PEMBAHASAN
2.1. Pengertian Metode Latent Semantic Indexing
Metode Latent Semantic Indexing (LSI) adalah
metode yang diimplementasikan di dalam IR system dalam mencari dan menemukan
informasi berdasarkan makna keseluruhan (conceptual topic atau meaning)
dari sebuah dokumen bukan hanya makna kata per kata.
Latent Semantic Indexing adalah
sebuah metode baru dalam algoritma search engine yang sedang
dikembangkan Google Corporation. Dengan metode ini, Google menganalisis kata
kunci dengan cara baru, bukan lagi berdasarkan pencocokkan kata secara
leksikal. Kata yang dicari tidak hanya kata kuncinya saja seperti pada
algoritma pada umumnya, tetapi kata-kata yang berhubungan dengan kata kunci
juga dicari.
Tujuan dari LSI adalah mendapatkan suatu pemodelan
yang efektif untuk merepresentasikan hubungan antara kata kunci dan dokumen
yang dicari. Dari sekumpulan kata kunci, yang tadinya tidak lengkap dan tidak
sesuai, menjadi sekunpulan objek yang berhubungan.
Keuntungan Latent
Semantik Indexing sebagai berikut :
1. True
(Latent) Dimensions
Asumsi
di LSI adalah bahwa dimensi baru lebih baik representasi dokumen dan query.
Metafora yang mendasari istilah “latent” adalah bahwa dimensi-dimensi baru
adalah benar. Ini benar representasi kemudian tertutup oleh proses generasi
yang menyatakan dimensi tertentu dengan satu set kata-kata dalam beberapa
dokumen dan berbagai set kata-kata dalam dokumen lain.
2. Sinonim
Mengacu
pada fakta bahwa konsep dasar yang sama dapat dijelaskan menggunakan istilah
yang berbeda. Strategi pengambilan Sinonim
adalah istilah untuk kata yang bermakna sama.
Contoh,
kata “sulit” merupakan sinonim untuk “sukar” karena “sulit” dan “sukar”
bermakna sama.
3. Polisemi
Polisemi
adalah istilah untuk kata yang sama namun maknanya berbeda.
Contoh,
kata “membajak” dalam “membajak sawah” dan “membajak VCD” merupakan polisemi
karena kata “membajak” di kedua frase sama namun mempunyai arti yang berbeda.
4. Term
Dependence
Model
ruang vektor tradisional menganggap merdeka dan istilah melayani sebagai dasar
vektor ortogonal dari ruang vektor.
Kekurangan Latent
Semantic Indexing sebagai berikut :






-1.jpg)
