Ringkasan dokumen tersebut adalah:
1. Dokumen tersebut membahas tentang informasi retrieval yang merupakan bidang yang mengkaji metode pencarian dokumen berdasarkan kata kunci atau query.
2. Contoh penerapan informasi retrieval adalah mesin pencari seperti Google, Yahoo, dan Bing.
3. Proses utama informasi retrieval terdiri dari indexing dan searching, dimana indexing berfungsi untuk mempersiapkan dokumen dan searching untuk menemukan dokumen re
3. Information Retrieval merupakan bidang yang mengkaji
metode-metode di dalam pencarian dokumen berdasarkan
representasi kebutuhan informasi berupa kata kunci, yaitu
keyword atau query.
Pengertian
4. Mendapatkan dokumen yang relevan yang ditampilkan
secara terurut dari dokumen yang memiliki tingkat
relevansi lebih tinggi ke dokumen yang tingkat relevansinya
lebih rendah.
Apa Tujuannya ?
6. Contoh penerapan Information Retrieval adalah pada
aplikasi mesin pencari seperti :
Contoh
โข Ask Search
โข dll.
โข Google Search
โข Yahoo Search
โข Bing Search
9. โข proses untuk membentuk basisdata (database) terhadap
koleksi dokumen yang dimasukkan
โข proses persiapan yang dilakukan terhadap dokumen
sehingga dokumen tersebut siap untuk diproses
Indexing
13. Tahap yang akan menghapus semua tag markup dan format
khusus yang ada di dalam dokumen.
Indexing(Markup Tag HTML)
14. Sebelum penghapusan tag HTML :
<p>Google Cardboard bantu <b>dokter<b> selamatkan nyawa bayi<p>
Setelah penghapusan tag HTML :
Google Cardboard bantu dokter selamatkan nyawa bayi
4 tag HTML telah dihapus
Contoh
15. Deretan kata dalam dokumen dipisahkan menjadi kata-kata atau
term.
Indexing (Tokenization)
18. Contoh
Sebelum diproses :
Sebuah penelitian dari University of Glasgow mengungkap hewan peliharaan juga
terkena dampak nyata akibat tinggal serumah dengan perokok
Setelah diproses :
Sebuah penelitian University of Glasgow mengungkap hewan peliharaan terkena dampak
nyata tinggal serumah dengan perokok
19. ๏ Mengubah kata ke bentuk kata dasarnya
๏ Membandingkan kata-kata di dalam dokumen dengan
kata dalam daftar kamus stem yang ada.
Indexing (Stemming)
20. Kamus Stem :
No Term Stem
1 Diperkenalkan Kenal
2 Terdengar Dengar
3 Menawarkan Tawar
4 Penyimpanan Simpan
5 Memiliki Milik
6 Menghapus Hapus
7 Mengingat Ingat
8 Meluncur Luncur
21. Contoh
Sebelum diproses :
Sebuah penelitian dari University of Glasgow mengungkap hewan peliharaan juga
terkena dampak nyata akibat tinggal serumah dengan perokok
Setelah diproses :
Sebuah teliti dari University of Glasgow ungkap hewan pelihara juga kena
dampak nyata akibat tinggal serumah dengan rokok
22. โข Pada tahap ini akan dilakukan proses pembobotan kata di dalam dokumen, dimana
hasil nilai atau bobot dari setiap kata tersebut akan membantu dalam menentukan
kemiripan antara dokumen dengan query masukan.
Weighting(1)
23. Diketahui:
W : bobot term
tf : banyaknya kemunculan suatu kata dalam suatu dokumen
๐๐๐ โถ log(
๐
๐ ๐๐
)
Diketahui :
N : jumlah artikel dalam koleksi dokumen
dji : banyaknya dokumen (j) yang mengandung term (i)
log : digunakan untuk memperkecil pengaruh relative terhadap tfij
Weighting(2)
W= tf x idf
24. D1 : metode temu kembali informasi simpan banyak sumber
D2 : proses cari dapat cari sumber
D3 : seni ilmu cari banyak informasi dalam kumpul dokumen
Contoh Weighting(3)
25. Diketahui :
D : 3 (jumlah dokumen)
dji : banyaknya dokumen (j) yang mengandung term (i)
tf D1 : banyaknya muncul kata di dokumen 1
tf D2 : banyaknya muncul kata di dokumen 2
Contoh Weighting(4)
tf D3 : banyaknya muncul kata di dokumen 3
W D1 : bobot kata di dokumen 1
W D2 : bobot kata di dokumen 2
W D3 : bobot kata di dokumen 3
W= tf x idf
26. Weighting
Term tf D1 tf D2 tf D3 dji
๐
๐๐๐
Idf W D1 W D2 W D3
metode 1 0 0 1 3 0.48 0.48 0 0
informasi 1 0 1 2 1.5 0.18 0.18 0 0.18
cari 0 2 1 3 1.5 0.18 0 0.36 0.18
27. โข Menentukan kemiripan antara dokumen dengan query.
โข Dokumen dan query direpresentasikan dalam bentuk vector
โข Tiap kata di dokumen dan query diberi bobot dan disimpan sebagai salah
satu elemen vektor
Metode VSM
28. Analisis Vector Space Model(2)
x =(x1, โฆ, xn)
y =(y1, โฆ, yn)
๐บ๐๐๐๐๐๐๐๐๐ ๐, ๐ = ๐๐๐ ๐ฝ =
๐.๐
๐ |๐|
= ๐=๐
๐
๐ ๐ ๐ ๐
๐=๐
๐ ๐ ๐
๐
๐=๐
๐ ๐ ๐
๐
x = dokumen (D)
y = query(Q)
29. Contoh (VSM)
Diketahui data sebagai berikut :
D1 : metode temu kembali informasi simpan banyak sumber
D2 : proses cari dapat cari sumber
D3 : seni ilmu cari banyak informasi dalam kumpulan dokumen
Dilakukan pencarian dengan query masukan, yaitu :
Q : informasi
30. Contoh (VSM)
Vektor untuk dokumen 1 adalah x = (1, 1, 1, 1, 1, 1, 1)
Vektor untuk query โinformasiโ adalah y = (0, 0, 0, 1, 0, 0, 0)
metode temu kembali informasi simpan banyak sumber
1 1 1 1 1 1 1
metode temu kembali informasi simpan banyak sumber
0 0 0 1 0 0 0
Hasil perhitungan dokumen 1 :
x.y = 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1
๐ฅ = 1 + 1 + 1 + 1 + 1 + 1 + 1 = 7 = 2.65
๐ฆ = 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 = 1
cos ๐ฅ, ๐ฆ =
1
7 ๐ฅ 1
=
1
2.65
= 0.38
31. Contoh (VSM)
Vektor untuk dokumen 2 adalah x = (1, 1, 1, 1, 1)
Vektor untuk query โinformasiโ adalah y = (0, 0, 0, 0, 0)
Hasil perhitungan dokumen 2 :
x.y = 0 + 0 + 0 + 0 + 0 = 0
๐ฅ = 1 + 1 + 1 + 1 + 1 = 5 = 2.24
๐ฆ = 0 + 0 + 0 + 0 + 0 = 0 = 0
cos ๐ฅ, ๐ฆ =
0
5 ๐ฅ 0
=
0
0
= 0
proses cari dapat cari sumber
1 1 1 1 1
proses cari dapat cari sumber
0 0 0 0 0
32. Contoh (VSM)
Vektor untuk dokumen 3 adalah x = (1, 1, 1, 1, 1, 1, 1, 1)
Vektor untuk query โinformasiโ adalah y = (0, 0, 0, 1, 0, 0, 0)
seni ilmu cari banyak informasi dalam kumpul dokumen
1 1 1 1 1 1 1 1
seni ilmu cari banyak informasi dalam kumpul dokumen
0 0 0 0 1 0 0 0
Hasil perhitungan dokumen 3 :
x.y = 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1
๐ฅ = 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 8
= 2.83
๐ฆ = 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 = 1
cos ๐ฅ, ๐ฆ =
1
8 ๐ฅ 1
=
1
2.83
= 0.35