SlideShare a Scribd company logo
Presented by :
Ahmad Faisal
Ismail
Narti Jaariyah
Information Retrieval
APA ITU INFORMATION RETRIEVAL ?
Introduction
Information Retrieval merupakan bidang yang mengkaji
metode-metode di dalam pencarian dokumen berdasarkan
representasi kebutuhan informasi berupa kata kunci, yaitu
keyword atau query.
Pengertian
Mendapatkan dokumen yang relevan yang ditampilkan
secara terurut dari dokumen yang memiliki tingkat
relevansi lebih tinggi ke dokumen yang tingkat relevansinya
lebih rendah.
Apa Tujuannya ?
CONTOH PENERAPAN
INFORMATION RETRIEVAL (IR)?
Contoh penerapan Information Retrieval adalah pada
aplikasi mesin pencari seperti :
Contoh
โ€ข Ask Search
โ€ข dll.
โ€ข Google Search
โ€ข Yahoo Search
โ€ข Bing Search
Arsitektur IR
Proses Utama
Indexing Searching
โ€ข proses untuk membentuk basisdata (database) terhadap
koleksi dokumen yang dimasukkan
โ€ข proses persiapan yang dilakukan terhadap dokumen
sehingga dokumen tersebut siap untuk diproses
Indexing
Indexing
Searching subsystem merupakan sebuah proses untuk
menemukan kembali dokumen yang relevan dengan query
yang dimasukkan.
Searching
Searching
Index Database
Tahap yang akan menghapus semua tag markup dan format
khusus yang ada di dalam dokumen.
Indexing(Markup Tag HTML)
Sebelum penghapusan tag HTML :
<p>Google Cardboard bantu <b>dokter<b> selamatkan nyawa bayi<p>
Setelah penghapusan tag HTML :
Google Cardboard bantu dokter selamatkan nyawa bayi
4 tag HTML telah dihapus
Contoh
Deretan kata dalam dokumen dipisahkan menjadi kata-kata atau
term.
Indexing (Tokenization)
Masukan :
Google Cardboard bantu dokter selamatkan nyawa bayi
Keluaran :
|Google| |Cardboard| |bantu| |dokter| |selamatkan| |nyawa|
|bayi|
Contoh
Kata sambung dan kata ganti dihilangkan.
Indexing (Filtration)
Contoh
Sebelum diproses :
Sebuah penelitian dari University of Glasgow mengungkap hewan peliharaan juga
terkena dampak nyata akibat tinggal serumah dengan perokok
Setelah diproses :
Sebuah penelitian University of Glasgow mengungkap hewan peliharaan terkena dampak
nyata tinggal serumah dengan perokok
๏‚– Mengubah kata ke bentuk kata dasarnya
๏‚– Membandingkan kata-kata di dalam dokumen dengan
kata dalam daftar kamus stem yang ada.
Indexing (Stemming)
Kamus Stem :
No Term Stem
1 Diperkenalkan Kenal
2 Terdengar Dengar
3 Menawarkan Tawar
4 Penyimpanan Simpan
5 Memiliki Milik
6 Menghapus Hapus
7 Mengingat Ingat
8 Meluncur Luncur
Contoh
Sebelum diproses :
Sebuah penelitian dari University of Glasgow mengungkap hewan peliharaan juga
terkena dampak nyata akibat tinggal serumah dengan perokok
Setelah diproses :
Sebuah teliti dari University of Glasgow ungkap hewan pelihara juga kena
dampak nyata akibat tinggal serumah dengan rokok
โ€ข Pada tahap ini akan dilakukan proses pembobotan kata di dalam dokumen, dimana
hasil nilai atau bobot dari setiap kata tersebut akan membantu dalam menentukan
kemiripan antara dokumen dengan query masukan.
Weighting(1)
Diketahui:
W : bobot term
tf : banyaknya kemunculan suatu kata dalam suatu dokumen
๐‘–๐‘‘๐‘“ โˆถ log(
๐‘
๐‘‘ ๐‘—๐‘–
)
Diketahui :
N : jumlah artikel dalam koleksi dokumen
dji : banyaknya dokumen (j) yang mengandung term (i)
log : digunakan untuk memperkecil pengaruh relative terhadap tfij
Weighting(2)
W= tf x idf
D1 : metode temu kembali informasi simpan banyak sumber
D2 : proses cari dapat cari sumber
D3 : seni ilmu cari banyak informasi dalam kumpul dokumen
Contoh Weighting(3)
Diketahui :
D : 3 (jumlah dokumen)
dji : banyaknya dokumen (j) yang mengandung term (i)
tf D1 : banyaknya muncul kata di dokumen 1
tf D2 : banyaknya muncul kata di dokumen 2
Contoh Weighting(4)
tf D3 : banyaknya muncul kata di dokumen 3
W D1 : bobot kata di dokumen 1
W D2 : bobot kata di dokumen 2
W D3 : bobot kata di dokumen 3
W= tf x idf
Weighting
Term tf D1 tf D2 tf D3 dji
๐‘
๐‘‘๐‘—๐‘–
Idf W D1 W D2 W D3
metode 1 0 0 1 3 0.48 0.48 0 0
informasi 1 0 1 2 1.5 0.18 0.18 0 0.18
cari 0 2 1 3 1.5 0.18 0 0.36 0.18
โ€ข Menentukan kemiripan antara dokumen dengan query.
โ€ข Dokumen dan query direpresentasikan dalam bentuk vector
โ€ข Tiap kata di dokumen dan query diberi bobot dan disimpan sebagai salah
satu elemen vektor
Metode VSM
Analisis Vector Space Model(2)
x =(x1, โ€ฆ, xn)
y =(y1, โ€ฆ, yn)
๐‘บ๐’Š๐’Ž๐’Š๐’๐’‚๐’“๐’Š๐’•๐’š ๐’™, ๐’š = ๐’„๐’๐’” ๐œฝ =
๐’™.๐’š
๐’™ |๐’š|
= ๐’Š=๐Ÿ
๐’
๐’™ ๐’Š ๐’š ๐’Š
๐’Š=๐Ÿ
๐’ ๐’™ ๐’Š
๐Ÿ
๐’Š=๐Ÿ
๐’ ๐’š ๐’Š
๐Ÿ
x = dokumen (D)
y = query(Q)
Contoh (VSM)
Diketahui data sebagai berikut :
D1 : metode temu kembali informasi simpan banyak sumber
D2 : proses cari dapat cari sumber
D3 : seni ilmu cari banyak informasi dalam kumpulan dokumen
Dilakukan pencarian dengan query masukan, yaitu :
Q : informasi
Contoh (VSM)
Vektor untuk dokumen 1 adalah x = (1, 1, 1, 1, 1, 1, 1)
Vektor untuk query โ€œinformasiโ€ adalah y = (0, 0, 0, 1, 0, 0, 0)
metode temu kembali informasi simpan banyak sumber
1 1 1 1 1 1 1
metode temu kembali informasi simpan banyak sumber
0 0 0 1 0 0 0
Hasil perhitungan dokumen 1 :
x.y = 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1
๐‘ฅ = 1 + 1 + 1 + 1 + 1 + 1 + 1 = 7 = 2.65
๐‘ฆ = 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 = 1
cos ๐‘ฅ, ๐‘ฆ =
1
7 ๐‘ฅ 1
=
1
2.65
= 0.38
Contoh (VSM)
Vektor untuk dokumen 2 adalah x = (1, 1, 1, 1, 1)
Vektor untuk query โ€œinformasiโ€ adalah y = (0, 0, 0, 0, 0)
Hasil perhitungan dokumen 2 :
x.y = 0 + 0 + 0 + 0 + 0 = 0
๐‘ฅ = 1 + 1 + 1 + 1 + 1 = 5 = 2.24
๐‘ฆ = 0 + 0 + 0 + 0 + 0 = 0 = 0
cos ๐‘ฅ, ๐‘ฆ =
0
5 ๐‘ฅ 0
=
0
0
= 0
proses cari dapat cari sumber
1 1 1 1 1
proses cari dapat cari sumber
0 0 0 0 0
Contoh (VSM)
Vektor untuk dokumen 3 adalah x = (1, 1, 1, 1, 1, 1, 1, 1)
Vektor untuk query โ€œinformasiโ€ adalah y = (0, 0, 0, 1, 0, 0, 0)
seni ilmu cari banyak informasi dalam kumpul dokumen
1 1 1 1 1 1 1 1
seni ilmu cari banyak informasi dalam kumpul dokumen
0 0 0 0 1 0 0 0
Hasil perhitungan dokumen 3 :
x.y = 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1
๐‘ฅ = 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 8
= 2.83
๐‘ฆ = 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 = 1
cos ๐‘ฅ, ๐‘ฆ =
1
8 ๐‘ฅ 1
=
1
2.83
= 0.35
Demo Program
TERIMA KASIH

More Related Content

Viewers also liked

International Journal of Satellite Communication & Remote Sensing vol 2 issue 1
International Journal of Satellite Communication & Remote Sensing vol 2 issue 1International Journal of Satellite Communication & Remote Sensing vol 2 issue 1
International Journal of Satellite Communication & Remote Sensing vol 2 issue 1JournalsPub www.journalspub.com
ย 
3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ
3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ
3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑelenakoval3107
ย 
ีซีด ีดีธีฌีธึ€ีกีฏีจ
ีซีด ีดีธีฌีธึ€ีกีฏีจีซีด ีดีธีฌีธึ€ีกีฏีจ
ีซีด ีดีธีฌีธึ€ีกีฏีจashkhen1983
ย 
Labour act
Labour actLabour act
Labour actpcitest
ย 
INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...
INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...
INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...IAEME Publication
ย 
H4 Grammar - Past perfect
H4 Grammar - Past perfectH4 Grammar - Past perfect
H4 Grammar - Past perfectVisionary01
ย 
STORM 24 JAN 2009 -S.WEST FRANCE 2
STORM 24 JAN 2009 -S.WEST FRANCE 2STORM 24 JAN 2009 -S.WEST FRANCE 2
STORM 24 JAN 2009 -S.WEST FRANCE 2pminsurance
ย 
CCI | Made In
CCI | Made InCCI | Made In
CCI | Made InCCICONNECT
ย 
Christophe morawski intervention-mobilisation-des-marques_2012
Christophe morawski intervention-mobilisation-des-marques_2012Christophe morawski intervention-mobilisation-des-marques_2012
Christophe morawski intervention-mobilisation-des-marques_2012Christophe Morawski
ย 
1240605872 iuce5x
1240605872 iuce5x1240605872 iuce5x
1240605872 iuce5xMundows
ย 
Die Hard 2 - Film Analysis
Die Hard 2 - Film AnalysisDie Hard 2 - Film Analysis
Die Hard 2 - Film Analysishaverstockmedia
ย 
PLAYBACK & SZENISCHES LERNEN
PLAYBACK & SZENISCHES LERNENPLAYBACK & SZENISCHES LERNEN
PLAYBACK & SZENISCHES LERNENNaomi Greenberg
ย 
Promotion dans les medias sociaux au quรฉbec
Promotion dans les medias sociaux au quรฉbecPromotion dans les medias sociaux au quรฉbec
Promotion dans les medias sociaux au quรฉbecOolong Media
ย 
Cristhian
CristhianCristhian
Cristhiancrismonx
ย 
Crise Morale (French)
Crise Morale (French)Crise Morale (French)
Crise Morale (French)Hitoshi Tsuchiyama
ย 

Viewers also liked (18)

International Journal of Satellite Communication & Remote Sensing vol 2 issue 1
International Journal of Satellite Communication & Remote Sensing vol 2 issue 1International Journal of Satellite Communication & Remote Sensing vol 2 issue 1
International Journal of Satellite Communication & Remote Sensing vol 2 issue 1
ย 
3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ
3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ
3 ั‡ะตั‚ะฒะตั€ั‚ัŒ ะฝะฐัˆะธ ัƒัะฟะตั…ะธ ะฑ
ย 
ีซีด ีดีธีฌีธึ€ีกีฏีจ
ีซีด ีดีธีฌีธึ€ีกีฏีจีซีด ีดีธีฌีธึ€ีกีฏีจ
ีซีด ีดีธีฌีธึ€ีกีฏีจ
ย 
Solstice
SolsticeSolstice
Solstice
ย 
Labour act
Labour actLabour act
Labour act
ย 
INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...
INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...
INVESTIGATION ON MECHANICAL PROPERTIES OF HEMP-E GLASS FIBER REINFORCED POLYM...
ย 
H4 Grammar - Past perfect
H4 Grammar - Past perfectH4 Grammar - Past perfect
H4 Grammar - Past perfect
ย 
STORM 24 JAN 2009 -S.WEST FRANCE 2
STORM 24 JAN 2009 -S.WEST FRANCE 2STORM 24 JAN 2009 -S.WEST FRANCE 2
STORM 24 JAN 2009 -S.WEST FRANCE 2
ย 
CCI | Made In
CCI | Made InCCI | Made In
CCI | Made In
ย 
Christophe morawski intervention-mobilisation-des-marques_2012
Christophe morawski intervention-mobilisation-des-marques_2012Christophe morawski intervention-mobilisation-des-marques_2012
Christophe morawski intervention-mobilisation-des-marques_2012
ย 
1240605872 iuce5x
1240605872 iuce5x1240605872 iuce5x
1240605872 iuce5x
ย 
Article Mont Elbrouz
Article Mont ElbrouzArticle Mont Elbrouz
Article Mont Elbrouz
ย 
Die Hard 2 - Film Analysis
Die Hard 2 - Film AnalysisDie Hard 2 - Film Analysis
Die Hard 2 - Film Analysis
ย 
Milieu
MilieuMilieu
Milieu
ย 
PLAYBACK & SZENISCHES LERNEN
PLAYBACK & SZENISCHES LERNENPLAYBACK & SZENISCHES LERNEN
PLAYBACK & SZENISCHES LERNEN
ย 
Promotion dans les medias sociaux au quรฉbec
Promotion dans les medias sociaux au quรฉbecPromotion dans les medias sociaux au quรฉbec
Promotion dans les medias sociaux au quรฉbec
ย 
Cristhian
CristhianCristhian
Cristhian
ย 
Crise Morale (French)
Crise Morale (French)Crise Morale (French)
Crise Morale (French)
ย 

Similar to Ir

data mining
data miningdata mining
data miningdewi2093
ย 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCcastakaagussugianto
ย 
Pertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxPertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxErfianCOC
ย 
Pertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxPertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxErfianCOC
ย 
INFORMATION RETRIEVAL
INFORMATION RETRIEVAL INFORMATION RETRIEVAL
INFORMATION RETRIEVAL Bunayya
ย 
Kelompok 2
Kelompok 2Kelompok 2
Kelompok 2Tari Holmes
ย 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfRinnaRachmatika2
ย 
R5 g kel 1 statdas 1
R5 g kel 1 statdas 1R5 g kel 1 statdas 1
R5 g kel 1 statdas 1matematikaunindra
ย 
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...Ainul Yaqin
ย 
Statistik & Probabilitas
Statistik & ProbabilitasStatistik & Probabilitas
Statistik & ProbabilitasYudhi Al' Basier
ย 
17 statistika
17 statistika17 statistika
17 statistikaThytienZaenal
ย 
25524 24 preprocessing searching dalam text mining
25524 24 preprocessing searching dalam text mining25524 24 preprocessing searching dalam text mining
25524 24 preprocessing searching dalam text miningUniversitas Bina Darma Palembang
ย 
Pertemuan 2.ppt
Pertemuan 2.pptPertemuan 2.ppt
Pertemuan 2.pptSaifAlfarizi1
ย 

Similar to Ir (20)

data mining
data miningdata mining
data mining
ย 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDC
ย 
Databases
DatabasesDatabases
Databases
ย 
Pertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxPertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptx
ย 
Pertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxPertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptx
ย 
INFORMATION RETRIEVAL
INFORMATION RETRIEVAL INFORMATION RETRIEVAL
INFORMATION RETRIEVAL
ย 
Kelompok 2
Kelompok 2Kelompok 2
Kelompok 2
ย 
P1 data mining
P1  data mining P1  data mining
P1 data mining
ย 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
ย 
Bab ii
Bab iiBab ii
Bab ii
ย 
Bbm 8
Bbm 8Bbm 8
Bbm 8
ย 
R5 g kel 1 statdas 1
R5 g kel 1 statdas 1R5 g kel 1 statdas 1
R5 g kel 1 statdas 1
ย 
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
ย 
Statistik & Probabilitas
Statistik & ProbabilitasStatistik & Probabilitas
Statistik & Probabilitas
ย 
17 statistika
17 statistika17 statistika
17 statistika
ย 
Bab1.pptx
Bab1.pptxBab1.pptx
Bab1.pptx
ย 
10
1010
10
ย 
25524 24 preprocessing searching dalam text mining
25524 24 preprocessing searching dalam text mining25524 24 preprocessing searching dalam text mining
25524 24 preprocessing searching dalam text mining
ย 
Sorting insert binary
Sorting insert binarySorting insert binary
Sorting insert binary
ย 
Pertemuan 2.ppt
Pertemuan 2.pptPertemuan 2.ppt
Pertemuan 2.ppt
ย 

Ir

  • 1. Presented by : Ahmad Faisal Ismail Narti Jaariyah Information Retrieval
  • 2. APA ITU INFORMATION RETRIEVAL ? Introduction
  • 3. Information Retrieval merupakan bidang yang mengkaji metode-metode di dalam pencarian dokumen berdasarkan representasi kebutuhan informasi berupa kata kunci, yaitu keyword atau query. Pengertian
  • 4. Mendapatkan dokumen yang relevan yang ditampilkan secara terurut dari dokumen yang memiliki tingkat relevansi lebih tinggi ke dokumen yang tingkat relevansinya lebih rendah. Apa Tujuannya ?
  • 6. Contoh penerapan Information Retrieval adalah pada aplikasi mesin pencari seperti : Contoh โ€ข Ask Search โ€ข dll. โ€ข Google Search โ€ข Yahoo Search โ€ข Bing Search
  • 9. โ€ข proses untuk membentuk basisdata (database) terhadap koleksi dokumen yang dimasukkan โ€ข proses persiapan yang dilakukan terhadap dokumen sehingga dokumen tersebut siap untuk diproses Indexing
  • 11. Searching subsystem merupakan sebuah proses untuk menemukan kembali dokumen yang relevan dengan query yang dimasukkan. Searching
  • 13. Tahap yang akan menghapus semua tag markup dan format khusus yang ada di dalam dokumen. Indexing(Markup Tag HTML)
  • 14. Sebelum penghapusan tag HTML : <p>Google Cardboard bantu <b>dokter<b> selamatkan nyawa bayi<p> Setelah penghapusan tag HTML : Google Cardboard bantu dokter selamatkan nyawa bayi 4 tag HTML telah dihapus Contoh
  • 15. Deretan kata dalam dokumen dipisahkan menjadi kata-kata atau term. Indexing (Tokenization)
  • 16. Masukan : Google Cardboard bantu dokter selamatkan nyawa bayi Keluaran : |Google| |Cardboard| |bantu| |dokter| |selamatkan| |nyawa| |bayi| Contoh
  • 17. Kata sambung dan kata ganti dihilangkan. Indexing (Filtration)
  • 18. Contoh Sebelum diproses : Sebuah penelitian dari University of Glasgow mengungkap hewan peliharaan juga terkena dampak nyata akibat tinggal serumah dengan perokok Setelah diproses : Sebuah penelitian University of Glasgow mengungkap hewan peliharaan terkena dampak nyata tinggal serumah dengan perokok
  • 19. ๏‚– Mengubah kata ke bentuk kata dasarnya ๏‚– Membandingkan kata-kata di dalam dokumen dengan kata dalam daftar kamus stem yang ada. Indexing (Stemming)
  • 20. Kamus Stem : No Term Stem 1 Diperkenalkan Kenal 2 Terdengar Dengar 3 Menawarkan Tawar 4 Penyimpanan Simpan 5 Memiliki Milik 6 Menghapus Hapus 7 Mengingat Ingat 8 Meluncur Luncur
  • 21. Contoh Sebelum diproses : Sebuah penelitian dari University of Glasgow mengungkap hewan peliharaan juga terkena dampak nyata akibat tinggal serumah dengan perokok Setelah diproses : Sebuah teliti dari University of Glasgow ungkap hewan pelihara juga kena dampak nyata akibat tinggal serumah dengan rokok
  • 22. โ€ข Pada tahap ini akan dilakukan proses pembobotan kata di dalam dokumen, dimana hasil nilai atau bobot dari setiap kata tersebut akan membantu dalam menentukan kemiripan antara dokumen dengan query masukan. Weighting(1)
  • 23. Diketahui: W : bobot term tf : banyaknya kemunculan suatu kata dalam suatu dokumen ๐‘–๐‘‘๐‘“ โˆถ log( ๐‘ ๐‘‘ ๐‘—๐‘– ) Diketahui : N : jumlah artikel dalam koleksi dokumen dji : banyaknya dokumen (j) yang mengandung term (i) log : digunakan untuk memperkecil pengaruh relative terhadap tfij Weighting(2) W= tf x idf
  • 24. D1 : metode temu kembali informasi simpan banyak sumber D2 : proses cari dapat cari sumber D3 : seni ilmu cari banyak informasi dalam kumpul dokumen Contoh Weighting(3)
  • 25. Diketahui : D : 3 (jumlah dokumen) dji : banyaknya dokumen (j) yang mengandung term (i) tf D1 : banyaknya muncul kata di dokumen 1 tf D2 : banyaknya muncul kata di dokumen 2 Contoh Weighting(4) tf D3 : banyaknya muncul kata di dokumen 3 W D1 : bobot kata di dokumen 1 W D2 : bobot kata di dokumen 2 W D3 : bobot kata di dokumen 3 W= tf x idf
  • 26. Weighting Term tf D1 tf D2 tf D3 dji ๐‘ ๐‘‘๐‘—๐‘– Idf W D1 W D2 W D3 metode 1 0 0 1 3 0.48 0.48 0 0 informasi 1 0 1 2 1.5 0.18 0.18 0 0.18 cari 0 2 1 3 1.5 0.18 0 0.36 0.18
  • 27. โ€ข Menentukan kemiripan antara dokumen dengan query. โ€ข Dokumen dan query direpresentasikan dalam bentuk vector โ€ข Tiap kata di dokumen dan query diberi bobot dan disimpan sebagai salah satu elemen vektor Metode VSM
  • 28. Analisis Vector Space Model(2) x =(x1, โ€ฆ, xn) y =(y1, โ€ฆ, yn) ๐‘บ๐’Š๐’Ž๐’Š๐’๐’‚๐’“๐’Š๐’•๐’š ๐’™, ๐’š = ๐’„๐’๐’” ๐œฝ = ๐’™.๐’š ๐’™ |๐’š| = ๐’Š=๐Ÿ ๐’ ๐’™ ๐’Š ๐’š ๐’Š ๐’Š=๐Ÿ ๐’ ๐’™ ๐’Š ๐Ÿ ๐’Š=๐Ÿ ๐’ ๐’š ๐’Š ๐Ÿ x = dokumen (D) y = query(Q)
  • 29. Contoh (VSM) Diketahui data sebagai berikut : D1 : metode temu kembali informasi simpan banyak sumber D2 : proses cari dapat cari sumber D3 : seni ilmu cari banyak informasi dalam kumpulan dokumen Dilakukan pencarian dengan query masukan, yaitu : Q : informasi
  • 30. Contoh (VSM) Vektor untuk dokumen 1 adalah x = (1, 1, 1, 1, 1, 1, 1) Vektor untuk query โ€œinformasiโ€ adalah y = (0, 0, 0, 1, 0, 0, 0) metode temu kembali informasi simpan banyak sumber 1 1 1 1 1 1 1 metode temu kembali informasi simpan banyak sumber 0 0 0 1 0 0 0 Hasil perhitungan dokumen 1 : x.y = 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 ๐‘ฅ = 1 + 1 + 1 + 1 + 1 + 1 + 1 = 7 = 2.65 ๐‘ฆ = 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 = 1 cos ๐‘ฅ, ๐‘ฆ = 1 7 ๐‘ฅ 1 = 1 2.65 = 0.38
  • 31. Contoh (VSM) Vektor untuk dokumen 2 adalah x = (1, 1, 1, 1, 1) Vektor untuk query โ€œinformasiโ€ adalah y = (0, 0, 0, 0, 0) Hasil perhitungan dokumen 2 : x.y = 0 + 0 + 0 + 0 + 0 = 0 ๐‘ฅ = 1 + 1 + 1 + 1 + 1 = 5 = 2.24 ๐‘ฆ = 0 + 0 + 0 + 0 + 0 = 0 = 0 cos ๐‘ฅ, ๐‘ฆ = 0 5 ๐‘ฅ 0 = 0 0 = 0 proses cari dapat cari sumber 1 1 1 1 1 proses cari dapat cari sumber 0 0 0 0 0
  • 32. Contoh (VSM) Vektor untuk dokumen 3 adalah x = (1, 1, 1, 1, 1, 1, 1, 1) Vektor untuk query โ€œinformasiโ€ adalah y = (0, 0, 0, 1, 0, 0, 0) seni ilmu cari banyak informasi dalam kumpul dokumen 1 1 1 1 1 1 1 1 seni ilmu cari banyak informasi dalam kumpul dokumen 0 0 0 0 1 0 0 0 Hasil perhitungan dokumen 3 : x.y = 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 ๐‘ฅ = 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 8 = 2.83 ๐‘ฆ = 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 = 1 = 1 cos ๐‘ฅ, ๐‘ฆ = 1 8 ๐‘ฅ 1 = 1 2.83 = 0.35