SlideShare a Scribd company logo
1 of 23
Numeric Query Ranking
Approach
NIKOLAS ANOVA / 10.6398
3KS2
Resume Paper
Sumber Paper :
http://www2013.wwwconference.org/companion/p229.pdf
Latar Belakang Riset
APA SALAHKU (google) ??
Query : SPSS 20
Masalah :
doc ranking teratas kurang sesuai dengan
maksud query dan cenderung hanya
menjelaskan tentang ‘SPSS’ saja.
NUMERIC QUERY : SPSS 20, ironman 3,
Naruto 461, Netbeans 7.0.1 , dsb
Latar Belakang Riset
Query : netbeans 7.0.1
Masalah :
Pada 5 ranking teratas, terdapat doc
yang kurang terkait / dan cenderung
hanya menjelaskan ‘netbeans’ saja.
APA SALAHKU (google) ??
Latar Belakang Riset
Terdiri dari13.920
queries
942
Numeric queries
docs
Searching masing2
numeric queri
Hasil searching
masing2 numeric
query
Rata-rata NDCG
rendah
POOR RANKING
PERFORMANCE
AT NUMERIC
QUERIES
mengindikasikan
EKSPERIMEN
PENULIS
Latar Belakang Riset
POOR RANKING
PERFORMANCE AT
NUMERIC QUERIES
A
Feature value (makna) dari
numeric term amat rendah
B
Numeric term pada dokumen
amatlah berantakan dan
bervariasi
WHY?
Latar Belakang Riset
Kenapa isu A bisa terjadi ?
Misal, numeric query : SPSS 20
Term ’20’ terdapat pada banyak dokumen.
Sehingga memiliki DF (Document
Frequency) yang tinggi, sehingga nilai TF-
IDF dari term ‘20’ menjadi rendah.
A
Feature value (makna) dari
numeric term amat rendah
Latar Belakang Riset
Kenapa isu B bisa terjadi ?
Tingginya DF dari numeric term yang
didiskusikan pada isu A.
B
Numeric term pada dokumen
amatlah berantakan dan
bervariasi
Makna/arti yang berbeda-beda dan
bervariasi pada numeric term yang sama
pada kumpulan dokumen.
PERMASALAHAN RISET
• Bagaimana algoritma/metode yang
memberikan hasil pemeringkatan yang lebih
baik untuk numeric sensitive queries ?
Teknologi/Istilah Penting
• Numeric query : query yang minimal terdiri dari
1 term berupa angka.
– Misal : SPSS 20, ironman 3, windows 7, makan 2 apel,
sehari 4 kali, harganya 10.000 , dsb
• Numeric sensitive queries : subset dari numeric
query, numeric term-nya amat berkaitan dengan
non stopword term yang terletak sebelum
numeric term.
contoh : pada query 'harry potter 6', karena banyak pattern seperti 'harry
potter x' di top docs, sehingga '6' penting di query.
Teknologi/Istilah Penting
• NDCG (Normalized Discounted Cumulative
Gain) Ukuran keefektifan dari algoritma web
search engine, yang dilihat dari kegunaan
dokumen didasarkan pada ranking. Ex : hasil
pencarian ‘SPSS 20’ pada latar belakang
Kontribusi Utama Riset
• Pengembangan algoritma web search engine
yang lebih baik untuk query yang
mengandung angka (numeric query). Sehingga
memperoleh hasil pencarian yang lebih baik.
Metode Pemecahan Masalah
• Mengidentifikasi numeric sensitive queries.
• Memperingkat dokumen
• Melatih model Pemeringkatan
Metode Pemecahan Masalah
Mengidentifikasi numeric sensitive queries
“download firefox 4” “number 1 cameras on the market"
Sensitive Non-Sensitive
Boosting feature values No Boosting feature values
Apa yang terjadi apabila proses ini tidak dilakukan ?
Metode Pemecahan Masalah
Mengidentifikasi numeric sensitive queries
Menunjukkan Numeric distribution dari query q pada
kumpulan dokumen s
: numeric term pada query q
: non stopword term sebelum pada q
: numeric term pada kumpulan dokumen s
: jumlah munculnya x bersamaan dengan pada s
: measure similarity dari x dan
Metode Pemecahan Masalah
Mengidentifikasi numeric sensitive queries
Sensitive
Non-Sensitive
: k dokumen teratas untuk query q (k = 10)
Metode Pemecahan Masalah
Memperingkat dokumen
Ekstrak Reliable Numeric Term
: stream (s) dari title, body, anchor, dan url
Sehingga didapat numeric term x (pada doc) yang paling
reliable terhadap numeric query q. Output itu untuk dipakai
pada
Metode Pemecahan Masalah
Memperingkat dokumen
dengan bantuan numeric-related features
NMatch
NSimilarity
Binary match
L1 Distance
Ukuran kesamaan antara numeric term pada dokumen
d dengan yang ada pada query q.
Metode Pemecahan Masalah
Memperingkat dokumen
dengan bantuan numeric-related features
Numeric Term NMatch NSimilarity
query Docs
20 20 1 0
20 40 0 20
20 15 0 5
20 20 1 0
Metode Pemecahan Masalah
• Dilakukan dengan menggunakan RankNet.
• RankNet merupakan suatu implementasi dari
neural network untuk memodelkan fungsi
pemeringkatan.
• RankNet memberikan performa yang baik
pada permasalahan nyata proses pencarian,
walaupun pada data yang amat besar.
Melatih Model Pemeringkatan
Evaluasi
Ide Pengembangan Riset
• Mengembangkan algoritma pencarian yang
lebih baik untuk non numeric sensitive queries.
• Pengembangan website search engine data
BPS (yang banyak mengandung numeric term)
yang lebih baik. Misal : Searching “inflasi 7”
Kesimpulan
• Penggunaan numeric model memberikan hasil
pemeringkatan yang lebih baik daripada
baseline dan boostN model dalam pencarian
untuk numeric query dan numeric sensitive
query.
• Bisa menjadi alternatif algoritma pencarian
selain algoritma yang tradisional seperti TF-IDF.
Terimakasih 
Semoga Bermanfaat

More Related Content

Viewers also liked

Skaters palafrugell 2014
Skaters palafrugell 2014Skaters palafrugell 2014
Skaters palafrugell 2014Marta Casas
 
Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...
Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...
Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...JENNY K. OH
 
Jelecos: Achieving Compliance with Axcient
Jelecos: Achieving Compliance with AxcientJelecos: Achieving Compliance with Axcient
Jelecos: Achieving Compliance with AxcientErin Olson
 
COMPUTER USE BY SECONDARY SCHOOL PRINCIPALS
COMPUTER USE BY SECONDARY SCHOOL PRINCIPALSCOMPUTER USE BY SECONDARY SCHOOL PRINCIPALS
COMPUTER USE BY SECONDARY SCHOOL PRINCIPALSsyaabdulrahman
 
Perbandingan pendekatan ruta dan art
Perbandingan pendekatan ruta dan artPerbandingan pendekatan ruta dan art
Perbandingan pendekatan ruta dan artNikolas Anova
 
Output overview and presentation
Output overview and presentationOutput overview and presentation
Output overview and presentationPraveen Anil
 
الــــــبـــــرمـــــجـــــة
الــــــبـــــرمـــــجـــــةالــــــبـــــرمـــــجـــــة
الــــــبـــــرمـــــجـــــةOM Soso
 
Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...
Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...
Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...Sadegh Asgari
 
Chip Kidd - Graphic Design
Chip Kidd - Graphic DesignChip Kidd - Graphic Design
Chip Kidd - Graphic DesignArts4good
 
Lng tanks paper_by_dilip_patel
Lng tanks paper_by_dilip_patelLng tanks paper_by_dilip_patel
Lng tanks paper_by_dilip_patelDilip Patel
 
Rewrite a message exchange system and set up its testing environment
Rewrite a message exchange system and set up its testing environmentRewrite a message exchange system and set up its testing environment
Rewrite a message exchange system and set up its testing environmentEmmanuel Padjinou
 
how i made it
how i made ithow i made it
how i made itdanoehme
 

Viewers also liked (13)

Skaters palafrugell 2014
Skaters palafrugell 2014Skaters palafrugell 2014
Skaters palafrugell 2014
 
Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...
Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...
Girls in Technology DC - Session #3: Embracing Fear & Learning to Fail - 01/2...
 
Jelecos: Achieving Compliance with Axcient
Jelecos: Achieving Compliance with AxcientJelecos: Achieving Compliance with Axcient
Jelecos: Achieving Compliance with Axcient
 
COMPUTER USE BY SECONDARY SCHOOL PRINCIPALS
COMPUTER USE BY SECONDARY SCHOOL PRINCIPALSCOMPUTER USE BY SECONDARY SCHOOL PRINCIPALS
COMPUTER USE BY SECONDARY SCHOOL PRINCIPALS
 
Perbandingan pendekatan ruta dan art
Perbandingan pendekatan ruta dan artPerbandingan pendekatan ruta dan art
Perbandingan pendekatan ruta dan art
 
Output overview and presentation
Output overview and presentationOutput overview and presentation
Output overview and presentation
 
الــــــبـــــرمـــــجـــــة
الــــــبـــــرمـــــجـــــةالــــــبـــــرمـــــجـــــة
الــــــبـــــرمـــــجـــــة
 
Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...
Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...
Sadegh Asgari - Modeling Construction Competitive Bidding An Agent-Based Appr...
 
Chip Kidd - Graphic Design
Chip Kidd - Graphic DesignChip Kidd - Graphic Design
Chip Kidd - Graphic Design
 
Lng tanks paper_by_dilip_patel
Lng tanks paper_by_dilip_patelLng tanks paper_by_dilip_patel
Lng tanks paper_by_dilip_patel
 
Rewrite a message exchange system and set up its testing environment
Rewrite a message exchange system and set up its testing environmentRewrite a message exchange system and set up its testing environment
Rewrite a message exchange system and set up its testing environment
 
Antennae
AntennaeAntennae
Antennae
 
how i made it
how i made ithow i made it
how i made it
 

Similar to Resume Paper : Numeric Query Ranking Approach

Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsHendro Subagyo
 
2. Tahapan Penelitian.pptx
2. Tahapan Penelitian.pptx2. Tahapan Penelitian.pptx
2. Tahapan Penelitian.pptxssuser4d3cd6
 
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...Ainul Yaqin
 
Pert 4 masalah-penelitian
Pert 4 masalah-penelitianPert 4 masalah-penelitian
Pert 4 masalah-penelitiandedidarwis
 
Materi 3 - Perumusan Masalah.pdf
Materi 3 - Perumusan Masalah.pdfMateri 3 - Perumusan Masalah.pdf
Materi 3 - Perumusan Masalah.pdfMahesaRioAditya
 
Contoh File Presentasi.pptx
Contoh File Presentasi.pptxContoh File Presentasi.pptx
Contoh File Presentasi.pptxFikrulIlmi3
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarmaArdianDwiPraba
 
Research methodology fundamental
Research methodology fundamentalResearch methodology fundamental
Research methodology fundamentaldedidarwis
 
Silabus smk-2017-terbaru simdig-kimia-fsk
Silabus smk-2017-terbaru simdig-kimia-fskSilabus smk-2017-terbaru simdig-kimia-fsk
Silabus smk-2017-terbaru simdig-kimia-fskAndi Laikenglish
 
Pert 1 pengantar met pen
Pert 1 pengantar met penPert 1 pengantar met pen
Pert 1 pengantar met pendedidarwis
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxSuraClips
 
Pert 3 tahapan penelitian
Pert 3 tahapan penelitianPert 3 tahapan penelitian
Pert 3 tahapan penelitiandedidarwis
 
Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1
Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1
Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1Bayu Aldi Yansyah
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxRidwanTI
 
RPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.doc
RPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.docRPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.doc
RPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.docHotdyCS
 
Format LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docx
Format LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docxFormat LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docx
Format LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docxsulisboy
 
Silabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docx
Silabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docxSilabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docx
Silabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docxHafidAs1
 

Similar to Resume Paper : Numeric Query Ranking Approach (20)

Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan Netlytics
 
2. Tahapan Penelitian.pptx
2. Tahapan Penelitian.pptx2. Tahapan Penelitian.pptx
2. Tahapan Penelitian.pptx
 
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
WEB SERVICE DISCOVERY MENGGUNAKAN COSINE SIMILARITY UNTUK MENINGKATKAN AKURAS...
 
Pert 4 masalah-penelitian
Pert 4 masalah-penelitianPert 4 masalah-penelitian
Pert 4 masalah-penelitian
 
Materi 3 - Perumusan Masalah.pdf
Materi 3 - Perumusan Masalah.pdfMateri 3 - Perumusan Masalah.pdf
Materi 3 - Perumusan Masalah.pdf
 
Contoh File Presentasi.pptx
Contoh File Presentasi.pptxContoh File Presentasi.pptx
Contoh File Presentasi.pptx
 
327232515
327232515327232515
327232515
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma
 
Research methodology fundamental
Research methodology fundamentalResearch methodology fundamental
Research methodology fundamental
 
Silabus smk-2017-terbaru simdig-kimia-fsk
Silabus smk-2017-terbaru simdig-kimia-fskSilabus smk-2017-terbaru simdig-kimia-fsk
Silabus smk-2017-terbaru simdig-kimia-fsk
 
Pert 1 pengantar met pen
Pert 1 pengantar met penPert 1 pengantar met pen
Pert 1 pengantar met pen
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
Pert 3 tahapan penelitian
Pert 3 tahapan penelitianPert 3 tahapan penelitian
Pert 3 tahapan penelitian
 
Bab1.pptx
Bab1.pptxBab1.pptx
Bab1.pptx
 
Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1
Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1
Pertemuan 1 - AI Indonesia Academy Surabaya Batch #1
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
 
RPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.doc
RPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.docRPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.doc
RPP_TKJ_TEKNOLOGI_LAYANAN_JARINGAN.doc
 
Format LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docx
Format LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docxFormat LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docx
Format LK-4 Analisis Penilaian - Komputer dan Jaringan Dasar - 10.docx
 
Silabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docx
Silabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docxSilabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docx
Silabus-Administrasi-Sistem-Jaringan-SMK-Negeri-1-Tunjung-Teja.docx
 

Resume Paper : Numeric Query Ranking Approach

  • 1. Numeric Query Ranking Approach NIKOLAS ANOVA / 10.6398 3KS2 Resume Paper Sumber Paper : http://www2013.wwwconference.org/companion/p229.pdf
  • 2. Latar Belakang Riset APA SALAHKU (google) ?? Query : SPSS 20 Masalah : doc ranking teratas kurang sesuai dengan maksud query dan cenderung hanya menjelaskan tentang ‘SPSS’ saja. NUMERIC QUERY : SPSS 20, ironman 3, Naruto 461, Netbeans 7.0.1 , dsb
  • 3. Latar Belakang Riset Query : netbeans 7.0.1 Masalah : Pada 5 ranking teratas, terdapat doc yang kurang terkait / dan cenderung hanya menjelaskan ‘netbeans’ saja. APA SALAHKU (google) ??
  • 4. Latar Belakang Riset Terdiri dari13.920 queries 942 Numeric queries docs Searching masing2 numeric queri Hasil searching masing2 numeric query Rata-rata NDCG rendah POOR RANKING PERFORMANCE AT NUMERIC QUERIES mengindikasikan EKSPERIMEN PENULIS
  • 5. Latar Belakang Riset POOR RANKING PERFORMANCE AT NUMERIC QUERIES A Feature value (makna) dari numeric term amat rendah B Numeric term pada dokumen amatlah berantakan dan bervariasi WHY?
  • 6. Latar Belakang Riset Kenapa isu A bisa terjadi ? Misal, numeric query : SPSS 20 Term ’20’ terdapat pada banyak dokumen. Sehingga memiliki DF (Document Frequency) yang tinggi, sehingga nilai TF- IDF dari term ‘20’ menjadi rendah. A Feature value (makna) dari numeric term amat rendah
  • 7. Latar Belakang Riset Kenapa isu B bisa terjadi ? Tingginya DF dari numeric term yang didiskusikan pada isu A. B Numeric term pada dokumen amatlah berantakan dan bervariasi Makna/arti yang berbeda-beda dan bervariasi pada numeric term yang sama pada kumpulan dokumen.
  • 8. PERMASALAHAN RISET • Bagaimana algoritma/metode yang memberikan hasil pemeringkatan yang lebih baik untuk numeric sensitive queries ?
  • 9. Teknologi/Istilah Penting • Numeric query : query yang minimal terdiri dari 1 term berupa angka. – Misal : SPSS 20, ironman 3, windows 7, makan 2 apel, sehari 4 kali, harganya 10.000 , dsb • Numeric sensitive queries : subset dari numeric query, numeric term-nya amat berkaitan dengan non stopword term yang terletak sebelum numeric term. contoh : pada query 'harry potter 6', karena banyak pattern seperti 'harry potter x' di top docs, sehingga '6' penting di query.
  • 10. Teknologi/Istilah Penting • NDCG (Normalized Discounted Cumulative Gain) Ukuran keefektifan dari algoritma web search engine, yang dilihat dari kegunaan dokumen didasarkan pada ranking. Ex : hasil pencarian ‘SPSS 20’ pada latar belakang
  • 11. Kontribusi Utama Riset • Pengembangan algoritma web search engine yang lebih baik untuk query yang mengandung angka (numeric query). Sehingga memperoleh hasil pencarian yang lebih baik.
  • 12. Metode Pemecahan Masalah • Mengidentifikasi numeric sensitive queries. • Memperingkat dokumen • Melatih model Pemeringkatan
  • 13. Metode Pemecahan Masalah Mengidentifikasi numeric sensitive queries “download firefox 4” “number 1 cameras on the market" Sensitive Non-Sensitive Boosting feature values No Boosting feature values Apa yang terjadi apabila proses ini tidak dilakukan ?
  • 14. Metode Pemecahan Masalah Mengidentifikasi numeric sensitive queries Menunjukkan Numeric distribution dari query q pada kumpulan dokumen s : numeric term pada query q : non stopword term sebelum pada q : numeric term pada kumpulan dokumen s : jumlah munculnya x bersamaan dengan pada s : measure similarity dari x dan
  • 15. Metode Pemecahan Masalah Mengidentifikasi numeric sensitive queries Sensitive Non-Sensitive : k dokumen teratas untuk query q (k = 10)
  • 16. Metode Pemecahan Masalah Memperingkat dokumen Ekstrak Reliable Numeric Term : stream (s) dari title, body, anchor, dan url Sehingga didapat numeric term x (pada doc) yang paling reliable terhadap numeric query q. Output itu untuk dipakai pada
  • 17. Metode Pemecahan Masalah Memperingkat dokumen dengan bantuan numeric-related features NMatch NSimilarity Binary match L1 Distance Ukuran kesamaan antara numeric term pada dokumen d dengan yang ada pada query q.
  • 18. Metode Pemecahan Masalah Memperingkat dokumen dengan bantuan numeric-related features Numeric Term NMatch NSimilarity query Docs 20 20 1 0 20 40 0 20 20 15 0 5 20 20 1 0
  • 19. Metode Pemecahan Masalah • Dilakukan dengan menggunakan RankNet. • RankNet merupakan suatu implementasi dari neural network untuk memodelkan fungsi pemeringkatan. • RankNet memberikan performa yang baik pada permasalahan nyata proses pencarian, walaupun pada data yang amat besar. Melatih Model Pemeringkatan
  • 21. Ide Pengembangan Riset • Mengembangkan algoritma pencarian yang lebih baik untuk non numeric sensitive queries. • Pengembangan website search engine data BPS (yang banyak mengandung numeric term) yang lebih baik. Misal : Searching “inflasi 7”
  • 22. Kesimpulan • Penggunaan numeric model memberikan hasil pemeringkatan yang lebih baik daripada baseline dan boostN model dalam pencarian untuk numeric query dan numeric sensitive query. • Bisa menjadi alternatif algoritma pencarian selain algoritma yang tradisional seperti TF-IDF.