SlideShare a Scribd company logo
1 of 4
Eigentaste is a collaborative filtering algorithm that uses universal queries to elicit real-valued user
ratings on a common set of items and applies principal component analysis (PCA) to the resulting
dense subset of the ratings matrix.

Eigentaste adalah algoritma penyaringan kolaboratif yang menggunakan query yang universal untuk
memperoleh peringkat pengguna bernilai real pada seperangkat item dan menerapkan analisis
komponen utama (PCA) pada subset padat yang dihasilkan dari matriks penilaian.

PCA facilitates dimensionality reduction for offline clustering of users and rapid computation of
recommendations. For a database of n users, standard nearest-neighbor techniques require O(n)
processing time to compute recommendations, whereas Eigentaste requires O(1) (constant) time.
We compare Eigentaste to alternative algorithms using data from Jester, an online joke
recommending system.

PCA memfasilitasi pengurangan dimensi untuk clustering offline pengguna dan perhitungan cepat
rekomendasi. Untuk database pengguna n, standar-tetangga terdekat teknik memerlukan O (n)
waktu proses untuk menghitung rekomendasi, sedangkan Eigentaste membutuhkan O (1) (konstan)
waktu. Kami membandingkan Eigentaste algoritma alternatif menggunakan data dari Jester, sebuah
sistem secara online lelucon merekomendasikan.

Jester has collected approximately 2,500,000 ratings from 57,000 users. We use the Normalized
Mean Absolute Error (NMAE) measure to compare performance of different algorithms. In the
Appendix we use Uniform and Normal distribution models to derive analytic estimates of NMAE
when predictions are random.

Jester telah mengumpulkan sekitar 2.500.000 peringkat dari 57.000 pengguna. Kami
menggunakan Kesalahan Mutlak Normalized Mean (NMAE) ukuran untuk membandingkan
kinerja algoritma yang berbeda. Dalam Lampiran kita menggunakan model distribusi
Uniform dan Normal untuk mendapatkan estimasi analitik NMAE ketika prediksi adalah
acak.


On the Jester dataset, Eigentaste computes recommendations two orders of magnitude faster with
no loss of accuracy

Di dataset Jester, Eigentaste menghitung rekomendasi dua lipat lebih cepat tanpa kehilangan akurasi
The networked world contains a vast amount of data. Visitors face the arduous task of retrieving
information that matches their preferences. The term “Collaborative Filtering” (CF) describes
techniques that use the known preferences of a group of users to predict the unknown preferences
of a new user; recommendations for the new user are based on these predictions (Pennock and
Horvitz 1999b). Other terms that have been proposed are “social information filtering” (Shardanand
and Maes 1995), and “recommender system” (Resnick et al. 1994). In each case, userscollaboratein
the sense that each rating improves the performance of the overall system. The fundamental
assumption is that if users A and B ratekitems similarly, they share similar tastes, and hence will rate
other items similarly. Approaches differ in how they define a “rating,” how they definek, and how
they define “similarly.”

Di dunia jaringan berisi sejumlah besar data. Pengunjung menghadapi tugas berat mengambil
informasi yang sesuai dengan preferensi mereka. Istilah "Filtering Kolaborasi" (CF)
menggambarkan teknik yang menggunakan preferensi diketahui dari kelompok pengguna
untuk memprediksi preferensi diketahui pengguna baru, rekomendasi untuk pengguna baru
didasarkan pada prediksi ini (Pennock dan Horvitz 1999b). Istilah lain yang telah diusulkan
adalah "informasi sosial penyaringan" (Shardanand dan Maes 1995), dan "sistem
recommender" (Resnick et al 1994.). Dalam setiap kasus, userscollaboratein arti bahwa setiap
rating meningkatkan kinerja sistem secara keseluruhan. Asumsi dasarnya adalah bahwa jika
pengguna A dan B ratekitems sama, mereka berbagi selera serupa, dan karenanya akan
menilai barang-barang lainnya yang sama. Pendekatan berbeda dalam bagaimana mereka
mendefinisikan "rating," bagaimana mereka definek, dan bagaimana mereka mendefinisikan
"sama."


A CF algorithm should be both accurate(the recommended objects should subsequently receive high
ratings), and efficientin terms of computational complexity. A CF database represents n users and m
items available for rating and recommendation. In most existing CF algorithms, online computation
scales linearly withn. In this paper we propose a new algorithm, Eigentaste, designed to provide
accurate and efficient recommendations to users in constant online time.

Sebuah algoritma CF harus baik akurat (obyek direkomendasikan kemudian harus menerima
peringkat tinggi), dan istilah efficientin kompleksitas komputasi. Sebuah database CF merupakan
pengguna n dan item m tersedia untuk penilaian dan rekomendasi. Dalam algoritma CF yang paling
yang ada, skala perhitungan secara online linear withn. Dalam tulisan ini kami mengusulkan sebuah
algoritma baru, Eigentaste, yang dirancang untuk memberikan rekomendasi yang akurat dan efisien
untuk pengguna dalam waktu online konstan.

Most CF systems include only user-selected queries: the user chooses which items to rate, yielding a
sparse ratings matrix with many null values. The Eigentaste algorithm profiles user taste with
universal queries: each item is presented with a short unbiased description (e.g., book summary
orfilm synopsis) so that users can form an opinion and respond to any query. Using univeral queries,
Eigentaste presents each user with the samegauge setof items to rate during its profiling phase. This
has the advantage that the subset of the ratings matrix containing the gauge set items is dense.
Universal ratings also permit the system to collect immediate feedback on all recommended items. It
is often argued that users who have not seen afilm are not able to rate it effectively. The opposite
can be argued: the experience of viewing afilm can corrupt taste ratings by extraneous factors
(indigestion, a bad seat, ...). The user’s level of familiarity with each item should properly be treated
as a confidence, a second-order measure notoriously difficult to collect. Consumers implicitly rate
unknown items whenever they shop or make choices. Collecting ratings only of familiar items can
yield a highly-biased and incomplete model of user taste. When properly designed, universal queries
offer the advantage of rapid and consistent profiling of new users.

Kebanyakan sistem CF hanya mencakup pengguna-dipilih query: pengguna memilih item mana untuk
menilai, menghasilkan matriks peringkat jarang dengan nilai nol banyak. Algoritma Eigentaste profil
pengguna rasa dengan pertanyaan universal: setiap item disajikan dengan deskripsi objektif singkat
(misalnya, buku ringkasan orfilm sinopsis) sehingga pengguna dapat membentuk opini dan
menanggapi permintaan apapun. Menggunakan query univeral, Eigentaste menyajikan setiap
pengguna dengan item setof samegauge untuk menilai selama fase profiling nya. Ini memiliki
keuntungan bahwa subset dari matriks peringkat yang berisi item mengukur set padat. Peringkat
Universal juga memungkinkan sistem untuk mengumpulkan umpan balik langsung pada semua item
yang direkomendasikan. Hal ini sering dikatakan bahwa pengguna yang belum melihat afilm tidak
mampu menilai secara efektif. Hal sebaliknya dapat dikatakan: pengalaman menonton afilm dapat
merusak peringkat rasa oleh faktor-faktor luar (gangguan pencernaan, kursi buruk, ...). Tingkat
pengguna keakraban dengan setiap item benar harus diperlakukan sebagai keyakinan, ukuran orde
kedua sangat sulit untuk mengumpulkan. Konsumen item tingkat implisit diketahui setiap kali
mereka berbelanja atau membuat pilihan. Mengumpulkan peringkat hanya item akrab dapat
menghasilkan model yang sangat-bias dan tidak lengkap rasa pengguna. Ketika benar dirancang,
pertanyaan universal yang menawarkan keuntungan dari profil yang cepat dan konsisten dari
pengguna baru.



Eigentaste captures user ratings on a continuous rating scale. To rate items, users are asked to click
their mouse on a horizontal“ratings bar”which returns scalar values. While technically not
continuous (limited by the granularity of HTML image maps), we can distinguish approximately 200
levels of ratings in the scale. Continuous ratings avoid dis-cretization effects in matrix computations
and may offer measurement (Albaum et al. 1981) and user-interface advantages as discussed in the
conclusion. Eigentaste splits computations into offline and online phases. Offline, Eigentaste uses
principal component analysis for optimal dimensionality reduction and then clusters users in the
lower dimensional subspace. The online phase uses eigenvectors to project new users into clusters
and a lookup table to recommend appropriate items so that run time is independent of the number
of users in the database. This paper is organized as follows. Section 2 reviews related work. Section 3
introduces the Eigentaste algorithm, PCA, and our recursive rectangular clustering method. Section 4
describes the application of Eigentaste to Jester, a CF system for recommending jokes, including a
description of the bootstrapping process. Section 5 proposes the normalized Mean Absolute Error
(NMAE) metric and compares performance of several algorithms on the Jester dataset in terms of
accuracy and efficiency. Section 7 reviews the results and discusses future work.

Eigentaste menangkap peringkat pengguna pada skala penilaian berkelanjutan. Untuk item tingkat,
pengguna diminta untuk mengklik mouse mereka pada "bar peringkat" horisontal yang
mengembalikan nilai skalar. Meskipun secara teknis tidak kontinyu (terbatas oleh granularity dari
peta gambar HTML), kita dapat membedakan sekitar 200 tingkat peringkat dalam skala. Peringkat
terus menerus menghindari dis-cretization efek dalam perhitungan matriks dan mungkin
menawarkan pengukuran (Albaum et al. 1981) dan user-interface keuntungan seperti yang dibahas
dalam kesimpulan. Eigentaste membagi perhitungan menjadi fase offline dan online. Offline,
Eigentaste menggunakan analisis komponen utama untuk pengurangan dimensi yang optimal dan
kemudian pengguna cluster dalam subruang dimensi yang lebih rendah. Tahap online menggunakan
vektor eigen untuk memproyeksikan pengguna baru ke dalam kelompok dan tabel untuk
merekomendasikan item yang sesuai sehingga waktu berjalan tidak tergantung pada jumlah
pengguna dalam database. Makalah ini diorganisasikan sebagai berikut. Bagian 2 ulasan kerja
terkait. Bagian 3 memperkenalkan algoritma Eigentaste, PCA, dan metode clustering rekursif persegi
panjang kami. Bagian 4 menjelaskan penerapan Eigentaste ke Jester, sebuah sistem CF untuk
merekomendasikan lelucon, termasuk deskripsi proses bootstrap. Bagian 5 mengusulkan Kesalahan
Mutlak dinormalisasi Mean (NMAE) metrik dan membandingkan kinerja beberapa algoritma pada
dataset Jester dalam hal akurasi dan efisiensi. Bagian 7 ulasan hasil dan membahas pekerjaan di
masa depan.

More Related Content

Viewers also liked

Viewers also liked (6)

Chapter2 part2
Chapter2 part2Chapter2 part2
Chapter2 part2
 
Studienarb linux kernel-dev
Studienarb linux kernel-devStudienarb linux kernel-dev
Studienarb linux kernel-dev
 
Budget 2013
Budget 2013Budget 2013
Budget 2013
 
ANGELGONZALEZ
ANGELGONZALEZANGELGONZALEZ
ANGELGONZALEZ
 
Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)
 
Computerized payroll system
Computerized payroll systemComputerized payroll system
Computerized payroll system
 

Similar to Eigentaste is a collaborative filtering algorithm that uses universal queries to elicit real

SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...
SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...
SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...faisalpiliang1
 
Presentasi Seminar Proposal
Presentasi Seminar ProposalPresentasi Seminar Proposal
Presentasi Seminar ProposalDaryan Ramadhany
 
Interaksi Manusia Dan Komputer 8
Interaksi Manusia Dan Komputer 8Interaksi Manusia Dan Komputer 8
Interaksi Manusia Dan Komputer 8Hide Maru
 
Sistem Pakar Intro-sant
Sistem Pakar Intro-santSistem Pakar Intro-sant
Sistem Pakar Intro-santMaikelPaijovka
 
Tugas 5 0317 (individu)
Tugas 5   0317 (individu)Tugas 5   0317 (individu)
Tugas 5 0317 (individu)Linda Lestari
 
Standar testing software
Standar testing softwareStandar testing software
Standar testing softwareazfa_rasikh
 
Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...
Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...
Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...faisalpiliang1
 
Software quality factors (revisi)
Software quality factors (revisi)Software quality factors (revisi)
Software quality factors (revisi)inggrid_5209100069
 
Prioritizing software maintenance plan by analyzing user feedback
Prioritizing software maintenance plan by analyzing user feedbackPrioritizing software maintenance plan by analyzing user feedback
Prioritizing software maintenance plan by analyzing user feedbackMuhammad Syafriansyah
 
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESHaris Pramudia
 
Penerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choice
Penerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choicePenerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choice
Penerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choicesholehulhuda1
 
Web-based culinary tourism recommendation system
Web-based culinary tourism recommendation systemWeb-based culinary tourism recommendation system
Web-based culinary tourism recommendation systemSetiya Nugroho
 
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...ferisulianta.com
 
perbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaperbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaBoyMorenaAllzytoroto
 
Software quality factors (revisi)
Software quality factors (revisi)Software quality factors (revisi)
Software quality factors (revisi)inggrid_5209100069
 

Similar to Eigentaste is a collaborative filtering algorithm that uses universal queries to elicit real (20)

SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...
SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...
SISTEM PENUNJANG KEPUTUSAN PEMILIHAN PERANGKAT LUNAK PENGOLAH CITRA DENGAN ME...
 
Presentasi Seminar Proposal
Presentasi Seminar ProposalPresentasi Seminar Proposal
Presentasi Seminar Proposal
 
Interaksi Manusia Dan Komputer 8
Interaksi Manusia Dan Komputer 8Interaksi Manusia Dan Komputer 8
Interaksi Manusia Dan Komputer 8
 
Sistem Pakar Intro-sant
Sistem Pakar Intro-santSistem Pakar Intro-sant
Sistem Pakar Intro-sant
 
Tugas 5 0317 (individu)
Tugas 5   0317 (individu)Tugas 5   0317 (individu)
Tugas 5 0317 (individu)
 
Standar testing software
Standar testing softwareStandar testing software
Standar testing software
 
Algoritma
AlgoritmaAlgoritma
Algoritma
 
Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...
Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...
Efektifitas Penerapan Metode AHP dalam Pemilihan Perangkat Lunak Pengolah Cit...
 
330 p03
330 p03330 p03
330 p03
 
Software quality factors (revisi)
Software quality factors (revisi)Software quality factors (revisi)
Software quality factors (revisi)
 
Prioritizing software maintenance plan by analyzing user feedback
Prioritizing software maintenance plan by analyzing user feedbackPrioritizing software maintenance plan by analyzing user feedback
Prioritizing software maintenance plan by analyzing user feedback
 
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
 
Penerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choice
Penerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choicePenerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choice
Penerapan metode ahp_dalam_pemilihan_komputer_dengan_expert_choice
 
Web-based culinary tourism recommendation system
Web-based culinary tourism recommendation systemWeb-based culinary tourism recommendation system
Web-based culinary tourism recommendation system
 
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...
 
perbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaperbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesia
 
Apsi (modul 2)
Apsi  (modul 2)Apsi  (modul 2)
Apsi (modul 2)
 
Software quality factors (revisi)
Software quality factors (revisi)Software quality factors (revisi)
Software quality factors (revisi)
 
Seminar Proposal.pptx
Seminar Proposal.pptxSeminar Proposal.pptx
Seminar Proposal.pptx
 
Cat ppt
Cat pptCat ppt
Cat ppt
 

Recently uploaded

Materi Pertemuan Materi Pertemuan 7.pptx
Materi Pertemuan Materi Pertemuan 7.pptxMateri Pertemuan Materi Pertemuan 7.pptx
Materi Pertemuan Materi Pertemuan 7.pptxRezaWahyuni6
 
Karakteristik Negara Brazil, Geografi Regional Dunia
Karakteristik Negara Brazil, Geografi Regional DuniaKarakteristik Negara Brazil, Geografi Regional Dunia
Karakteristik Negara Brazil, Geografi Regional DuniaNadia Putri Ayu
 
Kelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdf
Kelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdfKelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdf
Kelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdfmaulanayazid
 
Pembahasan Soal UKOM gerontik persiapan ukomnas
Pembahasan Soal UKOM gerontik persiapan ukomnasPembahasan Soal UKOM gerontik persiapan ukomnas
Pembahasan Soal UKOM gerontik persiapan ukomnasAZakariaAmien1
 
SILABUS MATEMATIKA SMP kurikulum K13.docx
SILABUS MATEMATIKA SMP kurikulum K13.docxSILABUS MATEMATIKA SMP kurikulum K13.docx
SILABUS MATEMATIKA SMP kurikulum K13.docxrahmaamaw03
 
MATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptx
MATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptxMATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptx
MATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptxrofikpriyanto2
 
Materi Pertemuan 6 Materi Pertemuan 6.pptx
Materi Pertemuan 6 Materi Pertemuan 6.pptxMateri Pertemuan 6 Materi Pertemuan 6.pptx
Materi Pertemuan 6 Materi Pertemuan 6.pptxRezaWahyuni6
 
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdf
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdfAKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdf
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdfTaqdirAlfiandi1
 
MATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATAS
MATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATASMATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATAS
MATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATASKurniawan Dirham
 
1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf
1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf
1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdfShintaNovianti1
 
Lembar Observasi Pembelajaran di Kelas.docx
Lembar Observasi Pembelajaran di  Kelas.docxLembar Observasi Pembelajaran di  Kelas.docx
Lembar Observasi Pembelajaran di Kelas.docxbkandrisaputra
 
Wawasan Nusantara sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...
Wawasan Nusantara  sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...Wawasan Nusantara  sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...
Wawasan Nusantara sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...MarwanAnugrah
 
LAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdf
LAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdfLAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdf
LAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdfChrodtianTian
 
DESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptx
DESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptxDESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptx
DESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptxFuzaAnggriana
 
PELAKSANAAN + Link2 Materi TRAINING "Effective SUPERVISORY & LEADERSHIP Sk...
PELAKSANAAN  + Link2 Materi TRAINING "Effective  SUPERVISORY &  LEADERSHIP Sk...PELAKSANAAN  + Link2 Materi TRAINING "Effective  SUPERVISORY &  LEADERSHIP Sk...
PELAKSANAAN + Link2 Materi TRAINING "Effective SUPERVISORY & LEADERSHIP Sk...Kanaidi ken
 
PPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptx
PPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptxPPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptx
PPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptxHeruFebrianto3
 
aksi nyata pendidikan inklusif.pelatihan mandiri pmm
aksi nyata pendidikan inklusif.pelatihan mandiri pmmaksi nyata pendidikan inklusif.pelatihan mandiri pmm
aksi nyata pendidikan inklusif.pelatihan mandiri pmmeunikekambe10
 
04-Gemelli.- kehamilan ganda- duo atau triplet
04-Gemelli.- kehamilan ganda- duo atau triplet04-Gemelli.- kehamilan ganda- duo atau triplet
04-Gemelli.- kehamilan ganda- duo atau tripletMelianaJayasaputra
 
PEMIKIRAN POLITIK Jean Jacques Rousseau.pdf
PEMIKIRAN POLITIK Jean Jacques  Rousseau.pdfPEMIKIRAN POLITIK Jean Jacques  Rousseau.pdf
PEMIKIRAN POLITIK Jean Jacques Rousseau.pdfMMeizaFachri
 
Prakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptx
Prakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptxPrakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptx
Prakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptxSyaimarChandra1
 

Recently uploaded (20)

Materi Pertemuan Materi Pertemuan 7.pptx
Materi Pertemuan Materi Pertemuan 7.pptxMateri Pertemuan Materi Pertemuan 7.pptx
Materi Pertemuan Materi Pertemuan 7.pptx
 
Karakteristik Negara Brazil, Geografi Regional Dunia
Karakteristik Negara Brazil, Geografi Regional DuniaKarakteristik Negara Brazil, Geografi Regional Dunia
Karakteristik Negara Brazil, Geografi Regional Dunia
 
Kelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdf
Kelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdfKelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdf
Kelompok 1 Bimbingan Konseling Islami (Asas-Asas).pdf
 
Pembahasan Soal UKOM gerontik persiapan ukomnas
Pembahasan Soal UKOM gerontik persiapan ukomnasPembahasan Soal UKOM gerontik persiapan ukomnas
Pembahasan Soal UKOM gerontik persiapan ukomnas
 
SILABUS MATEMATIKA SMP kurikulum K13.docx
SILABUS MATEMATIKA SMP kurikulum K13.docxSILABUS MATEMATIKA SMP kurikulum K13.docx
SILABUS MATEMATIKA SMP kurikulum K13.docx
 
MATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptx
MATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptxMATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptx
MATERI 1_ Modul 1 dan 2 Konsep Dasar IPA SD jadi.pptx
 
Materi Pertemuan 6 Materi Pertemuan 6.pptx
Materi Pertemuan 6 Materi Pertemuan 6.pptxMateri Pertemuan 6 Materi Pertemuan 6.pptx
Materi Pertemuan 6 Materi Pertemuan 6.pptx
 
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdf
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdfAKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdf
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdf
 
MATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATAS
MATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATASMATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATAS
MATERI EKOSISTEM UNTUK SEKOLAH MENENGAH ATAS
 
1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf
1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf
1.2.a.6. Demonstrasi Konstektual - Modul 1.2 (Shinta Novianti - CGP A10).pdf
 
Lembar Observasi Pembelajaran di Kelas.docx
Lembar Observasi Pembelajaran di  Kelas.docxLembar Observasi Pembelajaran di  Kelas.docx
Lembar Observasi Pembelajaran di Kelas.docx
 
Wawasan Nusantara sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...
Wawasan Nusantara  sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...Wawasan Nusantara  sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...
Wawasan Nusantara sebagai satu kesatuan, politik, ekonomi, sosial, budaya, d...
 
LAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdf
LAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdfLAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdf
LAPORAN PKP KESELURUHAN BAB 1-5 NURUL HUSNA.pdf
 
DESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptx
DESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptxDESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptx
DESAIN MEDIA PEMBELAJARAN BAHASA INDONESIA BERBASIS DIGITAL.pptx
 
PELAKSANAAN + Link2 Materi TRAINING "Effective SUPERVISORY & LEADERSHIP Sk...
PELAKSANAAN  + Link2 Materi TRAINING "Effective  SUPERVISORY &  LEADERSHIP Sk...PELAKSANAAN  + Link2 Materi TRAINING "Effective  SUPERVISORY &  LEADERSHIP Sk...
PELAKSANAAN + Link2 Materi TRAINING "Effective SUPERVISORY & LEADERSHIP Sk...
 
PPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptx
PPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptxPPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptx
PPT Materi Jenis - Jenis Alat Pembayaran Tunai dan Non-tunai.pptx
 
aksi nyata pendidikan inklusif.pelatihan mandiri pmm
aksi nyata pendidikan inklusif.pelatihan mandiri pmmaksi nyata pendidikan inklusif.pelatihan mandiri pmm
aksi nyata pendidikan inklusif.pelatihan mandiri pmm
 
04-Gemelli.- kehamilan ganda- duo atau triplet
04-Gemelli.- kehamilan ganda- duo atau triplet04-Gemelli.- kehamilan ganda- duo atau triplet
04-Gemelli.- kehamilan ganda- duo atau triplet
 
PEMIKIRAN POLITIK Jean Jacques Rousseau.pdf
PEMIKIRAN POLITIK Jean Jacques  Rousseau.pdfPEMIKIRAN POLITIK Jean Jacques  Rousseau.pdf
PEMIKIRAN POLITIK Jean Jacques Rousseau.pdf
 
Prakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptx
Prakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptxPrakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptx
Prakarsa Perubahan dengan Kanvas ATAP & BAGJA.pptx
 

Eigentaste is a collaborative filtering algorithm that uses universal queries to elicit real

  • 1. Eigentaste is a collaborative filtering algorithm that uses universal queries to elicit real-valued user ratings on a common set of items and applies principal component analysis (PCA) to the resulting dense subset of the ratings matrix. Eigentaste adalah algoritma penyaringan kolaboratif yang menggunakan query yang universal untuk memperoleh peringkat pengguna bernilai real pada seperangkat item dan menerapkan analisis komponen utama (PCA) pada subset padat yang dihasilkan dari matriks penilaian. PCA facilitates dimensionality reduction for offline clustering of users and rapid computation of recommendations. For a database of n users, standard nearest-neighbor techniques require O(n) processing time to compute recommendations, whereas Eigentaste requires O(1) (constant) time. We compare Eigentaste to alternative algorithms using data from Jester, an online joke recommending system. PCA memfasilitasi pengurangan dimensi untuk clustering offline pengguna dan perhitungan cepat rekomendasi. Untuk database pengguna n, standar-tetangga terdekat teknik memerlukan O (n) waktu proses untuk menghitung rekomendasi, sedangkan Eigentaste membutuhkan O (1) (konstan) waktu. Kami membandingkan Eigentaste algoritma alternatif menggunakan data dari Jester, sebuah sistem secara online lelucon merekomendasikan. Jester has collected approximately 2,500,000 ratings from 57,000 users. We use the Normalized Mean Absolute Error (NMAE) measure to compare performance of different algorithms. In the Appendix we use Uniform and Normal distribution models to derive analytic estimates of NMAE when predictions are random. Jester telah mengumpulkan sekitar 2.500.000 peringkat dari 57.000 pengguna. Kami menggunakan Kesalahan Mutlak Normalized Mean (NMAE) ukuran untuk membandingkan kinerja algoritma yang berbeda. Dalam Lampiran kita menggunakan model distribusi Uniform dan Normal untuk mendapatkan estimasi analitik NMAE ketika prediksi adalah acak. On the Jester dataset, Eigentaste computes recommendations two orders of magnitude faster with no loss of accuracy Di dataset Jester, Eigentaste menghitung rekomendasi dua lipat lebih cepat tanpa kehilangan akurasi
  • 2. The networked world contains a vast amount of data. Visitors face the arduous task of retrieving information that matches their preferences. The term “Collaborative Filtering” (CF) describes techniques that use the known preferences of a group of users to predict the unknown preferences of a new user; recommendations for the new user are based on these predictions (Pennock and Horvitz 1999b). Other terms that have been proposed are “social information filtering” (Shardanand and Maes 1995), and “recommender system” (Resnick et al. 1994). In each case, userscollaboratein the sense that each rating improves the performance of the overall system. The fundamental assumption is that if users A and B ratekitems similarly, they share similar tastes, and hence will rate other items similarly. Approaches differ in how they define a “rating,” how they definek, and how they define “similarly.” Di dunia jaringan berisi sejumlah besar data. Pengunjung menghadapi tugas berat mengambil informasi yang sesuai dengan preferensi mereka. Istilah "Filtering Kolaborasi" (CF) menggambarkan teknik yang menggunakan preferensi diketahui dari kelompok pengguna untuk memprediksi preferensi diketahui pengguna baru, rekomendasi untuk pengguna baru didasarkan pada prediksi ini (Pennock dan Horvitz 1999b). Istilah lain yang telah diusulkan adalah "informasi sosial penyaringan" (Shardanand dan Maes 1995), dan "sistem recommender" (Resnick et al 1994.). Dalam setiap kasus, userscollaboratein arti bahwa setiap rating meningkatkan kinerja sistem secara keseluruhan. Asumsi dasarnya adalah bahwa jika pengguna A dan B ratekitems sama, mereka berbagi selera serupa, dan karenanya akan menilai barang-barang lainnya yang sama. Pendekatan berbeda dalam bagaimana mereka mendefinisikan "rating," bagaimana mereka definek, dan bagaimana mereka mendefinisikan "sama." A CF algorithm should be both accurate(the recommended objects should subsequently receive high ratings), and efficientin terms of computational complexity. A CF database represents n users and m items available for rating and recommendation. In most existing CF algorithms, online computation scales linearly withn. In this paper we propose a new algorithm, Eigentaste, designed to provide accurate and efficient recommendations to users in constant online time. Sebuah algoritma CF harus baik akurat (obyek direkomendasikan kemudian harus menerima peringkat tinggi), dan istilah efficientin kompleksitas komputasi. Sebuah database CF merupakan pengguna n dan item m tersedia untuk penilaian dan rekomendasi. Dalam algoritma CF yang paling yang ada, skala perhitungan secara online linear withn. Dalam tulisan ini kami mengusulkan sebuah algoritma baru, Eigentaste, yang dirancang untuk memberikan rekomendasi yang akurat dan efisien untuk pengguna dalam waktu online konstan. Most CF systems include only user-selected queries: the user chooses which items to rate, yielding a sparse ratings matrix with many null values. The Eigentaste algorithm profiles user taste with universal queries: each item is presented with a short unbiased description (e.g., book summary orfilm synopsis) so that users can form an opinion and respond to any query. Using univeral queries, Eigentaste presents each user with the samegauge setof items to rate during its profiling phase. This has the advantage that the subset of the ratings matrix containing the gauge set items is dense. Universal ratings also permit the system to collect immediate feedback on all recommended items. It is often argued that users who have not seen afilm are not able to rate it effectively. The opposite can be argued: the experience of viewing afilm can corrupt taste ratings by extraneous factors (indigestion, a bad seat, ...). The user’s level of familiarity with each item should properly be treated
  • 3. as a confidence, a second-order measure notoriously difficult to collect. Consumers implicitly rate unknown items whenever they shop or make choices. Collecting ratings only of familiar items can yield a highly-biased and incomplete model of user taste. When properly designed, universal queries offer the advantage of rapid and consistent profiling of new users. Kebanyakan sistem CF hanya mencakup pengguna-dipilih query: pengguna memilih item mana untuk menilai, menghasilkan matriks peringkat jarang dengan nilai nol banyak. Algoritma Eigentaste profil pengguna rasa dengan pertanyaan universal: setiap item disajikan dengan deskripsi objektif singkat (misalnya, buku ringkasan orfilm sinopsis) sehingga pengguna dapat membentuk opini dan menanggapi permintaan apapun. Menggunakan query univeral, Eigentaste menyajikan setiap pengguna dengan item setof samegauge untuk menilai selama fase profiling nya. Ini memiliki keuntungan bahwa subset dari matriks peringkat yang berisi item mengukur set padat. Peringkat Universal juga memungkinkan sistem untuk mengumpulkan umpan balik langsung pada semua item yang direkomendasikan. Hal ini sering dikatakan bahwa pengguna yang belum melihat afilm tidak mampu menilai secara efektif. Hal sebaliknya dapat dikatakan: pengalaman menonton afilm dapat merusak peringkat rasa oleh faktor-faktor luar (gangguan pencernaan, kursi buruk, ...). Tingkat pengguna keakraban dengan setiap item benar harus diperlakukan sebagai keyakinan, ukuran orde kedua sangat sulit untuk mengumpulkan. Konsumen item tingkat implisit diketahui setiap kali mereka berbelanja atau membuat pilihan. Mengumpulkan peringkat hanya item akrab dapat menghasilkan model yang sangat-bias dan tidak lengkap rasa pengguna. Ketika benar dirancang, pertanyaan universal yang menawarkan keuntungan dari profil yang cepat dan konsisten dari pengguna baru. Eigentaste captures user ratings on a continuous rating scale. To rate items, users are asked to click their mouse on a horizontal“ratings bar”which returns scalar values. While technically not continuous (limited by the granularity of HTML image maps), we can distinguish approximately 200 levels of ratings in the scale. Continuous ratings avoid dis-cretization effects in matrix computations and may offer measurement (Albaum et al. 1981) and user-interface advantages as discussed in the conclusion. Eigentaste splits computations into offline and online phases. Offline, Eigentaste uses principal component analysis for optimal dimensionality reduction and then clusters users in the lower dimensional subspace. The online phase uses eigenvectors to project new users into clusters and a lookup table to recommend appropriate items so that run time is independent of the number of users in the database. This paper is organized as follows. Section 2 reviews related work. Section 3 introduces the Eigentaste algorithm, PCA, and our recursive rectangular clustering method. Section 4 describes the application of Eigentaste to Jester, a CF system for recommending jokes, including a description of the bootstrapping process. Section 5 proposes the normalized Mean Absolute Error (NMAE) metric and compares performance of several algorithms on the Jester dataset in terms of accuracy and efficiency. Section 7 reviews the results and discusses future work. Eigentaste menangkap peringkat pengguna pada skala penilaian berkelanjutan. Untuk item tingkat, pengguna diminta untuk mengklik mouse mereka pada "bar peringkat" horisontal yang mengembalikan nilai skalar. Meskipun secara teknis tidak kontinyu (terbatas oleh granularity dari peta gambar HTML), kita dapat membedakan sekitar 200 tingkat peringkat dalam skala. Peringkat terus menerus menghindari dis-cretization efek dalam perhitungan matriks dan mungkin
  • 4. menawarkan pengukuran (Albaum et al. 1981) dan user-interface keuntungan seperti yang dibahas dalam kesimpulan. Eigentaste membagi perhitungan menjadi fase offline dan online. Offline, Eigentaste menggunakan analisis komponen utama untuk pengurangan dimensi yang optimal dan kemudian pengguna cluster dalam subruang dimensi yang lebih rendah. Tahap online menggunakan vektor eigen untuk memproyeksikan pengguna baru ke dalam kelompok dan tabel untuk merekomendasikan item yang sesuai sehingga waktu berjalan tidak tergantung pada jumlah pengguna dalam database. Makalah ini diorganisasikan sebagai berikut. Bagian 2 ulasan kerja terkait. Bagian 3 memperkenalkan algoritma Eigentaste, PCA, dan metode clustering rekursif persegi panjang kami. Bagian 4 menjelaskan penerapan Eigentaste ke Jester, sebuah sistem CF untuk merekomendasikan lelucon, termasuk deskripsi proses bootstrap. Bagian 5 mengusulkan Kesalahan Mutlak dinormalisasi Mean (NMAE) metrik dan membandingkan kinerja beberapa algoritma pada dataset Jester dalam hal akurasi dan efisiensi. Bagian 7 ulasan hasil dan membahas pekerjaan di masa depan.