SlideShare a Scribd company logo
Nội Dung
1.      Giới thiệu về Recommendation
2.      Giới thiệu về Collaborative Filtering
3.      Giới thiệu về Item – Base Filtering
4.      Giới thiệu về Slope One
5.      Giải thuật Slope One
6.      Ví dụ về Slope One
7.      Demo chương trình Mahout theo giải thuật
        Slope One

4/19/2012               trungnb3535@gmail.com      2
1. Recommendation
 Recommendation là việc dự đoán khuynh
  hướng sở thích của con người, được sử dụng
  để tìm ra những cái mới, những cái mà
  người ta muốn
 Recommendation có hai kiểu:
        Collaborative Filtering
        Content-based Filtering




4/19/2012                   trungnb3535@gmail.com   3
2. Collaborative Filtering
                    Recommender
 Là phương thức đưa ra dự đoán dựa trên sở
  thích, hành vi của nhiều User và của User
  này trong quá khứ.
 Chúng ta không cần quan tâm đến bản chất
  của Item, các thuộc tính của Item. Nhưng
  cần một lượng dữ liệu lớn ban đầu để có thể
  dự đoán.
 Có 2 nhóm giải thuật:
        User – based recommendation
        Item – based recommendation

4/19/2012                 trungnb3535@gmail.com   4
3. Item – based recommendation
 Giải thuật này dự đoán dựa trên sự tương
  đồng giữa các Item
 Ví dụ :
Amazon.com mua 1 quyển sách sẽ giới thiệu
  một quyển sách tương tự (cùng chủ đề)
Mua một album của BackstreetBoys thì có thể
  mua một album khác của BackstreetBoys.
 Quan hệ giữa ratings của các cặp item được
  thể hiện qua hàm : y = ax + b

4/19/2012           trungnb3535@gmail.com      5
4. Slope One
 Slope One là một trường hợp đặc biệt của
  Item – based recommendation khi hệ số góc
  a = 1 (slope one).
 Mối liên hệ giữa 2 item được thể hiện qua
  hàm y = x + b, b là độ chênh lệnh trung
  bình giá trị ratings của 2 item.




4/19/2012          trungnb3535@gmail.com      6
5. Giải thuật Slope One
1. Tính độ chênh lệch trung bình giữa item đó
   với các Item còn lại

2. Tính ra giá trị ratings theo các Item kia

3. Tính giá trị ratings trung bình mà User có
   thể đánh giá Item



4/19/2012             trungnb3535@gmail.com     7
6. Ví dụ




            User A đánh giá item i là 1, item j là 1.5
            User B đánh giá item i là 2
              User B sẽ đánh giá item j là bao nhiêu (r)?
            Giải
            Ta có : b = 1.5 – 1 = 0.5 => r = 2 + 0.5 = 2.5
                                                             trungnb3535
4/19/2012                            8                       @gmail.com
Ví dụ khác




4/19/2012     trungnb3535@gmail.com   9
     Giá trị Ratings chênh lệch trung bình giữa Item 1 và Item 2 là:b =
      (2 + (-1))/2 = 0.5 => Item 1 luôn được đánh giá cao hơn Item 2 một
      khoảng 0.5
     Tương tự, giá trị Ratings chênh lệch trung bình giữa Item 1 và Item
      3 là : b = 3
     Dựa vào giá trị giá trị b được tính ở trên, ta có thể đưa ra dự đoán
      Ratings của 1 User cho 1 Item dựa theo hàm f(x) = x + b
      Ví Dụ : dự đoán đánh giá của Lucy cho Item 1 dựa theo Item 2 thì
      là f(2) = 2 + 0.5 = 2.5, dựa theo Item 3 là : f(5) = 5 + 3 = 8
     Giá trị Ratings trung bình theo dự đoán mà Lucy đánh giá Item 1 :



      Do đó, để thực hiện Slope One cho n Item thì cần phải tính toán và
      lưu lại các chênh lệch trung bình và số lượng các Ratings chung
      cho mỗi cặp trong số n2 cặp Item.

4/19/2012                       trungnb3535@gmail.com                        10
7. Demo giải thuật Slope One
  Dữ liệu đầu vào :
File dữ liệu có dạng : userId,itemId,ratings
 Đầu ra : các Item gợi ý cho User 1.




4/19/2012            trungnb3535@gmail.com     11
7. Demo giải thuật Slope One
     1,101,5.0               4,101,5.0
     1,102,3.0               4,103,3.0
     1,103,2.5               4,104,4.5
     2,101,2.0               4,106,4.0
     2,102,2.5               5,101,4.0
     2,103,5.0               5,102,3.0
     2,104,2.0               5,103,2.0
     3,101,2.5               5,104,4.0
     3,104,4.0               5,105,3.5
     3,105,4.5               5,106,4.0
     3,107,5.0

4/19/2012         trungnb3535@gmail.com    12
Hình 1 : Quan hệ User - Item
4/19/2012                    trungnb3535@gmail.com   13
User 1


                                                                           User 2


                                                                           User 3



                                                                           User 4


                                                                           User 5




Item 1       Item 2 Item 3   Item 4      Item 5          Item 6   Item 7


 4/19/2012                            trungnb3535@gmail.com                         14
7. Demo giải thuật Slope One
1. Tính độ chênh lệch trung bình giữa Item 1
    và Item 2 :
 1,101,5.0 | 2,101,2.0 | 5,101,4.0
 1,102,3.0 | 2,102,2.5 | 5,102,3.0
b=        -2.0          0.5        -1.0
Giá trị trung bình :
btb = (-2.0 + 0.5 – 1.0) 3 = - 0.833
 Tương tự cho các cặp Item còn lại.


4/19/2012            trungnb3535@gmail.com     15
7. Demo giải thuật Slope One
     Từ đó ta có một ma trận Item – Item




4/19/2012               trungnb3535@gmail.com   16
7. Demo giải thuật Slope One
2. Tính giá trị ratings cho Item 4.
y = x + btb
 y14 = x1 + b14 = 5.0 + 0.25 = 5.25
 y24 = x2 + b24 = 3.0 + 0.25 = 3.25
 y34 = x3 + b34 = 2.5 + 0.167 = 2.667
y4 = (5.25 4 + 3.25 2 + 2.667 3) (4 + 2 + 3)
   = 3.94
 Tương tự : y5 = 4.75, y6 = 4.2

4/19/2012          trungnb3535@gmail.com       17
7. Demo giải thuật Slope One
 Ta có : y5 > y6 > y4
 gợi ý cho User 1 :
        Item 5
        Item 6
        Item 4




4/19/2012                trungnb3535@gmail.com   18
Tài Liệu Tham Khảo
1.      Mahout In Action - Sean Owen, Robin Anil, Ted
        Dunning, and Ellen Friedman, 2012
2.      http://en.wikipedia.org/wiki/Collaborative_filtering
3.      http://en.wikipedia.org/wiki/Recommender_system




4/19/2012                     trungnb3535@gmail.com            19

More Related Content

What's hot

Bài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệuBài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệu
Lê Minh
 

What's hot (20)

Phân tích thiết kế hệ thống quản lý bán nước giải khát
Phân tích thiết kế hệ thống quản lý bán nước giải khátPhân tích thiết kế hệ thống quản lý bán nước giải khát
Phân tích thiết kế hệ thống quản lý bán nước giải khát
 
Luận văn: Hệ thống khuyến nghị cho bài toán dịch vụ giá trị gia tăng
Luận văn: Hệ thống khuyến nghị cho bài toán dịch vụ giá trị gia tăngLuận văn: Hệ thống khuyến nghị cho bài toán dịch vụ giá trị gia tăng
Luận văn: Hệ thống khuyến nghị cho bài toán dịch vụ giá trị gia tăng
 
Quan Ly Thu Vien Slide 20081029
Quan Ly Thu Vien Slide 20081029Quan Ly Thu Vien Slide 20081029
Quan Ly Thu Vien Slide 20081029
 
Bài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệuBài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệu
 
Đề tài: Hệ thống thông tin quản lý bán hàng tại công ty thương mại
Đề tài: Hệ thống thông tin quản lý bán hàng tại công ty thương mạiĐề tài: Hệ thống thông tin quản lý bán hàng tại công ty thương mại
Đề tài: Hệ thống thông tin quản lý bán hàng tại công ty thương mại
 
Mô hình hóa dữ liệu mức quan niệm
Mô hình hóa dữ liệu mức quan niệm Mô hình hóa dữ liệu mức quan niệm
Mô hình hóa dữ liệu mức quan niệm
 
Bài 5: Chuẩn hóa cơ sở dữ liệu
Bài 5: Chuẩn hóa cơ sở dữ liệuBài 5: Chuẩn hóa cơ sở dữ liệu
Bài 5: Chuẩn hóa cơ sở dữ liệu
 
báo cáo hệ quản trị cơ sỡ dữ liệu hệ thống bán cà phê
báo cáo hệ quản trị cơ sỡ dữ liệu hệ thống bán cà phêbáo cáo hệ quản trị cơ sỡ dữ liệu hệ thống bán cà phê
báo cáo hệ quản trị cơ sỡ dữ liệu hệ thống bán cà phê
 
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thịđồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
 
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAYTài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
 
Com201 slide 5
Com201   slide 5Com201   slide 5
Com201 slide 5
 
Phân tích thiết kế hệ thống của hàng bán điện thoại di động
Phân tích thiết kế hệ thống của hàng bán điện thoại di độngPhân tích thiết kế hệ thống của hàng bán điện thoại di động
Phân tích thiết kế hệ thống của hàng bán điện thoại di động
 
Data mining - Luật kết hợp và ứng dụng
Data mining - Luật kết hợp và ứng dụngData mining - Luật kết hợp và ứng dụng
Data mining - Luật kết hợp và ứng dụng
 
Phân tích và thiết kế hệ thống quản lý bán hàng
Phân tích và thiết kế hệ thống quản lý bán hàngPhân tích và thiết kế hệ thống quản lý bán hàng
Phân tích và thiết kế hệ thống quản lý bán hàng
 
Báo cáo tốt nghiệp - XÂY DỰNG CHƯƠNG TRÌNH QUẢN LÝ NHÀ HÀNG VỪA VÀ NHỎ SỬ DỤ...
Báo cáo tốt nghiệp - XÂY DỰNG CHƯƠNG TRÌNH QUẢN LÝNHÀ HÀNG VỪA VÀ NHỎ SỬ DỤ...Báo cáo tốt nghiệp - XÂY DỰNG CHƯƠNG TRÌNH QUẢN LÝNHÀ HÀNG VỪA VÀ NHỎ SỬ DỤ...
Báo cáo tốt nghiệp - XÂY DỰNG CHƯƠNG TRÌNH QUẢN LÝ NHÀ HÀNG VỪA VÀ NHỎ SỬ DỤ...
 
Bai nop chinh-thuc
Bai nop chinh-thucBai nop chinh-thuc
Bai nop chinh-thuc
 
Đề Tài Thiết Kế Phần Mềm Quản Lý Sinh Viên
Đề Tài Thiết Kế Phần Mềm Quản Lý Sinh Viên Đề Tài Thiết Kế Phần Mềm Quản Lý Sinh Viên
Đề Tài Thiết Kế Phần Mềm Quản Lý Sinh Viên
 
[Báo cáo] Bài tập lớn Ngôn ngữ lập trình: Quản lý thư viện
[Báo cáo] Bài tập lớn Ngôn ngữ lập trình: Quản lý thư viện[Báo cáo] Bài tập lớn Ngôn ngữ lập trình: Quản lý thư viện
[Báo cáo] Bài tập lớn Ngôn ngữ lập trình: Quản lý thư viện
 
Bài tập lớn Phát triển phần mềm hướng dịch vụ PTIT
Bài tập lớn Phát triển phần mềm hướng dịch vụ PTITBài tập lớn Phát triển phần mềm hướng dịch vụ PTIT
Bài tập lớn Phát triển phần mềm hướng dịch vụ PTIT
 
He thong quan Ly _ Giang day va co van hoc tap
He thong quan Ly _ Giang day va co van hoc tapHe thong quan Ly _ Giang day va co van hoc tap
He thong quan Ly _ Giang day va co van hoc tap
 

Recently uploaded

kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsbkjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
hoangphuc12ta6
 
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdfGIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
LngHu10
 

Recently uploaded (18)

DS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdf
DS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdfDS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdf
DS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdf
 
3000 từ thông dụng tiếng anh quốc tế Effortless
3000 từ thông dụng tiếng anh quốc tế Effortless3000 từ thông dụng tiếng anh quốc tế Effortless
3000 từ thông dụng tiếng anh quốc tế Effortless
 
Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...
Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...
Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...
 
TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...
TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...
TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...
 
Bài thuyết trình môn học Hệ Điều Hành.pptx
Bài thuyết trình môn học Hệ Điều Hành.pptxBài thuyết trình môn học Hệ Điều Hành.pptx
Bài thuyết trình môn học Hệ Điều Hành.pptx
 
2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx
2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx
2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx
 
onluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doc
onluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doconluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doc
onluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doc
 
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
 
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...
 
ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...
ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...
ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...
 
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdfGIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
 
Thực hành lễ tân ngoại giao - công tác NG
Thực hành lễ tân ngoại giao - công tác NGThực hành lễ tân ngoại giao - công tác NG
Thực hành lễ tân ngoại giao - công tác NG
 
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
 
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsbkjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
 
20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...
20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...
20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...
 
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdfGIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
 
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...
 
slide tuần kinh tế công nghệ phần mềm hust
slide tuần kinh tế công nghệ phần mềm hustslide tuần kinh tế công nghệ phần mềm hust
slide tuần kinh tế công nghệ phần mềm hust
 

Thuật toán Slope One (final)

  • 1.
  • 2. Nội Dung 1. Giới thiệu về Recommendation 2. Giới thiệu về Collaborative Filtering 3. Giới thiệu về Item – Base Filtering 4. Giới thiệu về Slope One 5. Giải thuật Slope One 6. Ví dụ về Slope One 7. Demo chương trình Mahout theo giải thuật Slope One 4/19/2012 trungnb3535@gmail.com 2
  • 3. 1. Recommendation  Recommendation là việc dự đoán khuynh hướng sở thích của con người, được sử dụng để tìm ra những cái mới, những cái mà người ta muốn  Recommendation có hai kiểu:  Collaborative Filtering  Content-based Filtering 4/19/2012 trungnb3535@gmail.com 3
  • 4. 2. Collaborative Filtering Recommender  Là phương thức đưa ra dự đoán dựa trên sở thích, hành vi của nhiều User và của User này trong quá khứ.  Chúng ta không cần quan tâm đến bản chất của Item, các thuộc tính của Item. Nhưng cần một lượng dữ liệu lớn ban đầu để có thể dự đoán.  Có 2 nhóm giải thuật:  User – based recommendation  Item – based recommendation 4/19/2012 trungnb3535@gmail.com 4
  • 5. 3. Item – based recommendation  Giải thuật này dự đoán dựa trên sự tương đồng giữa các Item  Ví dụ : Amazon.com mua 1 quyển sách sẽ giới thiệu một quyển sách tương tự (cùng chủ đề) Mua một album của BackstreetBoys thì có thể mua một album khác của BackstreetBoys.  Quan hệ giữa ratings của các cặp item được thể hiện qua hàm : y = ax + b 4/19/2012 trungnb3535@gmail.com 5
  • 6. 4. Slope One  Slope One là một trường hợp đặc biệt của Item – based recommendation khi hệ số góc a = 1 (slope one).  Mối liên hệ giữa 2 item được thể hiện qua hàm y = x + b, b là độ chênh lệnh trung bình giá trị ratings của 2 item. 4/19/2012 trungnb3535@gmail.com 6
  • 7. 5. Giải thuật Slope One 1. Tính độ chênh lệch trung bình giữa item đó với các Item còn lại 2. Tính ra giá trị ratings theo các Item kia 3. Tính giá trị ratings trung bình mà User có thể đánh giá Item 4/19/2012 trungnb3535@gmail.com 7
  • 8. 6. Ví dụ User A đánh giá item i là 1, item j là 1.5 User B đánh giá item i là 2 User B sẽ đánh giá item j là bao nhiêu (r)? Giải Ta có : b = 1.5 – 1 = 0.5 => r = 2 + 0.5 = 2.5 trungnb3535 4/19/2012 8 @gmail.com
  • 9. Ví dụ khác 4/19/2012 trungnb3535@gmail.com 9
  • 10. Giá trị Ratings chênh lệch trung bình giữa Item 1 và Item 2 là:b = (2 + (-1))/2 = 0.5 => Item 1 luôn được đánh giá cao hơn Item 2 một khoảng 0.5  Tương tự, giá trị Ratings chênh lệch trung bình giữa Item 1 và Item 3 là : b = 3  Dựa vào giá trị giá trị b được tính ở trên, ta có thể đưa ra dự đoán Ratings của 1 User cho 1 Item dựa theo hàm f(x) = x + b  Ví Dụ : dự đoán đánh giá của Lucy cho Item 1 dựa theo Item 2 thì là f(2) = 2 + 0.5 = 2.5, dựa theo Item 3 là : f(5) = 5 + 3 = 8  Giá trị Ratings trung bình theo dự đoán mà Lucy đánh giá Item 1 :  Do đó, để thực hiện Slope One cho n Item thì cần phải tính toán và lưu lại các chênh lệch trung bình và số lượng các Ratings chung cho mỗi cặp trong số n2 cặp Item. 4/19/2012 trungnb3535@gmail.com 10
  • 11. 7. Demo giải thuật Slope One  Dữ liệu đầu vào : File dữ liệu có dạng : userId,itemId,ratings  Đầu ra : các Item gợi ý cho User 1. 4/19/2012 trungnb3535@gmail.com 11
  • 12. 7. Demo giải thuật Slope One  1,101,5.0  4,101,5.0  1,102,3.0  4,103,3.0  1,103,2.5  4,104,4.5  2,101,2.0  4,106,4.0  2,102,2.5  5,101,4.0  2,103,5.0  5,102,3.0  2,104,2.0  5,103,2.0  3,101,2.5  5,104,4.0  3,104,4.0  5,105,3.5  3,105,4.5  5,106,4.0  3,107,5.0 4/19/2012 trungnb3535@gmail.com 12
  • 13. Hình 1 : Quan hệ User - Item 4/19/2012 trungnb3535@gmail.com 13
  • 14. User 1 User 2 User 3 User 4 User 5 Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 4/19/2012 trungnb3535@gmail.com 14
  • 15. 7. Demo giải thuật Slope One 1. Tính độ chênh lệch trung bình giữa Item 1 và Item 2 :  1,101,5.0 | 2,101,2.0 | 5,101,4.0  1,102,3.0 | 2,102,2.5 | 5,102,3.0 b= -2.0 0.5 -1.0 Giá trị trung bình : btb = (-2.0 + 0.5 – 1.0) 3 = - 0.833  Tương tự cho các cặp Item còn lại. 4/19/2012 trungnb3535@gmail.com 15
  • 16. 7. Demo giải thuật Slope One  Từ đó ta có một ma trận Item – Item 4/19/2012 trungnb3535@gmail.com 16
  • 17. 7. Demo giải thuật Slope One 2. Tính giá trị ratings cho Item 4. y = x + btb  y14 = x1 + b14 = 5.0 + 0.25 = 5.25  y24 = x2 + b24 = 3.0 + 0.25 = 3.25  y34 = x3 + b34 = 2.5 + 0.167 = 2.667 y4 = (5.25 4 + 3.25 2 + 2.667 3) (4 + 2 + 3) = 3.94  Tương tự : y5 = 4.75, y6 = 4.2 4/19/2012 trungnb3535@gmail.com 17
  • 18. 7. Demo giải thuật Slope One  Ta có : y5 > y6 > y4  gợi ý cho User 1 :  Item 5  Item 6  Item 4 4/19/2012 trungnb3535@gmail.com 18
  • 19. Tài Liệu Tham Khảo 1. Mahout In Action - Sean Owen, Robin Anil, Ted Dunning, and Ellen Friedman, 2012 2. http://en.wikipedia.org/wiki/Collaborative_filtering 3. http://en.wikipedia.org/wiki/Recommender_system 4/19/2012 trungnb3535@gmail.com 19

Editor's Notes

  1. Ngày nay, chúngtacóthểnêura ý kiếncủamìnhvềnhữnggìmàchúngtathích, khôngthích, thậmchílàkhôngquantâmđến. Mặcdùsởthíchcủa con ngườilàrấtđadạng, nhưngnóvẫntheonhữngkiểugiốngnhau. VD nhưmốtthờitrang, game online.VDtrongthưviệnsách, bạnlấy 1 quyểnsáchtrêngiávìcóthểlànónằmliềnkềvớiquyểnsáchmàbạnđãbiết, cùngchủđềhoặccóthểlàbạnthấynótrongchồngsáchcủabạnbèvàcũngmuốncómộtquyểntươngtựđểđọchoặclàhọgiớithiệuvớibạnvềquyểnsáchnày. Nócónhiềunguyênnhânkhácnhaunhưngtựuchunglạithìcóhaicáchđểtìmrathứbạncóthểthích :Tìmnhững item mànógiốngvới item ma ban thích (item-based recommender algorithms)Tìmnhữngngườicùngsởthíchxemhọthíchcáinào (user-based recommender algorithms)Recommendation cóhaikiểu:Collaborative Filtering : dựatrênmốiquanhệgiữa User và Item (thông qua các Items hay Users khác)Content-based Filtering : dựatrênnhữngthuộctínhcủa Item. VD: đưaracuốnsáchcùngnhàxuấtbảnhoặccùngtácgiả. Book(sốtrang, tácgiả, nxb, màu, font)- Do Content-based Filtering phảihiểurõvề Item rồixâydựngbộthuộctínhcho Item đó. Vàviệc recommend một Item nócũngkhácvới Item khácnêntốnnhiềucôngsứcđể recommend hơn.
  2. Sựliênquangiữa User và Item (thông qua các User hoặccác Item khác)-Ở giảithuậtUser – base recommendation : Tìmkiếmnhững User cócùngsởthích, hoặccóquanhệvới User nàySửdụngnhững ratings từnhững User đểdựđoán rating mà User nàysẽđánhgiá Item.Vídụ : User tuổi teen thíchnhững album nhạctrẻkiểunhư 1 album củaĐanTrườngchẳnghạn.Ngườibạnthâncủa User thíchĐanTrường, nêncóthể User nàycũngthíchĐanTrườngUser thíchĐanTrường, Lam Trường. CómộtngườicũngthíchĐanTrường, Lam TrườngvàthêmcảCẩm Ly. User cóthểcũngthíchCẩm Ly
  3. - Item – based recommender thìnócũngtươngtự User – based recommender (môhìnhdữliệu, thựcthisựtươngđồng)