Aula polska: Rekomendacje filmów na Filmaster.pl

1,039 views
950 views

Published on

Komputerowe wróżbiarstwo
Czyli jak poprawić rekomendacje o 20%?
Jakub Tlałka

Published in: Technology, Self Improvement
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,039
On SlideShare
0
From Embeds
0
Number of Embeds
31
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Aula polska: Rekomendacje filmów na Filmaster.pl

  1. 1. Filmaster.pl Komputerowe wróżbiarstwo Czyli jak poprawić rekomendacje o 20%? Jakub Tlałka
  2. 2. Czym jest Filmaster? Filmaster to otwarty, społecznościowy serwis dla miłośników kina. Można na nim prowadzić filmowego bloga, oceniać filmy i dyskutować z innymi użytkownikami. Bonusem są spersonalizowane rekomendacje. Kod napisany w języku Python przy użyciu frameworka Django i bazy PostgreSQL. Dostępny na wolnej licencji AGPLv3. Każdy może go użyć/poprawić.
  3. 3. Rekomendacje: Najprostsze podejście Określamy podobieństwo użytkowników na podstawie wspólnie ocenionych filmów. Przewidywana ocena filmu to średnia ważona oceny pozostałych użytkowników, gdzie wagą jest zbieżność gustu.
  4. 4. Nowy algorytm rekomendacji Zakładamy że na ocenę wpływają pewne abstrakcyjne cechy. Dla każdej z nich liczymy: - istotność dla każdego z użytkowników - poziom cechy w rozważanych filmach Na podstawie wyliczonych współczynników obliczamy przewidywaną ocenę dla każdej pary (użytkownik, film).
  5. 5. Ocena rekomendacji RMSE – wskaźnik skuteczności algorytmu R - zbiór wszystkich ocen g(r) – przewidywana ocena
  6. 6. Co się poprawiło? Stary algorytm Nowy algorytm RMSE 1,55 1,30 Szybkość (0,5 4 godziny 20 minut mln ocen) (Python) (C++) Dostępność Baza mocno Jednorazowa zasobów obciążona aktualizacja Możliwości Nikłe Duże: Netflix ulepszenia ma RMSE 0,85
  7. 7. Problemy... Przewidywane oceny wychodziły poza skalę Rozwiązanie: usunięcie sztucznych ograniczeń Spore wahanie rekomendacji w skali dziennej Rozwiązanie: na razie brak...
  8. 8. Problemy... Przy złym doborze współczynników algorytm wymyka się spod kontroli Rozwiązanie: Kontrola poprawności przy użyciu RMSE, skalowanie współczynników w przypadku nieprawidłowego działania
  9. 9. Więcej problemów... Problemy związane z rozmiarem danych (obecnie ponad pół miliona ocen, ponad 8,5 mln rekomendacji) Rozwiązanie: aktualizacja danych przez czyszczenie bazy rekomendacji wraz z indeksami, a potem wrzucanie nowych wyników i odnawianie indeksów.
  10. 10. Zastosowania Opisane podejścia można stosować w przypadku dowolnego zbioru obiektów podlegających ocenie: literatura, muzyka Wyliczane współczynniki mogą służyć również do określania podobieństwa między obiektami Znajdowanie cech wspólnych między pozornie różnymi obiektami
  11. 11. Przyłącz się! www: filmaster.pl, filmaster.com portal dla deweloperów: filmaster.org fan page: facebook.com/FilmasterCom kod: bitbucket.org/filmaster/filmaster-test filmaster@

×