Rapečka, Aurimas ; Marcinkevičius, Virginijus ; Dzemyda, Gintautas „Rekomendacinės sistemos algoritmų veikimo elektroninio knygyno duomenų bazėje analizė“ (VU MII)
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Rapečka, Aurimas ; Marcinkevičius, Virginijus ; Dzemyda, Gintautas „Rekomendacinės sistemos algoritmų veikimo elektroninio knygyno duomenų bazėje analizė“ (VU MII)
1. Rekomendacinės sistemos algoritmų veikimo
elektroninio knygyno duomenų bazėje
analizė
Aurimas Rapečka,
dr. Virginijus Marcinkevičius,
prof. habil. dr. Gintautas Dzemyda
2013-09-21
2. Rekomendacinės sistemos (RS)
RS sprendžia šias pagrindines problemas:
1. Padeda išsirinkti produktą iš panašių produktų
gausos.
2. Padeda išskirti reikiamą produktą iš nereikalingų
produktų aibės.
Atsirado kaip atsakas į informacijos perteklių internete.
Padeda vartotojui išsirinkti norimą prekę ar paslaugą.
3. Rekomendacinės sistemos (2)
Didžiajai daliai RS reikalinga:
◦ 1. Vartotojų aibė.
◦ 2. Produktų aibė.
◦ 3. Vartotojų vertinimų produktams aibė.
RS etapai
◦ Įvesties (duomenys – vertinimai, demografiniai, turinys)
◦ Filtravimo (ieškoma panašumų tarp vartotojų)
◦ Išvesties (prognozė arba rekomendacija)
7. Programinė įranga
Atnaujinta
Progr.
kalba
Realizuoti
Reitingų
Produktų
savo
RS algoritmų
progn.
rekomend.
MyMediaLite
2013 04
C#
>20
Taip
Taip
Taip
Apache Mahout
2012 06
Java
3
Ne
Taip
Taip
GraphLab
2012 05
C++
15
Taip
Taip
Taip
LensKit
2012
Java
?
Taip
Taip
Taip
Waffles
2013 04
C++
>5
Ne
Taip
Ne
easyrec
2012 02
Online
1
Ne
Taip
Taip
RecLab
2011 02
Online
1
Ne
Taip
Ne
Crab
2011
Python
>5
Taip
Taip
Taip
recommenderlab
2011 11
C++
4
Taip
Taip
Taip
Jellyfish
2012 12
Python
1
Ne
Taip
Ne
OpenSlopeOne
2010 06
PHP
1
Taip
Taip
Ne
AppRecommender
2011
Python
>10
Ne
Taip
Taip
12. Išvados
1. Atkreipiamas dėmesys, kad turimo duomenų rinkinio
užpildymais nenuliniais elementais yra labai mažas (50,68%
pirkėjų įsigujo tik vieną knygą, o 88,29% sistemos vartotojų
yra nupirkę mažiau nei 5 knygas), todėl siūlomų algoritmų
tikslumas nėra didelis.
2. Naujiems arba neaktyviems vartotojams (pirkimų istorijoje
turintiems tik 1 ar 2 nupirktų knygų įrašus) geriausius
rezultatus parodė MostPopular ir MostPopularByAttributes
algoritmai, kuomet atsižvelgiama ne vien tik į knygų, bet ir į
knygų kategorijų bei autorių populiarumą visoje sistemoje.
13. Išvados
3. Vartotojams, turintiems daugiau nei 3 knygas pirkimų
istorijoje, geriausias rekomendacijas generavo UserKNN
algoritmas, analizuojantis konkretaus vartotojo pirkimų
istoriją ir ieškantis panašumų kitų vartotojų pirkimų
istorijose. Tačiau pastebėtina, kad šis metodas reikalauja
daugiau kompiuterio operatyviosios atminties ir laiko išteklių
skaičiavimams, todėl jis negali veikti realiu laiku.
4. Nustatyta, kad esant didesniam vartotojo pirktų knygų
skaičiui (>8), pakankamai gerus rezultatus pademonstravo
BPRSLIM algoritmas, kurio skaičiavimai vyksta daug
greičiau. Šis algoritmas galėtų būti naudojamas kaip
alternatyva didelių resursų reikalaujančiam UserKNN
algoritmui.