ИТМО Machine Learning. Рекомендательные системы — часть 1

Рекомендательные
системы
Лекция 1
Андрей Данильченко
НИУ ИТМО, 10 ноября 2014

Что такое
рекомендательная
система?

│ Recommender Systems
are software tools and
techniques providing
suggestions for items to
be of use to a user
F. Ricci “Recommender Systems Handbook”
9

Количество статей в области
по данным google scholar (от 2014-10-17)

Какие бывают
рекомендательные
системы?

Классификация RS
Available data
Tags
&
Metadata
User history Content
Collaborative Content-based
Hybrid

Данные
• Рейтинги (explicit feedback)
• унарные (like)
• бинарные (like/dislike)
• числовые (stars)
• История действий пользователя (implicit feedback)
• Тэги, метаданные
• Комментарии, отзывы
• Друзья

Рекомендательные задачи
15
• Predict
• Recommend
• Similar

Как построить простую
рекомендательную
систему?
16

User-based kNN
Как продукт оценили похожие пользователи?
ˆ rui =
1
Ni (u)
rvi
Σ
v∈Ni (u)
Взвесим вклад каждого
ˆ rui =
wuvrvi
Σ
v∈Ni (u)
wuv
Σ
v∈Ni (u)
И нормализуем рейтинги
ˆ rui = h−1
wuvh rvi ( )
Σ
v∈Ni (u)
wuv
Σ
v∈Ni (u)
$
&&&
%
'
)))
(

Как посчитать расстояние?
Косинусное расстояние
Корреляция Пирсона
cos(u, v) =
ruirvi
Σ
i∈Iuv
Σ r2
rui
vj
i∈Iu
2
Σ
j∈Iv
PC(u, v) =
(rui − ru )(rvi − rv )
Σ
i∈Iuv
Σ (r− r)2
(r− r)2
ui u vj v i∈Iu
Σ
j∈Iv
Поправленное косинусное
расстояние
(adjusted cosine)
AC(u, v) =
(rui − ri )(rvi − ri )
Σ
i∈Iuv
Σ (r− r)2
(r− r)2
ui i vj j i∈Iu
Σ
j∈Iv

Как нормализовать рейтинги?
19
h rui ( ) = rui − ru
h rui ( ) =
rui − ru
σ u
h rui ( ) =
j ∈ Iu : ruj ≤ rui { }
Iu
Mean centering
Z-score
Percentile score

Как выиграть Netflix Prize?

http://sifter.org/~simon/journal/20061211.html

Singular Value Decomposition
Теорема:
если в матрице λ оставить k наибольших элементов, то полученное
произведение A’ будет наилучшим среди всех матриц ранга k
приближением матрицы A.

Baseline predictors
Модель:
rˆuui =μ + bu + bi
argmin
b*
Σ ( 2
r−μ − b− b)
uui u i (u,i )∈R
Σ 2 +
Σ
bi
+λ bu
u∈U
2
i∈I
$
% &
'
( )
Функция ошибки:

SVD
Модель:
ˆ rui =μ + bu + bi + pu
Tqi
argmin
p*q*b*
Σ 2
( r−μ − b− b− pTq)
ui u i u
i (u,i )∈R
2 ( )
+λ pu
2
+ qi
2
+ bu
2 + bi

Optimization by SGD
Модель:
ˆ rui =μ + bu + bi + pu
Tqi
argmin
p*q*b*
Σ 2
( r−μ − b− b− pTq)
ui u i u
i (u,i )∈R
2 ( )
+λ pu
2
+ qi
2
+ bu
2 + bi
Шаг стохастического градиентного спуска:
bu ←bu +γ1 eui −λ1bu ( )
bi ←bi +γ1 eui −λ1bi ( )
pu ← pu +γ 2 euiqi −λ2 pu ( )
qu ←qi +γ 2 eui pu −λ2qi ( )

Alternating Least Squares
P-step: обновление при фиксированных векторах item-ов
pu = λnuI + Au ( )−1 du
Au =Q[u]TQ[u] = qiqi
T
Σ
i:(u,i)∈R
Σ
du =Q[u]T ru = ruiqi
i:(u,i)∈R
Q-step: обновление при фиксированных векторах пользователей
qi = λniI + Ai ( )−1 di
Ai = P[i]T P[i] = pupu
T
Σ
u:(u,i)∈R
Σ
di = P[i]T ri = rui pu
u:(u,i)∈R

Что делать с implicit
feedback?

Как использовать implicit feedback?
Идея: rating => (preference, confidence)
pui ∈ {0,1}
cui ∈ ℜ+
∀(u, i) ∈ R
pui =1
pui = 0 иначе
cui =1+αrui
или
cui =1+α log 1+ rui
( β )

Обучение модели
argmin
x*y*
Σ 2
T yi ( )
cui pui − xu
(u,i )
Σ + yi
+λ xu
2
u
2
Σ
i
#
$ %
&
' (
xu = (λ I +Y TCuY )−1
Y TCup(u)
yi = λ I + XTCi( X)−1
XTCi p(i)
Это сводится к уравнениям для ALS:

Обучение модели
argmin
x*y*
Σ 2
T yi ( )
cui pui − xu
(u,i )
Σ + yi
+λ xu
2
u
2
Σ
i
#
$ %
&
' (
Y TCup(u)
yi = λ I + XTCi( X)−1
XTCi p(i)
Это сводится к уравнениям для ALS:
Но есть проблема!

Ускорение iALS
Идея:
Y TCuY = Y TY +Y T (Cu − I )Y
Cu − I
В матрице всего ненулевых элементов,
Cup(u)
в матрице всего ненулевых элементов,
Y TY
O f 2N + f 3 ( U )
nu
nu
а не зависит от пользователя!
Итого: обновляем вектора пользователей за

Интуиция iALS
Выпишем ALS-шаг в упрощенной форме:
Y TCu p(u) = λ I + Au ( )−1 du
Введем «нулевого» пользователя без фидбека:
Σ
Σ T yd= cpyi
0 0 0i
A0 = c0yi
i
i
T yi
Тогда для остальных пользователей выводим:
Σ
Au = A0 + (cui − c0 )yi
(u,i )∈N(u)
Σ
du = d0 + cui pui − c0 p0 ( ) yi
(u,i)∈N(u)

Как выбирать c0 и p0?
∀(u, i) ∈ N
Как и раньше:
pui =1
pui = 0 иначе
cui =1+αrui

Как выбирать c0 и p0?
∀(u, i) ∈ N
Как и раньше:
pui =1
pui = 0 иначе
cui =1+αrui
p0 = 0
c0 =1

А разве что-то еще
осталось?
35

If you like this lecture you will like these books

If you like this lecture you will also like

If you like this lecture you will probably like
http://www.4ducks.ru/pages/itmo-rs-2014.html

Удачи!
Андрей Данильченко
группа разработки рекомендательных систем, Яндекс
danilchenko@yandex-team.ru

ИТМО Machine Learning. Рекомендательные системы — часть 1

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to ИТМО Machine Learning. Рекомендательные системы — часть 1

Similar to ИТМО Machine Learning. Рекомендательные системы — часть 1 (20)

ИТМО Machine Learning. Рекомендательные системы — часть 1