Введение в рекомендательные системы

Введение в
рекомендательные
системы

Андрей Данильченко
разработчик

Структура
•  Introduction
•  Collaborative ﬁltering
•  Content-based & hybrid methods
•  Evaluation

Introduction
“Recommender Systems (RSs) are
software tools and techniques
providing suggestions for items to be
of use to a user”

F. Ricci

Историческая справка
199*

200*

2006-2009

2011

KDD cup
on
Yahoo! Music
Netﬂix Prize
Выход в online
Разработки
для
супермаркетов

Количество статей в области RS

по данным google scholar (от 2013-10-15)

Мы живем в эпоху
рекомендательных систем!

Классификация RS
Available data

User history

Tags
&
Metadata

Collaborative

Content

Content-based

Hybrid

Данные
•  Рейтинги (explicit feedback)
•  Унарные (like)
•  Бинарные (like/dislike)
•  Числовые (stars)

•  История действий (implicit feedback)
•  Теги, метаданные
~
•  Отзывы
•  Друзья (community-based RS)

Постановка задач RS

•  Predict
•  Recommend
•  Similar

Collaborative ﬁltering
•  Neighborhood methods
•  Matrix factorization methods


Neighborhood methods

Идея метода (user-based)
Как продукт оценили похожие пользователи?
ˆ
rui =

1

∑
N ( u)
i

rvi

v∈N i (u)

Взвесим вклад каждого

∑

wuv rvi

ˆui = v∈Ni (u)
r

∑

wuv

v∈N i (u)

И нормализуем рейтинги
$ ∑ w h (r ) '
& v∈N (u) uv vi )
ˆ
rui = h −1 & i
)
∑ wuv )
&
% v∈Ni (u)
(

Какое расстояние использовать?
•  Косинусное расстояние

∑r r

ui vi

cos(u, v) =

i∈I uv

∑r ∑ r
2
ui

i∈I u

2
vj

j∈I v

•  Корреляция Пирсона

∑ (r

ui

PC(u, v) =

− ru )(rvi − rv )

i∈I uv

(rui − ru )2 ∑ (rvi − rv )2
∑
i∈I u

j∈I v

Как нормализовать рейтинги?
•  Mean centering
h ( rui ) = rui − ru

•  Z-score
rui − ru
h ( rui ) =
σu

•  Percentile
h ( rui ) =

{ j ∈ Iu : ruj ≤ rui }
Iu


Matrix factorization methods

Наилучшее приближение ранга k

Теорема:
Если в матрице λ оставить k наибольших сингулярных векторов,
то получим наилучшее приближение матрицы A ранга k

Baseline predictors
Модель:
ˆu
rui = µ + bu + bi

Функция ошибки:
argmin
b*

∑ (r

ui
u

(u,i)∈R

− µ − bu − bi )

2

$
'
2
2
+ λ & ∑ bu +∑ bi )
% u∈U
(
i∈I

SVD
Модель:
T
ˆu
rui = µ + bu + bi + pu qi

argmin
p*q*b*

∑ (r

ui
u

(u,i)∈R

2

(

2

− µ − bu − bi − p qi ) + λ pu + qi
T
u

2

2
u

2
i

+b +b

)

Neighborhood (item-based)
Модель:
ˆu
rui = bui +

∑

k

j∈S (u,i)

∑

sij ( ruj − buj )
k

j∈S (u,i)

sij

= bui + ∑

j∈S k (u,i)

u
θ ij ( ruj − buj )

Neighborhood (optimization)

ˆu
rui = bui +

∑

k

j∈S (u,i)

∑

sij ( ruj − buj )
k

j∈S (u,i)

sij

ˆu
rui = bui +

= bui + ∑

∑ ω (r
ij

j∈R(u)

uj

j∈S k (u,i)

− buj )

u

Neighborhood (optimization + implicit)

ˆu
rui = bui +

∑

k

j∈S (u,i)

∑

sij ( ruj − buj )
k

j∈S (u,i)

sij

ˆu
rui = bui +

= bui + ∑

∑ ω (r
ij

j∈R(u)

uj

j∈S k (u,i)

− buj ) +

u

∑
j∈N (u)

cij

Neighborhood (normalization)
û
rui = bui +

∑ ω (r
ij

uj

j∈R(u)

û
rui = bui + R(u)

−

1
2

− buj ) +

∑

cij

j∈N (u)

∑ ω (r
ij

uj

− buj ) + N(u)

−

1
2

j∈R(u)

û
rui = bui + R k (i, u)

−

1
2

∑

j∈R k (u)

∑

cij

j∈N (u)

ωij ( ruj − buj ) + N k (i, u)

−

1
2

∑

j∈N k (u)

cij

Снова SVD
Модель:
T
ˆu

argmin
p*q*b*

∑ (r

ui
u

(u,i)∈R

2

(

2

− µ − bu − bi − p qi ) + λ pu + qi
T
u

2

2
u

2
i

+b +b

)

Asymmetric-SVD
Модель:

$
1
−
ˆu
rui = µ + bu + bi + qiT & R(u) 2
&
%

∑ (r

uj

− buj ) x j + N(u)

−

1
2

j∈R(u)

'
∑ yj )
)
(
j∈N (u)

argmin
p*q*b*

∑
(u,i)∈R

ˆu
(rui − rui )
u

2

$
+λ & qi
&
%

2

2
+ bu + bi2 +

∑
j∈R(u)

xj

2

+

∑
j∈N (u)

yj

2

'
)
)
(

SVD++
Модель:

$
1
−
ˆu
rui = µ + bu + bi + qiT & pu + N(u) 2
&
%

'
∑ yj )
)
(
j∈N (u)

argmin
p*q*b*

∑
(u,i)∈R

ˆu
(rui − rui )
u

2

$
2
+λ & pu + qi
&
%

2

2
+ bu + bi2 +

∑
j∈N (u)

yj

2

'
)
)
(

Integrated model
Модель:

$
1
−
ˆu
rui = µ + bu + bi + qiT & pu + N(u) 2
&
%
k

+ R (i, u)

−

1
2

∑

j∈R k (u)

'
∑ yj ) +
)
(
j∈N (u)
k

ωij ( ruj − buj ) + N (i, u)

−

1
2

∑

j∈N k (u)

cij

Сравнение моделей по RMSE

Модель

50 факторов

100 факторов

200 факторов

Лучшее

Item-based kNN

—

—

—

0.9406

Neighborhood

—

—

—

0.9002

SVD

0.9046

0.9025

0.9009

0.9009

Asymmetric SVD

0.9037

0.9013

0.9000

0.9000

SVD++

0.8952

0.8924

0.8911

0.8911

Integrated
model

0.8877

0.8870

0.8868

0.8868

на данных Netﬂix Prize

А как все это оптимизировать?

SGD-оптимизация модели SVD
Модель:
T
ˆu

argmin
p*q*b*

∑ (r

ui
u

(u,i)∈R

2

(

2

− µ − bu − bi − p qi ) + λ pu + qi
T
u

Правила для градиентного спуска:
bu ← bu + γ1 ( eui − λ1bu )
bi ← bi + γ1 ( eui − λ1bi )
pu ← pu + γ 2 ( eui qi − λ2 pu )
qu ← qi + γ 2 ( eui pu − λ2 qi )

2

2
u

2
i

+b +b

)

Ridge regression
Модель:

T

yi ← w xi
T

w w→0

n
# T
2&
T
argmin % λ w w + ∑ ( w xi − yi ) (
w
$
'
i=1

Точное решение:
−1

−1

w = ( λ I + X X ) X y = ( λ I + A) d
T

T

A=X X
T

d=X y

T

ALS-оптимизация модели SVD
Модель:
T
ˆu

argmin
p*q*b*

∑ (r

2

(

2

− µ − bu − bi − p qi ) + λ pu + qi
T
u

ui
u

(u,i)∈R

P-step:
−1
pu = ( λ nu I + Au ) du
Au = Q[u]T Q[u] =

∑

d = Q[u] ru =

∑

i:(u,i)∈R

rui qi

2
u

2
i

+b +b

)

Q-step:
−1
qi = ( λ ni I + Ai ) di
qi qiT

Ai = P[i]T P[i] =

∑

T
pu pu

u:(u,i)∈R

i:(u,i)∈R
T

2

T

di = P[i] ri =

∑

u:(u,i)∈R

rui pu

Ridge regression (RR1 optimization)
Модель:

T

yi ← w xi
T

w w→0

n
# T
2&
T
argmin % λ w w + ∑ ( w xi − yi ) (
w
$
'
i=1

Покоординатный спуск (по всем k):
∀ wk xik ≈ yi − ∑ wl xil
n
i=1

l≠k
n

wk

∑ xe
←
(λ + ∑ x x
i=1 ik i
n

i=1 ik ik

)

ALS1-оптимизация модели SVD
Модель:
T
ˆu

argmin
p*q*b*

∑ (r

ui
u

(u,i)∈R

2

(

2

− µ − bu − bi − p qi ) + λ pu + qi

P-step: RR1 для

T
u

pu

Q-step: RR1 для

qi

2

2
u

2
i

+b +b

)

Литература
•  Adomavicius G., Tuzhilin A., “Toward the next generation of
recommender systems: A survey of the state-of-the-art and possible
extensions”, 2005.
•  Sarwar B., Karypis G., Konstan J., Reidl J., “Item-based collaborative
ﬁltering recommendation algorithms”, 2001.
• 
• 
• 

Koren Y., “Factorization Meets the Neighborhood: a Multifaceted
Collaborative Filtering Model”, 2008.
Bell R., and Koren Y., “Scalable Collaborative Filtering with Jointly
Derived Neighborhood Interpolation Weights”, 2007.
I. Pila ́szy, D. Zibriczky, and D. Tikk, “Fast ALS-based matrix
factorization for explicit and implicit feedback datasets”, 2010.

Сontent-based methods
Tag-based methods
True content-based methods


Tag-based methods

Давайте использовать тэги!

Способы генерации тэгов

•  User-generated
•  Web-mining
•  Expert-generated
•  Metadata

Similarity by tags (co-occurrence)
Данные:
облака тэгов

Ti

и

Tj

Меры сходства:
•  Жаккарда Ti  Tj
Ti  Tj

•  Дайса

2 ⋅ Ti  Tj
Ti + Tj

•  Охаи

Ti  Tj
Ti Tj

Similarity by tags (LSA)
•  Разложим матрицу Items x Tags по SVD
•  Меры сходства: косинусное расстояние и др.

x

λ

x

Tag
features

≈

Item
features

Tags

Items

Тэговый вандализм
Тэги Paris Hillton

Last.fm, май 2013

Тэговый вандализм — как бороться?
Исправленные тэги Paris Hillton

•  User listening habbits
•  Filter tags by similarity


True content-based methods

Давайте смотреть на
содержание!

Пример — музыка
• 
• 
• 
• 
• 
• 

Spectral centroid
Spectral ﬂatness
Spectral skewness
Spectral kurtosis
Zero-Crossing Rate (ZCR)
Mel Frequency Cepstrum Coefﬁcients (MFCCs)

• 
• 
• 
• 
• 
• 
• 

Instrumentation
Rhythm
Harmony
Structure
Intensity
Genre
Mood

high-level

low-level

Классификация методов

• 
• 
• 
• 

Weighted
Switching
Mixed
Cascade

Как можно измерить качество RS?

•  Ofﬂine test
•  User study
•  Online experiment

Ofﬂine evaluation
•  Prediction accuracy
–  RMSE
–  MAE

•  Usage prediction accuracy
–  Precision/recall @N
–  F1
–  AUC

•  Ranking accuracy

–  DPM
–  DGC
–  Average Reciprocal Hit Rank (ARHR)

•  Coverage

–  Catalog coverage
–  Sales diversity
–  Gini index
–  Shannon entropy

User study
•  Conﬁdence
•  Trust
•  Novelty
•  Diversity
•  Serendipity
•  Robustness
•  Adaptivity
•  Scalability

Сравнивать легче!

Online study methods

•  A-B testing
•  Team-Driven Interleaving (TDI)

Куда копать дальше?

•  F. Ricci et al. “Recommender Systems
Handbook”, 2011
•  O. Celma “Music Recommendation and
Discovery”, 2010
•  D. Jannach et al. “Recommender Systems: An
Introduction”, 2011

Андрей Данильченко
разработчик

Удачи!

Введение в рекомендательные системы

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (7)

More from Andrey Danilchenko

More from Andrey Danilchenko (6)

Введение в рекомендательные системы