16. Наилучшее приближение ранга k
Теорема:
Если в матрице λ оставить k наибольших сингулярных векторов,
то получим наилучшее приближение матрицы A ранга k
17. Baseline predictors
Модель:
rˆuui =μ + bu + bi
argmin
b*
Σ ( 2
r−μ − b− b)
uui u i (u,i )∈R
Σ 2 +
Σ
bi
+λ bu
u∈U
2
i∈I
$
% &
'
( )
Функция ошибки:
18. SVD
Модель:
Tqi
rˆuui =μ + bu + bi + pu
argmin
p*q*b*
Σ 2
( r−μ − b− b− pTq)
uui u i u
i (u,i )∈R
2 ( )
+λ pu
2
+ qi
2
+ bu
2 + bi
Функция ошибки:
23. Снова SVD
Модель:
Tqi
rˆuui =μ + bu + bi + pu
argmin
p*q*b*
Σ 2
( r−μ − b− b− pTq)
uui u i u
i (u,i )∈R
2 ( )
+λ pu
2
+ qi
2
+ bu
2 + bi
Функция ошибки:
28. SGD-оптимизация модели SVD
Модель:
Tqi
rˆuui =μ + bu + bi + pu
argmin
p*q*b*
Σ 2
( r−μ − b− b− pTq)
uui u i u
i (u,i )∈R
2 ( )
+λ pu
2
+ qi
2
+ bu
2 + bi
Функция ошибки:
Правила для градиентного спуска:
bu ←bu +γ1 eui −λ1bu ( )
bi ←bi +γ1 eui −λ1bi ( )
pu ← pu +γ 2 euiqi −λ2 pu ( )
qu ←qi +γ 2 eui pu −λ2qi ( )
29. Ridge regression
Модель:
yi ←wT xi
wTw→0
argmin
w
nΣ
λwTw+ wT xi − yi ( )2
i=1
#
$ %
&
' (
Функция ошибки:
Точное решение:
w = (λ I + XTX)−1
XT y = (λ I + A)−1 d
A = XTX
d = XT y
30. ALS-оптимизация модели SVD
Модель:
Tqi
rˆuui =μ + bu + bi + pu
argmin
p*q*b*
Σ 2
( r−μ − b− b− pTq)
uui u i u
i (u,i )∈R
2 ( )
+λ pu
2
+ qi
2
+ bu
2 + bi
Функция ошибки:
P-step:
pu = λnuI + Au ( )−1 du
Au =Q[u]TQ[u] = qiqi
T
Σ
i:(u,i)∈R
Σ
d =Q[u]T ru = ruiqi
i:(u,i)∈R
Q-step:
qi = λniI + Ai ( )−1 di
Ai = P[i]T P[i] = pupu
T
Σ
u:(u,i)∈R
Σ
di = P[i]T ri = rui pu
u:(u,i)∈R
31. Сравнение моделей по RMSE
Модель 50 факторов 100 факторов 200 факторов Лучшее
Item-based
— —
—
0.9406
kNN
Neighborhood — — — 0.9002
SVD 0.9046 0.9025 0.9009 0.9009
Asymmetric
0.9037 0.9013 0.9000 0.9000
SVD
SVD++ 0.8952 0.8924 0.8911 0.8911
Integrated
model
0.8877 0.8870 0.8868 0.8868
на данных Netflix Prize
37. Similarity by tags (co-occurrence)
Данные:
облака тэгов и
Меры сходства:
• Жаккарда
• Дайса
• Охаи
Ti Tj
Ti Tj
Ti Tj
2 ⋅ Ti Tj
Ti + Tj
Ti Tj
Ti Tj
38. Similarity by tags (LSA)
• Разложим матрицу Items x Tags по SVD
• Меры сходства: косинусное расстояние и
др.
Item
features
≈ x x
Tags
Tag
features
Items
λ