Jaws2008 Presen121. ABMによるECサイトのレコメンド
設計の分析
○梅田 卓志, 小山友介, 出口弘
東京工業大学大学院 総合理工学研究科
umeda07[At]cs.dis.titech.ac.jp
※配布資料とは一部内容が異なります。
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
2. 発表の流れ
1. 目的と方法論
2. モデル
3. シミュレーション設定と結果
4. 結論と今後の課題
5. 参考文献,QA等
2
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
3. 1. 目的と方法論
3
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
4. 1-1. 背景
日米のEC市場規模(兆円)
180 E-Commerce市場規模が増加
162 • 前年比21.7%増
160 148
140
140
120 104
100 92 95
レコメンド機能を導入するサイトが
80
60 増加傾向 増加
• 特に協調フィルタリング手法
40
20
0
2005 2006 2007 カスタマイズの必要性
• 個別の市場構造に応じたパラメータ設定が必
日本 米国
須
消費者行動, 商品の特徴 etc…
4
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
5. 1-2. 目的
– なぜ協調フィルタリング
か?:
• 最もポピュラー なぜ協調フィルタリング?
協調フィルタリング手法に
• 特にユーザベース手法 •最もポピュラー
に焦点
ついて、ABS(Agent Based
– なぜABSか?: • Amazonなど
• 市場構造を考慮可能
Simulation)手法を用い
– 分析内容:
• ネイバー数と市場構造
て、市場構造を考慮した
の関係
• ネイバー数:パラメータ
評価&パラメータ調整を実
の1つ なぜABSか?
• 異質性、相互作用
施 • 市場構造までモデル化可能
現場のwebシステム担当者が、レコメンド機能を導入す
る際のパラメータ設定の指針になることを目指す
5
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
6. 1-3. 方法論
方法論 メリット
協調 市場構造を考慮可能
フィルタリング • 消費者行動・属性に応じた最
既存のモデル 適パラメータ
ABS で • 商品特性(人気度合など)に
モデル化 応じた分析
市場構造
(商品・消費者)
今回作成したシナリオ 環境変化を考慮可能
• レコメンドによって消費者の
嗜好が変化した場合
• 新商品の随時追加
• ColdStart問題
市場構造別に、協調フィル
容易性
タリング手法の精度評価& • 事前にデータが無くても良い
最適パラメータ探索 • 様々な仮定をおいたWhat-If
分析も可能
6
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
7. 1-5. 他の方法論との比較
容易性 市場構造 環境変化
クロス
バリデーション ○ × ×
被験者実験 × ○ △
提案する方法論 ○
7
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
9. 2-1. モデルの全体像
商品は、1カテゴリに分類される
消費者 購入
消費者
モデル 推薦
•カテゴリに対す EC Site
る選好を保持 購入 • 商品1(カテゴリ1)
•ハフモデル
消費者 • 商品2(カテゴリ2)
推薦 • 商品3(カテゴリ3)
購入
消費者 推薦
レコメンド
モデル
協調フィルタリング手法
(k-nearest neighbor )
9
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
10. 2-2. 消費者モデル
購入決定基準
購入決定確率 w1
商品p が選好とマッチしているか
[ある確率で] 未購入商 w2 商品p が直前にレコメンドされたか
商品を購入 品pの重み
w3
商品p の人気度合
未購入商品の「重み」から、購入商品を決定
[毎期] 未購入商品の中から、1商品について、
レコメンドされる レコメンドを受ける
10
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
11. 2-3. レコメンドモデル
商品1 商品2 ・・・ 商品p
コサイン
1. 消費者1 1 0 ・・・ V1,p 距離w1,2
類似度の高 消費者2 0 1 ・・・ V2,p を計算
い消費者を
確定 ネイバー数
自分と似た消費者のうち、上位何人
消費者1と類似度が高い消費者= NE1 = { 消費者2, 消費者3,..}
分を計算に用いるか
消費者2と類似度が高い消費者= NE2 = { 消費者1, 消費者5,…}
2. 消費者uの商品pに対する
各消費者に 「重み」を計算する 消費者u,iのコサイン距離(類似度)
ついて、各未
購入商品の 消費者iが商品pを購入している場
重みを算出 合は1, 未購入の場合は0
3. 「重み」が最大である商品をレコメンド
レコメンド商
品の決定 自分と似た人が購入している商品を、レコメンドする
11
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
12. 2-4. 評価指標
分母の中で、消費者uの選好
時刻tにおける消費者uの精度 =
とマッチしている商品
|レコメンドされた商品 |
この値を、全消費者について平均した値を、
時刻tにおける精度 とする
12
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
14. 3-1. シミュレーションの共通設定
パラメータ名 パラメータ値
共通 消費者数 100人
時間 50期
カテゴリ数 10
23×14
商品数 2000個
通りの
シナリオ毎 購入決定基準 {選好重視,トレンド追随混入} シナリオ
に設定 選好分布 {クラスタ型, ランダム型}
購入頻度 {均質型, 異質型}
ネイバー数 {5,10,15,20,25,30,…., 70}
実験方法
• 1シナリオ10回試行し、平均値を用いる
• 3つのパラメータに対して比較を行い、ネイバー数については、どの比較
に対しても、全てのパラメータ値を比較
14
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
15. 3-1. 選好分布の影響(1/2)
問題意識
• 選好のクラス化度合が、レコメンドにいかなる影響を与えるか?
実験設定
パラメータ設定 クラスタ型
パラメータ名 パラメータ値 1 2 3
購入決定基準 選好重視型 1 2 3
1 2 3
選好分布 ・クラスタ型
・ランダム型
購入頻度 均質型 ランダム型
ネイバー数 {5,10,15,…., 70} 1,2 1,3 2,3
1,4 2,1 3,1
15
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
16. 3-2. 選好分布の影響(2/2)
ランダム型での精度
選好分布:クラスタ型の精度 選好分布:ランダム型の精度
ネイバー数
0.7 0.7 5
ネイバー数が 10
15
実 尐ない場合 ネイバー数が 20
0.5 0.5
験 尐ない場合 25
精度
30
結 35
果 0.3 0.3
40
45
50
0.1 0.1
60
0 10 20 30 40 50 0 10 20 30 40 50 70
時刻 時刻
• 選好のクラスタ化の有無によらず、ネイバー数が尐ない場合に高い精度
考 Because:ネイバー数が増加することで、ノイズ(自分と異なる選好を持つ消費者
察 のデータ)を含んでしまう。真に選好が一致している消費者は、たかだか10人
• 選好のクラスタ化が緩む→ 精度が下がる
16
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
17. 3-3. 購入決定基準の影響(1/2)
問題意識
• トレンド追随型消費者がレコメンドに与える影響は?
– トレンド追随型消費者の影響で、自分の選好に従う消費者へのレコメンド精度が落ちる?
• 具体例:音楽市場
– 自分の趣味に忠実・ニッチ志向の消費者
– とりあえずオリコン上位に出てきそうな楽曲をチェックする消費者
実験設定
パラメータ設定
トレンド •(w1, w2, w3) = ( 0.5, 0.1 , 0.4)
パラメータ名 パラメータ値
追随型 •流行に敏感な人
購入決定基準 トレンド追随混入 30 %
選好分布 ・クラスタ型
・ランダム型
一般型 •(w1, w2, w3) = ( 0.9, 0.1 , 0.0)
購入頻度 均質型
70 % •流行を気にしない人
ネイバー数 {5,10,15,…., 70}
17
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
18. 3-3. 購入決定基準の影響(2/2)
購入決定基準:選好重視型 購入決定基準:トレンド追随型混入
一般型消費者の精度 0.5 0.5
ネイバー数
0.4 0.4 5
実
10
験
20
結 0.3 0.3
果 30
40
0.2 0.2
0 10 20 30 40 50 0 10 20 30 40 50
時刻 時刻
• 精度が下がる
考 – 後半では、最適なネイバー数の場合における精度が大幅に減尐
察 – Because:トレンド追随型の消費者が、一般の消費者が類似度の
ミーハーが多いと、趣味のあうひとを見つけるのが困難になる
高い消費者を見つけるにあたって、障害になる
18
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
19. 3-5. 購入頻度の影響(1/3)
問題意識
• 購入頻度の異質性がレコメンドにあたえる影響は?
– 消費者の購入頻度によって、最適なパラメータは異なってくる?
• 「尐しの優良顧客」と「大量の非優良顧客」が混在する環境
– 優良顧客の選好の影響をつよく受け、非優良顧客に対するレコメンド精度が下がる?
実験設定
パラメータ設定
パラメータ名 パラメータ値 優良 •購入頻度 = 0.8
購入決定基準 選好重視型 20 % • よくものを買う人
選好分布 ・クラスタ型
・ランダム型
購入頻度 異質型
非優良 •購入頻度 = 0.2
•ふつうの人
ネイバー数 {5,10,15,…., 70} 80 %
19
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
20. 3-5. 購入頻度の影響(2/3)
購入頻度:均質型 購入頻度:異質型
0.5 0.5
ネイバー数
優良顧客の精度
0.4 0.4
顧客の精度
実 5
験 0.3 0.3
10
結 15
果 0.2 0.2 20
25
0.1 0.1
0 10 20 30 40 50 0 10 20 30 40 50
時刻 時刻
• 優良顧客が対象:初期はネイバー数が大きい方が良い
考
Because:大半の消費者が「非優良顧客」であり、今までのシナ
リオと比較しても、初期時の投票行列が極めてスパース→より
察 多くのユーザの購買履歴を参照する必要性が生じた
• 優良顧客が対象:精度が低め
20
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
21. 3-5. 購入頻度の影響(3/3)
購入頻度:均質型 市場構造=ランダム型
購入頻度:異質型
0.5 0.5
0.55
非優良顧客の精度
0.4 0.45
0.4
ネイバー数
顧客の精度
5
5
実
0.35 10
験 0.3 0.3
10
結 15
15
0.25
果 0.2 0.2 20
20
0.15 25
25
0.1 0.05
0.1
0 10 20 30 40 50 00 10
10 20
20 30
30 40
40 50
時刻 時刻
• 常にネイバー数が尐ない方が良い
考
Because:非優良顧客の場合、投票行列がスパースな環境下で
多くのユーザのデータを考慮することが、ノイズになりやすい
察
優良顧客と非優良顧客で、精度&最適なネイバー数が異なる
• 精度は、優良顧客対象の場合よりも高い
21
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
22. 4. 結論と今後の課題
22
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
23. 4-1. 結論
•市場構造により、 精度が下がる場合がある
•市場構造に応じた協調フィルタリングのパラメータ調
整を実施し、特異なケースをあきらかにした
基本的にネイバー数は小さな値の方が良いが、市場構造
によっては異なる場合がある
市場構造 時期 対象 精度 ネイバー数
通常時 尐
優良顧客,非 システム導 優良顧客 低 多
優良顧客が 入時 非優良顧客 尐
存在
一定期間以 優良顧客 低 尐
降 非優良顧客 尐
トレンド追随 システム導 低 尐
型消費者が 入時
存在 一定期間以 尐
降
23
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
24. 4-2. 今後の課題
• ミクロデータに対する分析
– 今回の「特異なケース」について原因を、ミクロレ
ベルで考える必要性
• 実際のデータを用いたアプローチ
– 市場構造について、実データを用いて、よりリアリ
ティある市場構造を再現
• 他手法の評価
– アイテムベース手法等、別の方法での分析
24
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
25. 参考文献
1. 経済産業省,「平成19年度我が国のIT利活用に関する調査研究」(電子商取引に関する市場
調査),2008年
2. Resnick,M.,Iacovou,N.,Suchak,M.,Bergstorm,P. and Riedl,J.1994 GroupLens: an open
architechture for collaborative filtering of netnews. In Proc.9th ACM Conf.on Computer-Supported
Cooperative Work,pp.175-186,NewYork;ACM Press
3. Breese,J.S.,Heckerman,D.and Kadie,C. 1998 Empirical analysis of predictive algorithms for
collaborative filtering. In Proc. 14th Conf. on Uncertainty in Artificial Intelligence, pp 43-52, San
Francisco, CA:Morgan Kaufman
4. K. Goldberg et al.,”Eigentaste: A Consant Time Collaborative Filtering Algorithm,”Information
Retrieval J.,vol. 4, no.2,July 2001,pp 133-151.
5. Linden,G., Smith,B.,and York,J : Amazon.com recommendations: Item-to-Item collaborative
filtering, IEEE Internet Computing,Vol.4,No.1 (2003)
6. Sarwar,B.,Karypis ,G.,Konstan.J. and Riedl,J.:Item-based collaborative filtering recommendation
algorithms, Proc.of the 10th International World Wide Web Conference(2001)
7. Zhang,T. and Iyengar, V.S.2002 Recommender Systems using linear classifiers. J.Machine Learn.
Res.2, pp.313-334
8. 清水拓也, 土方嘉徳, 西田正吾,”発見性を考慮した協調フィルタリングアルゴリズムに関する複
数方式の検討”,DEWS2007
9. Herlocker,J.,Konstan,J., Terveen,L., and Riedl,J.: Evaluating collaborative filtering recommender
systems, ACM Transacions on Information Systems, Vol.22, No.1, pp.5-53(2004)
25
JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/