SlideShare a Scribd company logo
1 of 26
Download to read offline
ABMによるECサイトのレコメンド
        設計の分析
              ○梅田 卓志, 小山友介, 出口弘
            東京工業大学大学院 総合理工学研究科
              umeda07[At]cs.dis.titech.ac.jp
            ※配布資料とは一部内容が異なります。


JAWS 2008                     http://degulab.cs.dis.titech.ac.jp/~umeda07/
発表の流れ

   1.   目的と方法論
   2.   モデル
   3.   シミュレーション設定と結果
   4.   結論と今後の課題
   5.   参考文献,QA等




                 2
JAWS 2008            http://degulab.cs.dis.titech.ac.jp/~umeda07/
1. 目的と方法論




                                                    3
JAWS 2008     http://degulab.cs.dis.titech.ac.jp/~umeda07/
1-1. 背景
               日米のEC市場規模(兆円)
  180                                       E-Commerce市場規模が増加
                                162         • 前年比21.7%増
  160                148
         140
  140
  120                                 104
  100          92          95
                                            レコメンド機能を導入するサイトが
   80
   60               増加傾向                    増加
                                            • 特に協調フィルタリング手法
   40
   20
    0
            2005         2006    2007       カスタマイズの必要性
                                            • 個別の市場構造に応じたパラメータ設定が必
                    日本     米国
                                              須
        消費者行動, 商品の特徴 etc…


                                        4
JAWS 2008                                   http://degulab.cs.dis.titech.ac.jp/~umeda07/
1-2. 目的
     –   なぜ協調フィルタリング
         か?:
            •   最もポピュラー                  なぜ協調フィルタリング?
  協調フィルタリング手法に
            •   特にユーザベース手法            •最もポピュラー
                に焦点
  ついて、ABS(Agent Based
    – なぜABSか?:                        • Amazonなど
       • 市場構造を考慮可能
   Simulation)手法を用い
    – 分析内容:
       • ネイバー数と市場構造
  て、市場構造を考慮した
         の関係
       • ネイバー数:パラメータ
  評価&パラメータ調整を実
         の1つ                               なぜABSか?
                                      • 異質性、相互作用
             施                        • 市場構造までモデル化可能




   現場のwebシステム担当者が、レコメンド機能を導入す
    る際のパラメータ設定の指針になることを目指す

                                5
JAWS 2008                           http://degulab.cs.dis.titech.ac.jp/~umeda07/
1-3. 方法論
              方法論                              メリット


      協調                               市場構造を考慮可能
    フィルタリング                        •   消費者行動・属性に応じた最
     既存のモデル                            適パラメータ
                    ABS で          •   商品特性(人気度合など)に
                    モデル化               応じた分析
     市場構造
   (商品・消費者)
   今回作成したシナリオ                          環境変化を考慮可能
                                   •   レコメンドによって消費者の
                                       嗜好が変化した場合
                                   •   新商品の随時追加
                                   •   ColdStart問題

       市場構造別に、協調フィル
                                              容易性
       タリング手法の精度評価&                •   事前にデータが無くても良い
       最適パラメータ探索                   •   様々な仮定をおいたWhat-If
                                       分析も可能


                        6
JAWS 2008                   http://degulab.cs.dis.titech.ac.jp/~umeda07/
1-5. 他の方法論との比較

               容易性       市場構造              環境変化


   クロス
 バリデーション        ○            ×                    ×



   被験者実験        ×            ○                    △



 提案する方法論                     ○




                     7
JAWS 2008                 http://degulab.cs.dis.titech.ac.jp/~umeda07/
※ 詳細は、配布資料をご覧ください。

  2. モデル




                                                             8
JAWS 2008              http://degulab.cs.dis.titech.ac.jp/~umeda07/
2-1. モデルの全体像

                                     商品は、1カテゴリに分類される
              消費者   購入
 消費者
 モデル                推薦
•カテゴリに対す                              EC Site
 る選好を保持             購入            • 商品1(カテゴリ1)
  •ハフモデル
             消費者                  • 商品2(カテゴリ2)
                    推薦            • 商品3(カテゴリ3)

                    購入

              消費者   推薦
                                                 レコメンド
                                                  モデル
                                            協調フィルタリング手法
                                             (k-nearest neighbor )

                         9
 JAWS 2008                   http://degulab.cs.dis.titech.ac.jp/~umeda07/
2-2. 消費者モデル
                                                購入決定基準
            購入決定確率           w1
                                    商品p が選好とマッチしているか

 [ある確率で]        未購入商         w2 商品p が直前にレコメンドされたか
  商品を購入         品pの重み
                             w3
                                           商品p の人気度合

               未購入商品の「重み」から、購入商品を決定




  [毎期]               未購入商品の中から、1商品について、
レコメンドされる                 レコメンドを受ける



                        10
JAWS 2008                         http://degulab.cs.dis.titech.ac.jp/~umeda07/
2-3. レコメンドモデル
                    商品1   商品2          ・・・         商品p
                                                                   コサイン
  1.        消費者1    1     0            ・・・         V1,p            距離w1,2
類似度の高       消費者2    0     1            ・・・         V2,p            を計算
い消費者を
 確定                                         ネイバー数
            自分と似た消費者のうち、上位何人
            消費者1と類似度が高い消費者= NE1 = { 消費者2, 消費者3,..}
                分を計算に用いるか
            消費者2と類似度が高い消費者= NE2 = { 消費者1, 消費者5,…}

   2.       消費者uの商品pに対する
各消費者に       「重み」を計算する                    消費者u,iのコサイン距離(類似度)
ついて、各未
購入商品の                                    消費者iが商品pを購入している場
重みを算出                                      合は1, 未購入の場合は0


   3.        「重み」が最大である商品をレコメンド
レコメンド商
 品の決定              自分と似た人が購入している商品を、レコメンドする

                              11
JAWS 2008                          http://degulab.cs.dis.titech.ac.jp/~umeda07/
2-4. 評価指標

                    分母の中で、消費者uの選好
 時刻tにおける消費者uの精度 =
                      とマッチしている商品
                     |レコメンドされた商品 |




            この値を、全消費者について平均した値を、
                時刻tにおける精度 とする




                    12
JAWS 2008                http://degulab.cs.dis.titech.ac.jp/~umeda07/
ここからは、pptをご覧ください。配布資料とは内容が異なります。

  3. シミュレーション結果
    • 選好分布での比較
    • 購入決定基準での比較
    • 購入頻度での比較




                                                          13
JAWS 2008            http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-1. シミュレーションの共通設定
            パラメータ名    パラメータ値
共通          消費者数      100人
            時間        50期
            カテゴリ数     10
                                                          23×14
            商品数       2000個
                                                          通りの
シナリオ毎 購入決定基準          {選好重視,トレンド追随混入}                     シナリオ
に設定   選好分布            {クラスタ型, ランダム型}
            購入頻度      {均質型, 異質型}
            ネイバー数     {5,10,15,20,25,30,…., 70}

       実験方法

 • 1シナリオ10回試行し、平均値を用いる
 • 3つのパラメータに対して比較を行い、ネイバー数については、どの比較
 に対しても、全てのパラメータ値を比較
                     14
JAWS 2008                  http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-1. 選好分布の影響(1/2)
                                  問題意識


•   選好のクラス化度合が、レコメンドにいかなる影響を与えるか?



                                  実験設定

            パラメータ設定                          クラスタ型
    パラメータ名     パラメータ値                    1           2                3
    購入決定基準 選好重視型                             1             2               3
                                                 1             2               3
    選好分布       ・クラスタ型
               ・ランダム型
    購入頻度       均質型                           ランダム型
    ネイバー数      {5,10,15,…., 70}         1,2 1,3                2,3
                                          1,4        2,1             3,1

                                   15
JAWS 2008                                http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-2. 選好分布の影響(2/2)
                                                  ランダム型での精度
               選好分布:クラスタ型の精度                   選好分布:ランダム型の精度
                                                            ネイバー数
         0.7                                 0.7                                   5
               ネイバー数が                                                              10
                                                                                   15
実              尐ない場合                               ネイバー数が                          20
         0.5                                 0.5
験                                                  尐ない場合                           25
    精度




                                                                                   30
結                                                                                  35
果        0.3                                 0.3
                                                                                   40
                                                                                   45
                                                                                   50
         0.1                                 0.1
                                                                                   60
               0   10   20   30   40   50          0   10   20    30   40   50     70
                        時刻                                       時刻


    • 選好のクラスタ化の有無によらず、ネイバー数が尐ない場合に高い精度
考          Because:ネイバー数が増加することで、ノイズ(自分と異なる選好を持つ消費者
察          のデータ)を含んでしまう。真に選好が一致している消費者は、たかだか10人
    • 選好のクラスタ化が緩む→ 精度が下がる

                                        16
JAWS 2008                                    http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-3. 購入決定基準の影響(1/2)
                                 問題意識

•    トレンド追随型消費者がレコメンドに与える影響は?
     – トレンド追随型消費者の影響で、自分の選好に従う消費者へのレコメンド精度が落ちる?
•    具体例:音楽市場
     – 自分の趣味に忠実・ニッチ志向の消費者
     – とりあえずオリコン上位に出てきそうな楽曲をチェックする消費者


                                 実験設定

           パラメータ設定
                                  トレンド      •(w1, w2, w3) = ( 0.5, 0.1 , 0.4)
    パラメータ名    パラメータ値
                                  追随型       •流行に敏感な人
    購入決定基準    トレンド追随混入            30 %
    選好分布      ・クラスタ型
              ・ランダム型
                                 一般型        •(w1, w2, w3) = ( 0.9, 0.1 , 0.0)
    購入頻度      均質型
                                 70 %       •流行を気にしない人
    ネイバー数     {5,10,15,…., 70}

                                  17
JAWS 2008                              http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-3. 購入決定基準の影響(2/2)
                          購入決定基準:選好重視型                   購入決定基準:トレンド追随型混入
    一般型消費者の精度   0.5                                0.5
                                                                                 ネイバー数
                0.4                                0.4                                   5
実
                                                                                         10
験
                                                                                         20
結               0.3                                0.3
果                                                                                        30
                                                                                         40
                0.2                                0.2
                      0   10   20   30   40   50         0   10   20   30   40    50
                                時刻                                     時刻




    • 精度が下がる
考               – 後半では、最適なネイバー数の場合における精度が大幅に減尐
察               – Because:トレンド追随型の消費者が、一般の消費者が類似度の
                 ミーハーが多いと、趣味のあうひとを見つけるのが困難になる
                  高い消費者を見つけるにあたって、障害になる

                                              18
JAWS 2008                                            http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-5. 購入頻度の影響(1/3)
                                 問題意識

•    購入頻度の異質性がレコメンドにあたえる影響は?
     – 消費者の購入頻度によって、最適なパラメータは異なってくる?
•    「尐しの優良顧客」と「大量の非優良顧客」が混在する環境
     – 優良顧客の選好の影響をつよく受け、非優良顧客に対するレコメンド精度が下がる?



                                 実験設定

           パラメータ設定
    パラメータ名    パラメータ値              優良          •購入頻度 = 0.8
    購入決定基準    選好重視型               20 %        • よくものを買う人
    選好分布      ・クラスタ型
              ・ランダム型
    購入頻度      異質型
                                 非優良          •購入頻度 = 0.2
                                              •ふつうの人
    ネイバー数     {5,10,15,…., 70}   80 %
                                  19
JAWS 2008                                http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-5. 購入頻度の影響(2/3)
                  購入頻度:均質型                                           購入頻度:異質型
            0.5                                          0.5
                                                                                         ネイバー数




                                               優良顧客の精度
            0.4                                          0.4
    顧客の精度




実                                                                                               5
験           0.3                                          0.3
                                                                                                10
結                                                                                               15
果           0.2                                          0.2                                    20
                                                                                                25
            0.1                                          0.1
                  0   10   20   30   40   50                   0    10   20   30    40   50
                           時刻                                            時刻


    • 優良顧客が対象:初期はネイバー数が大きい方が良い
考
              Because:大半の消費者が「非優良顧客」であり、今までのシナ
               リオと比較しても、初期時の投票行列が極めてスパース→より
察              多くのユーザの購買履歴を参照する必要性が生じた
    • 優良顧客が対象:精度が低め
                                               20
JAWS 2008                                                      http://degulab.cs.dis.titech.ac.jp/~umeda07/
3-5. 購入頻度の影響(3/3)
                  購入頻度:均質型                                            市場構造=ランダム型
                                                                       購入頻度:異質型
            0.5                                           0.5
                                                          0.55




                                               非優良顧客の精度
            0.4                                           0.45
                                                          0.4
                                                                                            ネイバー数
    顧客の精度



                                                                                                 5
                                                                                                 5
実
                                                          0.35                                   10
験           0.3                                           0.3
                                                                                                 10
結                                                                                                15
                                                                                                 15
                                                          0.25
果           0.2                                           0.2                                    20
                                                                                                 20
                                                          0.15                                   25
                                                                                                 25
            0.1                                           0.05
                                                          0.1
                  0   10   20   30   40   50                     00    10
                                                                      10     20
                                                                            20    30
                                                                                  30   40
                                                                                       40   50

                           時刻                                               時刻


    • 常にネイバー数が尐ない方が良い
考
              Because:非優良顧客の場合、投票行列がスパースな環境下で
               多くのユーザのデータを考慮することが、ノイズになりやすい
察
              優良顧客と非優良顧客で、精度&最適なネイバー数が異なる
    • 精度は、優良顧客対象の場合よりも高い
                                               21
JAWS 2008                                                   http://degulab.cs.dis.titech.ac.jp/~umeda07/
4. 結論と今後の課題




                                                 22
JAWS 2008   http://degulab.cs.dis.titech.ac.jp/~umeda07/
4-1. 結論
    •市場構造により、 精度が下がる場合がある
    •市場構造に応じた協調フィルタリングのパラメータ調
    整を実施し、特異なケースをあきらかにした
       基本的にネイバー数は小さな値の方が良いが、市場構造
       によっては異なる場合がある

    市場構造     時期       対象            精度              ネイバー数
    通常時                                             尐
    優良顧客,非   システム導    優良顧客          低               多
    優良顧客が    入時       非優良顧客                         尐
    存在
             一定期間以    優良顧客          低               尐
             降        非優良顧客                         尐
    トレンド追随   システム導                  低               尐
    型消費者が    入時
    存在       一定期間以                                  尐
             降

                           23
JAWS 2008                       http://degulab.cs.dis.titech.ac.jp/~umeda07/
4-2. 今後の課題
• ミクロデータに対する分析
   – 今回の「特異なケース」について原因を、ミクロレ
     ベルで考える必要性
• 実際のデータを用いたアプローチ
   – 市場構造について、実データを用いて、よりリアリ
     ティある市場構造を再現
• 他手法の評価
   – アイテムベース手法等、別の方法での分析



                24
JAWS 2008            http://degulab.cs.dis.titech.ac.jp/~umeda07/
参考文献
1.   経済産業省,「平成19年度我が国のIT利活用に関する調査研究」(電子商取引に関する市場
     調査),2008年
2.   Resnick,M.,Iacovou,N.,Suchak,M.,Bergstorm,P. and Riedl,J.1994 GroupLens: an open
     architechture for collaborative filtering of netnews. In Proc.9th ACM Conf.on Computer-Supported
     Cooperative Work,pp.175-186,NewYork;ACM Press
3.   Breese,J.S.,Heckerman,D.and Kadie,C. 1998 Empirical analysis of predictive algorithms for
     collaborative filtering. In Proc. 14th Conf. on Uncertainty in Artificial Intelligence, pp 43-52, San
     Francisco, CA:Morgan Kaufman
4.   K. Goldberg et al.,”Eigentaste: A Consant Time Collaborative Filtering Algorithm,”Information
     Retrieval J.,vol. 4, no.2,July 2001,pp 133-151.
5.   Linden,G., Smith,B.,and York,J : Amazon.com recommendations: Item-to-Item collaborative
     filtering, IEEE Internet Computing,Vol.4,No.1 (2003)
6.   Sarwar,B.,Karypis ,G.,Konstan.J. and Riedl,J.:Item-based collaborative filtering recommendation
     algorithms, Proc.of the 10th International World Wide Web Conference(2001)
7.   Zhang,T. and Iyengar, V.S.2002 Recommender Systems using linear classifiers. J.Machine Learn.
     Res.2, pp.313-334
8.    清水拓也, 土方嘉徳, 西田正吾,”発見性を考慮した協調フィルタリングアルゴリズムに関する複
     数方式の検討”,DEWS2007
9.    Herlocker,J.,Konstan,J., Terveen,L., and Riedl,J.: Evaluating collaborative filtering recommender
     systems, ACM Transacions on Information Systems, Vol.22, No.1, pp.5-53(2004)




                                                  25
JAWS 2008                                                http://degulab.cs.dis.titech.ac.jp/~umeda07/
ご静聴、ありがとうございました。




                                                 26
JAWS 2008   http://degulab.cs.dis.titech.ac.jp/~umeda07/

More Related Content

What's hot

【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介devsumi2009
 
2009年4月8日セミナー 1.オープニング
2009年4月8日セミナー 1.オープニング2009年4月8日セミナー 1.オープニング
2009年4月8日セミナー 1.オープニングPreferred Networks
 
2009年4月8日セミナー 3.SSD向け全文検索エンジン
2009年4月8日セミナー 3.SSD向け全文検索エンジン2009年4月8日セミナー 3.SSD向け全文検索エンジン
2009年4月8日セミナー 3.SSD向け全文検索エンジンPreferred Networks
 
【12-A-1】 開発プロセスの心
【12-A-1】 開発プロセスの心【12-A-1】 開発プロセスの心
【12-A-1】 開発プロセスの心devsumi2009
 
夜までラボ☆テレビ7月24日開催分
夜までラボ☆テレビ7月24日開催分夜までラボ☆テレビ7月24日開催分
夜までラボ☆テレビ7月24日開催分ikiikilab
 
データ工学研究専門委員会ニュースレター 創刊
データ工学研究専門委員会ニュースレター 創刊データ工学研究専門委員会ニュースレター 創刊
データ工学研究専門委員会ニュースレター 創刊Hiroshi Ono
 
【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~
【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~
【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~devsumi2009
 
Copyright and Creative Commons
Copyright and Creative CommonsCopyright and Creative Commons
Copyright and Creative CommonsJun Nogata
 
Loftwork 20090416
Loftwork 20090416Loftwork 20090416
Loftwork 20090416武 河野
 
Requirement Development meets SOA
Requirement Development meets SOARequirement Development meets SOA
Requirement Development meets SOAiwasaki
 
enNetforum Wakamatsu Presentation
enNetforum Wakamatsu PresentationenNetforum Wakamatsu Presentation
enNetforum Wakamatsu PresentationForum
 
enNetforum Fukuoka Panelist
enNetforum Fukuoka PanelistenNetforum Fukuoka Panelist
enNetforum Fukuoka PanelistForum
 
teaching how to read Japanese with "Min-nano nihongo"
teaching how to read Japanese with "Min-nano nihongo"teaching how to read Japanese with "Min-nano nihongo"
teaching how to read Japanese with "Min-nano nihongo"Yoshifumi Murakami
 
Ds 018 機械產業專業人才認證考試
Ds 018 機械產業專業人才認證考試Ds 018 機械產業專業人才認證考試
Ds 018 機械產業專業人才認證考試handbook
 
Kotatsu-Model in Openthology
Kotatsu-Model in OpenthologyKotatsu-Model in Openthology
Kotatsu-Model in OpenthologyKent Ishizawa
 
guangdongtiger is a cheater?
guangdongtiger is a cheater?guangdongtiger is a cheater?
guangdongtiger is a cheater?Tony Liu
 
Ds 007 公差與配合
Ds 007 公差與配合Ds 007 公差與配合
Ds 007 公差與配合handbook
 

What's hot (20)

【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
 
2009年4月8日セミナー 1.オープニング
2009年4月8日セミナー 1.オープニング2009年4月8日セミナー 1.オープニング
2009年4月8日セミナー 1.オープニング
 
2009年4月8日セミナー 3.SSD向け全文検索エンジン
2009年4月8日セミナー 3.SSD向け全文検索エンジン2009年4月8日セミナー 3.SSD向け全文検索エンジン
2009年4月8日セミナー 3.SSD向け全文検索エンジン
 
【12-A-1】 開発プロセスの心
【12-A-1】 開発プロセスの心【12-A-1】 開発プロセスの心
【12-A-1】 開発プロセスの心
 
100420
100420100420
100420
 
夜までラボ☆テレビ7月24日開催分
夜までラボ☆テレビ7月24日開催分夜までラボ☆テレビ7月24日開催分
夜までラボ☆テレビ7月24日開催分
 
データ工学研究専門委員会ニュースレター 創刊
データ工学研究専門委員会ニュースレター 創刊データ工学研究専門委員会ニュースレター 創刊
データ工学研究専門委員会ニュースレター 創刊
 
【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~
【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~
【12-E-6】 ERP導入の投資対効果 ~SAPの導入事例を元に~
 
Copyright and Creative Commons
Copyright and Creative CommonsCopyright and Creative Commons
Copyright and Creative Commons
 
Loftwork 20090416
Loftwork 20090416Loftwork 20090416
Loftwork 20090416
 
Requirement Development meets SOA
Requirement Development meets SOARequirement Development meets SOA
Requirement Development meets SOA
 
enNetforum Wakamatsu Presentation
enNetforum Wakamatsu PresentationenNetforum Wakamatsu Presentation
enNetforum Wakamatsu Presentation
 
SIG-SWO-A801-04
SIG-SWO-A801-04SIG-SWO-A801-04
SIG-SWO-A801-04
 
enNetforum Fukuoka Panelist
enNetforum Fukuoka PanelistenNetforum Fukuoka Panelist
enNetforum Fukuoka Panelist
 
teaching how to read Japanese with "Min-nano nihongo"
teaching how to read Japanese with "Min-nano nihongo"teaching how to read Japanese with "Min-nano nihongo"
teaching how to read Japanese with "Min-nano nihongo"
 
Ds 018 機械產業專業人才認證考試
Ds 018 機械產業專業人才認證考試Ds 018 機械產業專業人才認證考試
Ds 018 機械產業專業人才認證考試
 
JLPT 2nd level Reading
JLPT 2nd level ReadingJLPT 2nd level Reading
JLPT 2nd level Reading
 
Kotatsu-Model in Openthology
Kotatsu-Model in OpenthologyKotatsu-Model in Openthology
Kotatsu-Model in Openthology
 
guangdongtiger is a cheater?
guangdongtiger is a cheater?guangdongtiger is a cheater?
guangdongtiger is a cheater?
 
Ds 007 公差與配合
Ds 007 公差與配合Ds 007 公差與配合
Ds 007 公差與配合
 

Viewers also liked

Jaws2008 Presen2
Jaws2008 Presen2Jaws2008 Presen2
Jaws2008 Presen2umekoumeda
 
Summerseminar 2007
Summerseminar 2007Summerseminar 2007
Summerseminar 2007umekoumeda
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xpumekoumeda
 
Video Recommender in Viki (VikiでのVideoレコメンド事例)
Video Recommender in Viki (VikiでのVideoレコメンド事例)Video Recommender in Viki (VikiでのVideoレコメンド事例)
Video Recommender in Viki (VikiでのVideoレコメンド事例)umekoumeda
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...Junki Marui
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...Junki Marui
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xpumekoumeda
 
Self Introduction
Self IntroductionSelf Introduction
Self Introductionumekoumeda
 

Viewers also liked (8)

Jaws2008 Presen2
Jaws2008 Presen2Jaws2008 Presen2
Jaws2008 Presen2
 
Summerseminar 2007
Summerseminar 2007Summerseminar 2007
Summerseminar 2007
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp
 
Video Recommender in Viki (VikiでのVideoレコメンド事例)
Video Recommender in Viki (VikiでのVideoレコメンド事例)Video Recommender in Viki (VikiでのVideoレコメンド事例)
Video Recommender in Viki (VikiでのVideoレコメンド事例)
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp
 
Self Introduction
Self IntroductionSelf Introduction
Self Introduction
 

Jaws2008 Presen12

  • 1. ABMによるECサイトのレコメンド 設計の分析 ○梅田 卓志, 小山友介, 出口弘 東京工業大学大学院 総合理工学研究科 umeda07[At]cs.dis.titech.ac.jp ※配布資料とは一部内容が異なります。 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 2. 発表の流れ 1. 目的と方法論 2. モデル 3. シミュレーション設定と結果 4. 結論と今後の課題 5. 参考文献,QA等 2 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 3. 1. 目的と方法論 3 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 4. 1-1. 背景 日米のEC市場規模(兆円) 180 E-Commerce市場規模が増加 162 • 前年比21.7%増 160 148 140 140 120 104 100 92 95 レコメンド機能を導入するサイトが 80 60 増加傾向 増加 • 特に協調フィルタリング手法 40 20 0 2005 2006 2007 カスタマイズの必要性 • 個別の市場構造に応じたパラメータ設定が必 日本 米国 須 消費者行動, 商品の特徴 etc… 4 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 5. 1-2. 目的 – なぜ協調フィルタリング か?: • 最もポピュラー なぜ協調フィルタリング? 協調フィルタリング手法に • 特にユーザベース手法 •最もポピュラー に焦点 ついて、ABS(Agent Based – なぜABSか?: • Amazonなど • 市場構造を考慮可能 Simulation)手法を用い – 分析内容: • ネイバー数と市場構造 て、市場構造を考慮した の関係 • ネイバー数:パラメータ 評価&パラメータ調整を実 の1つ なぜABSか? • 異質性、相互作用 施 • 市場構造までモデル化可能 現場のwebシステム担当者が、レコメンド機能を導入す る際のパラメータ設定の指針になることを目指す 5 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 6. 1-3. 方法論 方法論 メリット 協調 市場構造を考慮可能 フィルタリング • 消費者行動・属性に応じた最 既存のモデル 適パラメータ ABS で • 商品特性(人気度合など)に モデル化 応じた分析 市場構造 (商品・消費者) 今回作成したシナリオ 環境変化を考慮可能 • レコメンドによって消費者の 嗜好が変化した場合 • 新商品の随時追加 • ColdStart問題 市場構造別に、協調フィル 容易性 タリング手法の精度評価& • 事前にデータが無くても良い 最適パラメータ探索 • 様々な仮定をおいたWhat-If 分析も可能 6 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 7. 1-5. 他の方法論との比較 容易性 市場構造 環境変化 クロス バリデーション ○ × × 被験者実験 × ○ △ 提案する方法論 ○ 7 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 8. ※ 詳細は、配布資料をご覧ください。 2. モデル 8 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 9. 2-1. モデルの全体像 商品は、1カテゴリに分類される 消費者 購入 消費者 モデル 推薦 •カテゴリに対す EC Site る選好を保持 購入 • 商品1(カテゴリ1) •ハフモデル 消費者 • 商品2(カテゴリ2) 推薦 • 商品3(カテゴリ3) 購入 消費者 推薦 レコメンド モデル 協調フィルタリング手法 (k-nearest neighbor ) 9 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 10. 2-2. 消費者モデル 購入決定基準 購入決定確率 w1 商品p が選好とマッチしているか [ある確率で] 未購入商 w2 商品p が直前にレコメンドされたか 商品を購入 品pの重み w3 商品p の人気度合 未購入商品の「重み」から、購入商品を決定 [毎期] 未購入商品の中から、1商品について、 レコメンドされる レコメンドを受ける 10 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 11. 2-3. レコメンドモデル 商品1 商品2 ・・・ 商品p コサイン 1. 消費者1 1 0 ・・・ V1,p 距離w1,2 類似度の高 消費者2 0 1 ・・・ V2,p を計算 い消費者を 確定 ネイバー数 自分と似た消費者のうち、上位何人 消費者1と類似度が高い消費者= NE1 = { 消費者2, 消費者3,..} 分を計算に用いるか 消費者2と類似度が高い消費者= NE2 = { 消費者1, 消費者5,…} 2. 消費者uの商品pに対する 各消費者に 「重み」を計算する 消費者u,iのコサイン距離(類似度) ついて、各未 購入商品の 消費者iが商品pを購入している場 重みを算出 合は1, 未購入の場合は0 3. 「重み」が最大である商品をレコメンド レコメンド商 品の決定 自分と似た人が購入している商品を、レコメンドする 11 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 12. 2-4. 評価指標 分母の中で、消費者uの選好 時刻tにおける消費者uの精度 = とマッチしている商品 |レコメンドされた商品 | この値を、全消費者について平均した値を、 時刻tにおける精度 とする 12 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 13. ここからは、pptをご覧ください。配布資料とは内容が異なります。 3. シミュレーション結果 • 選好分布での比較 • 購入決定基準での比較 • 購入頻度での比較 13 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 14. 3-1. シミュレーションの共通設定 パラメータ名 パラメータ値 共通 消費者数 100人 時間 50期 カテゴリ数 10 23×14 商品数 2000個 通りの シナリオ毎 購入決定基準 {選好重視,トレンド追随混入} シナリオ に設定 選好分布 {クラスタ型, ランダム型} 購入頻度 {均質型, 異質型} ネイバー数 {5,10,15,20,25,30,…., 70} 実験方法 • 1シナリオ10回試行し、平均値を用いる • 3つのパラメータに対して比較を行い、ネイバー数については、どの比較 に対しても、全てのパラメータ値を比較 14 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 15. 3-1. 選好分布の影響(1/2) 問題意識 • 選好のクラス化度合が、レコメンドにいかなる影響を与えるか? 実験設定 パラメータ設定 クラスタ型 パラメータ名 パラメータ値 1 2 3 購入決定基準 選好重視型 1 2 3 1 2 3 選好分布 ・クラスタ型 ・ランダム型 購入頻度 均質型 ランダム型 ネイバー数 {5,10,15,…., 70} 1,2 1,3 2,3 1,4 2,1 3,1 15 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 16. 3-2. 選好分布の影響(2/2) ランダム型での精度 選好分布:クラスタ型の精度 選好分布:ランダム型の精度 ネイバー数 0.7 0.7 5 ネイバー数が 10 15 実 尐ない場合 ネイバー数が 20 0.5 0.5 験 尐ない場合 25 精度 30 結 35 果 0.3 0.3 40 45 50 0.1 0.1 60 0 10 20 30 40 50 0 10 20 30 40 50 70 時刻 時刻 • 選好のクラスタ化の有無によらず、ネイバー数が尐ない場合に高い精度 考 Because:ネイバー数が増加することで、ノイズ(自分と異なる選好を持つ消費者 察 のデータ)を含んでしまう。真に選好が一致している消費者は、たかだか10人 • 選好のクラスタ化が緩む→ 精度が下がる 16 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 17. 3-3. 購入決定基準の影響(1/2) 問題意識 • トレンド追随型消費者がレコメンドに与える影響は? – トレンド追随型消費者の影響で、自分の選好に従う消費者へのレコメンド精度が落ちる? • 具体例:音楽市場 – 自分の趣味に忠実・ニッチ志向の消費者 – とりあえずオリコン上位に出てきそうな楽曲をチェックする消費者 実験設定 パラメータ設定 トレンド •(w1, w2, w3) = ( 0.5, 0.1 , 0.4) パラメータ名 パラメータ値 追随型 •流行に敏感な人 購入決定基準 トレンド追随混入 30 % 選好分布 ・クラスタ型 ・ランダム型 一般型 •(w1, w2, w3) = ( 0.9, 0.1 , 0.0) 購入頻度 均質型 70 % •流行を気にしない人 ネイバー数 {5,10,15,…., 70} 17 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 18. 3-3. 購入決定基準の影響(2/2) 購入決定基準:選好重視型 購入決定基準:トレンド追随型混入 一般型消費者の精度 0.5 0.5 ネイバー数 0.4 0.4 5 実 10 験 20 結 0.3 0.3 果 30 40 0.2 0.2 0 10 20 30 40 50 0 10 20 30 40 50 時刻 時刻 • 精度が下がる 考 – 後半では、最適なネイバー数の場合における精度が大幅に減尐 察 – Because:トレンド追随型の消費者が、一般の消費者が類似度の ミーハーが多いと、趣味のあうひとを見つけるのが困難になる 高い消費者を見つけるにあたって、障害になる 18 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 19. 3-5. 購入頻度の影響(1/3) 問題意識 • 購入頻度の異質性がレコメンドにあたえる影響は? – 消費者の購入頻度によって、最適なパラメータは異なってくる? • 「尐しの優良顧客」と「大量の非優良顧客」が混在する環境 – 優良顧客の選好の影響をつよく受け、非優良顧客に対するレコメンド精度が下がる? 実験設定 パラメータ設定 パラメータ名 パラメータ値 優良 •購入頻度 = 0.8 購入決定基準 選好重視型 20 % • よくものを買う人 選好分布 ・クラスタ型 ・ランダム型 購入頻度 異質型 非優良 •購入頻度 = 0.2 •ふつうの人 ネイバー数 {5,10,15,…., 70} 80 % 19 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 20. 3-5. 購入頻度の影響(2/3) 購入頻度:均質型 購入頻度:異質型 0.5 0.5 ネイバー数 優良顧客の精度 0.4 0.4 顧客の精度 実 5 験 0.3 0.3 10 結 15 果 0.2 0.2 20 25 0.1 0.1 0 10 20 30 40 50 0 10 20 30 40 50 時刻 時刻 • 優良顧客が対象:初期はネイバー数が大きい方が良い 考  Because:大半の消費者が「非優良顧客」であり、今までのシナ リオと比較しても、初期時の投票行列が極めてスパース→より 察 多くのユーザの購買履歴を参照する必要性が生じた • 優良顧客が対象:精度が低め 20 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 21. 3-5. 購入頻度の影響(3/3) 購入頻度:均質型 市場構造=ランダム型 購入頻度:異質型 0.5 0.5 0.55 非優良顧客の精度 0.4 0.45 0.4 ネイバー数 顧客の精度 5 5 実 0.35 10 験 0.3 0.3 10 結 15 15 0.25 果 0.2 0.2 20 20 0.15 25 25 0.1 0.05 0.1 0 10 20 30 40 50 00 10 10 20 20 30 30 40 40 50 時刻 時刻 • 常にネイバー数が尐ない方が良い 考  Because:非優良顧客の場合、投票行列がスパースな環境下で 多くのユーザのデータを考慮することが、ノイズになりやすい 察  優良顧客と非優良顧客で、精度&最適なネイバー数が異なる • 精度は、優良顧客対象の場合よりも高い 21 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 22. 4. 結論と今後の課題 22 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 23. 4-1. 結論 •市場構造により、 精度が下がる場合がある •市場構造に応じた協調フィルタリングのパラメータ調 整を実施し、特異なケースをあきらかにした 基本的にネイバー数は小さな値の方が良いが、市場構造 によっては異なる場合がある 市場構造 時期 対象 精度 ネイバー数 通常時 尐 優良顧客,非 システム導 優良顧客 低 多 優良顧客が 入時 非優良顧客 尐 存在 一定期間以 優良顧客 低 尐 降 非優良顧客 尐 トレンド追随 システム導 低 尐 型消費者が 入時 存在 一定期間以 尐 降 23 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 24. 4-2. 今後の課題 • ミクロデータに対する分析 – 今回の「特異なケース」について原因を、ミクロレ ベルで考える必要性 • 実際のデータを用いたアプローチ – 市場構造について、実データを用いて、よりリアリ ティある市場構造を再現 • 他手法の評価 – アイテムベース手法等、別の方法での分析 24 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 25. 参考文献 1. 経済産業省,「平成19年度我が国のIT利活用に関する調査研究」(電子商取引に関する市場 調査),2008年 2. Resnick,M.,Iacovou,N.,Suchak,M.,Bergstorm,P. and Riedl,J.1994 GroupLens: an open architechture for collaborative filtering of netnews. In Proc.9th ACM Conf.on Computer-Supported Cooperative Work,pp.175-186,NewYork;ACM Press 3. Breese,J.S.,Heckerman,D.and Kadie,C. 1998 Empirical analysis of predictive algorithms for collaborative filtering. In Proc. 14th Conf. on Uncertainty in Artificial Intelligence, pp 43-52, San Francisco, CA:Morgan Kaufman 4. K. Goldberg et al.,”Eigentaste: A Consant Time Collaborative Filtering Algorithm,”Information Retrieval J.,vol. 4, no.2,July 2001,pp 133-151. 5. Linden,G., Smith,B.,and York,J : Amazon.com recommendations: Item-to-Item collaborative filtering, IEEE Internet Computing,Vol.4,No.1 (2003) 6. Sarwar,B.,Karypis ,G.,Konstan.J. and Riedl,J.:Item-based collaborative filtering recommendation algorithms, Proc.of the 10th International World Wide Web Conference(2001) 7. Zhang,T. and Iyengar, V.S.2002 Recommender Systems using linear classifiers. J.Machine Learn. Res.2, pp.313-334 8. 清水拓也, 土方嘉徳, 西田正吾,”発見性を考慮した協調フィルタリングアルゴリズムに関する複 数方式の検討”,DEWS2007 9. Herlocker,J.,Konstan,J., Terveen,L., and Riedl,J.: Evaluating collaborative filtering recommender systems, ACM Transacions on Information Systems, Vol.22, No.1, pp.5-53(2004) 25 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/
  • 26. ご静聴、ありがとうございました。 26 JAWS 2008 http://degulab.cs.dis.titech.ac.jp/~umeda07/