Webサービスによるユーザ嗜好に適応した
      お薦めシステムに関する基礎研究
A Study on User-Adaptive Recommender System
                               Based on Web Service


                      北海道大学 工学部 情報工学科4年
                      複雑系工学講座 調和系工学研究室
                                   山下晃弘
背景
  近年、Web上の情報資源は増加し、利用形態も多様化している

     利用者の趣味・嗜好を考慮した、お薦めシステムが注目されている
キーワード検索
  適切なキーワードを考える必要がある                                      ユーザ情報             飲食店情報
 例: 喫茶店○○の住所が知りたい

お薦めシステム
   趣味嗜好という感覚的側面を判断
 例: どこか美味しいお店を知りたい
   関連技術
・コンテンツベースフィルタリング
                                                         ・飲食店の評価       嗜好の近いユーザの評価を
・協調フィルタリング                                               ・好みのジャンル        基に飲食店を提示
・相関係数法      [Resnick 1994]                                    etc...

・逐次的二項関係学習法                  [Nakamura, Abe 1998]

・なんとなく協調フィルタリング                   [Kamishima 2003]


2006/2/16                                            卒業論文発表会                          1
問題点

      お薦め機能を導入しているのは、大部分が大手商用サイトである


 ・ ベンダーの提供するシステムは、導入時の経済的コストが大きい
              代表例
               Awareness Net システム(NTT東日本)
               アイジェント (Silver Egg Technology)

            日本のベンダーによる一般的なサービス価格 500万円∼3000万円※
                                 ※出典: Webパーソナライゼーション 日経BP社 2002

 ・ フリーのお薦めエンジンを利用するためにはプログラミング技術が必要




        個人や中小企業のサイトではお薦め機能の導入が難しい
2006/2/16                         卒業論文発表会                         2
目的


誰でも無償で利用できるシステムをオープンな技術で構築し公開する

実際にお薦めシステムを運用し、その実用性を検証する


   Webサービス技術を利用することにより、プラットフォームに依存せず
   多様なニーズに対応可能




2006/2/16          卒業論文発表会             3
Webサービス型汎用お薦めシステム

                     お薦めシステムのWebサービス化
    必要な機能

•   ユーザ管理
•   コンテンツ管理
•   推薦アルゴリズム
•   アルゴリズムのデータ管理
•   ユーザインタフェース




        システム構築時の方針
    •   出来る限りフリーで利用可能な技術を利用する
    •   計算速度や通信速度より言語や環境に依存しない一般性を重視する
    •   開発のしやすい方法で、拡張性の高さやメンテナンスの容易さを考慮する

2006/2/16              卒業論文発表会              4
Webサービスによるシステム構築

       プロバイダとリクエスタ間の通信にはSOAPを使用
            ・ W3Cの勧告であり、Webサービスの標準技術である
            ・ XMLにより通信を行うため、言語やプラットフォームに依存しない

  お薦めプロバイダ

   •    Javaによる実装
         – アプリケーションサーバやSOAPライブラリが充実
         – WebアプリケーションやWebサービスのサーバとして構築例が豊富

  お薦めリクエスタ
   •    XOOPSのモジュールとして実装
            – お薦めモジュールのインストールが容易
            – PHPにより、Webコンテンツを簡単に構成可能
            – 外部モジュールの利用により簡単に機能が追加できる
            – ユーザ管理コンテンツ管理など、お薦めシステムとして利用可能な機能が充実
2006/2/16                   卒業論文発表会             5
システム構成

                      今回新たに構築した部分




2006/2/16   卒業論文発表会                 6
協調フィルタリング − 相関係数法 ー
ユーザ集合 U  {u1 , , un } コンテンツ集合 : C  {c1 , , cm }
     :                                                                                            全コンテンツ集合
ユーザuiのコンテンツc jに対する評価 : eij
                                                                                                          ユーザが既知の
コンテンツci を評価したユーザ集合 : U i
                                                                                                          コンテンツ集合
ユーザuiが評価したコンテンツ集合 : Ci
ユーザuiとユーザu jの類似度 : sim (ui , u j )                                                                         評価済み
                                                                                                          コンテンツ集合
                         ˆ
ユーザuiが未知のコンテンツcαの評価推定値 : eiα

                     ˆ
 推薦するコンテンツ : arg max(eiα)
                                                                                       Ci  C j
                                                      α
                                                                                 Ci               C   j
               sim(ui , u j )(e jα  e j )
              jUα
eiα  ~i 
ˆ     e
                      sim(u , u )
                     jUα
                                       i        j                                sim (ui , u j )を計算
                               (e
                            aCi C j
                                           ia    ei )(e ja  e j )
sim(ui , u j ) 
                        (e
                     aCi C j
                                 ia    ei ) 2          (e
                                                     aCi C j
                                                                 ja    e j )2                              類似度小

       e     ia
~
ei
       aCi

         Ci
                     ei         e
                             aCi C j
                                            ia                                                        類似度大           高評価
                                                                                                                    コンテンツ
 2006/2/16                                                                   卒業論文発表会                                   7
システムの運用

・ 趣味や嗜好が強く反映されるコンテンツで実際にシステムを運用する
・ 推薦されるコンテンツがそのユーザに適応しているかを観察する
・ ユーザの嗜好を反映するためには多くのレビューが必要

  対象コンテンツ      映画
  ユーザ数         25名程度
  コンテンツ数       100タイトル
  お薦めアルゴリズム    協調フィルタリング(相関係数法)+レビュア評価
    ・ レビュー     5段階評価+レビューコメント投稿
    ・ レビュア評価   5段階評価
  お薦め表示        評価が高いと推測された上位3つのコンテンツを表示

               ※ レビュー: ユーザがコンテンツに対して行う評価やコメント
                 レビュア: 1回以上レビューを行ったユーザ
2006/2/16                卒業論文発表会            8
2006/2/16   卒業論文発表会   9
運用した結果得られたデータ例

                ユーザ間の嗜好の類似度グラフ
                            ・        ・

                    ・
                                                                   レビュア:17名
                                              ・・

                                                                   得られた総レビュー数:210
            ・                                           ・・




   ・                                                          ・・
                                                                    ノード:レビュア
                                                                    エッジ:ユーザ間の類似度
  ・
                                                              ・・
                                                                       赤:正の相関

       ・
                                                                       青:負の相関
                                                         ・・

                                                                       太:強い相関
                ・
                                                   ・・
                                                                       細:弱い相関
                        ・                ・・
                                ・・




2006/2/16                                          卒業論文発表会                          10
お薦めシステム構築方法の比較

    ベンダーに依頼する場合       フリーモジュールを利用する場合    提案する方法の場合

                       Apache等HTTPサーバ、   Apache、PHP、MySQL、
            ベンダーに依頼     DBMSのインストール       XOOPSのインストール


                         開発環境の構築


                      モジュールの仕様に沿って
  構築するシステムについて                            お薦めモジュールの
                        システムを設計する
    ベンダーと相談                                 インストール

                       フリーのモジュールを
                       Webサイトに組み込む
                        (プログラミング)



                      お薦めシステムの運用
2006/2/16                  卒業論文発表会                       11
まとめと今後の課題


        まとめ

•      一般ユーザでも簡単に低コストで導入可能なお薦めシステムの基盤を構築した
•      実際にシステムをテスト運用し、システムの実用性を検証することができた



       ユーザからの意見や要望
•       あるレビューが他の人の推薦にどの程度影響を与えてるかを可視化する方法はあるか
•       レビュアの人気ランキングを表示することで評価するインセンティブに繋がる
•       興味の無い映画が推薦された場合にシステムに知らせる方法があると良い
•       コンテンツの新規登録では、映画のタイトルから他の属性は自動入力できないか
•       監督、俳優、ジャンルの繋がりを考慮した推薦は可能であるか




    2006/2/16           卒業論文発表会              12

Ppt yamashita g

  • 1.
    Webサービスによるユーザ嗜好に適応した お薦めシステムに関する基礎研究 A Study on User-Adaptive Recommender System Based on Web Service 北海道大学 工学部 情報工学科4年 複雑系工学講座 調和系工学研究室 山下晃弘
  • 2.
    背景 近年、Web上の情報資源は増加し、利用形態も多様化している 利用者の趣味・嗜好を考慮した、お薦めシステムが注目されている キーワード検索 適切なキーワードを考える必要がある ユーザ情報 飲食店情報 例: 喫茶店○○の住所が知りたい お薦めシステム 趣味嗜好という感覚的側面を判断 例: どこか美味しいお店を知りたい 関連技術 ・コンテンツベースフィルタリング ・飲食店の評価 嗜好の近いユーザの評価を ・協調フィルタリング ・好みのジャンル 基に飲食店を提示 ・相関係数法 [Resnick 1994] etc... ・逐次的二項関係学習法 [Nakamura, Abe 1998] ・なんとなく協調フィルタリング [Kamishima 2003] 2006/2/16 卒業論文発表会 1
  • 3.
    問題点 お薦め機能を導入しているのは、大部分が大手商用サイトである ・ ベンダーの提供するシステムは、導入時の経済的コストが大きい 代表例 Awareness Net システム(NTT東日本) アイジェント (Silver Egg Technology) 日本のベンダーによる一般的なサービス価格 500万円∼3000万円※ ※出典: Webパーソナライゼーション 日経BP社 2002 ・ フリーのお薦めエンジンを利用するためにはプログラミング技術が必要 個人や中小企業のサイトではお薦め機能の導入が難しい 2006/2/16 卒業論文発表会 2
  • 4.
    目的 誰でも無償で利用できるシステムをオープンな技術で構築し公開する 実際にお薦めシステムを運用し、その実用性を検証する Webサービス技術を利用することにより、プラットフォームに依存せず 多様なニーズに対応可能 2006/2/16 卒業論文発表会 3
  • 5.
    Webサービス型汎用お薦めシステム お薦めシステムのWebサービス化 必要な機能 • ユーザ管理 • コンテンツ管理 • 推薦アルゴリズム • アルゴリズムのデータ管理 • ユーザインタフェース システム構築時の方針 • 出来る限りフリーで利用可能な技術を利用する • 計算速度や通信速度より言語や環境に依存しない一般性を重視する • 開発のしやすい方法で、拡張性の高さやメンテナンスの容易さを考慮する 2006/2/16 卒業論文発表会 4
  • 6.
    Webサービスによるシステム構築 プロバイダとリクエスタ間の通信にはSOAPを使用 ・ W3Cの勧告であり、Webサービスの標準技術である ・ XMLにより通信を行うため、言語やプラットフォームに依存しない お薦めプロバイダ • Javaによる実装 – アプリケーションサーバやSOAPライブラリが充実 – WebアプリケーションやWebサービスのサーバとして構築例が豊富 お薦めリクエスタ • XOOPSのモジュールとして実装 – お薦めモジュールのインストールが容易 – PHPにより、Webコンテンツを簡単に構成可能 – 外部モジュールの利用により簡単に機能が追加できる – ユーザ管理コンテンツ管理など、お薦めシステムとして利用可能な機能が充実 2006/2/16 卒業論文発表会 5
  • 7.
    システム構成 今回新たに構築した部分 2006/2/16 卒業論文発表会 6
  • 8.
    協調フィルタリング − 相関係数法ー ユーザ集合 U  {u1 , , un } コンテンツ集合 : C  {c1 , , cm } : 全コンテンツ集合 ユーザuiのコンテンツc jに対する評価 : eij ユーザが既知の コンテンツci を評価したユーザ集合 : U i コンテンツ集合 ユーザuiが評価したコンテンツ集合 : Ci ユーザuiとユーザu jの類似度 : sim (ui , u j ) 評価済み コンテンツ集合 ˆ ユーザuiが未知のコンテンツcαの評価推定値 : eiα ˆ 推薦するコンテンツ : arg max(eiα) Ci  C j α Ci C j  sim(ui , u j )(e jα  e j ) jUα eiα  ~i  ˆ e  sim(u , u ) jUα i j sim (ui , u j )を計算  (e aCi C j ia  ei )(e ja  e j ) sim(ui , u j )   (e aCi C j ia  ei ) 2  (e aCi C j ja  e j )2 類似度小 e ia ~ ei aCi Ci ei  e aCi C j ia 類似度大 高評価 コンテンツ 2006/2/16 卒業論文発表会 7
  • 9.
    システムの運用 ・ 趣味や嗜好が強く反映されるコンテンツで実際にシステムを運用する ・ 推薦されるコンテンツがそのユーザに適応しているかを観察する ・ユーザの嗜好を反映するためには多くのレビューが必要 対象コンテンツ 映画 ユーザ数 25名程度 コンテンツ数 100タイトル お薦めアルゴリズム 協調フィルタリング(相関係数法)+レビュア評価 ・ レビュー 5段階評価+レビューコメント投稿 ・ レビュア評価 5段階評価 お薦め表示 評価が高いと推測された上位3つのコンテンツを表示 ※ レビュー: ユーザがコンテンツに対して行う評価やコメント レビュア: 1回以上レビューを行ったユーザ 2006/2/16 卒業論文発表会 8
  • 10.
    2006/2/16 卒業論文発表会 9
  • 11.
    運用した結果得られたデータ例 ユーザ間の嗜好の類似度グラフ ・ ・ ・ レビュア:17名 ・・ 得られた総レビュー数:210 ・ ・・ ・ ・・ ノード:レビュア エッジ:ユーザ間の類似度 ・ ・・ 赤:正の相関 ・ 青:負の相関 ・・ 太:強い相関 ・ ・・ 細:弱い相関 ・ ・・ ・・ 2006/2/16 卒業論文発表会 10
  • 12.
    お薦めシステム構築方法の比較 ベンダーに依頼する場合 フリーモジュールを利用する場合 提案する方法の場合 Apache等HTTPサーバ、 Apache、PHP、MySQL、 ベンダーに依頼 DBMSのインストール XOOPSのインストール 開発環境の構築 モジュールの仕様に沿って 構築するシステムについて お薦めモジュールの システムを設計する ベンダーと相談 インストール フリーのモジュールを Webサイトに組み込む (プログラミング) お薦めシステムの運用 2006/2/16 卒業論文発表会 11
  • 13.
    まとめと今後の課題 まとめ • 一般ユーザでも簡単に低コストで導入可能なお薦めシステムの基盤を構築した • 実際にシステムをテスト運用し、システムの実用性を検証することができた ユーザからの意見や要望 • あるレビューが他の人の推薦にどの程度影響を与えてるかを可視化する方法はあるか • レビュアの人気ランキングを表示することで評価するインセンティブに繋がる • 興味の無い映画が推薦された場合にシステムに知らせる方法があると良い • コンテンツの新規登録では、映画のタイトルから他の属性は自動入力できないか • 監督、俳優、ジャンルの繋がりを考慮した推薦は可能であるか 2006/2/16 卒業論文発表会 12