ユーザ主導による主観・客観を考慮した 情報蓄積と推薦に関する研究 
複雑系工学講座 調和系工学研究室 
修士2年 山下晃弘 
User Initiated Information Accumulation and Recommendation Considering Objective-Subjective Distinction 
平成19年度修士論文発表会
2007/2/13 平成19年度修士論文発表会 2 /17 
研究背景 
Amazon.com 
Wikipedia 
主観的情報 
客観的情報 
個人が発信する情報には が含まれている 
客観的 主観的 客観的 
札幌にある美味しいラーメン店 
複雑系 
主観と客観が混在した情報の利用価値は閲覧者が判断 
例: 
本当に美味しい? 
個々の自律的振る舞いが全体を構成 
個々は互いに影響を及ぼしあう 
個人の自律的な閲覧・発信が全体を構成 
ある情報発信が他者の行動に影響 
Web 
主観と客観が分離できれば様々な技術が適用可能 
食べログ 
Flickr 
複雑性を持つ情報源から技術やアイディアで価値を生み出す実システム 
ソーシャルブックマーク 
Google ローカル
平成19年度修士論文発表会 
2007/2/13 
/17 
3 
研究目的 
(A) 主観性,客観性を区別した情報収集・提供システムの構築 (B) 主観・客観情報の利点を生かした情報推アルゴリズムの提案
平成19年度修士論文発表会 
2007/2/13 
/17 
4 
提案システム 
情報データベース 
情報推薦 アルゴリズム 
客観的属性テーブル 
主観的属性テーブル 
主観性と客観性を 
区別した情報カードとして蓄積 
札幌に来た 
観光客 
ラーメンに 詳しいユーザ 
美味しいランチ を捜す利用者 
客観的情報: 
住所:札幌市中央区・・・・ 
電話番号:011:1234:5678 
メニュー:味噌・塩 
価格:500~1000円 
主観的情報: おいしさ 雰囲気 
情報提供 
Webサービス 
情報推薦 
ブログなどでの 
情報利用 
ユーザによって情報が発信され その情報をユーザが利用する
平成19年度修士論文発表会 
2007/2/13 
/17 
5 
情報収集 
米Technorati調べ 
2003年3月~2007年4月 
ブログの特徴 
[Aimeur, E. 2003] ユーザ数が多い 誰でも利用可能 個人が編集主体であり主観を含む 頻繁な更新と時系列表示 アーカイブ形式 
情報提供者にとって利益になる仕組みが必要 
ブロガーにとっての利点 ブログ記事にカードを挿入・・・・・・・・・・記事の充実 カードにブログへのリンクを記載・・・・・ブログの宣伝効果 主観的情報を利用したカード推薦・・・・新たな情報の発見 
ブログの記事投稿時にカードを作ったり編集してもらう 
ブログに着目
2007/2/13 平成19年度修士論文発表会 6 /17 
情報推薦 
主観的属性の量 
類似ユーザの数 
全体の嗜好分布 
に依存する 
各データの 
属性値が類似 
主観が類似 
結果 結果 
好み 
好み 
推薦アルゴリズムの効果は 
アイテム間の類似度を利用[Sarwar,01] 
利点:新規ユーザにも推薦可 
欠点:多様性に乏しい 
個人の主観の類似度を利用[Resnick,94] 
利点:多様性が期待できる 
欠点:新規ユーザには推薦不可 
主観を考慮する推薦 
協調フィルタリングを利用 
既存アルゴリズム 
複雑系の分析手法であるマルチエージェントを用いて推薦の効果を検証 
Collaborative Filtering (CF)
2007/2/13 平成19年度修士論文発表会 7 /17 
ユーザ集合 U {i | i 1,...,n} 
( ,..., ) i i1 inF p  p p 
効用 exp( || ||) i, j i j s  α p  v 
( ) {1,2,3,4,5} , ,   i j i j 格付け r f s 
嗜好ベクトル 
アイテム集合 
特徴ベクトル 
推薦効果の分析-シミュレーションモデル 
C { j | j 1,...,m} 
( ,..., ) j j1 jnF v  v v 
推薦システム 
ランダム推薦 
人気推薦 
ユーザ間CF 
アイテム間CF 
ターゲットユーザ
2007/2/13 平成19年度修士論文発表会 8 /17 
ユーザ集合 U {i | i 1,...,n} 
( ,..., ) i i1 inF p  p p 
効用 exp( || ||) i, j i j s  α p  v 
( ) {1,2,3,4,5} , ,   i j i j 格付け r f s 
嗜好ベクトル 
アイテム集合 
特徴ベクトル 
推薦効果の分析-シミュレーションモデル 
C { j | j 1,...,m} 
( ,..., ) j j1 jnF v  v v 
推薦システム 
ランダム推薦 
人気推薦 
ユーザ間CF 
アイテム間CF 
推薦システムによる 
格付けの予測 
予測値が最も高い 
アイテムを推薦
2007/2/13 平成19年度修士論文発表会 9 /17 
ユーザ集合 U {i | i 1,...,n} 
( ,..., ) i i1 inF p  p p 
効用 exp( || ||) i, j i j s  α p  v 
( ) {1,2,3,4,5} , ,   i j i j 格付け r f s 
嗜好ベクトル 
アイテム集合 
特徴ベクトル 
推薦効果の分析-シミュレーションモデル 
C { j | j 1,...,m} 
( ,..., ) j j1 jnF v  v v 
推薦システム 
ランダム推薦 
人気推薦 
ユーザ間CF 
アイテム間CF 
推薦システムによる 
格付けの予測 
予測値が最も高い 
アイテムを推薦 
効用・格付け 
の計算 
効用 0.8 ,  i j s 
5 ,  i j 格付け r 
推薦システムに 
格付けを入力
2007/2/13 平成19年度修士論文発表会 10 /17 
推薦効果の分析-実験結果1 
ユーザ数n 100,500,1000,2000 
アイテム数m 500 
嗜好ベクトル 一様乱数 
特徴ベクトル 一様乱数 
ベクトルの次元 5 
i p 
j v 
実験設定 
ユーザ数=500の結果
平成19年度修士論文発表会 
2007/2/13 
/17 
11 
推薦効果の分析-考察 
各アイテムの格付け数(推薦された回数)を観察 
アイテム毎の推薦回数に差が少ない 
薄→推薦回数:多 
濃→推薦回数:少 
アイテム毎の推薦回数の差が大きい 
アイテム間CFの方が人気推薦に近い
平成19年度修士論文発表会 
2007/2/13 
/17 
12 
推薦効果の分析-実験結果2 
最初はアイテム間CFで推薦し,途中でユーザ間CFに切り替える 
実運用では,途中で推薦アルゴリズムを切り替える方法が有効 
誰も格付けを入力していない状態から開始 
初期状態で他ユーザの格付けあり
2007/2/13 平成19年度修士論文発表会 13 /17 
システムへの実装 
拡張モジュール 
表示サーバ 
(ユーザインタフェース) 
HTTP 
サーバ 
JavaVM 
データサーバ 
(情報管理・提供) 
XOOPS 
カード情報提供 
Webサービス 
DB 
推薦アルゴリズム 
カードデータ管理 
カード情報表示 
モジュール 
ブログ 
モジュール 
HTTP 
サーバ 
PHP DB 
Web 
サービス 
構築コストを最小化 (オープンソースの技術を利用) 
動作環境としての汎用性・拡張性・メンテナンスの容易性を考慮
2007/2/13 平成19年度修士論文発表会 14 /17 
プロトタイプシステムの動作例 
省略 
システムは、入力された記事内容と 
カード情報を基にブログ記事を構築する 
入力インタフェース ブログ記事 
カード情報
2007/2/13 平成19年度修士論文発表会 15 /17 
プロトタイプシステムの動作例 
ブログ記事 
情報サイト 
個人のブログ 一般に公開される情報サイト
2007/2/13 平成19年度修士論文発表会 16 /17 
プロトタイプシステムの動作例 
主観的情報 
客観的情報 
• 飲食店名 
• 住所 
• 電話番号 
• 休業日 
• 地図 
• メニュー 
• 価格 
etc. 
ブログ記事 
カード詳細情報 
個人のブログ 一般に公開される情報サイト
平成19年度修士論文発表会 
2007/2/13 
/17 
17 
結論 
Lecture Notes in Computer Science 4881, Springer-Verlag Berlin Heidelberg, pp.1112-1121 (2007). 
学会発表 : 国際2回(査読あり2回),国内8回(査読あり1回) 
受賞 : 情報処理学会北海道支部研究奨励賞 ユーザから発信される情報を主観・客観を区別して蓄積 それを情報源として他のユーザに適切に提供 
研究業績 
主観・客観を区別した情報収集・提供システムを構築 
主観・客観情報の利点を生かした推薦手法の提案 アイテム間の類似性による推薦と,主観の類似性による推薦の違いを分析 システムの運用状況で,両者を切り替える手法が有効 
Future Work 推薦アルゴリズムを切り替える有効性を実データで評価 システム全体の評価法の検討

yamasita m

  • 1.
    ユーザ主導による主観・客観を考慮した 情報蓄積と推薦に関する研究 複雑系工学講座調和系工学研究室 修士2年 山下晃弘 User Initiated Information Accumulation and Recommendation Considering Objective-Subjective Distinction 平成19年度修士論文発表会
  • 2.
    2007/2/13 平成19年度修士論文発表会 2/17 研究背景 Amazon.com Wikipedia 主観的情報 客観的情報 個人が発信する情報には が含まれている 客観的 主観的 客観的 札幌にある美味しいラーメン店 複雑系 主観と客観が混在した情報の利用価値は閲覧者が判断 例: 本当に美味しい? 個々の自律的振る舞いが全体を構成 個々は互いに影響を及ぼしあう 個人の自律的な閲覧・発信が全体を構成 ある情報発信が他者の行動に影響 Web 主観と客観が分離できれば様々な技術が適用可能 食べログ Flickr 複雑性を持つ情報源から技術やアイディアで価値を生み出す実システム ソーシャルブックマーク Google ローカル
  • 3.
    平成19年度修士論文発表会 2007/2/13 /17 3 研究目的 (A) 主観性,客観性を区別した情報収集・提供システムの構築 (B) 主観・客観情報の利点を生かした情報推アルゴリズムの提案
  • 4.
    平成19年度修士論文発表会 2007/2/13 /17 4 提案システム 情報データベース 情報推薦 アルゴリズム 客観的属性テーブル 主観的属性テーブル 主観性と客観性を 区別した情報カードとして蓄積 札幌に来た 観光客 ラーメンに 詳しいユーザ 美味しいランチ を捜す利用者 客観的情報: 住所:札幌市中央区・・・・ 電話番号:011:1234:5678 メニュー:味噌・塩 価格:500~1000円 主観的情報: おいしさ 雰囲気 情報提供 Webサービス 情報推薦 ブログなどでの 情報利用 ユーザによって情報が発信され その情報をユーザが利用する
  • 5.
    平成19年度修士論文発表会 2007/2/13 /17 5 情報収集 米Technorati調べ 2003年3月~2007年4月 ブログの特徴 [Aimeur, E. 2003] ユーザ数が多い 誰でも利用可能 個人が編集主体であり主観を含む 頻繁な更新と時系列表示 アーカイブ形式 情報提供者にとって利益になる仕組みが必要 ブロガーにとっての利点 ブログ記事にカードを挿入・・・・・・・・・・記事の充実 カードにブログへのリンクを記載・・・・・ブログの宣伝効果 主観的情報を利用したカード推薦・・・・新たな情報の発見 ブログの記事投稿時にカードを作ったり編集してもらう ブログに着目
  • 6.
    2007/2/13 平成19年度修士論文発表会 6/17 情報推薦 主観的属性の量 類似ユーザの数 全体の嗜好分布 に依存する 各データの 属性値が類似 主観が類似 結果 結果 好み 好み 推薦アルゴリズムの効果は アイテム間の類似度を利用[Sarwar,01] 利点:新規ユーザにも推薦可 欠点:多様性に乏しい 個人の主観の類似度を利用[Resnick,94] 利点:多様性が期待できる 欠点:新規ユーザには推薦不可 主観を考慮する推薦 協調フィルタリングを利用 既存アルゴリズム 複雑系の分析手法であるマルチエージェントを用いて推薦の効果を検証 Collaborative Filtering (CF)
  • 7.
    2007/2/13 平成19年度修士論文発表会 7/17 ユーザ集合 U {i | i 1,...,n} ( ,..., ) i i1 inF p  p p 効用 exp( || ||) i, j i j s  α p  v ( ) {1,2,3,4,5} , ,   i j i j 格付け r f s 嗜好ベクトル アイテム集合 特徴ベクトル 推薦効果の分析-シミュレーションモデル C { j | j 1,...,m} ( ,..., ) j j1 jnF v  v v 推薦システム ランダム推薦 人気推薦 ユーザ間CF アイテム間CF ターゲットユーザ
  • 8.
    2007/2/13 平成19年度修士論文発表会 8/17 ユーザ集合 U {i | i 1,...,n} ( ,..., ) i i1 inF p  p p 効用 exp( || ||) i, j i j s  α p  v ( ) {1,2,3,4,5} , ,   i j i j 格付け r f s 嗜好ベクトル アイテム集合 特徴ベクトル 推薦効果の分析-シミュレーションモデル C { j | j 1,...,m} ( ,..., ) j j1 jnF v  v v 推薦システム ランダム推薦 人気推薦 ユーザ間CF アイテム間CF 推薦システムによる 格付けの予測 予測値が最も高い アイテムを推薦
  • 9.
    2007/2/13 平成19年度修士論文発表会 9/17 ユーザ集合 U {i | i 1,...,n} ( ,..., ) i i1 inF p  p p 効用 exp( || ||) i, j i j s  α p  v ( ) {1,2,3,4,5} , ,   i j i j 格付け r f s 嗜好ベクトル アイテム集合 特徴ベクトル 推薦効果の分析-シミュレーションモデル C { j | j 1,...,m} ( ,..., ) j j1 jnF v  v v 推薦システム ランダム推薦 人気推薦 ユーザ間CF アイテム間CF 推薦システムによる 格付けの予測 予測値が最も高い アイテムを推薦 効用・格付け の計算 効用 0.8 ,  i j s 5 ,  i j 格付け r 推薦システムに 格付けを入力
  • 10.
    2007/2/13 平成19年度修士論文発表会 10/17 推薦効果の分析-実験結果1 ユーザ数n 100,500,1000,2000 アイテム数m 500 嗜好ベクトル 一様乱数 特徴ベクトル 一様乱数 ベクトルの次元 5 i p j v 実験設定 ユーザ数=500の結果
  • 11.
    平成19年度修士論文発表会 2007/2/13 /17 11 推薦効果の分析-考察 各アイテムの格付け数(推薦された回数)を観察 アイテム毎の推薦回数に差が少ない 薄→推薦回数:多 濃→推薦回数:少 アイテム毎の推薦回数の差が大きい アイテム間CFの方が人気推薦に近い
  • 12.
    平成19年度修士論文発表会 2007/2/13 /17 12 推薦効果の分析-実験結果2 最初はアイテム間CFで推薦し,途中でユーザ間CFに切り替える 実運用では,途中で推薦アルゴリズムを切り替える方法が有効 誰も格付けを入力していない状態から開始 初期状態で他ユーザの格付けあり
  • 13.
    2007/2/13 平成19年度修士論文発表会 13/17 システムへの実装 拡張モジュール 表示サーバ (ユーザインタフェース) HTTP サーバ JavaVM データサーバ (情報管理・提供) XOOPS カード情報提供 Webサービス DB 推薦アルゴリズム カードデータ管理 カード情報表示 モジュール ブログ モジュール HTTP サーバ PHP DB Web サービス 構築コストを最小化 (オープンソースの技術を利用) 動作環境としての汎用性・拡張性・メンテナンスの容易性を考慮
  • 14.
    2007/2/13 平成19年度修士論文発表会 14/17 プロトタイプシステムの動作例 省略 システムは、入力された記事内容と カード情報を基にブログ記事を構築する 入力インタフェース ブログ記事 カード情報
  • 15.
    2007/2/13 平成19年度修士論文発表会 15/17 プロトタイプシステムの動作例 ブログ記事 情報サイト 個人のブログ 一般に公開される情報サイト
  • 16.
    2007/2/13 平成19年度修士論文発表会 16/17 プロトタイプシステムの動作例 主観的情報 客観的情報 • 飲食店名 • 住所 • 電話番号 • 休業日 • 地図 • メニュー • 価格 etc. ブログ記事 カード詳細情報 個人のブログ 一般に公開される情報サイト
  • 17.
    平成19年度修士論文発表会 2007/2/13 /17 17 結論 Lecture Notes in Computer Science 4881, Springer-Verlag Berlin Heidelberg, pp.1112-1121 (2007). 学会発表 : 国際2回(査読あり2回),国内8回(査読あり1回) 受賞 : 情報処理学会北海道支部研究奨励賞 ユーザから発信される情報を主観・客観を区別して蓄積 それを情報源として他のユーザに適切に提供 研究業績 主観・客観を区別した情報収集・提供システムを構築 主観・客観情報の利点を生かした推薦手法の提案 アイテム間の類似性による推薦と,主観の類似性による推薦の違いを分析 システムの運用状況で,両者を切り替える手法が有効 Future Work 推薦アルゴリズムを切り替える有効性を実データで評価 システム全体の評価法の検討