information discovery based on social bookmarks3. Bookmark (しおり) Social Bookmark
› ブラウザの機能 › みんなでBookmark
› Webサイト(URL) の › タグの付与
記録 分類
何度も訪れるサイト 検索の補助:Tag Cloud
あとで訪れる可能性の › コンテンツフィルタリング
あるサイト
URL
Nintendo tags
Wii
Bookmark user
3
4. • タグ付け問題
関連研究 • 検索精度
• タグによる検索
既存のサービス • 人気のブックマーク
Social Bookmarkを活かした情報発見支援
4
6. 類似利用者手法
› 似ている利用者を探す
› 似ている利用者の持っている情報を見る
α ブックマーカー手法
› トピックを求める
› トピックに関するα ブックマーカーを探す
› α ブックマーカーの持っている情報を見る
6
8. 持ってるCD 持ってるCD
○○たん
かわゆす
興味が近い
萌え~
(*´Д`) ハァ
ハァ
8
9. 利用者間の類似度
コサイン尺度で計算
類似度 = cos U i , U j =
U i U j
| U i || U j |
U (URL1 ,URL2 ,URLn ) USERy
URLi {1 | 0}
θ
o USERx
9
13. αブックマーカー手法
1. トピックの算出
› 利用者の興味のあるものを指定したい
› タグはtopic
› タグの揺らぎを解消したい
同義語
意味の階層
2. αブックマーカーの算出
› トピックに関する情報をいち早くキャッチ
3. αブックマーカーのトピックに関する情報
を提示
14. タグの階層化
› Intersection Rate
link (t)
link (s) link (t ) link ( s )
| link (t ) link ( s ) |
a
| link ( s ) |
任意のタグ t の下位タグ集合をトピックと
みなす
14
15. トピック(タグ集合)に関するURL集合を求める
› タグ t ∈ TOPIC でタグ付けられているURL
それらのURL集合でαブックマーカーを探す
› 一つのURLに対する利用者集合のうち早期にブックマ
ークした上位α%の利用者に重みづけ
› 重みw (u) = 被ブックマーク数 – rank(u)
› α度 = w(u )
uUSERS
α度の大きい上位N人がαブックマーカー
15
17. 2005/2/10 2007/1/1 2007/7/17
訓練データ テストデータ time
• 2006年12月31日までのデータで実装
• 無作為に1000人の利用者
• 2007年1月1日以降のデータで1つでも利用者によって
ブックマークされていれば成功
• 情報提示数を10, 20, …, 100と変化
17
18. Random
› 利用者にブックマークデータのURL中からランダ
ムに情報提示
類似利用者手法
αブックマーカー手法
› 入力タグはTF値上位20個
タグの階層化のみ
› TOPICを求め, TOPICに関するURL集合を共起で
重みづけて情報提示
18
20. Social Bookmarkに注目
情報発見を支援するために2つの手法を提案
› 類似利用者法
› αブックマーカー法
› 評価実験
今後の課題
› 手法の改良
› 評価の見直し
Precision - Recall
20
21. close 2 u (類似利用者手法)
http://tinyurl.com/29ze3g
Tag Hierarchy (タグの階層化)
http://tinyurl.com/3x7cn6
Alpha Bookmarker (αブックマーカー手法)
http://tinyurl.com/2jb9g2