DEWS2007 C7-6

クエリログとナビゲーション履歴からの
探索意図抽出による協調探索支援	

京都大学	
川本淳平 田中克己 田島敬史
背景	
n 

グループWeb探索の必要性	
¡ 

グループ・組織の意思決定	
n 
n 

¡ 

情報収集型サーチ	
n 
n 

¡ 

旅行のプランニング	
Web上で流行している情報の収集	
違法な情報がWeb上にな...
協調探索の問題点	
「京都観光」を検索	

n 

探索領域が狭くなる	
¡ 

¡ 

n 

似た検索クエリの利用した

Web検索	
検索結果を上から順に検討	

適切な量の探索情報を共有	
¡ 

情報量が多い場合	
n 
...
目的とアプローチ	
できるだけ少ない情報量で	
既探索領域と未探索領域の可視化	

n 

既探索領域の可視化	
¡ 

クエリログの木構造化 : QueryLogTree
n 
n 

¡ 

n 

クエリログとはWeb検索に使...
探索領域
1) クエリ文字列としての探索領域

Q1 = 京都観光 金閣寺	
Q2 = 京都観光 銀閣寺	

本手法ではこの2つに着目	

2) 話題としての探索領域

Q1が指す話題	

Q2が指す話題	

ユーザ間で探索話題が

重ならない...
QueryLogTreeの例	
探索領域を詳細化する場合
子として接続する	

京都観光	

topic

topic
京都観光 金閣寺

京都観光 清水寺

同一領域の探索をtopicという
要素でグループ化	

京都観光 銀閣寺

京都観光...
クエリ間の親子関係を発見1
n 
n 

クエリ中のキーワードの関係を利用	
共通キーワードがある場合	
¡ 
¡ 

「京都観光 金閣寺」は「京都観光」の子要素	
「京都観光 金閣寺」と「京都観光 銀閣寺」は兄弟要素	
京都観光	

...
クエリ間の親子関係を発見2
n 

共通キーワードが無い場合	
¡ 
¡ 

新しいクエリは今までの探索内容を反映	
過去の探索に新しいクエリが含まれていれば

その探索に関連があると判断	
「広島 郷土料理」の検
索で閲覧したページ	
...
同一領域探索のクエリ発見	
n 

同一領域を探索しているクエリの発見	
¡ 

サーチエンジンのインデックスを利用	
n 
n 
n 

「銀閣寺」と「慈照寺」が同一領域探索かの判定	
「銀閣寺(慈照寺)」を検索	
検索結果のサマリ...
未探索領域の発見	
n 

グループ探索における2つのフェーズ	
¡ 
¡ 

n 

探索領域を広げていく拡大フェーズ	
探索領域を絞り深く探索する縮小フェーズ	

拡大フェーズに対する未探索領域	
¡ 

大島ら[1]の同位語発見...
実験	
n 
n 

20~30クエリを用いてQueryLogTreeを作成	
作成されたTreeがユーザの意図通りか?
¡ 
¡ 

n 

親子関係の判定・・・総クエリの85.3%正しく判定	
同一領域クエリの判定・・・94.3%...
まとめと今後の課題	
n 

協調探索で探索領域が狭くなる問題	
¡ 

既探索領域と未探索領域を可視化することで支援	
n 
n 
n 

n 

今後の課題	
¡ 

現在は探索している話題が重ならない為の支援	
n 

¡...
Upcoming SlideShare
Loading in...5
×

クエリログとナビゲーション履歴から探索意図抽出による協調探索支援

123

Published on

DEWS 2007.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
123
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

クエリログとナビゲーション履歴から探索意図抽出による協調探索支援

  1. 1. DEWS2007 C7-6 クエリログとナビゲーション履歴からの 探索意図抽出による協調探索支援 京都大学 川本淳平 田中克己 田島敬史
  2. 2. 背景 n  グループWeb探索の必要性 ¡  グループ・組織の意思決定 n  n  ¡  情報収集型サーチ n  n  ¡  旅行のプランニング Web上で流行している情報の収集 違法な情報がWeb上にないか網羅的に捜索 ディベート用に関連ある情報を網羅的に得たい その他 n  複数人で一つの情報をいかに早くみつけるか
 など色々な協調探索があるが上記2つのみを対象
  3. 3. 協調探索の問題点 「京都観光」を検索 n  探索領域が狭くなる ¡  ¡  n  似た検索クエリの利用した
 Web検索 検索結果を上から順に検討 適切な量の探索情報を共有 ¡  情報量が多い場合 n  n  ¡  共有情報の吟味に時間を要する 本来の探索が妨げられる 情報量が少ない場合 n  探索領域が狭くなる問題の発生 「京都観光」を検索
  4. 4. 目的とアプローチ できるだけ少ない情報量で 既探索領域と未探索領域の可視化 n  既探索領域の可視化 ¡  クエリログの木構造化 : QueryLogTree n  n  ¡  n  クエリログとはWeb検索に使用したクエリを時系列順に
 記録したもの クエリの関係をナビゲーション履歴を基に木構造で表現 ユーザ毎のQueryLogTreeを統合・共有 未探索領域の提示 ¡  未探索領域を表す語を検索しQueryLogTreeに追加
  5. 5. 探索領域 1) クエリ文字列としての探索領域 Q1 = 京都観光 金閣寺 Q2 = 京都観光 銀閣寺 本手法ではこの2つに着目 2) 話題としての探索領域 Q1が指す話題 Q2が指す話題 ユーザ間で探索話題が
 重ならないことが望ましい 3) Webページとして探索領域 Q1による検索結果 ユーザ間で同じページを
 閲覧しないことが望ましい Webページ Q2による検索結果
  6. 6. QueryLogTreeの例 探索領域を詳細化する場合 子として接続する 京都観光 topic topic 京都観光 金閣寺 京都観光 清水寺 同一領域の探索をtopicという 要素でグループ化 京都観光 銀閣寺 京都観光 慈照寺 雪景色 未探索領域を表す語を
 追加・提示
  7. 7. クエリ間の親子関係を発見1 n  n  クエリ中のキーワードの関係を利用 共通キーワードがある場合 ¡  ¡  「京都観光 金閣寺」は「京都観光」の子要素 「京都観光 金閣寺」と「京都観光 銀閣寺」は兄弟要素 京都観光 京都観光という話題を
 詳細化するクエリ 京都観光 金閣寺 話題を異なる方向に
 詳細化するクエリ 京都観光 金閣寺 京都観光 銀閣寺
  8. 8. クエリ間の親子関係を発見2 n  共通キーワードが無い場合 ¡  ¡  新しいクエリは今までの探索内容を反映 過去の探索に新しいクエリが含まれていれば
 その探索に関連があると判断 「広島 郷土料理」の検 索で閲覧したページ ・・・広島の郷土料理と しては牡蠣の土手鍋 が有名・・・ 「牡蠣の土手鍋」を検索 「牡蠣の土手鍋」は「広島 郷土料理」に関係がある
  9. 9. 同一領域探索のクエリ発見 n  同一領域を探索しているクエリの発見 ¡  サーチエンジンのインデックスを利用 n  n  n  「銀閣寺」と「慈照寺」が同一領域探索かの判定 「銀閣寺(慈照寺)」を検索 検索結果のサマリに「銀閣寺(慈照寺)」という
 フレーズが含まれるならば同一領域と判断 「慈照寺(銀閣寺)」を検索 ・・・慈照寺(銀閣寺)・・・ 慈照寺と銀閣寺は 同一領域の探索 「銀閣寺(慈照寺)」を検索 検索結果
  10. 10. 未探索領域の発見 n  グループ探索における2つのフェーズ ¡  ¡  n  探索領域を広げていく拡大フェーズ 探索領域を絞り深く探索する縮小フェーズ 拡大フェーズに対する未探索領域 ¡  大島ら[1]の同位語発見技術を利用 n  n  「郷土料理」から「特産品」「温泉」などを発見できる 縮小フェーズに対する未探索領域 ¡  野田ら[2]の話題語発見技術を利用 n  「銀閣寺」から「紅葉」「雪」などを発見できる 1: サーチエンジンのインデックスを利用した同位語検索と同位語コンテキストの発見 2: Web 検索結果のクラスタリングに用いる話題語の質問キーワードからの自動抽出
  11. 11. 実験 n  n  20~30クエリを用いてQueryLogTreeを作成 作成されたTreeがユーザの意図通りか? ¡  ¡  n  親子関係の判定・・・総クエリの85.3%正しく判定 同一領域クエリの判定・・・94.3%正しく判定 未探索領域の検索 ¡  拡大フェーズに対する未探索領域提示 n  ¡  75%が探索に関係し有益な未探索領域 縮小フェーズに対する未探索領域の提示 n  n  60%が現在の探索領域に含まれる話題 探索が深く詳細化していくと話題語が見つかりにくい
  12. 12. まとめと今後の課題 n  協調探索で探索領域が狭くなる問題 ¡  既探索領域と未探索領域を可視化することで支援 n  n  n  n  今後の課題 ¡  現在は探索している話題が重ならない為の支援 n  ¡  クエリはどのような話題の探索であるかを表している Webグラフとして重ならない為の支援も必要 n  Web検索に利用したクエリを木構造化 未探索領域を表す語も併せて提示 少ない情報でグループ探索の状態を俯瞰することが可能 異なる話題の探索でも同じページに辿り着くことがある
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×