IIR 21 Link Analysis

2,996 views
2,923 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,996
On SlideShare
0
From Embeds
0
Number of Embeds
2,035
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

IIR 21 Link Analysis

  1. 1. IIR21 Link analysis @KazkiMatz
  2. 2. • 21.1 Webのグラフ構造解析 – 21.1.1 アンカーテキスト重要 • 「ココをクリック」問題 – 頻出語にはペナルティを。 – アンカーテキストの拡大 • “evil empire”問題 – スパム対策が必要
  3. 3. • 21.2 PageRank – リンク構造解析 – 全てのWebページに[0,1)のスコア – ページ滞在確率 • ランダムウォーク – テレポート
  4. 4. • 21.2.1 マルコフ連鎖 – 任意時点での推移確率を以下の行列で 表す A B C Next status A  0 0.5 0.5    N i,  Pij  1 B 1 0 0  j 1 1 C  0  0  Current status
  5. 5. • 21.2.2 PageRankの算出 – Ergodic Markov chain – 極限 → 定常状態確率 → PageRank  P   1 定常状態確率
  6. 6. • 21.2.3 PageRankのユーザカスタマイズ – ユーザごとに推移確率行列を作り、定常 状態確率を求めるのは非現実的 • ベース確率分布 + トピック特化確率分 布の線形結合として算出
  7. 7. 21.3 Hubs and Authorities• 「IBM問題」への対処法
  8. 8. 21.3 Hubs and Authorities Hubs Authorities
  9. 9. 21.3 Hubs and Authorities h(υ) = Σa y0 a (y0) υ a (y1) y1 a (y2) y2 Hubs Authorities
  10. 10. 21.3 Hubs and Authorities a(υ) = Σh y0 h (y0) υ h (y1) y1 h (y2) y2 Hubs Authorities
  11. 11. 21.3 Hubs and AuthoritiesHITS(Hyperlink-Induced Topic Search)1. h(υ) = a(υ) = 12. 定常スコアの算出は固有ベクトルの算出と等価
  12. 12. 以上

×