論文紹介:Automated Classification of Model Errors on ImageNet
Mining of Massive Datasets Chapter5: Link Analysis
1. Mining of Massive Datasets
Chapter 5: Link Analysis
Recruit Communications Co., Ltd.
Kenji Hayashida
2. Early Search Engine and
Term Spam
• Google以前の検索エンジンはクエリ内のtermを多く
含むページを重要視していた
• 背景色と同色で”映画”と1000回書いておくと、”映画
”に関する重要なページとみなされていた
• ページ間のリンク情報をもとに重要度を計算する
PageRankが誕生
3. Definition of PageRank
Random Surfer Model
- あるページからリンク先のページに同確率で遷移する
- より多く訪問したページほど重要なページとみなす
AからはB,C,Dにそれぞれ1/3の確率で遷移
無限回遷移を繰り返すと、どのページをどれくらい訪問する?
(“Mining of Massive Datasets”より引用)