Rindokukai suzuki
- 1. RaRE: Social Rank Regulated
Large-scale Network Embedding
Yupeng Gu, Yizhou Sun, Yanen Li and Yang Yang
WWW ‘18
鈴木杏理
- 4. RaRE : base model
G = (V, E) eij : ui → uj
latent proximity-based representation : zv
latent rank representation : rv
• proximityもsocial rankも差が重要
dz = ||zi – zj||2
dr = ri – rj
- 5. RaRE : conditional distributions
• drもdzも正規分布に従うと仮定
μh(dz) : あるdzにおけるdrの平均
Is(x) : x ∈ Sなら1、そうでなければ0
μ : スケール調整
- 11. 実験 : データセット
• データセット
①スナチャ(フレンド)
②ウェイボ(RT)
2011/11/01の全RT(5RT以上)
③コンピュータサイエンスにおける引用ネットワーク
2007-2016の10年分
分野はAI,NET,SE,CT,CV,DB,PL,DM
④wikipediaのハイパーリンク
sports, politics, science, Christian, geography, musician
⑤wikipediaのクリックストリーム
2017年1月
どのページからどのページへ飛んだか
- 13. 実験 : 分類①
• MF(matrix factorization)
• GF(graph factorization)
• LINE(large scale network embedding)
• Node2vec
比較の公平性のためzのみ用いる
CBM(Conditional Bernoulli Mixtures)で分類
- 16. 実験 : リンク予測
• 評価指標 : AUC
• スナチャとウェイボ、wikiハイパーリンクは精度良い
→social rankの影響大きい?
- 17. 実験 : 分類②
• スナチャの性別推定
→今まではGradient Boost Decision Tree
精度93.5%
名前、国、今までのスナチャの使い方
• エンベッディング結果を加えると・・・
- 20. まとめ
• RaRE(Social Rank Regulated Network emvedding)
・proximity-based representation
・social rank representation
→分類やリンク予測で大きな効果
→リンクは近さだけでは説明できない