Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

how to make twitter list automatically

3,813 views

Published on

how to make twitter list automatically

Published in: Technology
  • Login to see the comments

how to make twitter list automatically

  1. 1. Twitterにおける自動リスト作成 @mosa_siru12年11月29日木曜日
  2. 2. 目標 • Clusteringの手法を使って、Twitterにお けるリスト作成を自動化 • リスト:友人の中で特に見たい人をグループにして閲覧する機能 • 「サークルの友人リスト」などを自動的に作成したい • 各リスト(以下module)はオーバーラップ • 例:大学の友人,サークルの友人の両方に属する人が存在12年11月29日木曜日
  3. 3. ソーシャルグラフとしての Twitter • ユーザーをNode、フォロー関係を Edgeとして有向グラフで表す • 自己ループやMultiple Edgeは存在しな いが、Double Edge( )は存在する12年11月29日木曜日
  4. 4. 手法 • Clique Percolation Method (CPM) • Gergely Palla, Imre Der´enyi, Ill´es Farkas, and Tam´as Vicsek (2005) Nature 435,814 • k-clique(完全グラフ)を繋げたものを1つ のmodule(k-cliques)とする12年11月29日木曜日
  5. 5. CPM 以下k=4とする12年11月29日木曜日
  6. 6. CPM (1)k-cliqueを見 つける12年11月29日木曜日
  7. 7. CPM (2)k-1個のnodeを 共有した、k-clique を見つける12年11月29日木曜日
  8. 8. (3)これを繰り返 CPM し、探索が終わり 訪れたnodeを 1moduleとする12年11月29日木曜日
  9. 9. CPM (4)複数のmoduleを 作ると、重複する12年11月29日木曜日
  10. 10. CPMの特徴 • 条件の厳しさや各moduleの大きさを、k を変化させることで調整できる • 他の手法と違い、local情報のみ必要 • global情報を取れない今回のデータにマッチ • あるmoduleに他のmoduleが影響すること はない12年11月29日木曜日
  11. 11. CPM kを小さくすると、条件が緩くなりmoduleが 大きくなる。 (例:k=3)12年11月29日木曜日
  12. 12. CPMd • 有向グラフのCPM • Gergely Palla, Illés J Farkas, Péter Pollner, Imre Derényi and Tamás Vicsek (2007) Physica A 387, 4959 • k-cliqueの定義を「 ループが存在しない ようなk-clique」とした上でのCPM12年11月29日木曜日
  13. 13. k-clique (CPMd) 4-cliqueである 4-cliqueでない ループがない ループがある12年11月29日木曜日
  14. 14. データ • フォロー関係をTwitter APIで取得 • 使い方は記事にまとめた http://goo.gl/ uHJX2 • 1時間に350Requestしか送れない! • つまり350nodesのedge情報しか取れない12年11月29日木曜日
  15. 15. 現状 • 自分@mosa_siruから2歩分のEdgeと1歩分の ユーザー情報を取得 • 802nodes, 510000edges • このデータではCPMdが終わらなかった • 非常に密で、kを大きくしないと有意なmodule分類が得られない が、大きなk-clique同定は計算量が大きいため? • ↔のみを抜き出した無向グラフでのCPMは計 算できた12年11月29日木曜日
  16. 16. 元の有向グラフ(非常に密)12年11月29日木曜日
  17. 17. のみを抜き出した 無向グラフ12年11月29日木曜日
  18. 18. 中高 計数 ネット友人2 ネット友人1 サークル 競技プログラミング CPM結果 (k=9にて7modules)12年11月29日木曜日
  19. 19. 展望 • API制限のため、逐次的にデータを取りたい • 初期ノード集合を与え、それらが属する1つの moduleを返す実装を考える • 例:サークルの友人3人から、サークル集合のリストを返す • 不要な枝情報を得ないことでAPI制限を回避 • 一応データが貰えないかTwitter社に打診中(返 信待ち)12年11月29日木曜日
  20. 20. me 例 k=4とする 初期ノードを3つ指定する12年11月29日木曜日
  21. 21. me 初期ノードから APIより枝情報を取得する12年11月29日木曜日
  22. 22. me k-cliqueを1つ選ぶ12年11月29日木曜日
  23. 23. 次はこのノードから 枝情報を取得する me 隣接したk-cliqueを探す moduleの新ノードの枝情報を取得し、新 たなk-cliqueを探す 以下繰り返し12年11月29日木曜日

×