Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ネットワークの特徴量で Twitter の
   友達リストを分析する

      Karubi Namuru
      Aug 22nd, 2010
自己紹介

●   Karubi Namuru
●   博士(理学)
●   Kauli 株式会社,代表
●   オンライン広告配信技術
●   Twitter: @karubi
●   Facebook: http://facebook.co...
学生時代の話


      ●   在学中の研究
          ●   統計的手法による日常行動分析
              –   実世界:ライフログ
              –   ウェブ:閲覧, clicks

200  ...
今日の内容

●   モチベーション
    ●   複数の方からグラフの話を聞きたいと DM が来た
    ●   初心者でも分かりやすい話がききたい
●   ネット上の資源で遊ぶ Part II
    ●   グラフの基礎
    ● ...
グラフの概要

●   ある対象について,関連する事柄や出来事の関
    係をあらわしたもの
●   数学的にはグラフ理論であつかわれている
数学的なグラフ

●   構成要素
    ●   ノード
        –   頂点や節点で表現できる
    ●   エッジ
        –   枝や辺で表現できる




                引用: http://ja....
辺の向き

●   問題によっては辺の向きを考慮する場合もあ
    ●   ノード同士の繋がりのみを考慮する
        –   →  向きが無いので「無向」
    ●   ノード同士について,どちらがどちらに繋がってい
       ...
グラフ構造

●   グラフをコンピュータで扱えるようにする
    ●   お絵かきした図については,人間が解釈できるがコ
        ンピュータが解釈できない表現
●   グラフ構造:データ構造としてグラフを表現
    ●   コンピ...
グラフ構造で記述できるもの

●   生活中のさまざまな自然現象
    ●   日常生活で形成した知り合いの関係
    ●   人の興味・嗜好と買い物の関係
    ●   目的地までの移動方法
●   インターネット内の現象
    ● ...
グラフ構造の分析

●   グラフ構造を処理することで問題を解決する
    ●   グラフ内の要素を分析する場合
        –   個々の頂点で,最も多くの辺が張られる頂点はどれか
    ●   グラフ同士を分析する場合
      ...
グラフの分析例


●   たとえば一筆書きの例
    ●   ケーニヒスベルクという大きな町
    ●   この町の中央にプレーゲル川という大きな川
    ●   七つの橋が架けられている
    ●   あるとき町の人が「この 7 つ...
グラフマイニング


●   主にグラフに埋もれた知識や知見を発見するた
    めのグラフ構造の分析
    ●   大量のデータ
    ●   データ構造
    ●   計算方法
    ●   豊富な計算能力
実際にマイニング


●   友達関係を分析してみる
    ●   問題
        –   自分の友達のなかで,注目に値する友達を誰か特定した
            い
    ●   たとえば,このように考えてみる
        ...
マイニングの一例




 参照: http://businessspeak.wordpress.com/2009/03/27/top-twitter-friends-map-brian-solis-pr-20
Karubi の考え


●   友達同士の繋がりに注目
    ●   注目に値する友達は,自分の知っている友達が多く
        友達関係をもちかけている人
    ●   もちろん友達関係をもちかけられる数が多ければ多
       ...
実際に分析してみる

●
    PageRank
    ●   考え方:論文の引用関係のように,重要なウェブ
        ページがリンクを集める
●   計算方法は割愛;;
    ●   ネットで調べればいくらでも出てきますよ
実際に分析してみる
まとめ


●   グラフマイニングの概要
●   Twitter の Following で実験
●   人選はランダムなので結果は気にしないで☆
●   ご質問ございましたらメールください
      gogokarubi@gmail.co...
Upcoming SlideShare
Loading in …5
×

ネットワークマイニング(グラフ構造分析)

4,311 views

Published on

Published in: Technology

ネットワークマイニング(グラフ構造分析)

  1. 1. ネットワークの特徴量で Twitter の 友達リストを分析する Karubi Namuru Aug 22nd, 2010
  2. 2. 自己紹介 ● Karubi Namuru ● 博士(理学) ● Kauli 株式会社,代表 ● オンライン広告配信技術 ● Twitter: @karubi ● Facebook: http://facebook.com/karubi ● 出身:広島 , 居住:東京 , Seongnam
  3. 3. 学生時代の話 ● 在学中の研究 ● 統計的手法による日常行動分析 – 実世界:ライフログ – ウェブ:閲覧, clicks 200 200 180 180 160 160 140 140 120 120 100 100 80 80 60 60 40 40 20 20 0 0
  4. 4. 今日の内容 ● モチベーション ● 複数の方からグラフの話を聞きたいと DM が来た ● 初心者でも分かりやすい話がききたい ● ネット上の資源で遊ぶ Part II ● グラフの基礎 ● 分析方法の紹介 ● 分析結果の一例
  5. 5. グラフの概要 ● ある対象について,関連する事柄や出来事の関 係をあらわしたもの ● 数学的にはグラフ理論であつかわれている
  6. 6. 数学的なグラフ ● 構成要素 ● ノード – 頂点や節点で表現できる ● エッジ – 枝や辺で表現できる 引用: http://ja.wikipedia.org/wiki/%E3%82%B0%E3%83%A9%E3%83%95%E7%90%86%E8%AB%96
  7. 7. 辺の向き ● 問題によっては辺の向きを考慮する場合もあ ● ノード同士の繋がりのみを考慮する – →  向きが無いので「無向」 ● ノード同士について,どちらがどちらに繋がってい るかどうかも考慮する – →  向きがあるので「有向」
  8. 8. グラフ構造 ● グラフをコンピュータで扱えるようにする ● お絵かきした図については,人間が解釈できるがコ ンピュータが解釈できない表現 ● グラフ構造:データ構造としてグラフを表現 ● コンピュータが解釈できる表現 ● 一定の形式を導入する ● データ処理をおこなう際に,もっともやりやすくす ることが目的(深い話につながるのでここまで)
  9. 9. グラフ構造で記述できるもの ● 生活中のさまざまな自然現象 ● 日常生活で形成した知り合いの関係 ● 人の興味・嗜好と買い物の関係 ● 目的地までの移動方法 ● インターネット内の現象 ● ウェブページ同士の繋がり ● ウェブページの HTML コンテンツの配置 ● 電子メールの送受信履歴
  10. 10. グラフ構造の分析 ● グラフ構造を処理することで問題を解決する ● グラフ内の要素を分析する場合 – 個々の頂点で,最も多くの辺が張られる頂点はどれか ● グラフ同士を分析する場合 – ふたつのグラフが似ているかどうか 引用: http://www.weblio.jp/content/%E4%B8%80%E7%AD%86%E6%9B%B8%E3%81%8D
  11. 11. グラフの分析例 ● たとえば一筆書きの例 ● ケーニヒスベルクという大きな町 ● この町の中央にプレーゲル川という大きな川 ● 七つの橋が架けられている ● あるとき町の人が「この 7 つの橋 を 2 度通らず,全て渡って,元の 所に帰ってくることができるか 引用: http://www.weblio.jp/content/%E4%B8%80%E7%AD%86%E6%9B%B8%E3%81%8D
  12. 12. グラフマイニング ● 主にグラフに埋もれた知識や知見を発見するた めのグラフ構造の分析 ● 大量のデータ ● データ構造 ● 計算方法 ● 豊富な計算能力
  13. 13. 実際にマイニング ● 友達関係を分析してみる ● 問題 – 自分の友達のなかで,注目に値する友達を誰か特定した い ● たとえば,このように考えてみる – もっとも話をする友達が一番注目に値する! ● TopTwitterFriend
  14. 14. マイニングの一例 参照: http://businessspeak.wordpress.com/2009/03/27/top-twitter-friends-map-brian-solis-pr-20
  15. 15. Karubi の考え ● 友達同士の繋がりに注目 ● 注目に値する友達は,自分の知っている友達が多く 友達関係をもちかけている人 ● もちろん友達関係をもちかけられる数が多ければ多 いほど,注目に値するのはないか ● ただし,一方的に見ず知らずの人でも,なんでもか んでも友人関係を大量にいろんな人にもちかけてい る人は注目に値しない
  16. 16. 実際に分析してみる ● PageRank ● 考え方:論文の引用関係のように,重要なウェブ ページがリンクを集める ● 計算方法は割愛;; ● ネットで調べればいくらでも出てきますよ
  17. 17. 実際に分析してみる
  18. 18. まとめ ● グラフマイニングの概要 ● Twitter の Following で実験 ● 人選はランダムなので結果は気にしないで☆ ● ご質問ございましたらメールください gogokarubi@gmail.com まで

×