More Related Content Similar to twitter's social network analysis (20) twitter's social network analysis1. Rでtwitterのクラスタを
あぶりだしてみた
favorite機能による重み付きグラフ構造を用いた
twitterの社会ネットワーク分析
Tsukuba.R#4
@y_benjo
2. 自己紹介
• twitter id : y_benjo
• hatena id : repose
– http://d.hatena.ne.jp/repose
• 春から院生
• 専門とか特にない
20. 構想(2)
• クラスタリングはハードクラスタリング
を
– ユーザがひとつのクラスタにのみ分割される
– 「俺はつくばクラスタで変態クラスタだな」
などというクラスタリングは無し
– フゔジゖクラスタリングだとクラスタの重複
が可能だが、触ったことが無いので
30. 社会ネットワーク分析
• A Clauset, MEJ Newman, C Moore:
– Finding community structure in very large
networks (2004)
• J. Duch and A. Arenas:
– Community detection in complex
networks using extremal optimization
(2005)
• ここらへんを試してみる
33. 少し考える
• ゕルゴリズムの
はO(N^2ln^2)
• ユーザごとの重
みの総和を図に
してみても、
5000id全て計算
するのは無駄っ
ぽそう…
– とりあえず329
人分
38. 変態クラスタ(最大、90user)
GUMIMI, HOJ, Hajimepg, Palpha,
SAN_Morishi, Sebastianus, TEtra11, Toyolina,
GUMIMI Wing_of_Blood, aki426, aorenjar, bombtter,
camelletgo, ch1haya, chap_py, chcbigz, chief_szk,
choconono, cress_cc, emakko, enpitsu, evil07,
f_jiro, fortunathefate, fune, garandou, gokujo,
zeppel ha_ma, ha_ru_ka, halciondaze, hazime1373,
hetaremozu, hironao, itati0, k_katsura,kaiware007
kazusap, kek_kuten, konaken, koukai, kuroreva,
kuzu_doh, kyabesuke, lakililac, llcheesell, lolipuni,
m_soba, masumizaru, meba, migelfutosi,
mio_sakamoto, miru, myu65, mywalrus, nekocafe,
Hajimepg ni_no_, nisenisetila, nurutema, ocha39, onicks2,
ooabikoo, p_n_y, poyow, purelightway, ragusk,
rarihoma, rokudenashi, ruehaduki, sakakiyu,
sayn0, shitu, shy_azusa, sio_halfmoon, suiginex,
suiginth, syochin, syounenX, tato256, tc_501, ukix,
wakatter, xmmm, y883, ycums, ykzts, yteppei,
yumeka_, zeppel, zero_zaki_,
39. ITっぽいクラスタ(60user)
Ett, KIMAGURE, VoQn, a_dach, bambico,
bulkneets, chrcc, deadpop, eigokun,enraku
bulkneets error403, fkgw, fuba, fuba_recorder,
hajime, harsch, hazy_moon, hironica,
hoge_systemz, irm_fyuk, isbsh, jazzanova,
kotoriko jinon, kagawa, kanamoken, kkshow,
kotoriko, kudan_, kusigahama, kyoujin,
lalha, m0h1can, marco11, mayutan,
morygonzalez, nancii, natant12, nipotan,
oquno, penguinana, pha, placebogirl,
yuiseki sachi_volta, saeko, saetomin, send_, slyl,
snoa, todesking, toriko, totoon, ugnews,
umelabo, wazurai, wyinoue, y_benjo,
yodaka, youpy, yuiseki,
40. ハチロククラスタ(11user)
Misho
Misho, T_Hash,
hayamiz, kaeru_san,
kaeru_san
limitusus, mickey24,
natsutan, sak65536,
syou6162, tencube,
T_hash
41. 評論?クラスタ(8user)
hanemimi
esehara, hanemimi,
kanose kanose, kisoem,
matakimika, okadaic,
tsuda, wideangle,
wideangle
42. 補足
• その他のクラスタは1~4人で構成される
ものが多い
– クラスタの構成userを見てみると、ある程度
妥当性がありそうな面子が
• クラスター分析全般に言えることですが、
これが絶対的な分割ではない
– fav情報のみで行っているという事を忘れずに
43. 結論
• 結構それっぽい感じで抽出できたと思う
– 今回は小規模だったが、極端な話5000user
で計算しても同様のクラスタが得られるので、
そう考えると面白いんじゃないかと
• 欠点:計算時間かかりすぎ
– 行列計算が楽なだけでRでやる必要があまり
ない
– 定期的にクロールさせてクラスタの状況を更
新していく、とかさせてみたい……
44. ありがとうございました
使用環境:R, Ruby, Meadow (ruby-mode ,ESS)
参考文献
:Finding community structure in very large networks (2004)
:Community detection in complex networks using extremal
optimization (2005)