More Related Content
PDF
Yahoo!関連検索ワードAPIが8/14の終了前に実践すべき事 PDF
最愛の推しを錬成するためとあるヲタクが果て無き荒野に挑んだ件 PDF
ソーシャルメディア大百科川井パート(ファンドレイジングセミナー2012より) PDF
PPTX
Twitterのつぶやきで明日の自分のご機嫌を予測してみる PPTX
PDF
PPTX
[Anitech] ITでアニメを考える、「ShangriLa Meetup5」 Similar to Tokyo webmining5
PDF
国会議員に聞いてみよう!原発どうする? 神戸ミーティング PDF
参院選予測2022 自民党360万回と立憲595万回のTwitterビッグデータ解析 PPTX
PDF
PDF
PDF
PPTX
PDF
PDF
PDF
KEY
PPTX
「2017年の目標と運営方針」を議論するための「2016年の振り返り」 PDF
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係― PDF
More from osamu morimoto
PPTX
PDF
ODP
PDF
PDF
Tokyo.R #22 Association Rules PDF
Tokyo r 11_self_organizing_map PDF
Tokyo.R8 brand positioning 2010.08.28. PDF
PDF
PDF
tokyo webmining3 2010.04.17. Tokyo webmining5
- 1.
- 2.
自己紹介
● 【はてな】 id:bob3
● 【 Twitter 】 @bob3bob3
●
バリバリの文系です。
● 仕事はマーケティング・リサーチャー。
●
本日のお話はまるっきり“お遊び”です。
- 3.
動機
● “ R”とはオープンソースの統計解析ツール。
● Rの“ twitteR” パッケージが面白い!
●
Twitter API 経由で直接 R に情報を取り込める。
● グラフ理論を扱う“ igraph” パッケージと組み合わ
せれば
- 4.
先行事例
「 iGraph でTwitter のネットワークを表してみ 「 twitter's social network analysis
る」 ( Tsukuba.R#4 )」
<http://d.hatena.ne.jp/syou6162/20071115/119507 <http://www.slideshare.net/guest91c5ac/twitters-
6286> social-network-analysis>
※ データの抽出には Perl を使っている。 ※ 「お気に入り」登録に注目してクラスタリン
グ。
★ twitteR を使えば、情報の収集から分析まで R で完結させられるんじゃないか?
- 5.
- 6.
今回のタネ
● Twitter アカウントを持つ国会議員。
●
ただし、 TwitterAPI の制限のため、フォロー先が 100 未
満の人に絞る。
●
TwitterAPI の制限
– リクエストできるのは1時間に 150 回まで。
– 取得できるフォロー先のリストは最新 100 アカウントまで。
●
コードはブログに載せておきました。
● http://d.hatena.ne.jp/bob3/20100619
- 7.
使ったアカウントのリスト
jimin_koho # 自民党広報 miekondotcom # 中林美恵子 ( 民主 ) GOGOdai5 # 松浦大悟 ( 民主 )
komei_koho # 公明党広報 oniken0024 # 大西健介 ( 民主 ) Y_Kaneko # 金子洋一 ( 民主 )
your_party # みんなの党広報 yo_ishida # 石田芳弘 ( 民主 ) fujimoto_yuuji # 藤本祐司 ( 民主 )
Tanigaki_S # 谷垣禎一 ( 自民 ) yamanoikazunori # 山井和則 ( 民主 ) kunivoice # 谷岡郁子 ( 民主 )
tadamori_oshima # 大島理森 ( 自民 ) takashinagao # 長尾敬 ( 民主 ) k_maekawa # 前川清成 ( 民主 )
TAIRAMASAAKI # 平将明 ( 自民 ) Kumaatsu # 熊田篤嗣 ( 民主 )
inuzuka2010 # 犬塚直史 ( 民主 )
AkiraNishino # 西野陽 ( 自民 ) otaninobumori # 大谷信盛 ( 民主 )
izki_toyama # 外山斎 ( 民主 )
junmatsumoto411 # 松本純 ( 自民 ) okadayasuhiro # 岡田康裕 ( 民主 )
odachi_moto # 尾立源幸 ( 民主 )
akibakenya # 秋葉賢也 ( 自民 ) takasho624 # 高橋昭一 ( 民主 )
hirayamamakoto # 平山誠(新党日本)
ohmura_hideaki # 大村秀章 ( 自民 ) toshiro141 # 石井登志郎 ( 民主 )
HideoYoshiizumi # 吉泉秀男(社民)
akimoto_tsukasa # 秋元司 ( 自民 ) Sakaguchi_Naoto # 阪口直人 ( 民主 )
hattori_ryoichi # 服部良一(社民)
SatoMasahisa # 佐藤正久 ( 自民 ) yunoki_m # 柚木道義 ( 民主 )
edaoffice # 江田憲司(みんな)
kandorishinobu # 神取忍 ( 自民 ) tamakiyuichiro # 玉木雄一郎 ( 民主 )
kiyohiko_toyama # 遠山清彦(公明)
maruyamakun # 丸山和也 ( 自民 ) nagaetakako # 永江孝子 ( 民主 )
Noriko_Furuya # 古屋 範子(公明)
shiba_masa # 柴山昌彦 ( 自民 ) fukken01 # 福嶋健一郎 ( 民主 )
abetoshiko # 阿部俊子 ( 自民 ) grazie4812 # 磯谷香代子 ( 民主 )
以上 50 アカウント
kushibuchi # 櫛渕万里 ( 民主 ) imai_masato # 今井雅人 ( 民主 )
yokokume # 横粂勝仁 ( 民主 ) fujitadaisuke # 藤田大助 ( 民主 )
- 8.
- 9.
- 10.
- 11.
Modularity Q でクラスタリング
● 「クラスタに含まれているエッジの割合が、ク
ラスタから出ているエッジの割合よりもどれだ
け大きいか」ということと「グラフが適度に分
割されているか」ということのトレードオフの
値が Modularity Q 。
● Q が最大になる分割が適切と推測されるクラス
タリング。
● 詳しくは以下の資料などを参照してください。
● http://ymatsuo.com/surveySNA/shibata.pdf
- 12.
- 13.
今後やってみたいこと
● Reply や Re-Tweet でエッジの重み付け。
● Tweet の内容も考慮したクラスタリング