Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
今そこにある呟きTwitterからのリアルタイムなイベント抽出及び応用アプリケーションについて<br />榊 剛史@tksakaki      松尾 豊@ymatsuo<br />東京大学 松尾研究室<br />
軽く自己紹介<br />東京大学 松尾研究室 博士課程1年<br />株式会社 ホットリンク 特任研究員<br />以前は、東京電力で電柱昇ったりしてました。<br />Twitter上で、よく教授と間違われます。<br />海外でも間違えられ...
今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter に...
今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter に...
Twitterにおける「今」と「どこ」<br />Twitterにおける「今」の重要性<br />ニュースサイト<br />ツイちぇき!!<br />Buzztter<br />TV見ながらTweet<br />TVzin<br />フォロワー...
Twitterにおける「今」と「どこ」<br />Twitterにおける「今」の重要性<br />ニュースサイト<br />Buzztter<br />TV見ながらTweet<br />TVzin<br />フォロワーの行動<br />今何が起...
Twitterにおける「今」と「どこ」<br />Twitterにおける「今」の重要性<br />ニュースサイト<br />Buzztter<br />TV見ながらTweet<br />TVzin<br />フォロワーの行動<br />今何が起...
リアルタイム性と位置情報を利用した使い方<br />地震の発生と震源地を知る<br />天体現象を知る<br />ゲリラ豪雨<br />虹<br />朝の電車遅延情報<br />Twitterにおける「今」と「どこ」<br />
リアルタイム性と位置情報を利用した使い方<br />地震の発生と震源地を知る<br />天体現象を知る<br />ゲリラ豪雨<br />虹<br />朝の電車遅延情報<br />Twitterにおける「今」と「どこ」<br />リアルな世界で<...
Twitterにおける「今」と「どこ」<br />「今」と「どこ」を利用したアプリケーション<br />Torretter :地震検出システム<br />時間的な近さから同じ地震であることを同定<br />Geolocation情報、ユーザーの...
今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter に...
アプローチ<br />「地震」「揺れた」を含むTweetから<br />地震直後に呟いたTweetのみを抽出<br />Twitterユーザーをセンサーと捉えて<br />地震検出・震源地推定<br />
ポイント1<br />機械学習で<br />「地震」「揺れた」を含むTweetから<br />地震直後に呟いたTweetのみを抽出<br />
ポイント1<br />□地震直後につぶやいた呟き<br />揺れた!<br />こえ~~<br />地震だ!!<br />地震!?<br />地震!<br />びびったー<br />□その他のつぶやいた呟き<br />今更、何故「鍋焼きうどん」...
ポイント1<br />□地震直後につぶやいた呟き<br />揺れた!<br />こえ~~<br />地震だ!!<br />地震!?<br />地震!<br />びびったー<br />□その他のつぶやいた呟き<br />今更、何故「鍋焼きうどん」...
ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震...
ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震...
ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震...
ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Support Vector<br />Machine<br />=機械学習の手法<br />Twitter se...
ターゲットとするイベントに関するキーワードを含むTweetを抽出<br />地震の場合<br />「揺れた」「地震」<br />虹の場合<br />「虹」<br />収集したTweetを正解と不正解に分類-> 学習データ<br />例:<br ...
ポイント1~詳細説明<br />ターゲットイベント用Tweets分類器作成<br />収集した学習データを利用<br />学習手法:Support Vector Machine<br />使用した特徴量(例文:やばい、地震きた!)<br />統...
アプローチ<br />「地震」「揺れた」を含むTweetから<br />地震直後に呟いたTweetのみを抽出<br />Twitterユーザーをセンサーと捉えて<br />地震検出・震源地推定<br />
ポイント2<br />Twitterユーザーをセンサーと捉えて<br />地震検出・震源地推定<br />
ポイント2~説明<br />Twitterからのイベント検出<br />センサーによるイベント検出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br /...
ポイント2~説明<br />Twitterからのイベント検出<br />センサーによるイベント検出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br /...
ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />・・・<br />呟き分類器<br />・・・<br />・・...
ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />twe...
ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震を検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分...
ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震を検出<br />地震センサーが地震を検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br /...
ポイント2~説明<br />Twitterからのイベント検出<br />センサーによるイベント検出<br />地震を検出<br />地震センサーが地震を検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br /...
ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震を検出<br />地震を検出<br />地震センサーが地震に反応<br />地震に関する呟きを抽出<br />確率モデル<br /...
ポイント2~詳細説明<br />実際には確率モデルを使用して検出<br />Twitterユーザーをセンサーを考えると、ノイズが多く、また誤検出もあり得る<br />1つのTweetだけでは、イベントが起きたとは判定できない<br />->時系...
ポイント2~詳細説明~時系列モデル<br />
ポイント2~詳細説明~時系列モデル<br />
ポイント2~詳細説明~時系列モデル<br />
ポイント2~詳細説明~時系列モデル<br />
ポイント2~詳細説明~時系列モデル<br />
ポイント2~詳細説明~時系列モデル<br />
ポイント2~詳細説明~時系列モデル<br />観測データを指数関数にフィッティング<br />ターゲットイベントの発生判定を、指数分布に基づいて確率的に算出<br />
ポイント2~詳細説明~空間モデル<br />ターゲットイベントの発生場所の確率分布を算出<br />センサーによる位置推定に使われるベイズフィルタを利用<br />カルマンフィルタ<br />パーティクルフィルタ<br />
ポイント2~詳細説明~空間モデル<br />カルマンフィルタ<br />ベイズフィルタとして最もよく使われている手法<br />長所計算が速い<br />短所適用対象が、高精度かつ計測間隔の短い<br />            センサーに限ら...
ポイント2~詳細説明~空間モデル<br />パーティクルフィルタ(粒子フィルタ)<br />確率分布をparticle=粒子の集合でシミュレートする手法<br />長所さまざまな確率分布に適用可能<br />短所高次元なデータを用いた予測には適...
検出の精度<br />どのくらいの精度で検出できたのか?<br />
地震自体の検出結果<br />期間:		 2009年8月 – 2009年9月<br />収集したTweet数:	49,314tweets<br />利用したTweet数: 	6291 tweets by 4218 users<br />震度3以...
震源地予測結果<br />Kyoto<br />Tokyo<br />予測震源地<br />(提案)<br />Osaka<br />実際の震源地<br />風船:呟きの位置<br />色:呟き時刻<br />
台風の進路予測<br />実際の経路<br />予測経路<br />(Particle Filter)<br />
問題点<br />地震検出の精度・位置推定の精度が<br />Twitterユーザーの多い地域>少ない地域<br />震源地が海だと予測できない<br />
今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter に...
Twitter上でのイベント情報の伝播<br />調査の発端<br />センサーによる観測手法<br />->センサー同士が影響しないことが前提<br />-> Twitterユーザー同士は影響を及ぼしてしまうのではないか?<br />2種類の...
2種類の情報伝播ネットワークを定義<br />フォロワーネットワーク<br />Retweetネットワーク<br />Twitter上でのイベント情報の伝播<br />ユーザーA<br />ユーザーB<br />follow<br />user...
突発的に発生するイベントの情報伝播<br />フォロワーネットワークの密度:普通<br />Retweetネットワーク:中心性の高いユーザーがいない<br />フォロワーネットワーク 台風<br />Retweetネットワーク 台風<br />
突発的に発生するイベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />Rpagerankv.s. Rbetween<br />
突発的に発生するイベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />Rpagerankv.s. Rbetween<br />
突発的に発生するイベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />Rpagerankv.s. Rbetween<br />地震<br />台風<br />地震<br />
学会/研究会イベントの情報伝播<br /><ul><li>フォロワーネットワークの密度が高い
RTネットワークの密度が高い</li></ul>フォロワーネットワーク<br />WI2<br />Retweet ネットワーク<br />WI2<br />
学会/研究会イベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />ネットワーク密度<br />
学会/研究会イベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />ネットワーク密度<br />
学会/研究会イベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />ネットワーク密度<br />
Twitter上でのイベント情報の伝播<br />Conference Events<br />他のイベントと比べ、フォロワーネットワークの密度が高い<br />Retweetも発生しやすい<br />-> 情報伝播が発生しやすいイベント<br...
今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter に...
地震速報システム Toretter<br />
虹出現お知らせシステム Nijitter<br />
芸能人を目撃せよ CelebPaparazzi(作成中)<br />
芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />
芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇のちゃちゃちゃチャンスですよ!w 。<br />
芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />フジテレビ内のローソンでとんちゃんとフォンチーを見かけたよ。<br />いま伊集院光氏が秋葉原うろうろしてるみ...
芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />フジテレビ内のローソンでとんちゃんとフォンチーを見かけたよ。<br />いま伊集院光氏が秋葉原うろうろしてるみ...
芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />フジテレビ内のローソンでとんちゃんとフォンチーを見かけたよ。<br />楳図かずおさん見かけた@吉祥寺。 赤と...
芸能人を目撃せよ CelebPaparazzi(作成中)<br />実際の仕組み<br />「発見」「遭遇」などを含むTweetを収集<br />有名人の人名が含まれてるTweetを抽出<br />Wikipedia等から収集した人物名リストを...
その他作りたいアプリ(計画&妄想)<br />計画中<br />電車遅延情報お知らせシステム(メールも配信)<br />渋滞情報表示システム<br />妄想<br />なんでもイベント判別器作成システム<br />正解データ/不正解データをユー...
まとめ<br />高い精度でイベント検出可能<br />ある程度の位置推定も可能<br />イベントごとの情報伝播の違いを検証<br />様々なイベント抽出サイトを作成<br />他のリアルタイムなイベントに応用可能<br />  例:電車遅延...
おしまい<br />@tksakaki<br />
位置情報推定の精度<br />地震<br />緯度・経度の最小2乗誤差<br />Particle filters works better than other methods<br />
Upcoming SlideShare
Loading in …5
×

Twitter研究会 事前資料_東大榊

2,983 views

Published on

第2回Twitter研究会の事前アップロード資料です。
本番の資料もこちらのアドレスにアップロードします。

Published in: Technology
  • Be the first to comment

Twitter研究会 事前資料_東大榊

  1. 1. 今そこにある呟きTwitterからのリアルタイムなイベント抽出及び応用アプリケーションについて<br />榊 剛史@tksakaki    松尾 豊@ymatsuo<br />東京大学 松尾研究室<br />
  2. 2. 軽く自己紹介<br />東京大学 松尾研究室 博士課程1年<br />株式会社 ホットリンク 特任研究員<br />以前は、東京電力で電柱昇ったりしてました。<br />Twitter上で、よく教授と間違われます。<br />海外でも間違えられてた・・・・<br />↑ウェブ学会のところ<br />↑口コミ係長のところ<br />
  3. 3. 今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter による位置推定<br />Twitter上でのリアルタイム情報伝播の特徴<br />イベント種類による情報伝播の特性<br />リアルタイムイベント抽出 応用システム<br />にじったー/Toretter<br />電車遅延抽出/渋滞抽出<br />Celeb Paparazzi(仮)<br />
  4. 4. 今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter による位置推定<br />Twitter上でのリアルタイム情報伝播の特徴<br />イベント種類による情報伝播の特性<br />リアルタイムイベント抽出 応用システム<br />にじったー/Toretter<br />電車遅延抽出/渋滞抽出<br />Celeb Paparazzi(仮)<br />
  5. 5. Twitterにおける「今」と「どこ」<br />Twitterにおける「今」の重要性<br />ニュースサイト<br />ツイちぇき!!<br />Buzztter<br />TV見ながらTweet<br />TVzin<br />フォロワーの行動<br />
  6. 6. Twitterにおける「今」と「どこ」<br />Twitterにおける「今」の重要性<br />ニュースサイト<br />Buzztter<br />TV見ながらTweet<br />TVzin<br />フォロワーの行動<br />今何が起きているかが分かる<br />
  7. 7. Twitterにおける「今」と「どこ」<br />Twitterにおける「今」の重要性<br />ニュースサイト<br />Buzztter<br />TV見ながらTweet<br />TVzin<br />フォロワーの行動<br />今何が起きているかが分かる<br />他人が何をしているかが分かる<br />
  8. 8. リアルタイム性と位置情報を利用した使い方<br />地震の発生と震源地を知る<br />天体現象を知る<br />ゲリラ豪雨<br />虹<br />朝の電車遅延情報<br />Twitterにおける「今」と「どこ」<br />
  9. 9. リアルタイム性と位置情報を利用した使い方<br />地震の発生と震源地を知る<br />天体現象を知る<br />ゲリラ豪雨<br />虹<br />朝の電車遅延情報<br />Twitterにおける「今」と「どこ」<br />リアルな世界で<br />「今」「そこで」何かが起きているのが分かる<br />
  10. 10. Twitterにおける「今」と「どこ」<br />「今」と「どこ」を利用したアプリケーション<br />Torretter :地震検出システム<br />時間的な近さから同じ地震であることを同定<br />Geolocation情報、ユーザーのプロフィールの場所情報を利用して、震源地を推定する(未実装)<br />Nijitter:虹検出システム<br />時間的な近さとTweet数から虹が出ていることを同定<br />位置情報をもとに、虹が出ていると思われる場所に虹を表示<br />本日はこの仕組みについて説明<br />サンプル:地震<br />
  11. 11. 今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter による位置推定<br />Twitter上でのリアルタイム情報伝播の特徴<br />イベント種類による情報伝播の特性<br />リアルタイムイベント抽出 応用システム<br />にじったー/Toretter<br />電車遅延抽出/渋滞抽出<br />Celeb Paparazzi(仮)<br />
  12. 12. アプローチ<br />「地震」「揺れた」を含むTweetから<br />地震直後に呟いたTweetのみを抽出<br />Twitterユーザーをセンサーと捉えて<br />地震検出・震源地推定<br />
  13. 13. ポイント1<br />機械学習で<br />「地震」「揺れた」を含むTweetから<br />地震直後に呟いたTweetのみを抽出<br />
  14. 14. ポイント1<br />□地震直後につぶやいた呟き<br />揺れた!<br />こえ~~<br />地震だ!!<br />地震!?<br />地震!<br />びびったー<br />□その他のつぶやいた呟き<br />今更、何故「鍋焼きうどん」買うの! こんなに沢山?!地震に供えて?<br />十年後って、自分が生きてる保証も無いですよね。 地震とか、戦争とかもわからんし・・・?<br />
  15. 15. ポイント1<br />□地震直後につぶやいた呟き<br />揺れた!<br />こえ~~<br />地震だ!!<br />地震!?<br />地震!<br />びびったー<br />□その他のつぶやいた呟き<br />今更、何故「鍋焼きうどん」買うの! こんなに沢山?!地震に供えて?<br />十年後って、自分が生きてる保証も無いですよね。 地震とか、戦争とかもわからんし・・・?<br />
  16. 16. ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震」<br />「揺れた」<br />提案システム<br />Tweetクローラー<br />テキスト分析器<br />データベース<br />Mecab<br />SVM<br />
  17. 17. ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震」<br />「揺れた」<br />提案システム<br />Tweetクローラー<br />テキスト分析器<br />データベース<br />Mecab<br />SVM<br />
  18. 18. ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震」<br />「揺れた」<br />提案システム<br />Tweetクローラー<br />テキスト分析器<br />データベース<br />Mecab<br />SVM<br />
  19. 19. ポイント1~説明<br />Tweet<br />Tweet<br />Tweet<br />Tweet<br />…<br />Support Vector<br />Machine<br />=機械学習の手法<br />Twitter search API<br />検索<br />キーワードを<br />含む呟き<br />「地震」<br />「揺れた」<br />提案システム<br />Tweetクローラー<br />テキスト分析器<br />データベース<br />Mecab<br />SVM<br />地震に関する呟きのみ抽出<br />
  20. 20. ターゲットとするイベントに関するキーワードを含むTweetを抽出<br />地震の場合<br />「揺れた」「地震」<br />虹の場合<br />「虹」<br />収集したTweetを正解と不正解に分類-> 学習データ<br />例:<br />「地震だ!!」 --正解<br />「地震が多い国って、日本だけじゃないんだよな・・・」 --不正解<br />ポイント1~詳細説明<br />
  21. 21. ポイント1~詳細説明<br />ターゲットイベント用Tweets分類器作成<br />収集した学習データを利用<br />学習手法:Support Vector Machine<br />使用した特徴量(例文:やばい、地震きた!)<br />統計量(3語、2番目)<br /> Tweetsが全部で何語か?また、キーワードは何番目か?<br />キーワード( やばい、地震、くる)<br /> Tweets中に含まれている全ての語<br />キーワード文脈情報(やばい、くる)<br />キーワードの前後に出現する語<br />
  22. 22. アプローチ<br />「地震」「揺れた」を含むTweetから<br />地震直後に呟いたTweetのみを抽出<br />Twitterユーザーをセンサーと捉えて<br />地震検出・震源地推定<br />
  23. 23. ポイント2<br />Twitterユーザーをセンサーと捉えて<br />地震検出・震源地推定<br />
  24. 24. ポイント2~説明<br />Twitterからのイベント検出<br />センサーによるイベント検出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />・・・<br />・・・<br />・・・<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  25. 25. ポイント2~説明<br />Twitterからのイベント検出<br />センサーによるイベント検出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />・・・<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  26. 26. ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />・・・<br />呟き分類器<br />・・・<br />・・・<br />tweets<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  27. 27. ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  28. 28. ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震を検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  29. 29. ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震を検出<br />地震センサーが地震を検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  30. 30. ポイント2~説明<br />Twitterからのイベント検出<br />センサーによるイベント検出<br />地震を検出<br />地震センサーが地震を検出<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />
  31. 31. ポイント2~説明<br />センサーによるイベント検出<br />Twitterからのイベント検出<br />地震を検出<br />地震を検出<br />地震センサーが地震に反応<br />地震に関する呟きを抽出<br />確率モデル<br />確率モデル<br />センサーの測定値<br />呟き分類器<br />tweets<br />・・・<br />・・・<br />ユーザーが「地震」について呟く<br />センサーによる観測<br />Twitterユーザーによる観測<br />ターゲット<br />オブジェクト<br />イベント発生<br />センサーによる観測と同じ確率的処理で検出可能<br />
  32. 32. ポイント2~詳細説明<br />実際には確率モデルを使用して検出<br />Twitterユーザーをセンサーを考えると、ノイズが多く、また誤検出もあり得る<br />1つのTweetだけでは、イベントが起きたとは判定できない<br />->時系列的なセンサーの値から、イベント判定を行う<br />2つの確率モデルを利用<br />時系列データよりイベント検出を行う確率モデル<br />一連の位置情報より位置推定を行う確率モデル<br />
  33. 33. ポイント2~詳細説明~時系列モデル<br />
  34. 34. ポイント2~詳細説明~時系列モデル<br />
  35. 35. ポイント2~詳細説明~時系列モデル<br />
  36. 36. ポイント2~詳細説明~時系列モデル<br />
  37. 37. ポイント2~詳細説明~時系列モデル<br />
  38. 38. ポイント2~詳細説明~時系列モデル<br />
  39. 39. ポイント2~詳細説明~時系列モデル<br />観測データを指数関数にフィッティング<br />ターゲットイベントの発生判定を、指数分布に基づいて確率的に算出<br />
  40. 40. ポイント2~詳細説明~空間モデル<br />ターゲットイベントの発生場所の確率分布を算出<br />センサーによる位置推定に使われるベイズフィルタを利用<br />カルマンフィルタ<br />パーティクルフィルタ<br />
  41. 41. ポイント2~詳細説明~空間モデル<br />カルマンフィルタ<br />ベイズフィルタとして最もよく使われている手法<br />長所計算が速い<br />短所適用対象が、高精度かつ計測間隔の短い<br />            センサーに限られてしまう<br />
  42. 42. ポイント2~詳細説明~空間モデル<br />パーティクルフィルタ(粒子フィルタ)<br />確率分布をparticle=粒子の集合でシミュレートする手法<br />長所さまざまな確率分布に適用可能<br />短所高次元なデータを用いた予測には適用できない<br />       (位置推定は2次元なので適用可能)<br />
  43. 43. 検出の精度<br />どのくらいの精度で検出できたのか?<br />
  44. 44. 地震自体の検出結果<br />期間: 2009年8月 – 2009年9月<br />収集したTweet数: 49,314tweets<br />利用したTweet数: 6291 tweets by 4218 users<br />震度3以上の地震を96%の精度で検出<br />
  45. 45. 震源地予測結果<br />Kyoto<br />Tokyo<br />予測震源地<br />(提案)<br />Osaka<br />実際の震源地<br />風船:呟きの位置<br />色:呟き時刻<br />
  46. 46. 台風の進路予測<br />実際の経路<br />予測経路<br />(Particle Filter)<br />
  47. 47. 問題点<br />地震検出の精度・位置推定の精度が<br />Twitterユーザーの多い地域>少ない地域<br />震源地が海だと予測できない<br />
  48. 48. 今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter による位置推定<br />Twitter上でのリアルタイム情報伝播の特徴<br />イベント種類による情報伝播の特性<br />リアルタイムイベント抽出 応用システム<br />にじったー/Toretter<br />電車遅延抽出/渋滞抽出<br />Celeb Paparazzi(仮)<br />
  49. 49. Twitter上でのイベント情報の伝播<br />調査の発端<br />センサーによる観測手法<br />->センサー同士が影響しないことが前提<br />-> Twitterユーザー同士は影響を及ぼしてしまうのではないか?<br />2種類のイベントについてネットワークの特徴量を比較<br />ユーザーの周囲で突発的に発生するイベント<br />地震・台風<br />学会/研究会イベント<br />
  50. 50. 2種類の情報伝播ネットワークを定義<br />フォロワーネットワーク<br />Retweetネットワーク<br />Twitter上でのイベント情報の伝播<br />ユーザーA<br />ユーザーB<br />follow<br />user A’s timeline<br />地震??<br />地震??<br />大丈夫!? RT @user B: 地震??<br />follow<br />ユーザーA<br />ユーザーB<br />
  51. 51. 突発的に発生するイベントの情報伝播<br />フォロワーネットワークの密度:普通<br />Retweetネットワーク:中心性の高いユーザーがいない<br />フォロワーネットワーク 台風<br />Retweetネットワーク 台風<br />
  52. 52. 突発的に発生するイベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />Rpagerankv.s. Rbetween<br />
  53. 53. 突発的に発生するイベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />Rpagerankv.s. Rbetween<br />
  54. 54. 突発的に発生するイベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />Rpagerankv.s. Rbetween<br />地震<br />台風<br />地震<br />
  55. 55. 学会/研究会イベントの情報伝播<br /><ul><li>フォロワーネットワークの密度が高い
  56. 56. RTネットワークの密度が高い</li></ul>フォロワーネットワーク<br />WI2<br />Retweet ネットワーク<br />WI2<br />
  57. 57. 学会/研究会イベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />ネットワーク密度<br />
  58. 58. 学会/研究会イベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />ネットワーク密度<br />
  59. 59. 学会/研究会イベントの情報伝播<br />フォロワーネットワーク v.s. Retweetネットワーク<br />ネットワーク密度<br />
  60. 60. Twitter上でのイベント情報の伝播<br />Conference Events<br />他のイベントと比べ、フォロワーネットワークの密度が高い<br />Retweetも発生しやすい<br />-> 情報伝播が発生しやすいイベント<br />Events around them<br />Retweetネットワークには中心性の高いユーザーはいない.<br />=ユーザーは突発的なイベントについてはあまりRetweetしない<br />-> 情報伝播が発生しにくいイベント<br />
  61. 61. 今日のアジェンダ<br />Twitterで分かる「今」と「どこ」<br />地震抽出システムについて<br />リアルタイムイベント抽出の仕組み<br />キーワード検索とSVMによるイベント抽出<br />Particle Filter による位置推定<br />Twitter上でのリアルタイム情報伝播の特徴<br />イベント種類による情報伝播の特性<br />リアルタイムイベント抽出 応用システム<br />にじったー/Toretter<br />電車遅延抽出/渋滞抽出<br />Celeb Paparazzi(仮)<br />
  62. 62. 地震速報システム Toretter<br />
  63. 63. 虹出現お知らせシステム Nijitter<br />
  64. 64. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />
  65. 65. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />
  66. 66. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇のちゃちゃちゃチャンスですよ!w 。<br />
  67. 67. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />フジテレビ内のローソンでとんちゃんとフォンチーを見かけたよ。<br />いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇のちゃちゃちゃチャンスですよ!w 。<br />
  68. 68. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />フジテレビ内のローソンでとんちゃんとフォンチーを見かけたよ。<br />いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇のちゃちゃちゃチャンスですよ!w 。<br />明治通りで美川憲一に遭遇なう。めっちゃくねくねしてる。<br />
  69. 69. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />今、新宿三丁目であの伝説の外人チャックウィルソン発見!<br />フジテレビ内のローソンでとんちゃんとフォンチーを見かけたよ。<br />楳図かずおさん見かけた@吉祥寺。 赤と白のボーダーすごい似合ってた。。<br />いま伊集院光氏が秋葉原うろうろしてるみたいですよ^^接近遭遇のちゃちゃちゃチャンスですよ!w 。<br />明治通りで美川憲一に遭遇なう。めっちゃくねくねしてる。<br />8月31日の16:00~20:00の間のTweet<br />
  70. 70. 芸能人を目撃せよ CelebPaparazzi(作成中)<br />実際の仕組み<br />「発見」「遭遇」などを含むTweetを収集<br />有名人の人名が含まれてるTweetを抽出<br />Wikipedia等から収集した人物名リストを使用<br />地名情報・位置情報を取得<br />-> リアルタイムに芸能人目撃情報を表示<br />
  71. 71. その他作りたいアプリ(計画&妄想)<br />計画中<br />電車遅延情報お知らせシステム(メールも配信)<br />渋滞情報表示システム<br />妄想<br />なんでもイベント判別器作成システム<br />正解データ/不正解データをユーザーがトゥギャる<br />イベント判別器を自動作成<br />天体情報表示&写真収集システム<br />
  72. 72. まとめ<br />高い精度でイベント検出可能<br />ある程度の位置推定も可能<br />イベントごとの情報伝播の違いを検証<br />様々なイベント抽出サイトを作成<br />他のリアルタイムなイベントに応用可能<br />  例:電車遅延、芸能人出現情報etc<br />
  73. 73. おしまい<br />@tksakaki<br />
  74. 74.
  75. 75. 位置情報推定の精度<br />地震<br />緯度・経度の最小2乗誤差<br />Particle filters works better than other methods<br />
  76. 76. 位置情報推定の精度<br />台風<br />緯度・経度の最小2乗誤差<br />Particle Filters works better than other methods<br />

×