121002東日本大震災での情報分析ss

417 views

Published on

京都大学防災計画実務者セミナー

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
417
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

121002東日本大震災での情報分析ss

  1. 1. 東日本大震災 における行政機関 での情報分析
  2. 2. 第一次調査(震災直後) 2
  3. 3. なぜ情報分析 を始 めたのか 東日本大震災直後には通信網の混乱等により情報が非常に不足し ており、通常ルートでの情報収集をすることが困難であった。し かし、 sns やブログが普及していたことにより、被災各地の個人等 から多くの情報が発信されていた。 経済産業省では、行政機関が情報を公開し、国民の声に耳を傾け 、国民と協力して行政を進めていくオープンガバメントという取 り組みを震災前から進めており、その一環として、国民の声を客 観的に分析する手法を研究するためのテキスト分析ツールを試行 導入していた。そのツールには、 twitter 情報分析機能、ブログ情 報分析機能が付いていたことから、震災直後に、この機能が使え るのではないかと試行を実施した。 sns 3
  4. 4. 電池 の分析 はじめに試行したのが電池情報の分析である。震災直後に、被災 地に電池がないことが課題になり各地で品不足が起こった。テレ ビや新聞では「電池がない」「買占めが起こっている」という繰 り返しが多く、現地の詳細情報が入手しにくい状況であった。そ こで、 twitter で「電池」に関するつぶやきを集め分析した。 3 月 14 日時点で、単1電池と単4電池が不足していること、携帯 電話の充電器が不足していることが分かった。また、電池に新聞 紙をまいて単1電池を代用する方法等が紹介されていた。 日次で分析を行ったが、 16 日に「電池」に関するつぶやきを集め 分析すると、電池だけではなく食料やトイレットペーパーも不足 しているというつぶやきが多くなる等、ニーズの変化を把握する ことができた。 ツールを使うことで情報収集と分析の時間が大幅に短縮されたの はもちろんであるが、全体でのマクロの傾向分析だけでなく、気 になる言葉をブレイクダウンして元の意見までたどれる等、現地 の声のミクロな分析まで行えることは、現状を把握する上で非常 に効果的であった。また、 Google リアルタイム分析により、電池 に関するつぶやき数の推移もあわせて分析していたが、課題のピ ーク分析という点からも有効性が確認された。 4
  5. 5. 電池 の分析2「電池」を含む Tweet を、 1500 件抽出したものを分析 Google リアルタイム分析による「電池」検索数の 推移 一般品の 要望と一体化主な意見・電池の不足・利用の工夫・携帯電話の充電 5
  6. 6. 日次 での「支援」「必要」分析  「支援」「必要」のキーワードで、毎日分析を実施し、必要な支 援をモニター。 ( 5:20-11:31 )の tweet 分析例 3 月 14 日 11:31午前中のお参り 終える。 を みな震災に心を 痛め心配し ている様子。 長期的な支援が必要と なるので、まずは日常を 大切に生きたい。昨日の菅直人や海江田万里の声明で節電ムード が広がっ てるけれど、 節電の必要のないエリ アまでの節電ムード はやめて欲し 思う むし いと 。 ろ復興支援と て不足分を し カバーするだけのエネルギーが必 物資 (12) 必要だ (28)要になると 考えはないのか。 いう物資支援は企業にお任せし ないと 被災地以外でも 、 必要な人が手に入れられなく 可能性も あるんじ ゃ 捨てる (12)ないかな…。【今後支援に必要と れるであろう の】 正確な情報・電池・ さ 充電器・ セッ コンロ・ カ ト も ・ 食料・ ウエッ テイ シュ・ イ ト ト ッ 飲料・ ト レッ ペーパー・ ゴム手袋・ ンラ プ・ イ 乾 生理用品・ サラ ッ カ ロ・ 下着( イツ・ タ 靴下・股 届ける (15) 食料 (165)引き・ パンツ・ シャツ) タ ・ オル・毛布・ 保湿用品・オムツ( 子供用・大人用) など 支援する (12) 必要だ (16)【久留米市】 救援物資のお尋ねが寄せら れていますが、 現時点では、 被災地の受入体制が十分整っておらず、ん。 交通規制など 今後必要物資を 調整し により被災地への輸送手段を 支援し ていきますので、 確保できないため、 ご理解をいただきますよう 受け入れを お願い申し 行っ ていませ 上げます。続 乗せる (52) 支援 (51) (く)下手に都市部の人が( え物資支援の為!と たと は言えど ) 生理用品、 も( 紙オムツ、 ルク、 粉ミ 飲料 情報 (114) 喜ぶ (11) 被災地 (242)水、 ッ ペーパー、 ティ シュ 電池、 ガソリン等)買い占めし ちゃう 、 と 値段が釣り 上がったり 本当に必要な 、被災地に回ら ない!!個人輸送は余計な負担!気持は分かるが、 節電、 買占めし ない、 が吉◎ 気仙沼 (47)津波で塩水に浸かっ たプリ ウスは、 感電の危険があり なので、 ヨ の技術者の支援が必要と そう トタ 思 向ける (56)われる。 31 1 s ppt @ ka z u yo _ @ nh k_ # k kuro ge n 分かれる (24) 被災者 (232) できる ( 否 )(24) 復興する (24) インタビュー読む (11) (14) かかる (19) 物流 (9) あさ (9) 必要だ (25) 各地 (5) テレビ (265) 働きかける (83) 集める (26) 訪問サービス (125) 投稿する (11) 物資 (162) 必要だ (9) 支援金 (19) 患者 (125) 茨城 (182) 支援 (115) 情報 (113) スタッフ (125) 支援 (25) 本部 (8) 比べる (11) 確認 かかりつけ医 (125) (156) 不足する (113) 情報 (333) 必要だ (168) 現地 (245) 給水所 (113) 行く (34) 体制 (128) 支援 (1202) 含める (24) 情報 (113) 被災者 (114) 必要だ (96) 体制 (135) 発送 (79) 茨城 (115) 新潟 (113) 必要だ (371)
  7. 7. 不足品分析  「不足」という単語で情報収集と分析を行った。「不足」という 言葉を含む tweet を集め、名詞単語ランキングを作成。  tweet に対して、複合語辞書、類似語辞書の修正、非表示単語の登 録等の辞書の精度向上を繰り返しながら、毎日20位までの不足 品一覧を作成。 – 約30分の情報分析作業で不足品状況の把握が可能。不足品の自動分析 3/ 1 2 3/ 1 3 3/ 1 4 3/ 15 3/ 1 6 1 639- 1 702 3/ 18 1 421 - 1 441 3/ 1 9 1 328- 1 404 3/ 20 1 252- 1 331 3/ 22 1 515- 1 600 3/ 23 1 959- 2050 3/ 26 2238- 2348 3/ 1 2 3/ 1 3 3/ 1 4 3/ 15 3/ 1 6 1 639- 1 702 3/ 18 1 421 - 1 441 3/ 1 9 1 328- 1 404 3/ 20 1 252- 1 331 3/ 22 1 515- 1 600 3/ 23 1 959- 2050 3/ 26 2238- 23481 電力 電力 電力 電力 物資 物資 物資 電力 物資 電力 電力2 情報 情報 食料 物資 ガソリン 電池 ガソリン 物資 ボランティア ガソリン 水3 食料 食料 情報 ガソリン 食料 ティ シュペーパーボランティ ッ ア ガソリン 水 物資 ガソリン4 物資 ガソ ン リ 物資 食料 情報 飲料水用容器 電力 ボランティア 土のう袋 水 物資5 テレビ 紙おむつ ガソリン 水 燃料 懐中電灯 エネルギー 情報 電力 テレビ 運動6 ニュース 赤ちゃん用 テレビ 情報 避難所 ト レッ ペーパー 情報 イ ト テレビ ガソ ン リ 食料 自動車7 照明 物資 場所 燃料 石油製品 軽油 医師 避難所 野菜 自転車 紙8 機器 テレビ 地図 紙オムツ 水 ブルーシート ヘリ 食料 テレビ 牛乳 食料9 避難所 水 水 ビニール テレビ 保存食 内科 店 食料 自動車 燃料10 水 ニュース 紙おむつ フ ース リ 自動車 ガソ ン用携行缶 リ 水 燃料 情報 ト レッ ペーパー 報告 イ ト11 血液 避難所 燃料 生地 店 電力 献血 運動 運動不足 ボランティア 野菜12 電源不足 店 運動 店 電力 水 おにぎり 水 燃料 電化 インク13 病院 血液 通信 医療 トイレッ ペーパー ガソ ン ト リ 看護師 自動車 車 燃料 情報14 救援 コンビニ 店 紙オムツ不足 暖房 テレビ 運動不足 おにぎり ト レッ ペーパー 住宅 イ ト 本15 店 運動 交通 テレビ 栄養不足 紙おむつ 車 募金 医師 店 ボランティア16 運動 燃料 自動車 電池 糖尿病 食事 無洗米 牛乳 運動 運動不足 魚17 ガソリン 医療 コンビニ ニュース 血液 かゆ 衣類 紙おむつ 食事 部品 ニュース18 場所 照明 救援 交通 粉ミルク 乳幼児用 紙オムツ 自転車 果物 電車 道路19 懐中電灯 自動車 血液 避難所 毛布 入院患者 下着 ニュース 店 情報 キャ プ ッ 不足20 携帯 場所 赤ちゃん用 医薬品不足 運動 無洗米 避難所 医薬品不足 水分 ニュース 避難所 情報に関する要望は、生活必需品と並んで常に上位に出現(緑の項目) 7
  8. 8. 課題1: クロール数 の制約 による誤差  tweet 数が多すぎるため一回のクロールで収集できる情報が 30 分 から 1 時間のスナップショット情報になる。このため情報に偏り が出やすい。  データを蓄積して分析することで平準化が図れると考えられる。 行く(1049) 範囲(1049) 観光(1050) 動き回る(2) 避ける(5) 医療(4) 毎日(1050) 頑張る( 否) (1049) 仕事(1052) 県(4) 我慢する(2) 必要だ(1049) 被災地(1117) いつも通り(1050) 出来る(2) 考える(2) 行く(1056)月 14 日 11:31 ( 5:20-11:31 ) 広い(2) 時間(1052) 支援(15) 範囲(1053) 留め待つ(2) 考える(3) 作業(3) 物資(12) 長野県災害対策(28) 必要だ(28) 捨てる(12) 信じ 否) (3) る( 毎日(1049) 復興(1073) 先輩(34) 食料(165) 形(1054) 届ける(15) 続ける(1049) 届ける(3) 必要だ(16)支援する(12) 支援(1385) 乗せる(52) 支援(51) 震災(4) 必要だ(1056) 情報(114) 喜ぶ(11) 被災地(242) ブーム(1049) 終わらせる( 否) (1049) 終わらせる( 否) (1049) 気仙沼(47) 向ける(56) できる( 否) (34) 必要だ(112) 分かれる(24) 被災者(232) できる( 否) (24) 3 月 14 日 19:10 ( 18:19-19:10 ) 復興する(24) インタ 読む ビュー(14) (11) かかる(19) 物流(9) あさ(9) 必要だ(25) 各地(5) テレビ(265) 働きかける(83) 集める(26) 訪問サービス(125) 投稿する(11) 物資(162) 必要だ(9) 支援金(19) 茨城(182) スタ フ(125) ッ 患者(125) 支援(115) 情報(113) 同じ日に「支援」「必要」で 支援(25) 本部(8) 現地(245) かかりつけ医確認(156) (125) 不足する(113) 比べる(11) 情報(333) 必要だ(168) 分析しているのに内容が全く 違う 給水所(113) 行く(34) 体制(128) 支援(1202) 含める(24) 情報(113) 被災者(114) 必要だ(96) 体制(135) 発送(79) 茨城(115) 新潟(113) 必要だ(371) 8
  9. 9. 課題2: RT (再送) による影響 ランキングを見ていると 3/18 に乳児に関する単語が多く出現して いるが、これは単語の出現回数がほぼ同じであり、 RT している ことによる影響であった。 RT を重要な情報と見ることも重要であるが、 RT を削除するフィ ルターを使って分析することで、 少数意見が浮かび上がらせるこ とができる等の情報分析の工夫の方法もわかった。 No . 3/ 18 1 421 - 1441 単語 割合 大量の RT の発生例 1 物資 44.8% 2 電池 25.7% 3 ティ シュペーパー 25.4% ッ 4 飲料水用容器 25.4% 5 懐中電灯 25.3% 6 ト レッ ペーパー イ ト 25.3% 7 軽油 25.3% 8 ブルーシート 25.2% 9 保存食 25.2% 10 ガソリン用携行缶 25.1 % 11 電力 1 2.3% 12 水 9.5% 13 ガソリン 8.6% 14 テレビ 8.2% 15 紙おむつ 7.7% 16 食事 7.6% 17 かゆ 6.9% 18 19 乳幼児用 入院患者 6.9% 6.9% 出現数が同じなので、 1 20 無洗米 6.9% つの Tweet の中に入って 21 22 流動食 ボランティア 6.9% 5.2% いて RT されたものと推 23 血液 4.5% 測される 24 燃料 4.2% 25 食料 4.2% 9
  10. 10. 課題2: RT (再送) による影響 意見の再送などで重複した意 2011/3/24 見がたくさんある場合、重複 「支援」 必要」 検索結果 「 での を排除することで、集団意見 に隠れた様々な個別意見を分 析可能となる。 T e t1500件 we フィルターで重複を削除 T e t489件 we 10
  11. 11. 課題3: 類似語辞書 の作成 第三の課題は、類似語辞書の作成である。「ご飯」「米」は一緒 にしてよいが「無洗米」はニーズとして別出ししたほうがよい等 のケースがある。「燃料」「灯油」「ガソリン」「石油製品」等 の関連した単語を、災害発生からの時間軸も踏まえ、どのように 整理していくかも検討が必要である。 3/ 1 2 3/ 1 9 1 328- 1 404 3/ 26 2238- 2348 No . 単語 単語 単語 1 電力 物資 電力 災害から 3 日 災害から一週間 2 情報 ガソリン 水 水=飲料水 水=水 3 食料 ボランティア ガソリン    水 飲料水=飲料水 物資 電力 物資    飲料 飲料=飲料 4 5 テレビ エネルギー 運動 6 ニュース 情報 自動車    飲み物    =お茶 7 照明 医師 紙 蒸留水=蒸留水    =ジュース 8 機器 ヘリ 食料 蒸留水=蒸留水 9 避難所 内科 燃料 10 水 水 報告 11 血液 献血 野菜 12 電源不足 おにぎり インク 13 病院 看護師 情報 14 救援 運動不足 本 15 店 車 ボランティア 16 運動 無洗米 魚 支援物資リストでフィルターをかけると ガソリン 衣類 ニュース 、より一層、効果的と考えられる 17 18 場所 紙オムツ 道路 19 懐中電灯 下着 キャ プ ッ 不足 20 携帯 避難所 避難所 11
  12. 12. その他 の影響要因 3/24 には twitter で流行している質問ゲームで「あなたの TL では 不足していったー」という問いが出たため、 twitter 上に「不足」 を含む tweet が大量に発生した。このため、分析が不能となる等の 偶発的な課題も発生。3 月 24 日 20:20-21:30   1500tweet のうち 511 がゲームの回答 12
  13. 13. 成果 の集約 2011 年 4 月 11 日に、震災のノウハウも含めた情報分析のガイド を公開。 – 災害に限らず、幅広く使えるガイドを提供。 事例2: 行政刷新会議 国民の声アイデアボックス 国民の声アイディアボッ スは、 ク 新成長戦略の実現に向けた規 制・制度に関するアイディアを国民の皆様から直接提案をいただ き、議論を深めた。 実施期間: ( 2010年9、10月) 国民の意見を活かしていますか 国民の声 データ テキスト を「 マイニング」 ~行政機関における情報分析ツール活用ガイド~ ツールにインポート 毎週の分析は3時間で作成。最終報告書( は8時間で作成 53ページ) 8 事例3 文部科学省 : パブリ クコメ ッ ント 熟議カケアイ アンケート自由記述 意見募集 意見の原文を読み込み、全体の意見 から特定の断面についての傾向を分 析した。 情報が持つ価値を1 0 0 %引き出していますか? ( 年代、職業など) 単なる紙の山、文字の羅列にしていませんか? 更には特定の注目単語を軸に主要な 話題や潜在的な話題の分析を行った。 「 授業」をキーワード た分析例 にし http://www.openlabs.go.jp/ 11 13
  14. 14. 第二次調査( 5 月上旬) 政府 と情報 の分析
  15. 15. 政府 における情報関連 の取 り組 みへの Twitter での意見 5月7日に「政府」「情報」で分析( 810 ( 1500Tweet )) – 浜岡原発を停止要請した直後であることと、 Wikileaks の日本関連報道 直後のため、その関連情報も混在している。 – (ユッケとアルカイダは除外単語に設定) 情報を隠蔽しているのではないかという疑念が大きく、国民への 情報公開を求めている。また、メディアも同様に信用されていな い。 15
  16. 16. 政府 の情報 や政府 の発表 に対 するブログでの意見 5/7 から過去四週間のブログの記事を検索 – アメーバブログ、 yahoo ブログ、 goo ブログを分析対象として選定: 1198 件 政府の発表は信用できないという指摘が多く、政府が情報の統制 や隠蔽が行われていると考えている。積極的な情報提供や発信が 求められている。 16
  17. 17. 第二次調査( 5 月上旬) 政府 の信頼性分析
  18. 18. 行政 の活動 に関 する評価 震災後、復興に向けて活動している各団体の活動についてどのよ うに思われますか。 – ベース: 7 段階の TOP2 計「とてもよくやっている」+「よくやっ ている」株式会社インテージ(本社:東京都千代田区、代表取締役社長:宮首賢治)『東日本大震災後の生活者の意識と行動調査』本調査は、 2011 年 4 月 5 日~ 4 月 7 日、インテージ・ネットモニターのうち、震災の被害を受けられた地域を除く全国の 18 ~ 69 才の男女個人を対象として、震災後の意識変化や行動に関してインターネット調査を行い、 6,416 名から得られた回答結果をまとめまし 18
  19. 19. 行政情報 の提供 に対 する国民 からの評価  災害直後の関東での調査結果では、国民は行政機関の サイトを重 視するものの、評価はあまりされていない。震災に関する情報提供で、重視しているメディア・情報源 (複数回答) 震災関連の情報に接して、 「信頼度が上昇した」という回答比 率 (メディアや情報発信主体別)調査名: 「東北地方太平洋沖地震に伴うメディア接触動向に関する調査」 実施時期: 2011 年 3 月 19 日から 3 月 20 日まで 調査方法: インターネットを用いた NRI のマーケティングリサーチサービスである「インサイトシグナル( http://www.is.nri.co.jp/)を利用 調査対象: 関東(茨城、栃木、群馬、千葉、埼玉、東京、神奈川)に在住する 20 歳~ 59 歳 震災関連の情報に接して、の男女個人。男女年代別に人口構成に比例した割付けを行っている。 「信頼度が低下した」という回答比 率株式会社野村総合研究所  2011 年 3 月 29 日 (メディアや情報発信主体別) 19
  20. 20. 新聞 の世論調査朝日新聞社全国定例世論調査 福島第一原発の事故について、政府の情報提供は適切だと思いま すか 。適切ではないと思いますか。 – 適切だ 16 適切ではない 73  〈調査方法〉  • 16、17の両日、コンピューターで無作為に作成した番号に調査員が 電話をかける「朝日RDD」方式で、全国の有権者を対象に調査した( 東日本大震災で被災した岩手、宮城、福島3県の一部を除く)。世帯用 と判明した番号は3352件、有効回答は1999人。回答率60%。毎日新聞全国世論調査 原発から出ている放射性物質に関する政府の発表について – 信用していない:58% – 16、17両日実施 20
  21. 21. Twitter による意見分析5月7日に「政府」「信用できない」で分析 – 232Tweet – 2011/05/03 14:45:47 ~ 2011/05/07 14:53:54 基準についての丁寧な説明が必要と考えられる。 21
  22. 22. Google リアルタイム検索機能 による Twitter 分析1  震災後に、政府が信頼できないという指摘が行われる。 Google リ アルタイム検索機能を使い分析を行った。 – 「政府」「信頼できない」の Twitter 分析 – 「政府」「信頼できる」の Twitter 分析「政府」「信頼できない」の Twitter 発言頻度「政府」「信頼できる」の Twitter 発言頻度 22
  23. 23. Google リアルタイム検索機能 による Twitter 分析 2 3 月 14 日「信頼できる」 23
  24. 24. Google リアルタイム検索機能 による Twitter 分析 3 3 月 18 日「信頼できない」 この日が「政府」「信頼できない」発言の最大 ピーク 24
  25. 25. 第二次調査( 5 月上旬) 風評 の分析
  26. 26. Twitter による意見分析  5/3-8 の Twitter を、「福島」「野菜」「食べない」で抽出。 地産地消は分かりました(納得はして ません)では、せめて弁当持参か給食 か選択できるようにしたらどうですか。 横浜市の給食が今月から福島や茨城の野菜 市長や教育委員会の考えが全く変わら 関西テレビの番組で、福島復興支援のためには安全な福島 を使うそうです。なんで子供達に安全が確 ないのと同様に、福島県産の野菜・牛 産の野菜を食べよーー、と、出演者が福島産生野菜をばり 立されていないものを食べさせるのか疑問 乳などを子供に食べさせたくないと考 ばり食べてたのですが、寒気がしました。 。 える親の考えも変わらないと思います 今も放射能は漏れ続けて放射能の雨が大地に落ちてるのに 、どう考えても安全とはいいきれないだろ。 。 報道機関は大スポンサー東電様の味方なんですね。 この国が狂っているのは風評被害と偽って放射能に汚染された野菜や魚介類 を国民に食べさせようとしている事だ。官も民も狂っている。・・・自治体 も国も放射線量の詳細を公表しない、本当に国民無視の北朝鮮のような国に なっている 実際に2000ベクレルの野菜を 食べ続けても害がないのか、ある のかなんて関係ない。『安全かも しれない』ものより『安全』なも のを選ぶのはごく自然な心理。 福島、関東圏の農家は緩い基準値 にのって出荷するより、被害者とモスバーガーやゼンショーで福島産の野菜を使うとか。 して原発への声を大にするべき。絶対、食べない。国より厳しい基準値とはいうがはっき その方が格段にイメージアップ。り示していないしね。汚染度の低い野菜を選ぶのは当然。そもそも福島産の食材は全て東電が買い取って廃棄すべ 「畑の野菜をくれて、翌日食べたかどうか子供に確認する」き代物。 背筋が寒くなりました。地域の一体感が一抜け許さない雰囲 気に。 26
  27. 27. 第三次調査( 5 月下旬) 27
  28. 28. テキストマイニングによる意見分析 節電による Twitter 上の話題を分析。 28
  29. 29. 時間軸 での広報効果 の検索 Twitter での議論の状況や特定の瞬間の内容を確認。 29
  30. 30. 地域別発言 や男女比 などの分析  地域別発言数や、つぶやきがどの ように伝播しているかなど分析が 可能。 http://twitraq.userlocal.jp/ 30
  31. 31. 特定地域 の分析 中心点と半径を指定することで、特定地域のつぶやきを検索可能 。 31
  32. 32. 属性別発言分析 10 代、 20 代の女性の学生がつぶやいている内容を抽出可能 32
  33. 33. まとめ 33
  34. 34.  災害時のテキスト分析は状況を把握する上で非常に重要である。 – 概要の把握が短時間にできることは、迅速に災害対応をするために 有効である。 災害時に有効にツールを使いこなすために 、日頃から情報分析ツ ールの活用を行い、現場の声を元にしたより良い行政サービスが 検討していくことが、重要と考えられる。 最新の民間サービスの活用が有効である。 – 技術の進歩が速い領域であることから、民間のサービスに関する情 報を日ごろから収集し、的確にサービスを導入する必要がある。 災害時に分析ツール導入や拡張等の有効な対策を迅速に実施する ための予算の確保方法が重要な課題である。 行政機関内の人材・組織面の課題を解決する必要がある。 – 情報分析の専門家の不足(マーケティングの専門家の不足) – 分析結果を読むリテラシーの不足 – 情報活用するルートの不足 34

×