2013参院選
ネット選挙での分析業務の現場から
第3回 テキストマイニング・シンポジウム 2013.9.12
株式会社ホットリンク
浅野弘輔
自己紹介
浅野 弘輔(あさの ひろすけ)
http://twitter.com/hirosuke_asano
http://www.facebook.com/asanohirosuke
大学・大学院時代に統計工学とデータマーケティングを専攻。
システム開発会社を経て株式会社ホットリンクに所属
ソーシャルメディア分析ツール を開発
現在はソーシャルデータの活用のための研究開発に従事
ウェブとデータとゲームが大好物!
株式会社ホットリンク
“Make Internet Hotto”
「ほっとする情報社会」を目指し
企業と生活者の共創を支援する
マーケティングテクノロジー企業です。
インターネット上の口コミを日々収集し、
オンデマンドで分析・レポーティングするサービス
今、みんなが何を考えているか分かる瞬間世論調査
当時、みんなが何を考えていたか分かるタイムマシン
曰く
2009年の衆議院総選挙から
選挙分野への応用をテーマに研究開始
マーケティング、風評リスク管理、
キャンペーンの効果測定など
利用目的
累計600社以上に導入
「ソーシャルメディア分析と言えば係長」
実績
そして
本日、お話したいこと
1.ネット選挙解禁までのホットリンクの取り組み
2.プロモーションとしての分析からビジネスとして
の分析で変わったこと
3.期待されたこと/できたこと/できなかったこと
2009年 第45回衆議院議員総選挙
2010年 第22回参議院選挙
選挙結果を
ネットのクチコミから予測
ホットリンク
・ソーシャルデータの収集と提供
・キャンペーンサイトの開発と運用
・プロモーション
東京大学 松尾研究室
・予測モデルの研究と予測システムの提供
産学連携
2012年 第46回衆議院議員総選挙
政党・党首に対する世論の反応を
ソーシャルデータから指標化
ホットリンク
・ソーシャルデータの収集と提供
Le Grand
・評価指標の作成
・キャンペーンサイトの制作・運営
・プロモーション
2013年 第23回参議院選挙
ネット選挙解禁
※インターネット選挙運動解禁に係る公職選挙法の一部を改正
ネット選挙解禁で出来るようになったこと
を使った
ウェブサイト
ブログ公式サイト
etc…
選挙運動
投票を呼び掛ける行為
「〇〇さんを当選させよう!」
「〇〇さんに清き一票を!」
ネット選挙解禁を受けて
ホットリンクにも
お声が掛かるようになりました。
それまでの地道な
メディア露出が実を結び
プロモーションとしての
選挙のソーシャルデータ分析
立ち位置の変化
今まで
ビジネスとしての
選挙のソーシャルデータ分析
今回
2.プロモーションとしての分析から
ビジネスとしての分析で
変わったこと
前回まで
新しい技術の研究(自前 or 産学連携)
研究成果をコンテンツとして見える化
新しい取り組みの実績を作る
メディアに取り上げてもらう
目的
「面白いね!」と思ってもらう
大事な点
やること
前回まで
◆メッセージ性
・なぜそれをするのか
・その先に何があるのか
◆話題性
・それをメディアが取り上げる理由
「面白いね!」の要素
★所詮、他人ごと
ホットリンクがやっていること
今回、選挙予測はやりませんでした
今回
データや分析結果を使ってもらう
ビジネス化(お役に立って対価を頂く)
ソーシャルデータ提供の採用実績を作る
目的
やること
大事な点
使ってもらう
今回
◆安心
・分かり易い
・よく分からないモノは使ってもらえない
(コンテンツの場合は、完全に理解されるとかえってつまらないモノになる)
・とりあえず使える
・お話だけじゃなくて、具体的なモノが確認できる
・データの信頼性
・あると思っているものがちゃんとある
(出来ないことや問題は都度伝え、相手の期待値と現実を合わせる)
使ってもらうためには
★(相手側の)自分事になる
自分(メディア)が発信する情報のソースである
自分(政党)がアクションを取るのに必要な情報である
「面白いね!」
と言ってもらっても
そのままビジネスには
ならない
が今回やったこと
ホットリンク
メディア(新聞社・TV)
データ・分析結果の提供
メディア(新聞社・TV)
データ・分析結果の提供
・政党、立候補者の情報にソーシャルアカウントを紐付け
・候補者の口コミ、公式アカウントの発言内容を収集
・政策関連キーワードを選定し、ソーシャルメディアの口コミを収集
API/ファイル連携で提供
政党(政党・代理店)
ダッシュボード・アプリケーション
政党(政党・代理店)
ダッシュボード・アプリケーション
・政党、立候補者の情報にソーシャルアカウントを紐付け
・候補者の口コミ、公式アカウントの発言内容を収集
・政策関連キーワードを選定し、ソーシャルメディアの口コミを収集
・政党・政策・候補者のクチコミ分析と公式アカウント分析を
ダッシュボード化
・Twitter上のクチコミの雰囲気が感じられるアプリケーション化
今回は
・データの精度とカバレッジを上げること
・それを上手く表現すること
を中心に行った。
選挙を扱う上で注意する点
報酬の支払いが買収になるケース
×主体的・裁量的に企画や運動に係り対価を貰う
〇ボランティアとして無報酬で主体的に関わる
〇主体的・裁量的でない、機械的な監視など
人気投票の公表の禁止
×Webアンケートなどの結果を公開する
〇結果を公開しないアンケート調査
〇人気投票ではない調査(クチコミ予測)
テキストマイニングは
こんなところで
使ってました。
Tweetのマッピング
Userのプロフィール情報のテキストを解析し
て所在都市を推定
座標に変換して地図上にマッピング
TweetのGeo情報だとカバー率が少ない
各メディアの話題語
ブログ/Twitter/2ch/ネットニュースで前日話題になったキーワードを
それぞれでランキングして比較
各メディアの話題語
出現数順だとノイズに弱い
ノイズを除去してキーワードの特徴量(話題指数)を評価
単純出現数 話題指数
各メディアの話題語
出現数順だとノイズに弱い
ノイズを除去してキーワードの特徴量(話題指数)を評価
単純出現数 話題指数
ニュースに対する世間の反応の可視化
センチメント分析を使って
リアルタイムなポジネガの割合をグラフ化
スパムフィルタのイメージ
スパムの排除
長年の運用により進化したホットリンクのスパム排除技術
分析の縁の下を
支えています
3.期待されたこと
出来たこと
出来なかったこと
ネット選挙(運動)解禁に期待されたこと
・ネット上での議論で政策論が深まるのではないか
・有権者の関心が高まって投票率があがるのではないか
本件と混同しやすいが、
違う内容なので割愛
ネット選挙のソーシャルデータ分析に
期待されたこと
1.誹謗中傷などの風評リスク対策
2.ソーシャルメディア上の候補者の動きや反響の把握
3.有権者が関心を持っている話題の把握
4.ネット選挙でどんな取り組みが効果があったのか
1.誹謗中傷などの風評リスク対策
【概要】
主に政党から。
候補者に対する誹謗・中傷などのカキコミを早期に把握、
対応する必要があれば反論や訂正などを行う。
【やったこと】
風評リスク監視。
一般企業向けの風評リスク監視とやることは同じ。
【結果】
結果的には、当初心配したような目立った事象は起きなかった。
2.ソーシャルメディア上の候補者の動きや反響の把握
【概要】
主にメディア向けで、報道やコンテンツなどの元ネタとして使う。
ネット選挙で、政党や候補者がどう動いたのかを把握。
【やったこと】
候補者のソーシャルアカウントの特定とモニタリング
一元的に正確な情報がまとまっているソースは無いので、政党のWebサイトや
候補者のWebサイトなどを回って泥臭くチェック
【結果】
収集したデータが、ニュースや記事のネタに使われたり、コンテンツになったりした。
選挙区ごと、政党ごとの動きを網羅的に掴むのに役立った。
【課題】
候補者ごとに、ソーシャルアカウントを開設しなかったり、Twitterがメイン
だったり、Facebookも個人ページを使う候補とFacebookページを使う候補
など、かなりバラツキがあった(前提が違うので数値的な比較が難しい)。
選挙期間中、Facebookの個人ページの記事に対するコメント数が仕様変
更で取れなくなるなどのトラブルもあった(Facebookページは取れる)。
2.ソーシャルメディア上の候補者の動きや反響の把握
3.有権者が関心を持っている話題の把握
【概要】
政党、メディア両方から
有権者は、どんな問題に関心があるのか
【やったこと】
ブログ/Twitter/2ch/ネットニュース/TVで話題になっているキーワードの抽出
政策に関するキーワードに関するクチコミの定点観測
候補者にiPadを配布し、経済情報や政党に関するTwitterのクチコミなどをリアルタイム
に見れるアプリを作った(クチコミ部分を担当)。
【結果】
TV討論や演説でのコミュニケーションを変えた。
有権者の興味関心に応じて、政策説明のパンフレットで強調する政策を変えた。
iPadで経済が上向いたことを示すデータなどを配信し、該当演説の際に活用。
【課題】
特定キーワードの定点観測はキーワードの選定が設定した人のセンスに
依存する。
ノイズ(関心事とは違う文脈で出るとか)の除去。
3.有権者が関心を持っている話題の把握
4.ネット選挙でどんな取り組みが効果があったのか
【概要】
政党、メディア両方から
ネット選挙では、どんなやり方が有効だったのか知りたい。
【できなかった】
・正解データと言えるのが開票結果のみ。
・仮説を立てても、検証できなければ結果論でしかない。
ブログでの「累計」話題量
(Source: クチコミ@係長)
• 7/13の佐々木俊尚氏とのTwitter討論などを活用
し、終盤戦で一気に話題量を伸ばしトップ当選の丸
川候補を引き離す。
• しかしながら、民主党内での候補者調整の遅れが
響き、次点に泣く。
仮説1:鈴木寛候補のネット戦略は成功だった
ブログでの「日次」話題量
(Source: クチコミ@係長)
• 7/13の佐々木俊尚氏とのTwitter討論などで、一時的
に話題量は増えるも拡散性は弱く、終盤は失速。
• 丸川候補は、話題の絶対量では劣るものの、投票日に
かけて一気にヤマを作り、その勢いのままトップ当選を
果たす。
仮説2:鈴木寛候補のネット戦略は失敗だった
当選すれば成功、落選すれば失敗か
もし、選挙期間中の支持率が分かったとしたら
実際に投票が行われる
詳細な票数も公表される
大手メディアの情勢調査等
抽象的な表現で発表
落選したが選挙運動
は失敗と言えるのか
当選したが選挙運動
は成功といえるのか
投・開票日公示日
A候補
B候補
当選
落選
日程
支持率
【課題】
開票数の1点だけでは、選挙運動というプロセスの評価は難しい
複数点で精度の高い観測しているのは、各新聞社の情勢調査(RDD方式
による電話調査)だが、詳細は非公開なので数値で評価することは難し
い。
ニコニコ動画の「ネット世論調査」が公示日の前後で情勢調査を行い、当
確予測の精度も高かったので注目したい(詳細が非公開なのは同じ)。
4.ネット選挙でどんな取り組みが効果があったのか
2013参院選のネット選挙を振り返って
• ネット選挙運動解禁の流れは、当初心配していた問題が起
きなかったので今後も続く。
・ ソーシャルメディアの観測データは今後重要になっていく。
ソーシャルデータは観測の精度向上が先ず重要(エンジニア
リングやオペレーションの領域)。
ニーズに合わせてどう表現するかが次に重要。
予測や要因分析(R&Dの領域)はまた次の課題。
・ 世間ウケするネタとビジネスになるネタの差を意識するのは
重要。
ご清聴ありがとうございました。

20130916第3回テキストマイニングシンポジウム資料(浅野)