Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Hirosuke Asano
PDF, PPTX
1,461 views
20130916第3回テキストマイニングシンポジウム資料(浅野)
第3回 テキストマイニング・シンポジウム http://www.ieice.org/~nlc/tm3.html で講演した発表の資料です。
Read more
2
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 57
2
/ 57
3
/ 57
4
/ 57
5
/ 57
6
/ 57
7
/ 57
8
/ 57
9
/ 57
10
/ 57
11
/ 57
12
/ 57
13
/ 57
14
/ 57
15
/ 57
16
/ 57
17
/ 57
18
/ 57
19
/ 57
20
/ 57
21
/ 57
22
/ 57
23
/ 57
24
/ 57
25
/ 57
26
/ 57
27
/ 57
28
/ 57
29
/ 57
30
/ 57
31
/ 57
32
/ 57
33
/ 57
34
/ 57
35
/ 57
36
/ 57
37
/ 57
38
/ 57
39
/ 57
40
/ 57
41
/ 57
42
/ 57
43
/ 57
44
/ 57
45
/ 57
46
/ 57
47
/ 57
48
/ 57
49
/ 57
50
/ 57
51
/ 57
52
/ 57
53
/ 57
54
/ 57
55
/ 57
56
/ 57
57
/ 57
More Related Content
PPTX
160702参院選データジャーナリズムハッカソン - 立候補者の違いを可視化しよう!(青木発表資料)
by
Yuichi Aoki
PDF
Cbpjp kw2019 20191215
by
m_miyamoto
PDF
書籍『シグナル&ノイズ』解説
by
Hirosuke Asano
PDF
データ・テキストマイニング
by
Hiroshi Ono
PDF
言語処理学会へ遊びに行ったよ
by
antibayesian 俺がS式だ
PDF
Open Source Data Mining - Data Mining Cup 2007
by
Christian Schieder
PDF
テキストマイニングのイメージと実際
by
antibayesian 俺がS式だ
PDF
素人がTF-IDFでキーワード抽出をやってみた
by
smzkng
160702参院選データジャーナリズムハッカソン - 立候補者の違いを可視化しよう!(青木発表資料)
by
Yuichi Aoki
Cbpjp kw2019 20191215
by
m_miyamoto
書籍『シグナル&ノイズ』解説
by
Hirosuke Asano
データ・テキストマイニング
by
Hiroshi Ono
言語処理学会へ遊びに行ったよ
by
antibayesian 俺がS式だ
Open Source Data Mining - Data Mining Cup 2007
by
Christian Schieder
テキストマイニングのイメージと実際
by
antibayesian 俺がS式だ
素人がTF-IDFでキーワード抽出をやってみた
by
smzkng
Viewers also liked
PDF
Tokyo webmining発表資料 20111127
by
kan_yukiko
PPTX
感情分析で株価を予測して おこづかい稼ぎ 日経版
by
saito_hirokazu
PDF
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
by
Shintaro Takemura
PPTX
推薦システムになにができるのか - Techcompass
by
Yoshifumi Seki
PPTX
勉強会資料:プログラムもアルゴリズム理解も不要な 機械学習テキストマイニング
by
Masahiro Yamaguchi
PDF
RでTwitterテキストマイニング
by
Yudai Shinbo
PDF
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
by
The Japan DataScientist Society
PDF
RではじめるTwitter解析
by
Takeshi Arabiki
PDF
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
by
Hirosuke Asano
PDF
第二回データサイエンティスト木曜勉強会20141016
by
Koichiro Kondo
PDF
プログラマのための文書推薦入門
by
y-uti
PPT
Twitterインフルエンサー影響力測定サービスの現状と課題
by
Hirosuke Asano
PPTX
さくっとはじめるテキストマイニング(R言語) スタートアップ編
by
Yutaka Shimada
PPTX
Spark Streamingを使ってみた ~Twitterリアルタイムトレンドランキング~
by
sugiyama koki
PDF
さくさくテキストマイニング入門セッション
by
antibayesian 俺がS式だ
PDF
情報推薦システム入門:講義スライド
by
Kenta Oku
PDF
データサイエンティスト協会 木曜勉強会 #04 『クラスター分析の基礎と総合通販会社での活用例 〜 ビッグデータ時代にクラスター分析はどう変わるか 〜』
by
The Japan DataScientist Society
PDF
機械学習によるデータ分析まわりのお話
by
Ryota Kamoshida
Tokyo webmining発表資料 20111127
by
kan_yukiko
感情分析で株価を予測して おこづかい稼ぎ 日経版
by
saito_hirokazu
テキストマイニングで発掘!? 売上とユーザーレビューの相関分析
by
Shintaro Takemura
推薦システムになにができるのか - Techcompass
by
Yoshifumi Seki
勉強会資料:プログラムもアルゴリズム理解も不要な 機械学習テキストマイニング
by
Masahiro Yamaguchi
RでTwitterテキストマイニング
by
Yudai Shinbo
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
by
The Japan DataScientist Society
RではじめるTwitter解析
by
Takeshi Arabiki
20141022 リサーチ向け・ブラウザだけでスクレイピング(浅野)
by
Hirosuke Asano
第二回データサイエンティスト木曜勉強会20141016
by
Koichiro Kondo
プログラマのための文書推薦入門
by
y-uti
Twitterインフルエンサー影響力測定サービスの現状と課題
by
Hirosuke Asano
さくっとはじめるテキストマイニング(R言語) スタートアップ編
by
Yutaka Shimada
Spark Streamingを使ってみた ~Twitterリアルタイムトレンドランキング~
by
sugiyama koki
さくさくテキストマイニング入門セッション
by
antibayesian 俺がS式だ
情報推薦システム入門:講義スライド
by
Kenta Oku
データサイエンティスト協会 木曜勉強会 #04 『クラスター分析の基礎と総合通販会社での活用例 〜 ビッグデータ時代にクラスター分析はどう変わるか 〜』
by
The Japan DataScientist Society
機械学習によるデータ分析まわりのお話
by
Ryota Kamoshida
Similar to 20130916第3回テキストマイニングシンポジウム資料(浅野)
PDF
参院選の事例で見るTwitter分析の現状と課題(#TokyoWebmining)
by
Hirosuke Asano
PPTX
ネット選挙分析振り返り@Tokyo webmining 35th
by
mikio wakafuji
PDF
2014日本公共政策学会報告資料「ネット選挙運動解禁の成果と課題 ――競合する『動員』と『透明化』」
by
亮介 西田
PPT
情報ネットワーク法学会第13回研究大会第4分科会「インターネット選挙運動の回顧と展望」報告資料
by
亮介 西田
PPTX
ネット選挙大分市選管
by
Yuki Fujino Oita Univ.
PDF
インターネット運動解禁、その現状と課題(2013年3月)
by
Haruki Tanimoto
参院選の事例で見るTwitter分析の現状と課題(#TokyoWebmining)
by
Hirosuke Asano
ネット選挙分析振り返り@Tokyo webmining 35th
by
mikio wakafuji
2014日本公共政策学会報告資料「ネット選挙運動解禁の成果と課題 ――競合する『動員』と『透明化』」
by
亮介 西田
情報ネットワーク法学会第13回研究大会第4分科会「インターネット選挙運動の回顧と展望」報告資料
by
亮介 西田
ネット選挙大分市選管
by
Yuki Fujino Oita Univ.
インターネット運動解禁、その現状と課題(2013年3月)
by
Haruki Tanimoto
20130916第3回テキストマイニングシンポジウム資料(浅野)
1.
2013参院選 ネット選挙での分析業務の現場から 第3回 テキストマイニング・シンポジウム 2013.9.12 株式会社ホットリンク 浅野弘輔
2.
自己紹介
3.
浅野 弘輔(あさの ひろすけ) http://twitter.com/hirosuke_asano http://www.facebook.com/asanohirosuke 大学・大学院時代に統計工学とデータマーケティングを専攻。 システム開発会社を経て株式会社ホットリンクに所属 ソーシャルメディア分析ツール
を開発 現在はソーシャルデータの活用のための研究開発に従事 ウェブとデータとゲームが大好物!
4.
株式会社ホットリンク “Make Internet Hotto” 「ほっとする情報社会」を目指し 企業と生活者の共創を支援する マーケティングテクノロジー企業です。
5.
インターネット上の口コミを日々収集し、 オンデマンドで分析・レポーティングするサービス 今、みんなが何を考えているか分かる瞬間世論調査 当時、みんなが何を考えていたか分かるタイムマシン 曰く
6.
2009年の衆議院総選挙から 選挙分野への応用をテーマに研究開始 マーケティング、風評リスク管理、 キャンペーンの効果測定など 利用目的 累計600社以上に導入 「ソーシャルメディア分析と言えば係長」 実績 そして
7.
本日、お話したいこと 1.ネット選挙解禁までのホットリンクの取り組み 2.プロモーションとしての分析からビジネスとして の分析で変わったこと 3.期待されたこと/できたこと/できなかったこと
8.
2009年 第45回衆議院議員総選挙 2010年 第22回参議院選挙
9.
選挙結果を ネットのクチコミから予測 ホットリンク ・ソーシャルデータの収集と提供 ・キャンペーンサイトの開発と運用 ・プロモーション 東京大学 松尾研究室 ・予測モデルの研究と予測システムの提供 産学連携
10.
2012年 第46回衆議院議員総選挙 政党・党首に対する世論の反応を ソーシャルデータから指標化 ホットリンク ・ソーシャルデータの収集と提供 Le Grand ・評価指標の作成 ・キャンペーンサイトの制作・運営 ・プロモーション
11.
2013年 第23回参議院選挙 ネット選挙解禁 ※インターネット選挙運動解禁に係る公職選挙法の一部を改正
12.
ネット選挙解禁で出来るようになったこと を使った ウェブサイト ブログ公式サイト etc… 選挙運動 投票を呼び掛ける行為 「〇〇さんを当選させよう!」 「〇〇さんに清き一票を!」
13.
ネット選挙解禁を受けて ホットリンクにも お声が掛かるようになりました。 それまでの地道な メディア露出が実を結び
14.
プロモーションとしての 選挙のソーシャルデータ分析 立ち位置の変化 今まで ビジネスとしての 選挙のソーシャルデータ分析 今回
15.
2.プロモーションとしての分析から ビジネスとしての分析で 変わったこと
16.
前回まで 新しい技術の研究(自前 or 産学連携) 研究成果をコンテンツとして見える化 新しい取り組みの実績を作る メディアに取り上げてもらう 目的 「面白いね!」と思ってもらう 大事な点 やること
17.
前回まで ◆メッセージ性 ・なぜそれをするのか ・その先に何があるのか ◆話題性 ・それをメディアが取り上げる理由 「面白いね!」の要素 ★所詮、他人ごと ホットリンクがやっていること
18.
今回、選挙予測はやりませんでした
19.
今回 データや分析結果を使ってもらう ビジネス化(お役に立って対価を頂く) ソーシャルデータ提供の採用実績を作る 目的 やること 大事な点 使ってもらう
20.
今回 ◆安心 ・分かり易い ・よく分からないモノは使ってもらえない (コンテンツの場合は、完全に理解されるとかえってつまらないモノになる) ・とりあえず使える ・お話だけじゃなくて、具体的なモノが確認できる ・データの信頼性 ・あると思っているものがちゃんとある (出来ないことや問題は都度伝え、相手の期待値と現実を合わせる) 使ってもらうためには ★(相手側の)自分事になる 自分(メディア)が発信する情報のソースである 自分(政党)がアクションを取るのに必要な情報である
21.
「面白いね!」 と言ってもらっても そのままビジネスには ならない
22.
が今回やったこと ホットリンク
23.
メディア(新聞社・TV) データ・分析結果の提供
24.
メディア(新聞社・TV) データ・分析結果の提供 ・政党、立候補者の情報にソーシャルアカウントを紐付け ・候補者の口コミ、公式アカウントの発言内容を収集 ・政策関連キーワードを選定し、ソーシャルメディアの口コミを収集 API/ファイル連携で提供
25.
政党(政党・代理店) ダッシュボード・アプリケーション
26.
政党(政党・代理店) ダッシュボード・アプリケーション ・政党、立候補者の情報にソーシャルアカウントを紐付け ・候補者の口コミ、公式アカウントの発言内容を収集 ・政策関連キーワードを選定し、ソーシャルメディアの口コミを収集 ・政党・政策・候補者のクチコミ分析と公式アカウント分析を ダッシュボード化 ・Twitter上のクチコミの雰囲気が感じられるアプリケーション化
27.
今回は ・データの精度とカバレッジを上げること ・それを上手く表現すること を中心に行った。
28.
選挙を扱う上で注意する点 報酬の支払いが買収になるケース ×主体的・裁量的に企画や運動に係り対価を貰う 〇ボランティアとして無報酬で主体的に関わる 〇主体的・裁量的でない、機械的な監視など 人気投票の公表の禁止 ×Webアンケートなどの結果を公開する 〇結果を公開しないアンケート調査 〇人気投票ではない調査(クチコミ予測)
29.
テキストマイニングは こんなところで 使ってました。
30.
Tweetのマッピング Userのプロフィール情報のテキストを解析し て所在都市を推定 座標に変換して地図上にマッピング TweetのGeo情報だとカバー率が少ない
31.
各メディアの話題語 ブログ/Twitter/2ch/ネットニュースで前日話題になったキーワードを それぞれでランキングして比較
32.
各メディアの話題語 出現数順だとノイズに弱い ノイズを除去してキーワードの特徴量(話題指数)を評価 単純出現数 話題指数
33.
各メディアの話題語 出現数順だとノイズに弱い ノイズを除去してキーワードの特徴量(話題指数)を評価 単純出現数 話題指数
34.
ニュースに対する世間の反応の可視化 センチメント分析を使って リアルタイムなポジネガの割合をグラフ化
35.
スパムフィルタのイメージ スパムの排除 長年の運用により進化したホットリンクのスパム排除技術
36.
分析の縁の下を 支えています
37.
3.期待されたこと 出来たこと 出来なかったこと
38.
ネット選挙(運動)解禁に期待されたこと ・ネット上での議論で政策論が深まるのではないか ・有権者の関心が高まって投票率があがるのではないか 本件と混同しやすいが、 違う内容なので割愛
39.
ネット選挙のソーシャルデータ分析に 期待されたこと 1.誹謗中傷などの風評リスク対策 2.ソーシャルメディア上の候補者の動きや反響の把握 3.有権者が関心を持っている話題の把握 4.ネット選挙でどんな取り組みが効果があったのか
40.
1.誹謗中傷などの風評リスク対策 【概要】 主に政党から。 候補者に対する誹謗・中傷などのカキコミを早期に把握、 対応する必要があれば反論や訂正などを行う。 【やったこと】 風評リスク監視。 一般企業向けの風評リスク監視とやることは同じ。 【結果】 結果的には、当初心配したような目立った事象は起きなかった。
41.
2.ソーシャルメディア上の候補者の動きや反響の把握 【概要】 主にメディア向けで、報道やコンテンツなどの元ネタとして使う。 ネット選挙で、政党や候補者がどう動いたのかを把握。 【やったこと】 候補者のソーシャルアカウントの特定とモニタリング 一元的に正確な情報がまとまっているソースは無いので、政党のWebサイトや 候補者のWebサイトなどを回って泥臭くチェック 【結果】 収集したデータが、ニュースや記事のネタに使われたり、コンテンツになったりした。 選挙区ごと、政党ごとの動きを網羅的に掴むのに役立った。
42.
【課題】 候補者ごとに、ソーシャルアカウントを開設しなかったり、Twitterがメイン だったり、Facebookも個人ページを使う候補とFacebookページを使う候補 など、かなりバラツキがあった(前提が違うので数値的な比較が難しい)。 選挙期間中、Facebookの個人ページの記事に対するコメント数が仕様変 更で取れなくなるなどのトラブルもあった(Facebookページは取れる)。 2.ソーシャルメディア上の候補者の動きや反響の把握
45.
3.有権者が関心を持っている話題の把握 【概要】 政党、メディア両方から 有権者は、どんな問題に関心があるのか 【やったこと】 ブログ/Twitter/2ch/ネットニュース/TVで話題になっているキーワードの抽出 政策に関するキーワードに関するクチコミの定点観測 候補者にiPadを配布し、経済情報や政党に関するTwitterのクチコミなどをリアルタイム に見れるアプリを作った(クチコミ部分を担当)。 【結果】 TV討論や演説でのコミュニケーションを変えた。 有権者の興味関心に応じて、政策説明のパンフレットで強調する政策を変えた。 iPadで経済が上向いたことを示すデータなどを配信し、該当演説の際に活用。
48.
【課題】 特定キーワードの定点観測はキーワードの選定が設定した人のセンスに 依存する。 ノイズ(関心事とは違う文脈で出るとか)の除去。 3.有権者が関心を持っている話題の把握
49.
4.ネット選挙でどんな取り組みが効果があったのか 【概要】 政党、メディア両方から ネット選挙では、どんなやり方が有効だったのか知りたい。 【できなかった】 ・正解データと言えるのが開票結果のみ。 ・仮説を立てても、検証できなければ結果論でしかない。
50.
ブログでの「累計」話題量 (Source: クチコミ@係長) • 7/13の佐々木俊尚氏とのTwitter討論などを活用 し、終盤戦で一気に話題量を伸ばしトップ当選の丸 川候補を引き離す。 •
しかしながら、民主党内での候補者調整の遅れが 響き、次点に泣く。 仮説1:鈴木寛候補のネット戦略は成功だった
51.
ブログでの「日次」話題量 (Source: クチコミ@係長) • 7/13の佐々木俊尚氏とのTwitter討論などで、一時的 に話題量は増えるも拡散性は弱く、終盤は失速。 •
丸川候補は、話題の絶対量では劣るものの、投票日に かけて一気にヤマを作り、その勢いのままトップ当選を 果たす。 仮説2:鈴木寛候補のネット戦略は失敗だった
52.
当選すれば成功、落選すれば失敗か
53.
もし、選挙期間中の支持率が分かったとしたら 実際に投票が行われる 詳細な票数も公表される 大手メディアの情勢調査等 抽象的な表現で発表 落選したが選挙運動 は失敗と言えるのか 当選したが選挙運動 は成功といえるのか 投・開票日公示日 A候補 B候補 当選 落選 日程 支持率
54.
【課題】 開票数の1点だけでは、選挙運動というプロセスの評価は難しい 複数点で精度の高い観測しているのは、各新聞社の情勢調査(RDD方式 による電話調査)だが、詳細は非公開なので数値で評価することは難し い。 ニコニコ動画の「ネット世論調査」が公示日の前後で情勢調査を行い、当 確予測の精度も高かったので注目したい(詳細が非公開なのは同じ)。 4.ネット選挙でどんな取り組みが効果があったのか
55.
2013参院選のネット選挙を振り返って
56.
• ネット選挙運動解禁の流れは、当初心配していた問題が起 きなかったので今後も続く。 ・ ソーシャルメディアの観測データは今後重要になっていく。 ソーシャルデータは観測の精度向上が先ず重要(エンジニア リングやオペレーションの領域)。 ニーズに合わせてどう表現するかが次に重要。 予測や要因分析(R&Dの領域)はまた次の課題。 ・
世間ウケするネタとビジネスになるネタの差を意識するのは 重要。
57.
ご清聴ありがとうございました。
Download