SlideShare a Scribd company logo
1 of 21
Download to read offline
データ・ビジュアリゼーションの
フロンティアと政治・選挙データへの応用
Keiko Ono, Ph.D.
May 2018
https://www.slideshare.net/keikoono3
1
Introduction
オープン・データ、ビッグ・データ、オープンソー
ス・ソフトウェアなどを核とするデータサイエンス
の手法は社会科学にも浸透しつつある。中でも
データ・ビジュアリゼーションはデータを視覚化
して伝えるという第一義的な目的にとどまらず、
視覚化されたデータから何らかの関係性を見
出す、問いを発見するためのツールとしても注
目されている。この発表ではデータ・ビジュアリ
ゼーションの進化と政治・選挙データへの応用
例を検討し、政治学教育と研究においてのさら
なる活用を提言する。
2
データ・ビジュアリゼーションとは、
データを可視化すること
3
計測・観察した結果を可視化する
ことは古代から行われてきた
政治・経済・選挙データの可視化
古典的なものは折れ線グラフ、円グ
ラフ、棒グラフ
今日のデータVIZは従来のものとどう
違うのか? 何が新しいのか?
5
(1)可視化の材料である「データ」が進化
しつつある
(2)可視化の道具箱が飛躍的に発展して
いる
(3)データ(材料)を取って来る、加工する、
成果物をシェアする、道具を共創するなどの
方法(API, R, Python,Java Script, Github
など)が進んでいる
今日のデータVIZは従来のものとどう
違うのか? この結果として・・・
6
「見る」だけでなく、「理解」する、
「発見」するためのデータVIZ
表(生データ、何らかのSummary
statisticsなど)ではなく、図にして見ること
で得られる発見
可視化(Visualization)の分類 (Hart, 2017)
1. 数学的な可視化 (Mathematical)
2. 科学における可視化 (Scientific)
計測またはシミュレーションによるデータ
1. 医学の例 細胞に色をつけて見えるようにする、
血液の流れをシミュレーションでモデル化など
3.情報の可視化 (Information)
よりダイナミックなデータ、関係性、つながり
7
“It was discovered by Benoit Mandelbrot during his early study of fractals in the
context of the complex dynamics of quadratic polynomials the 1980s, and studied in
greater detail by Douady and Hubbard in the early to mid-80s.” (Science Blog) 8
An example of mathematical visualization
Mandelbrot set
見える化したこ
とが発見につな
がる
表1.可視化の形式(Modes of visualization)
9
視覚化の形式 主役 ユーザーの役割
グラフのレンダリ
ング(Rendering) 目的 フォーマット
プレゼンテーション 作成者
ユーザーはグラ
フを見るだけ
前もって作られて
いる
コミュニケーシ
ョン
スライドやビ
デオ
インターアクティブ ユーザー
データセットも
含め、ユーザー
がコントロール
できる
リアルタイム 発見
インターネッ
トまたはソフ
トウェア
インターアクティ
ブ・ストーリーテ
リング
作成者
とユー
ザー
すでに出来上が
っているデータ
セットの中から
何を視覚化する
か選べる
リアルタイム
発見とコミュニ
ケーション
インターネッ
ト
Adapted from Hart (2017) and Alayón (2015)
プレゼンテー
ションとイン
ターアクティブ
の中間
プレゼンテーション
可視化は広く使わ
れている(インフォグ
ラフィックス、データ
ジャーナリズムな
ど)。
こちらは20世紀から
ある政治学のデータ
(DW-Nominate)に
21世紀のソーシャ
ルメディアデータを
Mashしたもの
(PEW Research Center,
2017)
10
プレゼンテーション可視化の例 ツイッター・アカウントの分析
トランプ支持者と共和党支持者は異なるグループであることがわかる。
12
Narayanan,etal.(2018)
Fruchteran-Reingoldvisualizationalgorithmを用い、
ソフトウェアGraphikaで作成したもの
「プレゼンテーション」可視化は作成者
が伝えたいメッセージを伝えるための
もの。ユーザー(受け手)は見るだけ。
13
「インターアクティブ・ストーリーテリン
グ」は、ユーザーが何をどのように可
視化するか、ある程度決められる。
多くの場合、ソフトウェアのインス
トール不要。ウェブ上で完結する。
インターアクティブ・ストーリーテリングの一例
シリアの内戦によって失われた人命 (GBD Compareなど4つのグラフを組み合わせたもの)
インターアクティブ・ストーリーテリングの一例
日本の都道府県別死亡率(10万人当たり、15-49歳、男女)
岩手
宮城
福島
「インターアクティブ」可視化は3つのう
ちで最もユーザーの自由度が高い
16
その分、イニシャル「コスト」はかか
る
たとえば、Freedom Houseの自由度インデックスと地図
1970年代までさかのぼるデータセットもあるが・・・
17
地図に表示されて
いるのは最新データ。
過去のデータを表
示したい場合、また
は変化をマップした
い場合。データセッ
ト(Excel)をダウン
ロード、整形して
QGISなどに入れる
新しいデータ可視化は大学・大学院教育
と研究に大きな可能性を持っている。すで
に可視化を中心とした政治学メソッドの講義などもされ
ている(Rom 2015)
18
同時に、古典的な可視化ツールの
力も再評価すべき
データを可視化して「見る」ことから生じる発見の例
*大相撲における「Corruption」(Duggan & Levitt,
2002)
*参議院選挙(比例代表)における個人票の分布
“Approximately 26.0 percent of all wrestlers finish with exactly eight wins,
compared to only 12.2 per- cent with seven wins. The binomial distribution
predicts that these two outcomes should occur with an equal frequency of 19.6
percent. The null hypothesis that the probability of seven and eight wins is
equal can be rejected at resounding levels of statistical significance”
19
Duggan, M., & Levitt, S. (2002). Winning Isn’t Everything : Corruption in Sumo
Wrestling. American Economic Review, 92(5), 1594–1605.
判定が本当に
フェアならば、7
勝と8勝の発生
件数は同じはず
日本相撲協会
参議院議員選挙 比例代表の候補別結果
個人への得票が最も多かった候補者から並べたもの
20
0
100,000
200,000
300,000
400,000
500,000
600,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
2016年自民党 n=19
0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
90,000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41
2016年共産党 n=5
0
100,000
200,000
300,000
400,000
500,000
600,000
700,000
800,000
900,000
1,000,000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
2016年公明党 n=7
I’m indebted
to Michael
Cucek for
sharing this
insight
(Cucek,
2017).
2013年
21
0
50000
100000
150000
200000
250000
300000
350000
400000
450000
500000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
2013年自民党 n=18
0
50000
100000
150000
200000
250000
300000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2013年 民主党 n=7
0
50000
100000
150000
200000
250000
300000
350000
400000
1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930
2013年 日本維新の会 n=6
0
200000
400000
600000
800000
1000000
1200000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
2013年公明党 n=7
アントニオ
猪木
結論
伝える、理解する、発見するための可視化ができ
る環境が整いつつある
22
データの進化
オープン・データ、ビッグ・デー
タ、ソーシャル・メディアなど
ツールと環境の進化
オープン・ソース・ソフトウェアなど
たとえば最新の
Excelではサン・
バースト、ツリー
マップができま
す!
Bibliography
Cucek, M. (2017). Update on Japanese Politics. Presented at Temple University Japan.
Hart, J. (2017). Introduction to Data Science. University of Illinois at Urbana Champaign.
Coursera.
Institute for Health Metrics and Evaluation. Healthdata.org
Lima, M. (2015).A visual history of human knowledge
https://www.ted.com/talks/manuel_lima_a_visual_history_of_human_knowledge#t-787352
Vidya Narayanan, Vlad Barash, John Kelly, Bence Kollanyi, Lisa-Maria Neudert, and Philip N.
Howard. “Polarization, Partisanship and Junk News Consumption over Social Media in the US.”
Data Memo 2018.1. Oxford, UK: Project on Computational Propaganda.
Rom, M. C. (2015). Numbers, Pictures, and Politics: Teaching Research Methods Through Data
Visualizations. Journal of Political Science Education, 11(1), 11–27.
http://doi.org/10.1080/15512169.2014.985108
Science Blogs. (2017). http://scienceblogs.com/goodmath/2007/07/11/the-mandelbrot-set-1/
五十嵐ほか。(2017) 新しい可視化表現が自発的かつ継続的に開発されるシビックテック活動の設
計:E2D3におけるアプリケーション・オープンソース・ハッカソンのデザイン。デジタル・プラクティス3223

More Related Content

Similar to Data visualization and its application to politics and elections

20140222_iodd_in_takizawa
20140222_iodd_in_takizawa20140222_iodd_in_takizawa
20140222_iodd_in_takizawaHiroshi Usui
 
技術が自分を変える?! Share
技術が自分を変える?! Share技術が自分を変える?! Share
技術が自分を変える?! ShareMakoto Fujiwara
 
6 Social Good Trends & 10 News-Gathering Tips - #smwtok
6 Social Good Trends & 10 News-Gathering Tips - #smwtok6 Social Good Trends & 10 News-Gathering Tips - #smwtok
6 Social Good Trends & 10 News-Gathering Tips - #smwtokSocialCompany, Inc.
 
20100610 opengov h_okumura
20100610 opengov h_okumura20100610 opengov h_okumura
20100610 opengov h_okumuraHirokazu Okumura
 

Similar to Data visualization and its application to politics and elections (6)

20151031
2015103120151031
20151031
 
20140222_iodd_in_takizawa
20140222_iodd_in_takizawa20140222_iodd_in_takizawa
20140222_iodd_in_takizawa
 
技術が自分を変える?! Share
技術が自分を変える?! Share技術が自分を変える?! Share
技術が自分を変える?! Share
 
6 Social Good Trends & 10 News-Gathering Tips - #smwtok
6 Social Good Trends & 10 News-Gathering Tips - #smwtok6 Social Good Trends & 10 News-Gathering Tips - #smwtok
6 Social Good Trends & 10 News-Gathering Tips - #smwtok
 
20100610 opengov h_okumura
20100610 opengov h_okumura20100610 opengov h_okumura
20100610 opengov h_okumura
 
CSISi10th_seto
CSISi10th_setoCSISi10th_seto
CSISi10th_seto
 

More from Keiko Ono

3-D geospatial data for disaster management and development
3-D geospatial data for disaster management and development3-D geospatial data for disaster management and development
3-D geospatial data for disaster management and developmentKeiko Ono
 
Political science meets computer science
Political science meets computer sciencePolitical science meets computer science
Political science meets computer scienceKeiko Ono
 
人口知能・自然言語処理・社会科学・政治学
人口知能・自然言語処理・社会科学・政治学人口知能・自然言語処理・社会科学・政治学
人口知能・自然言語処理・社会科学・政治学Keiko Ono
 
Data science week_1
Data science week_1Data science week_1
Data science week_1Keiko Ono
 
Data science week_2_visualization
Data science week_2_visualizationData science week_2_visualization
Data science week_2_visualizationKeiko Ono
 
US presidential selection: the Electoral College challenged (again)
US presidential selection: the Electoral College challenged (again)US presidential selection: the Electoral College challenged (again)
US presidential selection: the Electoral College challenged (again)Keiko Ono
 
The latest trends in academic research on GIS
The latest trends in academic research on GISThe latest trends in academic research on GIS
The latest trends in academic research on GISKeiko Ono
 
サーベイに基づく公的データが問題になった2例(2018年)
サーベイに基づく公的データが問題になった2例(2018年)サーベイに基づく公的データが問題になった2例(2018年)
サーベイに基づく公的データが問題になった2例(2018年)Keiko Ono
 
比べてみた関関同立の研究力 Top Kansai private universities' research output
比べてみた関関同立の研究力 Top Kansai private universities' research output 比べてみた関関同立の研究力 Top Kansai private universities' research output
比べてみた関関同立の研究力 Top Kansai private universities' research output Keiko Ono
 
Research analysis waseda_2018
Research analysis waseda_2018Research analysis waseda_2018
Research analysis waseda_2018Keiko Ono
 
Journal analysis SSJJ 2018
Journal analysis SSJJ 2018Journal analysis SSJJ 2018
Journal analysis SSJJ 2018Keiko Ono
 
Journal analysis JJPS_2017
Journal analysis JJPS_2017Journal analysis JJPS_2017
Journal analysis JJPS_2017Keiko Ono
 
How academic research on GitHub has evolved in the last several years
How academic research on GitHub has evolved in the last several yearsHow academic research on GitHub has evolved in the last several years
How academic research on GitHub has evolved in the last several yearsKeiko Ono
 
Multiple regression: creating a dummy variable and an interaction
Multiple regression: creating a dummy variable and an interaction Multiple regression: creating a dummy variable and an interaction
Multiple regression: creating a dummy variable and an interaction Keiko Ono
 
The Russians, the US presidency in peril, and the Mueller investigation
The Russians, the US presidency in peril, and the Mueller investigationThe Russians, the US presidency in peril, and the Mueller investigation
The Russians, the US presidency in peril, and the Mueller investigationKeiko Ono
 
Multiple regression with interaction term 2018
Multiple regression with interaction term 2018Multiple regression with interaction term 2018
Multiple regression with interaction term 2018Keiko Ono
 
Open meteorological data_himeji
Open meteorological data_himejiOpen meteorological data_himeji
Open meteorological data_himejiKeiko Ono
 
Encoding in excel
Encoding in excelEncoding in excel
Encoding in excelKeiko Ono
 
Data tools transform_multiple_dummy
Data tools transform_multiple_dummyData tools transform_multiple_dummy
Data tools transform_multiple_dummyKeiko Ono
 

More from Keiko Ono (20)

3-D geospatial data for disaster management and development
3-D geospatial data for disaster management and development3-D geospatial data for disaster management and development
3-D geospatial data for disaster management and development
 
Political science meets computer science
Political science meets computer sciencePolitical science meets computer science
Political science meets computer science
 
人口知能・自然言語処理・社会科学・政治学
人口知能・自然言語処理・社会科学・政治学人口知能・自然言語処理・社会科学・政治学
人口知能・自然言語処理・社会科学・政治学
 
Data science week_1
Data science week_1Data science week_1
Data science week_1
 
Data science week_2_visualization
Data science week_2_visualizationData science week_2_visualization
Data science week_2_visualization
 
US presidential selection: the Electoral College challenged (again)
US presidential selection: the Electoral College challenged (again)US presidential selection: the Electoral College challenged (again)
US presidential selection: the Electoral College challenged (again)
 
The latest trends in academic research on GIS
The latest trends in academic research on GISThe latest trends in academic research on GIS
The latest trends in academic research on GIS
 
サーベイに基づく公的データが問題になった2例(2018年)
サーベイに基づく公的データが問題になった2例(2018年)サーベイに基づく公的データが問題になった2例(2018年)
サーベイに基づく公的データが問題になった2例(2018年)
 
比べてみた関関同立の研究力 Top Kansai private universities' research output
比べてみた関関同立の研究力 Top Kansai private universities' research output 比べてみた関関同立の研究力 Top Kansai private universities' research output
比べてみた関関同立の研究力 Top Kansai private universities' research output
 
Research analysis waseda_2018
Research analysis waseda_2018Research analysis waseda_2018
Research analysis waseda_2018
 
Journal analysis SSJJ 2018
Journal analysis SSJJ 2018Journal analysis SSJJ 2018
Journal analysis SSJJ 2018
 
Journal analysis JJPS_2017
Journal analysis JJPS_2017Journal analysis JJPS_2017
Journal analysis JJPS_2017
 
How academic research on GitHub has evolved in the last several years
How academic research on GitHub has evolved in the last several yearsHow academic research on GitHub has evolved in the last several years
How academic research on GitHub has evolved in the last several years
 
Multiple regression: creating a dummy variable and an interaction
Multiple regression: creating a dummy variable and an interaction Multiple regression: creating a dummy variable and an interaction
Multiple regression: creating a dummy variable and an interaction
 
The Russians, the US presidency in peril, and the Mueller investigation
The Russians, the US presidency in peril, and the Mueller investigationThe Russians, the US presidency in peril, and the Mueller investigation
The Russians, the US presidency in peril, and the Mueller investigation
 
Multiple regression with interaction term 2018
Multiple regression with interaction term 2018Multiple regression with interaction term 2018
Multiple regression with interaction term 2018
 
Saitama
SaitamaSaitama
Saitama
 
Open meteorological data_himeji
Open meteorological data_himejiOpen meteorological data_himeji
Open meteorological data_himeji
 
Encoding in excel
Encoding in excelEncoding in excel
Encoding in excel
 
Data tools transform_multiple_dummy
Data tools transform_multiple_dummyData tools transform_multiple_dummy
Data tools transform_multiple_dummy
 

Data visualization and its application to politics and elections