1. Advanced statistical
visualization
Kimmo Vehkalahti
(acting) Professor, University of Helsinki
Department of Social Research, Statistics
http://www.helsinki.fi/people/Kimmo.Vehkalahti
24263 Information Design and Visualization
Aalto University, Department of Media
20 November 2012
1 / 21
2. Outline
1. Introduction
some recent findings (30 years after Tufte’s book #1)
2. Examples of advanced statistical visualization
typically required: advanced statistical methods
3. Statistical visualization using Muste
working through some of my examples in the
Visualizing Knowledge conference (17 Sep 2012)
http://tietonakyvaksi.fi/
2 / 21
3. Volkswagen on Suomen ostetuin
0 3000 6000 9000
kpl
Volkswagen 9417
Opel 9169
Toyota 8925
Nissan 7291
Ford 6651
Ensirekisteröidyt automerkit Suomessa 1-12/94
Lähde: kaikki autot VTKK/AR 1-12/1994.
3 / 21
4. Presidentin vaalien (2006) 1. kierros
0 500000 1000000 1500000
annettujen äänien lukumäärä
Tarja Halonen 46.3%
Sauli Niinistö 24.1%
Matti Vanhanen 18.6%
Heidi Hautala 3.5%
Timo Soini 3.4%
Bjarne Kallis 2.0%
Henrik Lax 1.6%
Arto Lahti 0.4%
yhteensä 3 016 801 annettua ääntä
4 / 21
5. Presidentin vaalien (2006) 1. kierros
0 0.5 milj. 1 milj. 1.5 milj.
annettujen äänien lukumäärä
Arto Lahti
Henrik Lax
Bjarne Kallis
Timo Soini
Heidi Hautala
Matti Vanhanen
Sauli Niinistö
Tarja Halonen
yhteensä 3 016 801 annettua ääntä
5 / 21
6. Presidentin vaalien (2006) 1. kierros
46.3%
24.1%
18.6%
Tarja Halonen
Sauli Niinistö
Matti Vanhanen
Heidi Hautala
Timo Soini
Bjarne Kallis
Henrik Lax
Arto Lahti
yhteensä 3 016 801 annettua ääntä
6 / 21
7. Excel-lent?! (Definitely not advanced!)...jotta ne eivät kohoa ja pullistu pilalle!
Sama tilasto Excelin 3D-kuvaksi leivottuna – yök!
Voittiko Matti Vanhanen muka vaalien 1. kierroksen?
7 / 21
10. Helsingin keskilämpötila kuukausittain 1829 - 2003
tammi helmi maalis huhti touko kesä heinä elo syys loka marras joulu
-20
-15
-10
-5
0
+5
+10
+15
+20
+25
Lämpötila(˚C)
1846
1856
1867
1871
1876
1880
1888
1914
1961
1987
10 / 21
11. Suomalaisten tehot ja kuviot NHL:ssä 2000-2001
Teemu Selänne Sami Kapanen Saku Koivu Janne Niinimaa Jere Lehtinen
Teppo Numminen Antti Laaksonen Tomi Kallio Kimmo Timonen Jyrki Lumme
Mikko Eloranta Juha Ylönen Ville Nieminen Janne Laukkanen Mika Alatalo
Olli Jokinen Ossi Väänänen Jarno Kultanen Jere Karalahti Juha Lind
Aki-Petteri Berg Sami Helenius
Vähintään puolet runkosarjan otteluista pelanneet
MUUTTUJAT: Vaihdot/ottelu
Tehdyt maalit Laukaukset
Annetut maalisyötöt Laukaus-%
Pisteet (maalit+syötöt) Taklaukset
+/- -pisteet Kiekonmenetykset
Jäähyminuutit Kiekonriistot
11 / 21
13. Economic indicators for 45 world cities in 1991
BigMac
Bread
WorkHrs
VacDays
BusFare
Service
TeachSal
TeachTax
EngSal
EngTax
Union Bank of Switzerland and The Economist
BigMac
Bread
WorkHrs
VacDays
BusFare
Service
TeachSal
TeachTax
EngSal
EngTax
Minutes of labor to buy a BigMac and fries
Minutes of labor to buy 1 kg bread
Ave hours worked per year
Ave days vacation per year
Lowest cost of 10 km public transit
Annual cost of 19 services
Primary teacher salary, 1000s
Tax rate paid by primary teacher
Electrical eng annual salary, 1000s
Tax rate paid by engineer
13 / 21
14. Buying a Big Mac and fries in 45 world cities
5 10 15 20 30 45 60 90 120 180 240
Minutes of labor to buy 1 kg bread
15
20
30
45
60
90
120
180
240
Minutes of labor to buy a Big Mac and fries
15
20
30
45
60
90
120
180
240
Amsterdam
Athens
Bogota
Bombay
Brussels
Buenos Aires Caracas
Chicago
Copenhagen
Dublin
DusseldorfFrankfortGeneva
Helsinki
Hong Kong
Houston
Johannesburg
Kuala Lumpur
Lagos
London
Los AngelesLuxembourg
Madrid
Manila
Mexico City
Milan
Montreal
Nairobi
New York
Nicosia
Oslo
Panama
Paris
Rio de Janeiro
Sao Paulo
Seoul
Singapore
Stockholm
Sydney
TaipeiTel Aviv
TokyoToronto
Vienna
Zurich
14 / 21
16. EU-maiden hierarkinen ryhmittely
Squared Euclidian Distance; Complete Linkage Clustering
EU:n tulevaisuuden tavoitteet -kysely Brysselin edustustoille (HS 1996)
Benelux
Komissio
Itävalta
Kreikka
Espanja
Portugali
Suomi
Ruotsi
Tanska
Irlanti
Saksa
Ranska
Italia
Britannia
Mustonen (1996), s. 154
16 / 21
21. Bibliography
Cleveland, William S. (1994). The Elements of Graphing Data, Hobart Press.
Cleveland, William S. (1993). Visualizing Data, Hobart Press.
Kuusela, Vesa (2000). Tilastografiikan perusteet, Edita.
Mustonen, Seppo (1996). Survo ja minä. www.survo.fi/kirjat
Robbins, Naomi B. (2005). Creating More Effective Graphs, Wiley.
Spence, Ian (2005). No Humble Pie: The Origins and Usage of a Statistical
Chart. Journal of Educational and Behavioral Statistics, 30, 353–368.
Tufte, E. R. (2006). Beautiful Evidence, Graphics Press.
Tufte, E. R. (1997). Visual Explanations, Graphics Press.
Tufte, E. R. (1990). Envisioning Information, Graphics Press.
Tufte, E. R. (1983). The Visual Display of Quantitative Information.
Tukey, J. W. (1977). Exploratory Data Analysis, Addison-Wesley.
Vehkalahti, K. (2008). Kyselytutkimuksen mittarit ja menetelmät, Tammi.
Wainer, Howard (2000). Visual Revelations, Lawrence Elbaum.
Wilkinson, L. (1999). The Grammar of Graphics, Springer.
The Best and Worst of Statistical Graphics. http://datavis.ca/gallery/
Friendly, M. & Denis, D. J. (2001). Milestones in the history of thematic
cartography, statistical graphics, and data visualization.
http://www.datavis.ca/milestones/
21 / 21