Miten luet ja tulkitset tilastoja, Jukka Hoffren, Tilastokeskus
1. Miten luet ja tulkitset
tilastoja?
Tutkitun tiedon teemavuoteen 2021
Jukka Hoffrén
Tutkimuspäällikkö
Tilastokeskus
1
26.1.2021 Jukka Hoffrén, Tilastokeskus
2. 2
Jukka Hoffrén, Tilastokeskus
26.1.2021
– Tilastojen käyttäjät hakevat yksinkertaisia vastauksia vaikeisiin kysymyksiin, joskus myös
lopullisia ja ehdottomia totuuksia. Yhteiskuntatilastoihin liittyy kuitenkin paljon
epävarmuuksia. Niitä pyritään hallitsemaan erilaisin tilastotieteellisin menetelmin.
– Tilastojen lukutaito on tilaston käyttäjän taitoa ja kykyä ymmärtää ja perustella
näkemyksiään datalla. Tilastojen lukutaito mahdollistaa tilastotiedon kriittisen arvioinnin.
Tilastojen lukutaito on myös avuksi epävarmuuden hallinnassa.
– Lukutaito –terminä tuli yleiseen käyttöön informaatioyhteiskunnan myötä ja sillä
tarkoitetaan yksilöiden kykyä etsiä, omaksua ja soveltaa työssään tarvitsemaansa
informaatiota jatkuvasti muuttuvassa ja teknologisesti kehittyvässä yhteiskunnassa.
– Tilastojen lukutaito on demokraattisen kansalaisyhteiskunnan toiminnan perusta. Taito on
välttämätön kansalaisille, jotta he ymmärtäisivät mediassa ja netissä esitettyjä
tilastosisältöjä. Alhaisen lukutaidon katsotaan johtavan vaikeuksiin selviytyä nykyisessä
työelämässä.
Miksi tilastoja luetaan
3. 3
Jukka Hoffrén, Tilastokeskus
26.1.2021
Tilastojen ominaisuuksia
– Tilastot perustuvat suurten joukkojen määrälliseen
mittaamiseen. Se paljastaa mutta myös kätkee asioita.
Laadullinen tutkimus nostaa usein esiin syvempiä
tutkittavien henkilöiden näkökulmia ja subjektiivisia
kokemuksia ja vaikuttimia.
– Tilastoille on keskeistä kuvattavien ilmiöiden
käsitteellistäminen: mitä ovat esim. talous, bkt, työllisyys,
hyvinvointi, terveys, osallisuus, koulutus.
– Tilastojen näkökulma ja käsitteet jäsentävät maailmaa.
Ne myös ohjaavat ihmisten toimintaa. Tilastoja laaditaan
ilmiöistä, joita pidetään tärkeinä. Siitä mistä ei ole
tilastoja, ei osata ottaa huomioon.
– Tilastot määrittelevät osaltaan mikä on tavoiteltavaa ja ne
tähtäävät hallintaan ja päätöksentekoon.
4. 4
Jukka Hoffrén, Tilastokeskus
26.1.2021
– Yhteiskunnan ilmiöitä kuvaavia käsitteitä esim.
inflaatio, työttömyys, bkt,
– Tutkimusmenetelmiä, esim. mikä on kokonais- ja
otantatutkimuksen ero,
– Tilastollisia tunnuslukuja, kuten moodi, mediaani,
varianssi, vaihteluväli,
– Tiedon visualisointia ja tulkitsemista sekä
– Tietolähteiden luotettavuutta ja käyttökelpoisuutta.
Tiedonkäyttäjän tulee ymmärtää:
5. 5
Jukka Hoffrén, Tilastokeskus
26.1.2021
– Virallinen tilasto on luotettava tietolähde: Yhteiskunnallisia oloja
kuvaileva tieto on tuotettu tilastotieteellisesti perustellulla
menetelmällä ja sen viitekehys on yhteiskuntatieteissä.
– SVT laatukriteerit: Puolueettomuus ja läpinäkyvyys, laadun hallinta,
tietosuoja, tehokkuus, relevanssi, tarkkuus ja luotettavuus, ajantasaisuus ja
oikea-aikaisuus, yhtenäisyys ja vertailukelpoisuus, saatavuus ja selkeys.
– SVT tilastot sisältävät laatuselosteen luotettavuudesta,
tarkkuudesta, virhelähteistä ja sopivuudesta eri käyttötarkoituksiin.
– Tilastot ovat riippumattomasti tuotettu läpinäkyvän julkisen
valvonnan alaisena.
– Perustuvat tilastoammattilaisten ammattietiikkaan.
– Ovat vertailukelpoisia ajallisesti, alueellisesti ja kansainvälisesti.
– Tilastotieto on toistuvaa ja kumuloituvaa: Uudet
tulokset harvemmin yllättävät, vaan ne täydentävät
vallitsevaa kuvaa todellisuudesta.
– Kuitenkin joskus uudet tiedot eivät ole yhteensopivia vanhojen kanssa, vaan
joudumme muuttamaan käsityksiämme.
Tilastojen luotettavuus
6. 6
Jukka Hoffrén, Tilastokeskus
26.1.2021
– Tilastoaineisto kertoo mitä on tapahtunut
mutta monesti kiinnostavampi kysymys on
miksi näin on tapahtunut. Miksi -kysymyksiin
aineistosta ei usein suoraan saada vastausta
ja vaaditaan tulkintaa.
– Ensimmäisen tulkinnan tekee yleensä tilaston tekijä. Monesti tulkinta
on hyvin riippuvainen asiayhteydestä.
– Tilastojen käyttäjät ovat monimuotoinen ja osaamiseltaan hyvinkin
epäyhtenäinen ryhmä. Tilastojen käyttäjien erilaiset taustat ja
tulokulmat ilmiöihin ja niitä kuvaaviin tilastoihin vaikuttavat tulkintaan.
– Ei ole aina selvää että tilastojen käyttäjät ymmärtävät tuotettuja
tilastoja tai että he osaisivat suhtautua niihin asianmukaisen
kriittisesti.
Tilastojen tulkinta
7. Esimerkki tulkinnasta
7
Jukka Hoffrén, Tilastokeskus
26.1.2021
–Tutkimuksen mukaan tietyllä alueella keskitulo/henkilö nousi
selvästi kahden vuoden aikana.
–Mitä siis tapahtui?
–Kaikkien asiakkaiden tulot nousivat
–Jonkin ryhmän tulot kasvoivat, muiden pysyivät ennallaan
–Köyhät kuolivat tai muuttivat pois
–Alueelle muutti rikkaita
–Kotitalouksien tulot pysyivät ennallaan, mutta henkilömäärä
muuttui, kun lapset muuttivat pois
8. 8
Jukka Hoffrén, Tilastokeskus
26.1.2021
Tilastojen käyttöön liittyvät erilaiset
lukutaidot
Tilastojen käyttöön liittyvät erilaiset lukutaidot
Numerotaito (Numeracy)
Tilastonlukutaito (Statistical Literacy)
Datanlukutaito (Data literacy)
Tilastojen lukemisen taito (The Art of Reading Statistics)
– Numerotaidossa on kysymys lukujen suuruusluokkien ymmärtämisestä sekä lukujen välisten
perussuhteiden (erityisesti prosenttilukujen, erojen ja muutosten suuruuksien)
ymmärtämisestä.
– Tilastonlukutaito tarkoittaa ihmisten kykyä tulkita ja kriittisesti arvioida tilastotietoa ja dataan
perustuvia argumentteja, joita esiintyy erilaisissa medioissa, ja kykyä käydä keskustelua
näkemyksistään tilastoinformaation pohjalta.
– Datalukutaito tarkoittaa kykyä lukea, luoda ja välittää dataa informaationa.
– Tilastojen lukemisen taito: tilastollisen ajattelun perusteiden hallinta, tilastollisten esitysten
tulkinta- ja arviointitaito, tilastojen ilmiöitä koskevien käsitteiden ja määritelmien merkityksen
ja rajoitusten ymmärtäminen, tiedon tuotantoprosessin tunteminen ja vaikutusten arviointi
sekä tilastollisten tietolähteiden tunteminen ja kriittinen arviointi.
9. Esimerkki: Harhaanjohtamista vai ei?
9
Jukka Hoffrén, Tilastokeskus
26.1.2021
– Valtiovarainministeriö julkaisi
Twitterissä 28.2.2017 kuvion jonka
tarkoitus oli kertoa työttömien määrän
kasvaneen, vaikka avoimien
työpaikkojen määrä on lisääntynyt.
– Kuvion piti havainnollistaa kohtaanto-
ongelmaa: vaikka työpaikkoja on tullut
lisää, niin lisää on tullut myös
työttömiä. Tämä tarkoittaisi sitä, että
työttömien taidot eivät istu syntyneiden
työpaikkojen vaatimuksiin.
– Pintapuolisella vilkaisulla kuvio antaa
lukijalle sellaisen mielikuvan, että
avoimia työpaikkoja olisi suunnilleen
yhtä paljon kuin työttömiä
työnhakijoita. Tästä on vedetty
sellaisia johtopäätöksiä, että grafiikalla
yritettäisiin väittää, että jokaiselle
halukkaalle kyllä löytyy töitä.
10. 10
Jukka Hoffrén, Tilastokeskus
26.1.2021
– Grafiikan ongelma on, että se esittää kaksi
eriasteikkoista muuttujaa: samassa kuvassa
ovat työttömien määrä (satoja tuhansia) ja
työpaikkojen määrä (kymmeniä tuhansia).
– Jos lukija ei huomaa, että kuvaajassa on kaksi
eri asteikkoa, näyttää siltä , että työpaikkojen
määrä ja työttömien määrä olisivat kohdanneet
vuosina 2009 ja 2015 sekä muutenkin olleen
pitkään lähellä toisinaan.
– Sosiaalisessa mediassa syntyi laaja keskustelu,
jossa Valtiovarainministeriötä kritisoitiin
harhaanjohtavan tiedon jakamisesta. Grafiikkaa
epäiltiin jopa tarkoitushakuiseksi
harhauttamiseksi.
– ”Jokainen työmarkkinoita tunteva tietysti tietää,
ettei näin ole. Kaavioissa ei esitetä väärää
tietoa, eikä siinä ole teknistä vikaa.”
– Grafiikan tekijän mukaan kuvion tarkoitus ei ole
väittää, että avoimia työpaikkoja olisi tarjolla
riittävästi kaikille halukkaille työnhakijoille.
”Grafiikassa käytetään kahta asteikkoa, jotta
avointen työpaikkojen ja työttömien määrän
vertailu ylipäänsä olisi visuaalisesti mahdollista”,
puolustaa tekijä kuvaajaa.
11. 11
Jukka Hoffrén, Tilastokeskus
26.1.2021
➢Tietämättömyys: ei tietoa tilastoista, numerotaidottomuus, ei
osata kytkeä tilastoja käytännön tilanteeseen.
➢Käyttövaikeudet: tilasto vaikeasti löydettävissä, tilastot
vaikeatajuisia, tilaston huono laatu, luotetaan liikaa
yksittäiseen tietoon.
➢Vääristelyn halu: lähteiden valikoiminen, tulkinnan vääristely
oman maailmankuvaa tukeviksi tai omaksi hyväksi.
➢Huolimattomuus ja kiire: ei malteta tutusta tilastoihin vaan
kiirehditään tekemään tulkintoja ja johtopäätöksiä. Esim.
Some.
Tilastojen väärinkäytön takana
12. 12
Jukka Hoffrén, Tilastokeskus
26.1.2021
Some ja media ovat yhä enemmän nopeita
ja spontaaneja tiedonvälittäjiä. Ne pyrkivät
myös nostamaan esille uusia ja yllättäviä asioita, joihin
ei aina löydy heti vahvistusta asiantuntijoilta.
Asiantuntijat joutuvat arvioimaan uusia tuloksia tieteen
alan teorioihin ja kokemuksiinsa perustuen: ovatko
uudet tulokset linjassa aiempien kanssa?
Tässä vaiheessa some, media ja poliitikot ovat
innoissaan jo aikaa sitten rientäneet tekemään
omia päätelmiään.
Some ja media
13. 13
Jukka Hoffrén, Tilastokeskus
26.1.2021
–1. Luotettavuus: Kuka tilaston tai
tiedon on tuottanut?
–2. Uskottavuus: Ovatko teoriapohja,
tutkimuskysymykset
ja käytetyt käsitteet luotettavia?
–3. Tieto on kumuloituvaa: Ovatko
tulokset samankaltaisia aiempien
tulosten kanssa?
–4. Tulkinta: Vastaavatko muiden
asiantuntijoiden ja omat käsitykset
tuloksista tekijöiden tulkintoja?
–Kun kaikkiin kohtiin saa myönteisen
vastauksen, uskaltaa tuloksiin luottaa!
Tilastojen käyttäjän tarkistuslista
14. 14
Jukka Hoffrén, Tilastokeskus
26.1.2021
Tilastojen tulkinta
– Tilastollisten tietolähteiden tunteminen
ja kriittinen arviointi on tärkeää.
– Lähtökohtaisesti SVT-tilastoihin voi
aina huoletta luottaa ja tilastojen
tekijät ovat valmiita keskustelemaan
ja auttamaan niiden tulkinnassa.
– Tilastojen tekijä ei väitä omaavansa
ehdotonta totuutta, vaan kertoo vain
mitä uusia tuloksia käytetyillä
menetelmillä ilmiöstä on saatu selville.
– Luotettaviksi arvioidut tilastot
jatkojalostuvat tiedoiksi, jotka luovat
pohjan yhteiskunnalliselle
keskustelulle, ennusteille ja
päätöksenteolle.
15. 15
Jukka Hoffrén, Tilastokeskus
26.1.2021
–Yksinkertaisia ja varmoja
totuuksia on vähän.
–Todennäköisiä ja
ehdollisia sitäkin
enemmän.
–Tilastotieto tieto vaatii
tulkitsijaltaan valppautta
ja ajattelua.
–Myös omat lähtökohdat ja
ennakkokäsitykset
kannattaa aika ajoin
kyseenalaistaa.
Lopuksi