SlideShare a Scribd company logo
1 of 16
Download to read offline
Vanhojen aineistojen aarreaitta
Hannu Karhunen,
Jyväskylän yliopiston kauppakorkeakoulu
hannu.a.karhunen@jyu.fi
Tilastokeskus, 20.4.2016
Tässä esityksessä
1. Taustaa
2. Tietojen tallennushistoria
3. Esimerkkejä mahdollisista aineistoista ja vanhojen aineistojen
palauttamisesta
4. Lopuksi: Mitä aineistojen kehittämiseksi voitaisiin tehdä?
19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)2
1. Taustaa
 Jyväskylän yliopiston kauppakorkeakoulu (JSBE) aloitti tutkimusaineistojen
kehittämisen vuoden 2015 alussa
 Epätietoisuutta siitä, että mitä yksilötason aineistoja on säilytetty
 Pelkona, että jos nyt ei toimita, niin vanhoja tietoja ei voida myöhemmin palauttaa
 Tarkoitus kartoittaa ja mahdollisesti palauttaa vanhoja sähköisessä muodossa
olevia aineistoja tutkimuskäyttöön (käytettävissä myös tilastoissa)
 Aineistojen kokoaminen ”moduulimuotoon”
 Tiedon jakaminen tilastoihin ja ulos tutkijoille tärkeää. Aineistot tulevat lopulta
kaikkien tutkijoiden käyttöön
 Käytännössä JSBE alkoi rahoittamaan määräaikaista virkasuhdetta, sillä
tietojen arkaluontoisuuden takia henkilön tulee olla Tilastokeskuksen työntekijä
 Datoissa henkilötunnuksia, henkilöiden nimiä, yritystunnuksia jne.
19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)3
 Myös vanhat aineistot ovat tärkeitä, sillä monilla reformeilla voi olla
kauaskantoisia vaikutuksia.
Esimerkki 1: Yliopistokoulutuksen alueellisen laajentumisen vaikutus koulutuksen periytyvyyteen.
 Kirjoilla missä pääaineessa?
 Isovanhempien, vanhempien ja
lasten koulutus.
 Millä alueilla henkilöt asuivat
ennen reformia?
 Minkä kunnan lukioista henkilöt
valmistuivat reformin aikoihin?
19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)4
Lähde: Karhunen ja Suhonen (2016).
19.4.20165
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
Osuushenkilöistäjoiltapuuttuuäidinid
SYNTYMÄVUOSI
Lapsi-äiti linkityksen epäonnistuminen syntymäkohorteittain
(Varhaisin linkitys on tehty VL70 perhetiedon perusteella)
Esimerkki 2: Aineistoissa on vielä monia ratkaisemattomia ongelmia
19.4.20166
2. Tietojen tallennushistoria
 Tilastokeskuksen vanhat tiedostot on tallennettu ajan kuluessa uuteen
muotoon tallennusmenetelmien muuttuessa
 Esimerkiksi 1970-luvulla tallennettiin reikäkortteja urakalla magneettinauhalle
 ks. ”Reikäkorttimaailmasta verkkoaikaan eli TI 1970-2000” (Juha Merimaa, 2000)
 Koontitiedostot (alkaen noin vuodesta 1995)
 Palautus verkkoasemalle  kuvaukset saadaan valmiilla SAS-makrolla
 Suhteellisen yksinkertaista ja nopeaa
 Ennen koontitiedostoja tehdyt historiatiedostot on myös tallennettu
sähköiseen muotoon
 Puhekielessä monta nimeä, mm. ”historiakasetit”, ”kelatiedostot”, ”nauhat”. Itse
käytän nimeä historiatiedostot.
 Tiedostoja vaihtelevasti 1960-luvun lopulta alkaen
Hannu Karhunen (hannu.a.karhunen@jyu.fi)
 Historiatiedostojen palautus SAS-tiedostoksi mahdollista mikäli aineistosta
löytyy kuvaus
 Tarvitaan tiedoston jaksonpituus ja muuttujapositiot
 Tilastokeskuksen vanhojen aineistojen kuvaukset on tallennettu
kuvatiedostoina ns. HIMA-kansioon; osa käsinkirjoitettua tekstiä
 Tietoa on hävinnyt henkilöiden mukana, mutta pääosin aineistoista
näyttäisi löytyvän kuvaukset (täydentäviä kuvauksia on löytynyt myös
arkistohuoneista)
 Aineistoista ei ole valitettavasti olemassa valmista luetteloa
 Käytännössä tiedostoja pitää palauttaa olemassa olevien kuvauksien
perusteella ja tarkistaa kuvauksen vastaavuudet aineistoon muuttuja
kerrallaan
 Aikaa ja luovuutta vaativaa puuhaa: kuvauksien muuttujapositiot eivät aina
täsmää aineistossa oleviin eli automaattisista SAS-makroista ei ole aina
apua
19.4.20167 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
3. Esimerkkejä mahdollisista aineistoista ja vanhojen
aineistojen palauttamisesta käytännössä
 Kuvaan seuraavaksi muutamia aineistoja, joiden kanssa olen työskennellyt
tai jotka olen jo palauttanut SAS-muotoon
 Esittelyn ei ole tarkoitus antaa kattavaa kuvaa kaikista mahdollisista
aineistoista
 Keskityn nyt lähinnä henkilötason koulutusaineistojen esittelyyn
19.4.20168 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
Toisen asteen
yhteisvalinta-
tiedostot 1985-
Tietoja yliopistojen
hakijarekisteristä
1992-
(Osittainen Harek)
Ylioppilaskirjoitukset
1967-
(ks. esim. 2)
Kansakoulun/oppikoulun
/peruskoulun
vuositiedostot
alkaen 1968
Ammatillisten
oppilaitosten linjatiedot
alkaen 1971
Oppilaitostason tietojaHenkilötason tietoja
Korkeakoulujen
opiskelijarekisteri
1968- (ks. esim. 1)
Lukioiden vuositilastot
alkaen 1969
Siniset moduulit ovat valmiita tai lähes valmiita
Hannu Karhunen (hannu.a.karhunen@jyu.fi)
Tavoitteena oli moduulimuoto ja tietojen linkitettävyys yli ajan
Opintojentuki 2002-
Opettajien
työsuhdejaksotiedot
2010-luvulta
Oppilaitosrekisteri
1971-
Esimerkki 1: Korkeakoulujen opiskelijarekisteri 1968-
19.4.201610 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
Esimerkki 2: Ylioppilastutkintolautakunnan tiedostot 1967-
 Tilastokeskuksen historiatiedostoista löytyy vain hajanaisia
vuositiedostoja ylioppilaskirjoituksista
 Tilastokeskuksen kuvauksista löytyi kuitenkin yksi yhden sivun
tiedostokuvaus vuoden 1971 ylioppilaista ja ylioppilaskirjoituksien
tuloksista
 Yhteydenotto Ylioppilastutkintolautakunnan toimistoon paljasti, että vanhat
vuositiedostot ovat tallessa sähköisessä muodossa vuodesta 1967 alkaen.
Vanhemmista vuositiedostoista ei heillä kuitenkaan ollut olemassa
muuttujakuvauksia.
 Tilastokeskuksesta löytyneen kuvauksen avulla oli mahdollista
selvittää vanhojen tiedostojen muuttujapositiot
 Yhteistyön tuloksena tutkimuskäyttöön saatiin palautettua yksityiskohtainen
aineisto ylioppilaskirjoituksiin osallistuneista henkilöistä 1967-1989
 Tavoitteena saada tutkijakäyttöön päivittyvä YTL-moduuli (tähän liittyvät
neuvottelut YTL:n kanssa vielä kesken)
19.4.201611 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
Säilynyt muuttujakuvaus YTL:n tiedostoista
19.4.2016 Etunimi Sukunimi12
Esimerkki 3: Väestölaskenta 1960 (VL60)
 Tornihuhun mukaan VL60 tuhoutui vesivahingossa
 On kuitenkin todennäköisempää, että VL60:n lomakkeet löytyvät
Hämeenlinnan maakunta-arkistosta. VL50 on myös siellä.
 Ennen kuin reikäkorttikoneet poistuivat käytöstä, niin VL60:n
reikäkortit ajettiin sähköiseen muotoon. Tietääkseni tätä aineistoa ei
ole aikaisemmin käytetty tutkimuksessa (harva edes tietää
sähköisestä versiosta)
 Rajoite: Aineistossa ei ole henkilöille nimiä ja tähän aikaan ei ollut
vielä henkilötunnusta  Datan yhdistäminen myöhempiin VL-
tiedostoihin likipitäen mahdotonta
19.4.201613 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
19.4.201614
Väestölaskenta 1960
4. Lopuksi: Mitä vanhojen aineistojen kehittämiseksi
voitaisiin tehdä?
 Tilastokeskuksen resurssit ovat rajalliset
 Läpikäytävää materiaalia on varsin paljon ja on vaikeaa arvioida mitkä
aineistot ovat tutkimuksellisesti tärkeitä
 Vanhojen aineistojen kuvaukset pitäisi saada näkyviin Tilastokeskuksen
ulkopuolelle
 Palautukset ja aineistojen käsittely ulkopuolisen rahoituksen voimin
 Ehdotuksia?
19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)15
KIITOS!
19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)16

More Related Content

Viewers also liked

الدرس الأول
الدرس الأولالدرس الأول
الدرس الأول
m h
 

Viewers also liked (11)

الدرس الأول
الدرس الأولالدرس الأول
الدرس الأول
 
Suhdanneklubi: Avaus, Kari Rautio
Suhdanneklubi: Avaus, Kari RautioSuhdanneklubi: Avaus, Kari Rautio
Suhdanneklubi: Avaus, Kari Rautio
 
FOET
FOETFOET
FOET
 
Miten tulo- ja varallisuuserot näkyvät tilastoissa, Tarja Hatakka
Miten tulo- ja varallisuuserot näkyvät tilastoissa, Tarja HatakkaMiten tulo- ja varallisuuserot näkyvät tilastoissa, Tarja Hatakka
Miten tulo- ja varallisuuserot näkyvät tilastoissa, Tarja Hatakka
 
Media Theories
Media TheoriesMedia Theories
Media Theories
 
Digitaalisten aineistojen kansallinen kuvausjärjestelmä
Digitaalisten aineistojen kansallinen kuvausjärjestelmäDigitaalisten aineistojen kansallinen kuvausjärjestelmä
Digitaalisten aineistojen kansallinen kuvausjärjestelmä
 
Dissociative identity disorder
Dissociative identity disorderDissociative identity disorder
Dissociative identity disorder
 
Web 2.0 And Media 2.0 Presentation
Web 2.0 And Media 2.0 PresentationWeb 2.0 And Media 2.0 Presentation
Web 2.0 And Media 2.0 Presentation
 
Multiple personality disorder
Multiple personality disorderMultiple personality disorder
Multiple personality disorder
 
Erbium Doped Fiber Lasers
Erbium Doped Fiber LasersErbium Doped Fiber Lasers
Erbium Doped Fiber Lasers
 
Mari Tikkunen - Susien aiheuttamat koiravahingot
Mari Tikkunen - Susien aiheuttamat koiravahingotMari Tikkunen - Susien aiheuttamat koiravahingot
Mari Tikkunen - Susien aiheuttamat koiravahingot
 

More from Tilastokeskus

More from Tilastokeskus (20)

Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, TilastokeskusKasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
 
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
 
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, TilastokeskusMitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
 
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 
TOL2025 - mikä muuttuu? Miten uudistus toteutettiin? Miten muutostarpeet Suom...
TOL2025 - mikä muuttuu? Miten uudistus toteutettiin? Miten muutostarpeet Suom...TOL2025 - mikä muuttuu? Miten uudistus toteutettiin? Miten muutostarpeet Suom...
TOL2025 - mikä muuttuu? Miten uudistus toteutettiin? Miten muutostarpeet Suom...
 
Lääkärien vuokratyö, Heli Udd, Tilastokeskus
Lääkärien vuokratyö, Heli Udd, TilastokeskusLääkärien vuokratyö, Heli Udd, Tilastokeskus
Lääkärien vuokratyö, Heli Udd, Tilastokeskus
 

Vanhojen aineistojen aarreaitta, Hannu Karhunen

  • 1. Vanhojen aineistojen aarreaitta Hannu Karhunen, Jyväskylän yliopiston kauppakorkeakoulu hannu.a.karhunen@jyu.fi Tilastokeskus, 20.4.2016
  • 2. Tässä esityksessä 1. Taustaa 2. Tietojen tallennushistoria 3. Esimerkkejä mahdollisista aineistoista ja vanhojen aineistojen palauttamisesta 4. Lopuksi: Mitä aineistojen kehittämiseksi voitaisiin tehdä? 19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)2
  • 3. 1. Taustaa  Jyväskylän yliopiston kauppakorkeakoulu (JSBE) aloitti tutkimusaineistojen kehittämisen vuoden 2015 alussa  Epätietoisuutta siitä, että mitä yksilötason aineistoja on säilytetty  Pelkona, että jos nyt ei toimita, niin vanhoja tietoja ei voida myöhemmin palauttaa  Tarkoitus kartoittaa ja mahdollisesti palauttaa vanhoja sähköisessä muodossa olevia aineistoja tutkimuskäyttöön (käytettävissä myös tilastoissa)  Aineistojen kokoaminen ”moduulimuotoon”  Tiedon jakaminen tilastoihin ja ulos tutkijoille tärkeää. Aineistot tulevat lopulta kaikkien tutkijoiden käyttöön  Käytännössä JSBE alkoi rahoittamaan määräaikaista virkasuhdetta, sillä tietojen arkaluontoisuuden takia henkilön tulee olla Tilastokeskuksen työntekijä  Datoissa henkilötunnuksia, henkilöiden nimiä, yritystunnuksia jne. 19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)3
  • 4.  Myös vanhat aineistot ovat tärkeitä, sillä monilla reformeilla voi olla kauaskantoisia vaikutuksia. Esimerkki 1: Yliopistokoulutuksen alueellisen laajentumisen vaikutus koulutuksen periytyvyyteen.  Kirjoilla missä pääaineessa?  Isovanhempien, vanhempien ja lasten koulutus.  Millä alueilla henkilöt asuivat ennen reformia?  Minkä kunnan lukioista henkilöt valmistuivat reformin aikoihin? 19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)4 Lähde: Karhunen ja Suhonen (2016).
  • 5. 19.4.20165 0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00 Osuushenkilöistäjoiltapuuttuuäidinid SYNTYMÄVUOSI Lapsi-äiti linkityksen epäonnistuminen syntymäkohorteittain (Varhaisin linkitys on tehty VL70 perhetiedon perusteella) Esimerkki 2: Aineistoissa on vielä monia ratkaisemattomia ongelmia
  • 6. 19.4.20166 2. Tietojen tallennushistoria  Tilastokeskuksen vanhat tiedostot on tallennettu ajan kuluessa uuteen muotoon tallennusmenetelmien muuttuessa  Esimerkiksi 1970-luvulla tallennettiin reikäkortteja urakalla magneettinauhalle  ks. ”Reikäkorttimaailmasta verkkoaikaan eli TI 1970-2000” (Juha Merimaa, 2000)  Koontitiedostot (alkaen noin vuodesta 1995)  Palautus verkkoasemalle  kuvaukset saadaan valmiilla SAS-makrolla  Suhteellisen yksinkertaista ja nopeaa  Ennen koontitiedostoja tehdyt historiatiedostot on myös tallennettu sähköiseen muotoon  Puhekielessä monta nimeä, mm. ”historiakasetit”, ”kelatiedostot”, ”nauhat”. Itse käytän nimeä historiatiedostot.  Tiedostoja vaihtelevasti 1960-luvun lopulta alkaen Hannu Karhunen (hannu.a.karhunen@jyu.fi)
  • 7.  Historiatiedostojen palautus SAS-tiedostoksi mahdollista mikäli aineistosta löytyy kuvaus  Tarvitaan tiedoston jaksonpituus ja muuttujapositiot  Tilastokeskuksen vanhojen aineistojen kuvaukset on tallennettu kuvatiedostoina ns. HIMA-kansioon; osa käsinkirjoitettua tekstiä  Tietoa on hävinnyt henkilöiden mukana, mutta pääosin aineistoista näyttäisi löytyvän kuvaukset (täydentäviä kuvauksia on löytynyt myös arkistohuoneista)  Aineistoista ei ole valitettavasti olemassa valmista luetteloa  Käytännössä tiedostoja pitää palauttaa olemassa olevien kuvauksien perusteella ja tarkistaa kuvauksen vastaavuudet aineistoon muuttuja kerrallaan  Aikaa ja luovuutta vaativaa puuhaa: kuvauksien muuttujapositiot eivät aina täsmää aineistossa oleviin eli automaattisista SAS-makroista ei ole aina apua 19.4.20167 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
  • 8. 3. Esimerkkejä mahdollisista aineistoista ja vanhojen aineistojen palauttamisesta käytännössä  Kuvaan seuraavaksi muutamia aineistoja, joiden kanssa olen työskennellyt tai jotka olen jo palauttanut SAS-muotoon  Esittelyn ei ole tarkoitus antaa kattavaa kuvaa kaikista mahdollisista aineistoista  Keskityn nyt lähinnä henkilötason koulutusaineistojen esittelyyn 19.4.20168 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
  • 9. Toisen asteen yhteisvalinta- tiedostot 1985- Tietoja yliopistojen hakijarekisteristä 1992- (Osittainen Harek) Ylioppilaskirjoitukset 1967- (ks. esim. 2) Kansakoulun/oppikoulun /peruskoulun vuositiedostot alkaen 1968 Ammatillisten oppilaitosten linjatiedot alkaen 1971 Oppilaitostason tietojaHenkilötason tietoja Korkeakoulujen opiskelijarekisteri 1968- (ks. esim. 1) Lukioiden vuositilastot alkaen 1969 Siniset moduulit ovat valmiita tai lähes valmiita Hannu Karhunen (hannu.a.karhunen@jyu.fi) Tavoitteena oli moduulimuoto ja tietojen linkitettävyys yli ajan Opintojentuki 2002- Opettajien työsuhdejaksotiedot 2010-luvulta Oppilaitosrekisteri 1971-
  • 10. Esimerkki 1: Korkeakoulujen opiskelijarekisteri 1968- 19.4.201610 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
  • 11. Esimerkki 2: Ylioppilastutkintolautakunnan tiedostot 1967-  Tilastokeskuksen historiatiedostoista löytyy vain hajanaisia vuositiedostoja ylioppilaskirjoituksista  Tilastokeskuksen kuvauksista löytyi kuitenkin yksi yhden sivun tiedostokuvaus vuoden 1971 ylioppilaista ja ylioppilaskirjoituksien tuloksista  Yhteydenotto Ylioppilastutkintolautakunnan toimistoon paljasti, että vanhat vuositiedostot ovat tallessa sähköisessä muodossa vuodesta 1967 alkaen. Vanhemmista vuositiedostoista ei heillä kuitenkaan ollut olemassa muuttujakuvauksia.  Tilastokeskuksesta löytyneen kuvauksen avulla oli mahdollista selvittää vanhojen tiedostojen muuttujapositiot  Yhteistyön tuloksena tutkimuskäyttöön saatiin palautettua yksityiskohtainen aineisto ylioppilaskirjoituksiin osallistuneista henkilöistä 1967-1989  Tavoitteena saada tutkijakäyttöön päivittyvä YTL-moduuli (tähän liittyvät neuvottelut YTL:n kanssa vielä kesken) 19.4.201611 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
  • 12. Säilynyt muuttujakuvaus YTL:n tiedostoista 19.4.2016 Etunimi Sukunimi12
  • 13. Esimerkki 3: Väestölaskenta 1960 (VL60)  Tornihuhun mukaan VL60 tuhoutui vesivahingossa  On kuitenkin todennäköisempää, että VL60:n lomakkeet löytyvät Hämeenlinnan maakunta-arkistosta. VL50 on myös siellä.  Ennen kuin reikäkorttikoneet poistuivat käytöstä, niin VL60:n reikäkortit ajettiin sähköiseen muotoon. Tietääkseni tätä aineistoa ei ole aikaisemmin käytetty tutkimuksessa (harva edes tietää sähköisestä versiosta)  Rajoite: Aineistossa ei ole henkilöille nimiä ja tähän aikaan ei ollut vielä henkilötunnusta  Datan yhdistäminen myöhempiin VL- tiedostoihin likipitäen mahdotonta 19.4.201613 Hannu Karhunen (hannu.a.karhunen@jyu.fi)
  • 15. 4. Lopuksi: Mitä vanhojen aineistojen kehittämiseksi voitaisiin tehdä?  Tilastokeskuksen resurssit ovat rajalliset  Läpikäytävää materiaalia on varsin paljon ja on vaikeaa arvioida mitkä aineistot ovat tutkimuksellisesti tärkeitä  Vanhojen aineistojen kuvaukset pitäisi saada näkyviin Tilastokeskuksen ulkopuolelle  Palautukset ja aineistojen käsittely ulkopuolisen rahoituksen voimin  Ehdotuksia? 19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)15
  • 16. KIITOS! 19.4.2016 Hannu Karhunen (hannu.a.karhunen@jyu.fi)16