Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Alan Vask: Statistikaandmed linkandmetena

848 views

Published on

Published in: Data & Analytics
 • Be the first to comment

 • Be the first to like this

Alan Vask: Statistikaandmed linkandmetena

 1. 1. Statistikaandmed linkandmetena Avaandmete infohommik 28.03.2014 Alan Vask Statistikaamet
 2. 2. Ülevaade  Avaandmed Statistikaametis  Mida on vaja teha linkandmete pakkumiseks  Linkandmete ohud  Kokkuvõte Statistikaandmed linkandmetena28.03.2014
 3. 3. Avaandmed statistikaametis  Statistika andmebaas: http://pub.stat.ee/px- web.2001/dialog/statfile2.asp  PC-Axis platvorm  ~3000 andmetabelit Statistikaandmed linkandmetena28.03.2014  Väljundid:  Ekraanil  PX-File  XLS  CSV  HTML  dBASE
 4. 4. Kas ikka on avaandmed?  1. Terviklik Kõik avalikud andmed tehakse kättesaadavaks, ehk teisisõnu kõik andmeid, mida ei piira isikuandmete või muul põhjusel salastatud andmete piirangud.  2. Algallikast Andmed on töötluseta kogutud algallikast, säilitades oma originaalkuju ja detailsuse.  3. Ajakohane Andmehulk on avaldatud võimalikult kiirelt, et säilitada selle asjakohasus.  4. Kättesaadav Andmed on saadavad võimalikult laiale kasutajateringile võimalikult laia kasutuseesmärgiga.  5. Masinloetav Andmed on mõistetava struktuuriga ja automaatselt töödeldavad. Statistikaandmed linkandmetena28.03.2014 - Statistilise konfidentsiaalsuse piirides - töödeldud ja summeeritud - kohati protsess liiga pikk - jah - jah, aga mitte kuigi mugav
 5. 5. Kas ikka on avaandmed?  6. Mitte-diskrimineeriv Andmed on esitatud avalikult, kättesaamiseks pole vaja registreeruda ega taotleda juurdepääsu.  7. Vabu standardeid kasutav Andmed on esitatud vabas formaadis, mis ei ole ühegi ettevõtte ega isiku ainuomand.  8. Vaba litsentsiga Andmed ei ole kaitstud autoriõiguse, patendi, kaubamärgi ega ärisaladuse regulatsiooniga. Mõistlikud privaatsus- ja turvalisuspiirangud võivad olla lubatud. Statistikaandmed linkandmetena28.03.2014 - jah - jah - jah
 6. 6. Kas on ka head avaandmed?  Laiale ringile huvipakkuv  Vabalt kättesaadav  Kehvasti masintöödeldav  Kehvasti lingitav Statistikaandmed linkandmetena28.03.2014
 7. 7. Statistikaameti andmed on esitatud rahuldavalt aga võiks olla palju paremini. Statistikaandmed linkandmetena28.03.2014
 8. 8. Parem andmete kättesaadavus  Uus Statistika andmebaasi platvorm: OECD.STAT (2015?)  Väljundid:  Ekraanil  CSV  XLS  PX-File Statistikaandmed linkandmetena28.03.2014  SDMX Statistical Data and Metadata Exchange  JSON .STAT
 9. 9. Aeg Keskmine brutokuupalk Töötatud tunnid ühe töötaja kohta 2013Q1 900 456 2013Q2 976 457 2013Q3 930 426 2013Q4 986 450 2013 948 1789 Suuremad ja paremad andmestikud Aasta Keskmine brutokuupalk 2013 948 Statistikaandmed linkandmetena28.03.2014 Kvartal Keskmine brutokuupalk 2013Q1 900 2013Q2 976 2013Q3 930 2013Q4 986 Kvartal Töötatud tunnid ühe töötaja kohta 2013Q1 456 2013Q2 457 2013Q3 426 2013Q4 450 Aasta Töötatud tunnid ühe töötaja kohta 2013 1789
 10. 10. Dimensioonide ja mõistete ühtlustamine Statistikaandmed linkandmetena28.03.2014 Sugu Kood Väärtus M Mees N Naine T Kokku Vastaja sugu Kood Väärtus 1 Mees 2 Naine 3 Kokku 4 Teadmata Sooline määratlus Kood Väärtus 0 Isane 1 Emane 2 Summa 3 Muu CL_SEX Kood ET_EE 1 Mees 2 Naine 3 Kokku 4 Teadmata 5 Muu
 11. 11. Valdkonnaülene ühtlustamine Statistikaandmed linkandmetena28.03.2014 CL_SEX Kood Eesti UK 1 Mees = Male 2 Naine = Female 3 Kokku = Total 4 Teadmata = Unknown 5 Muu = Other
 12. 12. Andmestruktuuride kirjeldused (DSD) <structure:KeyFamily id="HC01"> <structure:Name xml:lang="en">Marital Status </structure:Name> <structure:Components> <structure:Dimension conceptRef=“SEX“ codelist="CL_SEX"></structure:Dimension> <structure:TimeDimension conceptRef=“TIME“ codelist="CL_TIME"></structure:Dimension> <structure:PrimaryMeasure conceptRef=“OBS_VALUE“> </structure:Dimension> </structure:KeyFamily> Statistikaandmed linkandmetena28.03.2014
 13. 13. Metaandmete loomine  Kust on andmed pärit?  Millise metoodikaga on arvutused tehtud?  Kes on autor?  … Statistikaandmed linkandmetena28.03.2014
 14. 14. Metaandmete register  Statistikamaailmas SDMX registry Eurostatis  DSD  MSD  Codelists  Concepts  Datasets  …  Erinevad SDMX Registry’d on omavahel ühendatud Statistikaandmed linkandmetena28.03.2014
 15. 15. Valdkondadevaheline ühtlustamine Eestis  Võimalik ja mõistlik vaid üldisel tasemel  Kasutada vastavustabeleid  Tuleks koordineerida keskselt (MKM)  Ühised standardid Statistikaandmed linkandmetena28.03.2014
 16. 16. Teisene konfidentsiaalsus Statistikaandmed linkandmetena28.03.2014 Sissetulek Vanus Vaesed Rikkad 1-15 30 25 16-64 45 50 65-90 15 18 91+ 1 0 Kokku 91 93 Sissetulek Vanus Vaesed Rikkad 1-15 30 25 16-64 45 50 65+ 16 18 Kokku 91 93 Sissetulek Vanus Vaesed Rikkad 1-15 .. .. 16-64 45 50 65-90 15 18 91+ .. .. Kokku 91 93
 17. 17. Kokkuvõte  Kõrgema taseme avaandmed ja linkandmed on SA lähiaastate eesmärk  Linkandmete pakkumine ei ole vaid tehniline probleem  Sisuline andmete ettevalmistamine on väga mahukas  Linkandmed toovad kaasa uusi senitundmata probleeme Linkandmed on hea mõte! Statistikaandmed linkandmetena28.03.2014
 18. 18. Tänan tähelepanu eest! Küsimused? alan.vask@stat.ee Statistikaandmed linkandmetena28.03.2014
 19. 19. 28.03.2014 Esitluse või esitleja nimi

×