Praktilised avaandmed 
Andres Kütt 
Riigi Infosüsteemi arhitekt 
! 
18.09.2014
Praktiline mõtlemine, mitte retseptid 
! 
! 
Parimad tehnilised lahendused muutuvad 
kiiresti ja sõltuvad palju konkreetsest 
probleemist
Täna kavas 
" Miks avaandmed ja miks mitte? 
" Kuidas mõelda avaandmetest organisatsiooni 
kontekstis? 
" Avaandmete ärilised probleemid 
" Avaandmete riskid 
" Tehnilised küsimused
Sissejuhatus 
! 
!
Avaandmed on avalikult, ilma 
finantskohustusi võtmata, kätte saadavad 
andmed 
! 
! 
Päris avatud andmeid ei ole, finantsbarjääri 
valik definitsiooniks on kunstlik
Miks avaandmed? 
" Innovatsioon 
" Platvormistrateegia 
" Andmete ja taristuga tegelemine on ärimudel 
" Juriidilised põhjused 
" Seadusandlus kuid ka litsentsitingimused ja lepingud 
" Organisatsioonikultuur 
" Nii selle manifestatsioon kui muutmise vahend 
" Lõppkasutaja soov 
" Avalikussuhted, korporatiivne vastutus
Miks mitte avaandmed? 
" Kõrge alternatiivkulu 
" Võrreldes muude omaniku hüve suurendamise viisidega 
" Organisatsioonikultuur 
" Juriidilised põhjused 
" Seadusandlus kuid ka litsentsitingimused ja lepingud 
" Organisatsiooniline inerts 
" Suured organisatsioonid muutuvad aeglaselt 
" Riskid ja kohustused ei kaalu üles hüve
Avaandmed ja organisatsioon 
! 
! 
Avaandmed ei ole vaid tehniline probleem, 
nad puudutavad organisatsiooni eri tahke
Kõigepealt sõnasta eesmärk 
! 
! 
Miks te üldse avaandmetega tegelete?
Organisatsiooni struktuur 
Äri ja juriidika 
Organisatsioon ja protsessid 
Funktsionaalsed komponendid 
Tehnilised lahendused
Avaandmeid ümbritsevad jõud 
Organisatsiooni 
soovid 
Turu vajadus 
Organisatsiooni 
võimekus ja 
piirangud 
Ava-andmed
Organisatsiooni kui terviku võimekus 
" Kolm kirjeldatud jõudu toimivad kõigil tasandeil 
" Organisatsioonil võib olla äriline soov andmeid avada 
kuid seda soovi võib piirata tehniline võimekus 
" Organisatsiooni võimekus on summa tema 
võimekusest igal tasandil 
" On oluline hinnata, kas eesmärgi saavutamine 
on reaalne 
" Kui ei, tuleb leida viisid võimekuse kasvatamiseks või 
muuta eesmärki
Avaandmed kui äriline probleem 
! 
!
Avaandmed on vitamiin, mitte valuvaigisti 
! 
! 
Tehnilises mõttes on tegu 
madala signaali-müra suhtega
Võimekus ja vajadus on nagu kana ja muna 
! 
! 
Me ei tea, mida me vajame, kuni me ei tea, 
mis teil on. Me ei saa teile kõike näidata, 
öelge, mida teil vaja on
Kolm avaandmete probleemi 
" Avaandmed on ettevõttele pikaajaline kohustus 
" Eriti linkandmete korral 
" Uued sõltuvused arenduses 
" Me ei saa muuta andmestruktuure ja äriloogikat 
arvestamata avaandmete kasutajatega 
" Iga muutus meie süsteemis võib tähendada muutust 
andmete kasutajate süsteemides 
" Uued sõltuvused halduses 
" Tehes andmed kättesaadavaks lubame, et need on 
kättesaadavad ka tulevikus
Kolm viisi andmeid avada 
" Varjatud 
" Iga internetis olev andmeühik on sisult avalikult 
kasutatavad andmed 
" Tavalised avaandmed 
" Avalikud, dokumenteeritud ja stabiilse struktuuri ning 
semantikaga andmed 
" Rohelise Raamatu subjekt 
" Piiratud avaandmed 
" Andmed on avalikud ja tasuta, kuid kasutamiseks 
eeldatakse teatud barjääride ületamist (Google mudel)
Varjatud avaandmed 
" Kogu avalik info on masinloetav 
" Ja seda ka kasutatakse 
" Nii teie kahjuks kui kasuks 
" Kasutusega ei ole mõistlik tehniliselt võidelda 
" Teise poole ressursid on liiga suured 
" Tuleb toetuda millelegi muule (näiteks juriidika) 
" Vähegi tõsise huvi korral liikuge klassikalistele 
avaandmetele
Tavapärased avaandmed 
" Info on selgesõnaliselt kättesaadavaks tehtud 
" Koos põhjaliku dokumentatsiooniga 
" Oluline on stabiilne struktuur 
" Semantika on oluline 
" Mida tähendab tühi väli? 
" Mida kirjutatakse välismaalase isikukoodi väljale? 
" Kasu saamine eeldab suhtlust 
" Soovitavalt kahepoolset 
" “Meie server ei ole pühapäeval kättesaadav” 
" “Mida tähendab tühi isikukoodiväli?”
Piiratud avaandmed 
" Andmed on avalikud, kuid juurdepääsul on 
kunstlikud barjäärid 
" Näiteks vajadus registreeruda 
" Juurdepääsul on alati piirangud 
" Kasvõi kasutatav tehnoloogia aga ka info teenuse 
olemasolust 
" Kasulik andmete pakkujale 
" Saab kehtestada ja jõustada kasutustingimusi 
" Tekib konkreetne kasutajate kogukond
Avaandmed kui riskiprobleem 
! 
!
Isikuandmete kaitse 
" Isikuandmeid ei saa päriselt puhastada 
" Täielikult isikuandmetest puhastatud info on ka 
täielikult kasutu (matemaatika!) 
" Alati on küsimus mõistlikus riskis 
" Eesti väiksuse probleem 
" Kui keskmistatakse ühte inimest, siis ei ole privaatsus 
tagatud 
" Triangulatsiooni probleem 
" Andmeid võib teiste allikate abil uuesti isikustada
Operatiivsed riskid 
" Piiranguteta avalikke andmeid ka kasutatakse 
piiranguteta 
" Kui tihti ja kui palju andmeid küsitakse, ei ole teada 
" Eriti ebameeldivad on järsk kasv koormuses 
" Oluline on monitooring 
" Eesmärgiks teiste klientide kaitsmine üksiku valesti 
käituva kliendi eest 
" Kuidas eristada pahatahtlikkust rumalusest? 
" Kuidas seejärel pahatahtlik agent andmetest eemal 
hoida?
Andmeriskid 
" Allika mürgitamine 
" Ründaja muudab pakutavaid andmeid talle sobival viisil 
" Tuvastamine keeruline, mõju potentsiaalselt suur 
" Konkurendi telefoninumbri asendamine enda omaga 
avalikus andmestikus, näiteks 
" Semantika riskid 
" Pakutav andmestik on tollides ja kasutaja eeldab 
millimeetreid
Null-kasutuse risk 
" Kuup on n-mõõtmeline agregatsioon andmetelt 
" Oluline andmete puhastamise ning analüütika vahend 
" Exceli pivot table ainult et suur 
" Lihtne määratleda, kallis arvutada 
" Kuup on lõplik 
" Kuubist saab ainult need koondid, mis on sinna sisse 
kirjutatud 
" Isegi väike eksimus kuubi definitsioonis võib 
andmed lõppkasutajale kasutuks muuta
Avaandmed kui tehniline probleem 
! 
!
Kuidas andmetele ligi saab? 
! 
! 
Väga olulise mõjuga valik nii lahenduse 
kulu kui võimaliku kasutatavuse osas
Andmetõmmis 
" Andmed eraldatakse operatiivsüsteemist ja 
tehakse kättesaadavaks 
" Tõmmis on staatiline ning saadaval vaid tervikuna 
" Rohelises Raamatus soovitatud meetod 
" Eeldatakse andmete vananemiskindlust 
" Tõmmise ei muutu uuendamiste vahel 
" Kasulik ja lihtne pakkujale 
" Madal riskitase 
" Andmete eraldamise/puhastamise loogika võib olla kui 
tahes keeruline
Ligipääs andmetele 
" Juurdepääs andmetele läbi selge liidese 
" Sisuliselt avalik juurdepääs operatiivsüsteemile 
" Rohkem liikuvaid osi 
" Lisaks andmete struktuurile ja semantikale tuleb hallata 
ka liidese struktuuri ja semantikat 
" Liides on programm ja sellisena vajab hoolt 
" Potentsiaalselt lihtne kasutajale 
" Andmeid võib kasutada otse, ilma vahepealse 
töötlemiseta 
" Kas avatakse andmed või info?
Ligipääs teenustele 
" Juurdepääs andmetele läbi äriloogika 
" Eelmisele sarnane, kuid lisaks andmetele pakutakse ka 
äriloogikat 
" Näiteks aadressi kontrollimine korrektsete aadresside 
andmestiku asemel 
" Veel rohkem liikuvaid osi 
" Lisaks muule tuleb hallata ka äriloogikat 
" Potentsiaalselt lihtne kasutajale 
" Juhul, kui andmete kasutamiseks vajalik äriloogika on 
kas keeruline või tundlik
Ligipääs dokumentidele 
" Andmete asemel juurdepääs dokumentidele 
" Dokumendi moodustab komplekt omavahel seotud 
andmeid 
" Võlgnevuse puudumise tõend vs. võlgnevuste tabel vs. 
teenus “kas võib osaleda hankes” 
" Tavaliselt kasutusel, kui tulemust peab lugema 
inimene 
" Kasulik, keerulise andmestruktuuri puhul 
" Ning selle üksikuid osi ei kasutata tavaliselt eraldi
Milline on tehniline lahendus? 
! 
! 
Puudutame vaid peamisi standardeid
RDF/XML 
" RDF - Resource Description Framework 
" Standardne vahend andmete struktuuri kirjeldamiseks 
" Võimaldab esitada väiteid asjade kohta 
" Võib olla väljendatud mitmel eri viisil, sealhulgas XML 
" XML 
" Küllalt raskepärane viis struktureeritud viisil andmeid 
edastada 
" Võib olla range struktuuriga kuid ei pruugi 
" Kasuta neid keerulistel juhtudel: palju keerulise 
struktuuriga andmeid
REST/JSON 
" REST 
" Teenused ja andmeelemendid on viidatud 
veebiaadressidega 
" Andmeelementidega saab manipuleerida veebi tuumaks 
olevate protokollidega 
" JSON 
" Veebis levinud viis andmeid esitada, kasutatav otse 
brauserist 
" Ei oma jäika struktuuri 
" Kasuta lihtsate kiirete lahenduste tarbeks
Aitäh! 
Andres Kütt 
andres.kutt@ria.ee

Praktilised Avaandmed

  • 1.
    Praktilised avaandmed AndresKütt Riigi Infosüsteemi arhitekt ! 18.09.2014
  • 2.
    Praktiline mõtlemine, mitteretseptid ! ! Parimad tehnilised lahendused muutuvad kiiresti ja sõltuvad palju konkreetsest probleemist
  • 3.
    Täna kavas "Miks avaandmed ja miks mitte? " Kuidas mõelda avaandmetest organisatsiooni kontekstis? " Avaandmete ärilised probleemid " Avaandmete riskid " Tehnilised küsimused
  • 4.
  • 5.
    Avaandmed on avalikult,ilma finantskohustusi võtmata, kätte saadavad andmed ! ! Päris avatud andmeid ei ole, finantsbarjääri valik definitsiooniks on kunstlik
  • 6.
    Miks avaandmed? "Innovatsioon " Platvormistrateegia " Andmete ja taristuga tegelemine on ärimudel " Juriidilised põhjused " Seadusandlus kuid ka litsentsitingimused ja lepingud " Organisatsioonikultuur " Nii selle manifestatsioon kui muutmise vahend " Lõppkasutaja soov " Avalikussuhted, korporatiivne vastutus
  • 7.
    Miks mitte avaandmed? " Kõrge alternatiivkulu " Võrreldes muude omaniku hüve suurendamise viisidega " Organisatsioonikultuur " Juriidilised põhjused " Seadusandlus kuid ka litsentsitingimused ja lepingud " Organisatsiooniline inerts " Suured organisatsioonid muutuvad aeglaselt " Riskid ja kohustused ei kaalu üles hüve
  • 8.
    Avaandmed ja organisatsioon ! ! Avaandmed ei ole vaid tehniline probleem, nad puudutavad organisatsiooni eri tahke
  • 9.
    Kõigepealt sõnasta eesmärk ! ! Miks te üldse avaandmetega tegelete?
  • 10.
    Organisatsiooni struktuur Ärija juriidika Organisatsioon ja protsessid Funktsionaalsed komponendid Tehnilised lahendused
  • 11.
    Avaandmeid ümbritsevad jõud Organisatsiooni soovid Turu vajadus Organisatsiooni võimekus ja piirangud Ava-andmed
  • 12.
    Organisatsiooni kui tervikuvõimekus " Kolm kirjeldatud jõudu toimivad kõigil tasandeil " Organisatsioonil võib olla äriline soov andmeid avada kuid seda soovi võib piirata tehniline võimekus " Organisatsiooni võimekus on summa tema võimekusest igal tasandil " On oluline hinnata, kas eesmärgi saavutamine on reaalne " Kui ei, tuleb leida viisid võimekuse kasvatamiseks või muuta eesmärki
  • 13.
  • 14.
    Avaandmed on vitamiin,mitte valuvaigisti ! ! Tehnilises mõttes on tegu madala signaali-müra suhtega
  • 15.
    Võimekus ja vajaduson nagu kana ja muna ! ! Me ei tea, mida me vajame, kuni me ei tea, mis teil on. Me ei saa teile kõike näidata, öelge, mida teil vaja on
  • 16.
    Kolm avaandmete probleemi " Avaandmed on ettevõttele pikaajaline kohustus " Eriti linkandmete korral " Uued sõltuvused arenduses " Me ei saa muuta andmestruktuure ja äriloogikat arvestamata avaandmete kasutajatega " Iga muutus meie süsteemis võib tähendada muutust andmete kasutajate süsteemides " Uued sõltuvused halduses " Tehes andmed kättesaadavaks lubame, et need on kättesaadavad ka tulevikus
  • 17.
    Kolm viisi andmeidavada " Varjatud " Iga internetis olev andmeühik on sisult avalikult kasutatavad andmed " Tavalised avaandmed " Avalikud, dokumenteeritud ja stabiilse struktuuri ning semantikaga andmed " Rohelise Raamatu subjekt " Piiratud avaandmed " Andmed on avalikud ja tasuta, kuid kasutamiseks eeldatakse teatud barjääride ületamist (Google mudel)
  • 18.
    Varjatud avaandmed "Kogu avalik info on masinloetav " Ja seda ka kasutatakse " Nii teie kahjuks kui kasuks " Kasutusega ei ole mõistlik tehniliselt võidelda " Teise poole ressursid on liiga suured " Tuleb toetuda millelegi muule (näiteks juriidika) " Vähegi tõsise huvi korral liikuge klassikalistele avaandmetele
  • 19.
    Tavapärased avaandmed "Info on selgesõnaliselt kättesaadavaks tehtud " Koos põhjaliku dokumentatsiooniga " Oluline on stabiilne struktuur " Semantika on oluline " Mida tähendab tühi väli? " Mida kirjutatakse välismaalase isikukoodi väljale? " Kasu saamine eeldab suhtlust " Soovitavalt kahepoolset " “Meie server ei ole pühapäeval kättesaadav” " “Mida tähendab tühi isikukoodiväli?”
  • 20.
    Piiratud avaandmed "Andmed on avalikud, kuid juurdepääsul on kunstlikud barjäärid " Näiteks vajadus registreeruda " Juurdepääsul on alati piirangud " Kasvõi kasutatav tehnoloogia aga ka info teenuse olemasolust " Kasulik andmete pakkujale " Saab kehtestada ja jõustada kasutustingimusi " Tekib konkreetne kasutajate kogukond
  • 21.
  • 22.
    Isikuandmete kaitse "Isikuandmeid ei saa päriselt puhastada " Täielikult isikuandmetest puhastatud info on ka täielikult kasutu (matemaatika!) " Alati on küsimus mõistlikus riskis " Eesti väiksuse probleem " Kui keskmistatakse ühte inimest, siis ei ole privaatsus tagatud " Triangulatsiooni probleem " Andmeid võib teiste allikate abil uuesti isikustada
  • 23.
    Operatiivsed riskid "Piiranguteta avalikke andmeid ka kasutatakse piiranguteta " Kui tihti ja kui palju andmeid küsitakse, ei ole teada " Eriti ebameeldivad on järsk kasv koormuses " Oluline on monitooring " Eesmärgiks teiste klientide kaitsmine üksiku valesti käituva kliendi eest " Kuidas eristada pahatahtlikkust rumalusest? " Kuidas seejärel pahatahtlik agent andmetest eemal hoida?
  • 24.
    Andmeriskid " Allikamürgitamine " Ründaja muudab pakutavaid andmeid talle sobival viisil " Tuvastamine keeruline, mõju potentsiaalselt suur " Konkurendi telefoninumbri asendamine enda omaga avalikus andmestikus, näiteks " Semantika riskid " Pakutav andmestik on tollides ja kasutaja eeldab millimeetreid
  • 25.
    Null-kasutuse risk "Kuup on n-mõõtmeline agregatsioon andmetelt " Oluline andmete puhastamise ning analüütika vahend " Exceli pivot table ainult et suur " Lihtne määratleda, kallis arvutada " Kuup on lõplik " Kuubist saab ainult need koondid, mis on sinna sisse kirjutatud " Isegi väike eksimus kuubi definitsioonis võib andmed lõppkasutajale kasutuks muuta
  • 26.
  • 27.
    Kuidas andmetele ligisaab? ! ! Väga olulise mõjuga valik nii lahenduse kulu kui võimaliku kasutatavuse osas
  • 28.
    Andmetõmmis " Andmederaldatakse operatiivsüsteemist ja tehakse kättesaadavaks " Tõmmis on staatiline ning saadaval vaid tervikuna " Rohelises Raamatus soovitatud meetod " Eeldatakse andmete vananemiskindlust " Tõmmise ei muutu uuendamiste vahel " Kasulik ja lihtne pakkujale " Madal riskitase " Andmete eraldamise/puhastamise loogika võib olla kui tahes keeruline
  • 29.
    Ligipääs andmetele "Juurdepääs andmetele läbi selge liidese " Sisuliselt avalik juurdepääs operatiivsüsteemile " Rohkem liikuvaid osi " Lisaks andmete struktuurile ja semantikale tuleb hallata ka liidese struktuuri ja semantikat " Liides on programm ja sellisena vajab hoolt " Potentsiaalselt lihtne kasutajale " Andmeid võib kasutada otse, ilma vahepealse töötlemiseta " Kas avatakse andmed või info?
  • 30.
    Ligipääs teenustele "Juurdepääs andmetele läbi äriloogika " Eelmisele sarnane, kuid lisaks andmetele pakutakse ka äriloogikat " Näiteks aadressi kontrollimine korrektsete aadresside andmestiku asemel " Veel rohkem liikuvaid osi " Lisaks muule tuleb hallata ka äriloogikat " Potentsiaalselt lihtne kasutajale " Juhul, kui andmete kasutamiseks vajalik äriloogika on kas keeruline või tundlik
  • 31.
    Ligipääs dokumentidele "Andmete asemel juurdepääs dokumentidele " Dokumendi moodustab komplekt omavahel seotud andmeid " Võlgnevuse puudumise tõend vs. võlgnevuste tabel vs. teenus “kas võib osaleda hankes” " Tavaliselt kasutusel, kui tulemust peab lugema inimene " Kasulik, keerulise andmestruktuuri puhul " Ning selle üksikuid osi ei kasutata tavaliselt eraldi
  • 32.
    Milline on tehnilinelahendus? ! ! Puudutame vaid peamisi standardeid
  • 33.
    RDF/XML " RDF- Resource Description Framework " Standardne vahend andmete struktuuri kirjeldamiseks " Võimaldab esitada väiteid asjade kohta " Võib olla väljendatud mitmel eri viisil, sealhulgas XML " XML " Küllalt raskepärane viis struktureeritud viisil andmeid edastada " Võib olla range struktuuriga kuid ei pruugi " Kasuta neid keerulistel juhtudel: palju keerulise struktuuriga andmeid
  • 34.
    REST/JSON " REST " Teenused ja andmeelemendid on viidatud veebiaadressidega " Andmeelementidega saab manipuleerida veebi tuumaks olevate protokollidega " JSON " Veebis levinud viis andmeid esitada, kasutatav otse brauserist " Ei oma jäika struktuuri " Kasuta lihtsate kiirete lahenduste tarbeks
  • 35.
    Aitäh! Andres Kütt andres.kutt@ria.ee