SlideShare a Scribd company logo
Verkkoharavoinnin
hyödyntäminen
tilastotuotannossa
Anna Potila-Kyläkoski
23.3.2022
Näkökulmia tilastotuotantoon 2022
1
22.3.2022 Tilastokeskus
Verkkoharavointi?
2
Tilastokeskus
22.3.2022
– Verkkoharavointi on automatisoitu tiedonkeruun
menetelmä, joka kerää tiedot määrämuotoisena
verkkosivujen lähdekoodista
–Haravien oltava (Tilastokeskuksen) linjausten mukaisia ja
hyvää netikettiä noudattavia ”eettisiä”
– Vaihtoehtona verkkoharavoinnille ovat ainakin
– Perinteinen suorakeruu (kysely)
– Mahdolliset rekisteriaineistot
– Yhdessä sivuston ylläpitäjän kanssa määritetyt rajapintahaut (API)
–Tiedostomuotoiset toimitukset
Verkkoharavat tuotantokäytössä tai
kokeilussa Tilastokeskuksessa
–Vuokramökit (tuotanto)
www.stat.fi/keruu/vumo/
–Rautakaupat (tuotanto)
www.stat.fi/keruu/raka/
–Vaatteet
–Huonekalut
–Autot
–Uusia suunnitelmissa
3
Tilastokeskus
22.3.2022
Tarpeet verkkoharavoinnille
4
Tilastokeskus
22.3.2022
– Uusia tietotarpeita, joiden täyttämiseen pohditaan aineistojen hankintaa,
syntyy koko ajan
– Tilastolain mukaan tilastojen laadintaan tarvittavat tiedot tulisi kerätä
mahdollisimman tehokkaasti ja tiedonantajien rasite minimoiden
– Valmiita rekistereitä tai rajapintoja ei aina saada/löydetä, tai tietojen
kerääminen suorilla tiedonkeruilla olisi liian kallista tai työlästä toteuttaa.
– Suora tiedonkeruu (etenkin käynnit liikkeissä tai tietojen poimiminen
manuaalisesti verkosta) kallista, työvoimaintensiivistä, hidasta.
Lomakekeruu tai massa-aineistojen tuottaminen taas rasittaa tiedonantajia
(yritykset).
Verkkoharavoinnin mahdollisuudet
5
Tilastokeskus
22.3.2022
–Koko internetin laajuinen ”tietovaranto” käytettävissä
–Tiedot saatavissa ajantasaisesti ja nopeasti
–Haravien laatu ja soveltuvuus tilastoihin voi vaihdella suurestikin
– Mahdollisuuksia on paljon, ja tarkentuvat tapauskohtaisesti tutkimalla
– Erilaisissa hintakeruissa huomattavia säästömahdollisuuksia
–Sopii hyvin massa-aineistojen keruuseen
–Alustatalous tapahtuu vain verkossa
–Oikein toteutettuna ei kuormita tiedontuottajan teknisiä tai
henkilöresursseja
Haasteet
6
Tilastokeskus
22.3.2022
–Lainsäädännön tuomat ja eettiset reunaehdot
–Testidataa saadaan, mutta tuotantokäytössä tunnistauduttava
> blokkaus > pyyntö avata > joskus jopa sopimusneuvottelut
–Kaikkia olennaisia tietoja ei saada haravoinnin kautta,
tarvitaan useampi tietolähde
–Kolmansien osapuolien haravoimien tietojen käyttö vs.
eettiset ja juridiset linjaukset
–Hankalasti hahmotettavat viritelmät nettisivujen takana, mistä
nettisivulla oleva tieto tulee, kuka omistaa aineiston
–Sivusto (alusta) voidaan lakkauttaa, mistä korvaava tieto
nopeasti?
–Esim. hintatietoja ei päivitetä ajantasaisesti sivustolle
Teknologian nykytila ja uudet vaatimukset
7
Tilastokeskus
22.3.2022
– Sivustoilla uudentyyppisiä taulurakenteita, javascriptiä, visuaalisen
puolen ja käytettävyyden muutokset haastavat
– Sivustojen uudistuminen, vanhan rinnalle kehitetään uusia sivuja jotka
vaikeuttavat haravointia (sivustojen rakenteen selvittäminen vaikeaa)
– Teknologian tarjoamat mahdollisuudet vs. linjaus ja rajat (emme
hakkeroi, toimi pimeissä verkoissa jne.)
– Haravien ohjelmointi vaatii eritysosaamista
– Muutokset edellyttävät useimmiten haravoiden päivittämistä tai jopa
uudelleenrakentamista
– Teknologinen kehitys sivustoilla (pysytäänkö muutosten mukana)
– Cloudflaren kaltaiset sivustojen suojausmenetelmät estävät haravoinnin
– Haravat vaativat jatkuvaa ylläpitoa
– Sivustojen rakenne voi muuttua ennakoimattomasti
– Tuotteet/kohde mitä halutaan haravoida vaihtuu
Linjaus selkeyttämään käyttöä
8
Tilastokeskus
22.3.2022
– Vaikka moni seikka puoltaa internetistä haravoitujen tietojen
hyödyntämistä, ei tietojen käyttäminen tilastoinnissa ole ongelmatonta.
• Tiedon laatua koskevat puutteet
• Eettiset ongelmat
• Juridiset ongelmat
– Samoja haasteita pohditaan eurooppalaisessa tilastoyhteistyössä.
– Ensimmäinen verkosta haravoitujen tietojen käyttöä koskeva linjaus (ESS
Web scraping policy template) julkaistiin heinäkuussa 2019, ja se on
yhtenäinen Tilastokeskuksen käytäntöjen kanssa.
Lainsäädäntö
9
Tilastokeskus
22.3.2022
Tilastojen laadintaa ohjaa tilastolaki (280/2004).
Tilastolakiin tai muuhun lainsäädäntöön ei sisälly varsinaisia
verkkoharavointia koskevia säännöksiä.
Verkkoharavointia tilastotuotannossa koskevia vakiintuneita tulkintoja tai
oikeuskäytäntöä ei ole. Käytännöt ovat kansainväliselläkin tasolla vasta
muotoutumassa.
Verkkoharavointia tällä hetkellä tarkasteltava
• yleislainsäädännön perusteella
• tilastojen laadintaa koskevan lainsäädännön perusteella
Verkkoharavoinnin lainmukaisuutta arvioitaessa huomioitava
• tekijänoikeudet
• tietosuoja
• käyttöehdot
Yleiset periaatteet Tilastokeskuksessa
10
Tilastokeskus
22.3.2022
Verkkoharavoinnilla hankittavan aineiston käytöstä aina
• tiedonkeruupäätös
• rekisteröinti Tilastokeskuksen Tiedonkeruurekisteriin
Tiedonantovelvollisuuteen perustuvan verkkoharavoinnin
yhteydessä noudatetaan tilastoviranomaisen normaaleja
tiedonanto- ja neuvotteluvelvoitteita.
Aineiston paikkansapitävyyttä ja ajantasaisuutta ei aina
pystytä kaikilta osin tarkistamaan.
➢ Verkkoharavoinnin käyttäminen tiedonhankintatapana
ilmoitettava tilaston julkaisemisen yhteydessä.
➢ Aineiston puolueettomuus pystyttävä aina varmistamaan.
Eettisen kestävyyden varmistaminen
11
Tilastokeskus
22.3.2022
Lainmukaisuus
• Lainsäädäntö ja tietosuoja huomioidaan ja noudatetaan täysimääräisesti.
Mahdollisia muutoksia seurataan.
Läpinäkyvyys
• Verkkoharavoinneista ilmoitetaan julkisesti Tilastokeskuksen kotisivuilla.
• Haravoinnin tarkoitus, haravoinnin kohteena olevat tietotyypit
• Yhteystiedot, joihin verkkosivuston ylläpitäjä voi ottaa yhteyttä lisätietojen
pyytämiseksi tai haravoinnin rajoittamiseksi.
• Jos tiedonantovelvollisuuteen perustuvaa tiedon keräämistä, tietoja kerättäessä
huomioidaan tilastolain mukainen tiedottamisvelvollisuus. Henkilötietojen
käsittelyä koskevaa informointivelvollisuutta noudatetaan.
Vähimmän haitan periaate
• Verkkoharavointi siten, että haravoinnista aiheutuu verkkosivuston toiminnalle ja
sen omistajille mahdollisimman vähän haittaa ja kustannuksia.
Eettisen kestävyyden varmistaminen
12
Tilastokeskus
22.3.2022
Oikeus kieltää
• Verkkosivuston ylläpitäjille annetaan oikeus kieltää haravointi (opt-out)
ottamalla yhteyttä Tilastokeskukseen.
• Kieltopyyntöjä kunnioitetaan, ja ne ilmoitetaan yhteiseen listaan (ns. black
list).
Tilastointiperiaatteiden noudattaminen
• Tilastojen laatimiseen ja toimintaan sovellettavia menettelytapoja, periaatteita
ja ammattietiikkaa noudatetaan myös verkkoharavoinnissa.
Käyttöehtojen tarkistaminen
• Verkkoharavointi kohdistetaan toistaiseksi ainoastaan sellaisille
verkkosivustoille, joiden käyttöehdot on tarkistettu.
• Haravoinnin katsotaan olevan sallittua, jos sitä ei ole nimenomaisesti kielletty
tai kielto on selkeästi rajattu koskemaan pelkästään kaupallista toimintaa.
Käytännön toimintaperiaatteet
13
Tilastokeskus
22.3.2022
Tietojen tarpeellisuus
• Verkkoharavointi kohdistetaan vain sellaisiin tietoihin, jotka ovat
perustellusti tarpeellisia tilastojen laatimisen kannalta.
• Tietojen on tuotava lisäarvoa tilastotuotantoon.
Käyttötarkoitus
Verkkoharavoinnin avulla kerättyjä aineistoja voidaan luovuttaa
ainoastaan Tilastolain 13 §:n mukaisiin tarkoituksiin.
Identiteetin paljastaminen (user agent string)
Verkkosivustolle ilmoitetaan
• Tilastokeskuksen identiteetti
• yhteyspiste yhteydenottoa varten
• linkki verkkoharavointia koskevaan ilmoitukseen Tilastokeskuksen
kotisivuille.
Käytännön toimintaperiaatteet
14
Tilastokeskus
22.3.2022
Kuormittamisen minimointi
• Verkkosivustoja ei kuormiteta liiallisilla ja tiheillä kyselyillä
• Haravointi ajoitetaan sivuston hiljaisimpiin aikoihin (esim. yöaikaan)
• Ylimääräisiä kyselyitä ei tehdä, vaan haravat toteutetaan siten, että ne
hakevat ainoastaan tarpeellisia tietoja.
Etukäteiskuuleminen poikkeustapauksissa
Verkkosivuston ylläpitäjää kuullaan etukäteen tapauksissa, joissa
verkkoharavointi olisi poikkeuksellisen laajamittaista tai kuormittavaa.
Tilannekohtainen harkinta
• Verkkoharavoinnin tilannekohtainen tarkoituksenmukaisuus selvitetään
ennen haravoinnin aloittamista.
• Tiedot voidaan hakea myös APIn kautta, jos sellainen on tarjottu.
Käytännön toimintaperiaatteet
15
Tilastokeskus
22.3.2022
Robots.txt
• Jos verkkosivustolla on verkkoharavoinnin kieltävä robots.txt tiedosto,
sitä kunnioitetaan. Robots.txt-tiedostosta poikkeamiseen voidaan
tarvittaessa kysyä lupaa verkkosivuston ylläpitäjältä (kirjallisesti).
• Haravointia ei tule aloittaa ennen myöntävän vastauksen saamista.
Kolmannen osapuolen haravoiman aineiston hankinta
• Noudatettava samoja periaatteita kuin edellä esitelty
• Ei saa olla kopioitu esim. tekijänoikeuksien suojaamasta
tietokannasta
• Ei saa sisältää luvattomasti haravoituja tietoja
• Oltava eettisesti kestävällä tavalla hankittua
• Ei saa sisältää henkilötietoja
Tekniikat
16
Tilastokeskus
22.3.2022
–Tekniikoita
(Beutifulsoup, Requests, Scrapy, Selenium, Requests back
end –tekniikalla)
–Tutustumismateriaalia Scrapyyn:
https://docs.scrapy.org/en/latest/
https://docs.scrapy.org/en/latest/intro/tutorial.html
Yhteisen alustan kehittäminen
17
Tilastokeskus
22.3.2022
–Alustan kehittäminen ohjelmistokehittämistä (dev, test ja prod
ympäristö)
– Tietyt yhteiset komponentit (ajastus, datan siirto on premiin,
konfiguraatiotiedosto, selaimen ajurit ja asennus, haravien monitorointi,
virheilmoitukset ja lokitus)
–Yksittäisen haravan kehittämisessä prod, haravan tekijä voi
itse säädellä tekeekö testiä vai tuotantoa
Oikeudet
–Versiointi gitissä
–Gitissä olevat koodit kaikkien harava-alustalle oikeuden
saaneiden käytössä
–Aineistot vain niiden käytössä joilla oikeudet aineistoihin
–Aineisto tiettyyn sijaintiin josta siirto on
premiin/Tilastokeskuksen aineistojen vastaanottopalveluun
API-rajapinnat
18
Tilastokeskus
22.3.2022
–Vaihtoehtona verkkoharavoinnille voisi olla, että yksittäisen
sivuston omistaja avaa rajapinnan josta sivustolla olevat
tiedot saadaan
–Tietojen omistaja/tiedon tuottaja voi olla muukin kuin
sivuston omistaja, esim. yksityishenkilö, usea eri yritys
tuottaa tietoja alustaan
–Vaatii useimmiten sopimuksen, motivointia
–Pyydetäänkö korvausta tiedoille, rahallinen korvaus, kooste
tiedoista tms.
Tulevaisuus
– https://www.ceps.eu/ceps-publications/the-eu-
data-act/
– Yksityinen sektori olisi velvoitettava antamaan
tiedot julkisen sektorin käyttöön esimerkiksi
tietopohjaisten palvelujen järjestämistä varten
– Helpottaisi haravointia ja APIen avaamiseen
käytäviä keskusteluja
– Mahdollistaisi laajemman tason ratkaisujen
kehittämisen ja laadukkaat aineistot
– Data Act: Proposal for a Regulation on
harmonised rules on fair access to and use of
data | Shaping Europe’s digital future
(europa.eu)
19
Tilastokeskus
22.3.2022

More Related Content

What's hot

Menestyksen elementtejä etsimässä - yhdessä
Menestyksen elementtejä etsimässä - yhdessäMenestyksen elementtejä etsimässä - yhdessä
Menestyksen elementtejä etsimässä - yhdessä
Sitra / Hyvinvointi
 
STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...
STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...
STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...
THL
 
Vaikuttavuus- ja kustannustietomittarit sekä täytäntöönpano
Vaikuttavuus- ja kustannustietomittarit sekä täytäntöönpanoVaikuttavuus- ja kustannustietomittarit sekä täytäntöönpano
Vaikuttavuus- ja kustannustietomittarit sekä täytäntöönpano
Sitra / Hyvinvointi
 
Maakuntien kuulumiset: HUS
Maakuntien kuulumiset: HUSMaakuntien kuulumiset: HUS
Maakuntien kuulumiset: HUS
Sitra / Hyvinvointi
 
Avoimen datan palvelu
Avoimen datan palveluAvoimen datan palvelu
Avoimen datan palvelu
Mikael Vakkari
 
Yhteentoimivuus
YhteentoimivuusYhteentoimivuus
Yhteentoimivuus
Mikael Vakkari
 
Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas
Tilastokeskus
 
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri RoponenSemanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Tilastokeskus
 
Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...
Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...
Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...
THL
 
Isosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo KoskimäkiIsosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo Koskimäki
Tilastokeskus
 
Tilastokeskuksen big data -hankkeet, Pasi Piela
Tilastokeskuksen big data -hankkeet, Pasi PielaTilastokeskuksen big data -hankkeet, Pasi Piela
Tilastokeskuksen big data -hankkeet, Pasi Piela
Tilastokeskus
 
Selvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raportti
Selvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raporttiSelvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raportti
Selvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raportti
Helsinki Region Infoshare
 
4a jarjestajan tietojohtaminen huovila 2018-12-13
4a jarjestajan tietojohtaminen huovila 2018-12-134a jarjestajan tietojohtaminen huovila 2018-12-13
4a jarjestajan tietojohtaminen huovila 2018-12-13
Sosiaali- ja terveysministeriö / yleiset
 
Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...
Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...
Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...
THL
 
Sote-tietopaketit maakuntien ohjauksen ja johtamisen työkaluna
Sote-tietopaketit maakuntien ohjauksen ja johtamisen työkalunaSote-tietopaketit maakuntien ohjauksen ja johtamisen työkaluna
Sote-tietopaketit maakuntien ohjauksen ja johtamisen työkaluna
Sitra / Hyvinvointi
 
Tiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanne
Tiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanneTiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanne
Tiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanne
THL
 
Juha Mykkänen, THL, Yhteentoimivuus
Juha Mykkänen, THL, YhteentoimivuusJuha Mykkänen, THL, Yhteentoimivuus
Juha Mykkänen, THL, Yhteentoimivuus
THL
 
SOTE-tiedolla johtamisen suunnitteluhankkeet
SOTE-tiedolla johtamisen suunnitteluhankkeetSOTE-tiedolla johtamisen suunnitteluhankkeet
SOTE-tiedolla johtamisen suunnitteluhankkeet
AKUSTI - tietohallintoyhteistyöfoorumi
 
sote-palveluhakemistoPTV_info
sote-palveluhakemistoPTV_infosote-palveluhakemistoPTV_info
sote-palveluhakemistoPTV_info
THL
 
Ostopalvelujen valtuutus osana ostopalvelujen toiminnanohjausta
Ostopalvelujen valtuutus osana ostopalvelujen toiminnanohjaustaOstopalvelujen valtuutus osana ostopalvelujen toiminnanohjausta
Ostopalvelujen valtuutus osana ostopalvelujen toiminnanohjausta
THL
 

What's hot (20)

Menestyksen elementtejä etsimässä - yhdessä
Menestyksen elementtejä etsimässä - yhdessäMenestyksen elementtejä etsimässä - yhdessä
Menestyksen elementtejä etsimässä - yhdessä
 
STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...
STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...
STePS 3.0 – Sosiaali- ja terveydenhuollon tietojärjestelmäpalveluiden seurant...
 
Vaikuttavuus- ja kustannustietomittarit sekä täytäntöönpano
Vaikuttavuus- ja kustannustietomittarit sekä täytäntöönpanoVaikuttavuus- ja kustannustietomittarit sekä täytäntöönpano
Vaikuttavuus- ja kustannustietomittarit sekä täytäntöönpano
 
Maakuntien kuulumiset: HUS
Maakuntien kuulumiset: HUSMaakuntien kuulumiset: HUS
Maakuntien kuulumiset: HUS
 
Avoimen datan palvelu
Avoimen datan palveluAvoimen datan palvelu
Avoimen datan palvelu
 
Yhteentoimivuus
YhteentoimivuusYhteentoimivuus
Yhteentoimivuus
 
Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas
 
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri RoponenSemanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
Semanttinen yhteentoimivuus ja YTI-hanke, Petri Roponen
 
Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...
Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...
Sote-tiedonhallinnan työkalujen hyödyntäminen Sote-tietojärjestelmien olennai...
 
Isosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo KoskimäkiIsosta datasta uuteen dataan? Timo Koskimäki
Isosta datasta uuteen dataan? Timo Koskimäki
 
Tilastokeskuksen big data -hankkeet, Pasi Piela
Tilastokeskuksen big data -hankkeet, Pasi PielaTilastokeskuksen big data -hankkeet, Pasi Piela
Tilastokeskuksen big data -hankkeet, Pasi Piela
 
Selvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raportti
Selvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raporttiSelvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raportti
Selvitys julkishallinnon avoimen datan kysynnästä ja tarjonnasta hri_raportti
 
4a jarjestajan tietojohtaminen huovila 2018-12-13
4a jarjestajan tietojohtaminen huovila 2018-12-134a jarjestajan tietojohtaminen huovila 2018-12-13
4a jarjestajan tietojohtaminen huovila 2018-12-13
 
Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...
Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...
Kokonaisarkkitehtuurin hyödyntäminen. Sosiaali- ja terveydenhuollon asiakas- ...
 
Sote-tietopaketit maakuntien ohjauksen ja johtamisen työkaluna
Sote-tietopaketit maakuntien ohjauksen ja johtamisen työkalunaSote-tietopaketit maakuntien ohjauksen ja johtamisen työkaluna
Sote-tietopaketit maakuntien ohjauksen ja johtamisen työkaluna
 
Tiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanne
Tiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanneTiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanne
Tiedolla johtamisen atomit ja tietoaltaan toteuttamisen tilanne
 
Juha Mykkänen, THL, Yhteentoimivuus
Juha Mykkänen, THL, YhteentoimivuusJuha Mykkänen, THL, Yhteentoimivuus
Juha Mykkänen, THL, Yhteentoimivuus
 
SOTE-tiedolla johtamisen suunnitteluhankkeet
SOTE-tiedolla johtamisen suunnitteluhankkeetSOTE-tiedolla johtamisen suunnitteluhankkeet
SOTE-tiedolla johtamisen suunnitteluhankkeet
 
sote-palveluhakemistoPTV_info
sote-palveluhakemistoPTV_infosote-palveluhakemistoPTV_info
sote-palveluhakemistoPTV_info
 
Ostopalvelujen valtuutus osana ostopalvelujen toiminnanohjausta
Ostopalvelujen valtuutus osana ostopalvelujen toiminnanohjaustaOstopalvelujen valtuutus osana ostopalvelujen toiminnanohjausta
Ostopalvelujen valtuutus osana ostopalvelujen toiminnanohjausta
 

Similar to Verkkoharavoinnin hyödyntäminen tilastotuotannossa, Anna Potila-Kyläkoski, Tilastokeskus

17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus 17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
Tilastokeskus
 
Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...
Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...
Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...
TIEKE Finnish Information Society Development Centre
 
20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille
20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille
20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille
Tilastokeskus
 
Tiedonhallintalaki kunnan silmin by Pasi Halme
Tiedonhallintalaki kunnan silmin by Pasi Halme Tiedonhallintalaki kunnan silmin by Pasi Halme
Tiedonhallintalaki kunnan silmin by Pasi Halme
Mindtrek
 
Terveydenhoitoalan tietojärjestelmien kehittämisen haasteet
Terveydenhoitoalan tietojärjestelmien kehittämisen haasteetTerveydenhoitoalan tietojärjestelmien kehittämisen haasteet
Terveydenhoitoalan tietojärjestelmien kehittämisen haasteet
Jyrki Kasvi
 
Tereydenhoitoalan tietojärjestelmien kehittämisen haasteet
Tereydenhoitoalan tietojärjestelmien kehittämisen haasteetTereydenhoitoalan tietojärjestelmien kehittämisen haasteet
Tereydenhoitoalan tietojärjestelmien kehittämisen haasteet
TIEKE Finnish Information Society Development Centre
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
Tilastokeskus
 
Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?
Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?
Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?
Valtiokonttori / Statskontoret / State Treasury of Finland
 
Gosei hankintavalmistelu-18.9.2013.key
Gosei hankintavalmistelu-18.9.2013.keyGosei hankintavalmistelu-18.9.2013.key
Gosei hankintavalmistelu-18.9.2013.keyGosei Oy
 
Valmisaineistokirjasto, tuoteomistaja Niina Lesonen, Tilastokeskus
Valmisaineistokirjasto, tuoteomistaja Niina Lesonen, TilastokeskusValmisaineistokirjasto, tuoteomistaja Niina Lesonen, Tilastokeskus
Valmisaineistokirjasto, tuoteomistaja Niina Lesonen, Tilastokeskus
Tilastokeskus
 
Sosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihin
Sosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihinSosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihin
Sosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihin
TIEKE Finnish Information Society Development Centre
 
Erja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoa
Erja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoaErja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoa
Erja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoa
Valtiokonttori / Statskontoret / State Treasury of Finland
 
Datatalouden ja tekoälyn regulaatio – missä mennään?
Datatalouden ja tekoälyn regulaatio – missä mennään?Datatalouden ja tekoälyn regulaatio – missä mennään?
Datatalouden ja tekoälyn regulaatio – missä mennään?
Mindtrek
 
Evästystä evästeiden käyttöön + GA:n tämän hetken tulkinta
Evästystä evästeiden käyttöön + GA:n tämän hetken tulkintaEvästystä evästeiden käyttöön + GA:n tämän hetken tulkinta
Evästystä evästeiden käyttöön + GA:n tämän hetken tulkinta
Harto Pönkä
 
Evästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjaus
Evästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjausEvästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjaus
Evästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjaus
Harto Pönkä
 
Vine webinaari - GDPR
Vine webinaari - GDPRVine webinaari - GDPR
Vine webinaari - GDPR
Vine Oy
 
Tietosuoja ja sosiaalinen media
Tietosuoja ja sosiaalinen mediaTietosuoja ja sosiaalinen media
Tietosuoja ja sosiaalinen media
Harto Pönkä
 
STM digimuutoksen ajankohtaiset
STM digimuutoksen ajankohtaiset STM digimuutoksen ajankohtaiset
STM digimuutoksen ajankohtaiset
AKUSTI - tietohallintoyhteistyöfoorumi
 
Sote-tiedon toisisijaisen käytön kokonaisarkkitehtuuri
Sote-tiedon toisisijaisen käytön kokonaisarkkitehtuuriSote-tiedon toisisijaisen käytön kokonaisarkkitehtuuri
Sote-tiedon toisisijaisen käytön kokonaisarkkitehtuuri
AKUSTI - tietohallintoyhteistyöfoorumi
 
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus 17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
Tilastokeskus
 

Similar to Verkkoharavoinnin hyödyntäminen tilastotuotannossa, Anna Potila-Kyläkoski, Tilastokeskus (20)

17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus 17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
 
Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...
Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...
Hallituksen selvitys sosiaali- ja terveydenhuollon tietojärjestelmien ja raho...
 
20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille
20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille
20+ vuotta Tilastokeskuksen valmisaineistoja tutkijoille
 
Tiedonhallintalaki kunnan silmin by Pasi Halme
Tiedonhallintalaki kunnan silmin by Pasi Halme Tiedonhallintalaki kunnan silmin by Pasi Halme
Tiedonhallintalaki kunnan silmin by Pasi Halme
 
Terveydenhoitoalan tietojärjestelmien kehittämisen haasteet
Terveydenhoitoalan tietojärjestelmien kehittämisen haasteetTerveydenhoitoalan tietojärjestelmien kehittämisen haasteet
Terveydenhoitoalan tietojärjestelmien kehittämisen haasteet
 
Tereydenhoitoalan tietojärjestelmien kehittämisen haasteet
Tereydenhoitoalan tietojärjestelmien kehittämisen haasteetTereydenhoitoalan tietojärjestelmien kehittämisen haasteet
Tereydenhoitoalan tietojärjestelmien kehittämisen haasteet
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
 
Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?
Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?
Mirjami Laitinen: Mihin suuntaan julkishallinnon ict:n tulisi kehittyä?
 
Gosei hankintavalmistelu-18.9.2013.key
Gosei hankintavalmistelu-18.9.2013.keyGosei hankintavalmistelu-18.9.2013.key
Gosei hankintavalmistelu-18.9.2013.key
 
Valmisaineistokirjasto, tuoteomistaja Niina Lesonen, Tilastokeskus
Valmisaineistokirjasto, tuoteomistaja Niina Lesonen, TilastokeskusValmisaineistokirjasto, tuoteomistaja Niina Lesonen, Tilastokeskus
Valmisaineistokirjasto, tuoteomistaja Niina Lesonen, Tilastokeskus
 
Sosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihin
Sosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihinSosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihin
Sosiaalihuollon tietojärjestelmät – Eväitä järkeviin hankintoihin
 
Erja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoa
Erja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoaErja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoa
Erja Kinnunen: Tietoturvallisuuden perustasolta kohti korotettua tasoa
 
Datatalouden ja tekoälyn regulaatio – missä mennään?
Datatalouden ja tekoälyn regulaatio – missä mennään?Datatalouden ja tekoälyn regulaatio – missä mennään?
Datatalouden ja tekoälyn regulaatio – missä mennään?
 
Evästystä evästeiden käyttöön + GA:n tämän hetken tulkinta
Evästystä evästeiden käyttöön + GA:n tämän hetken tulkintaEvästystä evästeiden käyttöön + GA:n tämän hetken tulkinta
Evästystä evästeiden käyttöön + GA:n tämän hetken tulkinta
 
Evästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjaus
Evästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjausEvästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjaus
Evästeet nettisivuilla - aiemmin tapahtunutta ja nykyinen linjaus
 
Vine webinaari - GDPR
Vine webinaari - GDPRVine webinaari - GDPR
Vine webinaari - GDPR
 
Tietosuoja ja sosiaalinen media
Tietosuoja ja sosiaalinen mediaTietosuoja ja sosiaalinen media
Tietosuoja ja sosiaalinen media
 
STM digimuutoksen ajankohtaiset
STM digimuutoksen ajankohtaiset STM digimuutoksen ajankohtaiset
STM digimuutoksen ajankohtaiset
 
Sote-tiedon toisisijaisen käytön kokonaisarkkitehtuuri
Sote-tiedon toisisijaisen käytön kokonaisarkkitehtuuriSote-tiedon toisisijaisen käytön kokonaisarkkitehtuuri
Sote-tiedon toisisijaisen käytön kokonaisarkkitehtuuri
 
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus 17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
17.11.2022 Tiedonkeruun modernisointi, Tilastokeskus
 

More from Tilastokeskus

4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
Tilastokeskus
 
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
Tilastokeskus
 
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
Tilastokeskus
 
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
Tilastokeskus
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
Tilastokeskus
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
Tilastokeskus
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
Tilastokeskus
 
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, TilastokeskusKasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Tilastokeskus
 
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Tilastokeskus
 
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, TilastokeskusMitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Tilastokeskus
 
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
Tilastokeskus
 

More from Tilastokeskus (20)

4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
 
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
 
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
 
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
4.6.2024 Tilastotietoa hyvinvointialueiden tueksi, Tilastokeskus
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
 
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
13.5.2024 Yrityksen digitalous -hanke: Säästöä hallinnollisiin kuluihin yhtei...
 
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, TilastokeskusKasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
Kasvoiko Suomen bruttokansantuote 2023? Yliaktuaari Samu Hakala, Tilastokeskus
 
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
Miten rakentaminen, teollisuus ja palvelut kehittyivät? Yliaktuaari Eljas Tuo...
 
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, TilastokeskusMitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
Mitä tapahtui ulkomaankaupassa? Yliaktuaari Reetta Karinluoma, Tilastokeskus
 
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
Millaisia muutoksia tapahtui yksityisessä kulutuksessa ja investoinneissa, yl...
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
 
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
13.2.2024 Datajournalismin pikakurssi, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus14.12.2023 Kiertotalous Suomessa, Tilastokeskus
14.12.2023 Kiertotalous Suomessa, Tilastokeskus
 
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
21.11.2023 Talouden kokonaiskestävyyden mittaaminen, Tilastokeskus
 

Verkkoharavoinnin hyödyntäminen tilastotuotannossa, Anna Potila-Kyläkoski, Tilastokeskus

  • 2. Verkkoharavointi? 2 Tilastokeskus 22.3.2022 – Verkkoharavointi on automatisoitu tiedonkeruun menetelmä, joka kerää tiedot määrämuotoisena verkkosivujen lähdekoodista –Haravien oltava (Tilastokeskuksen) linjausten mukaisia ja hyvää netikettiä noudattavia ”eettisiä” – Vaihtoehtona verkkoharavoinnille ovat ainakin – Perinteinen suorakeruu (kysely) – Mahdolliset rekisteriaineistot – Yhdessä sivuston ylläpitäjän kanssa määritetyt rajapintahaut (API) –Tiedostomuotoiset toimitukset
  • 3. Verkkoharavat tuotantokäytössä tai kokeilussa Tilastokeskuksessa –Vuokramökit (tuotanto) www.stat.fi/keruu/vumo/ –Rautakaupat (tuotanto) www.stat.fi/keruu/raka/ –Vaatteet –Huonekalut –Autot –Uusia suunnitelmissa 3 Tilastokeskus 22.3.2022
  • 4. Tarpeet verkkoharavoinnille 4 Tilastokeskus 22.3.2022 – Uusia tietotarpeita, joiden täyttämiseen pohditaan aineistojen hankintaa, syntyy koko ajan – Tilastolain mukaan tilastojen laadintaan tarvittavat tiedot tulisi kerätä mahdollisimman tehokkaasti ja tiedonantajien rasite minimoiden – Valmiita rekistereitä tai rajapintoja ei aina saada/löydetä, tai tietojen kerääminen suorilla tiedonkeruilla olisi liian kallista tai työlästä toteuttaa. – Suora tiedonkeruu (etenkin käynnit liikkeissä tai tietojen poimiminen manuaalisesti verkosta) kallista, työvoimaintensiivistä, hidasta. Lomakekeruu tai massa-aineistojen tuottaminen taas rasittaa tiedonantajia (yritykset).
  • 5. Verkkoharavoinnin mahdollisuudet 5 Tilastokeskus 22.3.2022 –Koko internetin laajuinen ”tietovaranto” käytettävissä –Tiedot saatavissa ajantasaisesti ja nopeasti –Haravien laatu ja soveltuvuus tilastoihin voi vaihdella suurestikin – Mahdollisuuksia on paljon, ja tarkentuvat tapauskohtaisesti tutkimalla – Erilaisissa hintakeruissa huomattavia säästömahdollisuuksia –Sopii hyvin massa-aineistojen keruuseen –Alustatalous tapahtuu vain verkossa –Oikein toteutettuna ei kuormita tiedontuottajan teknisiä tai henkilöresursseja
  • 6. Haasteet 6 Tilastokeskus 22.3.2022 –Lainsäädännön tuomat ja eettiset reunaehdot –Testidataa saadaan, mutta tuotantokäytössä tunnistauduttava > blokkaus > pyyntö avata > joskus jopa sopimusneuvottelut –Kaikkia olennaisia tietoja ei saada haravoinnin kautta, tarvitaan useampi tietolähde –Kolmansien osapuolien haravoimien tietojen käyttö vs. eettiset ja juridiset linjaukset –Hankalasti hahmotettavat viritelmät nettisivujen takana, mistä nettisivulla oleva tieto tulee, kuka omistaa aineiston –Sivusto (alusta) voidaan lakkauttaa, mistä korvaava tieto nopeasti? –Esim. hintatietoja ei päivitetä ajantasaisesti sivustolle
  • 7. Teknologian nykytila ja uudet vaatimukset 7 Tilastokeskus 22.3.2022 – Sivustoilla uudentyyppisiä taulurakenteita, javascriptiä, visuaalisen puolen ja käytettävyyden muutokset haastavat – Sivustojen uudistuminen, vanhan rinnalle kehitetään uusia sivuja jotka vaikeuttavat haravointia (sivustojen rakenteen selvittäminen vaikeaa) – Teknologian tarjoamat mahdollisuudet vs. linjaus ja rajat (emme hakkeroi, toimi pimeissä verkoissa jne.) – Haravien ohjelmointi vaatii eritysosaamista – Muutokset edellyttävät useimmiten haravoiden päivittämistä tai jopa uudelleenrakentamista – Teknologinen kehitys sivustoilla (pysytäänkö muutosten mukana) – Cloudflaren kaltaiset sivustojen suojausmenetelmät estävät haravoinnin – Haravat vaativat jatkuvaa ylläpitoa – Sivustojen rakenne voi muuttua ennakoimattomasti – Tuotteet/kohde mitä halutaan haravoida vaihtuu
  • 8. Linjaus selkeyttämään käyttöä 8 Tilastokeskus 22.3.2022 – Vaikka moni seikka puoltaa internetistä haravoitujen tietojen hyödyntämistä, ei tietojen käyttäminen tilastoinnissa ole ongelmatonta. • Tiedon laatua koskevat puutteet • Eettiset ongelmat • Juridiset ongelmat – Samoja haasteita pohditaan eurooppalaisessa tilastoyhteistyössä. – Ensimmäinen verkosta haravoitujen tietojen käyttöä koskeva linjaus (ESS Web scraping policy template) julkaistiin heinäkuussa 2019, ja se on yhtenäinen Tilastokeskuksen käytäntöjen kanssa.
  • 9. Lainsäädäntö 9 Tilastokeskus 22.3.2022 Tilastojen laadintaa ohjaa tilastolaki (280/2004). Tilastolakiin tai muuhun lainsäädäntöön ei sisälly varsinaisia verkkoharavointia koskevia säännöksiä. Verkkoharavointia tilastotuotannossa koskevia vakiintuneita tulkintoja tai oikeuskäytäntöä ei ole. Käytännöt ovat kansainväliselläkin tasolla vasta muotoutumassa. Verkkoharavointia tällä hetkellä tarkasteltava • yleislainsäädännön perusteella • tilastojen laadintaa koskevan lainsäädännön perusteella Verkkoharavoinnin lainmukaisuutta arvioitaessa huomioitava • tekijänoikeudet • tietosuoja • käyttöehdot
  • 10. Yleiset periaatteet Tilastokeskuksessa 10 Tilastokeskus 22.3.2022 Verkkoharavoinnilla hankittavan aineiston käytöstä aina • tiedonkeruupäätös • rekisteröinti Tilastokeskuksen Tiedonkeruurekisteriin Tiedonantovelvollisuuteen perustuvan verkkoharavoinnin yhteydessä noudatetaan tilastoviranomaisen normaaleja tiedonanto- ja neuvotteluvelvoitteita. Aineiston paikkansapitävyyttä ja ajantasaisuutta ei aina pystytä kaikilta osin tarkistamaan. ➢ Verkkoharavoinnin käyttäminen tiedonhankintatapana ilmoitettava tilaston julkaisemisen yhteydessä. ➢ Aineiston puolueettomuus pystyttävä aina varmistamaan.
  • 11. Eettisen kestävyyden varmistaminen 11 Tilastokeskus 22.3.2022 Lainmukaisuus • Lainsäädäntö ja tietosuoja huomioidaan ja noudatetaan täysimääräisesti. Mahdollisia muutoksia seurataan. Läpinäkyvyys • Verkkoharavoinneista ilmoitetaan julkisesti Tilastokeskuksen kotisivuilla. • Haravoinnin tarkoitus, haravoinnin kohteena olevat tietotyypit • Yhteystiedot, joihin verkkosivuston ylläpitäjä voi ottaa yhteyttä lisätietojen pyytämiseksi tai haravoinnin rajoittamiseksi. • Jos tiedonantovelvollisuuteen perustuvaa tiedon keräämistä, tietoja kerättäessä huomioidaan tilastolain mukainen tiedottamisvelvollisuus. Henkilötietojen käsittelyä koskevaa informointivelvollisuutta noudatetaan. Vähimmän haitan periaate • Verkkoharavointi siten, että haravoinnista aiheutuu verkkosivuston toiminnalle ja sen omistajille mahdollisimman vähän haittaa ja kustannuksia.
  • 12. Eettisen kestävyyden varmistaminen 12 Tilastokeskus 22.3.2022 Oikeus kieltää • Verkkosivuston ylläpitäjille annetaan oikeus kieltää haravointi (opt-out) ottamalla yhteyttä Tilastokeskukseen. • Kieltopyyntöjä kunnioitetaan, ja ne ilmoitetaan yhteiseen listaan (ns. black list). Tilastointiperiaatteiden noudattaminen • Tilastojen laatimiseen ja toimintaan sovellettavia menettelytapoja, periaatteita ja ammattietiikkaa noudatetaan myös verkkoharavoinnissa. Käyttöehtojen tarkistaminen • Verkkoharavointi kohdistetaan toistaiseksi ainoastaan sellaisille verkkosivustoille, joiden käyttöehdot on tarkistettu. • Haravoinnin katsotaan olevan sallittua, jos sitä ei ole nimenomaisesti kielletty tai kielto on selkeästi rajattu koskemaan pelkästään kaupallista toimintaa.
  • 13. Käytännön toimintaperiaatteet 13 Tilastokeskus 22.3.2022 Tietojen tarpeellisuus • Verkkoharavointi kohdistetaan vain sellaisiin tietoihin, jotka ovat perustellusti tarpeellisia tilastojen laatimisen kannalta. • Tietojen on tuotava lisäarvoa tilastotuotantoon. Käyttötarkoitus Verkkoharavoinnin avulla kerättyjä aineistoja voidaan luovuttaa ainoastaan Tilastolain 13 §:n mukaisiin tarkoituksiin. Identiteetin paljastaminen (user agent string) Verkkosivustolle ilmoitetaan • Tilastokeskuksen identiteetti • yhteyspiste yhteydenottoa varten • linkki verkkoharavointia koskevaan ilmoitukseen Tilastokeskuksen kotisivuille.
  • 14. Käytännön toimintaperiaatteet 14 Tilastokeskus 22.3.2022 Kuormittamisen minimointi • Verkkosivustoja ei kuormiteta liiallisilla ja tiheillä kyselyillä • Haravointi ajoitetaan sivuston hiljaisimpiin aikoihin (esim. yöaikaan) • Ylimääräisiä kyselyitä ei tehdä, vaan haravat toteutetaan siten, että ne hakevat ainoastaan tarpeellisia tietoja. Etukäteiskuuleminen poikkeustapauksissa Verkkosivuston ylläpitäjää kuullaan etukäteen tapauksissa, joissa verkkoharavointi olisi poikkeuksellisen laajamittaista tai kuormittavaa. Tilannekohtainen harkinta • Verkkoharavoinnin tilannekohtainen tarkoituksenmukaisuus selvitetään ennen haravoinnin aloittamista. • Tiedot voidaan hakea myös APIn kautta, jos sellainen on tarjottu.
  • 15. Käytännön toimintaperiaatteet 15 Tilastokeskus 22.3.2022 Robots.txt • Jos verkkosivustolla on verkkoharavoinnin kieltävä robots.txt tiedosto, sitä kunnioitetaan. Robots.txt-tiedostosta poikkeamiseen voidaan tarvittaessa kysyä lupaa verkkosivuston ylläpitäjältä (kirjallisesti). • Haravointia ei tule aloittaa ennen myöntävän vastauksen saamista. Kolmannen osapuolen haravoiman aineiston hankinta • Noudatettava samoja periaatteita kuin edellä esitelty • Ei saa olla kopioitu esim. tekijänoikeuksien suojaamasta tietokannasta • Ei saa sisältää luvattomasti haravoituja tietoja • Oltava eettisesti kestävällä tavalla hankittua • Ei saa sisältää henkilötietoja
  • 16. Tekniikat 16 Tilastokeskus 22.3.2022 –Tekniikoita (Beutifulsoup, Requests, Scrapy, Selenium, Requests back end –tekniikalla) –Tutustumismateriaalia Scrapyyn: https://docs.scrapy.org/en/latest/ https://docs.scrapy.org/en/latest/intro/tutorial.html
  • 17. Yhteisen alustan kehittäminen 17 Tilastokeskus 22.3.2022 –Alustan kehittäminen ohjelmistokehittämistä (dev, test ja prod ympäristö) – Tietyt yhteiset komponentit (ajastus, datan siirto on premiin, konfiguraatiotiedosto, selaimen ajurit ja asennus, haravien monitorointi, virheilmoitukset ja lokitus) –Yksittäisen haravan kehittämisessä prod, haravan tekijä voi itse säädellä tekeekö testiä vai tuotantoa Oikeudet –Versiointi gitissä –Gitissä olevat koodit kaikkien harava-alustalle oikeuden saaneiden käytössä –Aineistot vain niiden käytössä joilla oikeudet aineistoihin –Aineisto tiettyyn sijaintiin josta siirto on premiin/Tilastokeskuksen aineistojen vastaanottopalveluun
  • 18. API-rajapinnat 18 Tilastokeskus 22.3.2022 –Vaihtoehtona verkkoharavoinnille voisi olla, että yksittäisen sivuston omistaja avaa rajapinnan josta sivustolla olevat tiedot saadaan –Tietojen omistaja/tiedon tuottaja voi olla muukin kuin sivuston omistaja, esim. yksityishenkilö, usea eri yritys tuottaa tietoja alustaan –Vaatii useimmiten sopimuksen, motivointia –Pyydetäänkö korvausta tiedoille, rahallinen korvaus, kooste tiedoista tms.
  • 19. Tulevaisuus – https://www.ceps.eu/ceps-publications/the-eu- data-act/ – Yksityinen sektori olisi velvoitettava antamaan tiedot julkisen sektorin käyttöön esimerkiksi tietopohjaisten palvelujen järjestämistä varten – Helpottaisi haravointia ja APIen avaamiseen käytäviä keskusteluja – Mahdollistaisi laajemman tason ratkaisujen kehittämisen ja laadukkaat aineistot – Data Act: Proposal for a Regulation on harmonised rules on fair access to and use of data | Shaping Europe’s digital future (europa.eu) 19 Tilastokeskus 22.3.2022