Julkinen data -mitä kaikkea se onkaan?
               7.4.2010
           Tapio Nurminen
          www.floapps.com
Flo Apps Oy ja julkinen data

  seuraavan sukupolven Internet-ratkaisujen konsultointia ja toteutusta
      Helsinki Region Infoshare - visualisointi
      Tanssin Tiedotuskeskus - Tanka-tietokanta
      Apps For Democracy Finland 2009 - Nomenest.info
      INCA awards joulukuu 2010 - Twitter-visualisointi

  5 työntekijää + partneriverkosto
  Helsinki, Alppila
Osa 1: Avoimesta tiedosta
Miksi avoin tieto?
  avaamalla dataa viranomaiset voivat auttaa luomaan
       innovatiivista liiketoimintaa ja uudenlaisia palveluja
       yhteiskunnallista ja kaupallista arvoa
       yhteistä hyvää (esim. fixmystreet.com, wheelshare.it)
  hallinnon avoimuus
       osallistava yhteiskunta
       lehdistölle ja aktivisteille ajantasaista tietoa
Avoimen tiedon 2 kerrosta
  data tarvitaan sovellusten rakentamiseen
  vasta sovellukset tekevät datasta mielenkiintoista ja hyödyllistä
Avoimen tiedon vaikutukset

 liikenteen ja markkinoinnin tehostuminen
 uudenlainen liiketoiminta
 entistä avoimempi ja paremmin informoitu päätöksenteko
 voi vaikuttaa asumispäätöksiin ja koulujen valintaan
 "data-driven journalism"
Avoin tieto Suomessa
Valtion periaatepäätös 3.3.2011

"Tietoaineistojen tulee olla avoimesti saatavilla ja uudelleenkäytettävissä
yhtenäisin, selkein ja kaikille tasapuolisin ehdoin. Aineistojen tulee olla
pääsääntöisesti maksuttomia."
Muut maat

 USA, Iso-Britannia, Australia ja Uusi-Seelanti edelläkävijöitä
 Eurooppa
    Suomi toinen maa Europassa (Iso-Britannian jälkeen), joka teki
    periaatepäätöksen julkisesta datasta
    kehitys myös esim. Hollannissa, Ruotsissa, Espanjassa ja Saksassa
 muualla
    esim. Uruguay, Venäjä (opengovdata.ru)
Osa 2: Linkitetty tieto
Linkitetty avoin tieto

  Linked Data - tekninen konsepti
  Open Data - julkaisupoliittinen asia
Miksi Linked Open Data?

  tietojen uudenlainen yhdistäminen ja jakaminen tulee mahdolliseksi
       "it is the unexpected re-use of information which is the value
       added by the web" - Sir Tim Berners-Lee
Tim Berners-Lee ja Semantic Web 2006

"The Semantic Web isn't just about putting data on the web. It is about
making links, so that a person or machine can explore the web of
data.

With linked data, when you have some of it, you can find other,
related, data."
The 5 stars of open linked data
  inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
Osa 3: Tiedon avaamisen edellytykset
Mitä avoin data edellyttää?

1. tekninen saatavuus
2. uudelleenkäytön sallivat käyttöehdot
3. löydettävyys
4. ymmärrettävyys
5. maksuttomuus
1 Tekninen saatavuus

  data on julkaistu sellaisessa muodossa, että sitä on helppo käsitellä ja
  hyödyntää osana verkkopalveluita koneellisesti
      PC Axis ja Excel vaativat oman ohjelmansa
      PDF ja HTML vaativat screenscrapingia
      CSV kätevä datan jakamisessa
      JSON/XML/RDF paras ratkaisu
HTML
...
<table>
<tr>
<td>1</td>
<td>alikersantti</td>
<td>NURMINEN</td>
<td>AARNE ALLAN</td>
<td>10.03.1940</td>
<td> <a href="index.php?id=6092&raportti=1"> n&auml;yt&auml; &raquo;</a>
</td>
</tr>
</table>
...
JSON
{
"firstName": "John",
"lastName": "Smith",
"age": 25,
"address": {
   "streetAddress": "21 2nd Street",
   "city": "New York",
   "state": "NY",
"postalCode": "10021" },
"phoneNumber": [
   { "type": "home", "number": "212 555-1234" },
   { "type": "fax", "number": "646 555-4567" }
 ]
 }
RDF
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:foaf="http:
//xmlns.com/foaf/0.1/" xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://en.wikipedia.org/wiki/Tony_Benn">
<dc:title>Tony Benn</dc:title>
<dc:publisher>Wikipedia</dc:publisher>
<foaf:primaryTopic>
<foaf:Person> <foaf:name>Tony Benn</foaf:name> </foaf:Person> </foaf:
primaryTopic>
</rdf:Description>
</rdf:RDF>
2 Uudelleenkäytön sallivat käyttöehdot

   julkaisija sallii aineiston uudelleenkäytön ja kertoo sen selkeästi
   aineiston yhteydestä löytyvillä käyttöehdoilla
       Creative Commons käytetty etenkin Suomessa
       kaupallinen vs ei-kaupallinen jatkokäyttö?
3 Löydettävyys

  aineiston olemassaolon ja sijainnin tulee olla yleisesti tunnettu
  datakatalogit kuten
      hri.fi
      data.suomi.fi
      kulttuurisampo.fi
4 Ymmärrettävyys

  datan rakenne ja merkitys on kuvailtu ymmärrettävästi sen käyttäjille
      ilman kuvailua data jää merkityksettömäksi, eikä sitä pystytä
      hyödyntämään.
  data on myös kansainvälisesti ymmärrettävää
5 Maksuttomuus
  valtion periaatepäätös: "Aineistojen tulee olla pääsääntöisesti
  maksuttomia."
       vain maksuttomuus mahdollistaa ekosysteemin kehittymisen
  liiketoimintamalleja on silti olemassa kuten
       Freemium
       rajoitettu pääsy
       maksullinen palvelu - esim. kaupallinen käyttö (Nantes, Ranska)
  esim. Ordnance Survey Iso Britanniassa
       vain suurempi käyttö maksullista
Osa 4: Nykytilanne
Nykytila Suomessa

  Helsinki Regional Infoshare
      muiden kaupunkien liikennedata?
      Matkahuollon liikennedata?
      Tilastokeskuksen data koneluettavaksi?
  Kulttuurisampo
      Tanssin tiedotuskeskus - Tanka
  INSPIRE-direktiivi ja paikkatietolaki
  data.suomi.fi
Ongelmakohtia

  dataa paljon, mutta ei koneluettavassa muodossa
      Excel, PDF, HTML, PC Axis
  käyttöehdot epäselvät
  yksityisyydensuoja muistettava
      esim. pk-seudun aluesarjoissa ei näytetä tietoja, jos henkilöt olisi
      helppo yksilöidä
Seuraavat askeleet
  periaatepäätös hyvä alku

  uusia tietoaineistoja tulossa ulos
      eduskuntadata
      mediatalot
      kulttuuri, tieteet jne
      Linked Data Finland -hanke

  mitä sinä voit tehdä?
      millaisia aineistoja kannattaisi julkaista?
      millaisessa muodossa aineisto kannattaisi avata?
Kiitos!

  tapio.nurminen@floapps.com
  twitter.com/TapioNurminen

Julkinen data - mitä kaikkea se onkaan

  • 1.
    Julkinen data -mitäkaikkea se onkaan? 7.4.2010 Tapio Nurminen www.floapps.com
  • 2.
    Flo Apps Oyja julkinen data seuraavan sukupolven Internet-ratkaisujen konsultointia ja toteutusta Helsinki Region Infoshare - visualisointi Tanssin Tiedotuskeskus - Tanka-tietokanta Apps For Democracy Finland 2009 - Nomenest.info INCA awards joulukuu 2010 - Twitter-visualisointi 5 työntekijää + partneriverkosto Helsinki, Alppila
  • 3.
  • 4.
    Miksi avoin tieto? avaamalla dataa viranomaiset voivat auttaa luomaan innovatiivista liiketoimintaa ja uudenlaisia palveluja yhteiskunnallista ja kaupallista arvoa yhteistä hyvää (esim. fixmystreet.com, wheelshare.it) hallinnon avoimuus osallistava yhteiskunta lehdistölle ja aktivisteille ajantasaista tietoa
  • 5.
    Avoimen tiedon 2kerrosta data tarvitaan sovellusten rakentamiseen vasta sovellukset tekevät datasta mielenkiintoista ja hyödyllistä
  • 6.
    Avoimen tiedon vaikutukset liikenteen ja markkinoinnin tehostuminen uudenlainen liiketoiminta entistä avoimempi ja paremmin informoitu päätöksenteko voi vaikuttaa asumispäätöksiin ja koulujen valintaan "data-driven journalism"
  • 8.
    Avoin tieto Suomessa Valtionperiaatepäätös 3.3.2011 "Tietoaineistojen tulee olla avoimesti saatavilla ja uudelleenkäytettävissä yhtenäisin, selkein ja kaikille tasapuolisin ehdoin. Aineistojen tulee olla pääsääntöisesti maksuttomia."
  • 9.
    Muut maat USA,Iso-Britannia, Australia ja Uusi-Seelanti edelläkävijöitä Eurooppa Suomi toinen maa Europassa (Iso-Britannian jälkeen), joka teki periaatepäätöksen julkisesta datasta kehitys myös esim. Hollannissa, Ruotsissa, Espanjassa ja Saksassa muualla esim. Uruguay, Venäjä (opengovdata.ru)
  • 10.
  • 11.
    Linkitetty avoin tieto Linked Data - tekninen konsepti Open Data - julkaisupoliittinen asia
  • 12.
    Miksi Linked OpenData? tietojen uudenlainen yhdistäminen ja jakaminen tulee mahdolliseksi "it is the unexpected re-use of information which is the value added by the web" - Sir Tim Berners-Lee
  • 13.
    Tim Berners-Lee jaSemantic Web 2006 "The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine can explore the web of data. With linked data, when you have some of it, you can find other, related, data."
  • 14.
    The 5 starsof open linked data inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
  • 15.
    Osa 3: Tiedonavaamisen edellytykset
  • 16.
    Mitä avoin dataedellyttää? 1. tekninen saatavuus 2. uudelleenkäytön sallivat käyttöehdot 3. löydettävyys 4. ymmärrettävyys 5. maksuttomuus
  • 17.
    1 Tekninen saatavuus data on julkaistu sellaisessa muodossa, että sitä on helppo käsitellä ja hyödyntää osana verkkopalveluita koneellisesti PC Axis ja Excel vaativat oman ohjelmansa PDF ja HTML vaativat screenscrapingia CSV kätevä datan jakamisessa JSON/XML/RDF paras ratkaisu
  • 18.
    HTML ... <table> <tr> <td>1</td> <td>alikersantti</td> <td>NURMINEN</td> <td>AARNE ALLAN</td> <td>10.03.1940</td> <td> <ahref="index.php?id=6092&raportti=1"> n&auml;yt&auml; &raquo;</a> </td> </tr> </table> ...
  • 19.
    JSON { "firstName": "John", "lastName": "Smith", "age":25, "address": { "streetAddress": "21 2nd Street", "city": "New York", "state": "NY", "postalCode": "10021" }, "phoneNumber": [ { "type": "home", "number": "212 555-1234" }, { "type": "fax", "number": "646 555-4567" } ] }
  • 20.
    RDF <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:foaf="http: //xmlns.com/foaf/0.1/"xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://en.wikipedia.org/wiki/Tony_Benn"> <dc:title>Tony Benn</dc:title> <dc:publisher>Wikipedia</dc:publisher> <foaf:primaryTopic> <foaf:Person> <foaf:name>Tony Benn</foaf:name> </foaf:Person> </foaf: primaryTopic> </rdf:Description> </rdf:RDF>
  • 21.
    2 Uudelleenkäytön sallivatkäyttöehdot julkaisija sallii aineiston uudelleenkäytön ja kertoo sen selkeästi aineiston yhteydestä löytyvillä käyttöehdoilla Creative Commons käytetty etenkin Suomessa kaupallinen vs ei-kaupallinen jatkokäyttö?
  • 22.
    3 Löydettävyys aineiston olemassaolon ja sijainnin tulee olla yleisesti tunnettu datakatalogit kuten hri.fi data.suomi.fi kulttuurisampo.fi
  • 23.
    4 Ymmärrettävyys datan rakenne ja merkitys on kuvailtu ymmärrettävästi sen käyttäjille ilman kuvailua data jää merkityksettömäksi, eikä sitä pystytä hyödyntämään. data on myös kansainvälisesti ymmärrettävää
  • 24.
    5 Maksuttomuus valtion periaatepäätös: "Aineistojen tulee olla pääsääntöisesti maksuttomia." vain maksuttomuus mahdollistaa ekosysteemin kehittymisen liiketoimintamalleja on silti olemassa kuten Freemium rajoitettu pääsy maksullinen palvelu - esim. kaupallinen käyttö (Nantes, Ranska) esim. Ordnance Survey Iso Britanniassa vain suurempi käyttö maksullista
  • 25.
  • 26.
    Nykytila Suomessa Helsinki Regional Infoshare muiden kaupunkien liikennedata? Matkahuollon liikennedata? Tilastokeskuksen data koneluettavaksi? Kulttuurisampo Tanssin tiedotuskeskus - Tanka INSPIRE-direktiivi ja paikkatietolaki data.suomi.fi
  • 27.
    Ongelmakohtia dataapaljon, mutta ei koneluettavassa muodossa Excel, PDF, HTML, PC Axis käyttöehdot epäselvät yksityisyydensuoja muistettava esim. pk-seudun aluesarjoissa ei näytetä tietoja, jos henkilöt olisi helppo yksilöidä
  • 28.
    Seuraavat askeleet periaatepäätös hyvä alku uusia tietoaineistoja tulossa ulos eduskuntadata mediatalot kulttuuri, tieteet jne Linked Data Finland -hanke mitä sinä voit tehdä? millaisia aineistoja kannattaisi julkaista? millaisessa muodossa aineisto kannattaisi avata?
  • 29.
    Kiitos! tapio.nurminen@floapps.com twitter.com/TapioNurminen