Datan siivousta tehokkaasti – Google RefineAntti Poikola
Tutoriaali http://datajournalismi.fi/tutoriaaleja/
Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?
Vaaditut ohjelmat / työkalut:
Google Refine -ohjelma asennettuna
Sisältö tiivistetysti:
- Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto?
- Datan tuominen Google refineen
- Facet text facet
- Samankaltaisten klusterointi ja yhdistäminen
- Edit cells / split multi-valued cells
- Datan vieminen Refinesta exceliin
Tutoriaalissa käytettävä data:
Lataa data osoitteesta http://192.49.229.35/E2011/s/ehd_listat/kokomaa.htm
Suora linkki taulukkoon on http://192.49.229.35/E2011/s/ehd_listat/e2011ehd.xls
Datan siivousta tehokkaasti – Google RefineAntti Poikola
Tutoriaali http://datajournalismi.fi/tutoriaaleja/
Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?
Vaaditut ohjelmat / työkalut:
Google Refine -ohjelma asennettuna
Sisältö tiivistetysti:
- Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto?
- Datan tuominen Google refineen
- Facet text facet
- Samankaltaisten klusterointi ja yhdistäminen
- Edit cells / split multi-valued cells
- Datan vieminen Refinesta exceliin
Tutoriaalissa käytettävä data:
Lataa data osoitteesta http://192.49.229.35/E2011/s/ehd_listat/kokomaa.htm
Suora linkki taulukkoon on http://192.49.229.35/E2011/s/ehd_listat/e2011ehd.xls
Jane Jacobs: 4 edellytystä elävälle kaupunkialueelle.
1. alueella pitää olla useampi kuin yksi ja mielellään useampi, kuin kaksi pääasiallista käyttötarkoitusta
esim. asuminen + kaupallinen + työpaikat tai toimistot + iltaharrastukset. Tämä takaa sen, että alueella on tasaisesti ihmisvirtaa eri vuorokauden aikoihin, koska tasainen ihmisvirta on se, mikä luo mahdollisia kaupallisille palveluille. Jos on esim valtava toimistoalue, niin siellä ei pysy hengissä mikään muu, kuin teolliseen tuotantotahtiin pystyvä lounasravintola, joka on tyhjillään suurimman osan päivästä. Jos taas on palkkä asuinalue, niin se kannattelee ehkä pitseriaa. Näiden ensisijaisten käyttötarkoitusten yhdistäminen on kaupallisten palveluntuottajien näkökulmasta enemmän kuin 1+1, sillä se takaa ihmisvirtaa eri kellonaikoihin.
Keskustassa esim. kulttuuri- harraste, vapaa-aika, viihdetilat tuovat paljon kaivattua vilinää ilta-aikaan. Olennaista on, että eri toimintoja ei väkisin pyritä erottelemaan toisistaan, luomalla lisää Ylistönmäkiä työpaikoiksi, Seppälänkankaita kaupalle ja Lutakkoja asumiselle. Terveempää olisi, että kaikilla alueilla olisi sekaisin kaikenlaisia toimintoja.
Kolme muuta Jacobsin pointtia ovat:
2. Riittävän lyhyet korttelipituudet (oikopolkuja kävelijöille)
3. Eri ikäisiä ja kuntoisia rakennuksia, sillä halvemmille ja huonokuntoisemmille rakennuksille on myös kysyntää, joka tuottaa alueelle monipuolisuutta
4. riittävä ihmistiheys (ei vain asukastiheys, vaan tiheys ihmisiä, jotka tulevat alueelle eri syistä)
Avoin data ja avoin kaupunkiorganisaatio, Antti Poikola, HUB Jyväskylä
Avoimen datan avulla kaupunkilaisille tarjottavia digitaalisia palveluita voidaan kehittää kenen tahansa toimesta joustavasti ja tarvelähtöisesti. Mitä tämä tarkoittaa osallistumiselle ja demokratialle? Voisiko myös valmistelu- ja päätöksentekoprosessi olla avoin ja vuorovaikutteinen? Esimerkkejä avoimen datan ja avointen toimintamallien vaikutuksesta asioiden valmisteluun, päätöksentekoon ja yhteistuotantoon kunnissa ja kaupungeissa.
Ks. http://datajournalismi.fi/tutoriaaleja/#A
Lyhyt johdattelu datajournalismiin: mitä uutta on datajournalismissa, millainen työprosessi siihen liittyy ja muutamia esimerkkejä. Luennon sisältöä päivitetään säännöllisesti ja sovelletaan eri kohderyhmille, täällä julkaistu versio on yleinen "peruspaketti".
Ks. http://datajournalismi.fi/tutoriaaleja/#B
Neljä datajournalistille tärkeää tapaa datan hankkimiseen – avoin data, tietopyynnöt, ruudunraaputus ja joukkoistaminen.
Jane Jacobs: 4 edellytystä elävälle kaupunkialueelle.
1. alueella pitää olla useampi kuin yksi ja mielellään useampi, kuin kaksi pääasiallista käyttötarkoitusta
esim. asuminen + kaupallinen + työpaikat tai toimistot + iltaharrastukset. Tämä takaa sen, että alueella on tasaisesti ihmisvirtaa eri vuorokauden aikoihin, koska tasainen ihmisvirta on se, mikä luo mahdollisia kaupallisille palveluille. Jos on esim valtava toimistoalue, niin siellä ei pysy hengissä mikään muu, kuin teolliseen tuotantotahtiin pystyvä lounasravintola, joka on tyhjillään suurimman osan päivästä. Jos taas on palkkä asuinalue, niin se kannattelee ehkä pitseriaa. Näiden ensisijaisten käyttötarkoitusten yhdistäminen on kaupallisten palveluntuottajien näkökulmasta enemmän kuin 1+1, sillä se takaa ihmisvirtaa eri kellonaikoihin.
Keskustassa esim. kulttuuri- harraste, vapaa-aika, viihdetilat tuovat paljon kaivattua vilinää ilta-aikaan. Olennaista on, että eri toimintoja ei väkisin pyritä erottelemaan toisistaan, luomalla lisää Ylistönmäkiä työpaikoiksi, Seppälänkankaita kaupalle ja Lutakkoja asumiselle. Terveempää olisi, että kaikilla alueilla olisi sekaisin kaikenlaisia toimintoja.
Kolme muuta Jacobsin pointtia ovat:
2. Riittävän lyhyet korttelipituudet (oikopolkuja kävelijöille)
3. Eri ikäisiä ja kuntoisia rakennuksia, sillä halvemmille ja huonokuntoisemmille rakennuksille on myös kysyntää, joka tuottaa alueelle monipuolisuutta
4. riittävä ihmistiheys (ei vain asukastiheys, vaan tiheys ihmisiä, jotka tulevat alueelle eri syistä)
Avoin data ja avoin kaupunkiorganisaatio, Antti Poikola, HUB Jyväskylä
Avoimen datan avulla kaupunkilaisille tarjottavia digitaalisia palveluita voidaan kehittää kenen tahansa toimesta joustavasti ja tarvelähtöisesti. Mitä tämä tarkoittaa osallistumiselle ja demokratialle? Voisiko myös valmistelu- ja päätöksentekoprosessi olla avoin ja vuorovaikutteinen? Esimerkkejä avoimen datan ja avointen toimintamallien vaikutuksesta asioiden valmisteluun, päätöksentekoon ja yhteistuotantoon kunnissa ja kaupungeissa.
Ks. http://datajournalismi.fi/tutoriaaleja/#A
Lyhyt johdattelu datajournalismiin: mitä uutta on datajournalismissa, millainen työprosessi siihen liittyy ja muutamia esimerkkejä. Luennon sisältöä päivitetään säännöllisesti ja sovelletaan eri kohderyhmille, täällä julkaistu versio on yleinen "peruspaketti".
Ks. http://datajournalismi.fi/tutoriaaleja/#B
Neljä datajournalistille tärkeää tapaa datan hankkimiseen – avoin data, tietopyynnöt, ruudunraaputus ja joukkoistaminen.
1. Skaba, palkinnot jne. 6:lla kalvolla
Attribution-Share Alike 1.0 Finland www.apps4finland.fi
2. Kilpailu:
Kilpailu julkisen datan parhaista käyttötavoista
Kehitä idea toimiva web sovellus
Käytä vähintään yhtä jonkun julkishallinnon
organisaation tarjoamaa avointa datalähdettä
Attribution-Share Alike 1.0 Finland www.apps4finland.fi
3. Palkinnot:
Kolme sarjaa: Idea, Indie ja Agencies
Attribution-Share Alike 1.0 Finland www.apps4finland.fi
4. Aikataulu:
• 14.4.2010 Kilpailu julkistettiin
• 31.8.2010 Lopullinen palautusdedis
• 30.9.2010 Yleisöäänestys päättyy
• 7.10.2010 Palkintoseremonia MindTrek
konferenssissa Tampereella
Attribution-Share Alike 1.0 Finland www.apps4finland.fi
5. Datan lähteet:
• Virallinen suomalainen datakatalogi:
www.data.suomi.fi
• Kehittäjäyhteisön oma katalogi:
www.opengov.fi (avataan pian)
• Voit käyttää mitä tahansa avoimesti saatavilla
olevaa dataa, mutta sinun pitää rekisteröidä
käytämäsi datalähteet opengov.fi -sivulle,
niin, että muut löytävät samat datat.
• Voit myös osallistua hackhathon
-tapahtumiin ennen kilpailua tutustuaksesi
datoihin
Attribution-Share Alike 1.0 Finland www.apps4finland.fi
6. Seuraavat askeleet:
Liity sähköpostilistalle tai ennakkorekisteröidy
kilpailuun:
Liity Ennakko-
postituslistalle rekisteröidy
Saat kilpailuun liittyvää tietoa Saat tarkemmat tiedot
(enintään kerran viikossa) osallistumisesta ja tunnukset
palautusjärjestelmään. Ei ole
vielä sitova osallistuminen
kilpailuun
Attribution-Share Alike 1.0 Finland www.apps4finland.fi