Datan siivousta tehokkaasti – Google Refine

811 views
751 views

Published on

Tutoriaali http://datajournalismi.fi/tutoriaaleja/

Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?

Vaaditut ohjelmat / työkalut:
Google Refine -ohjelma asennettuna

Sisältö tiivistetysti:
- Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto?
- Datan tuominen Google refineen
- Facet text facet
- Samankaltaisten klusterointi ja yhdistäminen
- Edit cells / split multi-valued cells
- Datan vieminen Refinesta exceliin

Tutoriaalissa käytettävä data:
Lataa data osoitteesta http://192.49.229.35/E2011/s/ehd_listat/kokomaa.htm
Suora linkki taulukkoon on http://192.49.229.35/E2011/s/ehd_listat/e2011ehd.xls

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
811
On SlideShare
0
From Embeds
0
Number of Embeds
88
Actions
Shares
0
Downloads
4
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • 2. Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?
  • Datan siivousta tehokkaasti – Google Refine

    1. 1. Google Refine Datan siivousta tehokkaasti – Eduskuntavaaliehdokkaiden itse ilmoittamat arvot/ammatit/asemat siivottuna Antti Poikola – Otavan Opisto Kuva: 1854 Broad Street cholera outbreak (wikipedia)Attribution-Share Alike 1.0 Finland
    2. 2. Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaali-Haaste: Millainen on ehdokkaiden poliittinen historia, kuka sai paljonkin ääniä aiemmissa vaaleissa? ehdokkaiden joukossa? Attribution-Share Alike 1.0 Finland
    3. 3. Data Vaalit.fi -sivustoltaAttribution-Share Alike 1.0 Finland
    4. 4. Uuden ”Refine Projektin” luominenAttribution-Share Alike 1.0 Finland
    5. 5. Projektin nimeäminenAttribution-Share Alike 1.0 Finland
    6. 6. Dataan tutustuminenAttribution-Share Alike 1.0 Finland
    7. 7. Vaalipiirien ehdokasmäärätAttribution-Share Alike 1.0 Finland
    8. 8. Pilkulla erotellut ammatit omille riveilleenAttribution-Share Alike 1.0 Finland
    9. 9. ”Textfacet” ammateilleAttribution-Share Alike 1.0 Finland
    10. 10. Eri tavoin kirjoitettujen ammattien yhdistäminen 1.Attribution-Share Alike 1.0 Finland
    11. 11. Eri tavoin kirjoitettujen ammattien yhdistäminen 2.Attribution-Share Alike 1.0 Finland
    12. 12. Eri tavoin kirjoitettujen ammattien yhdistäminen 3.Attribution-Share Alike 1.0 Finland
    13. 13. Ammattien lukumäärät tekstinä ulosAttribution-Share Alike 1.0 Finland
    14. 14. Tyhjien solujen täyttöAttribution-Share Alike 1.0 Finland
    15. 15. Tiedon tallentaminen Excel-muotoon 1.Attribution-Share Alike 1.0 Finland
    16. 16. Tiedon tallentaminen Excel-muotoon 2.Attribution-Share Alike 1.0 Finland
    17. 17. Yleisimmät ammatit puolueittain pääluottamusmies sairaanhoitaja KESK toimitusjohtaja KOK kasvatustieteiden maisteriyhteiskuntatieteiden maisteri PS toimittaja RKP filosofian maisteri SDP opiskelija VAS kansanedustaja VIHR yrittäjä 0 20 40 60 80 100 120 140 160 Attribution-Share Alike 1.0 Finland
    18. 18. Suomalainen datajournalistien verkosto Yhdessä oppien ja toisia auttaen  Datajournalismisivusto: http://datajournalismi.fi/  Datavaalit sivu: http://www.datavaalit.fi/  Twitterissä: @datajournalismi ja #datajournalismi  Facebookissa: www.facebook.com/datajournalismi  Teemo Tebestin blogi: datajournalismi.blogspot.com  Jens Finnäsin blogi: dataist.wordpress.com  HsOpen blogi: blogit.hs.fi/hsnextAttribution-Share Alike 1.0 Finland

    ×