Avoimen datan mahdollisuudet terveystieteissä THL 3.12.2013

571 views

Published on

Avoimen datan uudet mahdollisuudet terveys- ja yhteiskuntatieteissä. Esitelmä THL:llä 3.12.2013

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
571
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
3
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Avoimen datan mahdollisuudet terveystieteissä THL 3.12.2013

  1. 1. Avoin data­analytiikka & terveystieteet Leo Lahti, Helsinki & Wageningen (Alankomaat) THL 3.1 2.201 3
  2. 2. Leo Lahti Helsingin yliopisto (eltdk) Wageningenin yliopisto (Lab. Microbiol.), Alankomaat Tutkijatohtori (SA) Ihmiskehon mikrobiekologia TkT (Aalto, 201 0) Bioinformatiikka & koneoppiminen DI (TKK 2003) Teknillinen fysiikka & matematiikka VTK (HY 2009) Käytännöllinen filosofia & kansantaloustiede Open Knowledge Foundation Finland; Open Science work group Avoimen datan ohjelmakirjastot (rOpenSci; sorvi; Louhos-blogi) Avoimen lähdekoodin analyysivälineitä avoimelle datalle; biolääketiede keskeisimpänä sovellusalueena
  3. 3. Laskennallinen tiede & bioinformatiikka Avoin ja suljettu yhteiskunnallinen data Uusia tutkimustapoja ja ­välineitä? Keskustelua
  4. 4. Bioinformatiikka on monitieteinen tutkimusala, joka kehittää ja käyttää matematiikan, tietojenkäsittelytieteen sekä tilastotieteen menetelmiä biologisten ongelmien ratkaisuun. - Organisoi tietoaineistoja tutkijoiden saataville - Kehittää laskennallisia menetelmiä ja tietoresursseja - Soveltaa näitä (molekyyli)biologian tutkimuksessa Perimän rakenteen ja toiminnan kartoitus, geenisekvenssit, proteiinien ja geenien rakenne ja toiminta, evoluutiotutkimus, mikrobiekologia, tautigeenien kartoitus, eliöiden sukulaisuussuhteiden selvittäminen, prognostiikka, diagnostiikka
  5. 5. Ihmisen perimä ­ 3,000,000,000 emäsparia ­ 22,000 geeniä ­ mRNA; ncRNA; miRNA; lincRNA ­ 100,000 proteiinia - proteiinikompleksit - muu aineenvaihdunta, soluviestintä - biokemialliset vaikutusverkot - satoja kudostyyppejä - tuhansia sairauksia - ympäristötekijät
  6. 6. Aineistojen laskennallinen yhdistely keskeisellä sijalla perimän toimintaa tutkittaessa
  7. 7. Ihmisen mikrobiomi - tuhansia bakteerilajeja, valtaosin tuntemattomia - 1 0 1 4 bakteerisolua (1 0 x ihmisen solujen määrä!) ­ metagenomi: >3,000,000 uniikkia geeniä (1 50 x ihmisen perimä!) - hyvät, pahat & vapaamatkustajat HITChip suolistobakteeriatlas: 1000 bakteeria x 5000 näytettä
  8. 8. Datasta tietoon Tietojen yhdistely mahdollistaa uudet sovellukset ja kasvattaa datan arvoa Viisaus, toiminta Tieto, ymmärrys Informaatio, faktat Havainnot, data
  9. 9. R ­ Avoin tieteellinen laskentakieli jokapäiväiseen tiedonlouhintaan www.r-project.org - Laaja käyttäjä- ja kehittäjäyhteisö - Avoin lähdekoodi - Tuhansia analyysimenetelmiä (tilastollinen testaus, tiedonlouhinta, visualisointi) - Uusia työkaluja ja vaihtoehtoja SAS/SPSS/Matlab/Excel-säädölle
  10. 10. Number of analysis tools for R now growing exponentially CRAN rOpenGov r4stats.com
  11. 11. Avoimuuden etuja (data & koodi) - saavutettavuus & käytettävyys - läpinäkyvyys & luotettavuus - toistettavuus & jatkokäyttö - yhteistyön skaalautuvuus - lisätukea suljetun datan analyyseille
  12. 12. Esimerkki: uusi kuntajako ja väestötilastot Kuntajako: YLE Kuntakartta: Maanmittauslaitos Väestötiedot: Tilastokeskus
  13. 13. Open Street Map, Helsinki
  14. 14. Pullonkauloja avoimen datan hyödyntämisessä - tiedon hajanaisuus - heikko saavutettavuus - sotkuinen data - katoava data -  vertailukelvoton data - välineiden puute - yksityisyydensuoja
  15. 15. Louhos kerää ja kehittää algoritmeja avoimelle Suomi­datalle louhos.github.com
  16. 16. R/sorvi­kirjasto kattaa jo noin 20 kotimaista tietolähdettä Kunnallisvaalit Datavaalit Eduskunnan äänestykset Vaalikoneet YLE/MOT Yritystuet Maanmittauslaitos (MML) Suomen ympäristökeskus (SYKE/OIVA) Google Maps OpenStreetMap Kuntatason informaatio Maakuntatason informaatio Helsingin seudun ympäristöpalvelut (HSY) Helsingin kaupungin kiinteistövirasto (HKK) Helsinki Region Infoshare (HRI) Asuntojen hinnat Koulutus Kulttuuri Postinumerot Tilastokeskus Väestörekisterit Nimitilastot Maailmanpankki
  17. 17. Presidenttiehdokkaiden kannatus ja suomalaisten hyvinvointi (Data: Tilastokeskus & HRI)
  18. 18. Sotkanetin R-esimerkit Opasnet-sivustolla
  19. 19. Apps4Finland­finaaliin yhteistyössä Demos Helsingin kanssa
  20. 20. Käyttöesimerkkejä Datawiki github.com/louhos/sorvi/wiki/ Louhos­blogi louhos.wordpress.com
  21. 21. Sotkanet-esimerkit lähdekoodeineen Datawikissä
  22. 22. "Lex Karpela" tekijänoikeuslain kannattajat eduskunnassa
  23. 23. Louhos­blogi (louhos.wordpress.com)
  24. 24. Merkkipaaluja 201 0 sorvi-paketti & Louhos-blogi alulle 201 1 Datajournalismin työpaja, Vanha ylioppilastalo Apps4Finland Datan Avaus-sarjan voitto (sorvi) 201 2 SHARE-konferenssi (Belgrad) Kaupunkitutkimuksen päivät (Helsinki) HSOpen Hackathon - yhteistyö (Vaalidatapaketti) Sitralta 1 4,000e rahoitus Datavaalit-hankkeelle Open Legislative Data-konferenssi (Pariisi) Open Knowledge Festival (Helsinki) Apps4Finland Datan Avaus-sarjan voitto (Datavaalit) Apps4Finland Dataopas-sarjan yleisöäänet (Datawiki) Louhos-blogiin 20,000 vierailua 201 3 Open Knowledge Foundation; Open Science työryhmä Mukaan CRAN-verkostoon Open Knowledge Roadshow Sotkanet-sovellus Apps4Finland-finaalissa (+Demos Helsinki) Globaali rOpenGov-verkosto käynnistyy NIPS Machine Learning Open Source Software workshop (Lake Tahoe, US)
  25. 25. Uutta dataa & välineitä yhteiskuntatutkimukseen Datan saatavuus: tietolähteiden kartoitus; joustavat haku- ja putsausrutiinit Läpinäkyvyys & toistettavuus: kaikki vaiheet yhdessä koodissa Vuorovaikutteisuus: nopea datan seulonta ja visualisointi Monipuolisuus: koodipohjaa voidaan jakaa ja uudelleenkäyttää Lokalisoitu: kotimaisiin tarpeisiin Uusia tutkimusvälineitä: R/Python-koodikirjastot! (SAS/SPSS/Matlab/Excel: ei vastaavia välineitä
  26. 26. rOpenGov: globaali kehittäjäverkosto (ropengov.github.io) rOpenSci
  27. 27. Kiitos! Markus Kainu Aleksanteri-instituutti Joona Lehtomäki Helsingin yliopisto Juuso Parkkinen Aalto-yliopisto louhos.github.com/sorvi
  28. 28. Tervetuloa mukaan! louhos.github.io/sorvi !louhos@IRCnet

×