Marc Rietveld (UMC Utrecht) - Big Data en Research IT

  • 2,028 views
Uploaded on

De presentatie van Marc Rietveld (UMC Utrecht) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere …

De presentatie van Marc Rietveld (UMC Utrecht) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
2,028
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
11
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • Alleen voor Genetica UMC Utrecht nu 5 petabyte per jaar;dat groeit nog, dan zijn we nog niet eens echt aan het sequencen begonnen
  • Life sciences is top sector voor EZ: Nederland als kennisland
  • Situatie in Utrecht Strategiestudie 2010-2011 Onderzoekers bewegen van ‘zelf doen’ naar gebruik centrale dienstverlening Groei tot over de eigen grenzen Verder: kwaliteit / monitoring wordt van groter belang Pro biotica affaire, maar ook management Geen automatische steun vanuit de onderzoekers Spitsen: Research dataware house Kennis Storage / rekencapaciteit / netwerk
  • Het resultaat van dit work package zou moeten zijn dat een geïntegreerde verzameling van data voor zorg en onderzoek wordt gerealiseerd. Met de invoering van het nieuwe ziekenhuissysteem in 2011 wordt een begin gemaakt met de invoering van zgn. ‘zorgpaden’: op de unieke patiënt afgestemde trajecten, waarin meerdere hulpverleners ieder hun eigen taak hebben en informatie met elkaar delen. Het idee is dat binnen deze zorgpaden ook research activiteiten worden geïntegreerd, zodat de patiënt via één pad zowel door de zorgverleners als door de onderzoekers worden benaderd. Eventuele dubbelingen worden vermeden, bloedbepalingen en scans worden in principe zo uitgevoerd dat deze zowel voor de zorg als het onderzoek gebruikt kunnen worden.
  • Huidige situatie Vele soorten en vormen van onderzoeksdatabases Veel suboptimale, lokale oplossingen. Niet altijd conform wet- en regelgeving Borging van de data is vaak matig (bijv. backups) Goede datamanagement ondersteuning niet overal beschikbaar Vindbaarheid van onderzoeksdata beperkt / geen catalogus
  • Administratieve ondersteuning Toegang tot expertise op het gebied van datamanagement, medische informatiekunde en bio-informatica Beveiligde toegang tot relevante resources, waaronder de eigen datasets Gedeelde omgeving met collega’s, ook buiten het ziekenhuis Centraal volgen van onderzoek maakt kwaliteitscontroles mogelijk
  • Infrastructuur = storage, high performance computing, netwerk Centraal vs decentraal beheer Financiering / doorberekening Opvangen piekbelasting door samenwerking? Cloud computing Basis IT-voorzieningen als commodity
  • Er wordt op allerlei manieren gewerkt aan de realisatie van een nationale en internationale ICT infrastructuur voor onderzoek. Wat bedoel ik daarmee? U moet hierbij denken aan zaken die je instituutsoverstijgend moet organiseren om samenwerking en uitwisseling van data zo goed mogelijk te faciliteren, maar ook om zo effectief mogelijk van dure voorzieningen gebruik te maken. Concreet gaat het met name om: Een centrale pseudonimisatiedienst, waardoor het mogelijk wordt om data over dezelfde patiënt uit meerdere ziekenhuizen te koppelen Standaarden voor de wijze waarop data wordt verzameld en vastgelegd. Dan gaat het om SOP’s, om de semantiek en syntax van de data die je verzamelt en de metadata, dus de data die belangrijke kenmerken van de verzamelde data beschrijven. Zonder dit soort standaarden is uitwisseling eigenlijk niet mogelijk. In het kader van parelsnoer is een begin gemaakt met dit soort standaarden. En we hebben mogelijk allemaal ook wel over SNOMED gehoord. Dan weet u ook dat er nogal wat bij komt kijken. Voorzieningen waarmee data kunnen worden teruggevonden. We zijn een enorme oceaan aan data aan het opbouwen, en het is absoluut niet vanzelfsprekend dat we straks nog iets kunnen terugvinden. Maar eventueel ook het gezamenlijk gebruik van grote rekenclusters zodat niet iedereen de eigen serverparken hoeft af te stemmen op de piekbelastingen En tenslotte kan het gaan om de ontwikkeling van dure en specifieke technologieën die voor iedereen van belang zijn. Hierbij speelt bijv. het NBIC een rol. De situatie nu is dat er vanuit allerlei grote projecten zoals CTMM, Parelsnoer, TI Pharma en BBMRI wordt gewerkt aan allerlei belangrijke voorzieningen. Voor een deel wordt er daarbij samengewerkt, voor een deel ook niet. Er staat van alles in de steigers, maar de programma’s lopen de komende jaren af en het is onzeker wat er daarna gebeurt.
  • Op verschillende niveaus is inmiddels het besef scherp aanwezig dat het nodig is om alle initiatieven beter op elkaar af te stemmen, zodat een samenhangende ICT infrastructuur ontstaat op nationaal en zo mogelijk ook op internationaal niveau, die ook op de langere termijn in stand kan worden gehouden. Hierbij zal naar verwachting de rol van de instituten groter gaan worden dan nu het geval is, zij zijn de eigenlijke klant van deze infrastructuur.
  • ‘ Not invented here’ syndroom: moeite met oplossingen die men niet zelf heeft bedacht Argwaan tegen ‘centrale’ voorzieningen Flexibiliteit & kosten De concurrent is de Mediamarkt Onderscheid soorten data: archivering vs werk Direct opvraagbaarheid is van belang, ook van de ruwe data Wantrouwen t.a.v. andere partijen Big brother Ook: de eigen data zijn heilig

Transcript

  • 1. Seminar Dutch Health Hub 23 november 2011 Marc Rietveld
  • 2. Kans Dutch Health Hub in onderzoek
    • Goedkope en flexibele basisvoorziening voor storage en rekencapaciteit
    • Mits:
      • Flexibel / hoog serviceniveau
      • Goedkoop
      • Snelle netwerkverbindingen!
      • Samenwerking
      • Veel aandacht voor beveiliging
    Werken aan vertrouwen
  • 3. Inhoud
    • Trends in onderzoek
    • Situatie in UMC Utrecht
    • Situatie landelijk
    • Bottlenecks / vragen / issues
    • Mogelijke bijdrage Dutch Health Hub aan onderzoek
  • 4. Trends in medisch / farmaceutisch onderzoek
    • Enorme groei data:
    • Digitalisering en verbeteringen in meetapparatuur
    • Digitalisering zorgdata
    • Alles opslaan, want misschien is het bruikbaar
    • Koppeling & bewerking bestaande datasets
        • Prof. Peter van der Spek
        • “ De hoeveelheid data in research zullen 6 tot 7 keer zo groot worden als in de zorg.”
  • 5. Ter ilustratie sequencing ‘old style’ vs ‘new style’ Nu: 240 GB / dag 100.000 ACTG per experiment 50.000.000.000 3 uur Tijd per experiment 7 uur 2 jaar Tijd voor humaan genoom 2 weken € 300.000.000 Kosten voor humaan genoom € 3.000
  • 6. Trends medisch / farmaceutisch onderzoek
    • Nieuwe mogelijkheden van en voor onderzoek
      • Patroonherkenning in grote hoeveelheden MRI’s of CT-scans
      • Statistisch minder evidente causale relaties bij grotere databases
      • Betere en effectievere bewaking van nieuwe behandelingen en medicijnen door gebruik zorgdata
    • Concurrentie tussen landen
      • Nederland scoort vooralsnog hoog wat betreft kwaliteit van onderzoekers en infrastructuur
      • Maar: Nederland is klein wat betreft bevolking
  • 7. Situatie UMC Utrecht
    • Strategiestudie ICT voor Research 2010 – 2011
      • Observaties
        • (Digitale) zorggegevens zijn bruikbaar voor onderzoek
        • Van ‘zelf doen’ naar gebruik van meer centrale dienstverlening
        • Differentiatie van nieuwe specialismen in onderzoeksondersteuning
        • Kwaliteit / monitoring onderzoek steeds belangrijker
      • Plannen .
        • Integratie gegevensverzameling zorg en onderzoek
        • Research Data Platform
        • Ondersteuning en monitoring van onderzoeker via Onderzoeksportaal
        • Basis infrastructuur: storage, high performance computing, netwerk
  • 8. Integratie zorg & onderzoek bij dataverzameling Gewenste situatie Geïntegreerde zorg- en onderzoeksinformatie Zorg- / research pad Intake, anamnese en IC Self reporting MyUMC
  • 9. Research Data Platform Gewenste situatie : RDP als onderdeel UMC-breed datawarehouse OLAP Bronsystemen Data store ETL EZIS SAP BW Lab / medicatie Uitvoer BI portal Rapport xyz Rapport xyz Dataset Samples Beeld Vragenlijsten META DATA Dataset Dataset
    • Kern ‘Research Data Platform’
      • Centrale storage voorziening
      • Standaarden metadatering
      • Selectie tooling
      • Catalogus
    • Doel: data mining vs datakerkhoven
  • 10.
    • Ondersteuning van gehele onderzoeksproces
    • Toegang tot relevante expertise en ondersteuning
    • Toegang tot beveiligde storage omgeving
    • Delen met onderzoekers wereldwijd
    • Kwatliteitsmonitoring
    Onderzoeksportaal Gewenste situatie
  • 11. ICT Infrastructuur Gewenste situatie Waardevolle gegevens in een goed beheerd RC Goede/snelle verbindingen binnen UMCU Hoge bandbreedte naar buiten Open access & identity management Storage als basisvoorziening Schaalbare, flexibele storage tegen lage kosten Gedeeltelijk eigen beheer Metadatering om data op langere termijn te beheersen Toegankelijk Rekencapaciteit als basisvoorziening Voldoende voor onderzoek op bijv. beeldmateriaal Flexibel: (externe) voorzieningen / afspraken om pieken in rekenbehoefte op te kunnen vangen Met energie / koeling / beveiliging goed geregeld Hogere eisen aan security / privacy Netwerk Storage Rekenkracht Rekencentrum
  • 12. Situatie landelijk V eel partijen, veel lijntjes, veel steigers Lifelines SURF SARA NBIC UU UL UvA RUG EUR UM VU UMCU LUMC AMC UMCG AZM VUMC ErasmusMC KUN RadboudMC LSH NFU ZonMW KNAW CTMM BMM PSI BBMRI Industrie RIVM e.a. Programma’s & projecten project project project project project project TI Pharma project … ESFRI IMI OPS PROTECT … FP7 BioShare BioImaging …
  • 13. Gewenste situatie: samen werken aan toekomstvaste voorzieningen
    • Samenhangende lokale voorzieningen waar mogelijk, centraal waar nodig
    SURF SARA NBIC UU UL UvA RUG EUR UM VU UMCU LUMC AMC UMCG AZM VUMC ErasmusMC KUN RadboudMC NFU ZonMW KNAW Industrie RIVM e.a. Nationale ICT infrastructuur
    • Van projectgedreven naar instituutsgedreven
    DHH?
  • 14. Issues / bottlenecks / vragen Not invented here! Flexibiliteit & kosten Snelle toegang Beveiliging eigen data Samenwerking?
  • 15. Mogelijke bijdrage Dutch Health Hub
    • Centrale voorziening voor storage en High Performance Computing
    • Aansluiten bij landelijke ontwikkelingen rond standaarden voor semantiek en metadata
    • Afstemmen met andere soortgelijke initiatieven zoals DANS en TARGET
    • Randvoorwaarden:
      • Flexibel / hoog serviceniveau
      • Goedkoop
      • Snelle netwerkverbindingen!
      • Samenwerking
      • Veel aandacht voor beveiliging