Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Presentatie Marco Brattinga

18 views

Published on

Presentatie van het Datacongres ''data science voor maatschappelijke uitdagingen'' op 22 november 2018

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

Presentatie Marco Brattinga

  1. 1. 0 Technische valkuilen van het gebruik van data Marco Brattinga Data science voor maatschappelijke uitdagingen 22 november 2018, Den Haag
  2. 2. 1 Valkuil #1 Big data is niet alleen “veel” De verscheidenheid van data wordt onderschat
  3. 3. 2 Valkuil #2 Struikel niet over het dataformaat • Gestructureerd, tekst, geospatial, plaatjes, … • XML, CSV, JSON, ... • XSD’s, WSDL, Swagger, … • Coordinatenstelsels • Tekencoderingen
  4. 4. 3 Valkuil #3 Vorm bepaalt niet de betekenis • Bij vrijwel alle gestructureerde data wordt de vorm gebruikt om de betekenis af te leiden • Maar in een andere context kan de betekenis kwijt raken.
  5. 5. 4 EEN PRAKTIJKVOORBEELD
  6. 6. 5 Voorbeeld van de complexiteit: Het begrip bebouwde kom Source: google streetview
  7. 7. 6 Bebouwde kom wegenverkeerswet op de kaart (verkeersregels, bepaald door de gemeente)
  8. 8. 7 Bebouwde kom wegenwet op de kaart (onderhoud wegen, bepaald door de Provincie)
  9. 9. 8 En zo zijn er nog wel een paar “bebouwde kommen”
  10. 10. 9 Valkuil #4 metadata is vervelend Zonder metadata: • Is het moeilijk om de juiste data te vinden • Is het moeilijk om de data op de juiste manier te gebruiken Goede metadata maken is zoiets als de zolder opruimen: handig als je het gedaan hebt, maar vervelend om te doen.
  11. 11. 10 EEN PRAKTIJKVOORBEELD
  12. 12. 11 Voorbeeld
  13. 13. 12 Voorbeeld
  14. 14. 13 Voorbeeld
  15. 15. 14 Voorbeeld
  16. 16. 15 Voorbeeld
  17. 17. 16 Valkuil #5 verbonden data is niet zwart-wit Verbonden data kan eenvoudig zorgen voor vervuiling: • Verschillende tijdperiode’s; • Verschillende betrouwbaarheid; • Verschillende doelbinding; • Verschillende invalshoeken; • …
  18. 18. 17 Valkuil #6 Laat je niet verblinden door data Is het inzicht dat je hebt kregen wellicht… • Toeval? • Verwisseling van oorzaak en gevolg? • Gebaseerd op een ontbrekend element? • Veroorzaakt door een algemene trend? • Afkomstig uit een te kleine dataset? (n=1)
  19. 19. 18 Aanpakken van de valkuilen Intelligente datagedreven organisaties zetten in op: Capture & manage Genereer en verzamel relevante data en zorg voor optimale beschikbaarheid. Toegankelijk, betrouwbaar en veilig. Analyse, Visualise & Insight Analyseer de mix aan data, ontdek nieuwe verbanden en krijg dieper inzicht in uw bedrijfsprocessen. Groei van describe, predict naar prescribe. Activate, optimize & innovate Richt uw bedrijfsprocessen slimmer in met datagedreven applicaties en zelflerende systemen.
  20. 20. 19 Aanpakken van de valkuilen Data moet je kunnen vinden: • Unieke identificaties (URI’s); • Machine-leesbare beschrijvingen (metadata) Data moeten toegankelijk zijn: • Open en gestandaardiseerde data- uitwisselingsprotocollen (lees: web-based); • Gestandaardiseerde beveiligingsprotocol; • Data en metadata verbonden (zelfbeschrijvende data) Data moet te verbinden zijn met andere data: • Machine-leesbare formaten voor data en metadata; • Vocabularies (datamodellen) zelf ook FAIR; • Datalinks obv URI’s Data moet herbruikbaar zijn: • Metadata omvat informatie voor hergebruik: licenties, versie- en herkomstinformatie, doelbinding, etc.
  21. 21. 20  Gebruik internetstandaarden  Verbindt je data met andere data  Maak het ontwikkelaars makkelijk  Maak het gebruikers makkelijk Aanpakken van de valkuilen
  22. 22. 21  Gebruik internetstandaarden  Verbindt je data met andere data  Maak het ontwikkelaars makkelijk  Maak het gebruikers makkelijk  Geef uitleg over de betekenis  Verbind met wet & regelgeving  Verbind met andere datasets (van anderen) Aanpakken van de valkuilen
  23. 23. 22  Gebruik internetstandaarden  Verbindt je data met andere data  Maak het ontwikkelaars makkelijk  Maak het gebruikers makkelijk Aanpakken van de valkuilen
  24. 24. 23  Gebruik internetstandaarden  Verbindt je data met andere data  Maak het ontwikkelaars makkelijk  Maak het gebruikers makkelijk Aanpakken van de valkuilen
  25. 25. Contact Ir. Marco Brattinga Senior principal expert marco.brattinga@ordina.nl (+31) 6 53 37 55 74 http://nl.linkedin.com/in/marcobrattinga

×