SlideShare a Scribd company logo
1 of 36
Download to read offline
GoDataDriven
PROUDLY PART OF THE XEBIA GROUP
@ivoeverts
ivoeverts@godatadriven.com
GoDataDriven @ HvA
Gastcollege minor Big Data,Amsterdam, 31/08/2017
Ivo Everts
Data Scientist
Wat gaan we doen
•GoDataDriven: wat doen we, waarom doen we
het, hoe doen we het.
•Wat doe ik daar.
•Uitdiepen van client cases.
Ik hoop dat jullie enthousiast
raken over data-gedreven
werken in het algemeen want dat
is de toekomst.
GoDataDriven
Knowledge mile
GoDataDriven
•We zijn een groep van ~30 data specialisten
•5 chiefs: ops, tech, marketing, sales, general
•Technical consultants:
•~50% data engineers
•~50% data scientists
•Dochterbedrijf van Xebia, groot geworden in
software ontwikkeling en consultancy
? Wat is het verschil tussen een data engineer en een data scientist ?
GoDataDriven
•Als gevolg van de automatisering hebben
bedrijven te maken met steeds meer data
•Veel bedrijven bewegen nu van data opslag naar
beschrijvende en voorspellende data verwerking
? Wat voor data hebben deze bedrijven en wat kan je daarmee ?
GoDataDriven
•Bij de klant zien we vaak de volgende fases:
•Inspiratie: workshops om de data-driven use-
cases te ontdekken
•Transpiratie: de rest :)
•Infrastructuur aanleggen
•Statistische modellen testen
•Software in productie nemen
? Hoe zou je het voorspellend vermogen van een model testen ?
GoDataDriven
Typische data science workflow
GoDataDriven
Typische data science workflow
real-time aanbevelingen online retailer
clickstreams
user profiles
geo-filtering
missing data
item features
user features
item similarity
user similarity
sales, CTR
user satisfaction
GoDataDriven
? Waar zit jij en waar wil je zitten ?
Ivo @ GoDataDriven
•Ik werk hier nu ~3 jaar als data scientist
•Grote projecten voor ING en NS
•Trainingen, workshops, presentaties, PoC's,
hackathons
•Gewerkt voor een startup vanuit de
onderzoeksgroep (SightCorp)
•Eigen bedrijfje voor bouwen van webapplicaties
•BSc + MSc + PhD in beeldverwerking en
toegepaste kunstmatige intelligentie
Ivo @ GoDataDriven
•Filmpjes kijken
•Afstudeeropdracht: object tracking with
multiple cameras
•Deel van proefschrift: human activity
recognition
•Werk bij SightCorp:
•InSight
•CrowdSight
Ivo @ GoDataDriven
Gezichtsherkenning
Jack, Marie, John, Kim,Ann
?
John
? Heb ik al gezegd dat dit machine learning heet ?
Ivo @ GoDataDriven
Typische data science workflow
human activity recognition in video
youtube
videos
formaat
converteren
beweging,
kleur, vorm
support vector
machine
accuracy
Ivo @ GoDataDriven
Wat is nou een machine learning model
Support vector machine
Decision tree / random forest
Ivo @ GoDataDriven
State of the art machine learning: Deep Learning
Ivo @ GoDataDriven
Client case: NPO
•Gepersonaliseerd nieuws en video aanbod op
basis van surf gedrag
•Clickstream data afgevangen met Divolte, onze
eigen in-house opensource tool
•Hadoop data platform ontworpen en ingericht
•Team en werkwijze opgestart
Client case: NPO
•Hoe goed kunnen we het aantal lezers van een
artikel voorspellen?
? Wat voor impact heeft dit op de advertentie verkoop ?
Client case: NPO
•Hoe verhoudt de lengte van een video zich tot
het percentage van mensen dat niet wegklikt?
? Zou dit gevolgen kunnen hebben voor de business ?
Client case: NPO
•Verdeling over jaartal van bekeken content op
basis van rule-based aanbevelingen vs
algoritmische aanbevelingen
? Wie worden hier blij van en waarom ?
Client case: NPO
•Mik niet alleen op CTR: vaak is je doel niet een op dit moment zo hoog
mogelijke CTR te halen, maar ligt dat (veel) hoger. Zo is het op een site als de
NPO heel makkelijk om een hoge CTR te halen met een zeker fragment dat
draait om de voorgevel van Katja Schuurman, maar is dat natuurlijk juist niet wat
je wil tonen. — Copyright Vincent.
•Realiseer je goed wat je meet. Een CTR kan je makkelijk definiëren als “aantal
keer getoond” gedeeld door “aantal keer geklikt”, maar als je zoals bij de NPO
elke keer als een stream gepauzeerd wordt als “een keer getoond” rekent dan
ben je in feite de CTR maal (1+”aantal keer gepauzeerd”) aan het meten. Dat
scheelt al snel een factor vier.
•Realiseer je goed waar je data vandaan komt, en dat deze soms heel vies is. Bij
eBay komt ruim 1/3 van alle searchqueries van bots vandaan. Als je dan
geïnteresseerd bent in waar men naar zoekt zal je die eerst weg moeten filteren.
Client case:Transavia
•Zeer vergelijkbaar met de NPO case
•Persoonlijke aanbevelingen op basis van jouw
surfgedrag
•Opbouwen van een gedragsprofiel
Client case:Transavia
•Integreren van machine learning
Client case:Transavia
? Wat is 'oude' technologie en wat is 'nieuwe' technologie ?
Client case: Bakkersland
•Mooi voorbeeld van hoe steeds meer 'normale'
bedrijven data gedreven gaan werken
•Bakkersland bakt brood en levert aan de
supermarkt
•De data bestaat uit kassa bonnetjes die 's avonds
naar een ftp server worden gekopieerd
? Wat is de case ?
Client case: Bakkersland
Client case: NS
Client case: NS - luchtlekkage
•Credits:Wan-Jui Lee
•De remmen en deuren werken op luchtdruk
•Dus als er niet genoeg lucht is, is er niet genoeg
druk om te remmen
•'Luchtlekkage' vertraagt het bijvullen door de
compressor
•Gebeurt ~1.5x per trein per jaar
•Is moeilijk te detecteren tijdens inspectie
Client case: NS - luchtlekkage
Client case: NS - luchtlekkage
TP rate ~85%,TN rate ~100%
Client case: NS - Hotwheels
•Credits: Margot Peters
•Met het slijten van de as lagers, stijgt de
temperatuur bij de wielen
•Te hoge temperatuur schommeling => slijtage
van de as lager => wiel kapot
Client case: NS - Hotwheels
•De sleutel voor het voorspellen van de slijtage zit
'm in het links/rechts temperatuur verschil
Project:WaterIoT
•Samenwerking tussen GoDataDriven /
Knowledge Mile / HvA / Dopper / Arno van
Herwijnen
•Slimme tappunten door connectiviteit en data
verzameling
Zelf coden
•Data van wikipedia
•Jupyter notebook
GoDataDriven
PROUDLY PART OF THE XEBIA GROUP
@ivoeverts
ivoeverts@godatadriven.com
GoDataDriven @ HvA
Gastcollege minor Big Data,Amsterdam, 31/08/2017
Dank!
Ivo Everts
Data Scientist

More Related Content

Similar to GoDataDriven weer op de hogeschool van Amsterdam: gastcollege door Ivo Everts

Deloitte Webwinkel Vakdagen
Deloitte Webwinkel VakdagenDeloitte Webwinkel Vakdagen
Deloitte Webwinkel Vakdagenwebwinkelvakdag
 
Personalisatie 1 John van Beek - Personalization
Personalisatie 1 John van Beek - PersonalizationPersonalisatie 1 John van Beek - Personalization
Personalisatie 1 John van Beek - PersonalizationDigital Wednesday
 
Presentatie Somehow 29032013 zorg innovatiedag / workshop
Presentatie Somehow 29032013 zorg innovatiedag / workshopPresentatie Somehow 29032013 zorg innovatiedag / workshop
Presentatie Somehow 29032013 zorg innovatiedag / workshopWilbert Baan
 
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINTlabs | The Sogeti Trendlab
 
Website conversie optimalisatie
Website conversie optimalisatieWebsite conversie optimalisatie
Website conversie optimalisatieGuido X Jansen
 
Kunnen we door personalisatie de omzet verhogen webwinkel vakdagen 2014.ppt
Kunnen we door personalisatie de omzet verhogen   webwinkel vakdagen 2014.pptKunnen we door personalisatie de omzet verhogen   webwinkel vakdagen 2014.ppt
Kunnen we door personalisatie de omzet verhogen webwinkel vakdagen 2014.pptwebwinkelvakdag
 
Google analytics: Measuring what matters
Google analytics: Measuring what mattersGoogle analytics: Measuring what matters
Google analytics: Measuring what mattersDavy Tollenaere
 
Data Pioneers - Remco Wilting (VODW) - Mythes en feiten rondom big data
Data Pioneers -  Remco Wilting (VODW) - Mythes en feiten rondom big data Data Pioneers -  Remco Wilting (VODW) - Mythes en feiten rondom big data
Data Pioneers - Remco Wilting (VODW) - Mythes en feiten rondom big data Multiscope
 
Solvinity | Big Data: Ability to Execute
Solvinity | Big Data: Ability to ExecuteSolvinity | Big Data: Ability to Execute
Solvinity | Big Data: Ability to ExecuteSolvinity
 
Presentation2value2 uitgekristaliseerd in 2007
Presentation2value2 uitgekristaliseerd in 2007Presentation2value2 uitgekristaliseerd in 2007
Presentation2value2 uitgekristaliseerd in 2007Henk van Cann
 
@Ziggo webcare digital marketing update stormmc - berend sikkenga - 2 oktob...
@Ziggo webcare   digital marketing update stormmc - berend sikkenga - 2 oktob...@Ziggo webcare   digital marketing update stormmc - berend sikkenga - 2 oktob...
@Ziggo webcare digital marketing update stormmc - berend sikkenga - 2 oktob...StormMC
 

Similar to GoDataDriven weer op de hogeschool van Amsterdam: gastcollege door Ivo Everts (20)

Deloitte Webwinkel Vakdagen
Deloitte Webwinkel VakdagenDeloitte Webwinkel Vakdagen
Deloitte Webwinkel Vakdagen
 
Personalisatie 1 John van Beek - Personalization
Personalisatie 1 John van Beek - PersonalizationPersonalisatie 1 John van Beek - Personalization
Personalisatie 1 John van Beek - Personalization
 
Marketing & Big Data event
Marketing & Big Data eventMarketing & Big Data event
Marketing & Big Data event
 
Presentatie Somehow 29032013 zorg innovatiedag / workshop
Presentatie Somehow 29032013 zorg innovatiedag / workshopPresentatie Somehow 29032013 zorg innovatiedag / workshop
Presentatie Somehow 29032013 zorg innovatiedag / workshop
 
BDDD Bob Nieme
BDDD Bob NiemeBDDD Bob Nieme
BDDD Bob Nieme
 
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
 
Website conversie optimalisatie
Website conversie optimalisatieWebsite conversie optimalisatie
Website conversie optimalisatie
 
Kunnen we door personalisatie de omzet verhogen? JA! Webwinkel Vakdagen 2014
Kunnen we door personalisatie de omzet verhogen? JA! Webwinkel Vakdagen 2014Kunnen we door personalisatie de omzet verhogen? JA! Webwinkel Vakdagen 2014
Kunnen we door personalisatie de omzet verhogen? JA! Webwinkel Vakdagen 2014
 
Kunnen we door personalisatie de omzet verhogen webwinkel vakdagen 2014.ppt
Kunnen we door personalisatie de omzet verhogen   webwinkel vakdagen 2014.pptKunnen we door personalisatie de omzet verhogen   webwinkel vakdagen 2014.ppt
Kunnen we door personalisatie de omzet verhogen webwinkel vakdagen 2014.ppt
 
Bootcamp
BootcampBootcamp
Bootcamp
 
Google analytics: Measuring what matters
Google analytics: Measuring what mattersGoogle analytics: Measuring what matters
Google analytics: Measuring what matters
 
ICT Trends in 2013
ICT Trends in 2013ICT Trends in 2013
ICT Trends in 2013
 
Data Pioneers - Remco Wilting (VODW) - Mythes en feiten rondom big data
Data Pioneers -  Remco Wilting (VODW) - Mythes en feiten rondom big data Data Pioneers -  Remco Wilting (VODW) - Mythes en feiten rondom big data
Data Pioneers - Remco Wilting (VODW) - Mythes en feiten rondom big data
 
Solvinity | Big Data: Ability to Execute
Solvinity | Big Data: Ability to ExecuteSolvinity | Big Data: Ability to Execute
Solvinity | Big Data: Ability to Execute
 
Loyall: Cloud computing
Loyall: Cloud computingLoyall: Cloud computing
Loyall: Cloud computing
 
Loyall: Cloud computing
Loyall: Cloud computingLoyall: Cloud computing
Loyall: Cloud computing
 
Presentation2value2 uitgekristaliseerd in 2007
Presentation2value2 uitgekristaliseerd in 2007Presentation2value2 uitgekristaliseerd in 2007
Presentation2value2 uitgekristaliseerd in 2007
 
@Ziggo webcare digital marketing update stormmc - berend sikkenga - 2 oktob...
@Ziggo webcare   digital marketing update stormmc - berend sikkenga - 2 oktob...@Ziggo webcare   digital marketing update stormmc - berend sikkenga - 2 oktob...
@Ziggo webcare digital marketing update stormmc - berend sikkenga - 2 oktob...
 
The state of SEO & GDPR
The state of SEO & GDPRThe state of SEO & GDPR
The state of SEO & GDPR
 
Bas de Vos - SKO - FOAM
Bas de Vos - SKO - FOAMBas de Vos - SKO - FOAM
Bas de Vos - SKO - FOAM
 

GoDataDriven weer op de hogeschool van Amsterdam: gastcollege door Ivo Everts

  • 1. GoDataDriven PROUDLY PART OF THE XEBIA GROUP @ivoeverts ivoeverts@godatadriven.com GoDataDriven @ HvA Gastcollege minor Big Data,Amsterdam, 31/08/2017 Ivo Everts Data Scientist
  • 2. Wat gaan we doen •GoDataDriven: wat doen we, waarom doen we het, hoe doen we het. •Wat doe ik daar. •Uitdiepen van client cases.
  • 3. Ik hoop dat jullie enthousiast raken over data-gedreven werken in het algemeen want dat is de toekomst.
  • 5. GoDataDriven •We zijn een groep van ~30 data specialisten •5 chiefs: ops, tech, marketing, sales, general •Technical consultants: •~50% data engineers •~50% data scientists •Dochterbedrijf van Xebia, groot geworden in software ontwikkeling en consultancy ? Wat is het verschil tussen een data engineer en een data scientist ?
  • 6. GoDataDriven •Als gevolg van de automatisering hebben bedrijven te maken met steeds meer data •Veel bedrijven bewegen nu van data opslag naar beschrijvende en voorspellende data verwerking ? Wat voor data hebben deze bedrijven en wat kan je daarmee ?
  • 7. GoDataDriven •Bij de klant zien we vaak de volgende fases: •Inspiratie: workshops om de data-driven use- cases te ontdekken •Transpiratie: de rest :) •Infrastructuur aanleggen •Statistische modellen testen •Software in productie nemen ? Hoe zou je het voorspellend vermogen van een model testen ?
  • 9. GoDataDriven Typische data science workflow real-time aanbevelingen online retailer clickstreams user profiles geo-filtering missing data item features user features item similarity user similarity sales, CTR user satisfaction
  • 10. GoDataDriven ? Waar zit jij en waar wil je zitten ?
  • 11. Ivo @ GoDataDriven •Ik werk hier nu ~3 jaar als data scientist •Grote projecten voor ING en NS •Trainingen, workshops, presentaties, PoC's, hackathons •Gewerkt voor een startup vanuit de onderzoeksgroep (SightCorp) •Eigen bedrijfje voor bouwen van webapplicaties •BSc + MSc + PhD in beeldverwerking en toegepaste kunstmatige intelligentie
  • 12. Ivo @ GoDataDriven •Filmpjes kijken •Afstudeeropdracht: object tracking with multiple cameras •Deel van proefschrift: human activity recognition •Werk bij SightCorp: •InSight •CrowdSight
  • 13. Ivo @ GoDataDriven Gezichtsherkenning Jack, Marie, John, Kim,Ann ? John ? Heb ik al gezegd dat dit machine learning heet ?
  • 14. Ivo @ GoDataDriven Typische data science workflow human activity recognition in video youtube videos formaat converteren beweging, kleur, vorm support vector machine accuracy
  • 15. Ivo @ GoDataDriven Wat is nou een machine learning model Support vector machine Decision tree / random forest
  • 16. Ivo @ GoDataDriven State of the art machine learning: Deep Learning
  • 18. Client case: NPO •Gepersonaliseerd nieuws en video aanbod op basis van surf gedrag •Clickstream data afgevangen met Divolte, onze eigen in-house opensource tool •Hadoop data platform ontworpen en ingericht •Team en werkwijze opgestart
  • 19. Client case: NPO •Hoe goed kunnen we het aantal lezers van een artikel voorspellen? ? Wat voor impact heeft dit op de advertentie verkoop ?
  • 20. Client case: NPO •Hoe verhoudt de lengte van een video zich tot het percentage van mensen dat niet wegklikt? ? Zou dit gevolgen kunnen hebben voor de business ?
  • 21. Client case: NPO •Verdeling over jaartal van bekeken content op basis van rule-based aanbevelingen vs algoritmische aanbevelingen ? Wie worden hier blij van en waarom ?
  • 22. Client case: NPO •Mik niet alleen op CTR: vaak is je doel niet een op dit moment zo hoog mogelijke CTR te halen, maar ligt dat (veel) hoger. Zo is het op een site als de NPO heel makkelijk om een hoge CTR te halen met een zeker fragment dat draait om de voorgevel van Katja Schuurman, maar is dat natuurlijk juist niet wat je wil tonen. — Copyright Vincent. •Realiseer je goed wat je meet. Een CTR kan je makkelijk definiëren als “aantal keer getoond” gedeeld door “aantal keer geklikt”, maar als je zoals bij de NPO elke keer als een stream gepauzeerd wordt als “een keer getoond” rekent dan ben je in feite de CTR maal (1+”aantal keer gepauzeerd”) aan het meten. Dat scheelt al snel een factor vier. •Realiseer je goed waar je data vandaan komt, en dat deze soms heel vies is. Bij eBay komt ruim 1/3 van alle searchqueries van bots vandaan. Als je dan geïnteresseerd bent in waar men naar zoekt zal je die eerst weg moeten filteren.
  • 23. Client case:Transavia •Zeer vergelijkbaar met de NPO case •Persoonlijke aanbevelingen op basis van jouw surfgedrag
  • 24. •Opbouwen van een gedragsprofiel Client case:Transavia
  • 25. •Integreren van machine learning Client case:Transavia ? Wat is 'oude' technologie en wat is 'nieuwe' technologie ?
  • 26. Client case: Bakkersland •Mooi voorbeeld van hoe steeds meer 'normale' bedrijven data gedreven gaan werken •Bakkersland bakt brood en levert aan de supermarkt •De data bestaat uit kassa bonnetjes die 's avonds naar een ftp server worden gekopieerd ? Wat is de case ?
  • 29. Client case: NS - luchtlekkage •Credits:Wan-Jui Lee •De remmen en deuren werken op luchtdruk •Dus als er niet genoeg lucht is, is er niet genoeg druk om te remmen •'Luchtlekkage' vertraagt het bijvullen door de compressor •Gebeurt ~1.5x per trein per jaar •Is moeilijk te detecteren tijdens inspectie
  • 30. Client case: NS - luchtlekkage
  • 31. Client case: NS - luchtlekkage TP rate ~85%,TN rate ~100%
  • 32. Client case: NS - Hotwheels •Credits: Margot Peters •Met het slijten van de as lagers, stijgt de temperatuur bij de wielen •Te hoge temperatuur schommeling => slijtage van de as lager => wiel kapot
  • 33. Client case: NS - Hotwheels •De sleutel voor het voorspellen van de slijtage zit 'm in het links/rechts temperatuur verschil
  • 34. Project:WaterIoT •Samenwerking tussen GoDataDriven / Knowledge Mile / HvA / Dopper / Arno van Herwijnen •Slimme tappunten door connectiviteit en data verzameling
  • 35. Zelf coden •Data van wikipedia •Jupyter notebook
  • 36. GoDataDriven PROUDLY PART OF THE XEBIA GROUP @ivoeverts ivoeverts@godatadriven.com GoDataDriven @ HvA Gastcollege minor Big Data,Amsterdam, 31/08/2017 Dank! Ivo Everts Data Scientist