SlideShare a Scribd company logo
ANWB data gedreven: Voorspellen
van autopech
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Hoe kunnen we big data
technologie inzetten?
2
Gregor Abbas, Tijmen Blankevoort, Remko Stam
3
Forecasting Wegenwacht
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Forecasting Wegenwacht: Wie
krijgt waar wanneer waarmee
pech?
• ± 1.100.000 pechmeldingen per jaar
• 750 wegenwachten
• Overcapaciteit = duur
• Ondercapaciteit = slecht product
Datum Dag
Aantal gestrande
auto's - TOP 10
2012-02-07 Dinsdag 9.890
2012-02-02 Donderdag 9.352
2012-02-06 Maandag 9.271
2012-02-01 Woensdag 8.332
2010-12-02 Donderdag 7.818
2010-12-01 Woensdag 7.510
2010-01-04 Maandag 7.475
2012-02-03 Vrijdag 7.244
2010-12-20 Maandag 6.965
2010-12-03 Vrijdag 6.846
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Forecasting Wegenwacht: Wie
krijgt waar wanneer waarmee
pech?
Ultieme uitdaging: Voorspellen dat dhr. Jansen morgen om
9:24 met zijn VW polo strandt met een lekke band
(rechtsvoor) op de Kerkdijk 59.
5
Technologische
ontwikkeling
De case: forecast pechgevallen
Regio’s Nederland (totaal 4)
Per half uur:
Hoofdvraag
Kunnen we de hoeveelheid pechgevallen
voorspellen op basis van historische
data?
Per dag:
Analyse op werkgebied-niveau
Werkgebieden Nederland (totaal 33)
Weerstation
Per half uur:
Per dag:
Gebruikte data
Scyfer Deep Learning
Weerslag
Historische gegevens KNMI
Predicties Weerslag
Pechgevallen
Ledenaantallen
Feestdagen
Schoolvakanties
Dag/Maand/Jaar
Deep Learning
Superhuman image recognition
(Microsoft 2015)
Self-Driving Car (Google)
Deep Learning - more complex
concepts in subsequent layers
Deep learning is
currently winning all
machine learning
challenges
Voorspellingen - Werkgebied
Voorspellingen - Regio
Voorspellingen per dag heel 2014
De resultaten
ANWB Scyfer Verbetering
Noord-Oost 44 38 14%
Noord-West 55 44 20%
Zuid 55 45 18%
Zuid-West 46 38 17%
Nederland 164 123 25%
Gemiddelde absolute fout per dag op 2014
Vergelijking Scyfer modellen en ANWB
personeel voorspellingen (m.b.v. ander
model en eigen inzicht)
De verbetering is t.o.v. het aantal fouten per
dag.
Totaal gemm. 7% foute voorspellingen per
dag.
- Trainset: data 2004-2012
- Validatieset: data 2013
- Hertraining data 2004-2013
- Test: Forecast 2014
Sneller voorspellen
Voorheen meerdere uren per dag
kwijt met maken voorspellingen
Nu:
Software die met één druk op de
knop de forecast maakt:
○ Downloaden
weergegevens
○ Genereren input voor
model
○ Voorspelling (incl.
grafieken/tabellen)
In de praktijk?
Voorspellingen pechgevallen van 7% in 2014 naar 4.5% fout in deze maand
Maar: Geen significant verschil tussen ANWB personeel en Scyfer model.
Vervolgstap: Zoek uit waarom dit zo is!
Conclusie
Alternatieve vervolgstap:
Voorspelling locatie?
Eindresultaat:
● Theoretisch verbeterd pechgevallen model m.b.v. Big
Data
● Snellere voorspellingen maken, geen Excel
● Vervolgonderzoek: Waarom in de praktijk hetzelfde
resultaat?
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Computer says ‘no’
17
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Van Passief naar Preventief
18
?
!
Passief Proactief Preventief
Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een
lekke band (rechtsvoor) op de Kerkdijk 59.
Gregor Abbas, Tijmen Blankevoort, Remko Stam
19
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Gregor Abbas
@kreekoor
gabbas@anwb.nl
Tijmen Blankevoort
tijmen@scyfer.nl
20

More Related Content

Viewers also liked

sarah.cv
sarah.cvsarah.cv
sarah.cv
sarah saeed
 
Leonardo rojas trx
Leonardo rojas trxLeonardo rojas trx
Leonardo rojas trx
leorojashp1
 
2016 Calendar Project Mock-up
2016 Calendar Project Mock-up2016 Calendar Project Mock-up
2016 Calendar Project Mock-up
Loretta McKenzie
 
Resume
ResumeResume
How to get Terrific ROI on yout WiFi Hotspot installations?
How to get Terrific ROI on yout WiFi Hotspot installations?How to get Terrific ROI on yout WiFi Hotspot installations?
How to get Terrific ROI on yout WiFi Hotspot installations?
Gabriel Neuman
 
Modulo ilianet
Modulo ilianetModulo ilianet
Modulo ilianet
ilianet7
 
Presentatie Social Sevvy #3
Presentatie Social Sevvy #3Presentatie Social Sevvy #3
Presentatie Social Sevvy #3
Paul van Haastert
 
Comprehension Strategies
Comprehension StrategiesComprehension Strategies
Comprehension Strategies
drybarra
 
Word war 2
Word war 2Word war 2
Word war 2
PAXROMANA
 
Presentacion los aborigenes
Presentacion los aborigenesPresentacion los aborigenes
Presentacion los aborigenes
Estudiante.uftsaia Slideshow
 
Green building: green roof and wall
Green building: green roof and wallGreen building: green roof and wall
Green building: green roof and wall
Geert Elemans
 
shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...
shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...
shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...
shareNL
 
Relieveing the Testing Bottle Neck - Webinar
Relieveing the Testing Bottle Neck - WebinarRelieveing the Testing Bottle Neck - Webinar
Relieveing the Testing Bottle Neck - Webinar
Cprime
 

Viewers also liked (14)

sarah.cv
sarah.cvsarah.cv
sarah.cv
 
Leonardo rojas trx
Leonardo rojas trxLeonardo rojas trx
Leonardo rojas trx
 
2016 Calendar Project Mock-up
2016 Calendar Project Mock-up2016 Calendar Project Mock-up
2016 Calendar Project Mock-up
 
VAT recommendaton
VAT recommendatonVAT recommendaton
VAT recommendaton
 
Resume
ResumeResume
Resume
 
How to get Terrific ROI on yout WiFi Hotspot installations?
How to get Terrific ROI on yout WiFi Hotspot installations?How to get Terrific ROI on yout WiFi Hotspot installations?
How to get Terrific ROI on yout WiFi Hotspot installations?
 
Modulo ilianet
Modulo ilianetModulo ilianet
Modulo ilianet
 
Presentatie Social Sevvy #3
Presentatie Social Sevvy #3Presentatie Social Sevvy #3
Presentatie Social Sevvy #3
 
Comprehension Strategies
Comprehension StrategiesComprehension Strategies
Comprehension Strategies
 
Word war 2
Word war 2Word war 2
Word war 2
 
Presentacion los aborigenes
Presentacion los aborigenesPresentacion los aborigenes
Presentacion los aborigenes
 
Green building: green roof and wall
Green building: green roof and wallGreen building: green roof and wall
Green building: green roof and wall
 
shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...
shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...
shareNL symposium autodelen 2016, Caroline Cerfontaine, David van Kesteren, L...
 
Relieveing the Testing Bottle Neck - Webinar
Relieveing the Testing Bottle Neck - WebinarRelieveing the Testing Bottle Neck - Webinar
Relieveing the Testing Bottle Neck - Webinar
 

More from Gregor Abbas

Ruimte voor de stad
Ruimte voor de stadRuimte voor de stad
Ruimte voor de stad
Gregor Abbas
 
Smart CitySDK at Apps for Smart Cities
Smart CitySDK at Apps for Smart CitiesSmart CitySDK at Apps for Smart Cities
Smart CitySDK at Apps for Smart Cities
Gregor Abbas
 
Lecture Transparant Governance The Hague University
Lecture Transparant Governance The Hague UniversityLecture Transparant Governance The Hague University
Lecture Transparant Governance The Hague University
Gregor Abbas
 
Open Data & AppsvoorNederland
Open Data & AppsvoorNederlandOpen Data & AppsvoorNederland
Open Data & AppsvoorNederland
Gregor Abbas
 
Internet der Dingen
Internet der DingenInternet der Dingen
Internet der DingenGregor Abbas
 
Semantisch Web
Semantisch WebSemantisch Web
Semantisch Web
Gregor Abbas
 

More from Gregor Abbas (7)

Ruimte voor de stad
Ruimte voor de stadRuimte voor de stad
Ruimte voor de stad
 
Smart CitySDK at Apps for Smart Cities
Smart CitySDK at Apps for Smart CitiesSmart CitySDK at Apps for Smart Cities
Smart CitySDK at Apps for Smart Cities
 
Lecture Transparant Governance The Hague University
Lecture Transparant Governance The Hague UniversityLecture Transparant Governance The Hague University
Lecture Transparant Governance The Hague University
 
Open Data & AppsvoorNederland
Open Data & AppsvoorNederlandOpen Data & AppsvoorNederland
Open Data & AppsvoorNederland
 
Internet der Dingen
Internet der DingenInternet der Dingen
Internet der Dingen
 
Augmented reality
Augmented realityAugmented reality
Augmented reality
 
Semantisch Web
Semantisch WebSemantisch Web
Semantisch Web
 

ANWB Data Gedreven

  • 1. ANWB data gedreven: Voorspellen van autopech Gregor Abbas, Tijmen Blankevoort, Remko Stam
  • 2. Gregor Abbas, Tijmen Blankevoort, Remko Stam Hoe kunnen we big data technologie inzetten? 2
  • 3. Gregor Abbas, Tijmen Blankevoort, Remko Stam 3 Forecasting Wegenwacht
  • 4. Gregor Abbas, Tijmen Blankevoort, Remko Stam Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech? • ± 1.100.000 pechmeldingen per jaar • 750 wegenwachten • Overcapaciteit = duur • Ondercapaciteit = slecht product Datum Dag Aantal gestrande auto's - TOP 10 2012-02-07 Dinsdag 9.890 2012-02-02 Donderdag 9.352 2012-02-06 Maandag 9.271 2012-02-01 Woensdag 8.332 2010-12-02 Donderdag 7.818 2010-12-01 Woensdag 7.510 2010-01-04 Maandag 7.475 2012-02-03 Vrijdag 7.244 2010-12-20 Maandag 6.965 2010-12-03 Vrijdag 6.846
  • 5. Gregor Abbas, Tijmen Blankevoort, Remko Stam Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech? Ultieme uitdaging: Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59. 5 Technologische ontwikkeling
  • 6. De case: forecast pechgevallen Regio’s Nederland (totaal 4) Per half uur: Hoofdvraag Kunnen we de hoeveelheid pechgevallen voorspellen op basis van historische data? Per dag:
  • 7. Analyse op werkgebied-niveau Werkgebieden Nederland (totaal 33) Weerstation Per half uur: Per dag:
  • 8. Gebruikte data Scyfer Deep Learning Weerslag Historische gegevens KNMI Predicties Weerslag Pechgevallen Ledenaantallen Feestdagen Schoolvakanties Dag/Maand/Jaar
  • 9. Deep Learning Superhuman image recognition (Microsoft 2015) Self-Driving Car (Google) Deep Learning - more complex concepts in subsequent layers Deep learning is currently winning all machine learning challenges
  • 13. De resultaten ANWB Scyfer Verbetering Noord-Oost 44 38 14% Noord-West 55 44 20% Zuid 55 45 18% Zuid-West 46 38 17% Nederland 164 123 25% Gemiddelde absolute fout per dag op 2014 Vergelijking Scyfer modellen en ANWB personeel voorspellingen (m.b.v. ander model en eigen inzicht) De verbetering is t.o.v. het aantal fouten per dag. Totaal gemm. 7% foute voorspellingen per dag. - Trainset: data 2004-2012 - Validatieset: data 2013 - Hertraining data 2004-2013 - Test: Forecast 2014
  • 14. Sneller voorspellen Voorheen meerdere uren per dag kwijt met maken voorspellingen Nu: Software die met één druk op de knop de forecast maakt: ○ Downloaden weergegevens ○ Genereren input voor model ○ Voorspelling (incl. grafieken/tabellen)
  • 15. In de praktijk? Voorspellingen pechgevallen van 7% in 2014 naar 4.5% fout in deze maand Maar: Geen significant verschil tussen ANWB personeel en Scyfer model. Vervolgstap: Zoek uit waarom dit zo is!
  • 16. Conclusie Alternatieve vervolgstap: Voorspelling locatie? Eindresultaat: ● Theoretisch verbeterd pechgevallen model m.b.v. Big Data ● Snellere voorspellingen maken, geen Excel ● Vervolgonderzoek: Waarom in de praktijk hetzelfde resultaat?
  • 17. Gregor Abbas, Tijmen Blankevoort, Remko Stam Computer says ‘no’ 17
  • 18. Gregor Abbas, Tijmen Blankevoort, Remko Stam Van Passief naar Preventief 18 ? ! Passief Proactief Preventief Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.
  • 19. Gregor Abbas, Tijmen Blankevoort, Remko Stam 19
  • 20. Gregor Abbas, Tijmen Blankevoort, Remko Stam Gregor Abbas @kreekoor gabbas@anwb.nl Tijmen Blankevoort tijmen@scyfer.nl 20

Editor's Notes

  1. Complexiteit, 1,1 miljoen per jaar, 3000 gemiddeld per dag, kan ook 9000 zijn 1 wegenwacht doet 8 pechgevallen per dienst, dus bij een afwijking van van 1%, zijn 5 wegenwachten meer of minder Langere wachttijd
  2. Veel factoren van invloed op pech, maar die zijn nooit bewezen. Vandaar big data technologie.
  3. Om voorspellingen te doen is Nederland opgedeeld in 4 regios. Het doel is om voor elk van deze regios een goede voorspelling te krijgen zodat de capaciteit van de wegenwacht kan worden aangestuurd. De voorspellingen per dag (onder) worden gebruikt als algemene inschatting van de wegenwacht inzet op die dag. De voorspellingen per half uur worden gebruikt om op een dag zelf capaciteit bij te kunnen schakelen, of eerder naar huis te laten gaan.
  4. Hoe hebben we dit voor elkaar gekregen? De voorspellingen gebeuren momenteel op regioniveau. Maar de aansturing en planning gebeurt voor de 33 werkgebieden in Nederland. Als Scyfer hebben we al snel aangegeven een voorspelling te willen maken per werkgebied. Door deze werkgebied voorspellingen te combineren heb je een regio voorspelling. Sommige effecten, bijvoorbeeld weerseffecten, zie je pas terugkomen als je op een kleiner niveau kijkt. Het kan vriezen in Limburg, maar op regioniveau boven de 0 graden zijn. Deze informatie neem je wel mee als je op kleiner niveau voorspelt. We trainen een enkel model voor alle werkgebieden. De software vindt zelf wel de nuttige verbanden tussen werkgebieden, en wat specifiek is voor de werkgebieden. We hebben gezien dat het kijken op een kleiner niveau daadwerkelijk de resultaten verbeterd! Dit is een erg moeilijk probleem. Je ziet al aan de grafieken dat er veel variantie in de data zit. We kunnen niet perfect voorspellen wanneer een auto kapot gaat, maar we kijken naar gemiddeldes.
  5. Wat is de input van ons model? We nemen van het KNMI de historische weersgegevens. Dit is van 36 weerstations, informatie per uur voor 10 jaar lang. Van Weerslag kunnen we automatisch weersvoorspellingen downloaden voor de komende 3 weken om voor dit hele time-frame voorspellingen te maken. De ANWB levert de dataset met alle pechgevallen, en het ledenaantal Voorts voegen wij nog informatie toe m.b.v. de datum. Alle Nederlandse feestdagen, wanneer de schoolvakanties zijn in regios, en informatie over de dag, de maand en het jaar. Hiermee maken we twee modellen. 1 getraind op het voorspellen van de frequentie, en 1 op het voorspellen van de distributie per half uur per dag. Gecombineerd levert ons dit voorspellingen zowel per dag als per half uur.
  6. Hiermee maken we voorspellingen voor elk werkgebied
  7. Deze kunnen we weer combineren naar voorspellingen per Regio, met betere resultaten.
  8. Dit zijn de voorspellingen per dag voor heel Nederland. Deze resultaten komen goed overheen met de werkelijkheid, er zijn op het oog weinig opvallende missers.
  9. Scyfer heeft een model getraind op alle data tussen 2004 en 2013. Hierna hebben we met het model voor elke regio, voor elke dag een voorspelling gedaan voor 2014. De gemiddelde fout die de modellen van de ANWB en Scyfer maken staat in deze tabel. We zien een zeer significante verbetering! Kleine footnote: Bij het trainen en testen kunnen we alleen gebruik maken van de historische weersgegevens. We hebben geen data over wat er in het verleden voorspelt is voor de volgende dag. Met goede weersvoorspellingen zullen deze resultaten echter nog steeds een stuk beter zijn. (de fouten / percentages tellen niet op, dit komt mean(sum(abs)) anders is dan sum(abs(mean)))
  10. Wat hebben we nou uiteindelijk neergezet? Een significant verbeterd model dat pechgevallen voorspelt. Dit werkt model werkt voor de lange termijn beter, zodat de planning ver van tevoren aan te passen is. En ook op de korte termijn, zodat er eigenlijk ‘live’ bij te sturen is. De geleverde software levert volautomatisch voorspellingen. De benodigde historische weerdata en de voorspellingen worden automatisch gedownload en geintegreerd. Met 1 druk op de knop staan de grafieken en tabellen met nieuwe voorspellingen klaar voor gebruik. Er hoeft niemand elke dag data te kopieren om resultaten te genereren! In de toekomst zouden we misschien kunnen kijken naar het voorspellen van de locatie van pechgevallen om wegenwachters beter aan te sturen. We gaan onze resultaten binnenkort in de praktijk testen om te kijken wat het effect is.