Big data &IoT: van hype
naar doen!
The Analytics Lab | 21-4-2016 | Utrecht
Simon Bolhuis – Principal Consultant – s.bolhuis@theanalyticslab.nl
Jeroen Kromme – Data Scientist – j.kromme@theanalyticslab.nl
Big data volgensmarketeers
• “Excel bestand van 2.000 regels”
(Opdrachtgever van Cmotions)
• “Big data zijn alle gegevens over u en mij: wie u bent, wat u doet, waar u woont, wie uw vrienden zijn,
wat u mailt en vooral: wat u koopt en eventueel zou wíllen kopen”
(B. Wagendorp, 11-3-2014. Big Data. Volkskrant)
• “Vroeger heette dat gewoon statistiek”
(Persson, M. 14-03-2014. Hoe bang moet je zijn voor Big Data? Volkskrant)
Make it smart!
•Big Data
- Kan nieuwe en aanvullende inzichten bieden die voorheen niet (of niet tijdig) beschikbaar waren of tegen
onverantwoorde kosten beschikbaar konden worden gemaakt
• Big Data
- Beoogde toepassingen verschillen nauwelijks van huidige data-gerelateerde vraagstukken
• Onze visie … het gaat om smart data
8.
• Initiatief vanCmotions
• Platform voor innovatie
• Focus op nieuwe methoden, toepassingen en data
• Focus op behoefte & vraag creatie
> > > >
Maak kennis met The Analytics Lab
9.
Propositie
Wat doen wij?
•Wij focussen ons op behoefte creatie.
• Wij focussen ons op nieuwe data, tooling, technieken,
methoden en toepassingen. Wij gaan dus verder dan de
alom bekende churn en cross-sell modellen.
• Hiervoor hebben wij The Playground, een veilige cloud
omgeving, waarbij hardware en software geen bottleneck
is.
Waar staan wij voor?
• Get Dirty in The Playground: ga gewoon aan de slag en
durf vies te worden / onderuit te gaan.
• Wederzijdse investering: met wederzijdse commitment
als doel. In praktijk betekent dit: concurrerend uurtarief.
• Eerst kleinschalig kijken of het werkt, daarna pas
(grotere) investeringen doen.
• Commercieel voorstel kan gebaseerd zijn op uurtarief,
maar leent zich ook goed voor result based pricing.
Proposities
The Analytics API
Datadriven campagnes & volledige ontzorging op analytics
R Accelerator
Kickstart & upgrade marketing analytics in R
Store Visitors Prediction
Grip & sturing op bezoekers
Online Traffic Prediction
Grip & sturing op traffic
Assignments
Hands-on opleiden in toekomstgerichte context
De aanpak &het model
• Bezoekersaantallen van 1 vestiging opgevraagd
• 2013-2015 ontvangen, 2014 en 2015 gebruikt
• Weerdata van KNMI (open data) gedownload en gebruikt
• Verkeersgegevens van NDW (open data) gedownload en gebruikt
• Het beste model voorspelt met 95% accuratesse!
• Koppelen personeelsbezetting om de business case sluitend te maken
#2 Big data hero’s
Big data & IoT: waar hebben we het dan over?
Wat betekent dit nou voor jou? En hoe ga jij dit succesvol toepassen?
The Analytics Lab
Wat is het?
Waarom is het er?
Proposities
Cases
Vragen
#8 Big Data denken en technologieën helpen om meer smart data te creëren
Big Data helpt om toepassing van klantdata voor (marketing) optimalisatie op de kaart te zetten tot op board level
#12 Technologische ontwikkelingen gaan razendsnel
Concurrentie maakt stappen
Veel ronkende verhalen en voorbeelden over big data en Internet of Things
Disruptie vanwege start-ups
Kansen te over vanwege digitale transformatie
Wat kan al die nieuwe data (nu echt) voor mij betekenen?
Vragen vanuit alle geledingen in de maatschappij: van RvB tot medewerker en van overheid tot consument
Hoe ontdek ik dit potentieel?
Heb ik eigenlijk wel alles in huis om dit potentieel te ontdekken en te benutten?
Tools & software, data
Kennis, skills & vaardigheden
Ik wil eerst testen en bewijs zien, voordat ik beslissingen neem
Prototypes ontwikkelen & toepassen
IT als dwarsligger (‘nee’ is default)
Offertetrajecten, aanbestedingen of PoC’s
#13 The Analytics API
Voor wie is het: Organisaties / afdelingen die immatuur zijn wat betreft analytics, maar wel campagnes uitsturen en dit slimmer willen doen.
Wat is het: Klant stuurt data, wij verzorgen het model. Sturen conversie-, churn-, etc. kansen terug.
Pricing: Per werkend model, wat “werkend” inhoud wordt in overleg van tevoren vastgesteld.
R Accelerator
Voor wie is het: Organisaties / afdelingen die analytics doen in SPSS & SAS, maar aan de slag willen met R.
Wat is het: Een laagdrempelig classificatie template in R, dat analisten in staat stelt effectief, snel en flexibel modellen te bouwen.
Pricing: Per licentie inclusief updates.
Store Visitors Prediction
Voor wie is het: Ketens voor wie logistiek & personeel grote kostenposten zijn.
Wat is het: Het voorspellen van bezoekersaantallen voor vestigingen, aan de hand van interne (bv. campagnes) en open data (bv. weer en verkeer).
Pricing: aan de hand van Proof of Concept.
Online Traffic Prediction
Voor wie is het: Webwinkels die meer grip willen hebben op hun bezoekersaantallen.
Wat is het: Het voorspellen van bezoekersaantallen voor websites, aan de hand van interne (bv. campagnes) en open data (bv. weer en verkeer).
Pricing: aan de hand van Proof of Concept.
Assignments
Voor wie is het: Organisaties die op zoek zijn naar toepassingsgerichte trainingen, waarbij de deelnemers hands-on leren vanuit hun bestaande - of beter nog, een toekomstgerichte - context.
Wat is het: Bestaande business vraagstukken oppakken in een laboratorium setting met verplicht resultaat
Pricing: aan de hand van aantal deelnemers of gerelateerd aan vraagstuk
#14 Onderwerp: (voorspellen) bezoekersaantallen per dag (en mogelijk per uur) -> één van de belangrijkste businessvraagstukken van klant
Nu: voorspelling o.b.v. voorgaand jaar en vergelijkbare dagen, met inschatting externe factoren
Vraag: kan The Analytics Lab hiervoor een (beter) model ontwikkelen?
Reden: o.b.v. bezoekersaantallen wordt (o.a.) planning & inzet medewerkers bepaald –> vaak onder- of overbezetting en dus capaciteits- of kostenissue
Business case: verbetering door model The Analytics Lab in bezetting medewerkers
Potentieel: (o.a.) distributie, logistiek, planning (en marketing!)
#15 Bezoekersaantallen van 1 vestiging opgevraagd
2013-2015 ontvangen, 2014 en 2015 gebruikt
Weerdata van KNMI gedownload (open data) en gebruikt
Verkeersgegevens van NDW gedownload (open data) en gebruikt
Uiteindelijke voorspelling o.b.v. het gemiddelde aantal bezoekers per dag
Het beste model voorspelt met 95% accuratesse!
Vraag: hoe accuraat doet klant dit (met dezelfde data)?
#16 Variabelen die het beste de aantallen voorspellen:
Windsnelheid (hoe minder, des te meer bezoekers)
Temperatuur (hoe warmer, des te minder bezoekers)
Zonne-uren (hoe meer, des te minder bezoekers)
Gemiddeld zicht (hoe beter, des te meer bezoekers)
Daarnaast zijn woensdag, vrijdag, zaterdag en zondag ‘goede’ dagen
Zon- en feestdagen (positief effect bij opening)
Piek op 27e en 30e van iedere maand -> mogelijkheden voor targeting
Januari t/m juni zijn minder goede maanden
Juli en augustus zijn goede maanden
Andere maanden leveren gemiddelde aantallen
‘Pulsen’ (dagen/periodes met een veel hoger of veel lager bezoekersaantal dan verwacht) en hun verklaringen (campagnes, nieuws, events, concurrentie) verwerkt