Big data & IoT: van hype
naar doen!
The Analytics Lab | 21-4-2016 | Utrecht
Simon Bolhuis – Principal Consultant – s.bolhuis@theanalyticslab.nl
Jeroen Kromme – Data Scientist – j.kromme@theanalyticslab.nl
Big data hero’s
Big data volgens marketeers
• “Excel bestand van 2.000 regels”
(Opdrachtgever van Cmotions)
• “Big data zijn alle gegevens over u en mij: wie u bent, wat u doet, waar u woont, wie uw vrienden zijn,
wat u mailt en vooral: wat u koopt en eventueel zou wíllen kopen”
(B. Wagendorp, 11-3-2014. Big Data. Volkskrant)
• “Vroeger heette dat gewoon statistiek”
(Persson, M. 14-03-2014. Hoe bang moet je zijn voor Big Data? Volkskrant)
Big data volgens IT
Big data = digitale footprint
Internet of Things = koppeling digitale footprints
Make it smart!
• Big Data
- Kan nieuwe en aanvullende inzichten bieden die voorheen niet (of niet tijdig) beschikbaar waren of tegen
onverantwoorde kosten beschikbaar konden worden gemaakt
• Big Data
- Beoogde toepassingen verschillen nauwelijks van huidige data-gerelateerde vraagstukken
• Onze visie … het gaat om smart data
• Initiatief van Cmotions
• Platform voor innovatie
• Focus op nieuwe methoden, toepassingen en data
• Focus op behoefte & vraag creatie
> > > >
Maak kennis met The Analytics Lab
Propositie
Wat doen wij?
• Wij focussen ons op behoefte creatie.
• Wij focussen ons op nieuwe data, tooling, technieken,
methoden en toepassingen. Wij gaan dus verder dan de
alom bekende churn en cross-sell modellen.
• Hiervoor hebben wij The Playground, een veilige cloud
omgeving, waarbij hardware en software geen bottleneck
is.
Waar staan wij voor?
• Get Dirty in The Playground: ga gewoon aan de slag en
durf vies te worden / onderuit te gaan.
• Wederzijdse investering: met wederzijdse commitment
als doel. In praktijk betekent dit: concurrerend uurtarief.
• Eerst kleinschalig kijken of het werkt, daarna pas
(grotere) investeringen doen.
• Commercieel voorstel kan gebaseerd zijn op uurtarief,
maar leent zich ook goed voor result based pricing.
Drie pijlers
Tijd
Draagvlak
Tooling
IT
Data & tools
vs
eigen praktijk
Verkenning van ‘smart’
Proposities
The Analytics API
Data driven campagnes & volledige ontzorging op analytics
R Accelerator
Kickstart & upgrade marketing analytics in R
Store Visitors Prediction
Grip & sturing op bezoekers
Online Traffic Prediction
Grip & sturing op traffic
Assignments
Hands-on opleiden in toekomstgerichte context
Case: Bezoekersaantallen
De aanpak & het model
• Bezoekersaantallen van 1 vestiging opgevraagd
• 2013-2015 ontvangen, 2014 en 2015 gebruikt
• Weerdata van KNMI (open data) gedownload en gebruikt
• Verkeersgegevens van NDW (open data) gedownload en gebruikt
• Het beste model voorspelt met 95% accuratesse!
• Koppelen personeelsbezetting om de business case sluitend te maken
De variabelen & predictoren
Case: Contact optimalisatie
• Situatie: alle nieuwsbrieven werden op maandagochtend verstuurd
• Doel: de verzendtijd van de nieuwsbrief per individu proberen te schatten
• Aanpak: Random Forest op Hadoop cluster (4 nodes) met 100+ variabelen
• Resultaat: 33% stijging in marge per e-mailadres per week -> €500 000 per maand
Ochtend
Middag
Avond
Ochtend
Middag
Avond
Ochtend
Middag
Avond
Ochtend
Middag
Avond
Ochtend
Middag
Avond
Ochtend
Middag
Avond
Ochtend
Middag
Avond
Maandag Dinsdag Woensdag Donderdag Vrijdag Zaterdag Zondag
Case: Voetbal hackathon
Volg ons op web, social & nieuwsbrief

Presentatie Big data & IoT van hype naar doen

  • 1.
    Big data &IoT: van hype naar doen! The Analytics Lab | 21-4-2016 | Utrecht Simon Bolhuis – Principal Consultant – s.bolhuis@theanalyticslab.nl Jeroen Kromme – Data Scientist – j.kromme@theanalyticslab.nl
  • 2.
  • 3.
    Big data volgensmarketeers • “Excel bestand van 2.000 regels” (Opdrachtgever van Cmotions) • “Big data zijn alle gegevens over u en mij: wie u bent, wat u doet, waar u woont, wie uw vrienden zijn, wat u mailt en vooral: wat u koopt en eventueel zou wíllen kopen” (B. Wagendorp, 11-3-2014. Big Data. Volkskrant) • “Vroeger heette dat gewoon statistiek” (Persson, M. 14-03-2014. Hoe bang moet je zijn voor Big Data? Volkskrant)
  • 4.
  • 5.
    Big data =digitale footprint
  • 6.
    Internet of Things= koppeling digitale footprints
  • 7.
    Make it smart! •Big Data - Kan nieuwe en aanvullende inzichten bieden die voorheen niet (of niet tijdig) beschikbaar waren of tegen onverantwoorde kosten beschikbaar konden worden gemaakt • Big Data - Beoogde toepassingen verschillen nauwelijks van huidige data-gerelateerde vraagstukken • Onze visie … het gaat om smart data
  • 8.
    • Initiatief vanCmotions • Platform voor innovatie • Focus op nieuwe methoden, toepassingen en data • Focus op behoefte & vraag creatie > > > > Maak kennis met The Analytics Lab
  • 9.
    Propositie Wat doen wij? •Wij focussen ons op behoefte creatie. • Wij focussen ons op nieuwe data, tooling, technieken, methoden en toepassingen. Wij gaan dus verder dan de alom bekende churn en cross-sell modellen. • Hiervoor hebben wij The Playground, een veilige cloud omgeving, waarbij hardware en software geen bottleneck is. Waar staan wij voor? • Get Dirty in The Playground: ga gewoon aan de slag en durf vies te worden / onderuit te gaan. • Wederzijdse investering: met wederzijdse commitment als doel. In praktijk betekent dit: concurrerend uurtarief. • Eerst kleinschalig kijken of het werkt, daarna pas (grotere) investeringen doen. • Commercieel voorstel kan gebaseerd zijn op uurtarief, maar leent zich ook goed voor result based pricing.
  • 10.
    Drie pijlers Tijd Draagvlak Tooling IT Data &tools vs eigen praktijk Verkenning van ‘smart’
  • 11.
    Proposities The Analytics API Datadriven campagnes & volledige ontzorging op analytics R Accelerator Kickstart & upgrade marketing analytics in R Store Visitors Prediction Grip & sturing op bezoekers Online Traffic Prediction Grip & sturing op traffic Assignments Hands-on opleiden in toekomstgerichte context
  • 12.
  • 13.
    De aanpak &het model • Bezoekersaantallen van 1 vestiging opgevraagd • 2013-2015 ontvangen, 2014 en 2015 gebruikt • Weerdata van KNMI (open data) gedownload en gebruikt • Verkeersgegevens van NDW (open data) gedownload en gebruikt • Het beste model voorspelt met 95% accuratesse! • Koppelen personeelsbezetting om de business case sluitend te maken
  • 14.
    De variabelen &predictoren
  • 15.
    Case: Contact optimalisatie •Situatie: alle nieuwsbrieven werden op maandagochtend verstuurd • Doel: de verzendtijd van de nieuwsbrief per individu proberen te schatten • Aanpak: Random Forest op Hadoop cluster (4 nodes) met 100+ variabelen • Resultaat: 33% stijging in marge per e-mailadres per week -> €500 000 per maand Ochtend Middag Avond Ochtend Middag Avond Ochtend Middag Avond Ochtend Middag Avond Ochtend Middag Avond Ochtend Middag Avond Ochtend Middag Avond Maandag Dinsdag Woensdag Donderdag Vrijdag Zaterdag Zondag
  • 16.
  • 17.
    Volg ons opweb, social & nieuwsbrief

Editor's Notes

  • #2 Big data hero’s Big data & IoT: waar hebben we het dan over? Wat betekent dit nou voor jou? En hoe ga jij dit succesvol toepassen? The Analytics Lab Wat is het? Waarom is het er? Proposities Cases Vragen
  • #8 Big Data denken en technologieën helpen om meer smart data te creëren Big Data helpt om toepassing van klantdata voor (marketing) optimalisatie op de kaart te zetten tot op board level
  • #12 Technologische ontwikkelingen gaan razendsnel Concurrentie maakt stappen Veel ronkende verhalen en voorbeelden over big data en Internet of Things Disruptie vanwege start-ups Kansen te over vanwege digitale transformatie Wat kan al die nieuwe data (nu echt) voor mij betekenen? Vragen vanuit alle geledingen in de maatschappij: van RvB tot medewerker en van overheid tot consument Hoe ontdek ik dit potentieel? Heb ik eigenlijk wel alles in huis om dit potentieel te ontdekken en te benutten? Tools & software, data Kennis, skills & vaardigheden Ik wil eerst testen en bewijs zien, voordat ik beslissingen neem Prototypes ontwikkelen & toepassen IT als dwarsligger (‘nee’ is default) Offertetrajecten, aanbestedingen of PoC’s
  • #13 The Analytics API Voor wie is het: Organisaties / afdelingen die immatuur zijn wat betreft analytics, maar wel campagnes uitsturen en dit slimmer willen doen. Wat is het: Klant stuurt data, wij verzorgen het model. Sturen conversie-, churn-, etc. kansen terug. Pricing: Per werkend model, wat “werkend” inhoud wordt in overleg van tevoren vastgesteld. R Accelerator Voor wie is het: Organisaties / afdelingen die analytics doen in SPSS & SAS, maar aan de slag willen met R. Wat is het: Een laagdrempelig classificatie template in R, dat analisten in staat stelt effectief, snel en flexibel modellen te bouwen. Pricing: Per licentie inclusief updates. Store Visitors Prediction Voor wie is het: Ketens voor wie logistiek & personeel grote kostenposten zijn. Wat is het: Het voorspellen van bezoekersaantallen voor vestigingen, aan de hand van interne (bv. campagnes) en open data (bv. weer en verkeer). Pricing: aan de hand van Proof of Concept. Online Traffic Prediction Voor wie is het: Webwinkels die meer grip willen hebben op hun bezoekersaantallen. Wat is het: Het voorspellen van bezoekersaantallen voor websites, aan de hand van interne (bv. campagnes) en open data (bv. weer en verkeer). Pricing: aan de hand van Proof of Concept. Assignments Voor wie is het: Organisaties die op zoek zijn naar toepassingsgerichte trainingen, waarbij de deelnemers hands-on leren vanuit hun bestaande - of beter nog, een toekomstgerichte - context. Wat is het: Bestaande business vraagstukken oppakken in een laboratorium setting met verplicht resultaat Pricing: aan de hand van aantal deelnemers of gerelateerd aan vraagstuk
  • #14 Onderwerp: (voorspellen) bezoekersaantallen per dag (en mogelijk per uur) -> één van de belangrijkste businessvraagstukken van klant Nu: voorspelling o.b.v. voorgaand jaar en vergelijkbare dagen, met inschatting externe factoren Vraag: kan The Analytics Lab hiervoor een (beter) model ontwikkelen? Reden: o.b.v. bezoekersaantallen wordt (o.a.) planning & inzet medewerkers bepaald –> vaak onder- of overbezetting en dus capaciteits- of kostenissue Business case: verbetering door model The Analytics Lab in bezetting medewerkers Potentieel: (o.a.) distributie, logistiek, planning (en marketing!)
  • #15 Bezoekersaantallen van 1 vestiging opgevraagd 2013-2015 ontvangen, 2014 en 2015 gebruikt Weerdata van KNMI gedownload (open data) en gebruikt Verkeersgegevens van NDW gedownload (open data) en gebruikt Uiteindelijke voorspelling o.b.v. het gemiddelde aantal bezoekers per dag Het beste model voorspelt met 95% accuratesse! Vraag: hoe accuraat doet klant dit (met dezelfde data)?
  • #16 Variabelen die het beste de aantallen voorspellen: Windsnelheid (hoe minder, des te meer bezoekers) Temperatuur (hoe warmer, des te minder bezoekers) Zonne-uren (hoe meer, des te minder bezoekers) Gemiddeld zicht (hoe beter, des te meer bezoekers) Daarnaast zijn woensdag, vrijdag, zaterdag en zondag ‘goede’ dagen Zon- en feestdagen (positief effect bij opening) Piek op 27e en 30e van iedere maand -> mogelijkheden voor targeting Januari t/m juni zijn minder goede maanden Juli en augustus zijn goede maanden Andere maanden leveren gemiddelde aantallen ‘Pulsen’ (dagen/periodes met een veel hoger of veel lager bezoekersaantal dan verwacht) en hun verklaringen (campagnes, nieuws, events, concurrentie) verwerkt