SlideShare a Scribd company logo
1 of 25
Download to read offline
Data architectuur
ontmoet
Software architectuur
Beste van twee werelden
Mark van Gool
Product owner Data Platform & Data Infra
wehkamp
30% van de Nederlandse huishoudens shopt bij wehkamp
en we blijven groeien
400.000
verschillende
producten
>500.000
bezoekers elke dag
614 miljoen
klant-sales 16/17
10 million
verzonden pakketten
900
werknemers
30%
van Nederlandse
huishoudens shopt bij
wehkamp
70%
van bezoekers is vrouw
Meer dan 2.000 merken
• C&A
• Hunkemöller
• Mango
• Tommy Hilfiger
• River Island
• Hugo Boss
• Scotch & Soda
• HK Living
• Bloomingville
Online marktpositie
• Fashion #1
• Home & Garden #1/2
• Electronics #3
• Entertainment #3
• Home Appliances #3
• Sports & Leisure #1
• Beauty & Wellness #1
Strong brand / we are part of the family since 1952
✓96% Brand Awareness
1952
Herman Wehkamp
Starts selling mattresses
through advertising
1985
1st mail order company
with a telephone order
service
1995 -
1st steps online
Twice a year a
385 page catalogue
2008 - 12 times a year
>1000 pages magalogue
2017: Mobile first
Mobile first customer
experience2010 - Focus online
App, e-magazine, youtube
channel, mobile first and adaptive
design
data storage
flexible
secure
data provisioning
data science
real-time
external parties
micro-service architecture
scalable
data driven
intelligence
data exchange
Als we het over data hebben…
De ‘Customer Journey’ als voorbeeld van consument en producent van data
Klanten als consument én producent van data
Klanten
product prijs voorraad
wensenlijst
winkelmand bestelling leveringbetaling
account
retour
email social sea
clickstream
data geconsumeerd
data geproduceerd
accounting orderafhandeling
beoordeling klantcontactsessie account
beoordeling
profiel
profiel
analytics
leveropties
reparatie
Wehkamp werknemers
product prijs voorraad
data geproduceerd
boekhouding inkooporder content foto’s betaling
analytics assortimentsinfo
data geconsumeerd
leveranciersprijzen voorraaddata weer(bericht)
e-mails feeds sea
Klanten
product prijs voorraad
wensenlijst
winkelmand bestelling leveringbetaling
account
retour
email social sea
clickstream
data geconsumeerd
data geproduceerd
accounting orderafhandeling
beoordeling klantcontactsessie account
beoordeling
profiel
profiel
analytics
leveropties
reparatie
Wehkamp werknemers
product prijs voorraad
data geproduceerd
boekhouding inkooporder content foto’s betaling
analytics assortimentsinfo
data geconsumeerd
leveranciersprijzen voorraaddata weer(bericht)
e-mails feeds sea
product
prijs
voorraad
wensenlijs
winkelmand
bestelling levering
betaling
account
retour
email
social
sea
clickstream
boekhouding
orderafhandeling
beoordeling
klantcontactsessie
profiel
accounting inkooporder
content foto betaling
analytics
leveropties
assortimentsinfo
suppliersinkoopprijs
voorraaddata
reparatie
We zijn ook een data-bedrijf! (naast e-commerce-, tech-, etc.)
Hoe gaat data rond @Wehkamp
Disclaimer: versimpelde weergave van de werkelijkheid
Oude situatie: data van en naar iedereen…
Business Intelligence
Web Analytics
Analytics
Campagne
Management
batch
Externe partijen
Back-end
website
Front-end
Data warehouses
Batch
BatchBatch
Batch
data van ‘gisteren’  real-time
handmatig  geautomatiseerd
nog slimmer
meer data maar wel
gestructureerd
meer inzicht met juiste tools
Operatio
nal
efficiency
Meer
relevant
voor
klant
Verhoog
klant-
tevreden
heid
Enter-
prise
Service
Bus
send
Data
warehouse
Service
receive
send
send
receive
call
receive
receive
receive
• Service-to-service communicatie – anti-
pattern.
• Nieuwe berichten hebben implementatie op
verzender, ontvanger en ESB.
• ESB is duur en zwaar.
• Data via ETL processen naar datawarehouse.
• Verzenders en ontvangers ‘kennen
elkaar’
• Orchestratie is nodig
Monoliet
Service
Monoliet
LoadTransformExtract
send
Wacht! ESB, SOA en DWH’s zijn de oplossing, toch?
Nieuw (of eigenlijk oud) patroon: publish/subscribe & microservices
publish
data
lake
publish
publish
publish
subscribe
subscribe
subscribe
subscribe
subscribe
subscribe
subscribe
subscribe
subscribe
publisher ‘weet’ niet wie de subscribers zijn subscribers ‘weten’ niet wie de publisher is
Apache Kafka
publish
data
lake
publish
publish
subscribe
subscribe
subscribe
subscribe
subscribe
subscribe
subscribe
• Pub-Sub – data kan worden geconsumeerd door
iedereen!
• Consumers zijn verantwoordelijk voor het zelf
bijhouden waar ze zijn met lezen van Kafka
• Producers kunnen ook consumers (van
andere topics) zijn.
• Nieuw soort bericht? Nieuw topic!
TOPIC
PRODUCER
CONSUMER PRODUCER &
CONSUMER
TOPIC
CONSUMER
CONSUMER
CONSUMER GROUP
CONSUMER
TOPIC
PRODUCER
CONSUMER
• snel
• schaalbaar
• lichtgewicht
• gedistribueerd
• persistent
Hoe het werkt in de praktijk
web site apps
zoeken
product
fetcher
navi
gatie
content
account
recom
mender
product
zoeksugg
esties
recom
mender
winkel
mand
wensen
lijst
big data &
data warehousesdata science, intelligence, analytics
click
stream
Email marketing
systeem
Klant- en
ordersysteem
Prijssysteem
Voorraadsysteem
Productsysteem
Klantenservice-
systeem
Batch
Data WarehouseBronsysteem
Analytics
Data Warehouse
Bronsysteem
Bronsysteem
ETL Processen
ETL Processes
Campaign Mgmt
Web Analytics
Visualisatietools
2-24 hrs
Website Google Tag Mgr Google Analytics
Big
Query
Web Analytics
Hoe zit het dan met data warehouses, BI and web analytics?
Data lake
Microservice
data entiteit
subscribe
subscribe
Bronsysteem
Bronsysteem
Bronsysteem
Website clickstream
data entiteit
data entiteit
Systeem
subscribe
Streaming
data
verwerking
Analytics
Campaign Mgmt
Web Analytics
Visualisatietools
Web Analytics
Real-time data
producten
Apache Kafka & Data Lake
streams
Microservices
Opslag (ruw& gestructureerd)
Externe partijen
Website/apps
Front-end
Real-timeDataBus(Kafka)
Data Integratie
Data
Warehouse
Data Lake (BIG DATA)
DBBack-end
Data Producten Visualisatie
Ingest
Data
Warehouse
DBBack-end
Self Service BI
Analytics
Campagne-
management
Data Science
Ingest
Het complete plaatje…
Microservices
web site apps
zoek-
suggesties
big data &
data warehouses
data science, intelligence, analytics
click
stream
dataverwerking
winter
zomer
Voorbeeld: Datagedreven zoeksuggesties
Voorbeeld: Actuele voorraad en prijs naar e-mailteam
producten feed folder e-mail systeem
import feed
klant
klante-mail systeem
API
e-maildata platform Kafka consumer
nieuwe situatie
oude situatie
enkele seconden
enkele uren
e-mail
web site apps
recommendation
gateway
big data &
data warehouses
click
stream
dataverwerking
realtime
product
data
item
item
rec
toplist
rec
categ. /
item
rec
clickstream data
Recommendations
Logo bingo: dit gebruiken we
Trends en toekomst in het datalandschap
• Meer ‘streaming’ – Kafka Streams, Spark Streaming, andere streaming
engines
• Big data – schema on read, steeds meer tools, niet alleen maar Hadoop
• NoSql databases – Redis, Mongo, Cassandra, Riak, Kudu
• Big Data  SQL mogelijkheden
• Cloud, cloud, cloud
• Meer aandacht voor privacy (GDPR!)
• Meer aandacht voor beheer van data, ‘governance’ (GDPR!)
• Architecturen niet alleen bedoeld voor big data
• Andere dataformaten zoals AVRO, ORC en Parquet
• Niet alleen streamen van data, maar ook events
Join Us!
www.werkenbijwehkamp.nl
https://medium.com/wehkamp-techblog
mvgool@wehkamp.nl

More Related Content

Similar to Wehkamp Mark van Gool

Oogst gauc google analytics premium- de learnings en valkuilen - juni 2015 -...
Oogst  gauc google analytics premium- de learnings en valkuilen - juni 2015 -...Oogst  gauc google analytics premium- de learnings en valkuilen - juni 2015 -...
Oogst gauc google analytics premium- de learnings en valkuilen - juni 2015 -...Oogst
 
De waarde van een geïntegreerd klantbeeld
De waarde van een geïntegreerd klantbeeldDe waarde van een geïntegreerd klantbeeld
De waarde van een geïntegreerd klantbeeldDataValueTalk
 
WebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatie
WebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatieWebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatie
WebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatieXSARUS E-development & Consulting
 
Wwv 2018-xsarus-business intelligence
Wwv 2018-xsarus-business intelligenceWwv 2018-xsarus-business intelligence
Wwv 2018-xsarus-business intelligencewebwinkelvakdag
 
Webinar: Data Science
Webinar: Data ScienceWebinar: Data Science
Webinar: Data Sciencevalantic NL
 
Conversie optimalisatie in de praktijk
Conversie optimalisatie in de praktijkConversie optimalisatie in de praktijk
Conversie optimalisatie in de praktijkNetprofiler
 
PIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshop
PIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshopPIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshop
PIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshopvalantic NL
 
Microsoft Big Data Expo
Microsoft Big Data ExpoMicrosoft Big Data Expo
Microsoft Big Data ExpoBigDataExpo
 
Webinar conversie optimalisatie met big data
Webinar conversie optimalisatie met big dataWebinar conversie optimalisatie met big data
Webinar conversie optimalisatie met big dataEduvision Opleidingen
 
Pluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nl
Pluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nlPluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nl
Pluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nlCopernica BV
 
Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...
Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...
Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...Informatielogistiek
 
Closed loop e-marketing voor Magento
Closed loop e-marketing voor MagentoClosed loop e-marketing voor Magento
Closed loop e-marketing voor MagentoCopernica BV
 
Presentatie Mds
Presentatie MdsPresentatie Mds
Presentatie Mdsysoesan
 
Omnichannel infrastructuur
Omnichannel infrastructuur Omnichannel infrastructuur
Omnichannel infrastructuur valantic NL
 
Big Data in Retail: too big to ignore
Big Data in Retail: too big to ignoreBig Data in Retail: too big to ignore
Big Data in Retail: too big to ignorevalantic NL
 
WebWinkel Vakdagen 2018 - Het succes van kofferspecialist Travelbags
WebWinkel Vakdagen 2018 - Het succes van kofferspecialist TravelbagsWebWinkel Vakdagen 2018 - Het succes van kofferspecialist Travelbags
WebWinkel Vakdagen 2018 - Het succes van kofferspecialist TravelbagsXSARUS E-development & Consulting
 
Whitepaper Product Informatie Management DEF
Whitepaper Product Informatie Management DEFWhitepaper Product Informatie Management DEF
Whitepaper Product Informatie Management DEFRob Wiek
 

Similar to Wehkamp Mark van Gool (20)

Oogst gauc google analytics premium- de learnings en valkuilen - juni 2015 -...
Oogst  gauc google analytics premium- de learnings en valkuilen - juni 2015 -...Oogst  gauc google analytics premium- de learnings en valkuilen - juni 2015 -...
Oogst gauc google analytics premium- de learnings en valkuilen - juni 2015 -...
 
De waarde van een geïntegreerd klantbeeld
De waarde van een geïntegreerd klantbeeldDe waarde van een geïntegreerd klantbeeld
De waarde van een geïntegreerd klantbeeld
 
WebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatie
WebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatieWebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatie
WebWinkel Vakdagen 2018 - Het succes van een datadriven e-commerce organisatie
 
Wwv 2018-xsarus-business intelligence
Wwv 2018-xsarus-business intelligenceWwv 2018-xsarus-business intelligence
Wwv 2018-xsarus-business intelligence
 
Webinar: Data Science
Webinar: Data ScienceWebinar: Data Science
Webinar: Data Science
 
Conversie optimalisatie in de praktijk
Conversie optimalisatie in de praktijkConversie optimalisatie in de praktijk
Conversie optimalisatie in de praktijk
 
PIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshop
PIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshopPIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshop
PIM in B2B e-commerce: 5 redenen waarom PIM onmisbaar is voor jouw B2B-webshop
 
Marketing & Big Data event
Marketing & Big Data eventMarketing & Big Data event
Marketing & Big Data event
 
Microsoft Big Data Expo
Microsoft Big Data ExpoMicrosoft Big Data Expo
Microsoft Big Data Expo
 
Webinar conversie optimalisatie met big data
Webinar conversie optimalisatie met big dataWebinar conversie optimalisatie met big data
Webinar conversie optimalisatie met big data
 
Pluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nl
Pluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nlPluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nl
Pluk de vruchten van goede datakwaliteit - Jeroen Wolfs, Webservices.nl
 
Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...
Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...
Cross Docking: een concept uit de logistieke wereld en de oplossing voor e-fa...
 
Closed loop e-marketing voor Magento
Closed loop e-marketing voor MagentoClosed loop e-marketing voor Magento
Closed loop e-marketing voor Magento
 
Het starten van een webwinkel
Het starten van een webwinkelHet starten van een webwinkel
Het starten van een webwinkel
 
Presentatie Mds
Presentatie MdsPresentatie Mds
Presentatie Mds
 
Omnichannel infrastructuur
Omnichannel infrastructuur Omnichannel infrastructuur
Omnichannel infrastructuur
 
Big Data in Retail: too big to ignore
Big Data in Retail: too big to ignoreBig Data in Retail: too big to ignore
Big Data in Retail: too big to ignore
 
Ism remco dekkers
Ism remco dekkersIsm remco dekkers
Ism remco dekkers
 
WebWinkel Vakdagen 2018 - Het succes van kofferspecialist Travelbags
WebWinkel Vakdagen 2018 - Het succes van kofferspecialist TravelbagsWebWinkel Vakdagen 2018 - Het succes van kofferspecialist Travelbags
WebWinkel Vakdagen 2018 - Het succes van kofferspecialist Travelbags
 
Whitepaper Product Informatie Management DEF
Whitepaper Product Informatie Management DEFWhitepaper Product Informatie Management DEF
Whitepaper Product Informatie Management DEF
 

More from TalentEvent

traffic builders
traffic builderstraffic builders
traffic buildersTalentEvent
 
Dell Hans Timmerman
Dell Hans TimmermanDell Hans Timmerman
Dell Hans TimmermanTalentEvent
 
Andre ten Wolde Domino's
Andre ten Wolde Domino'sAndre ten Wolde Domino's
Andre ten Wolde Domino'sTalentEvent
 
Anchormen Jeroen Vlek
Anchormen Jeroen VlekAnchormen Jeroen Vlek
Anchormen Jeroen VlekTalentEvent
 
Achmea Thijs Fleer
Achmea Thijs FleerAchmea Thijs Fleer
Achmea Thijs FleerTalentEvent
 
Fontys Eric van Tol
Fontys Eric van TolFontys Eric van Tol
Fontys Eric van TolTalentEvent
 
GoDataDriven Giovanni Lanzani
GoDataDriven Giovanni LanzaniGoDataDriven Giovanni Lanzani
GoDataDriven Giovanni LanzaniTalentEvent
 
Jacco Oosterhof Wijnvoordeel Johan Smits Yellowgrape
Jacco Oosterhof Wijnvoordeel Johan Smits YellowgrapeJacco Oosterhof Wijnvoordeel Johan Smits Yellowgrape
Jacco Oosterhof Wijnvoordeel Johan Smits YellowgrapeTalentEvent
 
Bas Klein Geltink Sollicitego
Bas Klein Geltink SollicitegoBas Klein Geltink Sollicitego
Bas Klein Geltink SollicitegoTalentEvent
 
Robert Slijk Remiqz
Robert Slijk RemiqzRobert Slijk Remiqz
Robert Slijk RemiqzTalentEvent
 
Eline Kamerbeek PostNL
Eline Kamerbeek PostNLEline Kamerbeek PostNL
Eline Kamerbeek PostNLTalentEvent
 
Arjan van den Born Jads
Arjan van den Born JadsArjan van den Born Jads
Arjan van den Born JadsTalentEvent
 
Laurens Spiele Decathlon Talent Event
Laurens Spiele Decathlon Talent EventLaurens Spiele Decathlon Talent Event
Laurens Spiele Decathlon Talent EventTalentEvent
 
Saskia Nijs Talent Event
Saskia Nijs Talent EventSaskia Nijs Talent Event
Saskia Nijs Talent EventTalentEvent
 
Data Analytics for Smart Product Development
Data Analytics for Smart Product DevelopmentData Analytics for Smart Product Development
Data Analytics for Smart Product DevelopmentTalentEvent
 

More from TalentEvent (16)

traffic builders
traffic builderstraffic builders
traffic builders
 
Dell Hans Timmerman
Dell Hans TimmermanDell Hans Timmerman
Dell Hans Timmerman
 
Andre ten Wolde Domino's
Andre ten Wolde Domino'sAndre ten Wolde Domino's
Andre ten Wolde Domino's
 
Anchormen Jeroen Vlek
Anchormen Jeroen VlekAnchormen Jeroen Vlek
Anchormen Jeroen Vlek
 
Achmea Thijs Fleer
Achmea Thijs FleerAchmea Thijs Fleer
Achmea Thijs Fleer
 
Fontys Eric van Tol
Fontys Eric van TolFontys Eric van Tol
Fontys Eric van Tol
 
GoDataDriven Giovanni Lanzani
GoDataDriven Giovanni LanzaniGoDataDriven Giovanni Lanzani
GoDataDriven Giovanni Lanzani
 
Harm Olde KPN
Harm Olde KPNHarm Olde KPN
Harm Olde KPN
 
Jacco Oosterhof Wijnvoordeel Johan Smits Yellowgrape
Jacco Oosterhof Wijnvoordeel Johan Smits YellowgrapeJacco Oosterhof Wijnvoordeel Johan Smits Yellowgrape
Jacco Oosterhof Wijnvoordeel Johan Smits Yellowgrape
 
Bas Klein Geltink Sollicitego
Bas Klein Geltink SollicitegoBas Klein Geltink Sollicitego
Bas Klein Geltink Sollicitego
 
Robert Slijk Remiqz
Robert Slijk RemiqzRobert Slijk Remiqz
Robert Slijk Remiqz
 
Eline Kamerbeek PostNL
Eline Kamerbeek PostNLEline Kamerbeek PostNL
Eline Kamerbeek PostNL
 
Arjan van den Born Jads
Arjan van den Born JadsArjan van den Born Jads
Arjan van den Born Jads
 
Laurens Spiele Decathlon Talent Event
Laurens Spiele Decathlon Talent EventLaurens Spiele Decathlon Talent Event
Laurens Spiele Decathlon Talent Event
 
Saskia Nijs Talent Event
Saskia Nijs Talent EventSaskia Nijs Talent Event
Saskia Nijs Talent Event
 
Data Analytics for Smart Product Development
Data Analytics for Smart Product DevelopmentData Analytics for Smart Product Development
Data Analytics for Smart Product Development
 

Wehkamp Mark van Gool

  • 1. Data architectuur ontmoet Software architectuur Beste van twee werelden Mark van Gool Product owner Data Platform & Data Infra wehkamp
  • 2. 30% van de Nederlandse huishoudens shopt bij wehkamp en we blijven groeien 400.000 verschillende producten >500.000 bezoekers elke dag 614 miljoen klant-sales 16/17 10 million verzonden pakketten 900 werknemers 30% van Nederlandse huishoudens shopt bij wehkamp 70% van bezoekers is vrouw Meer dan 2.000 merken • C&A • Hunkemöller • Mango • Tommy Hilfiger • River Island • Hugo Boss • Scotch & Soda • HK Living • Bloomingville Online marktpositie • Fashion #1 • Home & Garden #1/2 • Electronics #3 • Entertainment #3 • Home Appliances #3 • Sports & Leisure #1 • Beauty & Wellness #1
  • 3. Strong brand / we are part of the family since 1952 ✓96% Brand Awareness 1952 Herman Wehkamp Starts selling mattresses through advertising 1985 1st mail order company with a telephone order service 1995 - 1st steps online Twice a year a 385 page catalogue 2008 - 12 times a year >1000 pages magalogue 2017: Mobile first Mobile first customer experience2010 - Focus online App, e-magazine, youtube channel, mobile first and adaptive design
  • 4. data storage flexible secure data provisioning data science real-time external parties micro-service architecture scalable data driven intelligence data exchange Als we het over data hebben…
  • 5. De ‘Customer Journey’ als voorbeeld van consument en producent van data
  • 6. Klanten als consument én producent van data Klanten product prijs voorraad wensenlijst winkelmand bestelling leveringbetaling account retour email social sea clickstream data geconsumeerd data geproduceerd accounting orderafhandeling beoordeling klantcontactsessie account beoordeling profiel profiel analytics leveropties reparatie
  • 7. Wehkamp werknemers product prijs voorraad data geproduceerd boekhouding inkooporder content foto’s betaling analytics assortimentsinfo data geconsumeerd leveranciersprijzen voorraaddata weer(bericht) e-mails feeds sea
  • 8. Klanten product prijs voorraad wensenlijst winkelmand bestelling leveringbetaling account retour email social sea clickstream data geconsumeerd data geproduceerd accounting orderafhandeling beoordeling klantcontactsessie account beoordeling profiel profiel analytics leveropties reparatie Wehkamp werknemers product prijs voorraad data geproduceerd boekhouding inkooporder content foto’s betaling analytics assortimentsinfo data geconsumeerd leveranciersprijzen voorraaddata weer(bericht) e-mails feeds sea
  • 9. product prijs voorraad wensenlijs winkelmand bestelling levering betaling account retour email social sea clickstream boekhouding orderafhandeling beoordeling klantcontactsessie profiel accounting inkooporder content foto betaling analytics leveropties assortimentsinfo suppliersinkoopprijs voorraaddata reparatie We zijn ook een data-bedrijf! (naast e-commerce-, tech-, etc.)
  • 10. Hoe gaat data rond @Wehkamp Disclaimer: versimpelde weergave van de werkelijkheid
  • 11. Oude situatie: data van en naar iedereen… Business Intelligence Web Analytics Analytics Campagne Management batch Externe partijen Back-end website Front-end Data warehouses Batch BatchBatch Batch
  • 12. data van ‘gisteren’  real-time handmatig  geautomatiseerd nog slimmer meer data maar wel gestructureerd meer inzicht met juiste tools Operatio nal efficiency Meer relevant voor klant Verhoog klant- tevreden heid
  • 13. Enter- prise Service Bus send Data warehouse Service receive send send receive call receive receive receive • Service-to-service communicatie – anti- pattern. • Nieuwe berichten hebben implementatie op verzender, ontvanger en ESB. • ESB is duur en zwaar. • Data via ETL processen naar datawarehouse. • Verzenders en ontvangers ‘kennen elkaar’ • Orchestratie is nodig Monoliet Service Monoliet LoadTransformExtract send Wacht! ESB, SOA en DWH’s zijn de oplossing, toch?
  • 14. Nieuw (of eigenlijk oud) patroon: publish/subscribe & microservices publish data lake publish publish publish subscribe subscribe subscribe subscribe subscribe subscribe subscribe subscribe subscribe publisher ‘weet’ niet wie de subscribers zijn subscribers ‘weten’ niet wie de publisher is
  • 15. Apache Kafka publish data lake publish publish subscribe subscribe subscribe subscribe subscribe subscribe subscribe • Pub-Sub – data kan worden geconsumeerd door iedereen! • Consumers zijn verantwoordelijk voor het zelf bijhouden waar ze zijn met lezen van Kafka • Producers kunnen ook consumers (van andere topics) zijn. • Nieuw soort bericht? Nieuw topic! TOPIC PRODUCER CONSUMER PRODUCER & CONSUMER TOPIC CONSUMER CONSUMER CONSUMER GROUP CONSUMER TOPIC PRODUCER CONSUMER • snel • schaalbaar • lichtgewicht • gedistribueerd • persistent
  • 16. Hoe het werkt in de praktijk web site apps zoeken product fetcher navi gatie content account recom mender product zoeksugg esties recom mender winkel mand wensen lijst big data & data warehousesdata science, intelligence, analytics click stream Email marketing systeem Klant- en ordersysteem Prijssysteem Voorraadsysteem Productsysteem Klantenservice- systeem
  • 17. Batch Data WarehouseBronsysteem Analytics Data Warehouse Bronsysteem Bronsysteem ETL Processen ETL Processes Campaign Mgmt Web Analytics Visualisatietools 2-24 hrs Website Google Tag Mgr Google Analytics Big Query Web Analytics Hoe zit het dan met data warehouses, BI and web analytics?
  • 18. Data lake Microservice data entiteit subscribe subscribe Bronsysteem Bronsysteem Bronsysteem Website clickstream data entiteit data entiteit Systeem subscribe Streaming data verwerking Analytics Campaign Mgmt Web Analytics Visualisatietools Web Analytics Real-time data producten Apache Kafka & Data Lake streams
  • 19. Microservices Opslag (ruw& gestructureerd) Externe partijen Website/apps Front-end Real-timeDataBus(Kafka) Data Integratie Data Warehouse Data Lake (BIG DATA) DBBack-end Data Producten Visualisatie Ingest Data Warehouse DBBack-end Self Service BI Analytics Campagne- management Data Science Ingest Het complete plaatje… Microservices
  • 20. web site apps zoek- suggesties big data & data warehouses data science, intelligence, analytics click stream dataverwerking winter zomer Voorbeeld: Datagedreven zoeksuggesties
  • 21. Voorbeeld: Actuele voorraad en prijs naar e-mailteam producten feed folder e-mail systeem import feed klant klante-mail systeem API e-maildata platform Kafka consumer nieuwe situatie oude situatie enkele seconden enkele uren e-mail
  • 22. web site apps recommendation gateway big data & data warehouses click stream dataverwerking realtime product data item item rec toplist rec categ. / item rec clickstream data Recommendations
  • 23. Logo bingo: dit gebruiken we
  • 24. Trends en toekomst in het datalandschap • Meer ‘streaming’ – Kafka Streams, Spark Streaming, andere streaming engines • Big data – schema on read, steeds meer tools, niet alleen maar Hadoop • NoSql databases – Redis, Mongo, Cassandra, Riak, Kudu • Big Data  SQL mogelijkheden • Cloud, cloud, cloud • Meer aandacht voor privacy (GDPR!) • Meer aandacht voor beheer van data, ‘governance’ (GDPR!) • Architecturen niet alleen bedoeld voor big data • Andere dataformaten zoals AVRO, ORC en Parquet • Niet alleen streamen van data, maar ook events