SlideShare a Scribd company logo
1 of 21
Download to read offline
Schaalbare
rapportage
op 1 miljard events
per dag
MobPro & GoDataDriven
● ● ● Gijs van der Voort
● Computer Science (Universiteit van Amsterdam)
● 7 jaar in de ad-tech sector
● Waarvan 5 jaar bij MobPro
● Van developer tot head of IT
Gijs van der Voort
● ● ● MobPro
Een full service bureau gespecialiseerd in
mobile advertising campagnes.
Wij begrijpen consumentengedrag en
ontwikkelen campagnes vanuit die gedachte.
Zo creëren we mentale beschikbaarheid en
gedragsverandering.
Met 30 mobile consultants,
campagnemanagers, creative developers &
techneuten de expert aan de zijde van ruim
vijftig A-merken, zoals:
● ● ● MobPro & tech
MobPro & Tech
● Real-time inkoop van advertentie ruimtes
voor tonen van advertentie campagnes
● Meten van gebeurtenissen met betrekking
tot de advertentie ruimtes
● Attributie van in-app gebeurtenissen aan
getoonde advertenties
● ● ● Fokko Driesprong
● Distributed Systems & Software Engineering
at University of Groningen
● Data Engineer at GoDataDriven
● Apache PPMC Member and Apache Airflow
committer
● Contributer to Apache Flink, Apache Spark,
Apache Druid and any many more
Fokko Driesprong
Data analytics
bij MobPro
● ● ● Analytics bij MobPro
De getallen
● 22 advertentienetwerken
● 10.000 veilingen per seconde
● 500 biedingen per seconde
● 400 tracking events per seconde
● 70GB per dag gecomprimeerd
● 400GB per dag rauwe data
De getallen
● ● ● Analytics bij MobPro
De verschillende type analyses
Rapportage
● “Hoeveel impressies hebben we per dag gerealiseerd?”
● “Op welk platform presenteerde de campagne het beste?”
● “Hoeveel mensen hebben we met de campagne bereikt?”
Forecasting
● “Is het mogelijk om 100.000 mensen binnen Amsterdam te bereiken?”
● “Is het mogelijk om 200.000 views te realiseren in een specifieke groep apps op Android?”
Exploration/debugging
● “Wat voor apps zitten er in netwerk X?”
● “Wat voor impact heeft de nieuwe cookie/consent wetgeving op ons netwerk?”
● “In welk format stuurt app X land codes?”
De verschillende type analyses
● ● ● Analytics bij MobPro
De oude situatie
PostgreSQL
● Alleen bruikbaar voor rapportage
● ‘Unieken’ moeilijk/onmogelijk
● Alleen verticaal schaalbaar
● Schema changes ‘forwards only’
Metamarkets
● Druid as a service
● Black box
● Schema changes duur en traag
● API eerst niet beschikbaar, later slecht bruikbaar
De oude situatie
Vervelend: moeizaam mee
te veranderen met de markt
Erger: verschil in metrics
tussen Postgres en
Metamarkets
Schaalbare
oplossing
Hadoop, Spark en Druid
● ● ● Schaalbare oplossing
Speerpunten
● Flexibiliteit
● Lage Total Cost of Ownership (TCO)
De oude situatie
● ● ● Apache Druid (Incubating)
● Gedistribueerd, kolom georiënteerd, real-time analytics
● Geoptimaliseerd voor sub-second slice-and-dice analytische queries
● Gebruikt door: Netflix, Wallmart, AirBnB, en meer
● Horizontaal schaalbaar
● 2011: Ontwikkeld door Metamarkets
● 2015: Open Source Apache 2.0 licentie
● 2017: Naar de Apache software foundation
De oude situatie
● ● ●
Apache {Hadoop, Spark, Druid}
Schaalbare oplossing
Hadoop, Spark en Druid
● ● ● Schaalbare oplossing
Open Source
● Toegang tot de broncode
● Ondersteund door grote bedrijven
● Laatste technologie
● Samen een beter product
● Samen het fixen van bugs
Open Source
● ● ● Stocator
Open Source
De oude situatie
● ● ●
Apache {Hadoop, Spark, Druid}
Schaalbare oplossing
Hadoop, Spark en Druid
● ● ● Apache Superset
Open Source
Open Source
● ● ●
Resultaat
Schaalbare oplossing
Resultaat
● Single source of truth
● `Unieken` in elke analyse beschikbaar
● Redundantie ingebakken
● Schema veranderingen met terugwerkende kracht
● Zo snel als dat we ervoor willen betalen
○ Alle rapportages binnen 2 seconden
○ Forecasting/debugging in enkele minuten
● Integreerbaar in bestaande systemen via API
● ● ● Schaalbare oplossing
Next steps
Streaming ingestion
● Data real-time beschikbaar
● Ook bij mislukte batch jobs
Eigen hardware
● Sneller
○ Lokale disks, geen noisy neighbours, geen IOPS restricties
● Goedkoper
○ Alleen redundantie daar waar nodig
○ Specs sluiten beter aan op type workload
Next steps
● Grote tech stack, dus:
○ Engineering culture nodig
○ Java java java
● Kosten trade-offs
● Maar ready for the future
● Naast scalable analytics ook ‘gratis’ een big-data stack
Take-aways

More Related Content

Similar to Mobpro - Uitschalen binnen de Ad-Tech wereld

App development step by step
App development   step by stepApp development   step by step
App development step by step
Philippe De Pauw
 
Workshop Online en social media projectmanagement seminar 1403 - handout
Workshop Online en social media projectmanagement   seminar 1403 - handoutWorkshop Online en social media projectmanagement   seminar 1403 - handout
Workshop Online en social media projectmanagement seminar 1403 - handout
TRAININGONLINEMARKETING
 
Cookie Compliancy and how to store 54th of consents | Themer Abourayan
Cookie Compliancy and how to store 54th of consents | Themer AbourayanCookie Compliancy and how to store 54th of consents | Themer Abourayan
Cookie Compliancy and how to store 54th of consents | Themer Abourayan
clickdistrict
 
Presentatie ILIAS Seminar on Open Source
Presentatie ILIAS Seminar on Open SourcePresentatie ILIAS Seminar on Open Source
Presentatie ILIAS Seminar on Open Source
Kouwepolder ICT
 
DSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo Software
DSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo SoftwareDSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo Software
DSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo Software
Deltares
 

Similar to Mobpro - Uitschalen binnen de Ad-Tech wereld (20)

SamenSpel voor Buurt Praktijk Team
SamenSpel voor Buurt Praktijk TeamSamenSpel voor Buurt Praktijk Team
SamenSpel voor Buurt Praktijk Team
 
Mdot 4a broker introductie
Mdot 4a broker introductie Mdot 4a broker introductie
Mdot 4a broker introductie
 
Complexe e-commerce concepten op basis van open source
Complexe e-commerce concepten op basis van open sourceComplexe e-commerce concepten op basis van open source
Complexe e-commerce concepten op basis van open source
 
Meetup 25/1/2018 - AIOPS om de uitdagingen van een slimme stad te ondersteunen
Meetup 25/1/2018 - AIOPS om de uitdagingen van een slimme stad te ondersteunenMeetup 25/1/2018 - AIOPS om de uitdagingen van een slimme stad te ondersteunen
Meetup 25/1/2018 - AIOPS om de uitdagingen van een slimme stad te ondersteunen
 
App development step by step
App development   step by stepApp development   step by step
App development step by step
 
GIVE-metadataproject
GIVE-metadataprojectGIVE-metadataproject
GIVE-metadataproject
 
TOPdesk Partner event slides 10-11-2016
TOPdesk Partner event slides 10-11-2016TOPdesk Partner event slides 10-11-2016
TOPdesk Partner event slides 10-11-2016
 
PWA VS Mobile - Picqer meet and grill 2018
PWA VS Mobile - Picqer meet and grill 2018PWA VS Mobile - Picqer meet and grill 2018
PWA VS Mobile - Picqer meet and grill 2018
 
Realisatiedag 14 juni Hilversum Buren common ground gamechanger
Realisatiedag 14 juni Hilversum Buren common ground gamechangerRealisatiedag 14 juni Hilversum Buren common ground gamechanger
Realisatiedag 14 juni Hilversum Buren common ground gamechanger
 
App analytics voor windows phone en windows store
App analytics voor windows phone en windows storeApp analytics voor windows phone en windows store
App analytics voor windows phone en windows store
 
Workshop Online en social media projectmanagement seminar 1403 - handout
Workshop Online en social media projectmanagement   seminar 1403 - handoutWorkshop Online en social media projectmanagement   seminar 1403 - handout
Workshop Online en social media projectmanagement seminar 1403 - handout
 
Cookie Compliancy and how to store 54th of consents | Themer Abourayan
Cookie Compliancy and how to store 54th of consents | Themer AbourayanCookie Compliancy and how to store 54th of consents | Themer Abourayan
Cookie Compliancy and how to store 54th of consents | Themer Abourayan
 
Realisatiedag 21 juni Nijverdal Twentecloud
Realisatiedag 21 juni Nijverdal TwentecloudRealisatiedag 21 juni Nijverdal Twentecloud
Realisatiedag 21 juni Nijverdal Twentecloud
 
Presentatie ILIAS Seminar on Open Source
Presentatie ILIAS Seminar on Open SourcePresentatie ILIAS Seminar on Open Source
Presentatie ILIAS Seminar on Open Source
 
Kansen met workvoices!
Kansen met workvoices!Kansen met workvoices!
Kansen met workvoices!
 
DSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo Software
DSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo SoftwareDSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo Software
DSD-NL 2014 - Geo Klantendag - 3. Next Generation Geo Software
 
Ricoh Pro C751: Een kleine stap richting grote plannen
Ricoh Pro C751: Een kleine stap richting grote plannenRicoh Pro C751: Een kleine stap richting grote plannen
Ricoh Pro C751: Een kleine stap richting grote plannen
 
Google analytics: Measuring what matters
Google analytics: Measuring what mattersGoogle analytics: Measuring what matters
Google analytics: Measuring what matters
 
Creating sustainable solutions with SharePoint 2013 - Yuri Burger
Creating sustainable solutions with SharePoint 2013 - Yuri BurgerCreating sustainable solutions with SharePoint 2013 - Yuri Burger
Creating sustainable solutions with SharePoint 2013 - Yuri Burger
 
Bas de Vos - SKO - FOAM
Bas de Vos - SKO - FOAMBas de Vos - SKO - FOAM
Bas de Vos - SKO - FOAM
 

More from BigDataExpo

More from BigDataExpo (20)

Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
 
Google Cloud - Google's vision on AI
Google Cloud - Google's vision on AIGoogle Cloud - Google's vision on AI
Google Cloud - Google's vision on AI
 
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
 
PGGM - The Future Explore
PGGM - The Future ExplorePGGM - The Future Explore
PGGM - The Future Explore
 
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
 
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
 
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
 
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIDynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
 
Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science
 
FunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsFunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data Analytics
 
fashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DatafashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big Data
 
BigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenches
 
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
 
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
 
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
 
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
 
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
 
Rabobank - There is something about Data
Rabobank - There is something about DataRabobank - There is something about Data
Rabobank - There is something about Data
 
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
 
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
 

Mobpro - Uitschalen binnen de Ad-Tech wereld

  • 1.
  • 2. Schaalbare rapportage op 1 miljard events per dag MobPro & GoDataDriven
  • 3. ● ● ● Gijs van der Voort ● Computer Science (Universiteit van Amsterdam) ● 7 jaar in de ad-tech sector ● Waarvan 5 jaar bij MobPro ● Van developer tot head of IT Gijs van der Voort
  • 4. ● ● ● MobPro Een full service bureau gespecialiseerd in mobile advertising campagnes. Wij begrijpen consumentengedrag en ontwikkelen campagnes vanuit die gedachte. Zo creëren we mentale beschikbaarheid en gedragsverandering. Met 30 mobile consultants, campagnemanagers, creative developers & techneuten de expert aan de zijde van ruim vijftig A-merken, zoals:
  • 5. ● ● ● MobPro & tech MobPro & Tech ● Real-time inkoop van advertentie ruimtes voor tonen van advertentie campagnes ● Meten van gebeurtenissen met betrekking tot de advertentie ruimtes ● Attributie van in-app gebeurtenissen aan getoonde advertenties
  • 6. ● ● ● Fokko Driesprong ● Distributed Systems & Software Engineering at University of Groningen ● Data Engineer at GoDataDriven ● Apache PPMC Member and Apache Airflow committer ● Contributer to Apache Flink, Apache Spark, Apache Druid and any many more Fokko Driesprong
  • 8. ● ● ● Analytics bij MobPro De getallen ● 22 advertentienetwerken ● 10.000 veilingen per seconde ● 500 biedingen per seconde ● 400 tracking events per seconde ● 70GB per dag gecomprimeerd ● 400GB per dag rauwe data De getallen
  • 9. ● ● ● Analytics bij MobPro De verschillende type analyses Rapportage ● “Hoeveel impressies hebben we per dag gerealiseerd?” ● “Op welk platform presenteerde de campagne het beste?” ● “Hoeveel mensen hebben we met de campagne bereikt?” Forecasting ● “Is het mogelijk om 100.000 mensen binnen Amsterdam te bereiken?” ● “Is het mogelijk om 200.000 views te realiseren in een specifieke groep apps op Android?” Exploration/debugging ● “Wat voor apps zitten er in netwerk X?” ● “Wat voor impact heeft de nieuwe cookie/consent wetgeving op ons netwerk?” ● “In welk format stuurt app X land codes?” De verschillende type analyses
  • 10. ● ● ● Analytics bij MobPro De oude situatie PostgreSQL ● Alleen bruikbaar voor rapportage ● ‘Unieken’ moeilijk/onmogelijk ● Alleen verticaal schaalbaar ● Schema changes ‘forwards only’ Metamarkets ● Druid as a service ● Black box ● Schema changes duur en traag ● API eerst niet beschikbaar, later slecht bruikbaar De oude situatie Vervelend: moeizaam mee te veranderen met de markt Erger: verschil in metrics tussen Postgres en Metamarkets
  • 12. ● ● ● Schaalbare oplossing Speerpunten ● Flexibiliteit ● Lage Total Cost of Ownership (TCO) De oude situatie
  • 13. ● ● ● Apache Druid (Incubating) ● Gedistribueerd, kolom georiënteerd, real-time analytics ● Geoptimaliseerd voor sub-second slice-and-dice analytische queries ● Gebruikt door: Netflix, Wallmart, AirBnB, en meer ● Horizontaal schaalbaar ● 2011: Ontwikkeld door Metamarkets ● 2015: Open Source Apache 2.0 licentie ● 2017: Naar de Apache software foundation De oude situatie
  • 14. ● ● ● Apache {Hadoop, Spark, Druid} Schaalbare oplossing Hadoop, Spark en Druid
  • 15. ● ● ● Schaalbare oplossing Open Source ● Toegang tot de broncode ● Ondersteund door grote bedrijven ● Laatste technologie ● Samen een beter product ● Samen het fixen van bugs Open Source
  • 16. ● ● ● Stocator Open Source De oude situatie
  • 17. ● ● ● Apache {Hadoop, Spark, Druid} Schaalbare oplossing Hadoop, Spark en Druid
  • 18. ● ● ● Apache Superset Open Source Open Source
  • 19. ● ● ● Resultaat Schaalbare oplossing Resultaat ● Single source of truth ● `Unieken` in elke analyse beschikbaar ● Redundantie ingebakken ● Schema veranderingen met terugwerkende kracht ● Zo snel als dat we ervoor willen betalen ○ Alle rapportages binnen 2 seconden ○ Forecasting/debugging in enkele minuten ● Integreerbaar in bestaande systemen via API
  • 20. ● ● ● Schaalbare oplossing Next steps Streaming ingestion ● Data real-time beschikbaar ● Ook bij mislukte batch jobs Eigen hardware ● Sneller ○ Lokale disks, geen noisy neighbours, geen IOPS restricties ● Goedkoper ○ Alleen redundantie daar waar nodig ○ Specs sluiten beter aan op type workload Next steps
  • 21. ● Grote tech stack, dus: ○ Engineering culture nodig ○ Java java java ● Kosten trade-offs ● Maar ready for the future ● Naast scalable analytics ook ‘gratis’ een big-data stack Take-aways