Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Keuzes in Data Science - wat als je resources beperkt zijn? - Big Data Expo 2019

155 views

Published on

Bedrijven willen inspelen op de individuele (toekomstige) klantbehoeften. Om gedrag te voorspellen is een goed klantbeeld nodig en daarmee dus goede klantdata. Het vervelende van klantdata is dat het dynamisch is: mensen verhuizen, gaan trouwen, krijgen kinderen, gaan scheiden, overlijden, gebruiken meerdere adressen, contactkanalen, etc. Ook is de data vaak versnipperd over verschillende systemen en missen veel matchkeys. Bedrijven hebben wel veel klantdata maar zelden een goed klantbeeld. Dagelijks verwerkt EDM veel ruwe data, worden issues opgelost om tot een optimaal 360 graden klantbeeld te komen en worden gedragsvoorspellingen toegevoegd.

Tijdens de presentatie geeft EDM aan hoe ze een en ander aanpakken. Er zijn uitdagingen met betrekking tot het toepassen en onderhouden van de AI-modellen. Een model maken en met de hand runnen is geen probleem, maar hoe ga je het structureel inzetten en onderhouden? Technieken veranderen, data ook en je werkt met verschillende collega’s. Daarvoor heeft EDM een ‘modellenfabriek’ ingericht. Uiteraard met een beperkt budget en restricties vanwege security, organisatie, etc. EDM vertelt hoe ze dit aangepakt hebben, welke issues ze tegenkwamen en welke keuzes gemaakt zijn. Geen luchtfietserij, maar een praktijkverhaal met tips voor het zelf opzetten van een eigen modellenfabriek.

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

Keuzes in Data Science - wat als je resources beperkt zijn? - Big Data Expo 2019

  1. 1. 1 VERSTAND VAN DATA. GEVOEL VOOR MARKETING. KEUZES IN DATA SCIENCE ‘WAT ALS JE NIET BIJ GOOGLE WERKT?’ Praatje voor data science managers / engineers / scientists WELKOM ROBERT FELTZER Head of intelligence ROELANT STEGMANN Data scientist
  2. 2. 2 DE “DATA SCIENCE” CURVE DE “DATA SCIENCE” CURVE
  3. 3. 3 DE “DATA SCIENCE” CURVE Behind the curve Big Data Expo praatjes Amazon, Google, Facebook, Microsoft VERWACHTINGSMANAGEMENT Revolutionaire technieken Afwegingen& keuzes Pseudografieken Praktijk voorbeelden Code
  4. 4. 4 VERSTAND VAN DATA. GEVOEL VOOR MARKETING. DROMEN ONEINDIG VEEL ENGINEERS EN SCIENTISTS
  5. 5. 5 ALLES GEAUTOMATISEERD IEDEREEN KAN ELKE PROGRAMMEERTAAL
  6. 6. 6 DATAKWALITEIT IS PERFECT GEEN KLIMAATCRISIS
  7. 7. 7 ONBEPERKT (EN GRATIS) COMPUTING VERSTAND VAN DATA. GEVOEL VOOR MARKETING. HELAAS…
  8. 8. 8 VERSTAND VAN DATA. GEVOEL VOOR MARKETING. ONZE WERKELIJKHEID ACTIONABLE VOORSPELLINGEN
  9. 9. 9 KLANTDATA IS VERSNIPPERD Administratie J. Jansen Kerkstraat 1 1234 AB Vleuten Klantnr: 115993 Transactie Klantnr: 115993 Bestelling Jolanda Janssen 06-12345678 Nieuwsbrief jans@gmail.com Retour Jansen Wattbaan 1 3439 ML Nieuwegein Klantnr: 231712 Info aanvraag 06-01010223 Excel Karel Jansen 030-6002000 Service pagina Web-ID jansen@ziggo.nl CUSTOMER DATA PLATFORM Golden record Klantgedrag Extra profiel AI-predictions Fam. Jansen Wattbaan 1 3439 ML Nieuwegein 030-6002000 K. Jansen, man, 23-01-1976, 06-87654321, jansen@ziggo.nl, klantnr 231712 J. Jansen, vrouw, 16-11-1978, 06-12345678, jans@gmail.com, klantnr 115993 Koophistorie Campagnehistorie Servicecontacten Webclicks Klanttype (afgeleid): - Klantwaarde - A-merk koper - Kortingkoper - Etc. Welstand Gezinssamenstelling Opleiding Woning Geotype + 160 kenmerken Look-a-like (top)klant Customer type Cross sell recommendation Upsell recommendation Churn probability Responsgevoeligheid
  10. 10. 10 VERSTAND VAN DATA. GEVOEL VOOR MARKETING. KEUZES WAAR BEGONNEN WE? Independents maken Klanten labelen Model maken Score per klant Script maken Automatische scores Rapportage maken 1 2 3 4 5 6 7
  11. 11. 11 ON-PREMISE OF DE CLOUD 1 2 3 & DATA SCIENCE HEEFT ANDERE TALEN 1 2 3 &
  12. 12. 12 SCIENTISTS ZIJN SCHAARS 10x 10x 3x 1 2 3 DATA IS NIET PERFECT 2 1
  13. 13. 13 Data Quality report highlights 2 0,0% Movers Other address 6,2% 1,9% 8,1% 41,9% 42,3% 0,0%@ 47.841 48.827 48.805 - 98,0% 100,0% 100,0% Gender Firstname Lastname Date of birth Person details 94,2% status green 4,7% status orange 1,0% status red 0,1% empty 37.720 unique persons 45.796 unique addresses 3.033duplicate persons 48.829 96,3% MATCHREFERENCE DATABASE person/family matches 74,5 % PROCESSED RECORDS 18 75+ Top5% Top50 % Top95 % Look-a-like DATASETS GROEIEN STERK 1 2 3
  14. 14. 14 SELECT d.*, p.Score FROM PREDICT(MODEL = @logit_model, DATA = dbo.mytable AS d) WITH (Score float) AS p; NOTEBOOKS ZIJN LASTIG 1 2 3
  15. 15. 15 File explorer view? SIMPEL MODEL MOET SIMPEL ZIJN 2 1
  16. 16. 16 Datum slide? LABELLEN MODELLEN EISEN ONDERHOUD 3 1 2
  17. 17. 17 HOE WERKT HET NU? Independents maken Klanten labelen Model maken Score per klant Script maken Automatische scores Rapportage maken 1 Independents maken Klanten labelen Model maken Score per klant Script maken Automatische scores Rapportage maken 1 2 3 4 5 6 7
  18. 18. 18 DE “DATA SCIENCE” CURVE VERSTAND VAN DATA. GEVOEL VOOR MARKETING. VRAGEN

×