Event:   DDMA DQ Dag Thema:  Datakwaliteit Spreker:   Brian Holmes - Infosync    en Henk Wassenaar – DMS Consultancy Datum...
Datakwaliteit Effectief gebruik van referentietabellen
..even voorstellen <ul><li>Brian Holmes </li></ul><ul><li>(Infosync Database Services) </li></ul><ul><li>Henk Wassenaar </...
..even voorstellen <ul><li>RDMS Direct Marketing </li></ul><ul><li>(opgericht vanuit RAET Database Services) </li></ul><ul...
Bestandsbewerking <ul><li>Standaardiseren, uniformeren </li></ul><ul><li>Stuctureren en ontdubbelen </li></ul><ul><li>Verr...
Hoe bereik je je doelstellingen <ul><li>Wat wil je bereiken? </li></ul><ul><li>Welk soort gebruiker ben je? </li></ul><ul>...
Wat wil je bereiken <ul><li>Heb je een referentiebestand nodig? </li></ul><ul><li>Betere ROI on mailings </li></ul><ul><ul...
Welk soort gebruiker ben je? <ul><li>Heb je er tijd voor? </li></ul><ul><li>Stabiel bestand, regelmatig contact, weten kla...
Welk soort gebruiker ben je? <ul><li>Heb je een eigen database – of maak je steeds gebruik van externe bestanden? </li></u...
Wat verwacht je van je leverancier? <ul><li>Advies van begin tot eind… </li></ul><ul><li>Opknappen en stuctureren eigen da...
Hoe kies je een leverancier? <ul><li>Reeds goede contacten/reputatie </li></ul><ul><li>Kosten van verwerking </li></ul><ul...
Waar moet je op letten? <ul><li>Hoe compleet is het referentiebestand? </li></ul><ul><ul><li>Consumenten </li></ul></ul><u...
Het proces/intelligentie… <ul><li>Eigen data ..structureren, parsing, personalisering, standaardisering </li></ul><ul><li>...
Het proces/Intelligentie <ul><li>Computers zijn in principe niet intelligent.. </li></ul><ul><li>Wij kunnen snel conclusie...
Intelligentie <ul><li>Wij kunnen conclusies trekken uit onze ervaringen en redeneringskracht… </li></ul><ul><li>Aan een na...
Intelligentie <ul><li>B.Holmes </li></ul><ul><li>Brian Holmes </li></ul><ul><li>Dhr B. Holmes </li></ul><ul><li>Dhr B. Hol...
Intelligentie <ul><li>Geen magische sleutel.. </li></ul><ul><li>Niet alleen een slim programma .. </li></ul><ul><li>Combin...
Namen en adressen <ul><li>Verschil zien tussen bedrijfs- en persoonsnamen.. </li></ul><ul><li>Herkennen van indicatieve de...
Namen …. <ul><li>Veronica Blad </li></ul><ul><li>V V D Fractie </li></ul><ul><li>Museum, Vincent van Gogh </li></ul><ul><l...
Adressen…. <ul><li>Land herkenning … St Moritz </li></ul><ul><li>Woonplaats .. Wassenaar </li></ul><ul><li>Straat huisnumm...
Leverancier doet alles goed .. <ul><li>Verificatie – dus vergelijken met referentiebestanden </li></ul><ul><li>Gevonden/Ni...
Referentiebestanden <ul><li>Informatie leveranciers </li></ul><ul><li>o.a.: </li></ul><ul><ul><li>Cendris </li></ul></ul><...
Referentiebestanden <ul><li>Beschikbare data: </li></ul><ul><li>KPN data(gidsvermeldingen) </li></ul><ul><li>Verhuisgegeve...
Referentiebestanden <ul><li>Beschikbare data: </li></ul><ul><li>Dagbladen abonnees </li></ul><ul><li>Weekblad abonnees </l...
Referentiebestanden <ul><li>Meer bronbestanden geeft betere dekkingsgraad en hogere betrouwbaarheid </li></ul><ul><li>Best...
Referentiebestanden <ul><li>Bestandsdiagnose / datascan </li></ul><ul><li>Tellingen van.. </li></ul><ul><li>- correcte rec...
Referentiebestanden <ul><li>Bestandsvergelijking </li></ul><ul><li>F. v. Rooij A. van Rooij </li></ul><ul><li>Hans van Lee...
Referentiebestanden <ul><li>Na de datascan </li></ul><ul><li>in overleg met de leverancier : </li></ul><ul><li>valideren (...
Referentiebestanden <ul><li>En hoe nu verder.. </li></ul>
De-duplicatie <ul><li>Ontdubbeling/ Merge-Purge </li></ul><ul><li>Maak groepen van gegevens met een of meerdere kenmerken ...
De-duplicatie <ul><li>. Henk heeft al voorbeelden gegeven van levensverzekering/hypotheken/verzekering enz </li></ul><ul><...
Conclusie <ul><li>Doelstellingen goed bepalen </li></ul><ul><li>Probeer zelf je data zo goed en zo gestructureerd mogelijk...
Upcoming SlideShare
Loading in …5
×

DDMA / DMS en Infosync: Datakwaliteit

751 views
707 views

Published on

Voorzitter van de DDMA sectie datakwaliteit Henk Wassenaar (DMS Consultancy) en Brian Holmes (Infosync Database Services) gaan in op het effectief gebruik van referentietabellenda. Ook hier gaat het om de manier waarop gebruik gemaakt wordt van de beschikbare gegevens. Toepassen van hoogwaardige software is nodig om intelligente beslissingen te kunnen nemen. Ook moet van tevoren duidelijk zijn waar de data voor gebruikt gaan worden. Bovendien moeten beschikbare bestanden zodanig worden voorbereid dat een vergelijking mogelijk is. En zelfs met de beste voorbereiding is het van belang de output te controleren op interpretatieverschillen. Na dit traject kan worden begonnen met het ingewikkelde proces van de-duplicatie en eventueel het samenvoegen van onderliggende data. Als dit zorgvuldig gebeurt, kan men er een groot voordeel uit halen.

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
751
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

DDMA / DMS en Infosync: Datakwaliteit

  1. 1. Event: DDMA DQ Dag Thema: Datakwaliteit Spreker: Brian Holmes - Infosync en Henk Wassenaar – DMS Consultancy Datum: 12 september 2006, Fortis NV www.ddma.nl
  2. 2. Datakwaliteit Effectief gebruik van referentietabellen
  3. 3. ..even voorstellen <ul><li>Brian Holmes </li></ul><ul><li>(Infosync Database Services) </li></ul><ul><li>Henk Wassenaar </li></ul><ul><li>(DMS Consultancy) </li></ul><ul><li>Van 1993 tot 2004 directie van computerservicebureau RDMS Direct Marketing </li></ul>
  4. 4. ..even voorstellen <ul><li>RDMS Direct Marketing </li></ul><ul><li>(opgericht vanuit RAET Database Services) </li></ul><ul><li>Dienstverlening: </li></ul><ul><li>Databasebeheer </li></ul><ul><li>Bestandsbewerking </li></ul>
  5. 5. Bestandsbewerking <ul><li>Standaardiseren, uniformeren </li></ul><ul><li>Stuctureren en ontdubbelen </li></ul><ul><li>Verrijken </li></ul><ul><li>Dataconversie </li></ul><ul><li>Ook internationale adresdata </li></ul><ul><li>… Brian … </li></ul>
  6. 6. Hoe bereik je je doelstellingen <ul><li>Wat wil je bereiken? </li></ul><ul><li>Welk soort gebruiker ben je? </li></ul><ul><li>Wat verwacht je van je leverancier? </li></ul><ul><li>Hoe kies je een leverancier? </li></ul><ul><li>Waar moet je opletten? </li></ul><ul><li>Het Proces?Intelligentie…….. </li></ul><ul><li>Henk … Referentiebestanden </li></ul><ul><li>De-duplicatie </li></ul><ul><li>Conclusie </li></ul>
  7. 7. Wat wil je bereiken <ul><li>Heb je een referentiebestand nodig? </li></ul><ul><li>Betere ROI on mailings </li></ul><ul><ul><li>Post retouren </li></ul></ul><ul><ul><li>Drukwerk </li></ul></ul><ul><ul><li>Meervoudige mailings naar 1 persoon </li></ul></ul><ul><li>Beter uitstraling – type product </li></ul><ul><li>Durf om regelmatig contact op te nemen </li></ul><ul><li>Meer inzicht </li></ul>
  8. 8. Welk soort gebruiker ben je? <ul><li>Heb je er tijd voor? </li></ul><ul><li>Stabiel bestand, regelmatig contact, weten klanten/prospects dat ze in je bestand zitten? </li></ul><ul><li>Veel prospects, weinig contact, laag profiel, veel post retour, verlies van contacten </li></ul><ul><li>Tussen in… </li></ul>
  9. 9. Welk soort gebruiker ben je? <ul><li>Heb je een eigen database – of maak je steeds gebruik van externe bestanden? </li></ul><ul><li>CRM systeem? </li></ul><ul><li>Type product </li></ul><ul><li>Prijs product </li></ul><ul><li>Channel gebruik…. </li></ul>
  10. 10. Wat verwacht je van je leverancier? <ul><li>Advies van begin tot eind… </li></ul><ul><li>Opknappen en stuctureren eigen data </li></ul><ul><li>De-duplicatie.. </li></ul><ul><li>Controle op naam </li></ul><ul><li>Uitgebreide info in fout situaties.. </li></ul><ul><li>100% oplossing </li></ul><ul><li>Nationaal/Internationaal </li></ul>
  11. 11. Hoe kies je een leverancier? <ul><li>Reeds goede contacten/reputatie </li></ul><ul><li>Kosten van verwerking </li></ul><ul><li>Resultaten – test verwerking… </li></ul><ul><li>Type oplossing gewenst, </li></ul><ul><ul><li>Batch … snelle batch </li></ul></ul><ul><ul><li>Online …. </li></ul></ul><ul><ul><li>Nationaal/Internationaal </li></ul></ul><ul><li>Dekking …. </li></ul>
  12. 12. Waar moet je op letten? <ul><li>Hoe compleet is het referentiebestand? </li></ul><ul><ul><li>Consumenten </li></ul></ul><ul><ul><li>B-to-B </li></ul></ul><ul><li>Hoe vaak wordt het ge-update? </li></ul><ul><li>Wat zijn de gebruikte bronnen? </li></ul><ul><li>Historie aanwezig … </li></ul><ul><li>Hoe intelligent is de software? </li></ul>
  13. 13. Het proces/intelligentie… <ul><li>Eigen data ..structureren, parsing, personalisering, standaardisering </li></ul><ul><li>Verificatie .. Matchen met referentiedata </li></ul><ul><li>De-duplicatie/samenvoegen, vervangen met referentiedata </li></ul>
  14. 14. Het proces/Intelligentie <ul><li>Computers zijn in principe niet intelligent.. </li></ul><ul><li>Wij kunnen snel conclusies trekken uit onze ervaringen – de computer niet of hij moet getrained worden… </li></ul><ul><li>Dus leverancier moet niet alleen referentiedata hebben voor controle enz. maar ook referentiedata en software om de computer intelligente beslissingen te laten maken… </li></ul>
  15. 15. Intelligentie <ul><li>Wij kunnen conclusies trekken uit onze ervaringen en redeneringskracht… </li></ul><ul><li>Aan een naam is veel te zien……. </li></ul>
  16. 16. Intelligentie <ul><li>B.Holmes </li></ul><ul><li>Brian Holmes </li></ul><ul><li>Dhr B. Holmes </li></ul><ul><li>Dhr B. Holmes Jr. </li></ul><ul><li>Aan de gelukkige winnaar </li></ul>
  17. 17. Intelligentie <ul><li>Geen magische sleutel.. </li></ul><ul><li>Niet alleen een slim programma .. </li></ul><ul><li>Combinatie van ervaring en software – artificial intelligence </li></ul><ul><li>Nooit klaar.. </li></ul><ul><li>Samen met klant “rule-set” maken </li></ul>
  18. 18. Namen en adressen <ul><li>Verschil zien tussen bedrijfs- en persoonsnamen.. </li></ul><ul><li>Herkennen van indicatieve delen bedrijfsnamen </li></ul><ul><li>Opsplistsen van naam onderdelen </li></ul><ul><li>Upper Lower case </li></ul><ul><li>Voornamen …. </li></ul>
  19. 19. Namen …. <ul><li>Veronica Blad </li></ul><ul><li>V V D Fractie </li></ul><ul><li>Museum, Vincent van Gogh </li></ul><ul><li>Philip Morris </li></ul><ul><li>Albert Hein </li></ul><ul><li>J.Janssen Arts </li></ul><ul><li>B.V. Holmes </li></ul><ul><li>Janssen AGF </li></ul>
  20. 20. Adressen…. <ul><li>Land herkenning … St Moritz </li></ul><ul><li>Woonplaats .. Wassenaar </li></ul><ul><li>Straat huisnummer toevoeging </li></ul><ul><ul><li>1940-1945, 1914-1918, 1 Feb 1953 </li></ul></ul><ul><ul><li>Apollo 11 … huisnr </li></ul></ul><ul><ul><li>Floris 4 </li></ul></ul><ul><ul><li>Hendrik 1 </li></ul></ul><ul><ul><li>Charta 77 </li></ul></ul><ul><ul><li>Jan 1 </li></ul></ul>
  21. 21. Leverancier doet alles goed .. <ul><li>Verificatie – dus vergelijken met referentiebestanden </li></ul><ul><li>Gevonden/Niet gevonden/Verhuisd… </li></ul><ul><li>Niet gevonden betekent niet dat iets verkeerd is… </li></ul><ul><li>Gebruik hulp van leverancier om conclusies te trekken… </li></ul><ul><li>… Henk … </li></ul>
  22. 22. Referentiebestanden <ul><li>Informatie leveranciers </li></ul><ul><li>o.a.: </li></ul><ul><ul><li>Cendris </li></ul></ul><ul><ul><li>Experian </li></ul></ul><ul><ul><li>Wegener DM </li></ul></ul><ul><ul><li>Kamer van Koophandel </li></ul></ul><ul><ul><li>Stichting Infofilter </li></ul></ul>
  23. 23. Referentiebestanden <ul><li>Beschikbare data: </li></ul><ul><li>KPN data(gidsvermeldingen) </li></ul><ul><li>Verhuisgegevens van TPG verhuisbericht </li></ul><ul><li>(90 % van de verhuizingen) </li></ul><ul><li>Postcodetabel </li></ul><ul><li>Afgiftebestand TPGpost </li></ul>
  24. 24. Referentiebestanden <ul><li>Beschikbare data: </li></ul><ul><li>Dagbladen abonnees </li></ul><ul><li>Weekblad abonnees </li></ul><ul><li>KvK data (bedrijven) </li></ul><ul><li>Infofilter (blokkering) </li></ul>
  25. 25. Referentiebestanden <ul><li>Meer bronbestanden geeft betere dekkingsgraad en hogere betrouwbaarheid </li></ul><ul><li>Bestand(en) zodanig voorbereiden, dat datavergelijking mogelijk is </li></ul><ul><li>Alles draait om het ‘herkennen’ van een record t.o.v. een record in het referentiebestand </li></ul>
  26. 26. Referentiebestanden <ul><li>Bestandsdiagnose / datascan </li></ul><ul><li>Tellingen van.. </li></ul><ul><li>- correcte records </li></ul><ul><li>- niet gevonden </li></ul><ul><li>- foutief adres </li></ul><ul><li>- (mogelijk) verhuisd </li></ul><ul><li>..zegt iets over de kwaliteit van het bestand </li></ul>
  27. 27. Referentiebestanden <ul><li>Bestandsvergelijking </li></ul><ul><li>F. v. Rooij A. van Rooij </li></ul><ul><li>Hans van Leeuwen J. van Leeuwen </li></ul><ul><li>Gert Rothert G. Rothert Sr. </li></ul><ul><li>R.V.S. Leven RVS Schadeverzekeringen </li></ul>
  28. 28. Referentiebestanden <ul><li>Na de datascan </li></ul><ul><li>in overleg met de leverancier : </li></ul><ul><li>valideren (of niet) </li></ul><ul><li>Hoe valide is valideren.. </li></ul><ul><li>Let op interpretatieverschillen! </li></ul><ul><li>Hoe hoog is de dekkingsgraad </li></ul><ul><li>Wat is de gewenste kwaliteit </li></ul><ul><li>Waarvoor wordt de data ingezet </li></ul>
  29. 29. Referentiebestanden <ul><li>En hoe nu verder.. </li></ul>
  30. 30. De-duplicatie <ul><li>Ontdubbeling/ Merge-Purge </li></ul><ul><li>Maak groepen van gegevens met een of meerdere kenmerken gelijk, binnen groep alles tegen alles vergelijken met scorings algorithme….. </li></ul><ul><li>Niet zo makkelijk als het lijkt.. </li></ul>
  31. 31. De-duplicatie <ul><li>. Henk heeft al voorbeelden gegeven van levensverzekering/hypotheken/verzekering enz </li></ul><ul><li>IBM Internationaal Business Machines </li></ul><ul><li>Samenvoegen onderliggende data… </li></ul>
  32. 32. Conclusie <ul><li>Doelstellingen goed bepalen </li></ul><ul><li>Probeer zelf je data zo goed en zo gestructureerd mogelijk bij te houden </li></ul><ul><li>Wees critisch met aanbod </li></ul><ul><li>Voer een test uit </li></ul><ul><li>Neem tijd om de output te controleren </li></ul><ul><li>Wees voorzichtig met samenvoegen…… </li></ul><ul><li>Gebruik het voordeel dat daar ligt … </li></ul>

×