Data Quality?
Data Quality:
Splijtzwam of bruggenbouwer?

Arend Jan Kolthof
Senior BI Architect, BI&A

Bussum, 26 november 2013

Data Qu...
Agenda
• ‘Data is changing the game’
• Business en ICT
• Eigenaarschap en verantwoordelijkheid
• Een modeloplossing
• Waar...
‘Data is changing the game’
• Ontwikkelingen
• Data als ‘asset’
• Kansen
• ‘Kwaliteit’?
• Initiatieven …

Data Quality: sp...
Business en ICT
• Taal
• Cultuur
• Eigenaarschap
• Verantwoordelijkheid
• Kansen…

Data Quality: splijtzwam of bruggenbouw...
Eigenaarschap en verantwoordelijkheid
Definitie

Logistiek
100%

naar David Garvin

100%

Kenmerken /
Eigenschappen

Prese...
Eigenaarschap en verantwoordelijkheid
Definitie

Logistiek
100%

naar David Garvin

100%

Kenmerken /
Eigenschappen

Prese...
Eigenaarschap en verantwoordelijkheid
Definitie

Logistiek
100%

naar David Garvin

100%

Kenmerken /
Eigenschappen

Prese...
Eigenaarschap en verantwoordelijkheid
Definitie

Logistiek
100%

naar David Garvin

100%

Kenmerken /
Eigenschappen

Prese...
Eigenaarschap en verantwoordelijkheid
Definitie

Logistiek
100%

naar David Garvin

100%

Kenmerken /
Eigenschappen

Prese...
Een modeloplossing
• Eenvoudig
• Specifiek
• Interdisciplinair
• Vertrekpunt
• Instrument
• Flexibiliteit
Data Quality: sp...
Waar een wil is…
• Business
• ICT
• Organisatiebreed
• Commitment

Data Quality: splijtzwam of bruggenbouwer? | 13
Conclusie
Eenvoud
Flexibiliteit
Medium
Commitment

+

Bruggenbouwer!

Data Quality: splijtzwam of bruggenbouwer? | 14
Q&A

Data Quality: splijtzwam of bruggenbouwer? | 15
Data Quality:
‘Bruggenbouwer!’
Arend Jan Kolthof
Senior BI Architect, BI&A
E

arendjan.kolthof@sogeti.nl

T

088-6006600

...
Upcoming SlideShare
Loading in …5
×

Sogeti - Data quality-Bruggenbouwer? - Arend jan kolthof

580 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
580
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
11
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Goedemiddag!
    Mijn naam is Arend Jan Kolthof. Ik ben werkzaam als …. bij Sogeti Nederland en wil u antwoord geven op de vraag:
    Data Quality: splijtzwam of bruggenbouwer?
    Wellicht heeft iemand van u het artikel waar mijn presentatie op is gebaseerd, gelezen: hier was sprake van ‘bottleneck’ i.p.v. splijtzwam, het resultaat van een redactionele ingreep. Hoe dan ook, ‘splijtzwam’ of ‘bottleneck’: het onderscheid is voor wat ik u wil meegeven niet van belang.
    Ik wil met u graag naar een antwoord op deze vraag. En welke punten komen daarbij aan bod?
    <overgang naar de volgende slide>
  • ‘Data is changing the game’: wat is er veranderd, wat verandert er? <evt. verwijzing naar andere sprekers>
    Business en ICT, beter gezegd de verhouding: hoe ziet die er uit in deze context, d.w.z. een context van data quality
    Deze rollen en ook mogelijke alternatieven (een modeloplossing) wil ik gaan beschouwen aan de hand van ‘eigenaarschap’ en ‘verantwoordelijkheid’
    Vervolgens wil ik stilstaan bij de additionele voorwaarden om vervolgens af te ronden met de conclusie
    <overgang naar volgende slide>
  • ‘Data is changing the game’: wat gebeurt er zoal? <verwijzing naar opening ‘s morgens>
    Een van de belangrijkste ontwikkelingen is de opkomst van big data, waardoor men data meer als ‘asset’ gaat zien, een asset die volop kansen biedt. Zo komen er bijvoorbeeld enorme hoeveelheden data beschikbaar via de social media. Die gegevens kunnen de basis vormen voor interessante consumenteninformatie <voorbeeld onderzoek tweets t.b.v. VINT)
    Met deze ontwikkeling groeit ook het besef, dat de waarde van deze asset sterk afhankelijk is van de kwaliteit van de data. <evt. vraag: hoe definieert u ‘datakwaliteit’? – Verschillende definities: hier kom ik later op terug>
    Er worden tal van initiatieven ontplooid, en tal van initiatieven stranden. Dit kan om verschillende redenen zijn, bijvoorbeeld: prioriteit, budget. Maar waar ik met u naar toe wil is de ‘eeuwige’ kloof tussen business en ICT
    <overgang naar de volgende slide>
  • Het verhaal gaat, dat het verschil in ontwikkeling van hersenhelften hieraan ten grondslag ligt, waarbij links grofweg voor ‘logica’ staat en ‘rechts’ voor ‘gevoel’
    Business en ICT spreken veelal een verschillende taal <voorbeeld: ?>
    Business en ICT kennen ook verschillende culturen <voorbeeld: structureel / gedocumenteerd vs. pragmatisme>
    De ‘stammenstrijd’ wordt ook gevoerd op het gebied van datakwaliteit en dan wel op het gebied van eigenaarschap van data en de verantwoordelijkheid van datakwaliteit. Wie is waarvoor verantwoordelijk?
    Het uiteindelijke gevolg is, dat de grote kansen die onderkend worden, gemist kunnen worden
    En daarmee kom ik bij de kern van mijn presentatie. Ik heb het in de agenda als ‘modeloplossing’ opgenomen. Het betreft een model, dat naar mijn mening beide partijen nader tot elkaar kan brengen en organisaties kan helpen ‘datakwaliteit’ te definiëren en het beleid in dezen vorm te geven en te monitoren
    < overgang naar volgende slide>
  • Zoals gezegd, worden eigenaarschap en verantwoordelijkheid als uitgangspunt genomen
    Onderscheid tussen 4 aspecten van data
    Deze 4 aspecten zijn bepalend voor de gegevenskwaliteit
    Definitie: technisch (type, lengte) / functioneel (functie, uniciteit)
    Inhoud: correct, compleet
    Presentatie: presentatiefaciliteiten / -platform; beschikbaarheid en functionaliteit
    Logistiek: beschikbaarheid, transport, infrastructuur
    Per aspect kenmerken / eigenschappen
    Kenmerken en eigenschappen op meerdere aspecten toepasbaar
    Definitie: consistent, compleet
    Inhoud: consistent, compleet, redundant
    Presentatie: tijdig, compleet
    Logistiek: redundant, tijdig
    100% is een theoretisch percentage: er zijn verschillen mogelijk, afhankelijk van de behoefte in kwestie (organisatie, afdeling, proces)
    Andere mogelijke verschillen: kenmerken / eigenschappen en aspecten
    Tot nu toe
    Een model ‘datakwaliteit’ te definiëren, een model dat flexibiliteit biedt
    Model is simpel, eerste aanzet
    Simpel maar effectief: ‘Plot het maar eens op uw eigen organisatie’
    Ook op ‘rijdende treinen’ inzetbaar (herijking van het data quality-beleid)
    Dit model kan echter ook partijen bij elkaar brengen, als katalysator fungeren voor een dialoog. Hoe dat in zijn werk gaat wil ik u nu laten zien.
    <overgang naar volgende slide>
  • Er is afstemming nodig tussen de aspecten onderling, beter gezegd: er zijn raakvlakken tussen de verschillende aspecten
    Zo ook tussen Definitie en Inhoud: wat te denken van het verschil tussen valide en correcte gegevens. In hoeverre moet de inhoud aan de opgestelde definitie voldoen?
  • Inhoud en presentatie: vgl. de beschikbaarheid van de rapportagefaciliteiten en de inhoud
    Beide moeten op elkaar zijn afgestemd,op basis van het kenmerk ‘compleet’
  • Dit is ook een voorbeeld van hoe diverse disciplines aan tafel komen
    Wat te denken van Logistiek en Presentatie op basis van de kenmerken ‘tijdigheid’ en ‘compleet’?
  • Tenslotte de samenhang tussen Logistiek en Definitie
    Ook hier is weer afstemming nodig
    Voorbeeld: masterdata (20/80)
    <korte pauze>
    Bij een nadere beschouwing van de 4 aspecten en de voorbeelden valt op, dat er afstemming nodig is. We hebben een paar voorbeelden gezien, maar er zijn er legio.
    Business en ICT zijn elk primair verantwoordelijk voor specifieke aspecten
    De afstemming zoals net is beschreven vereist de dialoog en de samenwerking tussen business en ICT.
    De eindverantwoordelijkheid ligt bij de business als eigenaar van deze belangrijke asset!
  • Samengevat:
    De ‘modeloplossing’ is eenvoudig van opzet en gemakkelijk te hanteren
    Het model biedt ruimte voor specifieke ‘eigen’ oplossingen en toepassingen
    Het model kan ook voor andere disciplines binnen datamanagement worden gebruikt
    Het model ter definitie van een vertrekpunt voor de ontwikkeling van een data quality-oplossing
    Het model als instrument om een bestaande oplossing tegen het licht te houden
    Kortom: het model biedt flexibiliteit
    Maar…..
  • ….dit gaat niet zonder absoluut commitment
    ….ook financieel
  • <stap voor stap presenteren>
    Samengevat kunnen we stellen….
    Data qualty als bruggenbouwer, maar ook andere disciplines zoals gezegd
    De keuze voor data quality is gemaakt n.a.v. de hernieuwde belangstelling voor data en data quality (data management in het algemeen)
  • Sogeti - Data quality-Bruggenbouwer? - Arend jan kolthof

    1. 1. Data Quality?
    2. 2. Data Quality: Splijtzwam of bruggenbouwer? Arend Jan Kolthof Senior BI Architect, BI&A Bussum, 26 november 2013 Data Quality: splijtzwam of bruggenbouwer? | 2
    3. 3. Agenda • ‘Data is changing the game’ • Business en ICT • Eigenaarschap en verantwoordelijkheid • Een modeloplossing • Waar een wil is… • Conclusie Data Quality: splijtzwam of bruggenbouwer? | 4
    4. 4. ‘Data is changing the game’ • Ontwikkelingen • Data als ‘asset’ • Kansen • ‘Kwaliteit’? • Initiatieven … Data Quality: splijtzwam of bruggenbouwer? | 5
    5. 5. Business en ICT • Taal • Cultuur • Eigenaarschap • Verantwoordelijkheid • Kansen… Data Quality: splijtzwam of bruggenbouwer? | 6
    6. 6. Eigenaarschap en verantwoordelijkheid Definitie Logistiek 100% naar David Garvin 100% Kenmerken / Eigenschappen Presentatie Inhoud 100% 100% Data Quality: splijtzwam of bruggenbouwer? | 7
    7. 7. Eigenaarschap en verantwoordelijkheid Definitie Logistiek 100% naar David Garvin 100% Kenmerken / Eigenschappen Presentatie Inhoud 100% 100% Data Quality: splijtzwam of bruggenbouwer? | 8
    8. 8. Eigenaarschap en verantwoordelijkheid Definitie Logistiek 100% naar David Garvin 100% Kenmerken / Eigenschappen Presentatie Inhoud 100% 100% Data Quality: splijtzwam of bruggenbouwer? | 9
    9. 9. Eigenaarschap en verantwoordelijkheid Definitie Logistiek 100% naar David Garvin 100% Kenmerken / Eigenschappen Presentatie Inhoud 100% 100% Data Quality: splijtzwam of bruggenbouwer? | 10
    10. 10. Eigenaarschap en verantwoordelijkheid Definitie Logistiek 100% naar David Garvin 100% Kenmerken / Eigenschappen Presentatie Inhoud 100% 100% Data Quality: splijtzwam of bruggenbouwer? | 11
    11. 11. Een modeloplossing • Eenvoudig • Specifiek • Interdisciplinair • Vertrekpunt • Instrument • Flexibiliteit Data Quality: splijtzwam of bruggenbouwer? | 12
    12. 12. Waar een wil is… • Business • ICT • Organisatiebreed • Commitment Data Quality: splijtzwam of bruggenbouwer? | 13
    13. 13. Conclusie Eenvoud Flexibiliteit Medium Commitment + Bruggenbouwer! Data Quality: splijtzwam of bruggenbouwer? | 14
    14. 14. Q&A Data Quality: splijtzwam of bruggenbouwer? | 15
    15. 15. Data Quality: ‘Bruggenbouwer!’ Arend Jan Kolthof Senior BI Architect, BI&A E arendjan.kolthof@sogeti.nl T 088-6006600 M 06-46170916 Data Quality: splijtzwam of bruggenbouwer? | 16

    ×