Databeheerinvijf lessen
Kapitaal, arbeidennatuur(delfstoffenen landbouwgrond) geldenals de drie productiefactoren.Daar
moetje tegenwoordigdataaan toevoegen.Grote hoeveelhedengegevensvormeneen
productiefactorzonderweerga.Maardaar moet je wel goedmee omgaan.Marc Goversvan Sogeti
geefteenminicursusdatamanagement.
Goversheeft‘managementconsultant’opzijnvisitekaartjestaan.Hij werktbij de afdelingBusiness
Intelligence&Analytics.Tijdens zijnhele werkzame leven heefthij zoongeveertussendatabasesen
datawarehousesdoorgebracht.De Mr.Data vanSogeti. De term‘data management’,zoonderwijst
hij,isal heel oud.Die stamt uitde jarentachtig vande vorige eeuw.“Hethadtoenveel potentie,
maar is uiteindelijkdestijds nietdoorgedrongentotde standaardinrichtingvan
automatiseringsstructuren.Datdatabeheermislukte,kwameigenlijkomdathet vooral eenIT-feestje
was.Terwijl ditaspectjuistophetbordje vande businesshoortte liggen.Daarwetenze watje kunt
doenmetinformatie.”
Het idee toenwas:je hebtheel veel data,die stopje allemaal bijelkaarineengrote,centrale
database (eendatawarehouse)endanverbindje alle gegevensaanelkaar,zodatje waardevolle
bedrijfsinformatie krijgt.Datisnatuurlijk eenhopelozezaak.Wantteneerste hebje nietalle data
nodigententweede maakje hetbeheervande data opdeze maniergigantischcomplex”,luidt
Govers’vernietigende oordeel.“De belofte wasgroot.Helaasis die destijds nietwaargemaakt.”
Eénkeeropslaan
Tegenwoordigstaathetonderwerpweerbovenaanopde agenda. We sprekenzelfsvanbigdata.In
tegenstellingtotdecenniaterugzitnude marketingafdelingbovenopde dataof de financiële
afdeling.Dataiseencorporate assetgeworden;eenproductiefactor. “Veel banken bijvoorbeeld
zettentegenwoordigdatagerichte dienstverleningin.Daartoe zijnze bezigmethetopzettenvaneen
data-infrastructuur. Dangaathet nietalleenomde technischeinfrastructuur,maarevenzeeromde
functionelearchitectuur:welke datahebje,watkunje ermee doen?Daarbij moetje hetgeheel zo
inrichtendathetheel snel kaninspelenopveranderingen.Wantde businessverandertvoortdurend.
Markten wijzigen,de overhedenstellenandere regelsen consumptiepatronen gaanvoortdurend een
andere richtingop.Daar wil je nietdoorwordenverrast;je wiltdatzienaankomen.Enje wiltweten
of ernieuwe kansenontstaanbij veranderdoverheidsbeleid.De antwoordenvindje indie berg
gegevens;in- enextern.”
De grap vandata is,volgensGovers,datje ze voor meerdere dingenkuntgebruiken.“Alsje mijn
geboortedatumweet,dankunje daar heel veel aanafleiden.Zekeralsje datdan ooknog eens
koppeltaande plekwaarik woon.Je weetwanneerikmetpensioenga,etcetera. Nuzijndie
gegevensvaakopgenomenineendatabase diebij eenbepaaldproceshoort.Zozie je dat
bijvoorbeeldklantgegevensintientallendatabasesvoorkomen;vaaknogeensandersgeformuleerd.
En hetis foutgevoelig.Aande ontdubbelingvangegevenswordtnuhardgewerkt.Datismisschien
wel leséén:zorgdat je gegevensmaaréénkeeropslaat.Zorger tevensvoordatze toegankelijk zijn
voor de businesswanneerdie daarbehoefte aanheeft.”
Verschillende bronnen
Eengoedbeheerbegintmethetinkaart brengenvande verschillende bronnenvoordatadie bij een
organisatie passen.Datbegintmetde interne systemen.Daarkomende dataop hetinternetbij,
zoalsde gigantische hoeveelhedendatavansocial media.Overhedenmoetenvaakaansluitenop
basisregistraties.Endanhebje nogde data vanklanten,vanleveranciersenhunafnemers.“Alsje
daar slimmee omgaat,danbereikje concurrentievoordeel”,isGovers’overtuiging.
Rijkswaterstaatheeftvijfmiljoengeïnvesteerdineendatamanagementproject.“Maardat levert
jaarlijks600 miljoeneuroop”,onderstreepthij hetbelangvangoeddatabeheer. “De CEOvan Shell
mikter tegenwoordigopnieuweolievoorradente vindendoorzijnsystemennate vlooien.Nietdoor
menseneropuitte sturenengeofysischonderzoekte latendoeninhetveld.Nee,dooralle
beschikbare gegevenste analyseren. Doorbijvoorbeeldopeennieuwe manieraante kijkentegen
ooitafgekeurde bronnen.”
Eenander voorbeeldismijnpensioenoverzicht.nl.Doorslimme koppelingvangegevenskaniemand
preciesnagaanhoe heter metzijnpensioenvoorstaat.
Kwaliteit
Het managenvandata betekentzorgdragenvoorde kwaliteitervan, de beschikbaarheidenzorgen
dat data op locatieskomtwaarhetnodigis.“Kernwoordenbij beheerzijn beschikbaarheid,
actualiteit,verrijkingmetgegevensuitexterne bronnen,compleetheidenjuistheid”,steltGovers.
Processenbinnenorganisatiesveranderengeregeld.Maardata zijnvrij stabiel.“Dusalsje dat één
keergoedregelt,danhebje ervrijwel geenomkijkenmeernaar.Goedmodelleren,goed
structurerenengoedopslaan.Daarmee hebje voortientallen jarenplezier.”
Je moetdata aandacht geven.Zowel op corporate niveau(strategischenbeleidsbepalend) als op
operationeel niveau.Datlaatste valtuiteenintwee componenten.Enerzijdservoorzorgendatde
kwaliteitvande datagoedis.Anderzijdseroptoeziendatgegevensdusdanigindatabasesworden
opgeslagendatiedereeninde organisatie dieerbaatbij heeft,toegangheefttotdie gegevens.
Veel organisaties doenergoedaaneerstde kwaliteitvande dataop orde te brengen.Erzijnveel
dubbelingen,enwisselendenoteringenvaneenenhetzelfde object(zoalseennaamof functie).
“Negentigprocentvande organisatiesheefthaardata nietoporde.Die moeteneerstde
rommelzoldermaareensopruimen.Endatgebeurtnuook, wantde business hijgtde IT-afdelingin
de nek.”
Wat is belangrijk?
Het toegankelijk makenvandataisnog helemaal nietzomakkelijk,vindtGovers.Wantde gegevens
zittenopgeslageninlegiodatabasesbinnende ondernemingdie nauwelijks metelkaarte rijmenzijn.
“Dat betekentdatje de data die echtbelangrijkzijnvoorde ondernemingcentraal moetgaanstellen.
In hetonderwijszijngegevensoverleerlingenvandoorslaggevendbelang,maarde dataoverde
luncheszijnhelemaal nietbelangrijkvoorde bedrijfsvoering.Dusmoetje opcorporate niveau
vaststellenwelke datavanbelangzijn.”
Er iseenonderscheidte makeninmasterdata:datzijnde gegevensdie intachtigprocentvande
bedrijfsprocessennodigzijn.Ensecundaire datadie minderbelangrijkzijnendusminderaandacht
behoeven.
“Bij de masterdatakunje nog eenonderscheidmakeninde snelheidwaarmee ze beschikbaarmoet
zijn.Sommige datawil je realtimeweten,andere maareensinde maand.Alsje eeninternetbedrijf
bent,ende klantvultonline eenaanvraagformulierinvooreenproduct,danmoethij directrespons
hebben. Logistiekemedewerkersdaarentegenwillenwetenhoe hetmetde voorradenstaat.Snel
maar realtime inzichtisgeenabsolute must.Dusdatvraagt danweerom eenandere infrastructuur.”
Extra aandacht
“Bij onze klantenzienwe dat ze meerconcurrentievoordeel hebbenmetmeer nuttigeinformatie.Of
dat ze veel efficiënterkunnen werkenzoalsbij de overheid.Daaromhoortdatabeheerechtthuisbij
de business”,constateertGovers.
Eenaspect dat tegenwoordigextraaandachtvraagtbij datamanagementishetfeitdat(veel) datain
de cloudstaan opgeslagen.“Danmoetje dusgoede afsprakenmaken overde kwaliteitsaspectendie
je gewaarborgdwil zien.Denkaantijdigheid,beschikbaarheid. Bovendienhebje danweereen
koppelingextratussenapplicatie endata,terwijl je zoumoetenstrevennaarzominmogelijk
interfaces.Die aspectenmoetje meenemenbij de overwegingomclouddienstenaf te nemen;enbij
de inrichtingvande masterdata managementinfrastructuur.”
[kaderkop]80– 20 regel
[kadertekst]De 80– 20 regel isinveel gevallentoepasbaar.Zoookbij datamanagement. Wantdan
gaat hetom hetbeheervande data die er werkelijktoe doenvoorde bedrijfsvoering.Overhet
algemeenistwintigprocentvande datazinvol voortachtigprocentvan de toepassingenbinneneen
organisatie.
Dat betekentdatslechtstwintigprocentvande data beheernodigheeft,ennietde volle honderd
procentzoalsnu metdatabasesendatawarehouses.
[kaderkop]Kwaliteitseisen
[kadertekst]Erzijnmeerdere aspectendie de kwaliteitvandatabepalen.Tijdigheidisereenvan:hoe
snel moetende gegevensbeschikbaarzijn? Inde online wereldvrijwel altijdreal time.
De beschikbaarheidzelf iseenkwaliteitsaspect:de gegevensmoetengewoonopdie plek
opvraagbaarzijnwaar de organisatie erbehoefteaanheeft.
Juistheidiseenbelangrijkaspect.AlsMarcinde ene database meteen‘c’isopgenomenenineen
andere meteen‘k’,danhebje al problemen.
Compleetheid:klantgegevenszonderhetbankrekeningnummerbijvoorbeeldboetensterkaan
waarde invoor hetbedrijf.
De referentiële integriteitiseenbijzonderkwaliteitsaspect.Hetkomteropneerdataan data is te
zienof hetgoedof foutis.Dat is alleenmogelijkalsde dataincontextstaat.Een modelmatigeopzet
isdan onvermijdelijk.
======================

Data management-interview ManageIT

  • 1.
    Databeheerinvijf lessen Kapitaal, arbeidennatuur(delfstoffenenlandbouwgrond) geldenals de drie productiefactoren.Daar moetje tegenwoordigdataaan toevoegen.Grote hoeveelhedengegevensvormeneen productiefactorzonderweerga.Maardaar moet je wel goedmee omgaan.Marc Goversvan Sogeti geefteenminicursusdatamanagement. Goversheeft‘managementconsultant’opzijnvisitekaartjestaan.Hij werktbij de afdelingBusiness Intelligence&Analytics.Tijdens zijnhele werkzame leven heefthij zoongeveertussendatabasesen datawarehousesdoorgebracht.De Mr.Data vanSogeti. De term‘data management’,zoonderwijst hij,isal heel oud.Die stamt uitde jarentachtig vande vorige eeuw.“Hethadtoenveel potentie, maar is uiteindelijkdestijds nietdoorgedrongentotde standaardinrichtingvan automatiseringsstructuren.Datdatabeheermislukte,kwameigenlijkomdathet vooral eenIT-feestje was.Terwijl ditaspectjuistophetbordje vande businesshoortte liggen.Daarwetenze watje kunt doenmetinformatie.” Het idee toenwas:je hebtheel veel data,die stopje allemaal bijelkaarineengrote,centrale database (eendatawarehouse)endanverbindje alle gegevensaanelkaar,zodatje waardevolle bedrijfsinformatie krijgt.Datisnatuurlijk eenhopelozezaak.Wantteneerste hebje nietalle data nodigententweede maakje hetbeheervande data opdeze maniergigantischcomplex”,luidt Govers’vernietigende oordeel.“De belofte wasgroot.Helaasis die destijds nietwaargemaakt.” Eénkeeropslaan Tegenwoordigstaathetonderwerpweerbovenaanopde agenda. We sprekenzelfsvanbigdata.In tegenstellingtotdecenniaterugzitnude marketingafdelingbovenopde dataof de financiële afdeling.Dataiseencorporate assetgeworden;eenproductiefactor. “Veel banken bijvoorbeeld zettentegenwoordigdatagerichte dienstverleningin.Daartoe zijnze bezigmethetopzettenvaneen data-infrastructuur. Dangaathet nietalleenomde technischeinfrastructuur,maarevenzeeromde functionelearchitectuur:welke datahebje,watkunje ermee doen?Daarbij moetje hetgeheel zo inrichtendathetheel snel kaninspelenopveranderingen.Wantde businessverandertvoortdurend. Markten wijzigen,de overhedenstellenandere regelsen consumptiepatronen gaanvoortdurend een andere richtingop.Daar wil je nietdoorwordenverrast;je wiltdatzienaankomen.Enje wiltweten of ernieuwe kansenontstaanbij veranderdoverheidsbeleid.De antwoordenvindje indie berg gegevens;in- enextern.” De grap vandata is,volgensGovers,datje ze voor meerdere dingenkuntgebruiken.“Alsje mijn geboortedatumweet,dankunje daar heel veel aanafleiden.Zekeralsje datdan ooknog eens koppeltaande plekwaarik woon.Je weetwanneerikmetpensioenga,etcetera. Nuzijndie gegevensvaakopgenomenineendatabase diebij eenbepaaldproceshoort.Zozie je dat bijvoorbeeldklantgegevensintientallendatabasesvoorkomen;vaaknogeensandersgeformuleerd. En hetis foutgevoelig.Aande ontdubbelingvangegevenswordtnuhardgewerkt.Datismisschien wel leséén:zorgdat je gegevensmaaréénkeeropslaat.Zorger tevensvoordatze toegankelijk zijn voor de businesswanneerdie daarbehoefte aanheeft.” Verschillende bronnen Eengoedbeheerbegintmethetinkaart brengenvande verschillende bronnenvoordatadie bij een organisatie passen.Datbegintmetde interne systemen.Daarkomende dataop hetinternetbij, zoalsde gigantische hoeveelhedendatavansocial media.Overhedenmoetenvaakaansluitenop basisregistraties.Endanhebje nogde data vanklanten,vanleveranciersenhunafnemers.“Alsje daar slimmee omgaat,danbereikje concurrentievoordeel”,isGovers’overtuiging. Rijkswaterstaatheeftvijfmiljoengeïnvesteerdineendatamanagementproject.“Maardat levert jaarlijks600 miljoeneuroop”,onderstreepthij hetbelangvangoeddatabeheer. “De CEOvan Shell mikter tegenwoordigopnieuweolievoorradente vindendoorzijnsystemennate vlooien.Nietdoor
  • 2.
    menseneropuitte sturenengeofysischonderzoekte latendoeninhetveld.Nee,dooralle beschikbaregegevenste analyseren. Doorbijvoorbeeldopeennieuwe manieraante kijkentegen ooitafgekeurde bronnen.” Eenander voorbeeldismijnpensioenoverzicht.nl.Doorslimme koppelingvangegevenskaniemand preciesnagaanhoe heter metzijnpensioenvoorstaat. Kwaliteit Het managenvandata betekentzorgdragenvoorde kwaliteitervan, de beschikbaarheidenzorgen dat data op locatieskomtwaarhetnodigis.“Kernwoordenbij beheerzijn beschikbaarheid, actualiteit,verrijkingmetgegevensuitexterne bronnen,compleetheidenjuistheid”,steltGovers. Processenbinnenorganisatiesveranderengeregeld.Maardata zijnvrij stabiel.“Dusalsje dat één keergoedregelt,danhebje ervrijwel geenomkijkenmeernaar.Goedmodelleren,goed structurerenengoedopslaan.Daarmee hebje voortientallen jarenplezier.” Je moetdata aandacht geven.Zowel op corporate niveau(strategischenbeleidsbepalend) als op operationeel niveau.Datlaatste valtuiteenintwee componenten.Enerzijdservoorzorgendatde kwaliteitvande datagoedis.Anderzijdseroptoeziendatgegevensdusdanigindatabasesworden opgeslagendatiedereeninde organisatie dieerbaatbij heeft,toegangheefttotdie gegevens. Veel organisaties doenergoedaaneerstde kwaliteitvande dataop orde te brengen.Erzijnveel dubbelingen,enwisselendenoteringenvaneenenhetzelfde object(zoalseennaamof functie). “Negentigprocentvande organisatiesheefthaardata nietoporde.Die moeteneerstde rommelzoldermaareensopruimen.Endatgebeurtnuook, wantde business hijgtde IT-afdelingin de nek.” Wat is belangrijk? Het toegankelijk makenvandataisnog helemaal nietzomakkelijk,vindtGovers.Wantde gegevens zittenopgeslageninlegiodatabasesbinnende ondernemingdie nauwelijks metelkaarte rijmenzijn. “Dat betekentdatje de data die echtbelangrijkzijnvoorde ondernemingcentraal moetgaanstellen. In hetonderwijszijngegevensoverleerlingenvandoorslaggevendbelang,maarde dataoverde luncheszijnhelemaal nietbelangrijkvoorde bedrijfsvoering.Dusmoetje opcorporate niveau vaststellenwelke datavanbelangzijn.” Er iseenonderscheidte makeninmasterdata:datzijnde gegevensdie intachtigprocentvande bedrijfsprocessennodigzijn.Ensecundaire datadie minderbelangrijkzijnendusminderaandacht behoeven. “Bij de masterdatakunje nog eenonderscheidmakeninde snelheidwaarmee ze beschikbaarmoet zijn.Sommige datawil je realtimeweten,andere maareensinde maand.Alsje eeninternetbedrijf bent,ende klantvultonline eenaanvraagformulierinvooreenproduct,danmoethij directrespons hebben. Logistiekemedewerkersdaarentegenwillenwetenhoe hetmetde voorradenstaat.Snel maar realtime inzichtisgeenabsolute must.Dusdatvraagt danweerom eenandere infrastructuur.” Extra aandacht “Bij onze klantenzienwe dat ze meerconcurrentievoordeel hebbenmetmeer nuttigeinformatie.Of dat ze veel efficiënterkunnen werkenzoalsbij de overheid.Daaromhoortdatabeheerechtthuisbij de business”,constateertGovers. Eenaspect dat tegenwoordigextraaandachtvraagtbij datamanagementishetfeitdat(veel) datain de cloudstaan opgeslagen.“Danmoetje dusgoede afsprakenmaken overde kwaliteitsaspectendie je gewaarborgdwil zien.Denkaantijdigheid,beschikbaarheid. Bovendienhebje danweereen koppelingextratussenapplicatie endata,terwijl je zoumoetenstrevennaarzominmogelijk interfaces.Die aspectenmoetje meenemenbij de overwegingomclouddienstenaf te nemen;enbij de inrichtingvande masterdata managementinfrastructuur.” [kaderkop]80– 20 regel
  • 3.
    [kadertekst]De 80– 20regel isinveel gevallentoepasbaar.Zoookbij datamanagement. Wantdan gaat hetom hetbeheervande data die er werkelijktoe doenvoorde bedrijfsvoering.Overhet algemeenistwintigprocentvande datazinvol voortachtigprocentvan de toepassingenbinneneen organisatie. Dat betekentdatslechtstwintigprocentvande data beheernodigheeft,ennietde volle honderd procentzoalsnu metdatabasesendatawarehouses. [kaderkop]Kwaliteitseisen [kadertekst]Erzijnmeerdere aspectendie de kwaliteitvandatabepalen.Tijdigheidisereenvan:hoe snel moetende gegevensbeschikbaarzijn? Inde online wereldvrijwel altijdreal time. De beschikbaarheidzelf iseenkwaliteitsaspect:de gegevensmoetengewoonopdie plek opvraagbaarzijnwaar de organisatie erbehoefteaanheeft. Juistheidiseenbelangrijkaspect.AlsMarcinde ene database meteen‘c’isopgenomenenineen andere meteen‘k’,danhebje al problemen. Compleetheid:klantgegevenszonderhetbankrekeningnummerbijvoorbeeldboetensterkaan waarde invoor hetbedrijf. De referentiële integriteitiseenbijzonderkwaliteitsaspect.Hetkomteropneerdataan data is te zienof hetgoedof foutis.Dat is alleenmogelijkalsde dataincontextstaat.Een modelmatigeopzet isdan onvermijdelijk. ======================