Big Data is nog steeds een big issue. Ik heb er dan ook redelijk wat aandacht aan besteed in eerdere blogs (bijvoorbeeld: welke data kan interessant zijn en Big Data voor het MKB). Toch is er in de essentie van de zinvolheid van Big Data een zekere verschuiving te onderkennen. Het lijkt me goed om daar in deze blog wat dieper op in te gaan.
In een eerdere blog (“Wat is Big Data?”) stond ik uitgebreid stil bij de term Big Data, zijn oorsprong en huidige interpretatie. Rond de vraag “of we er iets mee moeten” is inmiddels flink wat rijpingstijd verstreken, waardoor een update nodig is.
In twee eerdere blogs (“Wat is Big Data?”) zijn we ingegaan op de vraag wat Big Data is en of je er als manager al iets mee zou moeten. Als je besluit om ook in jouw bedrijf iets te gaan doen met Big Data, dan kom je gelijk bij de vraag: “Moet ik dan ook iets met Data Science?”. Daarom ga ik in deze blog iets dieper in op de relatie tussen Big Data en Data Science.
In vervolg op mijn blog van afgelopen week duiken we nog wat dieper in de strijd die lijkt op te laaien tussen aanhangers van Big Data en aanhangers van data warehouses. Als je dat nog niet gedaan hebt, is het raadzaam om het eerste deel van deze blog eerst even te lezen voordat je aan dit tweede deel begint.
Big Data is nog steeds een big issue. Ik heb er dan ook redelijk wat aandacht aan besteed in eerdere blogs (bijvoorbeeld: welke data kan interessant zijn en Big Data voor het MKB). Toch is er in de essentie van de zinvolheid van Big Data een zekere verschuiving te onderkennen. Het lijkt me goed om daar in deze blog wat dieper op in te gaan.
In een eerdere blog (“Wat is Big Data?”) stond ik uitgebreid stil bij de term Big Data, zijn oorsprong en huidige interpretatie. Rond de vraag “of we er iets mee moeten” is inmiddels flink wat rijpingstijd verstreken, waardoor een update nodig is.
In twee eerdere blogs (“Wat is Big Data?”) zijn we ingegaan op de vraag wat Big Data is en of je er als manager al iets mee zou moeten. Als je besluit om ook in jouw bedrijf iets te gaan doen met Big Data, dan kom je gelijk bij de vraag: “Moet ik dan ook iets met Data Science?”. Daarom ga ik in deze blog iets dieper in op de relatie tussen Big Data en Data Science.
In vervolg op mijn blog van afgelopen week duiken we nog wat dieper in de strijd die lijkt op te laaien tussen aanhangers van Big Data en aanhangers van data warehouses. Als je dat nog niet gedaan hebt, is het raadzaam om het eerste deel van deze blog eerst even te lezen voordat je aan dit tweede deel begint.
Big Data heeft ruimte nodig, meer ruimte dan je gewend bent in je 'normale' BI-omgeving. Met ruimte bedoel ik eerder ademruimte dan opslagruimte. Het gaat bij Big data niet om hoe groot jouw Hadoop-cluster wel niet is ten opzichte van je concurrenten, maar om de manier waarop je met die Big data omgaat. Let me explain.
Presentatie van Nico van der Dussen (Operations manager van de Variass Group) en Koen Kijk in de Vegt (Co-Founder Arkoni).
Uit de inzichten en ervaringen van de digitaliseringsweg bij Variass is er een model ontwikkeld waarvan ook andere mkb-bedrijven profijt kunnen hebben.
In deze blog ga ik wat dieper in op de status van de Big Data inspanningen van de multinationals, wat daar de voor- en nadelen van zijn en wat je daar als MKB-bedrijf van kunt leren.
Tijdens deze webinar deelden wij de ervaringen van alle in het onderzoek onderzochte mkb-maakbedrijven. Ook deelde Peter van Buuren, DGA Van Verheij Mertaal BV zijn ervaringen met de ontwikkeling van de digital twin binnen zijn bedrijf. Bekijk de opname van de webinar via YouTube https://youtu.be/6TFqtc2DMRE
In dit artikel wordt ingegaan op welke ICT-middelen worden ingezet om als Virtual Enterprise goed samen te werken en hoe de ICT-manager zijn beleid hierop kan afstemmen. Maar eerst wordt het begrip Virtual Enterprise nader bekeken.
Op dit moment zijn er in veel organisaties al duidelijke kenmerken zichtbaar van Virtual Enterprise en menige organisatie is ongemerkt al bezig te transformeren. Deze ontwikkeling zien we in alle branches terug. Tussen organisaties gebeurt dit in samenwerkingsverbanden, in- en out-sourcing en strategische allianties. Binnen organisaties is dit te zien in virtuele teams, externe resources en tijdelijke assignments.
Om de hele organisatie te kunnen voorzien van goede managementinformatie heb je gekozen voor een ‘centrale’ aanpak. Dat wil zeggen, je hebt alle BI-omgevingen en hun data warehouses geïntegreerd in één enkel data warehouse in één enkele BI-omgeving. Daarmee heb je alle brondata op één plek en kan de interpretatie van die brondata weinig verschillen. Een streefwaardige situatie, maar toch kan deze situatie signalen vertonen die aangeven dat een nieuwe groeistap nodig is.
White paper: Starten met Data Science in de Supply ChainMarcel Merkx
Wij verzamelen meer en meer data, maar wat doen we ermee? Data Science vertaalt data in nieuwe inzichten die leiden tot betere beslissingen en uiteindelijk betere resultaten. Ook op het gebied van transport, warehousing, voorraadbeheer en Supply Chain management biedt Data Science grote kansen. Wat zijn de mogelijkheden en de uitdagingen? En hoe kunnen we de kansen verzilveren?
Dit document is een eerste aanzet tot het verzilveren van de kansen die data biedt voor logistieke bedrijven in Brabant.
Dit is een presentatie die u wat meer kan vertellen over Knowledge Graphs. Wat het precies is, hoe een Knowledge Graph werkt, verschillende bedrijfstoepassingen,...
Summary of Multi Client study on Big Data in the Netherlands
combining end-user perceptions of medium and large organizations and vendor product/market strategies.
Praktijkvoordelen digital twin komen binnen handbereikDWA
De meeste gebouweigenaren denken er
nog niet over na en degenen die er wel aan
denken, weten vaak niet goed hoe of wat
ze exact moeten doen. Het creëren, maar
vooral het gebruiken van een digital twin
is nog lang geen abc’tje. Toch zijn de voordelen
– zeker in potentie – bijzonder groot
en de eerste ‘bewijzen’ daarvoor worden nu
ook zichtbaar. Bijvoorbeeld in het kantoor
van adviesbureau DWA in Gouda, waar de
digital twin helpt bij het optimaliseren van
het comfort en binnenklimaat.
MWG Big Data & Media - Stef van Grieken (Het Nieuwe Stemmen)MWG verbindt media
De MWG organiseerde op dinsdag 20 november 2012 in CoolBrands House in Amsterdam een kennis- en inspiratiesessie rondom het thema Big Data. Wat is het en wat zijn de trends? Big Data wordt ook in de media-industrie ongetwijfeld een big issue.
Moderator: John Faasse (Uitbijter). Sprekers: Marjolijn Kamphuis (Medeoprichter en CEO Foodzy.com/Eigenaar OKGO), Stef van Grieken (Voorzitter Het Nieuwe Stemmen), Nick North (Global lead media GfK UK), Stephan Noller (CEO nugg.ad), Mervyn Brookson (Manager Business Information & Performance UM).
Moderne marketing, met kenmerken als ‘customer-centric’, ‘inbound’, ‘content’ en ‘multi-channel’, lijkt vaak direct gekoppeld te worden aan Big Data. Maar is dat wel zo?
Big Data heeft ruimte nodig, meer ruimte dan je gewend bent in je 'normale' BI-omgeving. Met ruimte bedoel ik eerder ademruimte dan opslagruimte. Het gaat bij Big data niet om hoe groot jouw Hadoop-cluster wel niet is ten opzichte van je concurrenten, maar om de manier waarop je met die Big data omgaat. Let me explain.
Presentatie van Nico van der Dussen (Operations manager van de Variass Group) en Koen Kijk in de Vegt (Co-Founder Arkoni).
Uit de inzichten en ervaringen van de digitaliseringsweg bij Variass is er een model ontwikkeld waarvan ook andere mkb-bedrijven profijt kunnen hebben.
In deze blog ga ik wat dieper in op de status van de Big Data inspanningen van de multinationals, wat daar de voor- en nadelen van zijn en wat je daar als MKB-bedrijf van kunt leren.
Tijdens deze webinar deelden wij de ervaringen van alle in het onderzoek onderzochte mkb-maakbedrijven. Ook deelde Peter van Buuren, DGA Van Verheij Mertaal BV zijn ervaringen met de ontwikkeling van de digital twin binnen zijn bedrijf. Bekijk de opname van de webinar via YouTube https://youtu.be/6TFqtc2DMRE
In dit artikel wordt ingegaan op welke ICT-middelen worden ingezet om als Virtual Enterprise goed samen te werken en hoe de ICT-manager zijn beleid hierop kan afstemmen. Maar eerst wordt het begrip Virtual Enterprise nader bekeken.
Op dit moment zijn er in veel organisaties al duidelijke kenmerken zichtbaar van Virtual Enterprise en menige organisatie is ongemerkt al bezig te transformeren. Deze ontwikkeling zien we in alle branches terug. Tussen organisaties gebeurt dit in samenwerkingsverbanden, in- en out-sourcing en strategische allianties. Binnen organisaties is dit te zien in virtuele teams, externe resources en tijdelijke assignments.
Om de hele organisatie te kunnen voorzien van goede managementinformatie heb je gekozen voor een ‘centrale’ aanpak. Dat wil zeggen, je hebt alle BI-omgevingen en hun data warehouses geïntegreerd in één enkel data warehouse in één enkele BI-omgeving. Daarmee heb je alle brondata op één plek en kan de interpretatie van die brondata weinig verschillen. Een streefwaardige situatie, maar toch kan deze situatie signalen vertonen die aangeven dat een nieuwe groeistap nodig is.
White paper: Starten met Data Science in de Supply ChainMarcel Merkx
Wij verzamelen meer en meer data, maar wat doen we ermee? Data Science vertaalt data in nieuwe inzichten die leiden tot betere beslissingen en uiteindelijk betere resultaten. Ook op het gebied van transport, warehousing, voorraadbeheer en Supply Chain management biedt Data Science grote kansen. Wat zijn de mogelijkheden en de uitdagingen? En hoe kunnen we de kansen verzilveren?
Dit document is een eerste aanzet tot het verzilveren van de kansen die data biedt voor logistieke bedrijven in Brabant.
Dit is een presentatie die u wat meer kan vertellen over Knowledge Graphs. Wat het precies is, hoe een Knowledge Graph werkt, verschillende bedrijfstoepassingen,...
Summary of Multi Client study on Big Data in the Netherlands
combining end-user perceptions of medium and large organizations and vendor product/market strategies.
Praktijkvoordelen digital twin komen binnen handbereikDWA
De meeste gebouweigenaren denken er
nog niet over na en degenen die er wel aan
denken, weten vaak niet goed hoe of wat
ze exact moeten doen. Het creëren, maar
vooral het gebruiken van een digital twin
is nog lang geen abc’tje. Toch zijn de voordelen
– zeker in potentie – bijzonder groot
en de eerste ‘bewijzen’ daarvoor worden nu
ook zichtbaar. Bijvoorbeeld in het kantoor
van adviesbureau DWA in Gouda, waar de
digital twin helpt bij het optimaliseren van
het comfort en binnenklimaat.
MWG Big Data & Media - Stef van Grieken (Het Nieuwe Stemmen)MWG verbindt media
De MWG organiseerde op dinsdag 20 november 2012 in CoolBrands House in Amsterdam een kennis- en inspiratiesessie rondom het thema Big Data. Wat is het en wat zijn de trends? Big Data wordt ook in de media-industrie ongetwijfeld een big issue.
Moderator: John Faasse (Uitbijter). Sprekers: Marjolijn Kamphuis (Medeoprichter en CEO Foodzy.com/Eigenaar OKGO), Stef van Grieken (Voorzitter Het Nieuwe Stemmen), Nick North (Global lead media GfK UK), Stephan Noller (CEO nugg.ad), Mervyn Brookson (Manager Business Information & Performance UM).
Moderne marketing, met kenmerken als ‘customer-centric’, ‘inbound’, ‘content’ en ‘multi-channel’, lijkt vaak direct gekoppeld te worden aan Big Data. Maar is dat wel zo?
Software als enabler voor slimmer ondernemen in de KMOAlex Dossche
Ondernemen in een uitdagende en disruptieve markt is niet eenvoudig. In deze presentatie tonen we wat SMAC is, hoe het ook uw business zal beïnvloeden en hoe je door een doordacht inzetten van software ook mee kan profiteren van een tijdperk waarin software de enabler, het middel, wordt om slimmer te ondernemen in de KMO
Big, Smart, Small, Good, Usable, en zelfs Dark data: allemaal buzzwords die ons de laatste jaren om de oren vlogen. Het lijkt wel alsof iedereen onmiddellijk aan de slag moet met de in de diepste kerkers verborgen data en hier met zekerheid ongelooflijke voordelen uit zal halen. De realiteit? Die ligt toch nét iets anders.
Studie: The Past, Present and Future of Information ManagementLexisNexis Benelux
Internationaal onderzoek over het verleden, heden en de toekomst van #informatiemanagement.
Het vakgebied ondergaat veranderingen door technologische ontwikkelingen, toename in informatie, big data en sociale netwerken. De rol van de #informatiemanager verandert daardoor.
Deze whitepaper gebaseerd op interviews met senior informatiespecialisten, gecombineerd met Europees onderzoek onder meer dan 500 mensen uit het informatievak.
Pres Synthetron Engagement And Change , 8.2009.JcSynthetron
illustrates how social brainstorm by Synthetron to reinforce and accelerate the change journey by efficiently engaging the relevant internal stakeholders in feedback and reflection on the change process from their viewpoint.
Om de hele organisatie te kunnen voorzien van goede managementinformatie heb je inmiddels een zeer uitgebreide en uiterst professionele BI-omgeving opgezet: het ‘Enterprise Data Warehouse (EDW)’. Hierin heb je alle BI-omgevingen en hun data warehouses geïntegreerd. Alles in één enkel data warehouse in één enkele BI-omgeving. Alle bedrijfsdata binnen jouw organisatie wordt realtime als brondata in jouw EDW geladen. Er is geen enkele verwarring over terminologie, want het Enterprise Datamodel (EDM) definieert alle begrippen en relateert alle data aan elkaar. Je kunt makkelijk nieuwe dashboards maken, want alle bedrijfsdata is toch al beschikbaar gemaakt in het EDW. Wat kan hier nog misgaan?
Ik ben achter de tekentafel gaan zitten om een plaat te maken die de plekken van samenwerking tussen de ‘drukke, rumoerige’ research kant en de ‘rustig zoemende’ dataproductie kant weergeeft. Deze afbeelding wordt in deze blog nader toegelicht.
Trends in architecture ("De Master Spreekt", HU, 2014)Bas van Gils
More and more organizations turn to their architects to achieve business results. Agility, capabilty based planning, and data(management) are increasingly important. These slides are from the event "de master spreekt" at Hogeschool Utrecht from my public lecture in april 2014
Similar to 11. Wat is Big Data? En moeten we er wat mee? (20)
“Ik dacht dat het af was! Nu moet ik nóg €20.000 investeren om het netjes te maken?”
Wie bovenstaande uitspraak herkent, kan misschien wel een lesje ‘verwachtingsmanagement’ gebruiken. Blijkbaar was het voor de opdrachtgever niet helemaal duidelijk wat hij als eindproduct zou krijgen. Bovendien valt het eindproduct tegen, want hij moet flink extra investeren. De Definition of Done (D.o.D.) kan helpen om de transparantie in een ontwikkelproces te bevorderen. Hoe dat werkt en hoe je een D.o.D. opstelt, vertel ik in deze blog.
Er is nog geen uitsluitsel binnen de architectuur gemeenschap over het gebruik van de termen Business Architecture (Bedrijfsarchitectuur) en Enterprise Architecture. Is dit hetzelfde? Is het één onderdeel van het ander?d
Er zijn tegenwoordig al aardig wat Marketing Automation tools (MA-tools) op de markt. In deze blog ga ik de MA-tools voor de ‘niet multinationals’ bekijken.
In vorige blogs heb ik nader toegelicht wat data science is en hoe het voor marketing waardevol kan zijn. Ook heb ik de rol van de data scientist, het proces van data science en de databronnen voor data science wat nader beschreven.
Wat voor activiteiten gaat de data scientist - zoals ik die vorige week heb beschreven - nu eigenlijk uitvoeren? Welke proces wordt er typisch binnen data science uitgevoerd?
Als vervolg op de introductie blog over Data Science binnen Marketing heb ik het deze keer over de functie van data scientist. Wat typeert een data scientist binnen het vakgebied marketing? Welke kwaliteiten heeft hij?
Moderne marketing heeft steeds snellere ICT nodig. Maar dat geldt gelukkig niet voor alle processen. Vaak maak ik hiervoor onderscheid tussen de real-time marketing cyclus en de periodieke cyclus. In deze blog ga ik dieper in op deze twee cycli en hun functies.
Marketing en data science worden steeds vaker in één adem genoemd. Daarom lijkt het mij goed om het onderwerp data science - bekeken vanuit de marketing-discipline - eens wat nader te beschrijven in deze no-nonsense blogreeks over Marketing Intelligence. Ik begin daarom maar met een introductie van het begrip zelf.
Klantgegevens zijn waardevol voor Marketing. Des te meer kennis je krijgt over jouw klanten en prospects, des te beter kun je hun wensen en gedrag voorspellen. Maar klantgegevens zijn ook vluchtig, moeilijk te vangen. In dit blog meer uitleg hierover.
Het implementeren van de technologie voor Inbound Marketing lijkt een ‘mer à boire’ met snel uit de hand lopende kosten. Zeker voor kleine en middelgrote bedrijven (typisch tussen de 20 en 2.500 medewerkers). Dat hoeft echter niet zo te zijn. Met de huidige mogelijkheden in de cloud (software as a service, SaaS) zijn ook voor het MKB goed functionerende en goed schaalbare oplossingen beschikbaar. In deze blog ga ik hier wat verder op in en laat wat voorbeelden zien.
Duidelijkheid over wat er aan de processen en verantwoordelijkheden binnen de marketingfunctie moet veranderen, voorkomt desinvesteringen door het falen van aangekochte moderne en soms dure marketingsoftware. Daarom starten we deze blogreeks aan de basis, met het meest heikele punt: de organisatie.
Een modern bedrijf speelt in op de ‘customer journey’ door rekening te houden met het bezoekersgedrag. Maar dat kan Marketing niet alleen. Er moet een goede samenwerking tussen Kanalen, Verkoop en Marketing tot stand komen. Niet alleen technisch, maar ook organisatorisch. In deze blog geef ik de hoofdlijnen voor de technische samenwerking. In een volgend blog zal ik de organisatorische samenwerking bespreken.
Als een klant op eigen initiatief contact opneemt met jouw organisatie moeten alle disciplines samenwerken om de klant of prospect dit contact als prettig en behulpzaam te laten beleven. Daarbij moet die beleving zo consistent mogelijk zijn over de kanalen heen. Om die consistentie te bevorderen is het handig om een soort ‘standaard klantcontact model’ te hanteren. Hiermee maken we de onderdelen van een klantcontact zo kanaal-onafhankelijk mogelijk en kan het marketing- en verkoopproces (en dus de klantbeleving) consistenter worden over alle kanalen.
Net als voor zoveel ICT geldt, is het ook voor Marketing Intelligence belangrijk om een gedegen toolkeuze uit te voeren. Spring niet gelijk met de eerste de beste softwareleverancier in bed, maar overweeg verschillende opties. Behalve dat elke tool bepaalde sterktes en zwaktes kent, moet je er vooral op letten dat een tool past binnen jouw bedrijf en in je bestaande applicatielandschap. Zoals eerder gezegd moeten de systemen voor kanalen, sales en marketing naadloos met elkaar communiceren om een goed commercieel inbound proces te faciliteren.
Moderne marketing met kenmerken als ‘customer-centric’, ‘inbound’, ‘content’ en ‘multi-channel’, is niet zomaar geïmplementeerd. In deze blog zet ik de belangrijkste uitdagingen die moderne marketers tegenkomen even achter elkaar. Dus, in één simpel rijtje, de vijf belangrijkste aandachtsgebieden bij het veranderen van jouw marketingdiscipline naar de moderne leest. Drie voor business en twee voor IT. En hoe ze aan te pakken, natuurlijk.
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
11. Wat is Big Data? En moeten we er wat mee?
1. Wat is Big Data? En
moeten we er wat mee?
Door: Gerrit Versteeg
2. Wat is Big Data? En moeten we er wat mee?
Pg, 2
Er is veel te doen over Big Data. Als manager krijg je bijna een schuldgevoel als je de veelal
groots uitgewerkte, welhaast onweerlegbare voordelen niet direct gaat gebruiken binnen jouw
organisatie. Big Data is een populair begrip, ondanks of misschien juist dankzij de heersende
onduidelijkheid rond de definitie van de term. Om te kijken of Big Data iets voor jou als manager
kan betekenen, is het toch van pregnant belang om een goed beeld te hebben van wat de term
Big Data nu allemaal behelst. In dit artikel gaan we daarom enkele veel gebruikte definities wat
verder ontleden, om zo te komen tot een context waarbinnen we beter kunnen besluiten of we
wel of niet moeten gaan investeren in dit nieuwe fenomeen.
ICT research company, Gartner
Wie de term Big Data als eerste gebruikte is ongetwijfeld ook onderwerp van discussie, maar de
oudste bron die ik kon vinden is een bijdrage door Doug Laney (Gartner) uit 2001. Hij
introduceerde de drie eerste V’s (Volume, Velocity en Variety) als handvat bij de kwantificering
van Big Data. Inmiddels (2011) heeft Gartner deze begrippen onderdeel gemaakt van een meer
integrale kijk op wat zij noemen “extreme information management (EIM)”.
3. Wat is Big Data? En moeten we er wat mee?
Pg, 3
Hierbij worden een 12-tal facetten of invalshoeken
genoemd die komen kijken bij het besturen van jouw
informatie infrastructuur (voor de volledigheid hiernaast
opgesomd in het tekstvak). Helaas is het acroniem EIM al
eerder gebruikt voor Enterprise Information
Management, maar desondanks associeert de term wel
beter met de werkelijkheid dan Big Data.
De definitie die Gartner bij Big Data hanteert luidt als
volgt (in het Engels om verdere spraakverwarring te
vermijden): “Big data is high-volume, -velocity and -
variety information assets that demand cost-effective,
innovative forms of information processing for enhanced
insight and decision making”. Hierbij merkt Gartner op,
dat het zeker niet alleen gaat om die drie V’s, maar
vooral ook om de twee daaropvolgende onderdelen van hun definitie.
4. Wat is Big Data? En moeten we er wat mee?
Pg, 4
ICT supplier, IBM
IBM geeft in haar lezenswaardige boekje “Harness the power of Big Data” ook aan dat niemand
in ICT gelukkig is met de term Big Data en de definitie ervan. IBM’s Research manager Matt
Aslett gebruikt dan ook liever een definitie die zijns inziens bijna universeel geaccepteerd is,
namelijk: “Big Data…. refers to the realization of greater business intelligence by storing,
processing and analyzing data that was previously ignored due to limitations of traditional data
management technologies”. Waarbij de “limitations” worden gedefinieerd door combinaties van
de V’s, veelal in ieder geval “Volume”, “Velocity” en “Variety”, terwijl de auteurs van het boekje
daar zelf graag nog “Veracity” aan toevoegen.
ICT supplier, Oracle
Oracle gebruikt naar ons weten geen directe definitie, maar typeert Big Data door middel van
een viertal karakteristieke V’s, namelijk “Volume”, Velocity”, Variety” en “Value”, die
gezamenlijk moeten optreden. Volume alleen is dus niet genoeg om over Big Data te kunnen
spreken. “Value” wordt genoemd, omdat de wijze waarop de waarde wordt ontdekt (een steeds
verfijnder modelleerproces), een unieke eigenschap van Big Data zou zijn.
5. Wat is Big Data? En moeten we er wat mee?
Pg, 5
Management consultancy, McKinsey
McKinsey Global Institute gebruikt de definitie “Big Data refers to datasets whose size is beyond
the ability of typical database software tools to capture, store, manage, and analyze”. Zij
hanteren als onderscheidend criterium dus vooral het volume van de data in relatie tot de
beschikbare verwerkingstools (per sector), maar laten expres vrij wat dat volume precies is. Dit
doen zij omdat de tools en technieken steeds beter worden waardoor die grens ook steeds kan
opschuiven naarmate de tijd voortgaat.
Naast de voorbeelden hierboven bestaan er nog vele varianten van definities, maar die zullen we
je besparen omdat we dan toch in wat nodeloze herhaling gaan vervallen. Het moge duidelijk
zijn dat er grote verschillen bestaan, maar toch ook regelmatigheden zichtbaar zijn. Om het
overzicht compleet te maken voordat we naar een conclusie gaan, verwijzen we graag even naar
een handig overzicht van veel gehanteerde V’s en hun bron, dat we hier in verband met de
leesbaarheid niet hebben opgenomen. Geen artikel over Big Data zonder de V’s, nietwaar?
6. Wat is Big Data? En moeten we er wat mee?
Pg, 6
De definities beoordeeld
Het gebruik van V-woorden in de definities. Big Data als term leidt bijna automatisch tot de
associatie dat het vooral gaat om “veel” data. Die term is dus intrinsiek verraderlijk want we zijn
het er allemaal wel over eens dat het niet alleen om volume gaat. Naast de oorspronkelijke drie
V’s: Volume, Velocity en Variety, duiken er ook nog eens constant nieuwe V’s op, met als meest
genoemde toch wel “Veracity”. Even nog los van het aantal V’s; het is volstrekt onduidelijk
wanneer die V’s leiden tot de classificatie van Big Data. Alleen “Volume” is in ieder geval niet
afdoende volgens de meeste interpretoren (misschien met uitzondering van McKinsey). Er moet
ook “Variety” en “Velocity” aanwezig zijn en alles overziend wellicht ook “Veracity”. Maar in
welke mate die V’s aanwezig moeten zijn of hoe we die V’s uiteindelijk meten en waarderen om
tot een classificatie van Big Data te komen, is ook nog apert onduidelijk.
7. Wat is Big Data? En moeten we er wat mee?
Pg, 7
De verwerkingsproblemen als onderdeel van de definitie
De definities beschouwend is er wel een brede consensus over het feit dat nieuwe, geavanceerde
dataverwerkings-, dataopslag- en analyse-technieken nodig zijn bij zoiets als Big Data. Het
vervelende van dit soort definitie-onderdelen is dat zij niet exclusief zijn voor Big Data, waarbij
ook nog eens kan worden verwacht dat die technieken over vijf jaar weer gemeengoed zijn. De
definitie volgend, zou er dan over vijf jaar dus wellicht helemaal geen sprake meer zijn van Big
Data.
Het doel als onderdeel van de definitie
Tevens verwacht men van Big Data dat het nieuwe inzichten en een verbeterde besluitvorming
zal opleveren. In feite overeenkomend met het V-woord “Value”. Ook hier is sprake van niet-
exclusiviteit voor Big Data. Alle nieuw aangeboorde en ontsloten data-bronnen (kunnen) leiden
tot meer inzicht en mogelijk bredere besluitvorming.
Met andere woorden, de definities kunnen niet of nauwelijks ter classificatie dienen. Terug naar
het nut van Big Data en de basisvraag: wanneer wordt het interessant voor een manager om
erin te investeren?
8. Wat is Big Data? En moeten we er wat mee?
Pg, 8
Conclusie
Waar komt het met Big Data nu eigenlijk op neer? Al jarenlang gebruiken we onze traditionele,
vaak transactionele databronnen om management-informatie te genereren in onze BI-omgeving.
Tegenwoordig krijgen we steeds meer de mogelijkheid om data uit nieuwe bronnen te
verkrijgen, zoals:
sentimenten vanuit de vaak genoemde sociale media (Blogs, Twitter, Facebook);
proces-events vanuit sensoren in interne processen (via logs of de Enterprise Service Bus)
of externe processen (“The Internet of Things”).
Deze data is granulair van aard en daarom vaak volumineus (Volume), a-periodiek van aard
(Velocity) en daarnaast gevarieerd qua inhoud en structuur (Variety). Deze karakteristieken
maken het best lastig om die data te verwerken. Hierdoor laten veel organisaties het afweten
om deze data, voor zover ze de data al ter beschikking hebben, te integreren in hun
management rapportages. Moderne opslag- en analysetechnieken brengen die data echter
makkelijker binnen bereik.
9. Wat is Big Data? En moeten we er wat mee?
Pg, 9
Deze data kan een welkome aanvulling zijn om onze Management Informatie mee te verrijken,
maar niet per definitie! Onderzoek naar de waarde van de investeringen om die additionele
informatie voor de betrokken organisatie te ontsluiten en gebruiken, is belangrijk. Je zou het
kunnen vergelijken met het zoeken naar een waardevolle naald in een hooiberg: gemeten
sentimenten kunnen jouw multi-channel marketing-discipline helpen bij het vaststellen van het
effect van een marketingcampagne via televisie of e-mail. Voor de procesmanagement-discipline
zou directe informatie uit de loop van het bedrijfsproces kunnen worden verwerkt om zo te
kijken waar de bottlenecks zitten in een E2E-bedrijfsproces en wat er aan verbeterd kan worden.
Deze voorbeelden worden vaker genoemd in verband met Big Data, maar net als voor elke
investering geldt: ben je er aan toe om Big Data te ontsluiten ook qua interne
organisatie(volwassenheid)? Is jouw BI-afdeling, zelfs zonder Big Data, niet al een ‘drama’ dat
eerst moet worden aangepakt? Zijn er goedkopere databron-alternatieven die misschien niet het
volmaakte detail weergeven, maar wel de situatie in wat bredere zin duidelijk kunnen maken
waardoor het management ook prima aan de slag kan?
10. Wat is Big Data? En moeten we er wat mee?
Pg, 10
Misschien is het meest betekenisvolle wel dat in de meeste definities van Big Data wordt
aangegeven dat het gaat om data die verwerkt moet worden met geavanceerde, moderne
technieken. Uit ervaring weten managers echter dat een bleeding-edge technologie meestal duur
is en vaak kinderziektes kent. Qua status van het werkveld begreep ik tijdens de laatste DAMA
conferentie (Turkey chapter, Istanbul, maart 2013) dat de succesverhalen van dit moment
alleen Big Data oplossingen betreffen met maar één zogeheten “data-point”. Dat wil zeggen: er
zijn dus nog geen succesverhalen bekend over het integreren van Big Data met meerdere
datatypen.
Kortom, tenzij jouw organisatie ofwel direct afhankelijk is van het gebruik van moderne
technologie (bijvoorbeeld een organisatie gebaseerd op de waarde-drijver “Product-Innovation”)
of als “early adapter” gewend is om altijd voorop te staan met het gebruik van de nieuwste
technologie, is het wellicht geboden om heel precies te duiden waar je de waarde zoekt en dan
zo eenvoudig mogelijk een start te maken met het ontsluiten van dat soort bronnen of….
misschien gewoon nog even de kat uit de boom te kijken?
11. Wat is Big Data? En moeten we er wat mee?
Pg, 11
Ga naar onze knowledge base voor meer informatie:
Dit blogartikel is geschreven door Gerrit Versteeg.
Wil je meer informatie? Neem dan een kijkje op ons blog.