Sogeti BI Symposium 2013

De Toekomst Van Data

FutureFlock Consulting | Bart Götte
The Future of Data

Our Past: Numeric Data to be Controlled

Mean

Representativity

Stability

Statistical Significance

...
The Future of Data

Our Past: Data is to be Controlled
The Future of Data

Our Past: Data is to be Controlled
The Future of Data

Our Current Insight
The Future of Data

Our Current Insight
The Future of Data

Image Mining
The Future of Data

Image Mining: 5 Basics

Content
Analyse

Visuele
Analyse

Contextuele
Informatie

Bron
Informatie
Tech...
The Future of Data

Image Mining: Etnografie
The Future of Data

Image Mining: Etnografie
The Future of Data

Image Mining | Pinterest

Branding: Sogeti
The Future of Data

Image Mining | Pinterest

Productsoort: Kaas
The Future of Data

Image Mining | Pinterest

Kernwaarde: Vertrouwen
The Future of Data

Big Data: Bright Mining
Inzicht

Foresight

(Big) Image Mining

(Big) Text Mining

(Big) Number Mining...
The Future of Data

Big Data: Bright Analysis!

‘Waarheid’: Wat

‘Waarde’: Waarom
The Future of Data

Big Data: Big Challenge!
Big Data > Het toevoegen van nieuwe data dimensies
Cijfers
Tekst
Beeld
B...
Sogeti BI Symposium 2013

De Toekomst Van Data is “Changing Your Game”

www.futureflock.nl | Bart Götte
Upcoming SlideShare
Loading in …5
×

FutureFlock Consulting - De toekomst van data - Bart Götte

427 views
295 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
427
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Zo aan het eind van een intensieve twee-daags event over Business intelligence, is het een eer om af te sluiten met een blik op de toekomst. De toekomst van Data. Big Data en Beyond. En ik richt me daarbij vooral op marketing & data; of liever gezegd, mensen en data.
  • Maar voordat we een blik in de toekomst werpen is het goed even stil te staan bij het verleden. Pas in het jaar 2038 vieren we de 100ste verjaardag van de computer. De computer die in 1938 door Konrad Zuse werd uitgevonden. Wat is dat hard gegaan. De ontwikkeling van de computer is niet los te zien van de ontwikkeling van de statistiek. De business intelligence zoals we die kennen vandaag te dag is gebouwd op basis begrippen als gemiddelde, standaard awfijking en representativiteit. We zijn opgeleid in de wereld van analyse waarin signigficantie en betrouwbaarheidsintervallen en cronbachs alpha’s maatgevend zijn geworden. En om dat te bereiken hebben we data ‘gemanaged en gemanipuleerd’. Vreemde vogels die niet passen in het plaatje noemen we uitbijters, en negeren we vakkundg. Op deze wijze zodat we een situatie van stabiliteit bereiken en we met data ‘voorspelbaar’ kunnen zijn. Niet voor niks wordt statistiek ook wel de kunst van het beinvloeden genoemd. We creeren een waarheid die slechts een klein stukje van het geheel is.
  • Data is fijn als het gecontroleerd kan zijn. Schone data, daar houden we van.
  • Want juist in schone data, zijn heldere patronen te ontdekken. Patronen die ons eenvoud geven, en richting bieden. Het geeft ons houvast als bakens uit het verleden waarmee we naar de toekomst kunnen sturen.
    Maar in de laatste tien jaar roept deze aanpak steeds meer vragen op. Want de verleiding is groot en de druk hoog om uitbijters te negeren. En waar blijven dan de hoogvliegers die plotseling opdoemen op momenten dat je het niet verwacht, de afwijkende vogels die liever hun kop in het zand steken, de paradijsvogels in onze maatschappij die een ander deuntje fluiten, en de social weavers…?
  • Social weavers ja, wij, burgers die in onze rol als medewerker, klant, vriend, familielid met elkaar converseren en in de afgelopen tien jaar een nieuwe dimensie hebben gegeven aan ‘data analyse’. Want waar we voorheen data-analyse bouwden op basis van numerieke informatie, is met de ontwikeling van social media een nieuwe vorm van data ontstaan die massaal is vast te leggen en een veel grotere rijkheid aan íntelligentie’ herbergt: Tekst.
    Met onze digitale verspreiding van teksten, ontstaan nieuwe uitdagingen voor business intelligence. Dat het nieuwe uitdagingen zijn blijkt wel uit onze eerste reactie omtrent textanalyse: Aan de slag met word clouds waarin we simpel frequenties tellen, om vervolgens te duiken in sentimentanalyse waarin we tekstfragmenten ‘taggen’als positief, negatief of neutraal…om daar vervolgens een cijfer van te maken. Want met metrics kunnen we goed uit de voeten. Dat we daarmee de enorme rijkheid die tekst herbergt er vakkundig uit ventileren… Daar is het negeren van uitbijters niks bij.
    En dus wordt momenteel in vele kennisinstituten gewerkt aan nieuwe analyse technieken gebaseerd op tekst. Tekstanalyse op basis van clusters is daar het eerste product van. En ook de sentimentanalyse wordt verder fijngeslepen om niet alleen uistrpaken te kunnen doen of een emotie positief, of negatief is, maar om ook grip te krijgen op van welk van de zeven emoties er sprake is in tekstuitingen.
    Maar met de toevoeging van tekst verandert er ook fundamenteel iets in de wijze waarop we naar data kijken. De databeschikbaarheid neemt niet alleen toe, maar krijgt ook een nieuwe dimensie. En daarmee verandert ons perspectief over ‘juiste data’. Juiste data predikt niet langer de boodschap van waarheid op basis van gecontrolleerde research designs en representatieve steekproeven. Nee, onze houding ten opzichte van datanalyse verschuift van juist naar minder fout. Een totaal ander perspectief zullen we moeten hanteren door de enorme stroom aan real time data die naar ons toekomt.
    Een boodschap die Nassim Taleb in zijn boek “black Swan” helder en illustratief verwoord.
  • Ter illustratie toon ik u een aardig voorbeeld dat mij de ogen opende in 2010 toen ik samen met een aantal slimme collega’s bij MarketResponse de eerste stappen zette op het gebeid van tekst mining.
  • Maar waar we vandaag de dag nast cijfers, tekst ontdekken als nieuwe datadimensie, doet de volgende dimensie al van zich spreken. Van Data mining en tekst mining is de logische volgende stap ‘image mining’. En ja, ook hier is het platform social media een belangrijke driver. Want waar social media begon met het uitwisselen van teksten, zien we nu dat op steeds meer social media platformen de focus verschuift naar van tekst naar beeld. Teksten worden korter, en dienen steeds vaker als toelichting op beeldmateriaal dat in omvang toeneemt. En zoals u allemaal weet, een beeld zegt meer dan duizend woorden. En daar ligt de volgende grote uitdaging: hoe analyseer je beeld?
  • Content Analysis
    What do you see? (en zie je niet?)
    What is the image about?
    Are there people in the image? What are they doing? How are they represented?
    Can the image be looked at different ways?
    How effective is the image as a visual image?
    Visual Analysis
    How is teh image composed? What’s in the background? What’s in teh foreground?
    What are the most important visual elements in the image? How can yiu tell?
    How is color used?
    Can the image be looked at different ways?
    What meanings are conveyed by design choices?
    Contextual Information
    What information accompanies the image?
    Does the tekst change how you see the image? How?
    Is the textual information intended to be factual and inform, or is it intended to influence what and how you see it?
    What kind of context does the information provide? Does it answer teh questions Where, How, Why and for Whom the image was made?
    Image Source
    Where did we find the image?
    What information does the source provide about the origins of the image?
    Is teh source reliable and trustworthy?
    Was the image found in an image database, or was it being used in antither context to convey meaning?
    Technical Quality
    Is the image large enough to suit your purpose?
    Are the color, loght and balance true?
    Is the image a quality digital image, without pixelation or distortion?
    Is the image in a file format yo can use?
    Are there copyright or other user restrictionds you need to consider?
    http://guides.lib.washington.edu/content.php?pid=56693&sid=520121
  • Met alle data die op ons af komt ligt er een enorme potentie voor o.a. marketeers om klanten en prospects beter te bedienen. Niet alleen door in te spelen op feitelijk en geregistreerd gedrag uit het verleden, maar vooral ook door het verrijken en doorgronden van klantprofielen en inzichten op basis van meningsuitingen, wijze van participatie in netwerken, en tekenen van aspiraties, attitude en preferenties.
    Het is een mooie toevoeging om van sturen op waarheid door te groeien naar sturen op waarde.
  • Samenvattend:
    Het perspectief van Big Data gaat niet zozeer over meer data, maar vooral over nieuwe dimensies van data (tekst, beeld, video)
    Big data zal nieuwe disciplines doen ontstaan: tekst analystics maar ook interpreters
    Big data vraagt om Brigt Analysis. Het betekent een paradigm shift in hoe we met data omgaan. Van onze 20ste eeuw aanpak van schone data voor schone resultaten naar data als leidraad voor minder fouten maken; het omarmen van een totaalplaatje en accepteren van onzekerheid. Want een ding staat als een paal boven water: Gepaard met Big Data groeit onze bescheidenheid over wat we denken te weten en gllort het perspectief van effectiever en vooral waardevoller klantbeleid.
  • Zo aan het eind van een intensieve twee-daags event over Business intelligence, is het een eer om af te sluiten met een blik op de toekomst. De toekomst van Data. Big Data en Beyond. En ik richt me daarbij vooral op marketing & data; of liever gezegd, mensen en data.
  • FutureFlock Consulting - De toekomst van data - Bart Götte

    1. 1. Sogeti BI Symposium 2013 De Toekomst Van Data FutureFlock Consulting | Bart Götte
    2. 2. The Future of Data Our Past: Numeric Data to be Controlled Mean Representativity Stability Statistical Significance Standard Deviation Confidence Intervals Reliability Predictability
    3. 3. The Future of Data Our Past: Data is to be Controlled
    4. 4. The Future of Data Our Past: Data is to be Controlled
    5. 5. The Future of Data Our Current Insight
    6. 6. The Future of Data Our Current Insight
    7. 7. The Future of Data Image Mining
    8. 8. The Future of Data Image Mining: 5 Basics Content Analyse Visuele Analyse Contextuele Informatie Bron Informatie Technische kwaliteit
    9. 9. The Future of Data Image Mining: Etnografie
    10. 10. The Future of Data Image Mining: Etnografie
    11. 11. The Future of Data Image Mining | Pinterest Branding: Sogeti
    12. 12. The Future of Data Image Mining | Pinterest Productsoort: Kaas
    13. 13. The Future of Data Image Mining | Pinterest Kernwaarde: Vertrouwen
    14. 14. The Future of Data Big Data: Bright Mining Inzicht Foresight (Big) Image Mining (Big) Text Mining (Big) Number Mining Future
    15. 15. The Future of Data Big Data: Bright Analysis! ‘Waarheid’: Wat ‘Waarde’: Waarom
    16. 16. The Future of Data Big Data: Big Challenge! Big Data > Het toevoegen van nieuwe data dimensies Cijfers Tekst Beeld Big Data > Waarde benutten = nieuwe competenties van de analist Hoe analyseer je tekst en beeld? Hoe interpreteer je de betekenis van tekst en beeld? (semiotics , etnografie & linguisten) Big Data > Borgen van Bright Analysis De verleiding van data-erosie: “Beeld & Tekst? Maak er geen cijfertje van…” Het accepteren van onzekerheid: Denk Bayesiaans (minder fouten maken)
    17. 17. Sogeti BI Symposium 2013 De Toekomst Van Data is “Changing Your Game” www.futureflock.nl | Bart Götte

    ×