Big	
  Data-­‐Driven	
  
Decisions	
  24	
  april	
  	
  
2013	
  -­‐	
  Sander	
  Klous
Sander	
  	
  
Klous
data
pyramid
e	
  info
1	
  duurzame	
  informa?e	
  
maatschap
Q&A
4	
  kennis	
  en	
  talent	
  over	
  
deze	
  discipline
3	
  als	
  organisa?es	
  op	
  
juiste	
  wijze	
  bronnen	
  
gebruiken
2	
  rechten	
  privacy	
  
van	
  individuen
mindmap
bio
15jr	
  lang	
  onderzoek	
  
bij	
  CERN
KPMG
Sander	
  is	
  bij	
  KPMG	
  verantwoordelijk	
  	
  voor	
  de	
  
dienstverlening	
  op	
  het	
  gebied	
  van	
  Big	
  Data	
  &	
  AnalyEcs
data	
  analyEcs	
  lead
projecten	
  bij	
  CERN
BNR	
  op	
  bezoek	
  KPMG
Q:	
  belangstelling	
  voor	
  big	
  
data	
  bij	
  media
proeven	
  gedaan
A:	
  er	
  is	
  iets	
  groots	
  aan	
  de	
  hand
land	
  langzaam
veel	
  aan	
  het	
  bouwen
vragen	
  zoals
veel	
  data	
  nodig
de	
  versneller	
  was	
  klaar
kan	
  dit	
  ook	
  in	
  de	
  echte	
  wereld?
Ejd	
  loopt	
  één	
  kant	
  op
we	
  bestaan	
  uit	
  deeltjes
analyse	
  methodes,	
  bedrijven	
  beter	
  maken
veel	
  info	
  tot	
  onze	
  
beschikking
disconnect	
  tussen	
  
data	
  en	
  de	
  beslissing
bronnen	
  van	
  
info
anno	
  2013
over	
  20jr
nu	
  is	
  de	
  generaEe	
  die	
  in	
  de	
  transiEe	
  zit
lasEg	
  om	
  er	
  iets	
  uit	
  te	
  halen
socialmedia
we	
  hebben	
  veel	
  data,	
  toch	
  in	
  
een	
  financiële	
  crisis
roken	
  is	
  slecht,	
  toch	
  rookt	
  men
veel	
  ontbossing,	
  en	
  toch	
  gaat	
  het	
  door
wie	
  heeT	
  er	
  
kinderen?
eerste	
  kleine	
  computers
vader	
  &	
  moeder
leraar
vrienden
volwassen	
  kinderen
waar	
  haalde	
  we	
  info	
  
vandaan	
  20jr	
  geleden?
comodore	
  64
haal	
  je	
  weinig	
  uit
baby's	
  bestookt	
  met	
  info	
  bronnen
gaat	
  om	
  filtering,	
  betrouwbaarheid
maatschappij	
  verdronken	
  in	
  info
uniek	
  moment	
  in	
  Ejd
veel	
  data
1	
  duurzame	
  informaEe	
  maatschap
2	
  rechten	
  privacy	
  van	
  individuen
3	
  als	
  organisaEe	
  op	
  juiste	
  wijze	
  bronnen	
  gebruiken
4	
  kennis	
  en	
  talent	
  over	
  deze	
  discipline
toch	
  moeilijk	
  om	
  
beslissingen	
  te	
  nemen
groei	
  in	
  bevolking
resources
overvloed	
  van	
  info
verschuiving	
  van	
  rijkdom
internet	
  
trends
maak	
  als	
  organisaEe	
  1	
  pva	
  om	
  
de	
  ontwikkelingen	
  te	
  borgen
nieuwe	
  infrastructuur
seamless	
  
consumpEon
breedband
onbetrouwbaarheid	
  van	
  bronnen
vele	
  idenEteiten
mobile	
  money
internet	
  of	
  things
dingen	
  mogen	
  niet	
  niet	
  
meer	
  werken
Linkedin	
  vs	
  Facebook	
  vs	
  
Twi[er	
  vs	
  thuis
Q:	
  Wereldwijde	
  tekort	
  aan	
  
datascienEsts,	
  balans	
  tussen	
  IQ	
  
&	
  EQ,	
  structureel	
  tekort?
Q:	
  Veel	
  onderzoek	
  door	
  KPMG	
  BD	
  bij	
  bedrijven,	
  25%	
  vd	
  
bedrijven	
  gebruikt	
  dit	
  nu,	
  belangrijke	
  
managementbeslissing	
  worden	
  op	
  gevoel	
  genomen?
Q:	
  Hoe	
  krijg	
  je	
  als	
  consument	
  
helder	
  of	
  info	
  anoniem	
  is,	
  mag	
  je	
  
beslissen?
Q:	
  Google	
  health	
  is	
  stopgezet,	
  
wel	
  quanEfied	
  zelf
A:	
  gaat	
  een	
  beperking	
  worden	
  
(korte	
  termijn	
  en	
  middel	
  lang)
veel	
  vacatures
oplossing
scholing
van	
  BI	
  >	
  data
A:	
  ja!
A:	
  bijv	
  medisch	
  
dossier:	
  
onacceptabel
Anonimiseringsslag	
  maken
quanEfied	
  zelf
men	
  gaat	
  zelf	
  bepalen,	
  wie	
  
wel/niet	
  toegang	
  krijgen
zelf	
  in	
  controle	
  blijven
A:	
  lasEg	
  om	
  het	
  goed	
  te	
  krijgen,	
  vertrouwen
vertrouw	
  je	
  google	
  met	
  je	
  data?
dan	
  bij	
  de	
  overheid?
Diginotar?	
  wekt	
  ook	
  
geen	
  vertrouwen
nodig
deze	
  combi	
  is	
  er	
  niet	
  veel
analyses	
  &	
  staEsEek
communiceren
afstemmen	
  wat	
  wil	
  je	
  weten
hoe	
  pak	
  je	
  het	
  aan
onderwijs	
  en	
  overheid	
  
moeten	
  hierop	
  inspelen
voorbeelden
voorbeelden
issues
groen	
  gebied	
  vs	
  rood	
  
gebied	
  van	
  mobiele	
  
zendmasten	
  (telefonie)
randstad	
  overwegend	
  groen
rest	
  rood
big	
  data	
  laag,	
  informaEe	
  mappen
locaEon	
  based	
  services
project	
  X
crowd	
  
management
financial	
  health
mobiele	
  telefoon	
  volgen
zien	
  waar	
  mensen	
  zijn
bijvoorbeeld	
  mensen	
  in	
  de	
  trein
plot	
  van	
  tweets
twi[eren	
  op
tweet	
  Project	
  X
snelweg
pont	
  naar	
  Texel
etc...
event	
  liep	
  ruim	
  van	
  te	
  voren	
  uit	
  
de	
  hand	
  (door	
  socialmedia)
socialmedia	
  goed	
  volgen	
  >	
  dan	
  
relevante	
  info	
  ophalen	
  om	
  de	
  
veiligheid	
  te	
  bepalen	
  (obv	
  senEment)
bewegingen	
  ten	
  Ejde	
  vd	
  gaypride
sms	
  /	
  belverkeer
mensen	
  verspreiden	
  door	
  de	
  stad
komen	
  binnen	
  bij	
  Centraal	
  StaEon
zien	
  waar	
  de	
  drukte	
  is
avond:	
  Leidseplein
toepassingen	
  aan	
  de	
  veiligheidsorganisaEes
krachEg	
  middel	
  om	
  veiligheid	
  bewaken
combineer	
  het	
  publieke	
  info	
  (bij	
  Partyflock)
gaat	
  niet	
  om	
  techniek,	
  het	
  gaat	
  om	
  de	
  organisaEes
organisaEes,	
  zijn	
  niet	
  ingericht	
  om	
  op	
  data	
  driven	
  
decisions	
  zich	
  te	
  baseren
gaat	
  om	
  snel	
  
schakelen
komt	
  veel	
  info	
  uit	
  data
agile
scrum
iteraEef	
  aanpakken
de	
  echte	
  kracht	
  is	
  snel	
  besluiten	
  
en	
  schakelen	
  obv	
  data
legal	
  aspect
privacy	
  issues
maatschappelijke	
  
waarde	
  van	
  wat	
  je	
  doet
College	
  Bescherming	
  
Persoonsgegevens:	
  
100	
  jaar	
  achterop
is	
  iets	
  acceptabel?
ze	
  kunnen	
  het	
  niet	
  aan
geen	
  vragen	
  meer	
  te	
  stellen
we[en:	
  gaan	
  over	
  boeken	
  &	
  EjdschriTen
veel	
  inspanning	
  nodig
goed	
  organiseren
whatsapp	
  verkeer	
  
inspecteren	
  door	
  KPN
tegengehouden	
  obv	
  publieke	
  opinie
check	
  publieke	
  opinie
macht	
  van	
  grote	
  publiek	
  neemt	
  toe	
  door	
  big	
  data
gemaakt	
  door	
  
@AlexisvanDam
ook	
  uw	
  presentaEe/	
  
congres	
  gemindmapped?
lees	
  
instrucEe
h[p://www.alexisvandam.nl
mindmapper,	
  facilitator,	
  spreker
zie	
  h[p://www.connecEonofminds.com	
  voor	
  
onze	
  aanpak	
  en	
  mogelijkheden
met	
  de	
  klok	
  mee
van	
  binnen	
  naar	
  buiten
per	
  tak	
  van	
  boven	
  naar	
  beneden

BDDD Sander Klous

  • 1.
    Big  Data-­‐Driven   Decisions  24  april     2013  -­‐  Sander  Klous Sander     Klous data pyramid e  info 1  duurzame  informa?e   maatschap Q&A 4  kennis  en  talent  over   deze  discipline 3  als  organisa?es  op   juiste  wijze  bronnen   gebruiken 2  rechten  privacy   van  individuen mindmap bio 15jr  lang  onderzoek   bij  CERN KPMG Sander  is  bij  KPMG  verantwoordelijk    voor  de   dienstverlening  op  het  gebied  van  Big  Data  &  AnalyEcs data  analyEcs  lead projecten  bij  CERN BNR  op  bezoek  KPMG Q:  belangstelling  voor  big   data  bij  media proeven  gedaan A:  er  is  iets  groots  aan  de  hand land  langzaam veel  aan  het  bouwen vragen  zoals veel  data  nodig de  versneller  was  klaar kan  dit  ook  in  de  echte  wereld? Ejd  loopt  één  kant  op we  bestaan  uit  deeltjes analyse  methodes,  bedrijven  beter  maken veel  info  tot  onze   beschikking disconnect  tussen   data  en  de  beslissing bronnen  van   info anno  2013 over  20jr nu  is  de  generaEe  die  in  de  transiEe  zit lasEg  om  er  iets  uit  te  halen socialmedia we  hebben  veel  data,  toch  in   een  financiële  crisis roken  is  slecht,  toch  rookt  men veel  ontbossing,  en  toch  gaat  het  door wie  heeT  er   kinderen? eerste  kleine  computers vader  &  moeder leraar vrienden volwassen  kinderen waar  haalde  we  info   vandaan  20jr  geleden? comodore  64 haal  je  weinig  uit baby's  bestookt  met  info  bronnen gaat  om  filtering,  betrouwbaarheid maatschappij  verdronken  in  info uniek  moment  in  Ejd veel  data 1  duurzame  informaEe  maatschap 2  rechten  privacy  van  individuen 3  als  organisaEe  op  juiste  wijze  bronnen  gebruiken 4  kennis  en  talent  over  deze  discipline toch  moeilijk  om   beslissingen  te  nemen groei  in  bevolking resources overvloed  van  info verschuiving  van  rijkdom internet   trends maak  als  organisaEe  1  pva  om   de  ontwikkelingen  te  borgen nieuwe  infrastructuur seamless   consumpEon breedband onbetrouwbaarheid  van  bronnen vele  idenEteiten mobile  money internet  of  things dingen  mogen  niet  niet   meer  werken Linkedin  vs  Facebook  vs   Twi[er  vs  thuis Q:  Wereldwijde  tekort  aan   datascienEsts,  balans  tussen  IQ   &  EQ,  structureel  tekort? Q:  Veel  onderzoek  door  KPMG  BD  bij  bedrijven,  25%  vd   bedrijven  gebruikt  dit  nu,  belangrijke   managementbeslissing  worden  op  gevoel  genomen? Q:  Hoe  krijg  je  als  consument   helder  of  info  anoniem  is,  mag  je   beslissen? Q:  Google  health  is  stopgezet,   wel  quanEfied  zelf A:  gaat  een  beperking  worden   (korte  termijn  en  middel  lang) veel  vacatures oplossing scholing van  BI  >  data A:  ja! A:  bijv  medisch   dossier:   onacceptabel Anonimiseringsslag  maken quanEfied  zelf men  gaat  zelf  bepalen,  wie   wel/niet  toegang  krijgen zelf  in  controle  blijven A:  lasEg  om  het  goed  te  krijgen,  vertrouwen vertrouw  je  google  met  je  data? dan  bij  de  overheid? Diginotar?  wekt  ook   geen  vertrouwen nodig deze  combi  is  er  niet  veel analyses  &  staEsEek communiceren afstemmen  wat  wil  je  weten hoe  pak  je  het  aan onderwijs  en  overheid   moeten  hierop  inspelen voorbeelden voorbeelden issues groen  gebied  vs  rood   gebied  van  mobiele   zendmasten  (telefonie) randstad  overwegend  groen rest  rood big  data  laag,  informaEe  mappen locaEon  based  services project  X crowd   management financial  health mobiele  telefoon  volgen zien  waar  mensen  zijn bijvoorbeeld  mensen  in  de  trein plot  van  tweets twi[eren  op tweet  Project  X snelweg pont  naar  Texel etc... event  liep  ruim  van  te  voren  uit   de  hand  (door  socialmedia) socialmedia  goed  volgen  >  dan   relevante  info  ophalen  om  de   veiligheid  te  bepalen  (obv  senEment) bewegingen  ten  Ejde  vd  gaypride sms  /  belverkeer mensen  verspreiden  door  de  stad komen  binnen  bij  Centraal  StaEon zien  waar  de  drukte  is avond:  Leidseplein toepassingen  aan  de  veiligheidsorganisaEes krachEg  middel  om  veiligheid  bewaken combineer  het  publieke  info  (bij  Partyflock) gaat  niet  om  techniek,  het  gaat  om  de  organisaEes organisaEes,  zijn  niet  ingericht  om  op  data  driven   decisions  zich  te  baseren gaat  om  snel   schakelen komt  veel  info  uit  data agile scrum iteraEef  aanpakken de  echte  kracht  is  snel  besluiten   en  schakelen  obv  data legal  aspect privacy  issues maatschappelijke   waarde  van  wat  je  doet College  Bescherming   Persoonsgegevens:   100  jaar  achterop is  iets  acceptabel? ze  kunnen  het  niet  aan geen  vragen  meer  te  stellen we[en:  gaan  over  boeken  &  EjdschriTen veel  inspanning  nodig goed  organiseren whatsapp  verkeer   inspecteren  door  KPN tegengehouden  obv  publieke  opinie check  publieke  opinie macht  van  grote  publiek  neemt  toe  door  big  data gemaakt  door   @AlexisvanDam ook  uw  presentaEe/   congres  gemindmapped? lees   instrucEe h[p://www.alexisvandam.nl mindmapper,  facilitator,  spreker zie  h[p://www.connecEonofminds.com  voor   onze  aanpak  en  mogelijkheden met  de  klok  mee van  binnen  naar  buiten per  tak  van  boven  naar  beneden