SlideShare a Scribd company logo
Geen	
  Big	
  Data	
  
zonder	
  Small	
  
Data	
  
Norman	
  Manley	
  
IT	
  Analyst	
  
 	
  
	
  	
  
Big	
  Data	
  -­‐	
  een	
  defini;e	
  
Big	
  data	
  is	
  de	
  naam	
  die	
  wij	
  geven	
  aan	
  een	
  verzameling	
  van	
  
gegevens	
  die	
  zo	
  groot	
  (en	
  complex)	
  is	
  dat	
  die	
  niet	
  meer	
  te	
  
verwerken	
  valt	
  met	
  tradi;onele	
  IT	
  applica;es.	
  Over	
  het	
  
algemeen	
  is	
  het	
  volume	
  minstens	
  duizend	
  keer	
  groter	
  dan	
  
tradi;onele	
  data	
  bronnen	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
“Je	
  kunt	
  data	
  hebben	
  zonder	
  informa;e,	
  maar	
  je	
  kunt	
  geen	
  
informa;e	
  hebben	
  zonder	
  data."	
  	
  
Daniel	
  Keys	
  Moran	
  –	
  Amerikaanse	
  schrijver	
  
 
	
  	
  
Small	
  Data	
  -­‐een	
  defini;e	
  
Data	
  	
  (small	
  data)	
  is	
  synoniem	
  voor	
  gegevens;	
  	
  
en	
  Van	
  Dale	
  gedefinieerd	
  dat	
  als	
  	
  
“bekende	
  feiten	
  waaruit	
  je	
  gevolgtrekkingen	
  kunt	
  maken”.	
  	
  
Maar	
  als	
  de	
  feiten	
  niet	
  juist	
  zijn	
  dan	
  zullen	
  wij	
  	
  verkeerde	
  
gevolgtrekkingen	
  	
  maken!	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Factuur	
  Datum Klant Land Euros	
  excl	
  BTW BTW Totaal Factuurnummer Betaling
22/01/2014 Mondea Netherlands 795.00 166.95 961.95 2014.416 iDeal
24/01/2014 Physter	
  Technology Czech	
  Republic 795.00 0 795.00 2014.417 Visa
27/01/2014 Copenhagen	
  Airports	
  A/S Denmark 795.00 166.95 961.95 2014.421 MC
28/01/2014 Vista	
  Group Finland 575.00 120.75 695.75 2014.423 MC
07/02/2014 Global	
  Information USA 709.01 0 709.01 2014.441 Invoice
14/02/2014 DataPad	
  Inc United	
  States 795.00 0 795.00 2014.451 MC
21/02/2014 Scrip	
  Companies USA 795.00 795.00 2014.464 PayPal
Het	
  doel	
  van	
  het	
  werken	
  met	
  data	
  
! het	
  beschikbaar	
  stellen	
  van	
  een	
  consistente,	
  accurate	
  en	
  
;jdige	
  bron	
  van	
  verwerkte	
  data	
  die	
  beslissingen	
  
ondersteunen	
  
! het	
  beschikbaar	
  stellen	
  van	
  historische	
  informa;e	
  als	
  
enige	
  basis	
  voor	
  vergelijkende	
  en	
  voorspellende	
  analyses	
  
! het	
  integreren	
  van	
  data	
  uit	
  verschillende	
  bronnen	
  (zowel	
  
intern	
  als	
  extern)	
  
! het	
  creëren	
  van	
  “één	
  bron	
  van	
  de	
  waarheid”	
  die	
  wij	
  
nodig	
  hebben	
  om	
  betere	
  beslissingen	
  te	
  nemen	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Waar	
  komt	
  de	
  data	
  vandaan?	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Small	
  Data	
  -­‐	
  gestructureerd	
  
!  Applica;es	
  van	
  de	
  organisa;e	
  
!  Spreadsheets!	
  
Big	
  Data	
  –	
  vaak	
  ongestructureerd	
  
!  Processen	
  van	
  de	
  organisa;e:	
  
me;ngen,	
  websites,	
  apparatuur	
  
!  Communica;e:	
  
e-­‐mail,	
  rapporten,	
  presenta;es	
  
!  Sociale	
  media:	
  
Facebook,	
  LinkedIn,	
  Twicer	
  
!  Sensoren:	
  
temperatuur,	
  weer,	
  files,	
  regen	
  
!  Archieven:	
  
oude	
  documenten,	
  oude	
  films	
  
	
  
 	
  
	
  	
  
Ongestructureerde	
  data	
  -­‐	
  een	
  defini;e	
  
Ongestructureerde	
  data	
  is	
  niet	
  direct	
  als	
  veld	
  in	
  
een	
  database	
  benaderbaar.	
  Hierbij	
  kan	
  het	
  gaan	
  om	
  allerlei	
  soorten	
  
documenten	
  zoals	
  Office	
  documenten,	
  maar	
  ook	
  PDF,	
  XML,	
  e-­‐
mailberichten,	
  afeeldingen,	
  video's	
  en	
  geluid.	
  	
  De	
  inhoud	
  bevat	
  
vaak	
  datums,	
  cijfers	
  en	
  andere	
  feiten,	
  maar	
  is	
  met	
  moeilijk	
  te	
  
interpreteren	
  met	
  de	
  huidige	
  technologie.	
  	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
We	
  hebben	
  in	
  2013	
  opnieuw	
  een	
  goed	
  jaar	
  gerealiseerd.	
  Vooral	
  in	
  de	
  tweede	
  jaarheli	
  namen	
  de	
  orders	
  in	
  diverse	
  
markten	
  sterk	
  toe.	
  Deze	
  ontwikkeling	
  vertaalde	
  zich	
  in	
  een	
  omzetgroei	
  van	
  3%	
  (autonoom	
  +4,1%	
  tegen	
  constante	
  
wisselkoersen)	
  en	
  een	
  EBITA-­‐groei	
  van	
  ruim	
  10%	
  voor	
  diezelfde	
  periode.	
  Over	
  het	
  gehele	
  jaar	
  steeg	
  de	
  omzet	
  naar	
  
EUR	
  2.040	
  miljoen	
  (autonoom	
  +1,2%	
  tegen	
  constante	
  wisselkoersen).	
  Het	
  bedrijfsresultaat	
  (EBITA)	
  nam	
  eveneens	
  
toe,	
  met	
  3%	
  naar	
  EUR	
  225	
  miljoen;	
  de	
  EBITA-­‐marge	
  kwam	
  uit	
  op	
  11,0%
VOORWOORD	
  VAN	
  DE	
  CEO	
  van	
  Aalberts	
  Industries	
  
Big	
  Data	
  is	
  een	
  aanvulling	
  
! Big	
  Data	
  is	
  een	
  aanvullende	
  bron,	
  niet	
  iets	
  dat	
  op	
  
zichzelf	
  staat	
  
! het	
  doel	
  is	
  om	
  de	
  bestaande	
  data	
  te	
  completeren	
  
! “omzet”	
  uit	
  Big	
  Data	
  heei	
  dezelfde	
  defini;e	
  als	
  
“omzet”	
  uit	
  Small	
  Data	
  
! kwaliteit	
  is	
  even	
  belangrijk:	
  zo	
  niet	
  is	
  Big	
  Data	
  
gewoon	
  veel	
  slechte	
  data	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Hoe	
  wij	
  dingen	
  noemen	
  is	
  belangrijk	
  
Hoeveel	
  heb	
  	
  
ik	
  verkocht?	
  
Hoeveel	
  kan	
  
ik	
  boeken?	
  Omzet	
  
=	
  €	
  100,000	
   =	
  €	
  96,422	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
	
  	
  
	
  	
  
Net	
  zoals	
  de	
  meeste	
  IT	
  analisten	
  ben	
  ik	
  er	
  van	
  overtuigd	
  
dat	
  de	
  kwaliteit	
  van	
  de	
  data	
  een	
  groot	
  risico	
  vormt	
  voor	
  
onze	
  besluitvorming	
  –	
  het	
  probleem	
  is	
  dat	
  de	
  kwaliteit	
  van	
  
de	
  data	
  zo	
  slecht	
  is	
  dat	
  wij	
  dit	
  niet	
  kunnen	
  bewijzen!	
  
Norman	
  Manley,	
  IT	
  analyst	
  
Data	
  kwaliteit	
  –	
  een	
  probleem?	
  
Small	
  data	
  –	
  wat	
  zijn	
  de	
  problemen?	
  
•  de	
  bestanden	
  hebben	
  vele	
  verschillende	
  formaten	
  dat	
  
het	
  lezen	
  erg	
  moeilijk	
  kan	
  maken	
  
•  het	
  is	
  vaak	
  onzeker	
  wat	
  de	
  inhoud	
  van	
  een	
  rubriek	
  is	
  (en	
  
ook	
  wat	
  het	
  betekend)	
  	
  
•  privacy	
  is	
  een	
  probleem	
  –	
  mogen	
  wij	
  iets	
  zien,	
  en	
  mogen	
  
wij	
  er	
  iets	
  meedoen?	
  	
  
•  data	
  ontbreekt	
  vaak	
  (zowel	
  individuele	
  rubrieken	
  als	
  
delen	
  van	
  bestanden)	
  	
  
•  data	
  is	
  niet	
  actueel	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Het	
  Data	
  Integra;e	
  proces	
  –	
  de	
  basis	
  elementen	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Big	
  Data	
  -­‐	
  wat	
  heei	
  het	
  voor	
  nut?	
  
Hoe	
  nutg	
  is	
  big	
  data?	
  
De	
  vier	
  motoren	
  van	
  een	
  Boeing	
  
747	
  zouden	
  op	
  één	
  vlucht	
  van	
  
Amsterdam	
  naar	
  New	
  York	
  meer	
  
data	
  genereren	
  dan	
  de	
  meeste	
  
bedrijven	
  in	
  één	
  jaar.	
  	
  
De	
  vraag	
  bliji:	
  moeten	
  wij	
  de	
  data	
  allemaal	
  bewaren,	
  
zo	
  ja	
  voor	
  hoelang,	
  en	
  hoe	
  gaan	
  wij	
  die	
  gebruiken	
  om	
  
informa;e	
  te	
  genereren	
  waar	
  wij	
  iets	
  aan	
  hebben?	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Dat	
  is	
  heel	
  veel	
  data!	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Big	
  Data	
  successen	
  
Vestas,	
  een	
  Deense	
  fabrikant	
  van	
  windmolens	
  gebruikt	
  data	
  van	
  
meer	
  dan	
  35.000	
  meteorologische	
  
meetstations	
  en	
  van	
  45.000	
  eigen	
  turbines.	
  
Zo	
  bepalen	
  zij	
  de	
  beste	
  locaties,	
  qua	
  wind	
  
stromen,	
  om	
  nieuwe	
  windmolens	
  te	
  
plaatsen.	
  Zij	
  verwachten	
  24	
  petabytes	
  data	
  
te	
  verzamelen	
  (nu	
  hebben	
  zij	
  2,8	
  petabytes).	
  
Het	
  analyseren	
  van	
  één	
  nieuwe	
  locatie	
  is	
  terug	
  gebracht	
  van	
  
enkele	
  weken	
  naar	
  15	
  minuten.	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
Big	
  Data	
  successen	
  
Los	
  Angeles	
  en	
  Santa	
  Cruz	
  politie,	
  hebben	
  samen	
  met	
  PredPol	
  
(een	
  software	
  leverancier)	
  en	
  een	
  wiskundige	
  van	
  de	
  universiteit	
  
van	
  Santa	
  Clara	
  een	
  systeem	
  
ontwikkeld	
  dat	
  tot	
  50	
  m2	
  
nauwkeurig	
  
aangeeft	
  waar	
  men	
  
crimineel	
  activiteit	
  kan	
  
verwachten.	
  Een	
  combinatie	
  van	
  
historische	
  en	
  data	
  van	
  “live”	
  
camera’s	
  wordt	
  gebruikt	
  om	
  te	
  voorspelen	
  waar	
  de	
  politie	
  
naartoe	
  moet	
  om	
  o.a.	
  inbraken	
  te	
  voorkomen.	
  Inmiddels	
  is	
  het	
  
aantal	
  inbraken	
  met	
  33%	
  gedaald.	
  Het	
  systeem	
  heet	
  “predictive	
  
policing”	
  
Conclusies	
  
! als	
  de	
  Small	
  Data	
  niet	
  goed	
  werkt	
  dan	
  heei	
  Big	
  
Data	
  geen	
  kans	
  
! Big	
  Data	
  op	
  zich	
  heei	
  geen	
  waarde	
  –	
  maar	
  het	
  
geei	
  de	
  mogelijkheid	
  om	
  nieuwe	
  inzichten	
  te	
  
generen	
  
! alles	
  draait	
  om	
  accuratesse	
  –	
  slechte	
  data	
  kwaliteit	
  
leidt	
  tot	
  informa;e	
  die	
  nog	
  slechter	
  is	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
©	
  Decision	
  Support	
  Systems	
  2014	
  
"Not	
  everything	
  that	
  can	
  be	
  
counted	
  counts,	
  and	
  not	
  
everything	
  that	
  counts	
  can	
  
be	
  counted."	
  
William	
  Bruce	
  Cameron	
  “Informal	
  Sociology:	
  A	
  Casual	
  
Introduc;on	
  to	
  Sociological	
  Thinking”	
  1963	
  

More Related Content

Similar to 6 norman manley geen big data zonder small data

Whitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueWhitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueAnderson MacGyver
 
Big Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomstBig Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomst
Oscar Wijsman
 
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
ScienceWorks
 
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)
Erik Van Der Zee
 
BDDD Bob Nieme
BDDD Bob NiemeBDDD Bob Nieme
BDDD Bob Nieme
Insurance Market Pte Ltd
 
a.s.r. masterclass digital and social media by TIAS
a.s.r. masterclass digital and social media by TIASa.s.r. masterclass digital and social media by TIAS
a.s.r. masterclass digital and social media by TIAS
robineffing
 
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
Facto Magazine
 
DDM14 Spreker 3 rogier van nieuwenhuizen
DDM14 Spreker  3 rogier van nieuwenhuizenDDM14 Spreker  3 rogier van nieuwenhuizen
DDM14 Spreker 3 rogier van nieuwenhuizen
Connection of Minds
 
Wat is big data en hoe bemeester je het?
Wat is big data en hoe bemeester je het?Wat is big data en hoe bemeester je het?
Wat is big data en hoe bemeester je het?
Nick van Breda
 
John Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICT
John Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICTJohn Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICT
John Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICT
Dutch Power
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieMedia Perspectives
 
Big data: de mogelijkheden en de moeilijkheden
Big data: de mogelijkheden en de moeilijkhedenBig data: de mogelijkheden en de moeilijkheden
Big data: de mogelijkheden en de moeilijkheden
Marcel Maassen (Connectricity)
 
Presentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doenPresentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doen
Cmotions
 
Big Data in zicht - Nationale Denktank
Big Data in zicht - Nationale DenktankBig Data in zicht - Nationale Denktank
Big Data in zicht - Nationale Denktank
Lisette van Beusekom
 
Open data in Gent
Open data in  GentOpen data in  Gent
Open data in Gent
Rosseau Bart
 
NL - Module 6 - The Future of Smart Data
NL - Module 6 - The Future of Smart DataNL - Module 6 - The Future of Smart Data
NL - Module 6 - The Future of Smart Data
caniceconsulting
 
USG Professionals - Data Protection GDPR
USG Professionals - Data Protection GDPRUSG Professionals - Data Protection GDPR
USG Professionals - Data Protection GDPR
GuyVanderSande
 
BDDD Sander Klous
BDDD Sander KlousBDDD Sander Klous
BDDD Sander Klous
Insurance Market Pte Ltd
 

Similar to 6 norman manley geen big data zonder small data (20)

Whitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueWhitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-value
 
Big Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomstBig Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomst
 
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
 
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)
 
BDDD Bob Nieme
BDDD Bob NiemeBDDD Bob Nieme
BDDD Bob Nieme
 
a.s.r. masterclass digital and social media by TIAS
a.s.r. masterclass digital and social media by TIASa.s.r. masterclass digital and social media by TIAS
a.s.r. masterclass digital and social media by TIAS
 
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
 
DDM14 Spreker 3 rogier van nieuwenhuizen
DDM14 Spreker  3 rogier van nieuwenhuizenDDM14 Spreker  3 rogier van nieuwenhuizen
DDM14 Spreker 3 rogier van nieuwenhuizen
 
Data trends
Data trendsData trends
Data trends
 
Wat is big data en hoe bemeester je het?
Wat is big data en hoe bemeester je het?Wat is big data en hoe bemeester je het?
Wat is big data en hoe bemeester je het?
 
John Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICT
John Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICTJohn Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICT
John Post - Hoe wordt onze energietoekomst beïnvloed door Big Data en ICT
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data Visualisatie
 
Big data: de mogelijkheden en de moeilijkheden
Big data: de mogelijkheden en de moeilijkhedenBig data: de mogelijkheden en de moeilijkheden
Big data: de mogelijkheden en de moeilijkheden
 
Presentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doenPresentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doen
 
Big Data in zicht - Nationale Denktank
Big Data in zicht - Nationale DenktankBig Data in zicht - Nationale Denktank
Big Data in zicht - Nationale Denktank
 
Open data in Gent
Open data in  GentOpen data in  Gent
Open data in Gent
 
NL - Module 6 - The Future of Smart Data
NL - Module 6 - The Future of Smart DataNL - Module 6 - The Future of Smart Data
NL - Module 6 - The Future of Smart Data
 
Bigdata
BigdataBigdata
Bigdata
 
USG Professionals - Data Protection GDPR
USG Professionals - Data Protection GDPRUSG Professionals - Data Protection GDPR
USG Professionals - Data Protection GDPR
 
BDDD Sander Klous
BDDD Sander KlousBDDD Sander Klous
BDDD Sander Klous
 

More from NMITSymposium

2 paul bessems waarin ict bedrijven nutsbedrijven worden
2 paul bessems   waarin ict bedrijven nutsbedrijven worden2 paul bessems   waarin ict bedrijven nutsbedrijven worden
2 paul bessems waarin ict bedrijven nutsbedrijven worden
NMITSymposium
 
1 hans outhuis is de vraag nog wel te sturen
1 hans outhuis   is de vraag nog wel te sturen 1 hans outhuis   is de vraag nog wel te sturen
1 hans outhuis is de vraag nog wel te sturen
NMITSymposium
 
1 niels groen - achterkant van het gelijk - ethiek en ict
1   niels groen - achterkant van het gelijk - ethiek en ict1   niels groen - achterkant van het gelijk - ethiek en ict
1 niels groen - achterkant van het gelijk - ethiek en ict
NMITSymposium
 
2 kpn -wereld in verbinding, wat als
2   kpn -wereld in verbinding, wat als2   kpn -wereld in verbinding, wat als
2 kpn -wereld in verbinding, wat als
NMITSymposium
 
4 melanie rieback radicale transparantie
4 melanie rieback   radicale transparantie4 melanie rieback   radicale transparantie
4 melanie rieback radicale transparantie
NMITSymposium
 
4 arie versluis data- en informatiegedreven !
4 arie versluis   data- en informatiegedreven !4 arie versluis   data- en informatiegedreven !
4 arie versluis data- en informatiegedreven !
NMITSymposium
 
5 walter zondervan the future of bim
5 walter zondervan   the future of bim5 walter zondervan   the future of bim
5 walter zondervan the future of bim
NMITSymposium
 
6 jilt sietsma digiployment
6 jilt sietsma   digiployment6 jilt sietsma   digiployment
6 jilt sietsma digiployment
NMITSymposium
 
2 dev ops wat komt er op ons af in 2015
2 dev ops   wat komt er op ons af in 20152 dev ops   wat komt er op ons af in 2015
2 dev ops wat komt er op ons af in 2015
NMITSymposium
 
Opening keynotes
Opening keynotesOpening keynotes
Opening keynotes
NMITSymposium
 
1 christiaan hol process mining @ amphia
1 christiaan hol   process mining @ amphia1 christiaan hol   process mining @ amphia
1 christiaan hol process mining @ amphia
NMITSymposium
 
1 frank geffen process mining bij rabobank
1 frank geffen   process mining bij rabobank1 frank geffen   process mining bij rabobank
1 frank geffen process mining bij rabobank
NMITSymposium
 
9 dev ops mark smalley & lex scholten - when and how to devops
9 dev ops   mark smalley & lex scholten - when and how to devops9 dev ops   mark smalley & lex scholten - when and how to devops
9 dev ops mark smalley & lex scholten - when and how to devops
NMITSymposium
 
9 dev ops dave van herpen - what is devops-
9 dev ops   dave van herpen - what is devops-9 dev ops   dave van herpen - what is devops-
9 dev ops dave van herpen - what is devops-
NMITSymposium
 
9 dev ops erik peet - demystifying devops
9 dev ops   erik peet - demystifying devops9 dev ops   erik peet - demystifying devops
9 dev ops erik peet - demystifying devops
NMITSymposium
 
9 dev ops jan buurman - why now devops
9 dev ops   jan buurman - why now devops9 dev ops   jan buurman - why now devops
9 dev ops jan buurman - why now devops
NMITSymposium
 
1 albert roelofswaard trendhacking
1 albert roelofswaard   trendhacking1 albert roelofswaard   trendhacking
1 albert roelofswaard trendhacking
NMITSymposium
 
2 it's value koert krouwel - transparantie van een it dienst is niet belang...
2 it's value   koert krouwel - transparantie van een it dienst is niet belang...2 it's value   koert krouwel - transparantie van een it dienst is niet belang...
2 it's value koert krouwel - transparantie van een it dienst is niet belang...
NMITSymposium
 
1 dave van herpen agile siam - regie op kwaliteit in de cloud
1 dave van herpen   agile siam - regie op kwaliteit in de cloud1 dave van herpen   agile siam - regie op kwaliteit in de cloud
1 dave van herpen agile siam - regie op kwaliteit in de cloud
NMITSymposium
 

More from NMITSymposium (19)

2 paul bessems waarin ict bedrijven nutsbedrijven worden
2 paul bessems   waarin ict bedrijven nutsbedrijven worden2 paul bessems   waarin ict bedrijven nutsbedrijven worden
2 paul bessems waarin ict bedrijven nutsbedrijven worden
 
1 hans outhuis is de vraag nog wel te sturen
1 hans outhuis   is de vraag nog wel te sturen 1 hans outhuis   is de vraag nog wel te sturen
1 hans outhuis is de vraag nog wel te sturen
 
1 niels groen - achterkant van het gelijk - ethiek en ict
1   niels groen - achterkant van het gelijk - ethiek en ict1   niels groen - achterkant van het gelijk - ethiek en ict
1 niels groen - achterkant van het gelijk - ethiek en ict
 
2 kpn -wereld in verbinding, wat als
2   kpn -wereld in verbinding, wat als2   kpn -wereld in verbinding, wat als
2 kpn -wereld in verbinding, wat als
 
4 melanie rieback radicale transparantie
4 melanie rieback   radicale transparantie4 melanie rieback   radicale transparantie
4 melanie rieback radicale transparantie
 
4 arie versluis data- en informatiegedreven !
4 arie versluis   data- en informatiegedreven !4 arie versluis   data- en informatiegedreven !
4 arie versluis data- en informatiegedreven !
 
5 walter zondervan the future of bim
5 walter zondervan   the future of bim5 walter zondervan   the future of bim
5 walter zondervan the future of bim
 
6 jilt sietsma digiployment
6 jilt sietsma   digiployment6 jilt sietsma   digiployment
6 jilt sietsma digiployment
 
2 dev ops wat komt er op ons af in 2015
2 dev ops   wat komt er op ons af in 20152 dev ops   wat komt er op ons af in 2015
2 dev ops wat komt er op ons af in 2015
 
Opening keynotes
Opening keynotesOpening keynotes
Opening keynotes
 
1 christiaan hol process mining @ amphia
1 christiaan hol   process mining @ amphia1 christiaan hol   process mining @ amphia
1 christiaan hol process mining @ amphia
 
1 frank geffen process mining bij rabobank
1 frank geffen   process mining bij rabobank1 frank geffen   process mining bij rabobank
1 frank geffen process mining bij rabobank
 
9 dev ops mark smalley & lex scholten - when and how to devops
9 dev ops   mark smalley & lex scholten - when and how to devops9 dev ops   mark smalley & lex scholten - when and how to devops
9 dev ops mark smalley & lex scholten - when and how to devops
 
9 dev ops dave van herpen - what is devops-
9 dev ops   dave van herpen - what is devops-9 dev ops   dave van herpen - what is devops-
9 dev ops dave van herpen - what is devops-
 
9 dev ops erik peet - demystifying devops
9 dev ops   erik peet - demystifying devops9 dev ops   erik peet - demystifying devops
9 dev ops erik peet - demystifying devops
 
9 dev ops jan buurman - why now devops
9 dev ops   jan buurman - why now devops9 dev ops   jan buurman - why now devops
9 dev ops jan buurman - why now devops
 
1 albert roelofswaard trendhacking
1 albert roelofswaard   trendhacking1 albert roelofswaard   trendhacking
1 albert roelofswaard trendhacking
 
2 it's value koert krouwel - transparantie van een it dienst is niet belang...
2 it's value   koert krouwel - transparantie van een it dienst is niet belang...2 it's value   koert krouwel - transparantie van een it dienst is niet belang...
2 it's value koert krouwel - transparantie van een it dienst is niet belang...
 
1 dave van herpen agile siam - regie op kwaliteit in de cloud
1 dave van herpen   agile siam - regie op kwaliteit in de cloud1 dave van herpen   agile siam - regie op kwaliteit in de cloud
1 dave van herpen agile siam - regie op kwaliteit in de cloud
 

6 norman manley geen big data zonder small data

  • 1. Geen  Big  Data   zonder  Small   Data   Norman  Manley   IT  Analyst  
  • 2.         Big  Data  -­‐  een  defini;e   Big  data  is  de  naam  die  wij  geven  aan  een  verzameling  van   gegevens  die  zo  groot  (en  complex)  is  dat  die  niet  meer  te   verwerken  valt  met  tradi;onele  IT  applica;es.  Over  het   algemeen  is  het  volume  minstens  duizend  keer  groter  dan   tradi;onele  data  bronnen   ©  Decision  Support  Systems  2014   “Je  kunt  data  hebben  zonder  informa;e,  maar  je  kunt  geen   informa;e  hebben  zonder  data."     Daniel  Keys  Moran  –  Amerikaanse  schrijver  
  • 3.       Small  Data  -­‐een  defini;e   Data    (small  data)  is  synoniem  voor  gegevens;     en  Van  Dale  gedefinieerd  dat  als     “bekende  feiten  waaruit  je  gevolgtrekkingen  kunt  maken”.     Maar  als  de  feiten  niet  juist  zijn  dan  zullen  wij    verkeerde   gevolgtrekkingen    maken!   ©  Decision  Support  Systems  2014   Factuur  Datum Klant Land Euros  excl  BTW BTW Totaal Factuurnummer Betaling 22/01/2014 Mondea Netherlands 795.00 166.95 961.95 2014.416 iDeal 24/01/2014 Physter  Technology Czech  Republic 795.00 0 795.00 2014.417 Visa 27/01/2014 Copenhagen  Airports  A/S Denmark 795.00 166.95 961.95 2014.421 MC 28/01/2014 Vista  Group Finland 575.00 120.75 695.75 2014.423 MC 07/02/2014 Global  Information USA 709.01 0 709.01 2014.441 Invoice 14/02/2014 DataPad  Inc United  States 795.00 0 795.00 2014.451 MC 21/02/2014 Scrip  Companies USA 795.00 795.00 2014.464 PayPal
  • 4. Het  doel  van  het  werken  met  data   ! het  beschikbaar  stellen  van  een  consistente,  accurate  en   ;jdige  bron  van  verwerkte  data  die  beslissingen   ondersteunen   ! het  beschikbaar  stellen  van  historische  informa;e  als   enige  basis  voor  vergelijkende  en  voorspellende  analyses   ! het  integreren  van  data  uit  verschillende  bronnen  (zowel   intern  als  extern)   ! het  creëren  van  “één  bron  van  de  waarheid”  die  wij   nodig  hebben  om  betere  beslissingen  te  nemen   ©  Decision  Support  Systems  2014  
  • 5. Waar  komt  de  data  vandaan?   ©  Decision  Support  Systems  2014   Small  Data  -­‐  gestructureerd   !  Applica;es  van  de  organisa;e   !  Spreadsheets!   Big  Data  –  vaak  ongestructureerd   !  Processen  van  de  organisa;e:   me;ngen,  websites,  apparatuur   !  Communica;e:   e-­‐mail,  rapporten,  presenta;es   !  Sociale  media:   Facebook,  LinkedIn,  Twicer   !  Sensoren:   temperatuur,  weer,  files,  regen   !  Archieven:   oude  documenten,  oude  films    
  • 6.         Ongestructureerde  data  -­‐  een  defini;e   Ongestructureerde  data  is  niet  direct  als  veld  in   een  database  benaderbaar.  Hierbij  kan  het  gaan  om  allerlei  soorten   documenten  zoals  Office  documenten,  maar  ook  PDF,  XML,  e-­‐ mailberichten,  afeeldingen,  video's  en  geluid.    De  inhoud  bevat   vaak  datums,  cijfers  en  andere  feiten,  maar  is  met  moeilijk  te   interpreteren  met  de  huidige  technologie.     ©  Decision  Support  Systems  2014   We  hebben  in  2013  opnieuw  een  goed  jaar  gerealiseerd.  Vooral  in  de  tweede  jaarheli  namen  de  orders  in  diverse   markten  sterk  toe.  Deze  ontwikkeling  vertaalde  zich  in  een  omzetgroei  van  3%  (autonoom  +4,1%  tegen  constante   wisselkoersen)  en  een  EBITA-­‐groei  van  ruim  10%  voor  diezelfde  periode.  Over  het  gehele  jaar  steeg  de  omzet  naar   EUR  2.040  miljoen  (autonoom  +1,2%  tegen  constante  wisselkoersen).  Het  bedrijfsresultaat  (EBITA)  nam  eveneens   toe,  met  3%  naar  EUR  225  miljoen;  de  EBITA-­‐marge  kwam  uit  op  11,0% VOORWOORD  VAN  DE  CEO  van  Aalberts  Industries  
  • 7. Big  Data  is  een  aanvulling   ! Big  Data  is  een  aanvullende  bron,  niet  iets  dat  op   zichzelf  staat   ! het  doel  is  om  de  bestaande  data  te  completeren   ! “omzet”  uit  Big  Data  heei  dezelfde  defini;e  als   “omzet”  uit  Small  Data   ! kwaliteit  is  even  belangrijk:  zo  niet  is  Big  Data   gewoon  veel  slechte  data   ©  Decision  Support  Systems  2014  
  • 8. Hoe  wij  dingen  noemen  is  belangrijk   Hoeveel  heb     ik  verkocht?   Hoeveel  kan   ik  boeken?  Omzet   =  €  100,000   =  €  96,422   ©  Decision  Support  Systems  2014  
  • 9. ©  Decision  Support  Systems  2014           Net  zoals  de  meeste  IT  analisten  ben  ik  er  van  overtuigd   dat  de  kwaliteit  van  de  data  een  groot  risico  vormt  voor   onze  besluitvorming  –  het  probleem  is  dat  de  kwaliteit  van   de  data  zo  slecht  is  dat  wij  dit  niet  kunnen  bewijzen!   Norman  Manley,  IT  analyst   Data  kwaliteit  –  een  probleem?  
  • 10. Small  data  –  wat  zijn  de  problemen?   •  de  bestanden  hebben  vele  verschillende  formaten  dat   het  lezen  erg  moeilijk  kan  maken   •  het  is  vaak  onzeker  wat  de  inhoud  van  een  rubriek  is  (en   ook  wat  het  betekend)     •  privacy  is  een  probleem  –  mogen  wij  iets  zien,  en  mogen   wij  er  iets  meedoen?     •  data  ontbreekt  vaak  (zowel  individuele  rubrieken  als   delen  van  bestanden)     •  data  is  niet  actueel   ©  Decision  Support  Systems  2014  
  • 11. Het  Data  Integra;e  proces  –  de  basis  elementen   ©  Decision  Support  Systems  2014  
  • 12. ©  Decision  Support  Systems  2014   Big  Data  -­‐  wat  heei  het  voor  nut?  
  • 13. Hoe  nutg  is  big  data?   De  vier  motoren  van  een  Boeing   747  zouden  op  één  vlucht  van   Amsterdam  naar  New  York  meer   data  genereren  dan  de  meeste   bedrijven  in  één  jaar.     De  vraag  bliji:  moeten  wij  de  data  allemaal  bewaren,   zo  ja  voor  hoelang,  en  hoe  gaan  wij  die  gebruiken  om   informa;e  te  genereren  waar  wij  iets  aan  hebben?   ©  Decision  Support  Systems  2014  
  • 14. Dat  is  heel  veel  data!   ©  Decision  Support  Systems  2014  
  • 15. ©  Decision  Support  Systems  2014   Big  Data  successen   Vestas,  een  Deense  fabrikant  van  windmolens  gebruikt  data  van   meer  dan  35.000  meteorologische   meetstations  en  van  45.000  eigen  turbines.   Zo  bepalen  zij  de  beste  locaties,  qua  wind   stromen,  om  nieuwe  windmolens  te   plaatsen.  Zij  verwachten  24  petabytes  data   te  verzamelen  (nu  hebben  zij  2,8  petabytes).   Het  analyseren  van  één  nieuwe  locatie  is  terug  gebracht  van   enkele  weken  naar  15  minuten.  
  • 16. ©  Decision  Support  Systems  2014   Big  Data  successen   Los  Angeles  en  Santa  Cruz  politie,  hebben  samen  met  PredPol   (een  software  leverancier)  en  een  wiskundige  van  de  universiteit   van  Santa  Clara  een  systeem   ontwikkeld  dat  tot  50  m2   nauwkeurig   aangeeft  waar  men   crimineel  activiteit  kan   verwachten.  Een  combinatie  van   historische  en  data  van  “live”   camera’s  wordt  gebruikt  om  te  voorspelen  waar  de  politie   naartoe  moet  om  o.a.  inbraken  te  voorkomen.  Inmiddels  is  het   aantal  inbraken  met  33%  gedaald.  Het  systeem  heet  “predictive   policing”  
  • 17. Conclusies   ! als  de  Small  Data  niet  goed  werkt  dan  heei  Big   Data  geen  kans   ! Big  Data  op  zich  heei  geen  waarde  –  maar  het   geei  de  mogelijkheid  om  nieuwe  inzichten  te   generen   ! alles  draait  om  accuratesse  –  slechte  data  kwaliteit   leidt  tot  informa;e  die  nog  slechter  is   ©  Decision  Support  Systems  2014  
  • 18. ©  Decision  Support  Systems  2014   "Not  everything  that  can  be   counted  counts,  and  not   everything  that  counts  can   be  counted."   William  Bruce  Cameron  “Informal  Sociology:  A  Casual   Introduc;on  to  Sociological  Thinking”  1963