Presentatie van Dr. Piet Daas (CBS): 'Statistiek en grote data bestanden' tijdens het Big Data Analytics seminar 14 juni van Almere DataCapital in Almere.
Toepassing van Big Data in de Fysieke LeefomgevingErik Van Der Zee
Keynote presentatie over Big Data gerelateerd aan de Fysieke Leefomgeving op het Jong Leefomgeving mini symposium over Big Data op 19 mei 2016. De centrale vraag van deze middag luidt "Wat is de impact van Big Data op het werkveld van de fysieke leefomgeving?". Dit mini symposium is een initiatief van het Ministerie van Infrastructuur en Milieu, TNO en Netwerk Jong Leefomgeving
Big (sensor) Data and Smart City InteroperabilityErik Van Der Zee
Presentation for the Programmaraad Geonovum 9 juni 2016 about Big (sensor) Data and Smart City interoperability. In this presentation I stress the importance of the usage of international IoT standaards such as OGC SensorThings to prevent re-inventing the wheel and vendor lock-in. OGC SensorThings API facilitates smooth integration between smart city systems, using a standardized data model for sensing and actuating. Ideas to connect SensorThings and existing spatial information models in the Netherlands like IMGEO (which contains definitions of assets in public spaces, that can become smart assets in the near future)
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)Erik Van Der Zee
Key-Note presentatie op het Big Data symposium voor gezamenlijke provincies op 13 april 2016, georganiseerd door Geonovum in samenwerking met het Provinciaal Platform GEO (PP-GEO).
In deze presentatie wordt een beknopt overzicht van Big Data. Het geeft een introductie van het begrip big data, en de relatie met andere begrippen als Smart Cities, Internet of Things, en Open Data. Daarnaast komen een aantal "kwesties" aan de orde die met big data verbonden zijn, zoals privacy & security, opleiding, standaarden en architectuur, en worden een aantal huidige toepassingen van Big Data binnen de Nederlandse overheid uitgelicht. De presentatie geeft ook een visie op hoe provincies een coördinerende en verbindende rol kunnen vervullen bij de ontwikkeling van Smart Provincies, en geeft aan hoe het Platform Making Sense for Society van Geonovum daarbij kan ondersteunen
Toepassing van Big Data in de Fysieke LeefomgevingErik Van Der Zee
Keynote presentatie over Big Data gerelateerd aan de Fysieke Leefomgeving op het Jong Leefomgeving mini symposium over Big Data op 19 mei 2016. De centrale vraag van deze middag luidt "Wat is de impact van Big Data op het werkveld van de fysieke leefomgeving?". Dit mini symposium is een initiatief van het Ministerie van Infrastructuur en Milieu, TNO en Netwerk Jong Leefomgeving
Big (sensor) Data and Smart City InteroperabilityErik Van Der Zee
Presentation for the Programmaraad Geonovum 9 juni 2016 about Big (sensor) Data and Smart City interoperability. In this presentation I stress the importance of the usage of international IoT standaards such as OGC SensorThings to prevent re-inventing the wheel and vendor lock-in. OGC SensorThings API facilitates smooth integration between smart city systems, using a standardized data model for sensing and actuating. Ideas to connect SensorThings and existing spatial information models in the Netherlands like IMGEO (which contains definitions of assets in public spaces, that can become smart assets in the near future)
Key-Note Big Data - In a Nutshell (Big Data symposium provincies april 2016)Erik Van Der Zee
Key-Note presentatie op het Big Data symposium voor gezamenlijke provincies op 13 april 2016, georganiseerd door Geonovum in samenwerking met het Provinciaal Platform GEO (PP-GEO).
In deze presentatie wordt een beknopt overzicht van Big Data. Het geeft een introductie van het begrip big data, en de relatie met andere begrippen als Smart Cities, Internet of Things, en Open Data. Daarnaast komen een aantal "kwesties" aan de orde die met big data verbonden zijn, zoals privacy & security, opleiding, standaarden en architectuur, en worden een aantal huidige toepassingen van Big Data binnen de Nederlandse overheid uitgelicht. De presentatie geeft ook een visie op hoe provincies een coördinerende en verbindende rol kunnen vervullen bij de ontwikkeling van Smart Provincies, en geeft aan hoe het Platform Making Sense for Society van Geonovum daarbij kan ondersteunen
De presentatie van Marijn Fraanje, tijdens de parallelle sessie 'BOLD Cities' van het congres 'Data gedreven Beleidsontwikkeling' in Den Haag op 28 november 2017.
Presentatie big data (Dag van de verkoper, Cevora) IntoTheMinds
Presentatie gegeven in Antwerpen en Gent of 30 Mei 2017 en 18 Mei 2017 over Big Data en verkoop.
In deze introductie werd de theorie over Big Data uitgelegd zoals voorbeelden van toepassingen om data te valoriseren. Speciaal aandacht werd gevestigd op juridische aspecten zoals GDPR.
Tijdens dit webinar zal Eduvision ingaan op de rol van Big Data binnen de overheid. Bijbehorend bij webinar https://eduvision.nl/webinar/big-data-overheid
Big data voor rijksoverheid, gemeenten en andere publieke diensten. Nadruk op de werking en mogelijkheden van big data. Specifieke aandacht voor open data.
Doorbraakproject open geodata, grondstof voor groei en innovatieherbold
Het kabinet Rutte II zet in op het gebruik van ICT als middel om de economie te stimuleren en de concurrentiepositie van Nederland te verbeteren. Hiervoor zijn 10 doorbraakprojecten gedefinieerd die zich richten op het vergroten van gebruik en kennis van ICT. Deze projecten versterken het nationale ICT-beleid zoals dat is vastgelegd in de Digitale Agenda en worden uitgevoerd in een samenwerking tussen overheid, onderzoek & wetenschap en het bedrijfsleven. Het doorbraakproject "Open (geo)data als grondstof voor groei en innovatie" richt zich op het op gang brengen van het gebruik van de Open Data en het wegnemen van belemmeringen die ondernemers ondervinden in het gebruiken van Open Data van de Nederlandse overheid. Het project kiest hierbij nadrukkelijk het perspectief van de vraag en zal vanuit die positie belemmeringen zoals privacy, bestuurlijke ambitie en de dynamiek markt/overheid agenderen. Het op gang brengen van de vraag zal gedaan worden door het organiseren van een aantal sectorgerichte Open Data estafettebijeenkomsten die maatschappelijke vraag, ondernemers die toepassingen ontwikkelen en aanbieders van open data bij elkaar brengt.
De Nationale DenkTank 2014 onderzocht de kansen, mogelijkheden en bedreigingen van big data. Op InfraTrends presenteren ze de belangrijkste resulaten die vervolgens hebben geleid tot concrete oplossingen met grote maatschappelijke impact. Zo verzamelt de applicatie 'Op weg met Data' gegevens van alle auto’s, waardoor infrastructuurbeheerders kunnen achterhalen wat de kwaliteit van de weg is, waar het glad is en waar files staan. Leer van ex-Denktankers Janne Verstappen en Rik Plender hoe data slim kan worden ingezet binnen een organisatie en hoe je om gaat met de bottlenecks.
Exploit the Masses! Big Data en de ArchivarisKVANdagen
Big Data is een trendy term onder informatiedeskundigen, managers en bestuurders. Maar het is meer dan dat. Big Data heeft een groot effect op het gebruik van informatie. Het leidt tot een meerwaarde van informatie. Op dit moment wordt het concept Big Data vooral ingezet om op relatief korte termijn voorspellingen te doen op basis van recente informatie. Dat komt omdat de gedachtevorming nog volop in ontwikkeling is én omdat digitale data op deze schaal pas sinds kort bewaard blijven en dus voorhanden zijn. Er ontstaat duidelijkheid over de meerwaarde die schuilt in het type informatie dat tot voor kort werd gezien als ‘ruis’ en ‘ballast’. En dat meerwaardespectrum zal steeds breder worden, waarbij de bezitters van data uiteindelijk de grote winnaars zullen zijn. Hoe meer je verzamelt, hoe hoger je ‘marktwaarde’.
Wat zou dit kunnen betekenen voor archieven? Worden archieven, als databezitters, (economisch) steeds belangrijker? Krijgt archief, naast de bekende drie functies, door hergebruik nog een vierde – misschien
veel zwaardere – functie als grondstof voor informatieproducten? Wat betekent dit voor acquisitie, selectie en vernietiging? Hoe stel je de data beschikbaar en onder welke voorwaarden? Is een e-depot voldoende? En wie beheren die archieven dan: archivarissen of IT-specialisten? Kortom: in welke zin veranderen rol en functie van archief en archivaris als gevolg van deze ontwikkelingen?
Chido Houbraken
zelfstandig informatieadviseur - CHIDO
Exploit the masses! Big Data en de Archivaris (kvan14)adviesch
KVAN-dagen
Exploit the Masses! Big Data en de Archivaris
Datum: 16/06/2014
Tijd: 15:00 - 16:00
Lijn: Lijn 1a: Big data big future @Bioscoopzaal 2
Big Data is een trendy term onder informatiedeskundigen, managers en bestuurders. Maar het is meer dan dat. Big Data heeft een groot effect op het gebruik van informatie. Het leidt tot een meerwaarde van informatie. Op dit moment wordt het concept Big Data vooral ingezet om op relatief korte termijn voorspellingen te doen op basis van recente informatie. Dat komt omdat de gedachtevorming nog volop in ontwikkeling is én omdat digitale data op deze schaal pas sinds kort bewaard blijven en dus voorhanden zijn. Er ontstaat duidelijkheid over de meerwaarde die schuilt in het type informatie dat tot voor kort werd gezien als ‘ruis’ en ‘ballast’. En dat meerwaardespectrum zal steeds breder worden, waarbij de bezitters van data uiteindelijk de grote winnaars zullen zijn. Hoe meer je verzamelt, hoe hoger je ‘marktwaarde’.
Wat zou dit kunnen betekenen voor archieven? Worden archieven, als databezitters, (economisch) steeds belangrijker? Krijgt archief, naast de bekende drie functies, door hergebruik nog een vierde – misschien veel zwaardere – functie als grondstof voor informatieproducten? Wat betekent dit voor acquisitie, selectie en vernietiging? Hoe stel je de data beschikbaar en onder welke voorwaarden? Is een e-depot voldoende? En wie beheren die archieven dan: archivarissen of IT-specialisten? Kortom: in welke zin veranderen rol en functie van archief en archivaris als gevolg van deze ontwikkelingen?
Spreker(s) tijdens deze sessie:
Chido Houbraken
zelfstandig informatieadviseur - CHIDO
www.chido.nl
Slides van Karel Thönissen (Garabit). Beveiliging op het allerhoogste niveau: hoe beveilig ik staatsgeheimen?
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Slides van Steven van der Linden (directeur Qforce). Welke organisatorische maatregelen moet ik als ziekenhuis nemen om verantwoord mijn data extern op te laten slaan?
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
More Related Content
Similar to Dr. Piet Daas (CBS) - Statistiek en grote data bestanden
De presentatie van Marijn Fraanje, tijdens de parallelle sessie 'BOLD Cities' van het congres 'Data gedreven Beleidsontwikkeling' in Den Haag op 28 november 2017.
Presentatie big data (Dag van de verkoper, Cevora) IntoTheMinds
Presentatie gegeven in Antwerpen en Gent of 30 Mei 2017 en 18 Mei 2017 over Big Data en verkoop.
In deze introductie werd de theorie over Big Data uitgelegd zoals voorbeelden van toepassingen om data te valoriseren. Speciaal aandacht werd gevestigd op juridische aspecten zoals GDPR.
Tijdens dit webinar zal Eduvision ingaan op de rol van Big Data binnen de overheid. Bijbehorend bij webinar https://eduvision.nl/webinar/big-data-overheid
Big data voor rijksoverheid, gemeenten en andere publieke diensten. Nadruk op de werking en mogelijkheden van big data. Specifieke aandacht voor open data.
Doorbraakproject open geodata, grondstof voor groei en innovatieherbold
Het kabinet Rutte II zet in op het gebruik van ICT als middel om de economie te stimuleren en de concurrentiepositie van Nederland te verbeteren. Hiervoor zijn 10 doorbraakprojecten gedefinieerd die zich richten op het vergroten van gebruik en kennis van ICT. Deze projecten versterken het nationale ICT-beleid zoals dat is vastgelegd in de Digitale Agenda en worden uitgevoerd in een samenwerking tussen overheid, onderzoek & wetenschap en het bedrijfsleven. Het doorbraakproject "Open (geo)data als grondstof voor groei en innovatie" richt zich op het op gang brengen van het gebruik van de Open Data en het wegnemen van belemmeringen die ondernemers ondervinden in het gebruiken van Open Data van de Nederlandse overheid. Het project kiest hierbij nadrukkelijk het perspectief van de vraag en zal vanuit die positie belemmeringen zoals privacy, bestuurlijke ambitie en de dynamiek markt/overheid agenderen. Het op gang brengen van de vraag zal gedaan worden door het organiseren van een aantal sectorgerichte Open Data estafettebijeenkomsten die maatschappelijke vraag, ondernemers die toepassingen ontwikkelen en aanbieders van open data bij elkaar brengt.
De Nationale DenkTank 2014 onderzocht de kansen, mogelijkheden en bedreigingen van big data. Op InfraTrends presenteren ze de belangrijkste resulaten die vervolgens hebben geleid tot concrete oplossingen met grote maatschappelijke impact. Zo verzamelt de applicatie 'Op weg met Data' gegevens van alle auto’s, waardoor infrastructuurbeheerders kunnen achterhalen wat de kwaliteit van de weg is, waar het glad is en waar files staan. Leer van ex-Denktankers Janne Verstappen en Rik Plender hoe data slim kan worden ingezet binnen een organisatie en hoe je om gaat met de bottlenecks.
Exploit the Masses! Big Data en de ArchivarisKVANdagen
Big Data is een trendy term onder informatiedeskundigen, managers en bestuurders. Maar het is meer dan dat. Big Data heeft een groot effect op het gebruik van informatie. Het leidt tot een meerwaarde van informatie. Op dit moment wordt het concept Big Data vooral ingezet om op relatief korte termijn voorspellingen te doen op basis van recente informatie. Dat komt omdat de gedachtevorming nog volop in ontwikkeling is én omdat digitale data op deze schaal pas sinds kort bewaard blijven en dus voorhanden zijn. Er ontstaat duidelijkheid over de meerwaarde die schuilt in het type informatie dat tot voor kort werd gezien als ‘ruis’ en ‘ballast’. En dat meerwaardespectrum zal steeds breder worden, waarbij de bezitters van data uiteindelijk de grote winnaars zullen zijn. Hoe meer je verzamelt, hoe hoger je ‘marktwaarde’.
Wat zou dit kunnen betekenen voor archieven? Worden archieven, als databezitters, (economisch) steeds belangrijker? Krijgt archief, naast de bekende drie functies, door hergebruik nog een vierde – misschien
veel zwaardere – functie als grondstof voor informatieproducten? Wat betekent dit voor acquisitie, selectie en vernietiging? Hoe stel je de data beschikbaar en onder welke voorwaarden? Is een e-depot voldoende? En wie beheren die archieven dan: archivarissen of IT-specialisten? Kortom: in welke zin veranderen rol en functie van archief en archivaris als gevolg van deze ontwikkelingen?
Chido Houbraken
zelfstandig informatieadviseur - CHIDO
Exploit the masses! Big Data en de Archivaris (kvan14)adviesch
KVAN-dagen
Exploit the Masses! Big Data en de Archivaris
Datum: 16/06/2014
Tijd: 15:00 - 16:00
Lijn: Lijn 1a: Big data big future @Bioscoopzaal 2
Big Data is een trendy term onder informatiedeskundigen, managers en bestuurders. Maar het is meer dan dat. Big Data heeft een groot effect op het gebruik van informatie. Het leidt tot een meerwaarde van informatie. Op dit moment wordt het concept Big Data vooral ingezet om op relatief korte termijn voorspellingen te doen op basis van recente informatie. Dat komt omdat de gedachtevorming nog volop in ontwikkeling is én omdat digitale data op deze schaal pas sinds kort bewaard blijven en dus voorhanden zijn. Er ontstaat duidelijkheid over de meerwaarde die schuilt in het type informatie dat tot voor kort werd gezien als ‘ruis’ en ‘ballast’. En dat meerwaardespectrum zal steeds breder worden, waarbij de bezitters van data uiteindelijk de grote winnaars zullen zijn. Hoe meer je verzamelt, hoe hoger je ‘marktwaarde’.
Wat zou dit kunnen betekenen voor archieven? Worden archieven, als databezitters, (economisch) steeds belangrijker? Krijgt archief, naast de bekende drie functies, door hergebruik nog een vierde – misschien veel zwaardere – functie als grondstof voor informatieproducten? Wat betekent dit voor acquisitie, selectie en vernietiging? Hoe stel je de data beschikbaar en onder welke voorwaarden? Is een e-depot voldoende? En wie beheren die archieven dan: archivarissen of IT-specialisten? Kortom: in welke zin veranderen rol en functie van archief en archivaris als gevolg van deze ontwikkelingen?
Spreker(s) tijdens deze sessie:
Chido Houbraken
zelfstandig informatieadviseur - CHIDO
www.chido.nl
Slides van Karel Thönissen (Garabit). Beveiliging op het allerhoogste niveau: hoe beveilig ik staatsgeheimen?
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Slides van Steven van der Linden (directeur Qforce). Welke organisatorische maatregelen moet ik als ziekenhuis nemen om verantwoord mijn data extern op te laten slaan?
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Slides van Maarten Stultjens (Elephant Security). Hoe regel ik als ziekenhuis mijn autorisaties in een cloudomgeving?
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Slides van Sampo Kellomäki (CTO Synergetics). Datagebruik via Trustplatform en Privacy by Design.
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Slides van Peter Kits (ICT-advocaat Holland Van Gijzen). Relevante nieuwe ontwikkelingen in wet- en regelgeving rond privacy en security.
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Prof. mr. Sijmons (Universiteit Utrecht) @ PIDS seminarAlmereDataCapital
Slides van Prof. mr. Jaap Sijmons (hoogleraar Gezondheidsrecht UU). Huidige wet- en regelgeving belemmert externe data/cloudopslag in de zorg niet! Van wie zijn die zorgdata nu eigenlijk?
Gepresenteerd tijdens Privacy, Identity & Security (PIDS) seminar van Almere DataCapital, zie www.almeredatacapital.nl.
Roland Haeve (Atos): 'Using the Cloud for Big Data Analytics'AlmereDataCapital
Presentatie van Roland Haeve (Atos): 'Using the Cloud for Big Data Analytics' tijdens het Big Data Analytics seminar 14 juni van Almere DataCapital in Almere.
Maurice Bouwhuis (SARA/Vancis) - Hoe big data te begrijpen door ze te visuali...AlmereDataCapital
Presentatie van Maurice Bouwhuis (SARA/Vancis): ‘Hoe big data te begrijpen door ze te visualiseren’ tijdens het Big Data Analytics seminar 14 juni in Almere
Gerard Jansen (CEO Alan Turing Institute) - Alan Turing Institute: brengt dat...AlmereDataCapital
Presentatie van Gerard Jansen (CEO Alan Turing Institute) - ‘Alan Turing Institute: brengt data tot leven’ tijdens het Big Data Analytics seminar 14 juni in Almere
Bert Reijmerink (Genalice) - Hoe technologie bijdraagt aan een betere behande...AlmereDataCapital
Presentatie van Bert Reijmerink (Genalice) - 'Hoe technologie bijdraagt aan een betere behandeling van kankerpatiënten' tijdens het Big Data Analytics seminar 14 juni in Almere
Carlijn Nouwen (McKinsey) - Keynote: Big Data in de ZorgAlmereDataCapital
De presentatie van Carlijn Nouwen (McKinsey) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Sjaak van der Pouw (Siemens Healthcare) - Beeldexplosie: de mogelijkheden van...AlmereDataCapital
De presentatie van Sjaak van der Pouw (Siemens Healthcare) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
De presentatie van Nicky Hekster (IBM) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
De presentatie van Freek Bomhof (TNO) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Harro Stokman (Euvision) - Big Brother Watches Big DataAlmereDataCapital
De presentatie van Harro Stokman (Euvision) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Arjan Hassing (Ernst & Young) - Kosten besparen op big data storageAlmereDataCapital
De presentatie van Arjan Hassing (Ernst & Young) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Lex Pater (Flevoziekenhuis) - Slim omgaan met ziekenhuisdataAlmereDataCapital
De presentatie van Lex Pater (Flevoziekenhuis) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Prof. Ard den Heeten (LRCB) - Brondata: kennis uit ruwe dataAlmereDataCapital
De presentatie van Prof. Ard den Heeten (LRCB) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Peter Walgemoed (Carelliance) - Businessmodels for Big DataAlmereDataCapital
De presentatie van Peter Walgemoed (Carelliance) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.
Peter Walgemoed (Carelliance) - Businessmodels for Big Data
Dr. Piet Daas (CBS) - Statistiek en grote data bestanden
1. Statistiek en grote data
bestanden
Piet Daas, Martijn Tennekes, Edwin de Jonge,
Alex Priem en Merijn van Pelt
Centraal Bureau voor de Statistiek
Big Data Analytics, 14 Juni Almere
2. Centraal Bureau voor de Statistiek
• Taak: “het publiceren van betrouwbare en
samenhangende statistische informatie, die
inspeelt op de behoefte van de samenleving”.
• in 2012 zo’n kleine 5000 officiële publicaties & tabellen
• Doel: maximale vermindering van administratieve
lasten
• Door bestaande administratieve bestanden te
hergebruiken.
• Kijken naar de nieuwe bronnen van informatie: Big Data!
Big Data Analytics 14 Juni Almere 1
3. CBS en gegevens
Flinke verandering in gebruik beschikbare informatie voor
statistiekproductie:
1. Enquêtegegevens (steeds minder)
Per enquête tot max. 100.000 records per jaar
2. Administratieve bronnen (steeds meer)
Per bron tot 20 miljoen records per maand
• Ook steeds meer ‘nieuwe’ bronnen (Big Data)
Per bron zo’n 40-80 miljoen records per dag
Big Data Analytics 14 Juni Almere 2
4. CBS en gegevens (2)
• Er is steeds meer en steeds vaker data beschikbaar:
• Van ‘Data schaarste’ (steekproef-) naar ‘Data overdaad’
• Steeds grotere hoeveelheden data moeten snel
gecontroleerd, verwerkt en geanalyseerd worden
• Meer aandacht voor selectiviteit en datatransformatie
• Meer mogelijkheden voor snelle cijfers (‘real-time
statistics’)
• Behoefte aan nieuwe methoden en tools
• Statistische methoden geschikt voor grote datasets
• Denk aan: visualisatie methoden en data-, tekst- en
stream-mining technieken
Big Data Analytics 14 Juni Almere 3
5. Nieuwe ontwikkelingen
• Voorbeelden uit de praktijk
1) Visualisatie-methoden om snel inzicht te krijgen
in grote hoeveelheden gegevens
a. Virtuele Volkstelling (17 miljoen records)
b. Polisadministratie (20 miljoen records)
2) Bevindingen van onderzoek gebruik Big Data
bronnen
c. Verkeerslusgegevens (80 miljoen records)
• Mobiele telefonie (~500 miljoen records)
Big Data Analytics 14 Juni Almere 4
6. Voorbeeld a. Virtuele Volkstelling
• Volkstelling is verplicht, eens in 10-jaar
• In Nederland niet meer met vragenlijsten
• Laatste traditionele volkstelling in 1971
• Nu door (her)gebruik van reeds verzamelde
informatie
• Grootschalig koppelen van administratieve bronnen en
enquêtegegevens
• Controleren en bijschatten
• Hoe controleren?
• Met een visualisatiemethode: Tableplot
Big Data Analytics 14 Juni Almere 5
8. Voorbeeld b: Polisadministratie
• Bestand met de financiële gegevens van
alle banen, uitkeringen en pensioenen in
Nederland
• Verzameld door Belastingdienst en UWV
• Elke maand 20 miljoen records
• Hoe krijgen we inzicht in deze enorme bak
data?
• Met een visualisatie: heat map
Big Data Analytics 14 Juni Almere 7
10. In 3D heatmap: Leeftijd, Inkomen, Aantal
Na ‘in
dikken
’
leef
tijd
leef
tijd
Big Data Analytics 14 Juni Almere 9
11. Voorbeeld c: Verkeerslusgegevens
• Verkeerslussen
• Elke minuut (24/7) wordt het aantal
passerende voertuigen op ~10.000
meetpunten in Nederland geteld
• Totaal en in verschillende lengtecategorieën
• Mooie bron om verkeer- en vervoerstatistieken
mee te maken
• Veel data, zo’n 80 miljoen records per dag
Big Data Analytics 14 Juni Almere 10
14. Na ‘gaafmaken’ van lusdata (op macroniveau)
Maar op microniveau
Big Data Analytics 14 Juni Almere 13
15. Nog steeds op microniveau veel ‘ruis’
Big Data Analytics 14 Juni Almere 14
16. Kijk naar trend: voortschrijdend gemiddelde
60 min gem.
30 min gem.
20 min gem.
10 min gem.
5 min gem.
origineel
Big Data Analytics 14 Juni Almere 15
17. Voorbeeld d: Mobiele telefoon
• Vrijwel elke Nederlander heeft een ‘mobieltje’
• Bijna altijd bij zich en staat vrijwel altijd aan
• Steeds meer mensen hebben een smartphone!
• Ideale informatiebron om:
• Met behulp van registraties van providers:
• Verplaatsingsgedrag (‘Dag’-populatie)
• Toerisme (nieuwe aanmeldingen op netwerk)
• Mensenmassa’s (bijv. bij evenementen)
• Als meetinstrument te gebruiken voor:
• Vragenlijsten (via App, SMS of browser)
• Maken van foto’s van producten, kassabonnen en streepjescodes
• Doorgeven exacte locatie (GPS)
• Etc.
Big Data Analytics 14 Juni Almere 16
18. Verplaatsingsgedrag mobiele telefoons
Verplaatsingen van zeer
actieve mobiele gebruikers
- gedurende 14 dagen
- van één provider
Gebaseerd op:
- Bel- en SMS-activiteit
meer dan 1x / dag
- Locatie telefoonmasten
Duidelijk selectief:
- Wel de grote steden
- Nauwelijks ‘t noorden
en zeeland
Big Data Analytics 14 Juni Almere 17
19. Afsluitend: Statistiek en ‘Big Data’
• Geschikt maken voor statistisch gebruik is veel werk
• Vooronderzoek nodig, kost veel tijd
• Informatiereductie (‘indikken’) nodig
• Risico: ‘garbage in’ ‘garbage statistics out’
• Traditionele aanpak schiet te kort
• Zijn geen steekproefgegevens meer
• Betreft vaak een selectief deel van de populatie
• Soms te veel data (overdekking & teveel detail)
• Bij standaard analyses wordt alles significant!
• Meer behoefte aan:
• Visualisatiemethoden (om snel inzicht te krijgen)
• Snelle methoden en niet-lineaire schatters
• ‘Computational statistics’ (& snelle hardware)
• Privacy-eisen worden hoger!
Big Data Analytics 14 Juni Almere 18