1. D: DRIVE
Hoe word ik data gedreven?
This programme has been funded with
support from the European Commission
Module 3: Verbetering van de
huidige activiteiten met externe
data
2. Smart Data Smart Region | www.smartdata.how
»De steun van de Europese Commissie voor de productie van deze publicatie vormt geen
goedkeuring van de inhoud die uitsluitend de mening van de auteurs weerspiegelt, en de
Commissie kan niet aansprakelijk worden gesteld voor het gebruik van de informatie die erin is
vervat.«
Het doel van deze module is om een overzicht te krijgen
hoe je de data die buiten jouw bedrijf beschikbaar zijn,
kunt gebruiken om jouw bedrijf te verbeteren.
Na voltooiing van deze module zal je:
• De basisprincipes van externe data en waar jij deze
kunt vinden geleerd hebben
• In staat zijn te herkennen dat er al veel Open Data
beschikbaar is die je zou kunnen gebruiken
• De voordelen van het gebruik van de externe data om
jouw bedrijf te verbeteren inzien
Duur van de module: ongeveer 2 – 3 hours
Module 3: Het
verbeteren van de
huidige bedrijfsvoering
met externe data
3. 1 Externe data
2
Smart Data Smart Region | www.smartdata.how
– De voordelen van externe data
– De uitdagingen die gepaard gaan met het
gebruik van de externe data
– Waarom externe data de brandstof van
jouw bedrijf zijn
Het zakelijke aspect van externe data
– Primaire data
• Bronnen van primaire data
– Secundaire gegevens
• Bronnen van secundaire data
– Open Data
• Open data definiëren
• Big Data versus Open Data
• Voordelen
– Factoren van datakwaliteit
4. EXTERNE DATA
1. Primaire data
1. Bronnen van primaire data
2. Secundaire data
1. Bronnen van secundaire data
3. Open data
1. Open data definiëren
2. Big Data versus Open Data
3. Voordelen
4. Datakwaliteitsfactoren
5. Data is overal. Dat feit is niet noodzakelijkerwijs
nieuw of interessant - grote denkers van vorige
generaties hebben lang gebruik gemaakt van data
om hun beslissingen te informeren, hypothesen te
creëren en te testen en de wereld te proberen te
veranderen.
Maar "data is everywhere" heeft voor onze
generatie niet dezelfde betekenis als voor eerdere
generaties. Voor ons is het een knipoog naar het
feit dat we meer verbonden met elkaar zijn, met
de bedrijven waar wij van kopen en met de
wereld dan ooit tevoren. Dankzij de brede
acceptatie en het gebruik van internet hebben we
tegenwoordig onmiddellijke en realtime toegang
tot een onbegrijpelijk grote hoeveelheid data.
Smart Data Smart Region | www.smartdata.how
6. Wanneer de meeste mensen aan Big Data en
Business Intelligence denken, denken ze aan
interne data (module 2). Maar het probleem met
interne data is dat het slechts een deel van de foto
schildert.
Dus wat ontbreekt er?
Het antwoord is, zoals je misschien al geraden
had, externe data.
Smart Data Smart Region | www.smartdata.how
7. Externe gegevens kunnen worden onderverdeeld in twee categorieën:
1. Primaire data
• Het verwijst naar de informatie verzameld door de onderzoeker uit originele bronnen.
Het zijn geen gepubliceerde gegevens; het moet door de onderzoeker zelf worden
verzameld door verschillende bronnen te gebruiken. Primaire data worden meestal
verzameld voor specifieke doeleinden.
• Het is een zeer langzaam proces van het verzamelen van gegevens en brengt enorme
kosten met zich mee. Maar de resultaten die uit deze gegevens zijn verkregen, zijn
origineel en hebben de neiging nauwkeuriger en betrouwbaarder te zijn.
2. Secundaire data
• Er bestaan al secundaire data die door sommige personen of instellingen zijn
verzameld en gepubliceerd. Deze gegevens zijn beschikbaar voor een zeer lage prijs en
het kost minder tijd om het te verzamelen.
• Open data!
Smart Data Smart Region | www.smartdata.how
EXTERNE DATA
Externe data heeft
betrekking op gegevens die
van buiten een organisatie
zijn gegenereerd. Het kan
uit verschillende plaatsen
komen en bijna elke
branche in de zakenwereld
bedienen.
Smart Data Smart Region | www.smartdata.how
8. PRIMAIRE DATA
Smart Data Smart Region | www.smartdata.how
Primaire data zijn uniek, origineel, betrouwbaar en nauwkeurig van aard, omdat het niet is veranderd of gewijzigd door mensen, daarom is de geldigheid ervan
groter dan secundaire data. Het wordt ook speciaal verzameld voor een onderzoeksproject.
Interview Vragenlijst Focus groep
Gemeenschapsforums
en openbare
hoorzittingen
Observaties
Case Study
Belangrijk
informanten interview
Online
onderzoeksmethoden
Er zijn verschillende methoden om primaire data te verzamelen:
9. Smart Data Smart Region | www.smartdata.how
Een vragenlijst is een onderzoeksinstrument dat bestaat uit een reeks vragen (of andere soorten prompts)
om informatie van respondenten te verzamelen. Er kan een onderscheid worden gemaakt tussen
vragenlijsten met vragen die afzonderlijke variabelen meten en vragenlijsten met vragen die worden
samengevoegd in een schaal of index. Vragenlijsten met vragen die afzonderlijke variabelen meten, kunnen
bijvoorbeeld vragen over:
• voorkeuren (bijvoorbeeld politieke partij)
• gedrag (bijvoorbeeld voedselconsumptie)
• feiten (bijvoorbeeld geslacht)
Vragenlijsten met vragen die zijn samengevoegd in een schaal of index, omvatten bijvoorbeeld vragen die
meten:
• latente eigenschappen
• attitudes (bijvoorbeeld ten aanzien van immigratie)
• een index (bijvoorbeeld sociale economische status)
Vragenlijst
PRO‘s
•Goedkoop
•Het kan op grote schaal worden gebruikt
•Snel
•Eenvoudig te analyseren
CON‘s
•Zeer lage retourtarieven
•Vanwege de specifieke vragen kan de
verkregen informatie minimaal zijn
•Ze kunnen behoorlijk grote meetfouten
bevatten
•Het ontvangen van ingevulde vragenlijsten
duurt lang
10. Vragenlijst Marktonderzoek
Deze studie wordt door
universiteit Inholland, als deel
van de marktonderzoek opdracht
afgenomen.
Dit is een vragenenquête over
Ben & Jerry’s merk ijs. Door de
lijst kan Ben & Jerry hun merk
verbeteren doormiddel van in de
behoefte van hun consumenten
te voorzien. Het invullen van
deze vragenlijst duurt ongeveer
tien minuten.
Deze studie is alleen voor
educatie doeleinden en niet voor
commerciële doeleinden bedoel.
Deze vragenlijst werd
steekproefsgewijs, A-selecte,
onder Amsterdamse burgers en
Inholland studenten verspreid.
Geheel anoniem.
11. Smart Data Smart Region | www.smartdata.how
Een interview in kwalitatief onderzoek is een gesprek waarbij vragen worden gesteld om informatie te
verzamelen. De interviewer is meestal een professionele of betaalde onderzoeker, soms getraind, die vragen
aan de geïnterviewde stelt in een afwisselende reeks van meestal korte vragen en antwoorden.
Bij het kiezen van een interview als methode voor het uitvoeren van kwalitatief onderzoek, is het belangrijk
om tactvol en gevoelig te zijn in jouw aanpak. Hoewel een interviewer in het algemeen elk interview met een
vooraf bepaalde, gestandaardiseerde reeks vragen binnenbrengt, is het belangrijk dat ze ook tijdens het hele
proces vervolgvragen stellen. Zulke vragen kunnen een deelnemer aanmoedigen uit te weiden over iets
schokkends dat ze hebben gedeeld en zijn belangrijk bij het verkrijgen van een meer uitgebreid begrip van
het onderwerp. Daarnaast is het belangrijk dat een interviewer vragen stelt als ze in de war zijn. Als het
verhaal, de details of de chronologie van de antwoorden van een deelnemer onduidelijk worden, is het vaak
gepast voor de interviewer om hen te vragen deze aspecten van hun verhaal opnieuw uit te leggen om hun
transcripties accuraat te houden.
Interview
PRO‘s
• Eenvoudig en handig
• Bespaart tijd, geld en arbeid
• Handig bij het onderzoeken van een groot
gebied
• Adequate informatie kan worden verkregen
CON‘s
•Informatie kan niet worden gebruikt als
afwezigheid van direct contact
•Interview met een ongepast persoon zal de
resultaten bederven
•Om echte gegevens te krijgen, moet een
voldoende aantal mensen worden
geïnterviewd
•Onzorgvuldige houding van informant
beïnvloedt de mate van nauwkeurigheid
12.
13. Smart Data Smart Region | www.smartdata.how
De essentie van de enquêtemethode kan worden uitgelegd als "individuen vragen stellen over een
onderwerp of onderwerpen en vervolgens hun antwoorden beschrijven". Bij bedrijfskundige enquêtes wordt
de methode van primaire gegevensverzameling gebruikt om concepten te testen, de houding van mensen
weer te geven, de mate van klanttevredenheid vast te stellen, onderzoek naar segmentatie uit te voeren en
een reeks andere doeleinden.
De enquêtemethode heeft twee hoofddoelen:
• Beschrijven van bepaalde aspecten of kenmerken van de bevolking en / of
het testen van hypothesen over de aard van relaties binnen een populatie.
De enquêtemethode kan grofweg in drie categorieën worden onderverdeeld:
• mailenquête - een schriftelijke enquête die zelf wordt beheerd
• telefonische enquête - een telefonische enquête waarbij de vragen worden voorgelezen aan de
respondenten
• persoonlijk interview - een face-to-face interview van de respondent
Enquête
PRO‘s
•Zeer nauwkeurig, betrouwbaar en geldig
•Maakt vergelijkingen met andere / grotere
populaties mogelijk als items afkomstig zijn
van bestaande instrumenten
•Genereert eenvoudig kwantitatieve
gegevens
CON‘s
•Relatief hoge kosten
•Traag om te ontwerpen, implementeren en
analyseren
•De nauwkeurigheid is afhankelijk van wie en
hoeveel mensen zijn gesampled
•Kan lage responscijfers hebben
•Weinig gelegenheid om kwesties diepgaand
te verkennen
14.
15. Smart Data Smart Region | www.smartdata.how
Een case study is een onderzoeksmethode waarbij een onderwerp van studie (de casus) van dichtbij,
diepgaand en gedetailleerd wordt onderzocht, evenals de bijbehorende contextuele omstandigheden. Bij
case study-onderzoek kan de "case" die wordt bestudeerd een persoon, organisatie, gebeurtenis of actie zijn
die op een specifieke tijd en plaats bestaat. De klinische wetenschap heeft bijvoorbeeld zowel bekende case-
study's van individuen als case-studies van klinische praktijken geproduceerd. Wanneer 'case' echter in
abstracte zin wordt gebruikt, zoals in een claim, een stelling of een argument, een casus kan het onderwerp
zijn van veel onderzoeksmethoden, niet alleen casestudy-onderzoek.
Casestudieonderzoek kan bestaan uit enkele en meervoudige casestudy's, kan kwantitatief bewijs omvatten,
is gebaseerd op meerdere bronnen van bewijsmateriaal en heeft baat bij de voorafgaande ontwikkeling van
theoretische proposities.
Case Study
PRO‘s
• Direct gedragsonderzoek
• Echte en persoonlijke ervaring
vastleggen
• Maak de studie van sociale verandering
mogelijk
• Vergroot analysecapaciteit en
vaardigheden
CON‘s
• Elk geval verschilt van een ander geval
• Persoonlijke vooringenomenheid
• Het kan alleen in een beperkte sfeer
worden gebruikt
• Het vraagt meer tijd
• Geld verslindend
16.
17. Smart Data Smart Region | www.smartdata.how
Een focusgroep is een kleine, maar demografisch diverse groep mensen en van wie de reacties vooral in
marktonderzoek of politieke analyse worden bestudeerd in begeleide of open discussies over een nieuw
product of iets anders om de reacties te bepalen die van een grotere bevolking kunnen worden verwacht.
Het is een vorm van kwalitatief onderzoek bestaande uit interviews waarin een groep mensen wordt
gevraagd naar hun percepties, meningen, overtuigingen en attitudes ten aanzien van een product, dienst,
concept, advertentie, idee of verpakking. Vragen worden gesteld in een interactieve groepsomgeving waar
deelnemers vrij zijn om met andere groepsleden te praten. Tijdens dit proces neemt de onderzoeker notities
of legt hij de vitale punten vast die hij of zij van de groep krijgt. Onderzoekers moeten zorgvuldig de leden
van de focusgroep selecteren op effectieve en officiële antwoorden.
Focus groep
PRO‘s
•Lage kosten
•Snelle data verzameling
•Deelnemers definiëren wat belangrijk is
•Enige gelegenheid om kwesties diepgaand te
onderzoeken
•Mogelijkheid om antwoorden via sondes op
te helderen
CON‘s
•Kan tijdrovend zijn om groepen samen te
stellen
•Produceert beperkte kwantitatieve gegevens
•Vereist opgeleide facilitators
•Minder controle over het proces dan
interviews met sleutelinformanten
•Moeilijk om gevoelige informatie te
verzamelen
•Het kan moeilijk zijn om de bevindingen te
analyseren en samen te vatten
18. Fig. 3 Voorbeeld focus groep script
Interviewer
Wanneer jij naar de tandarts gaat, wat is het aller
belangrijkste voor jou? Wat zoek jij in een tandarts?
Participant A Netheid, het moet een schone en mooie omgeving zijn.
(Vrouw) Als een heel mooie plek waar je naartoe zou willen gaan.
Overeenstemmende geluiden
(verschillende groepsleden knikken instemmend)
Participant B
Ik heb een leuke tandarts. Hij is altijd heel voorzichtig en
als ik ga
(Vrouw)
binnenkom, weet hij mijn naam en vraagt mij altijd naar ,ij
kleinkinderen.
Vervolgens kijkt hij mijn mond na en zegt 'geen
problemen vandaag'.
Participant C Jij hebt geluk. De mijne vind altijd wel wat te doen.
(Man) Wat gelach
Participant B
Nou ja, ik heb altijd al sterke tanden gehad. Ik denk dat dit
door
(Vrouw)
de oorlog komt. Als kinderen hadden wij nooit snoep of
zoiets.
(Glimlachen)
Interviewer Dus, een paar dingen naar te kijken. Een is de omgeving -
hoe ziet de omgeving eruit? Het andere is dat de tandarts
jou onthoud. Iemand anders nog?
Participant D
Vroeger ben ik met mijn kinderen veel bij tandartsen
geweest
en ik dacht dat als ze met mijn kinderen goed waren, ze
ook
wel goed met zij zouden zijn. Snap je wat ik bedoel?
(kijkt rond en mensen knikken instemmend)
19. Smart Data Smart Region | www.smartdata.how
Observatie, zoals de naam al aangeeft, is een manier om gegevens/data te verzamelen door te observeren.
Observatiegegevensverzamelingsmethode is geclassificeerd als een participerende studie, omdat de
onderzoeker zich moet onderdompelen in de omgeving waarin haar respondenten zich bevinden, tijdens het
maken van aantekeningen en/of opname.
Observatie als een methode voor het verzamelen van gegevens kan gestructureerd of ongestructureerd zijn.
Bij gestructureerde of systematische observatie, wordt het verzamelen van gegevens uitgevoerd met behulp
van specifieke variabelen en volgens een vooraf gedefinieerd schema. Ongestructureerde waarneming
daarentegen wordt op een open en vrije manier uitgevoerd in de zin dat er geen vooraf bepaalde variabelen
of doelstellingen zijn.
Observaties
PRO‘s
•Omgeving is natuurlijk, flexibel en
ongestructureerd
•Evaluator kan zijn / haar identiteit kenbaar
maken of anoniem blijven
•Evaluator mag actief deelnemen of passief
observeren
•Kan worden gecombineerd met verschillende
andere methoden voor het verzamelen van
gegevens
•Genereert relevante, kwantificeerbare gegevens
•Zeer nuttig voor het bestuderen van kleinere
eenheden
CON‘s
•Vereist een ervaren waarnemer
•De beoordelaar heeft minder controle over de
situatie in een natuurlijke omgeving
•Hawthorne-effect - als de groep weet dat ze
worden waargenomen, kan het resulterende
gedrag worden beïnvloed
•Kan niet worden gegeneraliseerd naar de gehele
populatie tenzij een plan voor representativiteit
wordt ontwikkeld
20. Waarnemingen werden elke 15 seconden
geregistreerd en in gedragscategorieën geplaatst
Intensiteit
Nabijheid
en contact
zoeken
Contact
behouden
Nabijheid
en
interactie
vermijdend
Nabijheid
en
interactie
bestendig
Zoekende
21. Smart Data Smart Region | www.smartdata.how
Belangrijke informant interview zijn kwalitatieve, diepte-interviews met 15 tot 35 mensen geselecteerd voor
hun kennis uit de eerste hand over een onderwerp dat van belang is. De interviews zijn los gestructureerd en
steunen op een lijst met problemen die moeten worden besproken. Belangrijke informant interviews lijken
op een gesprek tussen bekenden, waardoor een vrije stroom van ideeën en informatie mogelijk is.
Interviewers ordenen spontaan vragen, zoeken naar informatie en nemen aantekeningen, die later worden
uitgewerkt.
Hieronder volgen twee veelgebruikte technieken voor het uitvoeren van belangrijke informanteninterviews:
• Telefonische interviews
• Face-to-Face-interviews
Belangrijke
informant
interview
PRO‘s
•Lage kosten
•Respondenten definiëren wat belangrijk is
•Snelle gegevensverzameling
•Mogelijk om kwesties diepgaand te verkennen
•Mogelijkheid om antwoorden via sondes op te
helderen
•Bronnen van leads naar andere
gegevensbronnen en andere belangrijke
informanten
CON‘s
•Kan tijdrovend zijn om interviews met drukke
informanten op te zetten
•Vereist bekwame en / of getrainde interviewers
•Nauwkeurigheid is beperkt en moeilijk te
beveiligen
•Produceert beperkte kwantitatieve gegevens
•Het kan moeilijk zijn om de bevindingen te
analyseren en samen te vatten
22. Belangrijke Informant Interview Vragen
Risico- en beschermingsfactoren op elk van de vier
niveaus van een sociaal-ecologisch model
Wat werkt goed bij familie, een maatschappij,
systeem en beleid om te voorkomen dat
verwaarlozing optreedt?
Welke inspanningen moeten worden geleverd om
significante gevolgen voor het voorkomen van
verwaarlozing te hebben?
Rol / bijdragen van het Bondgenootschap
Rol / bijdragen te leveren door de CTF's
23. Smart Data Smart Region | www.smartdata.how
Een reeks openbare bijeenkomsten om de gemeenschap te betrekken bij het definiëren en bespreken van
behoeften. Deze methoden zijn technieken voor het verzamelen van gegevens uit de politieke arena.
Gemeenschapsforums zijn minder formeel en open voor het publiek, terwijl hoorzittingen getuigenissen van
geselecteerde getuigen zijn en vaak een samenvattend verslag uitbrengen.
Gemeenschap
sforums en
openbare
hoorzittingen
PRO‘s
•Ze kunnen de geloofwaardigheid van het
behoeften beoordelingsproces verhogen door
openheid en inclusie te bevorderen
•Deze activiteiten zijn goedkoop en relatief
eenvoudig te regelen
•Gemeenschapsleden die niet zijn geselecteerd
voor het plannen van een groepslidmaatschap,
kunnen deelnemen
•Forums en hoorzittingen kunnen het niveau
van bewustzijn en begrip vergroten over jouw
probleem en het initiatief voor
gemeenschapsplanning
•Deze methoden kunnen een manier zijn om
gemeenschapseigendom en investeringen in
jouw probleem en het planningsproces op te
bouwen
•De vergaderingen kunnen problemen aan het
licht brengen die verder onderzoek
rechtvaardigen
CON‘s
•Gemeenschapsleden die ervoor kiezen om deel
te nemen, zijn mogelijk niet volledig
representatief voor de gemeenschap; Onthoud
dat sommige mensen met goede ideeën of een
duidelijk begrip van de problemen niet graag
spreken op dergelijke evenementen
•Alleen omdat de behoeften welsprekend en
met veel luisteraars kunnen worden genoemd,
betekent dit niet dat andere methoden voor
gegevensverzameling moeten worden
verdisconteerd
•Sta niet toe dat representatie te smal wordt; de
geïdentificeerde behoeften zijn afhankelijk van
de kenmerken en achtergronden van degenen
die deelnemen
•Gebruik geen hoorzittingen / fora als jouw
primaire gegevensverzamelingsmethode
24.
25. Smart Data Smart Region | www.smartdata.how
Online onderzoeksmethoden zijn de digitale hulpmiddelen en processen die worden gebruikt om informatie
over een onderwerp via een zoekopdracht op internet te verzamelen. De verzamelde informatie kan zowel
feitelijke informatie als de mening van deskundigen bevatten. Ze helpen mensen snel de informatie te vinden
die ze nodig hebben. Online tools geven direct informatie. Deze informatie zou veel langer duren om te
vinden met behulp van offline onderzoeksmethoden (zoals het zoeken naar boeken in een bibliotheek).
Sommige specifieke soorten methoden omvatten:
• Cyber-etnografie
• Online inhoudsanalyse
• Online focusgroepen
• Online interviews
• Online kwalitatief onderzoek
• Online vragenlijsten
• Sociale netwerkanalyse
• Web-gebaseerde experimenten
• Online klinische proeven
Online
onderzoeksme
thoden
PRO‘s
•Geautomatiseerde gegevensverzameling
•Minimale kosten
•Eenvoudiger richten van respondenten op
verschillende segmentatievariabelen
•Snelle doorlooptijd
CON‘s
•Beperkt tot internetpopulatie
•Respondent-fraude en vooringenomenheid
•Vooringenomen onderzoeker
27. SECUNDAIRE DATA
Smart Data Smart Region | www.smartdata.how
Secundaire data zijn onderzoeksgegevens die
eerder zijn verzameld en die voor onderzoekers
toegankelijk zijn. De term staat in contrast met
primaire data, gegevens die rechtstreeks bij de
bron worden verzameld.
Secundaire data worden gebruikt om de
steekproefomvang van onderzoek studies te
vergroten en worden ook gekozen voor de
efficiëntie en snelheid die wordt geboden door
het gebruik van een reeds bestaande bron.
Secundaire data faciliteren grote
onderzoeksprojecten, waarbij veel
onderzoeksgroepen die in tandem werken
secundaire data verzamelen. De
hoofdonderzoeker mag zich dan concentreren op
primair onderzoek of op specifieke
aandachtsgebieden. Deze arbeidsverdeling helpt
onderzoekers om meer te leren in minder tijd.
28. Smart Data Smart Region | www.smartdata.how
Bronnen van secundaire data:
GEPUBLICEERDE GEDRjijKTE BRONNEN
Boeken
Boeken zijn vandaag
beschikbaar over elk
onderwerp dat jij
wilt onderzoeken.
Het gebruik van
boeken begint al
voordat je het
onderwerp hebt
geselecteerd. Na
selectie van
onderwerpen geven
boeken inzicht in
hoeveel werk al is
gedaan over
hetzelfde onderwerp
en jij kunt jouw
literatuuroverzicht
voorbereiden.
Journaals
Journaals en
tijdschriften worden
met betrekking tot
het verzamelen van
gegevens steeds
belangrijker. De
reden is dat
tijdschriften actuele
informatie bieden
die soms niet kan
worden gepubliceerd
en ten tweede dat
journaals informatie
over het specifieke
onderwerp waarover
je onderzoekt
kunnen geven, in
plaats van over meer
algemene
onderwerpen te
praten.
Tijdschriften/
Kranten
Tijdschriften zijn ook
effectief maar niet
erg betrouwbaar.
Kranten daarentegen
zijn betrouwbaarder
en in sommige
gevallen kan de
informatie alleen in
kranten worden
verkregen, zoals bij
sommige politieke
studies.
Commerciële
Dienstverlening
Gepubliceerde
marktonderzoeksrap
porten en andere
publicaties zijn
verkrijgbaar bij een
breed scala van
organisaties die
kosten voor hun
informatie in
rekening brengen.
Doorgaans zijn
marketingmensen
geïnteresseerd in
mediastatistieken en
consumenteninform
atie die is verkregen
van grootschalige
consumenten- of
boerenpanels.
Algemene
Websites
Over het algemeen
bevatten websites
niet echt
betrouwbare
informatie, dus hun
inhoud moet worden
gecontroleerd op
betrouwbaarheid
voordat ze worden
geciteerd.
Blogs
Weblogs worden ook
steeds gebruikelijker.
Het zijn eigenlijk
dagboeken
geschreven door
verschillende
mensen. Deze
dagboeken zijn net
zo betrouwbaar om
te gebruiken als
persoonlijke
geschreven
dagboeken.
NIET-GEPUBLICEERDE BRONNEN
Nationale en
Internationale
Instituties
Bank economische
beoordelingen,
universitaire
onderzoeksrapporte
n, tijdschriften en
artikelen zijn
allemaal nuttige
bronnen om te
contacten.
Internationale
agentschappen zoals
de Wereldbank, IMF,
IFAD, UNDP, ITC,
FAO en ILO
produceren een
overvloed aan
secundaire gegevens
die uiterst nuttig
voor de
marketingonderzoek
er kunnen zijn.
Handels-
verenigingen
Beroepsverenigingen
verschillen sterk in
de reikwijdte van
hun
gegevensverzamelin
g en activiteiten voor
informatieverspreidi
ng. Het is echter de
moeite waard om
met hen te
controleren wat ze
wel publiceren. Op
zijn minst zou men
normaal verwachten
dat ze een
handelsgids en
misschien een
jaarboek zouden
produceren.
Overheids-
gegevens
Overheidsgegevens zijn
erg belangrijk voor
onderzoek op het
gebied van marketing,
management,
geesteswetenschappen
en
sociaalwetenschappelij
k onderzoek.
Deze kunnen alle of
enkele van de volgende
elementen bevatten:
· Volkstellingen
· Sociale enquêtes,
enquêtes over
gezinsuitgaven
-Statistieken
importeren /
exporteren
·Productiestatistieken
· Landbouwstatistieken.
29. VERSCHIL TUSSEN PRIMAIRE EN
SECUNDAIRE DATA
Primaire data
• Realtime data
• Zeker over data bronnen
• Hulp om resultaten /
bevindingen te geven
• Duur en tijdrovend proces
• Mogelijke vooroordelen
• Flexibeler
Secundaire data
• Data uit het verleden
• Niet zeker over de bronnen
van data
• Het probleem verfijnen
• Goedkoop en neemt niet te
veel tijd in beslag
• Kan niet weten of data
vooringenomen zijn of niet
• Minder flexibel
Smart Data Smart Region | www.smartdata.how
30. Data is het ruwe
materiaal van de
nieuwe industriële
revolutie.
Francis Maude MP
31. OPEN DATA BEPALEN
Data enrichment refers to
processes used to enhance, refine
or otherwise improve raw data.
This idea and other similar
concepts contribute to making
data a valuable asset for almost
any modern business or
enterprise.
Smart Data Smart Region | www.smartdata.how
Data die door organisaties,
bedrijven en individuen
beschikbaar worden gesteld
voor iedereen om toegang
te krijgen, te gebruiken en
te delen.
Open data moet een licentie die zegt dat het open data is hebben. Zonder een licentie
kunnen de gegevens niet opnieuw worden gebruikt. De licentie kan ook zeggen:
- dat mensen die de gegevens gebruiken, degene die het publiceert, moeten crediteren
(dit wordt attributie genoemd)
- dat mensen die de gegevens met andere gegevens mengen, ook de resultaten als
open gegevens moeten vrijgeven (dit wordt gelijksoortig genoemd)
32. 1
2
3
• Grote datasets van
wetenschappelijk
onderzoek, sociale
media of andere
niet-
gouvernementele
bronnen
• Grote
overheidsdatasets
(weer, GPS,
gezondheidszorg,
...)
• Publieke gegevens
van de staat, lokale,
federale overheid
(budgetgegevens,
...)
BIG DATA
• Niet-
openbare
gegevens
voor
marketing,
bedrijfsanal
yse,
nationale
veiligheid
OPEN DATA
• Bedrijfsrapportage en
andere bedrijfsgegevens
(klachten van
consumenten, ...)
OPEN
GOVERNMENT
• Burgerbetrokke
nheidsprogram
ma's niet
gebaseerd op
gegevens
(verzoekschrift
en, websites,
...)
BIG DATA
VS
OPEN DATA
De kruising van de drie concepten
definieert de zes subtypen van data
die in het diagram worden getoond.
Er is geen aparte categorie voor de
kruising van Big Data en Open
Government - alles in die categorie is
ook Open Data.
Smart Data Smart Region | www.smartdata.how
33. 1. Big data die geen Open Data is. Veel Big Data vallen in deze categorie, inclusief enkele Big Data die grote commerciële waarde hebben. Alle gegevens die grote
winkeliers hebben over de koopgewoonten van klanten, die ziekenhuizen over hun patiënten houden of die banken over hun creditcardhouders houden , vallen
hier. Het is informatie die de gegevenshouders bezitten en voor commercieel voordeel kunnen gebruiken. Nationale veiligheidsgegevens, zoals de gegevens
verzameld door de NSA, vallen ook in deze categorie.
2. Open overheidswerk dat geen Open Data is. Dit is het deel van Open Government dat zich puur op burgerbetrokkenheid richt. Zo is het Witte Huis bijvoorbeeld
met een petitie-website, genaamd We the People, begon, om zich open te stellen voor inbreng van burgers. Hoewel de site zijn gegevens beschikbaar maakt, is
het publiceren van Open Data - buiten het aantal handtekeningen - niet het hoofddoel.
3. Grote, open, niet-Government data. Hier vinden we wetenschappelijke gegevensuitwisseling en burgerwetenschappelijke projecten. Big data van
astronomische observaties, van grote biomedische projecten zoals het Human Genome Project, of van andere bronnen realiseren hun grootste waarde via een
open, gedeelde aanpak. Hoewel sommige van dit onderzoek door de overheid wordt gefinancierd, zijn het geen 'overheidsgegevens' omdat deze niet algemeen
worden bewaard, onderhouden of geanalyseerd door overheidsinstanties. Deze categorie bevat ook een heel ander soort open gegevens: de gegevens die
kunnen worden geanalyseerd via Twitter en andere vormen van sociale media.
4. Open Government data die geen big data zijn. Gegevens van overheden hoeven geen Big Data te zijn om waardevol te worden geacht. Bescheiden
hoeveelheden gegevens van staten, steden en de federale overheid kunnen een grote impact hebben wanneer het wordt vrijgegeven. Dit soort gegevens voedt
de participatieve budgetteringsbeweging, waar steden over de hele wereld hun inwoners uitnodigen om naar het stadsbudget te kijken en te helpen beslissen
hoe het te besteden. Het is ook de brandstof voor apps die mensen helpen stadsdiensten zoals openbare bussen of gezondheidsklinieken te gebruiken.
5. Open Data – niet Big, niet van de overheid (Government). Dit omvat de gegevens uit de privésector die bedrijven kiezen voor hun eigen doeleinden,
bijvoorbeeld om hun potentiële investeerders tevreden te stellen of om hun reputatie te verbeteren. Milieu-, sociale en governance (ESG) -metriek vallen hier.
Bovendien zijn reputatiegegevens, zoals gegevens van consumentenklachten, zeer relevant voor het bedrijfsleven en vallen in deze categorie.
6. Big, Open, Government Data trifecta (de drie-eenheid). Deze gegevensreeksen hebben mogelijk de meeste impact van een categorie. Overheidsinstanties
hebben de capaciteit en fondsen om zeer grote hoeveelheden gegevens te verzamelen en het openhouden van die gegevenssets kan grote economische
voordelen hebben. Nationale weergegevens en GPS-gegevens zijn de meest genoemde voorbeelden. Amerikaanse censusgegevens en gegevens verzameld door
de Securities and Exchange Commission en the Department of Health & Human Services zijn anderen. Met het nieuwe Open Data-beleid wordt deze categorie
waarschijnlijk groter, robuuster en nóg belangrijker.
Smart Data Smart Region | www.smartdata.how
Het diagram uitgelegd:
34. Open Government Data is
een schat aan onbenut
potentieel. Zoals bij elk
initiatief binnen het
publieke domein, gaat het
ook om uitgaven en
inspanningen van interne
bronnen. Als jij de
voordelen van Open Data
beter begrijpt, kunt jij de
betrokkenheid bij jouw
Open Data-initiatief
versnellen. Het volgende
overzicht biedt meer bewijs
van deze voordelen om
jouw initiatief te
ondersteunen.
Smart Data Smart Region | www.smartdata.how
VOORDELEN • Het biedt burgers een betrouwbare kennisbasis over de activiteiten van overheids- en openbare lichamen.
• Het stelt hen in staat deel te nemen aan activiteiten van openbare lichamen en neemt daarom actief deel aan
de publieke keuzes (eDemocracy).
• Het is het eerste materiaal voor publieke of private belanghebbenden om nieuwe diensten met toegevoegde
waarde te ontwikkelen en deze aan burgers te leveren.
• Het is een van de cruciale taken om het doel van de digitale agenda voor Europa te verwezenlijken om
"duurzame economische en sociale voordelen te behalen uit een digitale interne markt op basis van snel en
ultrasnel internet en interoperabele toepassingen" (Kolodziejski, 2013)
• Het openen van gegevens kan jouw proces intern optimaliseren. Wanneer gegevens open zijn, zal geen van
jouw collega's een intern proces moeten doorlopen om bepaalde gegevens te ontvangen. Veel organisaties
hebben het voordeel ondervonden van het open hebben van hun gegevens, simpelweg omdat het minder tijd
kost om gegevens te vinden. Vergeet niet dat jouw organisatie hoogstwaarschijnlijk de meest actieve
hergebruiker van jouw gegevens zal zijn.
• Niet alleen jouw organisatie, maar ook burgers zullen profiteren van een verbeterde - en misschien sneller -
interne informatiestructuur. Processen zullen minder tijd kosten, diensten kunnen worden gedigitaliseerd en
burgers zullen profiteren van meer efficiëntie en transparantie. Een eenvoudig voorbeeld kan zijn om één
enkele gegevensvoorziening toe te passen op jouw services, waardoor gebruikers - burgers en / of bedrijven -
niet langer gegevens hoeven aan te leveren die jij al hebt.
• Als de gegevensinfrastructuur van jouw organisatie mogelijk verouderd is, kan jouw Open Data-initiatief een
geweldige kans zijn om een interne verandering tot stand te brengen. Veel organisaties hebben van de
gelegenheid gebruik gemaakt om hun interne gegevensinfrastructuur opnieuw in te richten en hebben de
publicatie van gegevens opgenomen als een hoofdactiviteit in werkinstructies. Praat met de managers binnen
jouw organisatie over de plannen met betrekking tot IT-infrastructuur op gegevensniveau.
• Door middel van gebruikersfeedback kunt jij de kwaliteit van jouw datasets verbeteren. De kracht van de
menigte, bekend als crowd sourcing, is een zeer efficiënte manier om middelen te bundelen om een bepaald,
soms verrassend, resultaat te bereiken.
36. Een getraind, professioneel oog in de zakelijke wereld
van vandaag bestudeert gegevensanalyses bij het
verzamelen van gegevens als een manier om de
belangrijkste kwesties met betrekking tot elk specifiek
type bedrijf te extraheren. Het is moeilijk voor te stellen
dat mensen in de restaurantindustrie bijvoorbeeld
verzuimen gegevens te verzamelen over concurrenten
voor hun marktaandeel. Data-analyse speelt een grote
rol in financieel, productie, medisch, gezondheidszorg,
marketing en overheid. Binnen deze industrieën voeren
duizenden bedrijven gegevensanalyses uit op
verschillende bedrijfsactiviteiten.
Factoren van
datakwaliteit
Tijdigheid
Consistentie
Deugdelijkheid
Nauwkeurigheid
Volledigheid
1
2
3
4
5
Voor het verkrijgen van optimale kwaliteitsgegevens zijn er factoren waarmee rekening
moet worden gehouden. Deze omvatten:
Smart Data Smart Region | www.smartdata.how
37. 1. De voordelen van externe data
2. De uitdagingen die gepaard gaan met het
gebruik van de externe data
3. Waarom externe data de brandstof van
jouw bedrijf zijn
HET BEDRIJFSASPECT
VAN EXTERNE DATA
38. Organisaties die externe data gebruiken, hebben in
potentie de potentie om zichzelf voor te blijven op het
gebied van strategische planning en
concurrentievermogen binnen de sector.
Voordelen zijn onder andere:
DE VOORDELEN VAN
HET GEBRUIKEN
VAN EXTERNE DATA
Externe gegevensproviders stellen hoogwaardige informatie en gegevens ter beschikking voor hergebruik
door organisaties ter ondersteuning van strategische planning
De kwaliteit van de gegevens is gewaarborgd
Grote hoeveelheden gegevens zijn vrij beschikbaar voor organisaties van websites van providers
Op maat gemaakte diensten worden aangeboden wanneer meer gedetailleerde gegevens vereist zijn
Regelmatige publicaties worden in hardcopy door sommige providers op papier verstrekt
Gegevens op hoog niveau over gelijkwaardige organisaties maken vergelijkingen mogelijk
Tijdreeksen en historische gegevens maken vergelijkingen in de loop van de tijd mogelijk
Training in het gebruik van data wordt aangeboden door sommige providers
De lopende discussie tussen aanbieders beoogt een afgeronde service te bieden
Gegevensproviders werken proactief om de bruikbaarheid van hun gegevens te verbeteren
Hiermee kan een benchmark specifieke aspecten van haar eigen prestaties vergelijken met die van
gelijkwaardige en / of concurrerende organisaties.
Smart Data Smart Region | www.smartdata.how
39. Er zijn nog steeds uitdagingen bij het leveren en
gebruiken van externe gegevens voor optimale
resultaten, zowel voor organisaties als voor
gegevensleveranciers.
Deze uitdagingen omvatten:
DE UITDAGINGEN
VERBONDEN AAN
HET GEBRUIK VAN
EXTERNE DATA
Werken met statistieken wordt door sommige managers nog steeds als een last gezien en
niet als een voordeel
Sommige managers zien het werken met statistieken nog steeds als een functie alleen voor de IT-
afdeling
Zonder ervaring kan het moeilijk zijn om de juiste vraag te stellen om externe providers te
vragen
Het kan duur zijn om gegevens te verkrijgen van externe gegevensproviders
Het kan moeilijk zijn om statistieken nauwkeurig in betekenisvolle informatie te vertalen
Aanbieders moeten meer begeleiding en casestudy's leveren over hergebruik voor de sector
Een gebrek aan data join up (over dezelfde gegevens) tussen externe providers kan leiden tot inefficiëntie
en onjuiste resultaten
Het kan moeilijk zijn om extern samen te werken met intern bewaarde gegevens om nauwkeurige
conclusies te trekken
Het is moeilijk om gegevens te verkrijgen op een voldoende gedetailleerd niveau voor het
maken van nuttige vergelijkingen met concurrenten
Smart Data Smart Region | www.smartdata.how
40. Er zijn een aantal redenen waarom steeds
meer bedrijven en dataprofessionals
externe data-analyse in hun
besluitvormingsprocessen opnemen. Hier
zijn er slechts enkele die het vermelden
waard zijn en die laten zien waarom het nu
de perfecte tijd is om all-in met externe
data te gaan.
WAAROM EXTERNE
DATA DE BRANDSTOF
VAN JOUW BEDRIJF IS
41. Smart Data Smart Region | www.smartdata.how
Externe data kan jou een groter beeld
geven.
Als bedrijfseigenaar of gegevensprofessional
moet je interne gegevens verzamelen, evalueren
en ernaar handelen. Maar zoals gezegd, dat geeft
je eigenlijk maar een beperkt beeld. Om de
volledige weergave te krijgen, moet je naar
externe data kijken (door de gebruiker
gegenereerde gegevens, openbare gegevens,
gegevens van concurrenten, partnergegevens,
enz.).
1
42. Smart Data Smart Region | www.smartdata.how
Toegang tot externe data is niet duur.
Dankzij initiatieven van overheden en bedrijven
over de hele wereld kost toegang tot externe
gegevens niet veel geld. In feite zijn veel
databases gratis toegankelijk. Waar de kosten
echter een rol spelen, is het organiseren,
evalueren en extern toepassen van externe
datagegevens op specifieke bedrijfsbehoeften
(dat is waar ervaren datawetenschappers en
analisten in beeld komen!).
2
43. Smart Data Smart Region | www.smartdata.how
Dankzij technologie en hulpmiddelen is
toegang tot externe data eenvoudiger en
handiger dan ooit.
Het is nog nooit zo eenvoudig of gemakkelijker geweest
om toegang te krijgen tot externe gegevens. Naarmate
de wereld steeds meer verbonden raakt en de
technologie blijft toenemen, wordt het een stuk
eenvoudiger om externe gegevens te vinden, verzamelen
en interpreteren. Jij hebt geen diploma
computerwetenschappen of een Master Data Science
nodig om te kunnen profiteren van externe data. Je wilt
beslist iemand die deze diploma's in jouw team heeft om
dieper in te gaan op de interne en externe datagegevens
die jij uiteindelijk verzamelt, maar je hebt ze niet
noodzakelijkerwijs nodig om de gegevens zelf te kunnen
openen of verzamelen. Veel van de externe tools die
vandaag beschikbaar zijn, zijn ongelooflijk eenvoudig te
gebruiken.
3
44. Smart Data Smart Region | www.smartdata.how
Externe datagegevens kunnen jouw real-
time, van minuut tot minuut updates over
trends in de industrie, consumenten en
producten bieden.
Dit is de grootste waarde voor bedrijven en daarom is
externe data zo belangrijk. Externe gegevensanalyse
kan een grote impact hebben als het gaat om het
nemen van beslissingen over de toekomst van een
bedrijf, meer leren over de gezondheid van een
industrie, bepalen welke nieuwe producten moeten
worden vrijgegeven en waar ze moeten worden
vrijgegeven, en nog veel, veel andere gebieden. In
veel gevallen zijn de hulpprogramma's en sites die
externe data verzamelen en presenteren actuele
informatie bijwerken in realtime, wat van onschatbare
waarde is in tijden dat een geïnformeerde beslissing
snel moet worden genomen.
4
45. Smart Data Smart Region | www.smartdata.how
Externe data kan jou een voorsprong
op de concurrentie geven.
Het andere grote voordeel van externe gegevens
is dat het een kans om een voorsprong op de
concurrentie te krijgen creëert. Er zijn veel tools
die het gemakkelijker dan ooit maken om je
concurrentie in het oog te houden om voorop te
blijven lopen. Met de concurrentie voor de
aandacht van online consumenten op het hoogste
niveau, is de mogelijkheid om snel, gemakkelijk en
regelmatig concurrentie te controleren van
onschatbare waarde en kan het verschil tussen
het laten groeien van jouw bedrijf of het voor
altijd sluiten van jouw deuren betekenen.
5
46. Smart Data Smart Region | www.smartdata.how
Meer en meer gegevens worden elke
dag naar het internet geüpload.
Overweeg de volgende verklaring van Rose
Business Technologies: "IDC schat dat het volume
van digitale gegevens met 40% tot 50% per jaar
zal groeien. Tegen 2020 voorspelt IDC dat het
aantal 40.000 EB of 40 Zettabytes (ZB) heeft
bereikt. De informatie in de wereld verdubbelt om
de twee jaar. Tegen 2020 zal de wereld 50 keer de
hoeveelheid informatie en 75 keer het aantal
"informatiecontainers" genereren, terwijl IT-
personeel om het te beheren minder dan 1,5 keer
zal groeien. "
6
47. Als je bereid bent te
luisteren, zal data
praten.
Jim Bergeson