De presentatie van Mark Vermeer, tijdens de parallelle sessie 'Nieuwe perspectieven voor data gedreven beleid' van het congres 'Data gedreven Beleidsontwikkeling' in Den Haag op 28 november 2017.
2. Waaruit bestaan die perspectieven?
Steeds meer data; steeds meer
soorten data
Steeds meer mogelijkheden
voor data-opslag en data-analyse
Steeds meer data-toepassingen
- Niet alleen terugkijken…
- … maar ook vooruitkijken en
werken met voorspelmodellen.
! Om vooruit te kunnen kijken
moet je de historie kennen
(gegevens op orde is must).
2
3. Wat betekent dat voor beleid?
Beleid is (Wikipedia):
‘het aangeven van de richting en de middelen waarmee men gestelde
organisatiedoelen wil gaan realiseren binnen de gestelde periode’.
Maakt data science (voorspellende / voorschrijvende analyse)
beleidsformulering overbodig?
Van datagedreven beleidsformulering naar datagedreven uitvoering?
3
Data
Beleid
Uitvoering
4. Wat is er nodig voor datagedreven beleid/uitvoering?
Investeringen in hulpmiddelen: infrastructuur / lab-omgeving; systemen en
instrumenten om data op te slaan en te analyseren
Investeringen in mensen: de juiste mensen aan boord:
4
* Informatiekant: data analisten, data scientists, IT-spec., privacy-desk., etc.
* Domeinkant: Inhoudsdeskundigen, Management
* Project-/proceskant: Projectleiders / change managers
5. Rotterdams voorbeeldproject: Handhaving Uitkeringsverstrekking
5
Onderzoeksvraag
Kan een risicomodel nauwkeuriger voorspellingen doen
over de kans op uitkeringsfraude dan de huidige werkwijze?
Aanpak met predictive analytics
Deze vraag is beantwoord door m.b.v. R,
verschillende modellen op de juiste dataset
te vergelijken met de huidige bronnen van
signalen.
Op basis van inzicht in de verklarende
patronen is het mogelijk om m.b.v.
algoritmes, correcte voorspellingen uit de
data te destilleren.
Conclusie: het werkt, zelfs
met beperkte data!
Volgens berekening: besparing mogelijk van 2
2 miljoen euro op jaarbasis.
Hudige
fase ject
Huidige
fase
6. Valkuilen & knelpunten van datagedreven beleid
1. ‘De computer neemt het over’: algoritmes (onzichtbare aannames en
waarden) bepalen de uitvoering
! (Big) data krijgt pas betekenis in een specifieke context; domeinkennis!
2. De niet-gedataficeerde realiteit verdwijnt uit het zicht
Wat wordt er niet meegenomen in de data?
3. De keerzijde: iedereen in zijn eigen ‘bubble’:
Alles wat je hoort en ziet op Internet, wordt voor je geselecteerd door algoritmes. Dat
heeft voordelen, maar ook grote nadelen.
Tijd voor overheidsactie of zelfreinigend vermogen van de social media?
6