SlideShare a Scribd company logo
1 of 13
Improving Mental Health by Sharing Knowledge
Machine Learning en CBS data
Joran Lokkerbol
Agenda
2
• CBS data
• Werken met CBS data
• Een voorbeeld: predictie van verbetering in GAF-score
• Reflectie
CBS data
3
CBS beheert:
• individuele & koppelbare data van iedereen in NL
• de domeinen:
– Persoonsgegevens (GBA)
– Educatie
– Werk en inkomen (e.g. belastingdienst)
– Veiligheid en justitie
– Gezondheid
• Datasets zijn lang en breed (grote n, hoge p)
Werken met CBS data
4
Voordelen:
• Heel veel gedetailleerde data,
• Op veel verschillende domeinen,
• Uitstekende klantenservice
Nadelen:
• Time-lag van plm 2-3 jaar
• Beschikbaarheid uitkomstmaten beperkt
Grote datasets:
• SPSS
• Memory limits
Voorbeeld: vooruitgang op GAF
5
Vraag:
Kunnen we voorspellen welke patiënten (27.65%) in de GGZ verbeteren op de GAF?
The Global Assessment of Functioning:
- 10: superior functioning in wide range of activities
- 9: good functioning with minimal symptoms
- 8: if symptoms are present, they are expectable reactions to stress
- 7: some mild symptoms or some difficulty in functioning
- 6: moderate symptoms or moderate difficulty in functioning
- 5: serious symptoms or serious impairment in functioning
- 4: some impairment in reality testing or communication
- 3: behavior considerably influenced by delusions/hallucinations or serious impaired
communication or judgement
- 2: some danger of hurting self or others
- 1: persistent danger of severely hurting self or others
Data
6
Behandelrecords in de periode 2010-2013 met een voor- en nameting
op de GAF, inclusief informatie over:
- Behandelduur (# minuten uitgesplitst in direct, reistijd en indirect)
- Aantal dagen hospitalisatie
- Rechterlijke machtiging
- Type behandeling (psycho-analyse, psychodynamische therapie,
gedragstherapie, cognitieve gedragstherapie, interpersoonlijke therapie,
clientgerichte therapie, systeemtherapie, overige psychotherapie
- Patiëntkarakteristieken (leeftijd, primaire en secundaire diagnose, woonplaats,
etc)
- Informatie over inkomen (decielen)
- Informatie over behandeling (start, duur, type instelling, type behandelaar)
Methode
7
70/30 train/test sample
LASSO regressie
Uitkomsten: AUC, PPV en NPV
Resultaten
8
n = 2.234.144
p = 61 (146 na dummy-coderen
categorische variabelen)
Bijna alle variabelen significant: 45
vd 146 variabelen zijn 0
- AUC: 0.808
- NPV: 0.821 (versus 0.724)
- PPV: 0.662 (versus 0.276)
Reflectie 1/4
9
Supervised learning heeft 1 focus: predictie out-of-sample
Data y en x, hold-out sample, gebruik x om y te voorspellen, en kijk hoe
goed je dat doet
Welke interventie werkt het beste voor welke patiënt?
Schatten causale effecten: we kunnen behandeleffect schatten in
training sample, maar kunnen deze niet out-of-sample checken.(er is
geen ground truth)?
Literatuur over aanpassingen predictietools om uitspraken te doen over
causaliteit: Abadie, Athey, Imbens, Wooldridge (2014); Athey-Imbens
(2015); Belloni, Chen Chernozhukov, Hansen (2012)
Reflectie 2/4
10
Reflectie 3/4
11
Reflectie 4/4
12
Machine Learning lijkt nog weinig te gebeuren met CBS data
CBS data uitzonderlijk in termen van compleetheid (grote n) en
diversiteit in termen van databronnen
Zeer geschikt voor goed gedefinieerde, gedocumenteerde en relevante
uitkomstmaten, zoals functionele uitkomsten (arbeid en inkomen),
suïcide, hospitalisatie, etc
Kan beperkt zijn in termen van type uitkomstmaten
Memory is een probleem
Beschikbare informatie over type behandeling maakt het mogelijk om
heterogeniteit in behandeluitkomsten te verkennen
Improving Mental Health by Sharing Knowledge
Machine Learning en CBS data
Joran Lokkerbol

More Related Content

Similar to Machine learning en cbs

Ppt groep lapaq 16/06/14
Ppt groep lapaq 16/06/14Ppt groep lapaq 16/06/14
Ppt groep lapaq 16/06/14Kristof Peeters
 
‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...
‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...
‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...Triora
 
Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...
Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...
Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...Radboud universitair medisch centrum
 
Behandeleffect als voorspeller van seksuele recidive (31.12.2013)
Behandeleffect als voorspeller van seksuele recidive (31.12.2013)Behandeleffect als voorspeller van seksuele recidive (31.12.2013)
Behandeleffect als voorspeller van seksuele recidive (31.12.2013)Jan Willem van den Berg
 
PP Jane de Sauvage, werkconferentie Trimbos 11 6 15
PP Jane de Sauvage, werkconferentie Trimbos 11 6 15PP Jane de Sauvage, werkconferentie Trimbos 11 6 15
PP Jane de Sauvage, werkconferentie Trimbos 11 6 15Jane de Sauvage Nolting
 
Psa analyseren en voorkomen Juriaan Blekemolen
Psa analyseren en voorkomen   Juriaan BlekemolenPsa analyseren en voorkomen   Juriaan Blekemolen
Psa analyseren en voorkomen Juriaan Blekemolenanderswerken
 
StatistischeVaardigheden_20mar2015
StatistischeVaardigheden_20mar2015StatistischeVaardigheden_20mar2015
StatistischeVaardigheden_20mar2015Lennard Pisa
 
Powerpoint hl ce vt32013 effect
Powerpoint hl ce vt32013 effectPowerpoint hl ce vt32013 effect
Powerpoint hl ce vt32013 effectAnne de Hulster
 
1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...
1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...
1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...Flevum
 
Presentatie workshop ebp podomedics 2012
Presentatie workshop ebp podomedics 2012Presentatie workshop ebp podomedics 2012
Presentatie workshop ebp podomedics 2012rsmabers
 
Seminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefSeminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefsofiebe
 
Seminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefSeminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefsofiebe
 
Seminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefSeminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefsofiebe
 

Similar to Machine learning en cbs (20)

Ppt groep lapaq 16/06/14
Ppt groep lapaq 16/06/14Ppt groep lapaq 16/06/14
Ppt groep lapaq 16/06/14
 
‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...
‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...
‘Indicatiestelling, zorgtoewijzing en AA’: Vincent Hendriks, donderdag 24 nov...
 
Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...
Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...
Verklaringen voor gedragsverandering bij patiënten na cognitieve gedragsthera...
 
Ppt seminariewerk definitief
Ppt seminariewerk definitiefPpt seminariewerk definitief
Ppt seminariewerk definitief
 
Behandeleffect als voorspeller van seksuele recidive (31.12.2013)
Behandeleffect als voorspeller van seksuele recidive (31.12.2013)Behandeleffect als voorspeller van seksuele recidive (31.12.2013)
Behandeleffect als voorspeller van seksuele recidive (31.12.2013)
 
PP Jane de Sauvage, werkconferentie Trimbos 11 6 15
PP Jane de Sauvage, werkconferentie Trimbos 11 6 15PP Jane de Sauvage, werkconferentie Trimbos 11 6 15
PP Jane de Sauvage, werkconferentie Trimbos 11 6 15
 
1.6 Individuele Plaatsing en Steun werkt!
1.6 Individuele Plaatsing en Steun werkt!1.6 Individuele Plaatsing en Steun werkt!
1.6 Individuele Plaatsing en Steun werkt!
 
Cat nurse pdefinitief_2013
Cat nurse pdefinitief_2013Cat nurse pdefinitief_2013
Cat nurse pdefinitief_2013
 
Psa analyseren en voorkomen Juriaan Blekemolen
Psa analyseren en voorkomen   Juriaan BlekemolenPsa analyseren en voorkomen   Juriaan Blekemolen
Psa analyseren en voorkomen Juriaan Blekemolen
 
Psa analyseren en voorkomen
Psa analyseren en voorkomenPsa analyseren en voorkomen
Psa analyseren en voorkomen
 
StatistischeVaardigheden_20mar2015
StatistischeVaardigheden_20mar2015StatistischeVaardigheden_20mar2015
StatistischeVaardigheden_20mar2015
 
Powerpoint hl ce vt32013 effect
Powerpoint hl ce vt32013 effectPowerpoint hl ce vt32013 effect
Powerpoint hl ce vt32013 effect
 
1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...
1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...
1509117 | Zorg | Transparantie in de curatieve zorg: obstakels en sprekende i...
 
Presentatie workshop ebp podomedics 2012
Presentatie workshop ebp podomedics 2012Presentatie workshop ebp podomedics 2012
Presentatie workshop ebp podomedics 2012
 
Seminariewerk sensewear
Seminariewerk sensewearSeminariewerk sensewear
Seminariewerk sensewear
 
Seminariewerk sensewear
Seminariewerk sensewearSeminariewerk sensewear
Seminariewerk sensewear
 
Seminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefSeminariewerk senseweardefinitief
Seminariewerk senseweardefinitief
 
Seminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefSeminariewerk senseweardefinitief
Seminariewerk senseweardefinitief
 
Seminariewerk sensewear
Seminariewerk sensewearSeminariewerk sensewear
Seminariewerk sensewear
 
Seminariewerk senseweardefinitief
Seminariewerk senseweardefinitiefSeminariewerk senseweardefinitief
Seminariewerk senseweardefinitief
 

Machine learning en cbs

  • 1. Improving Mental Health by Sharing Knowledge Machine Learning en CBS data Joran Lokkerbol
  • 2. Agenda 2 • CBS data • Werken met CBS data • Een voorbeeld: predictie van verbetering in GAF-score • Reflectie
  • 3. CBS data 3 CBS beheert: • individuele & koppelbare data van iedereen in NL • de domeinen: – Persoonsgegevens (GBA) – Educatie – Werk en inkomen (e.g. belastingdienst) – Veiligheid en justitie – Gezondheid • Datasets zijn lang en breed (grote n, hoge p)
  • 4. Werken met CBS data 4 Voordelen: • Heel veel gedetailleerde data, • Op veel verschillende domeinen, • Uitstekende klantenservice Nadelen: • Time-lag van plm 2-3 jaar • Beschikbaarheid uitkomstmaten beperkt Grote datasets: • SPSS • Memory limits
  • 5. Voorbeeld: vooruitgang op GAF 5 Vraag: Kunnen we voorspellen welke patiënten (27.65%) in de GGZ verbeteren op de GAF? The Global Assessment of Functioning: - 10: superior functioning in wide range of activities - 9: good functioning with minimal symptoms - 8: if symptoms are present, they are expectable reactions to stress - 7: some mild symptoms or some difficulty in functioning - 6: moderate symptoms or moderate difficulty in functioning - 5: serious symptoms or serious impairment in functioning - 4: some impairment in reality testing or communication - 3: behavior considerably influenced by delusions/hallucinations or serious impaired communication or judgement - 2: some danger of hurting self or others - 1: persistent danger of severely hurting self or others
  • 6. Data 6 Behandelrecords in de periode 2010-2013 met een voor- en nameting op de GAF, inclusief informatie over: - Behandelduur (# minuten uitgesplitst in direct, reistijd en indirect) - Aantal dagen hospitalisatie - Rechterlijke machtiging - Type behandeling (psycho-analyse, psychodynamische therapie, gedragstherapie, cognitieve gedragstherapie, interpersoonlijke therapie, clientgerichte therapie, systeemtherapie, overige psychotherapie - Patiëntkarakteristieken (leeftijd, primaire en secundaire diagnose, woonplaats, etc) - Informatie over inkomen (decielen) - Informatie over behandeling (start, duur, type instelling, type behandelaar)
  • 7. Methode 7 70/30 train/test sample LASSO regressie Uitkomsten: AUC, PPV en NPV
  • 8. Resultaten 8 n = 2.234.144 p = 61 (146 na dummy-coderen categorische variabelen) Bijna alle variabelen significant: 45 vd 146 variabelen zijn 0 - AUC: 0.808 - NPV: 0.821 (versus 0.724) - PPV: 0.662 (versus 0.276)
  • 9. Reflectie 1/4 9 Supervised learning heeft 1 focus: predictie out-of-sample Data y en x, hold-out sample, gebruik x om y te voorspellen, en kijk hoe goed je dat doet Welke interventie werkt het beste voor welke patiënt? Schatten causale effecten: we kunnen behandeleffect schatten in training sample, maar kunnen deze niet out-of-sample checken.(er is geen ground truth)? Literatuur over aanpassingen predictietools om uitspraken te doen over causaliteit: Abadie, Athey, Imbens, Wooldridge (2014); Athey-Imbens (2015); Belloni, Chen Chernozhukov, Hansen (2012)
  • 12. Reflectie 4/4 12 Machine Learning lijkt nog weinig te gebeuren met CBS data CBS data uitzonderlijk in termen van compleetheid (grote n) en diversiteit in termen van databronnen Zeer geschikt voor goed gedefinieerde, gedocumenteerde en relevante uitkomstmaten, zoals functionele uitkomsten (arbeid en inkomen), suïcide, hospitalisatie, etc Kan beperkt zijn in termen van type uitkomstmaten Memory is een probleem Beschikbare informatie over type behandeling maakt het mogelijk om heterogeniteit in behandeluitkomsten te verkennen
  • 13. Improving Mental Health by Sharing Knowledge Machine Learning en CBS data Joran Lokkerbol