Sinds 2010 gebruikt het Nederlands Forensisch Instituut (NFI) Bonaparte voor slachtofferidentificatie. Deze software is speciaal voor het NFI ontwikkeld door Big4Data. Big4Data is specialist op het gebied van Machine Learning en Kunstmatige Intelligentie technieken en ontwikkelt modellen waarmee ‘Big Data’ vraagstukken beantwoord kunnen worden.
In deze keynote zal Willem Burgers, ontwikkelaar van Bonaparte, belichten hoe de software tot stand is gekomen en hoe de technieken die zijn ontwikkeld voor artificieel redeneren, worden gebruikt om het biologische verwantschapsmodel (op basis van DNA) te modelleren. Tot slot zal hij ingaan op enkele van de zaken waarvoor Bonaparte is gebruikt door het NFI; onder meer MH17 (2014), Tripoli (2010), de Vaatstra zaak (2012) zullen worden besproken.
2. 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 2
Wie zijn wij?
Academisch onderzoek
Machine learning
(1990 - )
Spin-off bedrijf
Commerciële
toepassingen
(1997 - )
Nieuwe naam
(2015)
3. Wat doen wij?
Chocola maken van data
Oplossingen met (domein) kennis,
patroonherkenning en machine learning
• Zelflerende algoritmes
• Voorspellen met statistische modellen
• Modellen die redeneren met data
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 3
4. Redeneren met data
• Bayesiaans netwerk
• Variabelen en hun relaties
• Algoritmes: automatische kansberekening
= alle mogelijkheden doorrekenen
die bij de data passen
gewogen met hun kans.
Veel gebruikt in kunstmatige intelligentie
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 4
7. Bonaparte voor slachtoffer identificatie
• Achtergrond
• Het identificatie probleem
• DNA profielen, erfelijkheidsleer
• Oplossing: Bayesiaanse netwerken
• Zaken en toepassingen
• Samenvatting
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 7
8. Achtergrond
• 2008: CBRN/e project bij het Nederlands Forensisch Instituut (NFI)
• Opdracht regering aan NFI:
klaar zijn voor rampen 500+ slachtoffers
• Hiaat bij NFI: analyse software
• SNN/SMART Research BV & NFI
beginnen samen ontwikkeling Bonaparte
• 2010: opgeleverd.
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 8
9. De naam Bonaparte
Napoleon Bonaparte heeft ons een
achternaam ‘gegeven’ dmv invoering
Burgerlijke Stand.
Doel van de Bonaparte software is om
onbekende slachtoffers weer een naam te
geven
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 9
10. Het identificatie probleem
DNA profielen van
• ongeidentificeerde slachtoffers
• families van vermisten
Het probleem: welk slachtoffer past in welke familie?
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 10
11. Waar komt het DNA vandaan?
In bijna elke cel is DNA materiaal
Hiervan worden DNA profielen gemaakt
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 11
12. Wat is een DNA profiel?
Menselijk genoom
• 99.7% van het DNA is hetzelfde,
0.3% variabel
DNA Profiel: kenmerken op loci
• Hypervariabele gebieden
op verschillende chromosomen
• Nauwkeurig bepaald
• Internationaal afgesproken
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 12
13. Short Tandem Repeat (STR) profielen
• Repeterende stukjes DNA
• Hypervariabel
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 13
14. 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 14
Voorbeeld van een DNA profiel
• locus D19S433 => repeats {16,17}
• getallen 16, 17 etc noemen we allelen
• Eén allel van vader en één van moeder
• maar onbepaald welke van wie: {17,16}={16,17}
• De combinatie {16,17} noemen we genotype
D3S1358 16,17
VWA 16,17
D16S539 11,14
D2S1338 17,25
AMEL X,X
D8S1179 8,14
etc etc
DNA profiel
15. Erfelijkheidsleer
• Per locus: iedere ouder heeft 2 allelen
en geeft er één door aan kind.
• Allelen van verschillende loci worden
onafhankelijk van elkaar doorgegeven.
• Bij het doorgeven is er een kleine kans
op mutatie.
M V A B
C A|C B|C
D A|D B|D
Gregor Mendel (1822-1884)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 15
16. Nogmaals het identificatie probleem
Oplossing: Met DNA profielen en familie stambomen en populatie statistiek
bereken volgens erfelijkheidsleer de likelihood ratio’s
𝑳𝑹 =
𝑃(𝐬𝐥𝐚𝐜𝐡𝐭𝐨𝐟𝐟𝐞𝐫 𝑝𝑎𝑠𝑡 𝑖𝑛 𝐬𝐭𝐚𝐦𝐛𝐨𝐨𝐦)
𝑃(𝐬𝐥𝐚𝐜𝐡𝐭𝐨𝐟𝐟𝐞𝐫 𝑖𝑠 𝑜𝑛𝑔𝑒𝑟𝑒𝑙𝑎𝑡𝑒𝑒𝑟𝑑)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 16
Welk slachtoffer past in welke familie?
17. Bayesiaanse netwerken
• Elke familie stamboom
Uniek Bayesiaans netwerk
• Kansmodel voor overerving
• Netwerk van
ouder-kind verbindingen
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 17
18. Hoe wordt dit in Bonaparte gedaan?
• Familiestambomen Bayesiaans netwerken
• DNA profielen
berekening van LR’s voor iedere combi
(slachtoffer, stamboom)
DNA Profiles
Match Reports
D19S433 13,14
VWA 14,17
TPOX 11,11
D18S51 13,16
D5S818 10,11
FGA 23.2,25
AMEL X,Y
BONAPARTE
Family Relationships
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 18
20. Slachtofferidentificaties
met Bonaparte
door NFI
• Disaster Victim Identification (DVI)
• Tripoli vliegtuigramp (2010)
• MH 17, Oekraine (2014)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 20
http://www.forensischinstituut.nl
21. Slachtofferidentificaties
met Bonaparte
door NFI
• Databank Vermiste Personen
• Slachtoffers watersnoodramp
• Vermiste zeelieden
• WO II slachtoffers
• …
1 januari
2008
1 januari
2009
1 januari
2010
1 januari
2011
1 januari
2012
1 januari
2013
1 januari
2014
Onbekende personen 61 131 207 247 339 464 575
Vermiste personen 66 124 142 169 198 228 249
Familieleden 111 237 332 367 441 555 695
Totaal 238 492 671 783 978 1247 1519
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 21
Bron: NFI
22. Familial search
• Indirecte match van sporen van
DNA donoren aan verwanten
bij ernstige strafzaken
• Wettelijk mogelijk sinds 2012
• Wiskundig zelfde probleem als bij
slachtofferidentificatie
• Zaken
• Vaatstra zaak (8000 DNA profielen, vrijwillig afgestaan)
• Utrechtse serie-aanrander
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 22
23. Bonaparte bij INTERPOL
• ‘Roma’ meisje: geen software om
DNA verwantschapsanalyse te doen
• Sinds voorjaar 2015 heeft Interpol
beschikking over Bonaparte
• Internationale zoekacties in
vermisten personen database
(±100.000 profielen)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 23
25. Samenvatting
• Bonaparte: software voor grootschalige (slachtoffer) identificatie
• Gebruikt door NFI voor
• Rampen zoals Tripoli, MH17
• Vermiste personen
• Ernstige delicten
• Domeinkennis omgezet in wiskundig model
• Algoritmes om met veel data om te gaan.
• Software implementatie
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 25