SlideShare a Scribd company logo
1 of 26
Bonaparte: slimme
slachtofferidentificatie
op basis van DNA
Willem Burgers
Wim Wiegerinck
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 1
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 2
Wie zijn wij?
Academisch onderzoek
Machine learning
(1990 - )
Spin-off bedrijf
Commerciële
toepassingen
(1997 - )
Nieuwe naam
(2015)
Wat doen wij?
Chocola maken van data
Oplossingen met (domein) kennis,
patroonherkenning en machine learning
• Zelflerende algoritmes
• Voorspellen met statistische modellen
• Modellen die redeneren met data
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 3
Redeneren met data
• Bayesiaans netwerk
• Variabelen en hun relaties
• Algoritmes: automatische kansberekening
= alle mogelijkheden doorrekenen
die bij de data passen
gewogen met hun kans.
Veel gebruikt in kunstmatige intelligentie
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 4
Chest-clinic netwerk
A priori kansen Kansen na invoeren van de data
Bonaparte
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 6
Bonaparte voor slachtoffer identificatie
• Achtergrond
• Het identificatie probleem
• DNA profielen, erfelijkheidsleer
• Oplossing: Bayesiaanse netwerken
• Zaken en toepassingen
• Samenvatting
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 7
Achtergrond
• 2008: CBRN/e project bij het Nederlands Forensisch Instituut (NFI)
• Opdracht regering aan NFI:
klaar zijn voor rampen 500+ slachtoffers
• Hiaat bij NFI: analyse software
• SNN/SMART Research BV & NFI
beginnen samen ontwikkeling Bonaparte
• 2010: opgeleverd.
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 8
De naam Bonaparte
Napoleon Bonaparte heeft ons een
achternaam ‘gegeven’ dmv invoering
Burgerlijke Stand.
Doel van de Bonaparte software is om
onbekende slachtoffers weer een naam te
geven
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 9
Het identificatie probleem
DNA profielen van
• ongeidentificeerde slachtoffers
• families van vermisten
Het probleem: welk slachtoffer past in welke familie?
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 10
Waar komt het DNA vandaan?
In bijna elke cel is DNA materiaal
Hiervan worden DNA profielen gemaakt
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 11
Wat is een DNA profiel?
Menselijk genoom
• 99.7% van het DNA is hetzelfde,
0.3% variabel
DNA Profiel: kenmerken op loci
• Hypervariabele gebieden
op verschillende chromosomen
• Nauwkeurig bepaald
• Internationaal afgesproken
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 12
Short Tandem Repeat (STR) profielen
• Repeterende stukjes DNA
• Hypervariabel
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 13
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 14
Voorbeeld van een DNA profiel
• locus D19S433 => repeats {16,17}
• getallen 16, 17 etc noemen we allelen
• Eén allel van vader en één van moeder
• maar onbepaald welke van wie: {17,16}={16,17}
• De combinatie {16,17} noemen we genotype
D3S1358 16,17
VWA 16,17
D16S539 11,14
D2S1338 17,25
AMEL X,X
D8S1179 8,14
etc etc
DNA profiel
Erfelijkheidsleer
• Per locus: iedere ouder heeft 2 allelen
en geeft er één door aan kind.
• Allelen van verschillende loci worden
onafhankelijk van elkaar doorgegeven.
• Bij het doorgeven is er een kleine kans
op mutatie.
M V A B
C A|C B|C
D A|D B|D
Gregor Mendel (1822-1884)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 15
Nogmaals het identificatie probleem
Oplossing: Met DNA profielen en familie stambomen en populatie statistiek
bereken volgens erfelijkheidsleer de likelihood ratio’s
𝑳𝑹 =
𝑃(𝐬𝐥𝐚𝐜𝐡𝐭𝐨𝐟𝐟𝐞𝐫 𝑝𝑎𝑠𝑡 𝑖𝑛 𝐬𝐭𝐚𝐦𝐛𝐨𝐨𝐦)
𝑃(𝐬𝐥𝐚𝐜𝐡𝐭𝐨𝐟𝐟𝐞𝐫 𝑖𝑠 𝑜𝑛𝑔𝑒𝑟𝑒𝑙𝑎𝑡𝑒𝑒𝑟𝑑)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 16
Welk slachtoffer past in welke familie?
Bayesiaanse netwerken
• Elke familie stamboom
 Uniek Bayesiaans netwerk
• Kansmodel voor overerving
• Netwerk van
ouder-kind verbindingen
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 17
Hoe wordt dit in Bonaparte gedaan?
• Familiestambomen  Bayesiaans netwerken
• DNA profielen
berekening van LR’s voor iedere combi
(slachtoffer, stamboom)
DNA Profiles
Match Reports
D19S433 13,14
VWA 14,17
TPOX 11,11
D18S51 13,16
D5S818 10,11
FGA 23.2,25
AMEL X,Y
BONAPARTE
Family Relationships
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 18
Zaken en toepassingen
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 19
Slachtofferidentificaties
met Bonaparte
door NFI
• Disaster Victim Identification (DVI)
• Tripoli vliegtuigramp (2010)
• MH 17, Oekraine (2014)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 20
http://www.forensischinstituut.nl
Slachtofferidentificaties
met Bonaparte
door NFI
• Databank Vermiste Personen
• Slachtoffers watersnoodramp
• Vermiste zeelieden
• WO II slachtoffers
• …
1 januari
2008
1 januari
2009
1 januari
2010
1 januari
2011
1 januari
2012
1 januari
2013
1 januari
2014
Onbekende personen 61 131 207 247 339 464 575
Vermiste personen 66 124 142 169 198 228 249
Familieleden 111 237 332 367 441 555 695
Totaal 238 492 671 783 978 1247 1519
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 21
Bron: NFI
Familial search
• Indirecte match van sporen van
DNA donoren aan verwanten
bij ernstige strafzaken
• Wettelijk mogelijk sinds 2012
• Wiskundig zelfde probleem als bij
slachtofferidentificatie
• Zaken
• Vaatstra zaak (8000 DNA profielen, vrijwillig afgestaan)
• Utrechtse serie-aanrander
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 22
Bonaparte bij INTERPOL
• ‘Roma’ meisje: geen software om
DNA verwantschapsanalyse te doen
• Sinds voorjaar 2015 heeft Interpol
beschikking over Bonaparte
• Internationale zoekacties in
vermisten personen database
(±100.000 profielen)
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 23
Samenvatting
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 24
Samenvatting
• Bonaparte: software voor grootschalige (slachtoffer) identificatie
• Gebruikt door NFI voor
• Rampen zoals Tripoli, MH17
• Vermiste personen
• Ernstige delicten
• Domeinkennis omgezet in wiskundig model
• Algoritmes om met veel data om te gaan.
•  Software implementatie
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 25
Meer weten?
Bonaparte: www.bonaparte-dvi.com
NFI: www.forensischinstituut.nl
Big4Data: www.big4data.nl
1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 26

More Related Content

Viewers also liked

Machine Learning with Applications in Categorization, Popularity and Sequence...
Machine Learning with Applications in Categorization, Popularity and Sequence...Machine Learning with Applications in Categorization, Popularity and Sequence...
Machine Learning with Applications in Categorization, Popularity and Sequence...Nicolas Nicolov
 
Machine Learning With R
Machine Learning With RMachine Learning With R
Machine Learning With RDavid Chiu
 
Applications of Machine Learning at USC
Applications of Machine Learning at USCApplications of Machine Learning at USC
Applications of Machine Learning at USCSri Ambati
 
Machine learning in image processing
Machine learning in image processingMachine learning in image processing
Machine learning in image processingData Science Thailand
 
Machine Learning and Real-World Applications
Machine Learning and Real-World ApplicationsMachine Learning and Real-World Applications
Machine Learning and Real-World ApplicationsMachinePulse
 
Analysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summit
Analysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summitAnalysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summit
Analysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summitSlim Baltagi
 

Viewers also liked (6)

Machine Learning with Applications in Categorization, Popularity and Sequence...
Machine Learning with Applications in Categorization, Popularity and Sequence...Machine Learning with Applications in Categorization, Popularity and Sequence...
Machine Learning with Applications in Categorization, Popularity and Sequence...
 
Machine Learning With R
Machine Learning With RMachine Learning With R
Machine Learning With R
 
Applications of Machine Learning at USC
Applications of Machine Learning at USCApplications of Machine Learning at USC
Applications of Machine Learning at USC
 
Machine learning in image processing
Machine learning in image processingMachine learning in image processing
Machine learning in image processing
 
Machine Learning and Real-World Applications
Machine Learning and Real-World ApplicationsMachine Learning and Real-World Applications
Machine Learning and Real-World Applications
 
Analysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summit
Analysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summitAnalysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summit
Analysis-of-Major-Trends-in-big-data-analytics-slim-baltagi-hadoop-summit
 

More from BigDataExpo

Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...BigDataExpo
 
Google Cloud - Google's vision on AI
Google Cloud - Google's vision on AIGoogle Cloud - Google's vision on AI
Google Cloud - Google's vision on AIBigDataExpo
 
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...BigDataExpo
 
PGGM - The Future Explore
PGGM - The Future ExplorePGGM - The Future Explore
PGGM - The Future ExploreBigDataExpo
 
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...BigDataExpo
 
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...BigDataExpo
 
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...BigDataExpo
 
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIDynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIBigDataExpo
 
Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science BigDataExpo
 
FunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsFunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsBigDataExpo
 
fashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DatafashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DataBigDataExpo
 
BigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigDataExpo
 
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...BigDataExpo
 
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...BigDataExpo
 
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBigDataExpo
 
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...BigDataExpo
 
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...BigDataExpo
 
Rabobank - There is something about Data
Rabobank - There is something about DataRabobank - There is something about Data
Rabobank - There is something about DataBigDataExpo
 
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...BigDataExpo
 
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...BigDataExpo
 

More from BigDataExpo (20)

Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
 
Google Cloud - Google's vision on AI
Google Cloud - Google's vision on AIGoogle Cloud - Google's vision on AI
Google Cloud - Google's vision on AI
 
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
 
PGGM - The Future Explore
PGGM - The Future ExplorePGGM - The Future Explore
PGGM - The Future Explore
 
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
 
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
 
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
 
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIDynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
 
Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science
 
FunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsFunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data Analytics
 
fashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DatafashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big Data
 
BigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenches
 
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
 
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
 
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
 
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
 
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
 
Rabobank - There is something about Data
Rabobank - There is something about DataRabobank - There is something about Data
Rabobank - There is something about Data
 
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
 
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
 

Big Data Expo 2015 - Big 4 Data Bonaparte

  • 1. Bonaparte: slimme slachtofferidentificatie op basis van DNA Willem Burgers Wim Wiegerinck 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 1
  • 2. 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 2 Wie zijn wij? Academisch onderzoek Machine learning (1990 - ) Spin-off bedrijf Commerciële toepassingen (1997 - ) Nieuwe naam (2015)
  • 3. Wat doen wij? Chocola maken van data Oplossingen met (domein) kennis, patroonherkenning en machine learning • Zelflerende algoritmes • Voorspellen met statistische modellen • Modellen die redeneren met data 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 3
  • 4. Redeneren met data • Bayesiaans netwerk • Variabelen en hun relaties • Algoritmes: automatische kansberekening = alle mogelijkheden doorrekenen die bij de data passen gewogen met hun kans. Veel gebruikt in kunstmatige intelligentie 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 4
  • 5. Chest-clinic netwerk A priori kansen Kansen na invoeren van de data
  • 6. Bonaparte 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 6
  • 7. Bonaparte voor slachtoffer identificatie • Achtergrond • Het identificatie probleem • DNA profielen, erfelijkheidsleer • Oplossing: Bayesiaanse netwerken • Zaken en toepassingen • Samenvatting 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 7
  • 8. Achtergrond • 2008: CBRN/e project bij het Nederlands Forensisch Instituut (NFI) • Opdracht regering aan NFI: klaar zijn voor rampen 500+ slachtoffers • Hiaat bij NFI: analyse software • SNN/SMART Research BV & NFI beginnen samen ontwikkeling Bonaparte • 2010: opgeleverd. 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 8
  • 9. De naam Bonaparte Napoleon Bonaparte heeft ons een achternaam ‘gegeven’ dmv invoering Burgerlijke Stand. Doel van de Bonaparte software is om onbekende slachtoffers weer een naam te geven 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 9
  • 10. Het identificatie probleem DNA profielen van • ongeidentificeerde slachtoffers • families van vermisten Het probleem: welk slachtoffer past in welke familie? 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 10
  • 11. Waar komt het DNA vandaan? In bijna elke cel is DNA materiaal Hiervan worden DNA profielen gemaakt 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 11
  • 12. Wat is een DNA profiel? Menselijk genoom • 99.7% van het DNA is hetzelfde, 0.3% variabel DNA Profiel: kenmerken op loci • Hypervariabele gebieden op verschillende chromosomen • Nauwkeurig bepaald • Internationaal afgesproken 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 12
  • 13. Short Tandem Repeat (STR) profielen • Repeterende stukjes DNA • Hypervariabel 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 13
  • 14. 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 14 Voorbeeld van een DNA profiel • locus D19S433 => repeats {16,17} • getallen 16, 17 etc noemen we allelen • Eén allel van vader en één van moeder • maar onbepaald welke van wie: {17,16}={16,17} • De combinatie {16,17} noemen we genotype D3S1358 16,17 VWA 16,17 D16S539 11,14 D2S1338 17,25 AMEL X,X D8S1179 8,14 etc etc DNA profiel
  • 15. Erfelijkheidsleer • Per locus: iedere ouder heeft 2 allelen en geeft er één door aan kind. • Allelen van verschillende loci worden onafhankelijk van elkaar doorgegeven. • Bij het doorgeven is er een kleine kans op mutatie. M V A B C A|C B|C D A|D B|D Gregor Mendel (1822-1884) 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 15
  • 16. Nogmaals het identificatie probleem Oplossing: Met DNA profielen en familie stambomen en populatie statistiek bereken volgens erfelijkheidsleer de likelihood ratio’s 𝑳𝑹 = 𝑃(𝐬𝐥𝐚𝐜𝐡𝐭𝐨𝐟𝐟𝐞𝐫 𝑝𝑎𝑠𝑡 𝑖𝑛 𝐬𝐭𝐚𝐦𝐛𝐨𝐨𝐦) 𝑃(𝐬𝐥𝐚𝐜𝐡𝐭𝐨𝐟𝐟𝐞𝐫 𝑖𝑠 𝑜𝑛𝑔𝑒𝑟𝑒𝑙𝑎𝑡𝑒𝑒𝑟𝑑) 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 16 Welk slachtoffer past in welke familie?
  • 17. Bayesiaanse netwerken • Elke familie stamboom  Uniek Bayesiaans netwerk • Kansmodel voor overerving • Netwerk van ouder-kind verbindingen 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 17
  • 18. Hoe wordt dit in Bonaparte gedaan? • Familiestambomen  Bayesiaans netwerken • DNA profielen berekening van LR’s voor iedere combi (slachtoffer, stamboom) DNA Profiles Match Reports D19S433 13,14 VWA 14,17 TPOX 11,11 D18S51 13,16 D5S818 10,11 FGA 23.2,25 AMEL X,Y BONAPARTE Family Relationships 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 18
  • 19. Zaken en toepassingen 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 19
  • 20. Slachtofferidentificaties met Bonaparte door NFI • Disaster Victim Identification (DVI) • Tripoli vliegtuigramp (2010) • MH 17, Oekraine (2014) 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 20 http://www.forensischinstituut.nl
  • 21. Slachtofferidentificaties met Bonaparte door NFI • Databank Vermiste Personen • Slachtoffers watersnoodramp • Vermiste zeelieden • WO II slachtoffers • … 1 januari 2008 1 januari 2009 1 januari 2010 1 januari 2011 1 januari 2012 1 januari 2013 1 januari 2014 Onbekende personen 61 131 207 247 339 464 575 Vermiste personen 66 124 142 169 198 228 249 Familieleden 111 237 332 367 441 555 695 Totaal 238 492 671 783 978 1247 1519 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 21 Bron: NFI
  • 22. Familial search • Indirecte match van sporen van DNA donoren aan verwanten bij ernstige strafzaken • Wettelijk mogelijk sinds 2012 • Wiskundig zelfde probleem als bij slachtofferidentificatie • Zaken • Vaatstra zaak (8000 DNA profielen, vrijwillig afgestaan) • Utrechtse serie-aanrander 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 22
  • 23. Bonaparte bij INTERPOL • ‘Roma’ meisje: geen software om DNA verwantschapsanalyse te doen • Sinds voorjaar 2015 heeft Interpol beschikking over Bonaparte • Internationale zoekacties in vermisten personen database (±100.000 profielen) 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 23
  • 24. Samenvatting 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 24
  • 25. Samenvatting • Bonaparte: software voor grootschalige (slachtoffer) identificatie • Gebruikt door NFI voor • Rampen zoals Tripoli, MH17 • Vermiste personen • Ernstige delicten • Domeinkennis omgezet in wiskundig model • Algoritmes om met veel data om te gaan. •  Software implementatie 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 25
  • 26. Meer weten? Bonaparte: www.bonaparte-dvi.com NFI: www.forensischinstituut.nl Big4Data: www.big4data.nl 1-10-2015 BIGDATAEXPO, Utrecht Bonaparte: slachtofferidentificatie op basis van DNA 26