SlideShare a Scribd company logo
1 of 14
Download to read offline
Verbinden van Biografie¨n aan Documenten
                      e                                           1




         Verbinden van Biografie¨n aan
                               e
                 Documenten
                                             Maarten Marx

                                     Universiteit van Amsterdam

                                          Den Haag 2010-12-10
Verbinden van Biografie¨n aan Documenten
                      e                              2



             Koppeling Bio’s en Documenten: Inhoud

• Wat is dat?

• Wat heeft dat voor nut?

• Hoe doe je dat?

• Hoe maak je een Bio-archief waardevol?
Verbinden van Biografie¨n aan Documenten
                      e                             3



       Koppeling Bio’s en Documenten. Wat is dat?

• Handeling zonder koppeling

• Gekoppelde Handelingen

• Gekoppelde geOCRde Handelingen
Verbinden van Biografie¨n aan Documenten
                      e                                     4



                         Archieven om naar te koppelen

• Twee op parlementari¨rs gerichte databases:
                      e
  • parlement.com (Parlementair Documentatie Centrum)
  • pentapolitica.nl (PoliticalMashup)

• Wikipedia is een mooi alternatief.

      http://nl.wikipedia.org/wiki/Lijst_van_Nederlandse_
                           politici
Verbinden van Biografie¨n aan Documenten
                      e                                           5



                                      Koppeling andersom

                                          Dynamische Biografie¨n
                                                             e

Combinatie van

• statische achtergrond data

• dynamische groeiende gegevens.

• Voorbeelden
  • http://www.pentapolitica.nl/politici/femke-halsema
  • Pagina van Sophie in het Veld bij Europees Parlement
  • Sophie in het Veld bij IkKiesWijzer.nl
  • Pagina van David Cameron bij TheyWorkForYou.com
Verbinden van Biografie¨n aan Documenten
                      e                                         6



      Koppeling Mens–Document. Wat is het nut? I

• Verhogen van betrouwbaarheid van de data.

• Makkelijker toegang tot de data.

• Grootscheeps automatisch (wetenschappelijk) onderzoek wordt
  opeens mogelijk.
Verbinden van Biografie¨n aan Documenten
                      e                                    7



     Koppeling Mens–Document. Wat is het nut? II

1. Normalisatie van namen door koppeling.
   • Typos
   • Naamswijzigingen
   • OCR fouten

2. Zoeken op naam met autocompletion. Voorbeeld in DBLP.

3. Van document-centrisch naar mens-centrisch.
Verbinden van Biografie¨n aan Documenten
                      e                                         8



                  Mens-centrische informatiebehoeften

• Expert search. http://ikkieswijzer.nl/personen

• Geef me alle uitspraken van Balkenende over Suriname

• Geef alle uitspraken gedaan door allochtonen over Suriname.

• Wie spreekt het meest in de Tweede Kamer?

• Glazen Plafond Query.
    De Kamer bestaat voor 40% uit vrouwen. Hoeveel % van de
    uitspraken wordt door vrouwen gedaan?

• Interruptiegraaf. 2010-10-27 2010-10-26
Verbinden van Biografie¨n aan Documenten
                      e                                         9



                           Hoe maak je zo’n koppeling?

• Twee manieren.
  • Van bovenaf opleggen (top-down)
  • Door “slimme algorithmes” laten aanleggen (bottom up)

• Top-down werkt alleen vanaf een bepaald moment, en

• is moeilijk te onderhouden in een gedistribueerde omgeving.
Verbinden van Biografie¨n aan Documenten
                      e                                          10



                                          Bottom up

• Bottom-up kan ook op historische data (zie
  statengeneraaldigitaal.nl).

• Bottom-up geeft inzicht in de kwaliteit van de koppeling.

• Bottom-up algorithmes zijn herbruikbaar.

• Er is zeer veel onderzoek gedaan naar bottom up algorithmes.
  • Data Deduplication
  • named entity reconciliation

• Zwaan–kleef–aan effect. (Veel gebruikt systeem wordt de facto
  standaard).
Verbinden van Biografie¨n aan Documenten
                      e                                               11



                                          Bottom up pipeline

• Intuitie: maak het equivalent van de zoek functie in Google Maps.

• http://maps.google.com/maps?hl=en&q=Koninklijke+
  Bibliotheek+Den+Haag&sa=N&tab=sl

• normalize(KB Den Haag) = (52.081273,4.328055)

• Dus nodig:
  • Dimensie met unieke waardes voor elk datapunt.
  • Normaliserings-functie.
  • Eventueel functie terug.
Verbinden van Biografie¨n aan Documenten
                      e                                            12



                       Super goede baseline: Wikipedia

• Gebruik Wikipedia paginanamen als je dimensie.
• http://en.wikipedia.org/wiki/Jimi_Hendrix
• Gebruik Wikipedia search functie (inclusief redirects) als
  normaliseringsfunctie.
• http:
  //en.wikipedia.org/w/index.php?search=Jimi+Hendricks
• Prima (crowdsourced and quality-controlled) disambiguation and
  redirect.

   James Hendrix James Marshall Hendrix Jim Hendrix Jimi hendrix
    Jimmi Hendrix Jimmy Hendricks Jimmy Hendrix Jimmy hendrix
         Jimy Hendrix Johnny Allen Hendrix Johnny Hendrix
Verbinden van Biografie¨n aan Documenten
                      e                                                  13



                                          Concreet

Stap 1 Vind een betrouwbare, goed georganiseerde en
   gedocumenteerde bron met biodata met in ieder geval
   • permanente vrij beschikbare unieke identifiers voor elke entiteit.

Stap 2 Maak de normaliserings-functie.

Stap 3 Zet een kwaliteitscontrole systeem op.
   • % correct gevonden (recall)
   • % niet gevonden
   • % verkeerd gevonden (precisie)

Stap 4 Hergebruik je functie op andere data.
Verbinden van Biografie¨n aan Documenten
                      e                                              14



                                Boodschap en Conclusies

• Een niet verbonden of niet koppelbaar archief heeft geen waarde.

• Een archief kan een bron van meerwaarde worden door openheid.
  • open machine leesbare formaten
  • geen maffe restricties, beperkingen, moeilijkheden
  • gebruik een slim verdienmodel
  • wees eerlijk
  • wees niet bang
  • gebruik je gebruikers (kwaliteitscontrole, crowdsourcing)

• De waarde van je archief wordt bepaald door het aantal
  koppelingen.

More Related Content

Viewers also liked

Dans dataprijs2012
Dans dataprijs2012Dans dataprijs2012
Dans dataprijs2012maartenmarx
 
Haagse Hogeschool 2012-09-13
Haagse Hogeschool 2012-09-13Haagse Hogeschool 2012-09-13
Haagse Hogeschool 2012-09-13maartenmarx
 
Presentation at NLDB 2012
Presentation at NLDB 2012Presentation at NLDB 2012
Presentation at NLDB 2012maartenmarx
 
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13maartenmarx
 
Economie van de aandacht
  Economie van de aandacht  Economie van de aandacht
Economie van de aandachtmaartenmarx
 
Ilja state2014expressivity
Ilja state2014expressivityIlja state2014expressivity
Ilja state2014expressivitymaartenmarx
 

Viewers also liked (7)

Dans dataprijs2012
Dans dataprijs2012Dans dataprijs2012
Dans dataprijs2012
 
Haagse Hogeschool 2012-09-13
Haagse Hogeschool 2012-09-13Haagse Hogeschool 2012-09-13
Haagse Hogeschool 2012-09-13
 
Presentation at NLDB 2012
Presentation at NLDB 2012Presentation at NLDB 2012
Presentation at NLDB 2012
 
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13
Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13
 
Economie van de aandacht
  Economie van de aandacht  Economie van de aandacht
Economie van de aandacht
 
Ilja state2014expressivity
Ilja state2014expressivityIlja state2014expressivity
Ilja state2014expressivity
 
DERECHO A LA LIBERTAD
DERECHO A LA LIBERTADDERECHO A LA LIBERTAD
DERECHO A LA LIBERTAD
 

Similar to Screen biographischportaal2010 12-10

Slides social software Fred Truyen
Slides social software Fred TruyenSlides social software Fred Truyen
Slides social software Fred TruyenFtruyen
 
Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018
Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018
Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018Netwerk Oorlogsbronnen
 
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheekInctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheekElco van Staveren
 
Samen delen samen spelen juni 2015
Samen delen samen spelen juni 2015Samen delen samen spelen juni 2015
Samen delen samen spelen juni 2015marianne73
 
Beeldbank UT en Social Media
Beeldbank UT en Social MediaBeeldbank UT en Social Media
Beeldbank UT en Social MediaJulia Meijvogel
 
20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...
20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...
20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...VNG Realisatie
 
Datamanagement for Research: A Case Study
Datamanagement for Research: A Case StudyDatamanagement for Research: A Case Study
Datamanagement for Research: A Case StudyDirk Roorda
 
1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids
1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids
1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gidsKVANdagen
 
Kennismaking Triple A @ncyclopedie
Kennismaking Triple A @ncyclopedieKennismaking Triple A @ncyclopedie
Kennismaking Triple A @ncyclopediesaMBO-ICT
 
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...VNG Realisatie
 
Webwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo Techniek
Webwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo TechniekWebwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo Techniek
Webwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo TechniekMediaprofiel ❖
 
Webwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniek
Webwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniekWebwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniek
Webwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniekMarielle van Rijn
 
Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016Enno Meijers
 
Gastcollege e learning trends fontys 2015
Gastcollege e learning trends fontys 2015Gastcollege e learning trends fontys 2015
Gastcollege e learning trends fontys 2015WilfredRubens.com
 
CED 2016 Begrijpend Lezen en Onlinegeleterdheid
CED 2016 Begrijpend Lezen en OnlinegeleterdheidCED 2016 Begrijpend Lezen en Onlinegeleterdheid
CED 2016 Begrijpend Lezen en OnlinegeleterdheidJeroen Clemens
 

Similar to Screen biographischportaal2010 12-10 (20)

Slides social software Fred Truyen
Slides social software Fred TruyenSlides social software Fred Truyen
Slides social software Fred Truyen
 
Jan Bollansee, “Databanken in de bibliotheek: klik hier voor meer informatie”
Jan Bollansee,  “Databanken in de bibliotheek: klik hier voor meer informatie”Jan Bollansee,  “Databanken in de bibliotheek: klik hier voor meer informatie”
Jan Bollansee, “Databanken in de bibliotheek: klik hier voor meer informatie”
 
Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018
Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018
Hoe zoeken mensen door historische kranten? | Netwerkdag Oorlogsbronnen 2018
 
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheekInctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
 
Samen delen samen spelen juni 2015
Samen delen samen spelen juni 2015Samen delen samen spelen juni 2015
Samen delen samen spelen juni 2015
 
Beeldbank UT en Social Media
Beeldbank UT en Social MediaBeeldbank UT en Social Media
Beeldbank UT en Social Media
 
20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...
20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...
20190425 presentatie architectuur themabijeenkomst digitale informatie en inn...
 
Wat Wikileaks ons leert over bibliotheken
Wat Wikileaks ons leert over bibliothekenWat Wikileaks ons leert over bibliotheken
Wat Wikileaks ons leert over bibliotheken
 
Datamanagement - Helen klip
Datamanagement - Helen klipDatamanagement - Helen klip
Datamanagement - Helen klip
 
Data-interoperabiliteit in de praktijk
Data-interoperabiliteit in de praktijkData-interoperabiliteit in de praktijk
Data-interoperabiliteit in de praktijk
 
Bibliotheek 4.0
Bibliotheek 4.0Bibliotheek 4.0
Bibliotheek 4.0
 
Datamanagement for Research: A Case Study
Datamanagement for Research: A Case StudyDatamanagement for Research: A Case Study
Datamanagement for Research: A Case Study
 
1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids
1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids
1206_aertsen_digitale_chaos_aanpakken_met_de_dig_gids
 
Kennismaking Triple A @ncyclopedie
Kennismaking Triple A @ncyclopedieKennismaking Triple A @ncyclopedie
Kennismaking Triple A @ncyclopedie
 
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
20190329 leveranciersbijeenkomst Toekomstperspectief Informatie- en archiefbe...
 
Webwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo Techniek
Webwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo TechniekWebwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo Techniek
Webwijsheid juni 2014 Workshop landelijke onderwijsdag vmbo & mbo Techniek
 
Webwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniek
Webwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniekWebwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniek
Webwijsheid juni 2014 Workshop Onderwijsdag vmbo & mbo techniek
 
Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016Presentatie PCDB overleg Utrecht 28 juni 2016
Presentatie PCDB overleg Utrecht 28 juni 2016
 
Gastcollege e learning trends fontys 2015
Gastcollege e learning trends fontys 2015Gastcollege e learning trends fontys 2015
Gastcollege e learning trends fontys 2015
 
CED 2016 Begrijpend Lezen en Onlinegeleterdheid
CED 2016 Begrijpend Lezen en OnlinegeleterdheidCED 2016 Begrijpend Lezen en Onlinegeleterdheid
CED 2016 Begrijpend Lezen en Onlinegeleterdheid
 

More from maartenmarx

Women in Dutch parliament: what they did
Women in Dutch parliament: what they didWomen in Dutch parliament: what they did
Women in Dutch parliament: what they didmaartenmarx
 
Keynote Exploring and Exploiting Official Publications
Keynote Exploring and Exploiting Official PublicationsKeynote Exploring and Exploiting Official Publications
Keynote Exploring and Exploiting Official Publicationsmaartenmarx
 
Namescape 2012 03 06
Namescape 2012 03 06Namescape 2012 03 06
Namescape 2012 03 06maartenmarx
 
voting advice slides
 voting advice slides voting advice slides
voting advice slidesmaartenmarx
 
TV-slant presentatie_politicologen_etmaal
TV-slant presentatie_politicologen_etmaalTV-slant presentatie_politicologen_etmaal
TV-slant presentatie_politicologen_etmaalmaartenmarx
 
Groningen nl pgroep
Groningen nl pgroepGroningen nl pgroep
Groningen nl pgroepmaartenmarx
 
networks inparliament-ccct
 networks inparliament-ccct networks inparliament-ccct
networks inparliament-ccctmaartenmarx
 

More from maartenmarx (7)

Women in Dutch parliament: what they did
Women in Dutch parliament: what they didWomen in Dutch parliament: what they did
Women in Dutch parliament: what they did
 
Keynote Exploring and Exploiting Official Publications
Keynote Exploring and Exploiting Official PublicationsKeynote Exploring and Exploiting Official Publications
Keynote Exploring and Exploiting Official Publications
 
Namescape 2012 03 06
Namescape 2012 03 06Namescape 2012 03 06
Namescape 2012 03 06
 
voting advice slides
 voting advice slides voting advice slides
voting advice slides
 
TV-slant presentatie_politicologen_etmaal
TV-slant presentatie_politicologen_etmaalTV-slant presentatie_politicologen_etmaal
TV-slant presentatie_politicologen_etmaal
 
Groningen nl pgroep
Groningen nl pgroepGroningen nl pgroep
Groningen nl pgroep
 
networks inparliament-ccct
 networks inparliament-ccct networks inparliament-ccct
networks inparliament-ccct
 

Screen biographischportaal2010 12-10

  • 1. Verbinden van Biografie¨n aan Documenten e 1 Verbinden van Biografie¨n aan e Documenten Maarten Marx Universiteit van Amsterdam Den Haag 2010-12-10
  • 2. Verbinden van Biografie¨n aan Documenten e 2 Koppeling Bio’s en Documenten: Inhoud • Wat is dat? • Wat heeft dat voor nut? • Hoe doe je dat? • Hoe maak je een Bio-archief waardevol?
  • 3. Verbinden van Biografie¨n aan Documenten e 3 Koppeling Bio’s en Documenten. Wat is dat? • Handeling zonder koppeling • Gekoppelde Handelingen • Gekoppelde geOCRde Handelingen
  • 4. Verbinden van Biografie¨n aan Documenten e 4 Archieven om naar te koppelen • Twee op parlementari¨rs gerichte databases: e • parlement.com (Parlementair Documentatie Centrum) • pentapolitica.nl (PoliticalMashup) • Wikipedia is een mooi alternatief. http://nl.wikipedia.org/wiki/Lijst_van_Nederlandse_ politici
  • 5. Verbinden van Biografie¨n aan Documenten e 5 Koppeling andersom Dynamische Biografie¨n e Combinatie van • statische achtergrond data • dynamische groeiende gegevens. • Voorbeelden • http://www.pentapolitica.nl/politici/femke-halsema • Pagina van Sophie in het Veld bij Europees Parlement • Sophie in het Veld bij IkKiesWijzer.nl • Pagina van David Cameron bij TheyWorkForYou.com
  • 6. Verbinden van Biografie¨n aan Documenten e 6 Koppeling Mens–Document. Wat is het nut? I • Verhogen van betrouwbaarheid van de data. • Makkelijker toegang tot de data. • Grootscheeps automatisch (wetenschappelijk) onderzoek wordt opeens mogelijk.
  • 7. Verbinden van Biografie¨n aan Documenten e 7 Koppeling Mens–Document. Wat is het nut? II 1. Normalisatie van namen door koppeling. • Typos • Naamswijzigingen • OCR fouten 2. Zoeken op naam met autocompletion. Voorbeeld in DBLP. 3. Van document-centrisch naar mens-centrisch.
  • 8. Verbinden van Biografie¨n aan Documenten e 8 Mens-centrische informatiebehoeften • Expert search. http://ikkieswijzer.nl/personen • Geef me alle uitspraken van Balkenende over Suriname • Geef alle uitspraken gedaan door allochtonen over Suriname. • Wie spreekt het meest in de Tweede Kamer? • Glazen Plafond Query. De Kamer bestaat voor 40% uit vrouwen. Hoeveel % van de uitspraken wordt door vrouwen gedaan? • Interruptiegraaf. 2010-10-27 2010-10-26
  • 9. Verbinden van Biografie¨n aan Documenten e 9 Hoe maak je zo’n koppeling? • Twee manieren. • Van bovenaf opleggen (top-down) • Door “slimme algorithmes” laten aanleggen (bottom up) • Top-down werkt alleen vanaf een bepaald moment, en • is moeilijk te onderhouden in een gedistribueerde omgeving.
  • 10. Verbinden van Biografie¨n aan Documenten e 10 Bottom up • Bottom-up kan ook op historische data (zie statengeneraaldigitaal.nl). • Bottom-up geeft inzicht in de kwaliteit van de koppeling. • Bottom-up algorithmes zijn herbruikbaar. • Er is zeer veel onderzoek gedaan naar bottom up algorithmes. • Data Deduplication • named entity reconciliation • Zwaan–kleef–aan effect. (Veel gebruikt systeem wordt de facto standaard).
  • 11. Verbinden van Biografie¨n aan Documenten e 11 Bottom up pipeline • Intuitie: maak het equivalent van de zoek functie in Google Maps. • http://maps.google.com/maps?hl=en&q=Koninklijke+ Bibliotheek+Den+Haag&sa=N&tab=sl • normalize(KB Den Haag) = (52.081273,4.328055) • Dus nodig: • Dimensie met unieke waardes voor elk datapunt. • Normaliserings-functie. • Eventueel functie terug.
  • 12. Verbinden van Biografie¨n aan Documenten e 12 Super goede baseline: Wikipedia • Gebruik Wikipedia paginanamen als je dimensie. • http://en.wikipedia.org/wiki/Jimi_Hendrix • Gebruik Wikipedia search functie (inclusief redirects) als normaliseringsfunctie. • http: //en.wikipedia.org/w/index.php?search=Jimi+Hendricks • Prima (crowdsourced and quality-controlled) disambiguation and redirect. James Hendrix James Marshall Hendrix Jim Hendrix Jimi hendrix Jimmi Hendrix Jimmy Hendricks Jimmy Hendrix Jimmy hendrix Jimy Hendrix Johnny Allen Hendrix Johnny Hendrix
  • 13. Verbinden van Biografie¨n aan Documenten e 13 Concreet Stap 1 Vind een betrouwbare, goed georganiseerde en gedocumenteerde bron met biodata met in ieder geval • permanente vrij beschikbare unieke identifiers voor elke entiteit. Stap 2 Maak de normaliserings-functie. Stap 3 Zet een kwaliteitscontrole systeem op. • % correct gevonden (recall) • % niet gevonden • % verkeerd gevonden (precisie) Stap 4 Hergebruik je functie op andere data.
  • 14. Verbinden van Biografie¨n aan Documenten e 14 Boodschap en Conclusies • Een niet verbonden of niet koppelbaar archief heeft geen waarde. • Een archief kan een bron van meerwaarde worden door openheid. • open machine leesbare formaten • geen maffe restricties, beperkingen, moeilijkheden • gebruik een slim verdienmodel • wees eerlijk • wees niet bang • gebruik je gebruikers (kwaliteitscontrole, crowdsourcing) • De waarde van je archief wordt bepaald door het aantal koppelingen.