2. Programma
• 13.00-13.10 Welkom door Puck Huitsing, programmadirecteur NOB
• 13.10-13.30 Netwerk Oorlogsbronnen door Edwin Klijn, programmamanager
• 13.30-14.00 De virtuele cultuurbezoeker. #wiedan? door Jos de Haan, Centraal Cultureel Planbureau/Erasmus Universiteit
• 14.00-14.20 Q&A
• 14.20-15.00 PAUZE en overgang naar de sessies
• 15.00-16.30 Parallelle sessies:
Sessie I in Spiegelstudio: Van digitaliseren naar een bruikbare bron, Cecile van der Harten, Marian Hellema en Olaf Janssen
Sessie II in Tuinzaal: Oorlogsbronnen verbonden, Lizzy Jongma en Michiel Hildebrand
Sessie III in Boardroom: Het grote oorlogsbronnenspel, Tessa Free, Yeva Swart en Inge van Stokkom
• 16.30-16.55 Beeldbank Nederlands Indië door Thom Hoffman, acteur, fotograaf en documentairemaker
• 16.55-17.00 Afsluiting
• 17.00-18.00 Borrel
Wifi: gast-wifi
Twitter: #hoedan
@Oorlogsbronnen
3. Deelnemers Netwerk Oorlogsbronnen
1 Aaltense Musea (Onderduikmuseum markt 12)
2 Airborne Museum ‘Hartenstein’
3 Anne Frank Stichting
4 Atria Kennisinstituut voor Emancipatie en Vrouwengeschiedenis
5 Bevrijdingsmuseum Zeeland
6 Brabants Historisch Informatie Centrum (BHIC)
7 CBG Centrum voor familiegeschiedenis
8 Drents Archief
9 Erfgoed Leiden en Omstreken
10 Erfgoedcentrum Achterhoek en Liemers (ECAL)
11 Erfgoedcluster Weert
12 Fries Verzetsmuseum
13 Gelders Archief
14 Gemeentearchief Ede en Scherpenzeel
15 Gemeentearchief Schiedam
16 Gemeentearchief Schouwen-Duiveland
17 Gemeentearchief Zaanstad
18 Gronings Audiovisueel Archief (GAVA);
Valt onder RHC Groninger Archieven
19 Haags Gemeentearchief
20 Herinneringscentrum Kamp Westerbork
21 Het Utrechts Archief
22 Historisch Centrum Leeuwarden
23 Indisch Herinneringscentrum (IHC)
24 Joods Cultureel Kwartier
25 Koninklijke Bibliotheek
26 Maritiem Museum Rotterdam
27 Museon
28 Nationaal Archief
29 Nationaal Bevrijdingsmuseum 1944-1945
30 Nationaal Comité 4 en 5 mei
31 Nationaal Monument Kamp Amersfoort
32 Nationaal Monument Kamp Vught
33 Nederlands Instituut voor Beeld en Geluid (NIBG)
34 Nederlands Instituut voor Militaire Historie (NIMH)
35 Nederlands Muziek Instituut/MusicForce Media (gefuseerd met HGA)
36 NIOD Instituut voor Oorlogs-, Holocaust- en Genocidestudies
37 Noord-Hollands Archief
38 Oorlogsgravenstichting
39 Oorlogs- en Verzetscentrum Groningen (OVCG)
40 Regionaal Archief Alkmaar
41 Regionaal Archief Nijmegen
42 Regionaal Archief Tilburg
43 Regionaal Historisch Centrum Groninger Archieven
44 Regionaal Historisch Centrum Limburg
45 Rijksdienst voor het Cultureel Erfgoed (RCE)
46 Rijksmuseum
47 Stadsarchief Amsterdam
48 Stadsarchief Rotterdam
49 Stichting Oranjehotel
50 Stichting Spaarnestad Photo
51 Tresoar
52 Verzetsmuseum Amsterdam
53 Verzetsmuseum Zuid-Holland
54 West-Brabants Archief
55 Zeeuws Archief
56 Stadsarchief Breda
9. Tien geboden
1. Gij zult uw gehele collectie online aanbieden
2. Gij zult uw collectiedata als open data delen
3. Gij zult persistent identifiers gebruiken
4. Gij zult standaardiseren
5. Gij zult uw kennis delen als digitale data
6. Gij zult de computer als klant waarderen
7. Gij zult uw digitale gebruikers respecteren
8. Gij zult de kennis van anderen gebruiken
9. Gij zult uw publiek benutten
10. Gij zult deze geboden in acht nemen
=
10. Van ‘web of documents’…
http://www.kampwesterbork.nl
12. …naar semantisch web…
The Semantic Web is not a separate Web but an extension of the
current one, in which information is given well-defined meaning,
better enabling computers and people to work in cooperation
Tim Berners-Lee, Scientific American 2001
30. WIE, WAT, WAAR EN WANNEER?
Met de Aanslag op het Amsterdams bevolkingsregister
wordt de aanslag bedoeld die tijdens de Tweede
Wereldoorlog, in de nacht van 27 maart 1943, werd
gepleegd op het gebouw van de gemeente Amsterdam
aan de Plantage Kerklaan 36.
Wikipedia
Datum: 27 maart 1943
Locatie: Amsterdam
34. En ook…
• Noordelijke Netwerkdag en andere bijeenkomsten
• Gezamenlijk WO2-Metamorfoze-voorstel van het
Bevrijdingsmuseum Zeeland, Internationaal Instituut voor Sociale
Geschiedenis, Regionaal Archief Nijmegen en Verzetsmuseum
Amsterdam
• Nieuwsbrief, blogs en verslagen
37. Oorlogsbronnen4all
• Teruggeven van ‘verrijkte’ collectiedata aan
collectiehoudende instellingen en andere
belangstellenden
• Ook: downloaden zoekresultaten
• Formaten: CSV, XLSX, JSON
• Oktober-december 2017
38. Open Data WO2-project
• Verzamelen en vrijmaken (‘clearen’) van
bronnenmateriaal voor hergebruik
• Verspreiden van bronnenmateriaal via
Wikimedia, NOB,
tweedewereldoorlog.nl, Liberation
Route Europe en verschillende
oorlogsmusea
• Augustus 2017- april 2018
39. 2018 en verder
• Collectiedata: meer, meer, meer
• Programmaplan 2019-2021
• Word deelnemer en deel je collectiedata!
• Uitbreiding regionale netwerken
• Meer publieksapplicaties
Het herstel van de verkeersbrug over de IJssel bij Zwolle van 1941-1943.
Standaard slide
Beeldnummer: 45382 Collectie: NIOD Bijschrift: Das sind die Heerstrassen, die die Deutschen in Jugoslawien bewältigen mussten: aufgewühlte und zerfahrene Morastwege. Beeld Datum:29-05-1941 (Vrijgegeven) Trefwoorden:Duitse Strijdkrachten; Modder; Partizanen - Zie ook: Guerrilla's; Vervolging; VoertuigenGeografie:Joegoslavië Beeldsoort:Foto
Standaard slide
Van documenten naar data.
Van documenten naar data.
Bevrijdingschocolade, Chocolate from British military rations World War II, handed to a Dutch civilian by a British soldier during the liberation of the Netherlands and preserved as a precious gift.
Geocoderen is het scriptsgewijs aan een geocoder vragen of er een locatie bekend is bij een bepaalde naam. Soms levert dat onverwachte resultaten op. Als je die naam met Named Entity Recognition uit een tekst hebt gehaald, dan denkt een geocoder al snel de Duitstalige boeken 'Retter in Uniform' en 'Statisten in Uniform' in het Amerikaanse plaatsje 'Uniform' te moeten situeren.
Anne Frank is een straat in Bunschoten-Spakenburg (flink inzoomen, ligt wat verstopt achter Grebbelinie!) en elders in het land vindt je de straten Bevrijding, Zuidfront, Veldpost, Luchtvaart, Genie, Kampement en Spitfire. In Friesland liggen de plaatsen Moskou en War.
Bij het geocoderen van Oorlogsbronnen bleken veel collecties gelukkig over een apart veld voor geografische termen te beschikken. Maar dat je zeker weet dat het niet om een persoons- of andere naam gaat wil niet zeggen dat je problemen verdwenen zijn. Zo'n naam hoeft namelijk helemaal niet eenduidig te zijn. In Suriname ligt ook een Berlijn.
Als je zoals ik eerst de Historische Geocoder gebruikt en de GeoNames API pas als je daarmee niets vindt, dan ligt Bali zo in een Purmerends wijkje. Sowieso halen straatnaamcommissies hun inspiratie nogal eens uit een atlas: Atlantische Oceaan, Westfriesland, Sudeten, Normandië, Saksen, Javazee, Sicilië. En als je daar 'straat', 'weg' of 'laan' achter plakt gaat het er maar raar uit zien (Javazeestraat).
Soms is de valse positief veroorzaakt door de strategie die je bij geocoderen kiest. Als je aan GeoNames vraagt naar Brussel en je accepteert alleen plaatsen met precies dezelfde naam, dan mis je Brussels en eindig je in het Zuid-Afrikaanse Brussel. Maar welke strategie je ook kiest, bij elke loop je kans op vals positieven.
Nu zijn de vals positieven op de kaart hierboven op de vingers van een hand of achtendertig te tellen. En het aantal correct gegeocodeerde locaties bedroeg meer dan tienduizend! Ik zeg het maar even, dat u op basis van dit blogbericht niet besluit dat u voor geocodeerprojecten maar beter iemand anders in kunt huren.
Collectie-eigenaren zouden een hoop gedoe kunnen voorkomen door unieke identifiers te gebruiken in plaats van (of naast) plaatsnamen. GeoNames of TGN URI's bijvoorbeeld, of BAG id's. Dat scheelt vals positieven, vals negatieven en uiteindelijk ook geld. Want dan zijn geocodeerprojecten naderhand niet meer nodig.
Menno den Engelse / Islands of Meaning
De plaatsen Agenda, Social, Library, of Teheran, Sicily en Darfur in Amerika. Ze bestaan echt. Zoals ook Afrika in Rusland, Parijs in België en Borneo in ons eigen land. Nederland is zelfs behept met de straten Verzet, Plateau, Randstad, Contact, maar ook Vrouwenkamp, Zieken en Onrust. Deze plaats- en straatnamen maken het geocoderen van oorlogsbronnen niet makkelijk. Dat bleek tijdens de uitvoering van het pilotproject Geocoding van Netwerk Oorlogsbronnen (NOB). Een onderzoek naar het verbeteren van ‘zoeken op locatie’ door grote hoeveelheden data automatisch van geografische informatie te voorzien. In dit geval de ruim 8,6 miljoen Oorlogsbronnen.
Project Geocoding is begin juli afgerond en bestaat uit meerdere aspecten: (1) Onderzoek van de kwaliteit van bestaande geografische metadata van bronnen uit de NOB-portal. (2) Daarop volgend hoe geografische locaties automatisch aan de metadata gekoppeld kunnen worden door gebruik van verschillende databases van unieke geocodes (thesauri). (3) Tot slot de ontwikkeling van een kaart voor toegang tot collecties.
Toekomstbestendig
Waarom unieke geocodes? Omdat standaardisatie uitwisseling en koppeling van data mogelijk maakt. En om toekomstbestendige metadata te gebruiken. Pilotuitvoerder Menno den Engelse pleit bij het georefereren dan ook voor uniform resource identifiers, ofwel URI’s. Dit zijn permanente unieke codes (persistent identifiers) van in dit geval geografische locaties. Een URI blijft door de tijd heen hetzelfde, ongeacht of de naam van een plaats verandert. Zo kan de geografische locatie altijd worden terug gevonden op het internet. Er is geen afhankelijkheid meer van spelling of hiërarchie (Sicily de plaats in Nebraska, Amerika of het Italiaanse eiland?).
Projectuitvoerder Menno den Engelse: “Collectiebeheerders kunnen een hoop gedoe voorkomen door unieke identifiers te gebruiken in plaats van (of naast) plaatsnamen. Het scheelt de verwerking van vals positieven en vals negatieven!”. Vals positieven zijn termen die worden herkend als plaatsnaam, maar geen geografische locatie zijn. Zoals een inventarisnummer met de beschrijving ‘Voedselverstrekking aan zieken’, die geen geografische koppeling aan de straat ‘Zieken’ in Den Haag behoeft. En een tekening met belevenissen uit de agenda van een verpleegster op Bandoeng, die uiteraard niet gesitueerd is in de plaats Agenda in Amerika. Maar ook vals negatieven resultaten zijn gevonden: plaatsen die wel bestaan maar nog geen geocode hebben, zoals Kamp Westerbork.
Gegeocodeerd, en dan?
Wat kunnen we met de gegeocodeerde metadata? Koppelen! Gestandaardiseerde metadata kan worden uitgewisseld en aan elkaar verbonden. Collecties van verschillende instellingen, die fysiek op verschillende locaties zijn geborgen, worden digitaal gelinkt op basis van overeenkomstige locatie. Zo kunnen uit een grote hoeveelheid data alle bronnen geselecteerd worden over een provincie, gebied of plaats. De geografische code is leidend in de ontsluiting. Een verrijking voor lokale en regionale oorlogerfgoedbeheerders!
Aan de metadata van alle oorlogsbronnen zijn in het project – waar mogelijk – een geocode en coördinaten toegevoegd. Collectiebeherende instellingen kunnen de verrijkte data downloaden en in hun eigen collectiebeheersystemen opnemen. Zo wordt ‘zoeken op locatie’ binnen de eigen systemen verbeterd, kan de metadata worden uitgewisseld en gekoppeld én is er de mogelijkheid tot het maken van een kaart. Ter illustratie is dit gedaan met de collectie van De Gelderlander en per provincie. Let op! Dit zijn tijdelijke, ongecorrigeerde websites. We willen middels deze sites onder meer de records met vals positieve geocodes identificeren. Een interessante onderzoeksbron is de gegeocodeerde De Gelderlander, die nu laat zien waar de krant in de oorlogsperiode over schreef. Want in tegenstelling tot de rest van de oorlogsbronnen, waarvan de metadata is gegeocodeerd, is deze krant OCR-gescand en hangen de geografische codes aan de inhoud van de krant. Met name de advertenties, veelal met adresgegevens, geven een mooi beeld van het dagelijks leven in de oorlog.
Test met aantal collecties waaronder Fries Verzetsmuseum, Brabant Cloud, OCLC en De Ree.
Standaard slide
Standaard slide
Geocoderen is het scriptsgewijs aan een geocoder vragen of er een locatie bekend is bij een bepaalde naam. Soms levert dat onverwachte resultaten op. Als je die naam met Named Entity Recognition uit een tekst hebt gehaald, dan denkt een geocoder al snel de Duitstalige boeken 'Retter in Uniform' en 'Statisten in Uniform' in het Amerikaanse plaatsje 'Uniform' te moeten situeren.
Anne Frank is een straat in Bunschoten-Spakenburg (flink inzoomen, ligt wat verstopt achter Grebbelinie!) en elders in het land vindt je de straten Bevrijding, Zuidfront, Veldpost, Luchtvaart, Genie, Kampement en Spitfire. In Friesland liggen de plaatsen Moskou en War.
Bij het geocoderen van Oorlogsbronnen bleken veel collecties gelukkig over een apart veld voor geografische termen te beschikken. Maar dat je zeker weet dat het niet om een persoons- of andere naam gaat wil niet zeggen dat je problemen verdwenen zijn. Zo'n naam hoeft namelijk helemaal niet eenduidig te zijn. In Suriname ligt ook een Berlijn.
Als je zoals ik eerst de Historische Geocoder gebruikt en de GeoNames API pas als je daarmee niets vindt, dan ligt Bali zo in een Purmerends wijkje. Sowieso halen straatnaamcommissies hun inspiratie nogal eens uit een atlas: Atlantische Oceaan, Westfriesland, Sudeten, Normandië, Saksen, Javazee, Sicilië. En als je daar 'straat', 'weg' of 'laan' achter plakt gaat het er maar raar uit zien (Javazeestraat).
Soms is de valse positief veroorzaakt door de strategie die je bij geocoderen kiest. Als je aan GeoNames vraagt naar Brussel en je accepteert alleen plaatsen met precies dezelfde naam, dan mis je Brussels en eindig je in het Zuid-Afrikaanse Brussel. Maar welke strategie je ook kiest, bij elke loop je kans op vals positieven.
Nu zijn de vals positieven op de kaart hierboven op de vingers van een hand of achtendertig te tellen. En het aantal correct gegeocodeerde locaties bedroeg meer dan tienduizend! Ik zeg het maar even, dat u op basis van dit blogbericht niet besluit dat u voor geocodeerprojecten maar beter iemand anders in kunt huren.
Collectie-eigenaren zouden een hoop gedoe kunnen voorkomen door unieke identifiers te gebruiken in plaats van (of naast) plaatsnamen. GeoNames of TGN URI's bijvoorbeeld, of BAG id's. Dat scheelt vals positieven, vals negatieven en uiteindelijk ook geld. Want dan zijn geocodeerprojecten naderhand niet meer nodig.
Menno den Engelse / Islands of Meaning
De plaatsen Agenda, Social, Library, of Teheran, Sicily en Darfur in Amerika. Ze bestaan echt. Zoals ook Afrika in Rusland, Parijs in België en Borneo in ons eigen land. Nederland is zelfs behept met de straten Verzet, Plateau, Randstad, Contact, maar ook Vrouwenkamp, Zieken en Onrust. Deze plaats- en straatnamen maken het geocoderen van oorlogsbronnen niet makkelijk. Dat bleek tijdens de uitvoering van het pilotproject Geocoding van Netwerk Oorlogsbronnen (NOB). Een onderzoek naar het verbeteren van ‘zoeken op locatie’ door grote hoeveelheden data automatisch van geografische informatie te voorzien. In dit geval de ruim 8,6 miljoen Oorlogsbronnen.
Project Geocoding is begin juli afgerond en bestaat uit meerdere aspecten: (1) Onderzoek van de kwaliteit van bestaande geografische metadata van bronnen uit de NOB-portal. (2) Daarop volgend hoe geografische locaties automatisch aan de metadata gekoppeld kunnen worden door gebruik van verschillende databases van unieke geocodes (thesauri). (3) Tot slot de ontwikkeling van een kaart voor toegang tot collecties.
Toekomstbestendig
Waarom unieke geocodes? Omdat standaardisatie uitwisseling en koppeling van data mogelijk maakt. En om toekomstbestendige metadata te gebruiken. Pilotuitvoerder Menno den Engelse pleit bij het georefereren dan ook voor uniform resource identifiers, ofwel URI’s. Dit zijn permanente unieke codes (persistent identifiers) van in dit geval geografische locaties. Een URI blijft door de tijd heen hetzelfde, ongeacht of de naam van een plaats verandert. Zo kan de geografische locatie altijd worden terug gevonden op het internet. Er is geen afhankelijkheid meer van spelling of hiërarchie (Sicily de plaats in Nebraska, Amerika of het Italiaanse eiland?).
Projectuitvoerder Menno den Engelse: “Collectiebeheerders kunnen een hoop gedoe voorkomen door unieke identifiers te gebruiken in plaats van (of naast) plaatsnamen. Het scheelt de verwerking van vals positieven en vals negatieven!”. Vals positieven zijn termen die worden herkend als plaatsnaam, maar geen geografische locatie zijn. Zoals een inventarisnummer met de beschrijving ‘Voedselverstrekking aan zieken’, die geen geografische koppeling aan de straat ‘Zieken’ in Den Haag behoeft. En een tekening met belevenissen uit de agenda van een verpleegster op Bandoeng, die uiteraard niet gesitueerd is in de plaats Agenda in Amerika. Maar ook vals negatieven resultaten zijn gevonden: plaatsen die wel bestaan maar nog geen geocode hebben, zoals Kamp Westerbork.
Gegeocodeerd, en dan?
Wat kunnen we met de gegeocodeerde metadata? Koppelen! Gestandaardiseerde metadata kan worden uitgewisseld en aan elkaar verbonden. Collecties van verschillende instellingen, die fysiek op verschillende locaties zijn geborgen, worden digitaal gelinkt op basis van overeenkomstige locatie. Zo kunnen uit een grote hoeveelheid data alle bronnen geselecteerd worden over een provincie, gebied of plaats. De geografische code is leidend in de ontsluiting. Een verrijking voor lokale en regionale oorlogerfgoedbeheerders!
Aan de metadata van alle oorlogsbronnen zijn in het project – waar mogelijk – een geocode en coördinaten toegevoegd. Collectiebeherende instellingen kunnen de verrijkte data downloaden en in hun eigen collectiebeheersystemen opnemen. Zo wordt ‘zoeken op locatie’ binnen de eigen systemen verbeterd, kan de metadata worden uitgewisseld en gekoppeld én is er de mogelijkheid tot het maken van een kaart. Ter illustratie is dit gedaan met de collectie van De Gelderlander en per provincie. Let op! Dit zijn tijdelijke, ongecorrigeerde websites. We willen middels deze sites onder meer de records met vals positieve geocodes identificeren. Een interessante onderzoeksbron is de gegeocodeerde De Gelderlander, die nu laat zien waar de krant in de oorlogsperiode over schreef. Want in tegenstelling tot de rest van de oorlogsbronnen, waarvan de metadata is gegeocodeerd, is deze krant OCR-gescand en hangen de geografische codes aan de inhoud van de krant. Met name de advertenties, veelal met adresgegevens, geven een mooi beeld van het dagelijks leven in de oorlog.
Waar draait dit project om: hoe kun je van een een ongestructureerd analoog archief bruikbare digitale data maken? Uitleggen dat veel archieven slechts beschreven zijn op metadataniveau, collectie of deelcollectie (correspondentie 33-39, het dossier van meneer Jansen, etc.) Dit gaat erom om losse documenten machineleesbaar te maken.
Waar draait dit project om: hoe kun je van een een ongestructureerd analoog archief bruikbare digitale data maken? Uitleggen dat veel archieven slechts beschreven zijn op metadataniveau, collectie of deelcollectie (correspondentie 33-39, het dossier van meneer Jansen, etc.) Dit gaat erom om losse documenten machineleesbaar te maken.
Waar draait dit project om: hoe kun je van een een ongestructureerd analoog archief bruikbare digitale data maken? Uitleggen dat veel archieven slechts beschreven zijn op metadataniveau, collectie of deelcollectie (correspondentie 33-39, het dossier van meneer Jansen, etc.) Dit gaat erom om losse documenten machineleesbaar te maken.
Laatste pagina met wit vlak voor logootjes (hoogte aanpassen naar behoefte)