7. • Data/informatie/kennis gebruiken van andere organisaties
• Dit kan automatisch worden gedaan
• Linked Open Data overstijgt informatiesilo’s en domeinen
• Nationale strategie Digitaal Erfgoed
Waarom Linked Open Data
8. Architectuur
MARA DERA
MARA = Model Architectuur voor Rijks Archiefinstellingen
DERA = Digitaal Erfgoed Referentie Architectuur
Grotere maatschappelijke waarde door
de gebruiker centraal te stellen
Gebruiker kan ongehinderd door
gezamenlijke erfgoedinformatie
navigeren
De gebruiker staat centraal
Archiefinstellingen maken een
geïntegreerde benadering van cultureel
erfgoed mogelijk
9. DERA principes en Linked Open Data
Principe 5: Zorg dat erfgoedinformatie verwijst
Betekenis en interpretatie van erfgoedinformatie is afhankelijk van de
context. De context moet worden vastgelegd door te verwijzen naar
gerelateerde en beheerde erfgoedinformatie, definities etc.
Principe 6: Zorg dat erfgoedinformatie verwijsbaar is
Erfgoedinformatie is verwijsbaar wanneer er relaties tussen deze en
andere erfgoedinformatie kunnen worden gelegd. Gebruikers moeten
dat kunnen doen om bestaande data via verwijzingen te hergebruiken
of te verrijken.
13. Wat het NA omzet naar Linked Open Data
123 Nadere Toegangen (indexen)
14. Wat het NA omzet naar LOD (2)
108 fotocollecties
15. • publiceer open data op het internet. (*)
• publiceer de open data zo integer mogelijk (zorg dat het
herbruikbaar is). (**)
• gebruik zoveel mogelijk (open) standaarden. (***)
• gebruik URI’s, RDF en Sparql zodat er van buiten naar de data
verwezen kan worden. (****)
• verrijk de context (metadata) van de data door te verwijzen
naar andere data. (*****)
Bron: Tim Berners-Lee
http://5stardata.info/en/
Classificatie van open data
20. HUB3
HUB3 is een platform dat ”ETL” functionaliteit biedt. Dit staat voor:
•Extract: Importeren van data en metadata
•Transform: Transformatie van deze (meta)data naar RDF (triples)
•Load: Opslag van triples in een triple store database
Zoeken en Ontsluiten met HUB3:
• Generieke zoekvragen zijn mogelijk door indexatie met Elastic Search.
• Geavanceerdere zoekvragen zijn mogelijk met de Search API of met een
SPARQL ‘query’.
• OAI-PMH koppelvlak voor publieke (open data) harvesting.
20
29. Ontologie
• ‘Een strikt en uitputtend schema voor een bepaald
onderwerpsdomein, meestal in een hiërarchische
structuur, die alle relevante grootheden en hun relaties
bevat, alsmede de regels waaraan die grootheden en
relaties binnen dat domein voldoen.’ Bron: Wikipedia
• Een verzameling bestaande en nieuw gemunte classes en
termen bedoeld om de NT’s en fotocollecties om te zetten
naar Linked Open Data.
30. Principes ontologie NA
• Gebruik van W3C Standaarden
• Zoveel mogelijk gebruik van bestaande vocabulaires
• Gebaseerd op de schema’s van:
http://www.openarchives.org/ore/terms/
http://www.europeana.eu/schemas/edm/
• Nieuwe veel voorkomende entiteiten munten met
http://archief.nl/.....
31. ore:Aggregation (1)
• ore:Aggregation geeft aan dat het om een verzameling
gaat
• ore:Aggregation wordt zowel op record niveau als op
collectie niveau gebruikt
• ore:aggregates vs ore:isAggregatedBy
33. Subject Predicaat Object Opmerking
http://archief.nl/NL-
HaNA/doc/DeathRecord
:b08a82c6-78c6-102d-
ba75-005056a23d00>
a (rdf:type) naa:NL-HaNA_Aggregation Het record is een aggregatie.
naa:isAggregationType naa:TypeDeathRecord Nadere typering van het aggregatie type.
In dit geval is dit een registratie van
overlijden.
ore:isAggregatedBy <http://archief.nl/NL-
HaNA/doc/View:NT00373_Oranjehotel_Doden
boeken>
De koppeling met de collectie.
ore:aggregates <http://archief.nl/NL-
HaNA/id/persoon/Krijgsgevangene:b08a82c6-
78c6-102d-ba75-005056a23d00>
De persoon die is geïnterpreteerd op basis
van de brondata. De UUID van het record
maakt onderdeel van de URI.
Ore:aggregates <http://archief.nl/NL-
HaNA/doc/KrijgsgevangeneBeschrijving:b08a8
2c6-78c6-102d-ba75-005056a23d00>
De archiefbeschrijving over de persoon uit
het record.
edm:isShownBy <http://www.gahetna.nl/collectie/archief/inve
ntaris/gahetnascan/eadid/2.19.136/inventaris
nr/1/scan-index/10>
Een verwijzing naar de scan van de foto.
rdfs:label "Record van krijgsgevangene Dirk Arie van den
Bosch uit
Nadere Toegang 00373"
Label van het record, kan gebruikt worden
voor het tonen op de website.
36. Stappen genomen door het NA
2017
• Eerste LOD experiment met drie Nadere Toegangen (NT’s)
• Aanschaf HUB3
2018
•URI strategie ontwikkeld http://archief.nl/....
• Begonnen met omzetten van eerste fotocollectie en Nadere Toegangen
• Ontwikkeling ontologie (Protegé)
• Gebruik extra tooling: OpenRefine en GraphDB
• Documenteren van alle omzettingen
2019
• Omzetten alle NT’s en Foto- en beeldcollecties
• Beheer organiseren
• Publiceren van linked open data en documentatie36
37. Activiteiten Nationaal Archief
Interne activiteiten:
• Nadere Toegangen en Fotocollecties worden omgezet naar LOD
• Ontwikkeling NA vocabulaire
• Samenwerking van ICT en inhoudelijk deskundigen
Knooppunt richting de archiefsector:
• Communicatie richting Archiefsector over LOD
• Kennisoverdracht omtrent LOD aan RHC’s organiseren
• Samen met RHC’s LOD community opzetten
38. Aandachtspunten
• Businesscase?
• Gebruik van vaststaande termen/vocabulaires
• Datakwaliteit
• Complexiteit van LOD/weinig expertise beschikbaar
• LOD is arbeidsintensief: 10 medewerkers ±4fte
39. Bronnen
•http://bp4mc2.org/ (Best practices for meaningful
connected computing)
•www.netwerkdigitaalerfgoed.nl/dera
•https://open.hpi.de/courses/semanticweb2016/
•http://www.pilod.nl/wiki/Platform_Linked_Data_Nede
rland
•Europeana EDM Primer
•Nationaal Archief Primer in de maak