Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Le Matterhorn RDF Data Model:
Description archivistique et Linked Open
Data. Vers quelle convergence?
Alain Dubois, Tobias...
Depuis 10 ans, deux axes de réflexion
 Le cœur de la réflexion porte sur la question de la
préservation numérique (garant...
La pérennisation des données
 Modèle de référence OAIS
Prise en compte du modèle d’information global
(contenu d’informat...
Une description archivistique contextualisée
 Normes de description du CIA
4
Matterhorn METS Profile
5
Matterhorn METS Profile
 Première concrétisation des modèles conceptuels
pérennisation / contextualisation
 Une boîte à ...
Matterhorn METS Profile: la Metadata-Map
7
Matterhorn METS Profile
 Le Matterhorn METS Profile
enregistré en 2012 auprès de la Bibliothèque du Congrès
(Washington) ...
Limites du XML
 Structure du XML (EAD et Premis) rend les fichiers
de métadonnées trop lourds
 Absence d’identifiants un...
Vers un modèle générique
 Choix de standards utilisables pour pérenniser
l’information, quelle que soit l’institution qui...
Deux approches possibles
 Approche spécifique de l’EGAD: développer un standard
RDF spécifique aux Archives, mais avec de...
Matterhorn RDF Data Model
12
Matterhorn RDF: modèle conceptuel
13
Matterhorn RDF: contenu d’information
14
Matterhorn RDF: exemple d’un contrat
15
Matterhorn RDF Data Model
16
Une grande partie des attributs (properties) utilisés
dans le Matterhorn RDF Data Model est t...
Comment concrétiser ce modèle?

Formalisation par l’intermédiaire de “SHACL Shapes” au lieu d’une
ontologie spécifique

...
Exemple

shacl.org
 SHACL Shapes
 Exemple de triples de deux dossiers
Liens vers nos ressources

Ressources générales sur les outils Matterhorn METS et RDF:
http://matterhorn.tools/?lang=fr
...
Merci de votre attention
Archives de l’Etat du VS
Alain Dubois
Archiviste cantonal
Rue de Lausanne 45
1950 Sion
+41 27 606...
Upcoming SlideShare
Loading in …5
×

Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivistique et Linked Open Data. Vers quelle convergence? Présentation au “Forum des Archivistes” 5 avril 2019, Saint-Etienne.

236 views

Published on

Approche généraliste du Matterhorn RDF Data Model: se
fonder sur des standards RDF existants et répandus au niveau
international, qui permettent de modéliser le Records in
Contexts

Published in: Government & Nonprofit
  • Be the first to comment

  • Be the first to like this

Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivistique et Linked Open Data. Vers quelle convergence? Présentation au “Forum des Archivistes” 5 avril 2019, Saint-Etienne.

  1. 1. Le Matterhorn RDF Data Model: Description archivistique et Linked Open Data. Vers quelle convergence? Alain Dubois, Tobias Wildi Saint-Etienne, 5 avril 2019 1
  2. 2. Depuis 10 ans, deux axes de réflexion  Le cœur de la réflexion porte sur la question de la préservation numérique (garantie de la qualité de l’information durant tout son cycle de vie, notamment en termes de contextualisation)  Le réflexion est conduite en se fondant sur les normes et standards internationaux 2
  3. 3. La pérennisation des données  Modèle de référence OAIS Prise en compte du modèle d’information global (contenu d’information, information de pérennisation, information de description) 3
  4. 4. Une description archivistique contextualisée  Normes de description du CIA 4
  5. 5. Matterhorn METS Profile 5
  6. 6. Matterhorn METS Profile  Première concrétisation des modèles conceptuels pérennisation / contextualisation  Une boîte à outils composée  d’une Metadata-Map  du Matterhorn METS Profile  d’outils open source (docuteam packer / Octave, docuteam feeder) 6
  7. 7. Matterhorn METS Profile: la Metadata-Map 7
  8. 8. Matterhorn METS Profile  Le Matterhorn METS Profile enregistré en 2012 auprès de la Bibliothèque du Congrès (Washington) comme un profil générique pouvant être utilisé par des institution de conservation du patrimoine gérant des fonds d’archives (archives, bibliothèques et musées)  Des outils open source (docuteam packer, docuteam feeder), utilisé dans 20 services d’archives environ  Utilisation du XML pour la sérialisation 8
  9. 9. Limites du XML  Structure du XML (EAD et Premis) rend les fichiers de métadonnées trop lourds  Absence d’identifiants uniques sur les ressources  Impossibilité de modéliser des relations entre les descriptions à l’interne du fichier  Impossibilité de modéliser des relations avec des ressources externes (Wikidata, Viaf, GND...) 9
  10. 10. Vers un modèle générique  Choix de standards utilisables pour pérenniser l’information, quelle que soit l’institution qui la gère (archives, bibliothèques, musées, centres de recherche, centres de documentation…)  Concept d’entité intellectuelle (par exemple, une œuvre littéraire, un jeu de données scientifiques, un dossier d’affaire, un record) 10
  11. 11. Deux approches possibles  Approche spécifique de l’EGAD: développer un standard RDF spécifique aux Archives, mais avec des passerelles vers les standards des bibliothèques et musées  Approche généraliste du Matterhorn RDF Data Model: se fonder sur des standards RDF existants et répandus au niveau international, qui permettent de modéliser le Records in Contexts  Contrairement à l’approche de l’EGAD, le Matterhorn RDF Data Model se fonde sur des ontologies déjà existantes. Il suit ainsi les W3C Best Practices: «It is best practice to use or extend an existing vocabulary before creating a new vocabulary.» 11
  12. 12. Matterhorn RDF Data Model 12
  13. 13. Matterhorn RDF: modèle conceptuel 13
  14. 14. Matterhorn RDF: contenu d’information 14
  15. 15. Matterhorn RDF: exemple d’un contrat 15
  16. 16. Matterhorn RDF Data Model 16 Une grande partie des attributs (properties) utilisés dans le Matterhorn RDF Data Model est tirée des standards RDA (Resource Description and Access) et Premis Name Prefix URI Dublin Core DC http://purl.org/dc/elements/1.1/ DC Terms DCT http://purl.org/dc/terms/ Provenance-Family PROV prov http://www.w3.org/ns/prov# Premis premis http://id.loc.gov/vocabulary/ preservation RDA Unconstrained properties rdau http://rdaregistry.info/Elements/u/ RDA Class hierarchies rdac http://rdaregistry.info/Elements/c/
  17. 17. Comment concrétiser ce modèle?  Formalisation par l’intermédiaire de “SHACL Shapes” au lieu d’une ontologie spécifique  SHACL est un langage pour la validation de triples sh:property [ sh:path dc:title ; rdfs:label "Title"@en ; rdfs:label "Titel"@de ; rdfs:label "Titre"@fr ; rdfs:comment "ISAD 1.2" ; owl:sameAs rico:title ; sh:datatype xsd:string ; sh:minCount 1 ; sh:maxCount 1 ; sh:nodeKind sh:Literal ; ] .
  18. 18. Exemple  shacl.org  SHACL Shapes  Exemple de triples de deux dossiers
  19. 19. Liens vers nos ressources  Ressources générales sur les outils Matterhorn METS et RDF: http://matterhorn.tools/?lang=fr  Wiki avec modèle conceptuel et technique https://wiki.docuteam.ch/doku.php?id=docuteam:matterhornrdf  Repository Git: https://bitbucket.org/docuteam/matterhorn 19
  20. 20. Merci de votre attention Archives de l’Etat du VS Alain Dubois Archiviste cantonal Rue de Lausanne 45 1950 Sion +41 27 606 46 05 alain.dubois@admin.vs.ch Docuteam Sàrl Tobias Wildi Im Langacker 16 5405 Baden-Dättwil +41 56 470 03 37 t.wildi@docuteam.ch

×