Metadonnees -- une typologie

2,038 views

Published on

Présentation générale de ce que sont les métadonnées, de quelques questions qu'elles soulèvent, suivie d'une proposition de typologie des standards de métadonnées.
Manquent les animations
Version 1.1

Published in: Technology
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,038
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
51
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Metadonnees -- une typologie

  1. 1. Métadonnées <ul><li>François-Xavier Boffy </li></ul><ul><li>SID – SCD Lyon 1 </li></ul>
  2. 2. M. Jourdain et les métadonnées DATA META Les métadonnées sont « des données sur des données » ( data about data , cf. Martin). On pourrait dire aussi, « des données sur du donné » (y compris sur les objets sensibles). Quand on utilise des données portant sur un objet, on utilise des méta-données.
  3. 3. M. Jourdain et les métadonnées Villeurbanne 69100 Sous-préfecture 138 000 hab. On fait des métadonnées depuis très longtemps sans s'en rendre forcément compte...
  4. 4. Exemples de métadonnées <ul><li>Votre numéro de sécurité sociale – les machines peuvent gérer votre dossier </li></ul><ul><li>Vos prénoms – on peut vous identifier plus précisément qu'avec un seul (alternative : date voire lieu de naissance) </li></ul><ul><li>Votre taille – on peut savoir quel vêtement (= une autre donnée) pourrait « s'agencer » avec vous; mais elle varie ! </li></ul><ul><li>La cuisson de la viande au restaurant – question de vocabulaire (bleu, à point...) ! </li></ul>
  5. 5. Approche classique <ul><li>Les métadonnées sont des données sur les données, donc on peut classer les métadonnées selon le type des données </li></ul><ul><li>Distinction entre </li></ul><ul><ul><li>Métadonnées descriptives (du contenu) </li></ul></ul><ul><ul><li>Métadonnées administratives (droits) </li></ul></ul><ul><ul><li>Métadonnées de structure (relations) </li></ul></ul><ul><ul><li>Métadonnées sur les métadonnées </li></ul></ul>
  6. 6. Exemple en Dublin Core qualifié et LOM <ul><li>title signale le nom d'usage du contenu </li></ul><ul><li>rights signale des droits sur le document </li></ul><ul><li>hasPart signale une sous-partie du doc </li></ul><ul><li>metametadata/contribute (ou 3.2, en LOM) signale l'origine des métadonnées </li></ul>
  7. 7. Changer de format... <ul><li>title en DC = champ 240 en MARC </li></ul><ul><li>embargoDate en PRISM =? en DC (n'existe pas) </li></ul><ul><li>creator en DC ≈ %A en Endnote </li></ul><ul><li>contributor en Zotero ≠ contributor en DC </li></ul><ul><li>La conversion d'un format de métadonnées en un autre est déjà délicat à cause de la « grammaire » utilisée par chacun. </li></ul>
  8. 8. Transférer des données... <ul><li>Titre = La pie voleuse / La Pie voleuse / The Thieving Magpie / ... </li></ul><ul><li>Date = “02/12/1977” / “2 décembre 77” / “12/02/1977” </li></ul><ul><li>La conversion des métadonnées est rendue difficile aussi à cause des vocabulaires plus ou moins bien contrôlés employés par les utilisateurs / créateurs de métadonnées. </li></ul>
  9. 9. Des questions restent ouvertes, sur la théorie et la pratique : <ul><li>Quel équilibre entre la richesse des métadonnées et leur interprétabilité ? </li></ul><ul><li>Quelles relations entre les différents formats ? </li></ul><ul><li>Qui choisit les noms des champs, qui choisit ce qu'on peut y mettre (usagers, éditeurs, instituts de normalisation) ? </li></ul><ul><li>Une norme de stockage ou de transmission, un codage de caractères (ex : Unicode) sont-il aussi des standards de métadonnées ? </li></ul>
  10. 10. Si on élargissait le traitement ? <ul><li>Non seulement </li></ul><ul><ul><li>DC </li></ul></ul><ul><ul><li>DC Terms </li></ul></ul><ul><ul><li>MODS </li></ul></ul><ul><ul><li>MARC </li></ul></ul><ul><ul><li>EAD </li></ul></ul><ul><ul><li>RDF / XML </li></ul></ul><ul><ul><li>METS </li></ul></ul><ul><ul><li>RIS... </li></ul></ul><ul><li>Mais aussi </li></ul><ul><ul><li>RAMEAU </li></ul></ul><ul><ul><li>Z3950 </li></ul></ul><ul><ul><li>DOCX </li></ul></ul><ul><ul><li>Endnote (.enl) </li></ul></ul><ul><ul><li>XML </li></ul></ul><ul><ul><li>Microformat </li></ul></ul><ul><ul><li>RFC3361 </li></ul></ul><ul><ul><li>RDF... </li></ul></ul>
  11. 11. Mon approche <ul><li>La méta-information est un processus de transmission qu'on peut modéliser de différentes façons </li></ul><ul><li>La dialectique entre les fonctionnements du web et les essais de normalisation / standardisation rompt les limites entre données et métadonnées </li></ul><ul><li>Dans le cas des données, les FRBR ont proposé une modélisation intéressante </li></ul>Attention ! Les diapositives qui suivent sont des propositions de modélisation qui n'engagent que leur auteur.
  12. 12. Rappel FRBR <ul><li>On distingue </li></ul><ul><ul><li>l'oeuvre (exemple : l'histoire des Misérables de Victor Hugo) </li></ul></ul><ul><ul><li>l'expression de l'oeuvre (exemple : le film Les Misérables inspiré de l'oeuvre d'Hugo) </li></ul></ul><ul><ul><li>la manifestation de l'oeuvre (exemple : le film Les Misérables sur DVD édité en 2004) </li></ul></ul><ul><ul><li>l'item (exemple : 1 exemplaire du DVD) </li></ul></ul>
  13. 13. Et les standards de métadonnées ? <ul><li>Pourquoi pas... </li></ul><ul><ul><li>Règles de conception de métadonnées </li></ul></ul><ul><ul><li>Règles d'organisation de métadonnées </li></ul></ul><ul><ul><li>Règles d'expression de métadonnées </li></ul></ul><ul><ul><ul><li>Règles grammaticales </li></ul></ul></ul><ul><ul><ul><li>Règles du vocabulaire </li></ul></ul></ul>
  14. 14. Standard de conception Standard d'organisation Standard d'expression grammaticale Standard d'expression du vocabulaire 4 niveaux de régulation des métadonnées
  15. 15. Langages à balise Formats bibliographiques XML HTML TEI DC MARC LCSH RFC3361 MeSH DC-HAL LOM La place qu'on peut attribuer à certains standards de méta-information
  16. 16. DC Abstract model Langages à balise XML DC Terms DC DC-HAL Europeana RFC3361 LCSH Le DC abstract model contrôle l'emploi des grammaires et des vocabulaires, mais reste sur la conception duXML RDF
  17. 17. Langages à balise XML METS MODS DC Terms MADS LCSH MIX Le METS peut structurer toutes les organisations et les expressions de métadonnées sur la base du XML PREMIS TextMD
  18. 18. Formats bibliographiques MARC UNIMARC MARC21 MARCXML Langages à balise XML Le MARCXML est l'adaptation de MARC21 à la conception des langages à balises de type XML
  19. 19. Microformats hCard Hcal W3CDTF Les Microformats, standards sans organisation (en caricaturant un peu)
  20. 20. Enveloppe de métadonnées XMP PDF Métadonnées embarquées EXIF L'enrichissement des métadonnées des PDF ou image peut se faire avec une enveloppe de métadonnées en XMP
  21. 21. Fils de métadonnées RSS PAM Transmission par lots Z3950 La transmission des métadonnées en séquence peut elle-même être standardisée de manières diverses. RSS 1.0 RDF SRU / SRW CQL
  22. 22. RDF XML RDF / XML Mais au fait, où se placerait RDF dans cette modélisation ? SPARQL
  23. 23. Pourquoi cette typologie ? <ul><li>Mieux montrer les implications des choix de standard de métadonnées </li></ul><ul><li>Mieux évaluer les possibilités de conversion entre les standards à partir des ensembles qu'ils encadrent ou qui leur sont liés </li></ul><ul><li>Mieux distinguer ce qui relève d'un choix conceptuel, d'organisation ou de vocabulaire </li></ul><ul><li>Garder la possibilité d'inventer de nouveaux modes de méta-information, avec des organisations identiques ou diférentes </li></ul>
  24. 24. Merci <ul><li>C'est tout... pour le moment ! </li></ul>Continuer vers Ali Sabieh ©2010 Visocrea

×