Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation
Upcoming SlideShare
Loading in...5
×
 

Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

on

  • 502 views

INRIA 2008 (2) - Métadonnées : mutations et perspectives

INRIA 2008 (2) - Métadonnées : mutations et perspectives
http://www.adbs.fr/metadonnees-mutations-et-perspectives-46545.htm

Statistics

Views

Total Views
502
Views on SlideShare
502
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Voir aussi - Chapitre 7 - Méta-information et économie numérique François Moreau (Cnam, Laboratoire d’économétrie)
  • Voir aussi - Chapitre 7 - Méta-information et économie numérique François Moreau (Cnam, Laboratoire d’économétrie)
  • Monde du Web http://www.isoc-gfsi.org/ietf/tao.html#intro Nouvelles de l'ISO : accords ISO/IEEE et ISO/TC46/IETF ISO et l'IEEE (Institute of Electrical and Electronics Engineers, à l'origine de nombreux standards d'ingénierie de l'information, dont le LOM) ont signé un accord en avril 2008 pour renforcer leur coopération en matière de normalisation internationale. http://www.iso.org/iso/fr/pressrelease.htm?refid=Ref1125 Par ailleurs, pour les mêmes raisons, le comité technique Information et documentation de l'ISO (ISO/TC46) a signé un accord de liaison avec l'IETF (Internet Engineering Task Force). ICANN - Internet Corporation for Assigned Names and Numbers
  • Monde du Web http://www.isoc-gfsi.org/ietf/tao.html#intro TC 46 - billet sur le blog Descripteurs en 2008 : http://dossierdoc.typepad.com/descripteurs/2008/06/la-galre-du-tra.html ICANN - Internet Corporation for Assigned Names and Numbers
  • RDA / description bibliographique, FRAD / autorités : A2 - Outils de modélisation métier MODS / remplacement de MARC B2 - Outil informatique Format éditorial ONIX (ONline Information Exchange). Proposé en 1999 par le groupe EDItEUR pour favoriser le commerce électronique du livre et des séries à l’attention des éditeurs, libraires et autres intermédiaires. Il complète le modèle de la référence bibliographique par des données administratives comme la licence de publication ou par des données d’accès comme des listes contrôlées adaptées aux catalogues d’éditeurs. Format ONIX: www.editeur.org/onix.html, www.bisg.org/onix/onix_faq.html
  • RDA / description bibliographique, FRAD / autorités : A2 - Outils de modélisation métier MODS / remplacement de MARC B2 - Outil informatique Format éditorial ONIX (ONline Information Exchange). Proposé en 1999 par le groupe EDItEUR pour favoriser le commerce électronique du livre et des séries à l’attention des éditeurs, libraires et autres intermédiaires. Il complète le modèle de la référence bibliographique par des données administratives comme la licence de publication ou par des données d’accès comme des listes contrôlées adaptées aux catalogues d’éditeurs. Format ONIX: www.editeur.org/onix.html, www.bisg.org/onix/onix_faq.html
  • METS est une spécification développée au départ sur la base du modèle de l’OAIS (ISO 14721:2003)
  • http://blog.feedbooks.com/fr/?p=82 pour des informations techniques sur .epub

Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation Presentation Transcript

  • Métadonnées et normalisation INRIA Seminaire 2008 par Sylvie Dalbin - ATD sylvieATD@aol.com (2)
  • Fil conducteur de l’intervention1. Contexte de l’intervention2. Normalisation Contexte - Enjeux - Acteurs en présence3. Modèles - Schémas 1. Un modèle conceptuel métier : FRBR 2. Succession cohérente d’outils : FRBR, RDA, MODS et ONIX 3. Notation particulière : CRM 4. Profil d’application : TEF 5. Conteneur et transporteur : METS 6. Livres numériques 7. Schémas de concepts 8. Composants transversaux 9. Familles de schémas : cohérence métier4. Conclusion 1. Sur le plan technique 2. Sur le plan des métiersINRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 1. 1. CONTEXTE DE L’INTERVENTION
  • Préparer l’Atelier Fabriqué avec http://wordleINRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • Autres ? Notez des noms de normes, recommandations ou modèles que vous connaissez ou sur lesquels vous souhaiteriez des informationsINRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 2. 2. NORMALISATION Contexte Enjeux Acteurs en présence
  • 2.1 Contexte • L’information – fait partie intégrante de toute activité humaine [F.Moreau] - La méta-information permet de localiser un bien informationnel et de décider de l’intérêt de le consommer « La méta-information est ainsi indéniablement au cœur du processus de création de valeur à l’heure du numérique ». • Les TIC – sont des technologies qui agissent sur l’information – elles sont structurantes et modèlent les dispositifs INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 2.2 Enjeux • Standardisation - normalisation – Des formats des données numériques Des méta-informations – Des systèmes d’encodage ? • Plusieurs strates complémentaires Codage de base Unicode Technique Technologies du Web Structure Identifiants, schémas de ressources, méta- informations Encodage des contenus Nomenclatures, terminologies INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 2.3 Acteurs en présence (1) • Histoires, fonctionnements et périmètres variables • Coordination : une nécessité • ISO TC46 avec ISO TC37 • L’ISO et l’IEEE (concepteur entre autres du LOM) en 2008 • ISO TC46 (Information et Documentation) et l’IETF en 2008 • Organes-clés pour l’infodoc • ISO TC46 - piloté actuellement par la France (C.Dhérent / Bnf) – Un rôle essentiel, des moyens faibles au regard du travail réalisé et à réaliser – Activité des groupes - les professionnels terrain sont absents ! • NISO - National Information Standards Organization • Library of Congress : http://www.loc.gov/standards/ INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 2.3 Acteurs en présence (2) • ISO et organes locaux • Comités centrés sur l’information et les TIC : JTC1 (TIC, ISO/CEI), TC37 (Terminologie), TC46 (Infodoc) • Internet et le Web • IETF - « groupe informel et auto-organisé » qui développe les spécifications des standards de lInternet : les RFC • ICANN - organes normalisateurs du Web – IANA = bureau central denregistrement des activités IETF • Autres organismes par métiers ou domaines • OASIS - consortium mondial, autour d’XML - DocBook, UDDI,… • IEEE - à l’origine du LOM ; ADL - standards du e-learning • IPTC, IFLA (bibliothèque), SMTPE (cinéma et télévision), … INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3. 3. MODELES - SCHEMAS Quelques exemples
  • 3.1 Un modèle conceptuel métier : FRBR Functional Requirements for Bibliographic Records, IFLA, initié en 1997 Entités du Groupe 2 - FRANAR « identifiants » Entités du Groupe 3 - FRSAR « sujets » INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.2 Succession d’outils : FRBR et …. « Or, pour gérer des données, ces gens-là (les geeks) travaillent de la manière suivante : ils font de la modélisation, puis des spécifications, et enfin ils implémentent. Nous, pauvres bibliothécaires et catalogueurs, le nez dans le guidon trop souvent, nous avons commencé par créer un format dimplémentation (MARC), sappuyant quand même sur une norme (lISBD). Mais mieux vaut tard que jamais, nous avons fini par faire la modélisation et les spécifications de nos données bibliographiques : ce sont les FRBR. » Figoblog, 10/03/05 INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.2 Succession d’outils : … RDA, MODS et ONIX • Schémas et outils techniques en cours de révision ! – Outils métiers • RDA / description bibliographique • FRAD / autorités – Outils informatiques • MODS / remplacement de MARC en XML • Compatible avec le format de livre ONIX (ONline Information eXchange) INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.3 Notation particulière : CRM (1) Conceptual Reference Model (Museum!), ISO 2127:2006 • Au cœur du modèle – Des évènements et des phénomènes temporels – La modélisation de l’activité versus la description d’objets Actions ( Activity ) La Seconde Guerre mondiale, la bataille de Stalingrad, le tremblement de terre de Lisbonne, la naissance de Cléopâtre, la fête donnée pour mon anniversaire le 28 juin 1995, la conférence de Yalta, une tuile est tombée de mon toit, la conférence Inria de 2008, … Début d’existence : naissance, création, formation, etc. Fin d’existence : destruction, dissolution, mort, etc. INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.3 Notation particulière : CRM (2) • Des métadonnées libérées • Des applications à construire sont requis pour et un QuickTime™ visionner cette image. décompresseur « un élément physique fabriqué par l’homme » (E24 - Physical man-made thing) « A par héritage des propriétés de tout objet physique » « une localisation ou une position » (P53 - has former location) « Dans un lieu précis » (E53 - Place) « un Lieu » (E53 - Place ) « est identifié par » (P87 - identified by) « une appellation » (E4 - Appellation) INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.4 Profil d’application : TEF • Thèses électroniques françaises, recommandation Afnor 2006 • Composition de la recommandation – Un modèle pour le genre « thèse » s’appuyant sur les FRBR • travail universitaire validé par des pairs, une œuvre de l’esprit, un document administratif pour la délivrance d’un diplôme national – Un format informatique de structuration et d’encodage XML selon le vocabulaire Schematron. (binding) – Un format informatique d’organisation des données selon le vocabulaire METS INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.5 Conteneur et transporteur : METS • Metadata Encoding and Transmission Standard – Maintenu par la LC – Enveloppe pour transporter des ressources – Une carte de la structure (Structural Map) de l’objet METS – La liste des fichiers (File Section) – Cinq autres sections, facultatives et répétables en fonction des ressources intégrées : l’en-tête, les métadonnées descriptives et administratives, les liens structurels entre les différents éléments de la carte, ainsi que des exécutables. • Autre conteneur : MXF (Material eXchange Format) – Etabli par la SMPTE (Soc. Motion Picture & TV Engineers). – Enveloppe unique : contenus (essences), métadonnées, informations administratives sur la ressource globale INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.6 Livres numériques • Digital Accessible Information System, Z39.86:2005 DAISY Adopté par Braillenet en 2002 ; • Structuration XML des livres audionumérique, DTBook Métadonnées spécifiques : navigation dans la structure du livre + synchronisation sonore • Norme SMIL/XHTML du W3C • acteurs variés (Adobe, Hachette, OCLC, universités…) ePub de l’IDPF • 3 spécifications: structure (OPS), format (OPF), conteneur format harmonisé ? (OCF) • Vocabulaire établi à partir du DTBook (Daisy) et XHTML • Depuis 1992, par OASIS - intégré aux outils bureautiques • Noyau standardisé extensible; modèle et schéma XML DocBook • Un vocabulaire intégrant la structure des documents et les métadonnées (dont 3 éléments du DC) INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.7 Schémas de concepts (1) • Derrière des schémas, des modèles différents – TMF (ISO 16642:2003) - Terminological Markup Framework – SKOS/RDF du W3C, Juin 2008 - thésaurus et classification pour la recherche – NP25964 - projet de refonte des normes du thésaurus, pour l’indexation (et la recherche) • Composants – Concepts et relations entre concepts ; termes reliés avec des concepts et entre eux – Entités - attributs - relation 3 modèles - 3 finalités différentes Atelier - étudier la représentation UML d’un schéma INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.8 Composants transversaux • Représentation de haut niveau – Modélisation qui convient dans de nombreux contextes (A) – Développement de schémas normalisés, réutilisables (B) • Utilisables dans d’autres schémas ou profils • Exemples – Jeu de métadonnées générique : Dublin Core – Eléments de données ou groupe d’éléments de données • Identifiants normalisés • Langues, Pays,… • Microformats : hCard (vCard), hCalendar,… • Certaines balises imposées dans (X)Html : rel: «license » • Schémas de concepts INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 3.9 Familles de schémas : cohérence métier INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 4. 4. EN CONCLUSION Sur le plan technique Sur le plan des métiers Sur le plan de la normalisation
  • 4.1 Sur le plan technique • Des formalismes variés – Ne facilitant pas la prise en main de schémas ou modèles • Qu’est-ce-qu’un schéma de représentation ? – Une entité globale (le profil d’application LOM Fr) – Ou un ensemble de composants (langue, DRM,…) • Correspondance entre schémas – Alignement conceptuel plutôt qu’alignement technique – Utiliser Dublin Core comme un cadre général et non comme une spécification technique INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • 4.1 Sur le plan des métiers • Continuum de la conception à l’exploitation des ressources – Métadonnées à la source : « recyclage infini » des métadonnées produites, et non (re)création – Ne pas rester à la lisière du document INRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie
  • Annexe 1 - Outil : langage graphique UML entités relation Draft Schema np25964 attributsINRIA IST - Session Métadonnées et normalisation par 2008 -Dal 30 Sept Sylvie