2011 06-23 bi-b92_formats-de-donnees_fl-pl-b

1,793 views
1,633 views

Published on

Présentation effectuée par Françoise Leresche (BNF) et Patrick Le-Boeuf (BNF) à la matinée organisée par BiB92 sur l'évolution des formats de données bibliographiques et des catalogues de bibliothèques, le 23 juin 2011 à Antony.

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,793
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
50
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • MARBI (Machine-Readable Bibliographic Information) is an interdivisional committee of the American Library Association (ALA): ALCTS ( Association for Library Collections and Technical Services ); LITA ( Library and Information Technology Association ; and RUSA ( Reference and User Services Association ). Its mission is to: Encourage the creation of needed standards for the representation in machine-readable form of bibliographic information Review and evaluate proposed standards Recommend approval of standards in conformity with ALA policy (especially the ALA Standards Committee) Establish a mechanism for continuing review of standards (including the monitoring of further development) Provide commentary on the content of various implementations of standards to concerned agencies Maintain liaison with concerned units within ALA and relevant outside agencies
  • Leur complexité codes alpha-numériques non signifiants nécessitant un long apprentissage Leur spécificité conversions nécessaires pour les échanges, même entre formats MARC propres au monde des bibliothèques facteur d’ isolement des bibliothèques dans un environnement web face à l’explosion des schémas de métadonnées en XML : Dublin Core, EAD,
  • 2 options possibles « habiller » MARC en XML saisie directe en XML
  • MARC 21 data in an XML structure
  • 2011 06-23 bi-b92_formats-de-donnees_fl-pl-b

    1. 1. Formats de données en bibliothèques 23 juin 2011 – BiB92 Françoise Leresche – Patrick Le Bœuf
    2. 2. Plan <ul><li>Un peu de vocabulaire… </li></ul><ul><li>Structure et finalité des catalogues – le modèle FRBR </li></ul><ul><li>Les bibliothèques dans l’environnement Web : </li></ul><ul><ul><li>La « tour d’ivoire » des formats MARC </li></ul></ul><ul><ul><li>Langages informatiques du Web : XML et schémas de métadonnées en XML, Dublin Core </li></ul></ul><ul><ul><li>Adaptation des formats MARC à ces langages </li></ul></ul><ul><ul><li>Évolution de l’environnement Web : Web sémantique, RDF </li></ul></ul><ul><li>Adaptation des règles de catalogage au nouvel environnement : RDA et son impact sur les SIGB </li></ul>
    3. 3. Un peu de vocabulaire…
    4. 4. L’information bibliographique : les outils modèles de l’information bibliographique principes internationaux de catalogage règles de catalogage formats bibliographiques (MARC) ontologies web sémantique schémas de métadonnées
    5. 5. Qu’est-ce qu’un « modèle » ? <ul><li>Modèle de données Modèle qui décrit de façon abstraite comment sont représentées les données dans une organisation (point de vue d’un métier particulier), dans un système d’information ou une base de données. </li></ul><ul><ul><li>Un modèle donne une représentation conceptuelle du monde (ou d'une partie du monde) en fonction d’un point de vue particulier qui va déterminer un certain nombre de choix </li></ul></ul>
    6. 6. Qu’est-ce qu’un « modèle » ? <ul><li>Les modèles conceptuels sont </li></ul><ul><ul><li>des outils de dialogue et de compréhension entre personnes d’horizons différents (spécialistes d’un domaine // informaticiens) </li></ul></ul><ul><ul><li>des outils de dialogue entre réservoirs de données hétérogènes </li></ul></ul><ul><ul><li>des outils d’aide à la conception de systèmes </li></ul></ul><ul><ul><li>des outils de comparaison , d’ échange et de stockage des données </li></ul></ul><ul><ul><li>des outils d’intégration au web sémantique (ou web de données ) </li></ul></ul>
    7. 7. Qu’est-ce qu’un « format » ? <ul><li>Format (informatique) Agencement structuré des données numériques sur un support lors de leur production, leur affichage, leur stockage sur ce support, leur compression, impression ou diffusion. </li></ul><ul><li>Format bibliographique Définition d’une présentation structurée de l’information bibliographique en vue de son échange sur support informatisé et/ou de son traitement dans un système informatisé. </li></ul>Vocabulaire de la documentation, ADBS, 2004
    8. 8. Qu’est-ce que les « métadonnées » ? <ul><li>Métadonnées Informations structurées qui décrivent , expliquent, localisent ou encore facilitent la découverte , l’ utilisation ou la gestion d’une ressource d’information </li></ul><ul><li>Différentes catégories de métadonnées, en fonction des informations qu’elles contiennent </li></ul><ul><ul><li>Métadonnées descriptives </li></ul></ul><ul><ul><li>Métadonnées de structure </li></ul></ul><ul><ul><li>Métadonnées techniques </li></ul></ul><ul><ul><li>Métadonnées administratives </li></ul></ul>NISO (National Information Standards Organization), Understanding metadata, 2004, ISBN 1-880124-62-9 http :// www.niso.org /publications/ press / UnderstandingMetadata.pdf Cataloguer, c’est produire des métadonnées descriptives !
    9. 9. Structure et finalité des catalogues – le modèle FRBR
    10. 10. Qu’est-ce qu’un catalogue ? <ul><li>Regardons un peu dans le rétroviseur… </li></ul>
    11. 11. <ul><li>Bibliothèque nationale, Catalogue général des imprimés : </li></ul><ul><li>Principe : regrouper les publications des œuvres d’un même auteur </li></ul><ul><li>Auteurs « prolifiques » : regroupement des notices par œuvre </li></ul>
    12. 12. Le catalogue proposait d’abord les différentes éditions du texte original… … puis d’autres versions linguistiques de la même œuvre
    13. 13. Derrière chaque version, les différentes éditions étaient classées par date de publication…
    14. 14. … Puis venaient les mentions d’ exemplaires (plusieurs exemplaires regroupés sous une même description de publication )
    15. 15. Catalogues sur fiches <ul><li>Duplication des fiches, ajout de « vedettes secondaires » : permet d’autres regroupements (par sujet, éditeur, cote etc.) </li></ul><ul><li>Mais fondamentalement il s’agit encore, dans le catalogue auteurs, de regrouper les œuvres : - par versions, - puis par publications, - puis par exemplaires possédés </li></ul>
    16. 16. Catalogues informatisés <ul><li>Permettent virtuellement n’importe quel regroupement, selon n’importe quel critère de recherche… </li></ul><ul><li>Mais dans la structure des notices, l’idéal sous-jacent reste celui du regroupement auteur / œuvre / « édition » / exemplaire (même s’il tend à être de moins en moins perceptible) </li></ul>
    17. 17. Démarche de modélisation : FRBR ( Functional Requirements for Bibliographic Records ) <ul><li>Années 1990 : l’IFLA élabore le modèle FRBR </li></ul><ul><ul><li>publié en 1998 </li></ul></ul><ul><ul><li>modélise l’information contenue </li></ul></ul><ul><ul><ul><li>dans les notices bibliographiques </li></ul></ul></ul><ul><ul><ul><li>et leurs points d’accès </li></ul></ul></ul><ul><ul><li>formalise l’idéal sous-jacent du regroupement auteur / œuvre / version / publication / exemplaire </li></ul></ul>
    18. 18. FRBR ou les pièges du langage <ul><li>J’ai perdu mon livre </li></ul><ul><li>Je vais acheter ce livre </li></ul><ul><li>Son livre est disponible en ligne et sur papier (broché et relié) </li></ul><ul><li>Son livre est lu jusqu’en Chine </li></ul>un objet matériel un produit défini par des caractéristiques communes en termes de contenu, d’aspect physique et de circonstances de production un contenu textuel précisément identifié par delà la diversité de ses supports une pure abstraction qui n’existe qu’à travers un lien intellectuel entre divers contenus textuels (original et traductions) Item Manifestation Expression Œuvre
    19. 19. FRBR = des entités… Item Manifestation Expression Œuvre Une création, par delà ses différentes versions Exemple : Les Travailleurs de la mer Version sous laquelle une Œuvre est disponible Exemple : traduction anglaise des Travailleurs de la mer Publication (pour simplifier) Exemple : Toilers of the Sea, G. Routledge & sons, 1886 Exemplaire matériel Exemple : ouvrage coté 16-Y2-7542
    20. 20. FRBR = … et des relations Item Manifestation Expression Œuvre Concept Objet Événement Lieu est au sujet de a créé a réalisé a produit possède Personne Collectivité Famille est réalisée par est matérialisée dans est représentée par
    21. 21. Au total, FRBR… <ul><li>… regarde à la fois vers le passé et vers l’avenir : </li></ul><ul><ul><li>cristallise l’idéal du regroupement des œuvres d’un auteur, déclinées par versions, par publications, par exemplaires </li></ul></ul><ul><ul><li>mais ouvre aussi les données bibliographiques sur un nouvel environnement </li></ul></ul><ul><ul><ul><li>analyse la notice bibliographique comme une superposition de niveaux dont chacun peut être récupérable dans un contexte donné </li></ul></ul></ul><ul><ul><ul><li>énumère pour chacun de ces niveaux les éléments de données qui peuvent faire l’objet d’une recherche </li></ul></ul></ul><ul><ul><ul><li>traite l’information bibliographique comme un réseau d’éléments de données liés entre eux </li></ul></ul></ul>
    22. 22. Les bibliothèques dans l’environnement Web La « tour d’ivoire » des formats MARC
    23. 23. Formats MARC <ul><li>MARC = Machine Readable Cataloguing Catalogage lisible par machine </li></ul><ul><li>Premier format MARC défini par la Bibliothèque du Congrès en 1965 </li></ul><ul><li>Formats définis par les bibliothèques pour la fourniture de notices aux bibliothèques </li></ul><ul><li>Une norme de référence : ISO 2709 </li></ul><ul><li>Aujourd’hui, 2 formats d’échange au niveau international </li></ul><ul><ul><li>UNIMARC = format national d’échange en France </li></ul></ul><ul><ul><li>MARC 21 </li></ul></ul>
    24. 24. La norme ISO 2709 <ul><li>ISO 2709 – Format pour l’échange d’information </li></ul><ul><ul><li>Norme à la base de tous les formats MARC </li></ul></ul><ul><ul><li>Norme adaptée à l’information bibliographique car elle permet de gérer des zones (et sous-zones) </li></ul></ul><ul><ul><ul><li>de longueur variable </li></ul></ul></ul><ul><ul><ul><li>facultatives </li></ul></ul></ul><ul><ul><ul><li>répétables ou non </li></ul></ul></ul><ul><ul><li>Norme qui définit la structure d’une notice </li></ul></ul><ul><ul><ul><li>Label (sur 24 caractères) </li></ul></ul></ul><ul><ul><ul><li>Répertoire </li></ul></ul></ul><ul><ul><ul><li>Structure générique d’une zone </li></ul></ul></ul><ul><ul><ul><ul><li>Étiquette (sur 3 caractères) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Indicateurs de traitement </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Codes de sous-zones </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Caractère de fin de zone </li></ul></ul></ul></ul>
    25. 25. Derrière une notice MARC… 000 cam 22 3n 450 001 FRBNF322633020000009 003 http://catalogue.bnf.fr/ark:/12148/cb32263302g 039 $o CRI $a SU059013100001P 100 $a 19970701d1886 m y0frey50 ba 101 1 $a eng 102 $a GB 105 $a ||||z 00||| 106 $a r 200 1 $a Toilers of the sea $b Texte imprimé $f by Victor Hugo $g authorized English translation, by W. Moy Thomas 210 $a London $c G. Routledge and sons $d 1886 215 $a 1 vol. (XII-370 p.) $c pl. $d in-16 454 1 $t %Les ‰travailleurs de la mer 700 1 $3 11907966 $a Hugo $b Victor $f 1802-1885 $4 070 702 1 $3 11191871 $a Thomas $b William Moy $4 730 801 0 $a FR $b FR-751131015 $c 19970701 $g AFNOR $h FRBNF322633020000009 $2 intermrc
    26. 26. … il y a la norme ISO 2709 00787cam 22002173n 450 001 002100000 003 004700021 039 002500068 100 004100093 101 0008 00134 102 000700142 105 001800149 106 000600167 200 010500173 210 004000278 215 003600318 454 003500354 700 004300389 702 003900432 801 007000471 930 002800541 _ FRBNF322633020000009 _ http ://catalogue.bnf.fr/ark:/12148/cb32263 302g _ $o CRI $a SU059013100001P _ $a 19970701d1886 m y0frey5 0 ba _ 1 $a eng _ $a GB _ $a ||||z 00||| _ $a r _ 1 $a Toilers of the sea $b Texte imprimé $f by Victor Hugo $g authorized English translation, by W. Moy Thomas _ $a London $c G. Routledge and sons $d 1886 _ $a 1 vol. (XII-370 p.) $c pl. $d in-16 _ 1 $t %Les ‰travailleurs de la mer _ 1 $3 11907966 $a Hugo $b Victor $f 1802-1885 $4 070 _ 1 $3 11191871 $a Thomas $b William Moy $4 730 _ 0 $a FR $b FR-751131015 $c 19970701 $g AFNOR $h FRBNF322633020000009 $2 intermrc _ $5 FR-751131010: 16-Y2-7542  Label Répertoire Zones de données
    27. 27. Les deux formats d’échange <ul><li>MARC 21 </li></ul><ul><ul><li>descendant du premier format MARC (1965) </li></ul></ul><ul><ul><li>créé en 1999 par la fusion de quatre formats : USMARC, AUSMARC, CANMARC et UKMARC </li></ul></ul><ul><ul><li>maintenance par </li></ul></ul><ul><ul><ul><li>la Bibliothèque du Congrès </li></ul></ul></ul><ul><ul><ul><li>MARBI </li></ul></ul></ul><ul><ul><li>utilisé dans le monde anglo-saxon … et même au-delà </li></ul></ul><ul><ul><li>en liaison avec les AACR (aujourd’hui avec RDA) </li></ul></ul><ul><li>UNIMARC </li></ul><ul><ul><li>créé par l’IFLA en 1977 </li></ul></ul><ul><ul><li>dans le cadre du CBU (Contrôle bibliographique universel) </li></ul></ul><ul><ul><li>comme format pivot des échanges d’information bibliographique </li></ul></ul><ul><ul><li>adopté ensuite comme format de saisie </li></ul></ul><ul><ul><li>maintenance par l’IFLA </li></ul></ul><ul><ul><li>utilisé par plusieurs pays européens </li></ul></ul><ul><ul><li>référence directe aux ISBD </li></ul></ul>
    28. 28. Les formats MARC - Avantages <ul><li>Leur grande précision </li></ul><ul><li>Leur concision </li></ul><ul><li>Leur capacité à refléter les règles de catalogage </li></ul><ul><li>Leur adaptation parfaite à l’information bibliographique </li></ul>
    29. 29. Les formats MARC - Critiques <ul><li>Leur âge (ils ont plus de 40 ans) </li></ul><ul><li>Leur limitation </li></ul><ul><ul><li>seulement 2 niveaux de granularité (zone/sous-zone) </li></ul></ul><ul><ul><li>pas plus de 36 sous-zones (26 + 10) pour chaque zone </li></ul></ul><ul><ul><li>hiérarchie limitée entre notices </li></ul></ul><ul><ul><li>manque de souplesse pour les liens </li></ul></ul><ul><li>Leur complexité </li></ul><ul><li>Leur spécificité </li></ul><ul><ul><li>propres au monde des bibliothèques </li></ul></ul><ul><li>facteur d’ isolement des bibliothèques </li></ul><ul><ul><li>dans un environnement web </li></ul></ul><ul><ul><li>face à l’explosion des schémas de métadonnées en XML (Dublin Core, EAD, etc.) </li></ul></ul>
    30. 30. Les bibliothèques dans l’environnement Web Langages informatiques du Web : XML et schémas de métadonnées en XML, Dublin Core
    31. 31. XML en quelques mots <ul><li>Langage qui structure l’information… </li></ul><ul><li>… sans la lier à une mise en forme unique et définitive </li></ul><ul><li>Ce n’est pas « un » format, mais le moule d’une multiplicité de formats </li></ul><ul><li>Depuis sa création en 1998 (recommandation du World Wide Web Consortium – W3C), très nombreux usages </li></ul><ul><li>Joue un rôle majeur dans l’ échange d’informations </li></ul>
    32. 32. Sigle et historique <ul><li>XML = eXtensible Markup Language (Langage de balisage extensible) </li></ul><ul><li>La famille des langages de balisage : </li></ul><ul><ul><li>SGML = Standard Generalized Markup Language (1986) – très complexe, inadapté au Web </li></ul></ul><ul><ul><li>HTML = HyperText Markup Language (1991) – version très simplifiée de SGML conçue pour le Web </li></ul></ul><ul><ul><li>XML (1998) – plus simple que SGML, plus riche que HTML </li></ul></ul><ul><li>… Mais qu’entend-on au juste par « langage de balisage » ? </li></ul>
    33. 33. On prend un texte… <ul><li>Par exemple, une recette de cuisine : </li></ul>La mayonnaise se fait avec de l’huile et du jaune d’œuf.
    34. 34. Baliser un texte, cela revient à passer du stabilo sur ses différents segments… La mayonnaise se fait avec de l’huile et du jaune d’œuf. recette produit ingrédient <recette> La <produit> mayonnaise </produit> se fait avec de l’ <ingredient> huile </ingredient> et du <ingredient> jaune d’œuf </ingredient> . </recette> < recette > </ recette > < produit > </ produit > < ingredient > </ ingredient > < ingredient > </ ingredient >
    35. 35. Un peu de jargon… < ingredient type=&quot; liquide &quot; > huile </ ingredient > élément nom de balise nom d'attribut valeur de l'attribut valeur de l'élément attribut balise (ouvrante) balise (fermante)
    36. 36. Qui décide du nom des balises ? <ul><li>XML autorise tout un chacun à créer ses propres balises… </li></ul><ul><li>… mais pour travailler ensemble et partager des données, ça peut être gênant… </li></ul><ul><li> Il existe 2 moyens de créer des modèles de documents : </li></ul><ul><ul><li>DTD ( Document Type Definition ) </li></ul></ul><ul><ul><li>XML Schema </li></ul></ul>
    37. 37. Pour résumer <ul><li>XML définit une arborescence d’éléments </li></ul><ul><li>Chaque élément est encadré par des balises et peut recevoir des attributs </li></ul><ul><li>Un élément peut être vide </li></ul><ul><li>Il existe différents modèles de documents XML, définis par des DTD ou des schémas XML </li></ul><ul><li>La mise en forme d’un document XML est totalement dissociée de son contenu </li></ul>
    38. 38. Exemples de formats XML. 1, ONIX For Books <ul><li>ONIX = ONline Information eXchange </li></ul><ul><li>Initialement créé par The Association of American Publishers, et aujourd’hui promu par le groupe EDItEUR </li></ul><ul><li>1re version d’ ONIX for Books publiée en 2000 </li></ul><ul><li>But : offrir aux clients des éditeurs une information enrichie visant à rendre les produits plus attractifs : couverture, biographie de l’auteur, critiques, table des matières… </li></ul><ul><li>Peut servir à enrichir le contenu d’un catalogue de bibliothèque, à créer une pré-notice bibliographique... </li></ul>groupement international qui coordonne le développement de l’infrastructure normative pour le commerce électronique des livres et publications en série
    39. 39. ONIX for books : exemple <TitleDetail> <TitleType> 01 </TitleType> <TitleElement><TitleElementLevel> 01 </TitleElementLevel> <TitleText> Toilers of the sea </TitleText></TitleElement> </TitleDetail> <Contributor> <SequenceNumber> 1 </SequenceNumber> <ContributorRole> A01 </ContributorRole> <NamesBeforeKey> Victor </NamesBeforeKey> <KeyNames> Hugo </KeyNames> <BiographicalNote> Victor Hugo is one of the most famous exponent of the French literature. His work touches upon most of the political and social issues and artistic trends of his time. </BiographicalNote> </Contributor> <Contributor> <SequenceNumber> 2 </SequenceNumber> <ContributorRole> B06 </ContributorRole> <NamesBeforeKey> William Moy </NamesBeforeKey> <KeyNames> Thomas </KeyNames> </Contributor> <ContributorStatement> by Victor Hugo ; authorized English translation, by W. Moy Thomas </ContributorStatement>
    40. 40. Exemple d’utilisation de données ONIX par la Bibliothèque du Congrès
    41. 41. Exemples de formats XML. 2, EAD <ul><li>EAD = Encoded Archival Description </li></ul><ul><li>Maintenance par la Bibliothèque du Congrès et la Société des archivistes américains </li></ul><ul><li>Publiée en 1998 (version actuelle : 2002) </li></ul><ul><li>Concerne les fonds d’archives </li></ul><ul><ul><li>de plus en plus aussi : les manuscrits conservés en bibliothèque </li></ul></ul>
    42. 42. Exemple d’utilisation d’EAD <ul><li>Calames (Catalogue en ligne des archives et des manuscrits de l’enseignement supérieur) </li></ul>
    43. 43. Exemples de formats XML. 3, Dublin Core <ul><li>(Pas forcément exprimé en XML, mais de fait l’est souvent) </li></ul><ul><li>Schéma de métadonnées généraliste </li></ul><ul><ul><li>définit un noyau minimal de métadonnées (15 éléments) </li></ul></ul><ul><li>Créé en 1995 à Dublin, Ohio par OCLC et NCSA (National Center for Supercomputing Applications) </li></ul><ul><li>Maintenance assurée par la Dublin Core Metadata Initiative (DCMI) http:// dublincore.org / </li></ul><ul><li>Devenu norme ISO 15836 en 2003 </li></ul>
    44. 44. Exemples de formats XML. 3, Dublin Core <ul><li>Objectif = améliorer la recherche de ressources sur le Web </li></ul><ul><ul><li>Définir un ensemble de métadonnées communes à diverses communautés </li></ul></ul><ul><ul><li>suffisamment simples pour que des non-spécialistes puissent les créer à n’importe quel point du cycle de vie des ressources </li></ul></ul><ul><ul><li>mais suffisamment structurées pour rendre les moteurs de recherche plus performants </li></ul></ul>
    45. 45. Dublin Core simple : exemple <dc:title> Toilers of the sea </dc:title> <dc:title> Les travailleurs de la mer </dc:title> <dc:creator> Hugo, Victor (1802-1885) </dc:creator> <dc:contributor> Thomas, William Moy </dc:contributor> <dc:language> eng </dc:language> <dc:publisher> G. Routledge and sons </dc:publisher> <dc:date> 1886 </dc:date> <dc:type> Text </dc:type> <dc:format> 1 vol. (XII-370 p.) : pl. ; in-16 </dc:format>
    46. 46. Les bibliothèques dans l’environnement Web Adaptation des formats MARC à ces langages
    47. 47. De Marc à XML <ul><li>Besoin d’ interopérabilité pour pouvoir échanger avec d’autres communautés qui produisent de l’information bibliographique sur le web </li></ul><ul><li>Nouveaux protocoles d’échange , fondés sur XML et les technologies du web </li></ul><ul><li>Puissance du langage XML , qui permet d’exploiter les données dans diverses applications (conversions, indexation, affichage, etc.) </li></ul><ul><li>Besoin d’encoder l’information bibliographique en XML </li></ul>
    48. 48. Option 1 : « habiller » MARC en XML <ul><li>MARCXML </li></ul><ul><li>http:// www.loc.gov/standards/marcxml/ </li></ul><ul><ul><li>schéma XML pour le format MARC21 </li></ul></ul><ul><ul><li>créé en 2000 </li></ul></ul><ul><ul><li>développé et maintenu par la Bibliothèque du Congrès </li></ul></ul><ul><ul><li>structure très simple </li></ul></ul><ul><ul><li>conversion </li></ul></ul><ul><ul><ul><li>sans aucune perte </li></ul></ul></ul><ul><ul><ul><li>réversible </li></ul></ul></ul><ul><li>MarcXchange </li></ul><ul><li>http://www.loc.gov/standards/iso25577/ </li></ul><ul><ul><li>norme ISO 25777 : 2008 </li></ul></ul><ul><ul><li>pour l’échange en XML de l’information bibliographique </li></ul></ul><ul><ul><ul><li>alternative à la norme ISO 2709 </li></ul></ul></ul><ul><ul><li>étend à tous les formats MARC le principe de base de MARCXML </li></ul></ul><ul><ul><li>introduit 2 précisions </li></ul></ul><ul><ul><ul><li>le format MARC </li></ul></ul></ul><ul><ul><ul><li>le type de notice </li></ul></ul></ul>
    49. 49. MARCXML : structure <ul><li>Exprimer en XML une ou plusieurs notices MARC </li></ul>collection record <leader> <controlfield tag=&quot;  &quot; > <datafield tag=&quot;  &quot; ind1=&quot;  &quot; ind2=&quot;  &quot; > <subfield code=&quot;  &quot; > <controlfield tag=&quot;  &quot; > etc. <subfield code=&quot;  &quot; > etc. <datafield tag=&quot;  &quot; ind1=&quot;  &quot; ind2=&quot;  &quot; > etc. <subfield code=&quot;  &quot; > <subfield code=&quot;  &quot; > etc. Données codées traitées comme des chaînes de caractères
    50. 50. MarcXchange : exemple <ul><li>Conversion en XML d’une zone UNIMARC </li></ul><ul><li>200 1# $a Toilers of the sea $b Texte imprimé $f by Victor Hugo $g authorized English translation, by W. Moy Thomas </li></ul><ul><li><datafield tag=&quot;200&quot; ind1=&quot;1&quot; ind2=&quot;#&quot; > </li></ul><ul><ul><li><subfield code=&quot;a&quot; > Toilers of the sea </subfield> </li></ul></ul><ul><ul><li><subfield code=&quot;b&quot; > Texte imprimé </subfield> </li></ul></ul><ul><ul><li><subfield code=&quot;f&quot; > by Victor Hugo </subfield> </li></ul></ul><ul><ul><li><subfield code=&quot;g&quot; > authorized English translation, by W. Moy Thomas </subfield> </li></ul></ul><ul><li></datafield> </li></ul>
    51. 51. Option 2 : saisie directe en XML <ul><li>MODS = Metadata Object Description Schema http://www.loc.gov/standards/mods/ </li></ul><ul><ul><li>schéma XML permettant de créer directement en XML des métadonnées descriptives </li></ul></ul><ul><ul><li>fondé sur MARC 21 simplifié </li></ul></ul><ul><ul><li>élaboré en 2002-2003 par la Bibliothèque du Congrès </li></ul></ul><ul><ul><li>version 3.4 (2010) </li></ul></ul><ul><li>MADS = Metadata Authority Description Schema http:// www.loc.gov /standards/ mads / </li></ul><ul><ul><li>pendant de MODS pour les notices d’autorité </li></ul></ul><ul><ul><li>élaboré en 2005 par la Bibliothèque du Congrès </li></ul></ul><ul><ul><li>version 2.0 (2011) à paraître </li></ul></ul>
    52. 52. MODS <ul><li>Plus intelligible par les utilisateurs que MARCXML </li></ul><ul><ul><li>balises explicites (termes anglais) </li></ul></ul><ul><li>Permet la description de toutes les ressources </li></ul><ul><ul><li>ressources numériques complexes (sites web, etc.)  gestion de la hiérarchie </li></ul></ul><ul><li>Description modulable </li></ul><ul><ul><li>20 éléments de haut niveau, avec la possibilité d’utiliser des sous-éléments et des attributs </li></ul></ul><ul><ul><li>ensemble d’éléments plus riche et mieux adapté à la description bibliographique que Dublin Core, mais plus simple que MARC 21 </li></ul></ul><ul><ul><li>analyse des éléments de données inspirée de MARC 21, mais avec une organisation originale  conversion avec modification de structure </li></ul></ul>
    53. 53. MODS : exemple d’encodage <ul><li><titleInfo> </li></ul><ul><ul><li><title type=&quot;translated&quot; xml:lang=&quot;eng&quot; > Toilers of the sea </title> </li></ul></ul><ul><li></titleInfo> </li></ul><ul><li><titleInfo> </li></ul><ul><ul><li><nonSort xml:lang=&quot;fre&quot; > Les </nonSort> </li></ul></ul><ul><ul><li><title xml:lang=&quot;fre&quot; > travailleurs de la mer </title> </li></ul></ul><ul><li></titleInfo> </li></ul><ul><li><typeOfResource> text </typeOfResource> </li></ul><ul><li><name> </li></ul><ul><ul><li><namePart type=&quot;family&quot; > Hugo </namePart> </li></ul></ul><ul><ul><li><namePart type=&quot;given&quot; > Victor </namePart> </li></ul></ul><ul><ul><li><namePart type=&quot;date&quot; > 1802-1885 </namePart> </li></ul></ul><ul><ul><li><role><roleTerm type=&quot;code&quot; > aut </roleTerm></role> </li></ul></ul><ul><li></name> </li></ul>
    54. 54. L’information bibliographique en XML ONIX UNIMARC MARC 21 MARCXML MarcXchange MODS MADS création en XML XML conversion en XML non XML édition bibliothèques QUI ? COMMENT ?
    55. 55. Les bibliothèques dans l’environnement Web Évolution de l’environnement Web : Web sémantique, RDF
    56. 56. Le Web sémantique, qu’est-ce que c’est ? <ul><li>Web sémantique </li></ul><ul><ul><li>un ensemble de technologies et de standards développés par le W3C pour construire le Web de données </li></ul></ul><ul><li>Web de données </li></ul><ul><ul><li>une extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes, et de les rendre exploitables par des machines </li></ul></ul>
    57. 57. Pour être visible sur le Web, la bibliothèque doit… <ul><li>Mettre à disposition des données… </li></ul><ul><li>Dans l’écosystème du Web : </li></ul><ul><ul><li>Indexables par les moteurs de recherche </li></ul></ul><ul><ul><li>Reliées avec d’autres données existantes </li></ul></ul><ul><ul><li>Sur le passage des utilisateurs </li></ul></ul>
    58. 58. Que va nous apporter le Web de données ? <ul><li>Données reliées avec d’autres </li></ul><ul><li>Architecture du Web </li></ul><ul><li>Plus de visibilité </li></ul><ul><li>Autres communautés </li></ul><ul><li>Interopérabilité </li></ul><ul><li>Souplesse pour la réutilisation des données </li></ul>
    59. 59. Quelques principes de base 700 $3 11907966 $a Hugo $b Victor $f 1802-1885 $4 070 200 1   $a Toilers of the sea $b Texte imprimé 1. Structurer l’information 700 11907966 11907966 $a Hugo $b Victor $f 1802-1885 $4 070 200 ‘‘ Toilers of the sea’’
    60. 60. Quelques principes de base 700 11907966 11907966 $a Hugo $b Victor $f 1802-1885 $4070 200 ‘‘ Toilers of the sea’’ http://catalogue.bnf.fr/ark:/12148/cb32263302g http://catalogue.bnf.fr/ark:/12148/cb11907966z 2. Nommer les ressources avec des identifiants Web (URI)
    61. 61. Quelques principes de base Hugo ‘‘ Toilers of the sea’’ http://catalogue.bnf.fr/ark:/ 12148/cb32263302g http://catalogue.bnf.fr/ark:/12148/cb11907966z Victor 200 $a 200 $b nom prénom 3. Définir les relations entre les ressources… en utilisant des vocabulaires normalisés 700 $4070 200 auteur titre DC:creator DC:title FOAF:familyName FOAF:givenName
    62. 62. Quelques principes de base Hugo ‘‘ Toilers of the sea’’ http://catalogue.bnf.fr/ark:/12148/cb32263302g http://catalogue.bnf.fr/ark:/12148/cb11907966z DC:creator DC:title Victor FOAF:familyName FOAF:givenName http://xmlns.com/foaf/0.1/givenName http://xmlns.com/foaf/0.1/familyName http://purl.org/dc/terms/creator http://purl.org/dc/terms/title 4. Nommer les relations avec des URI RDF Resource description Framework
    63. 63. Quelques principes de base 5. Exprimer le tout avec une syntaxe normalisée @prefix dc: < http://purl.org/dc/terms/ > @prefix foaf: < http://xmlns.com/foaf/0.1/ > http://catalogue.bnf.fr/ark:/12148/cb32263302g dc:creator http://catalogue.bnf.fr/ark:/12148/cb11907966z . http://catalogue.bnf.fr/ark:/12148/cb11907966z foaf:familyName ‘‘ Hugo ’’ ; foaf:givenName ‘‘ Victor ’’ . http://catalogue.bnf.fr/ark:/12148/cb32263302g dc:title ‘‘Toilers of the sea’’.
    64. 64. Adaptation des règles de catalogage au nouvel environnement RDA et son impact sur les SIGB
    65. 65. Qu’est-ce que RDA ? <ul><li>La réponse… en 2010 </li></ul>« RDA - the new, unified standard for resource description and access, designed for the digital world and an expanding universe of metadata users »
    66. 66. Un nouveau code de catalogage <ul><li>Élaboré par la communauté des bibliothèques anglo-américaines </li></ul><ul><ul><li>JSC for development of RDA Australie, Canada, É tats-Unis, Grande-Bretagne </li></ul></ul><ul><ul><li>Travaux menés de 2003 à 2010 </li></ul></ul><ul><li>En remplacement des AACR (Anglo-American Cataloguing Rules) </li></ul><ul><li>Pour adapter les catalogues à leur environnement actuel (univers du web) </li></ul><ul><li>Publication : juin 2010 </li></ul><ul><li>Sous la forme d’un site web payant : RDA Toolkit </li></ul>
    67. 67. Un code conçu pour le numérique <ul><li>La recherche d’information aujourd’hui s’effectue sur le web </li></ul><ul><li>Sortir les catalogues de bibliothèques de leur isolement pour les mettre sur le passage des utilisateurs  sur le web </li></ul><ul><li>Ceci impose une nouvelle structure de l’information bibliographique </li></ul><ul><ul><li>Sortir du modèle du fichier (succession linéaire de notices autonomes et juxtaposées) </li></ul></ul><ul><ul><li>Aller vers le modèle du web (réseau de liens entre des documents (web 1.0) ou entre des données (web 3.0) </li></ul></ul>
    68. 68. Nouvelle structure des catalogues <ul><li>Objectif de RDA : aller vers une structure de base de données relationnelle ou orientée-objet… </li></ul><ul><li>… en s’appuyant sur les outils disponibles : les modèles conceptuels  FRBR </li></ul><ul><li>Scénario 1 d’implémentation de RDA </li></ul>
    69. 69. Nouvelle structure des catalogues (scénario 1 de RDA) Œuvre Œuvre Personne Expression Personne Expression Personne Collectivité Personne Collectivité Manifestation Manifestation Collectivité Item Item Collectivité Personne Concept
    70. 70. Nouvelle approche du catalogage <ul><li>Organiser l’information bibliographique à partir de sa modélisation conceptuelle (entités/relations) </li></ul><ul><ul><li>Modèle FRBR pour les données bibliographiques </li></ul></ul><ul><ul><li>Modèle FRAD pour les données d’autorité </li></ul></ul><ul><li>Mettre le modèle au cœur des règles de catalogage </li></ul><ul><ul><li>Rendre compte des entités FRBR /FRAD </li></ul></ul><ul><ul><ul><li>de leurs caractéristiques : leurs attributs </li></ul></ul></ul><ul><ul><ul><li>des relations qu’elles peuvent avoir entre elles </li></ul></ul></ul><ul><ul><li>Associer chaque élément de données </li></ul></ul><ul><ul><ul><li>aux entités FRBR / FRAD </li></ul></ul></ul><ul><ul><ul><li>aux tâches des utilisateurs du catalogue </li></ul></ul></ul>
    71. 71. Cataloguer selon le modèle FRBR <ul><li>Norme de contenu </li></ul><ul><ul><li>Analyse de l’information dissociée de sa présentation </li></ul></ul><ul><ul><li>Indépendance par rapport aux formats d’encodage </li></ul></ul><ul><li>Définition des éléments de données </li></ul><ul><ul><li>Correspondance étroite entre les éléments de RDA et les attributs/relations des modèles FRBR/FRAD </li></ul></ul><ul><li>Définition d’un ensemble d’éléments fondamentaux (« core elements ») </li></ul><ul><ul><li>obligatoires si applicables </li></ul></ul><ul><ul><li>définis à partir de leur importance pour répondre aux principales tâches des utilisateurs </li></ul></ul>
    72. 72. Cataloguer selon le modèle FRBR Accès normalisé : Hugo, Victor (1802-1885) Date et lieu de naissance : 1802-02-26, Besançon Date et lieu de mort : 1885-05-22, Paris Activité : Écrivain. Artiste graphiste, auteur de lavis Membre de l'Académie française (élu en 1841) Identifiant : xxxxx Titre privilégié : Les travailleurs de la mer Variante de titre : L’abîme Variante de titre : Toilers of the sea Créateur : Hugo, Victor (1802-1885) Fonction : Auteur Date de l’œuvre : 1866 Forme de l’œuvre : Roman Lieu d’origine : France Histoire de l’œuvre : Écrit entre 1861 et 1865 ; titre primitif &quot;L'abîme&quot; Identifiant : xxxxx Titre privilégié : Hugo, Victor (1802-1885). Les travailleurs de la mer . Anglais. Thomas Contributeur : Thomas, William Moy Fonction : Traducteur Type de contenu : Texte Langue de l’expression : Anglais Date de l’expression : 1886 Présence d’illustration : illustrations Identifiant : xxxxx Titre propre : Toilers of the sea Mentions de responsabilité : by Victor Hugo ; authorized English translation, by W. Moy Thomas Lieu de publication : London Nom de l’éditeur : G. Routledge and sons Date de publication : 1886 Mode de publication : Unité isolée Type de médiation : Immédiat Type de support : Volume Importance matérielle : XII-370 pages Format bibliographique : in-16 Identifiant : xxxxx Accès normalisé Œuvre : Hugo, Victor (1802-1885). Les travailleurs de la mer Accès normalisé Expression : Hugo, Victor (1802- 1885). Les travailleurs de la mer. Anglais. Thomas Accès normalisé Créateur de l’Œuvre : Hugo, Victor 1802-1885) . Auteur Accès normalisé Contributeur de l’Expression : Thomas, William Moy . Traducteur Localisation : BnF - Tolbiac - Littérature et art - Rez-de-jardin - magasin Cote : 16-Y2-7542 EXPRESSION MANIFESTATION ITEM ŒUVRE Accès normalisé : Thomas, William Moy Identifiant : xxxxx
    73. 73. Cataloguer dans un monde numérique <ul><li>Ouvrir la voie à la récupération automatique des données descriptives </li></ul><ul><ul><li>Transcription des informations descriptives telles qu’elles figurent sur les ressources </li></ul></ul><ul><ul><li>Définition de référentiels communs avec ONIX </li></ul></ul><ul><li>Prendre acte de l’informatisation des catalogues </li></ul><ul><ul><li>Fin des contraintes liées à la présentation des fiches </li></ul></ul><ul><ul><ul><li>changement de vocabulaire </li></ul></ul></ul><ul><ul><ul><li>fin de l’emploi des abréviations </li></ul></ul></ul><ul><ul><ul><li>abandon de la règle de trois </li></ul></ul></ul><ul><ul><li>Possibilité de multiplier les points d’accès </li></ul></ul>
    74. 74. Aller vers le web sémantique <ul><li>Répartir l’information bibliographique selon les entités FRBR </li></ul><ul><ul><li>Créer un réseau de données interconnectées </li></ul></ul><ul><ul><li>Refléter les différents niveaux utiles à différents utilisateurs </li></ul></ul><ul><li>ouvre la voie à la mutualisation des données </li></ul><ul><li>Enregistrement dans l’Open Metadata Registry des éléments et référentiels de RDA, avec attribution d’identifiants pérennes (URI) </li></ul><ul><li>expression en RDF des données créées avec RDA </li></ul>
    75. 75. Pour résumer <ul><li>Des objectifs louables … et auxquels on ne peut que souscrire </li></ul><ul><ul><li>Mettre les catalogues de bibliothèque sur le web </li></ul></ul><ul><ul><li>Participer pleinement à la circulation de l’information </li></ul></ul><ul><li>MAIS </li></ul><ul><li>Des obstacles demeurent </li></ul><ul><ul><li>Trop grande continuité avec les AACR </li></ul></ul><ul><ul><li>Une modélisation inexacte par souci de simplification </li></ul></ul><ul><ul><li>Trop grande souplesse d’implémentation  Confusion des règles qui mêlent différents scénarios </li></ul></ul>
    76. 76. Adopter RDA en France ? <ul><li>Besoin d’actualiser les règles de catalogage </li></ul><ul><ul><li>pour suivre les évolutions au niveau international </li></ul></ul><ul><ul><li>pour répondre aux besoins des catalogues d’aujourd’hui </li></ul></ul><ul><li>Perspectives offertes par RDA </li></ul><ul><ul><li>Rénovation en profondeur des règles de catalogage </li></ul></ul><ul><ul><li>Mutation des catalogues </li></ul></ul><ul><ul><li>Ouverture vers le web de données </li></ul></ul><ul><li>Réflexion menée dans le cadre de l’AFNOR </li></ul><ul><li>Création de deux groupes de travail </li></ul><ul><ul><li>Groupe de travail technique (aspects professionnels) </li></ul></ul><ul><ul><li>Groupe de travail stratégique (aspects politiques) </li></ul></ul>
    77. 77. Groupe stratégique, 25 mars 2011 <ul><li>Il faut aller vers une nouvelle structure des catalogues reflétant le modèle FRBR </li></ul><ul><li>Il faut rechercher l’interopérabilité maximale avec les catalogues étrangers </li></ul><ul><li>Préparer les conditions d’une adoption de RDA </li></ul><ul><ul><li>sans profil national  travailler à la définition d’un profil européen </li></ul></ul><ul><ul><li>selon le scénario 1 de RDA </li></ul></ul><ul><li>Expérimenter la FRBRisation des catalogues </li></ul><ul><ul><li>à travers les initiatives des grands établissements et réseaux … mais en les coordonnant </li></ul></ul>
    78. 78. Évolution des SIGB <ul><li>Intérêt des éditeurs de logiciels pour une mise en œuvre du modèle FRBR </li></ul><ul><ul><li>nouvelle génération de systèmes </li></ul></ul><ul><ul><li>sans calendrier précis à ce stade </li></ul></ul><ul><ul><li>besoin de consignes claires </li></ul></ul><ul><ul><ul><li>sur le scénario d’implémentation de RDA retenu </li></ul></ul></ul><ul><ul><ul><li>sur les évolutions des formats (en France, UNIMARC) </li></ul></ul></ul><ul><li>Questions </li></ul><ul><ul><li>Comment gérer la période de transition ? </li></ul></ul><ul><ul><li>Comment mutualiser les efforts de catalogage ? </li></ul></ul><ul><ul><ul><li>Notices d’ Œuvres et d’Expressions </li></ul></ul></ul>
    79. 79. Évolutions du format Unimarc <ul><li>Besoin d’exprimer le modèle FRBR en Unimarc, le format de catalogage en usage en France </li></ul><ul><li>Travail considérable … qui n’est pas terminé </li></ul><ul><ul><li>15 demandes d’évolution des formats préparées par le CfU (Comité français Unimarc) </li></ul></ul><ul><ul><ul><li>4 nouvelles zones en Unimarc/B </li></ul></ul></ul><ul><ul><ul><li>33 nouvelles zones en Unimarc/A </li></ul></ul></ul><ul><ul><ul><li>11 zones modifiées en Unimarc/A </li></ul></ul></ul><ul><ul><li>Propositions validées par le PUC (Permanent Unimarc Committee) de l’IFLA en mars 2011 </li></ul></ul><ul><ul><ul><li>statut provisoire (3 ans) pour les zones relatives à l’Expression </li></ul></ul></ul><ul><ul><li>Diffusion possible aux éditeurs de logiciels </li></ul></ul>
    80. 80. FRBR en Unimarc <ul><li>Des notices pour les entités FRBR du Groupe 1 </li></ul><ul><li>Œuvre  Unimarc/ A </li></ul><ul><li>Expression  Unimarc/ A </li></ul><ul><li>Manifestation  Unimarc/ B </li></ul><ul><li>Item  Unimarc/ H </li></ul><ul><li>Principes directeurs </li></ul><ul><ul><li>Créer de nouvelles zones (U/A et U/B) pour les données « FRBRisées » </li></ul></ul><ul><ul><li>Conserver les anciennes pour les données pré-FRBR et/ou les catalogues non « FRBRisés » </li></ul></ul><ul><ul><li>Utilisation du bloc 5XX (Unimarc/A) pour les noms associés aux Œuvres et aux Expressions </li></ul></ul><ul><ul><ul><li>déclinaison semblable aux 7XX de l’Unimarc/B  5X0, 5X1, 5X2 </li></ul></ul></ul><ul><ul><ul><li>utilisation des codes de fonction en $4 </li></ul></ul></ul>
    81. 81. Bientôt un nouveau format ? <ul><li>23 mai 2011 : annonce sur le site de la Bibliothèque du Congrès : Bibliographic Framework Transition Initiative </li></ul><ul><li>Réflexion engagée sur le format futur des échanges d’information bibliographique </li></ul><ul><ul><li>abandonner les formats MARC (dans 10 ans ?) </li></ul></ul><ul><ul><li>définir un nouveau format </li></ul></ul><ul><ul><ul><li>aussi robuste que MARC </li></ul></ul></ul><ul><ul><ul><li>mieux adapté aux technologies du web </li></ul></ul></ul><ul><ul><ul><li>plus apte à exprimer le modèle FRBR </li></ul></ul></ul><ul><li>À suivre… </li></ul>
    82. 82. Merci de votre attention

    ×