Informatique documentaire - Cours Licence pro bib 2013

4,321 views

Published on

Première journée d'une série de deux sur l'informatique documentaire, médiation numérique ...
Dans cette première journée : formats, outils, rappels méthode projet

Published in: Education

Informatique documentaire - Cours Licence pro bib 2013

  1. 1. Linformation numérique Matin : « normes, formats & jargon »Après-midi : « le système dinformation documentaire » Sylvain Machefert – 14·02·2013
  2. 2. Considérations dordre général Parle-t-on le LinformatiqueQui parle ? même langage ? documentaire (questionnaire) cest important ?
  3. 3. GénéralitésDomaine public // Nasa // Wikimedia Commons
  4. 4. Le document numérique « Dans son acception courante un document estgénéralement défini comme le support physique duneinformation. Plus précisément on peut le définircomme un ensemble de données informativesprésentes sur un support, sous une forme permanenteet lisible par l’homme ou par une machine (permanentpar opposition à volatil). » http://fr.wikipedia.org/wiki/Document
  5. 5. Le document numériqueLe document numérique peut être compris dans un sensplus large, comme étant un ensemble de donnéesinformatives sous forme de chiffres (= numérique) lisiblepar un dispositif informatique restituant les informations.
  6. 6. ENJEUX● Interopérabilité● Accessibilité● Pérennité CC-BY-NC-SA // Maurizio DArrigo // Flickr
  7. 7. Éléments de vocabulaire● bit → le fameux 0 ou 1● octet → 8 bits → 256 combinaisons● kilooctets → 1024 octets● mégaoctet → 1024 kilooctets● gigaoctet → 1024 mégaoctets● téraoctet → 1024 gigaoctets CC-BY-NC-SA // Stephanie Booth // Flickr
  8. 8. Ordres de grandeur1 CD 650 Mo 74 min > 10 h en mp3
  9. 9. PérennitéCC-BY-SA // Matt Schilder // Flickr
  10. 10. Codage des caractères Étendue Codage Création bits Valeurs CaractèresASCII 1961 7 128 95ISO-8859-1 / Latin-1 1987 8 256 191 (accents)UTF-8 1993 8-32 > 2 milliards > 100 000 CC-BY-SA // Paqribas // Wikimedia Commons
  11. 11. FormatsCC-BY // Marc Mateus // Flickr
  12. 12. Choix du format ↓ accessibilité
  13. 13. Préconisations nationales ↓ RGI ( Référentiel Général dInteropérabilité )
  14. 14. Maîtriser la manipulation via les outils de base
  15. 15. HTML – 1989● structuration des pages web● se limite à la présentation (peu de sémantique)● support variable selon les outils Rendus transparents par les CMS
  16. 16. CSS – 1995● feuille de style pour le web● séparation entre structure et présentation main.css
  17. 17. XML – 1998● Recommandation du W3C● Intimement lié au web● Structure arborescente● Format générique décliné en schémas ● TEI : Text Encoding Initiative ● EAD : Encoded Archival Description ● TEF : Thèses Électroniques Françaises ● METS : Metadata Encoding and Transmission Standard
  18. 18. Epub – 2007● Format ouvert pour les ebooks● Archive composée de HTML, css, images CC-BY // Dan Taylor // Flickr
  19. 19. Mais il y a du monde sur le créneauDaprès http://en.wikipedia.org/wiki/Comparison_of_e-book_formats
  20. 20. Un souci pour les bibliothèques …DigitalRightsManagement CC-BY // Martin Krzywinski // Flickr
  21. 21. Description CC-BY-SA // Julian Fong // Flickr
  22. 22. Les métadonnéesdescriptives techniques juridiques● importance du choix de format● ne pas sisoler de ses partenaires● qui peut le plus peut le moins … CC-BY // MG Shelton // Flickr
  23. 23. IdentifiantSuite de caractères alphanumériquespermettant didentifier une ressourcephysique ou une ressource logique,selon une granularité particulière.
  24. 24. Identifier lunité physique● Livre  → ISBN → 978-2-7654-0954-0● Périodique → ISSN → 0335-1793● Musique → ISMN → M-060-11561-5
  25. 25. Identifier en ligneLes URI (Uniform Resource Identifier) sont lélémentcentral de lidentication en ligne.Leur but est de :● Nommer● Adresse● Décrire (jusquà un certain point)
  26. 26. URN – Uniform Resource Name● Indépendant de lemplacement● Nécessite un répertoire de correspondanceex : « urn:isbn:0-395-36341-1 » ; « doi:10.1000/182 »
  27. 27. URL – Uniform Resource Locator ● Localisation des pages web en HTTP ● Très lié à lhébergeur http://fr.wikipedia.org/wiki/URLprotocole sous-domaine nom de domaine 2nd niveau nom de domaine 1er niveau nom de la ressource
  28. 28. URL – Enjeux de la lisibilité● Permet un accès direct à la ressource● Facilite la citation (cf. permalien)● Indexation dans les moteurs de recherche● Moissonnage OAI
  29. 29. Problème de la pérennitéAprès 27 mois, 13% des liens web utiliséscomme référence dans des articles nerépondent plus. Going, Going, Gone: Lost Internet References / Robert P. Dellavalle et al. (2003)
  30. 30. le permalien – url pérennehttp://www2.babord.u-bordeaux.fr/ipac20/ipac.jsp?session=1P0X90854L991.10123&profile=babord&source=~!pwbabord&view=items&uri=full=3100001~!1095420~!3&ri=1&aspect=subtab50&menu=search&ipp=20&spp=20&staffonly=&term=wikipedia&index=.GK&uindex=&aspect=subtab50&menu=search&ri=1http://www2.babord.u-bordeaux.fr/ipac20/ipac.jsp?uri=full=3100001~!1095420~!0
  31. 31. Étude de 260 OPAC de bibliothèquesacadémiques américaines Duke University, Princeton, à paraître
  32. 32. ARK – Archival Resource Key● Créé et maintenu par la California Digital Library● Utilisé par la BnF● Plusieurs niveaux de granularité : ● page dans un document ● image dans un lot de documents http://catalogue.bnf.fr/ ark:/12148/bpt6k103226k/f263.pagination http://gallica.bnf.fr/ adresse du résolveur (optionnel) espace de nom institution Identifiant unique niveau plus fin
  33. 33. DOI – Digital Object Identifier● Géré par Crossref pour le domaine de la recherche● Plus de 48 millions denregistrements http://dx.doi.org/ doi:10.1045/may2006-apps http://hdl.handle.net/ résolveur espace de nom code handle du DOI organisme gestionnaire identifiant de lobjet
  34. 34. Description ≠ Stockage Dublin Core MARC Onix iso2709 XMLFormat binaire
  35. 35. Description – Les format MARC – 1965● Par et pour les bibliothécaires● Deux niveaux darborescence● Variations nationales (Marc 21, unimarc …)● Principal format utilisé en bibliothèque
  36. 36. Description – Dublin Core – 1995● 15 éléments de base ● contenu : titre, type, sujet ... ● Propriété intellectuelle : créateur, éditeur ... ● Instanciation : date, identifiant, format● Version étendue : DC qualifié● Utilisé par OAI
  37. 37. StockageXML iso2709 binaire
  38. 38. FRBR● Dès 1991, publié en 1998● Modèle conceptuel● Orienté utilisateur ● Tous utilisateurs potentiels ● Tous les usages possibles Domaine public // Mhrmaw // Wikimedia Commons
  39. 39. FRBR / RDA FRBR Œuvre Personne Concept Expression Collectivité ObjetManifestation Événement Item Lieu Groupe 1 Groupe 2 Groupe 3 Personnes et collectivités Sujets dœuvre
  40. 40. FRBR / RDA FRBR – Détail du groupe 1 Œuvre Harry Potter et le princede sang-mêlé de J. K. Rowling Expression La traduction française Manifestation La version de poche de 2006 Item Mon exemplaire
  41. 41. FRBR / RDAFRBR – Vue densemble Daprès Stéphanie Bouvier
  42. 42. RessourceDescription &Access
  43. 43. ÉchangeCC-BY // JC i Nuria // Flickr
  44. 44. Échanger ses données pour …● Être présent sur le web● Ne pas réinventer la roue● Sintégrer dans un Système dInformation● Faciliter la vie de lusager● Rendre le système évolutif
  45. 45. RSS – Really Simple SyndicationSabonner aux mises à jourdun site web et centraliser lesalertes sur ces mises à jour. © Matthew Forsythe
  46. 46. bibliobsession le bouillon des bibliothèques une recherche bibliobsédés [reloaded] sudoc Agrégateur Synthèse des mises à jour
  47. 47. Google Reader
  48. 48. OAI-PMH → Échange de métadonnées● Format XML● Données Dublin Core● Protocole très simple● Nécessite des urls pérennes ex. 1 ; ex. 2
  49. 49. Z39.50 → Interrogation● Format historique (1970)● Possibilités très larges● Utilisé pour la recherche fédérée et la dérivation de notices CC-BY-SA – Alexander Drachmann – Flickr
  50. 50. SRU / SRW → Interrogation● Protocole Web● Langage dinterrogation dédié● Assez simple (3 opérations) exemple CC-BY-SA – Alexander Drachmann – Flickr
  51. 51. Les Web Services → Usages divers● Technologie Web déchange de données entre applications● AJAX : « Asynchronous JavaScript and XML » Réservations Disponibilité Infos lecteurs
  52. 52. ILS-DI : tentative de normalisationhttp://onlinebooks.library.upenn.edu/webbin/availability?id=olbp42044
  53. 53. Screen scraping – Capture des données décran plus moins compliqué pérennne Derniers recours ( mais souvent le seul … )CC-BY-SA // Jacekgal // Wikimedia Commons
  54. 54. Mais ça fonctionne→ http://bibliotheques.wordpress.com/2011/03/07/capturer-les-donnees-decran-dun-opac/
  55. 55. Les mash-ups(applications composites)
  56. 56. Récupération des résultats de recherche du catalogue de la Ville de Paris pour les afficher sur une carte → http://www.geobib.fr/paris
  57. 57. Diffuser linformationCC-BY // Kevin dooley // Flickr
  58. 58. Sitemap Norme dorganisation de fichiers XML qui va nous permettre de lister toutes les pages de notre catalogue afin que les moteurs les indexent. → http://www.u-bordeaux3.fr/sitemap.xmlCC-BY // Shad Bolling // Flickr
  59. 59. Web de données Donner du sens aux contenus web en les mettant en relation, afin de permettre leur analyse par les machines.CC-BY-SA // Richard Cyganiak // Wikimedia Commons
  60. 60. Le butQue lordinateur sache à partir de ces informations queles affirmations suivantes sont vraies : « Jean-Paul Sartre » « est né à » « Paris » « Jean-Paul Sartre » « a écrit » « Huis clos »« Jean-Paul Sartre » « est le compagnon de » « Simone de Beauvoir » http://dbpedia.org/page/Jean-Paul_Sartre Sur une idée dÉtienne Cavalié
  61. 61. Permettre des requêtes construites sur les données
  62. 62. Les attributs et les relationsquils ont, sont définis dansdes ontologies :- FOAF : pour des personnes- SKOS : pour les thésaurus
  63. 63. À la BnFdata.bnf.fr
  64. 64. Open Data vidéoCC-BY // Huk_Flickr // Flickr
  65. 65. http://data.lacub.fr
  66. 66. Bibliothèques de Gironde
  67. 67. Expérimenter …« Il n’y a pourtant aucun risque : personne ne déclenchera la troisièmeguerre mondiale depuis une bibliothèque en se trompant dans une lignede code, et le seul danger qui nous menace, c’est de ne pas savoir. » D. Bourrion dans , Documentaliste Sciences de linformation, janvier 2011
  68. 68. Choix de logiciels Éléments de réflexion
  69. 69. Des avantages Logiciels métiers – Une offre de nicheDes inconvénients
  70. 70. Gestion dun projet informatiqueCC-BY-SA // Michael Cooper // Wikimedia Commons
  71. 71. 1 Étude préalable 2 Cahier des charges● Opportunité du projet ● Analyse de lexistant● Périmètre du besoin ● Besoins détaillés● Budget 3 Choix du produit 4 Mise en œuvre● Type de procédure marché ● Spécifications fonctionnelles● Mise en concurrence ● Paramétrages● Sélection du prestataire ● Formations ● Recette et garantie CC-BY-SA // Michael Cooper // Wikimedia Commons
  72. 72. Architectures logicielles ClientFull web serveur
  73. 73. Architecture « classique » full web Linux ApacheSystème dexploitation serveur web Mysql, PHP, posgreSQL perl, ruby bases de données langage de prog. (C) // danzo08 // sxc.hu
  74. 74. le nuage //le cloud
  75. 75. CGU – Accès aux Pérennité Respect donnésvie privée Backupify
  76. 76. le logiciel libreCC-BY-NC-SA // Francesco Lodolo // Flickr
  77. 77. Une histoire dinformaticiens ... CC-BY-SA // Chris McKenna // Wikimedia Commons
  78. 78. Une histoire dinformaticiens ... Système dexploitation Infrastructure Outils généralistes Outils métiers
  79. 79. Une histo ire de ... CC-BY-SA // Remi Jouan // Wikimedia Commons
  80. 80. libertés0 1 Free as in free speec h, not as in free beer Exécuter Étudier2 3Redistribuer Améliorer CC-BY-SA // thrp // Flickr
  81. 81. Gnu Public license (GPL)Libre de droits // Vassil // Wikimedia commons
  82. 82. Creative Commons BY Attribution NC Non Commercial ND No Derivative SA Share Alike CC-BY // Giuli-O // Flickr
  83. 83. Extension à la Culture CC-BY-NC // Balakov // Flickr
  84. 84. Extension à la Culture● Musiques● Encyclopédie● Cartes● Photographies● Articles scientifiques● … CC-BY-NC // Balakov // Flickr
  85. 85. La communautéCC-BY-SA // Dkassing // Wikimedia Commons
  86. 86. communautés métiers● tailles réduites● moins de développeurs ● Développeurs non praticiens ● Praticiens non développeurs● peu (pas) de bénévoles● utilisation professionnelle CC-BY-SA // JoJan // Wikimedia Commons
  87. 87. Exemple 1 Briques payantes Ever Team OpenFlora Serdaéditeur produits partenaire(s) Utilisateurs
  88. 88. Exemple 2 prestataires Kohainternationaux produit Biblibre Tamil Progilone prestataires français Utilisateurs
  89. 89. (fork*)* fourche CC-BY // S Baker // Flickr
  90. 90. Exemple 3 PMB « Plus de 20 PMB Services prestataires en France »*éditeur libre produit Utilisateurs * Éric Robert, liste PMB-devel, 08/2010
  91. 91. “La gouvernance de PMB estclairement établie : cestPMB Services qui en est le ”maître. Éric Robert, Direction générale PMB Services
  92. 92. Évaluation de la communautéCC-BY // Mukkuher // Wikimedia Commons
  93. 93. Aspect financierCC-BY-SA // Nick Ares // Flickr
  94. 94. CompétencesCC-BY-NC-SA // Ennor // Flickr
  95. 95. de bons interlocuteursCC-BY-NC-SA // Sergio Alvarez // Flickr
  96. 96. Le système dinformation documentaire Le systèmedinformationdocumentaire Sylvain Machefert – 14·02·2013
  97. 97. Un système dinformation (SI) est unensemble organisé de ressources(matériels, logiciels, personnel, données etprocédures) qui permet de collecter,regrouper, classifier, traiter et diffuser delinformation sur un environnement donné. http://frwp.org/Système_dinformation
  98. 98. Des briques CC-BY // mikecogh // Flickr
  99. 99. Élément central (encore en 2013) : le SIGB
  100. 100. Principales fonctionnalités (peu dévolutions fonctionnelles aujourdhui)Périodiques Acquisitions Retours Éditions Statistiques CatalogageClient Z39.50 Recherche Prêts
  101. 101. Principaux cas de mise en œuvre dun SIGB aujourdhui Fin de support éditeur Mise en réseau / mise à niveau Évolution infrastructure informatique
  102. 102. ERMS –AtoZ CC-BY-SA // Piotr Kuczyński // Wikimedia Commons
  103. 103. Exemple de gestion avec 360 Core CC-BY // Britt Reints // Flickr
  104. 104. Outils sur Activation deabonnement packages Base deconnaissance Métadonnées gérée par moins riches fournisseur
  105. 105. Discovery tool –Outil de découverte CC-BY-SA // geschenkhamster.de
  106. 106. Une granularité plus fine → http://univevry.summon.serialssolutions.com
  107. 107. Le catalogue nest quune partie dunécosystème plus large
  108. 108. Les CMSJoomla Drupal Wordpress Spip SOPAC Scriblio CC-BY // Les Chatfield // Flickr
  109. 109. Exemple de gestion avec Amethys CC-BY // Britt Reints // Flickr
  110. 110. GEDDomaine public // DustyDingo // Wikimedia Commons
  111. 111. Exemple de gestion avec Omeka CC-BY // Britt Reints // Flickr
  112. 112. Le résolveur de liens OpenURL CC-BY-SA – Tennen Gas – Wikimedia Commons
  113. 113. ● Lier les métadonnées à la ressource quelles décrivent en fonction des accès dont dispose lutilisateur● « résolveur de lien » pour fournir ce lien et/ou dautres services CC-BY-SA – Tennen Gas – Wikimedia Commons
  114. 114. Sans OpenURL Notice repérée Rechercheau catalogue Site de Texte l’éditeur intégral
  115. 115. Avec OpenURL Notice repérée Résolveur Recherche de liensau catalogue Site de Texte l’éditeur intégral
  116. 116. OpenURL – Exemple1 2
  117. 117. Autres briques Service de Gestion des Archive renseignementspostes publics institutionnel virtuel
  118. 118. Le contrôle Le contrôle des accès des accèsDomaine public – Emil Mayer
  119. 119. Reconnaissance IPCC-BY-SA // Toffelginkgo // Wikimedia Commons
  120. 120. Reverse Jstor Ebsco Ressources électroniques Cairn proxy Poste 1 Ezproxy147.210.108.205 147.210.116.177 Poste 2 Annuaire LDAP Usager147.210.109.154 88.102.88.54 UNIVERSITÉ
  121. 121. Transfert dannuairesCC-BY-NC-SA // Mongrain Claure // Flickr
  122. 122. Échange de jetonsDomaine public // Ab5602 // Wikimedia Commons
  123. 123. CAS : identification une fois pour toutes CAS / LDAP / Jetons / Shibboleth CC-BY-SA // The Pageman // Flickr
  124. 124. Fédération didentité ShibbolethDomaine public // Man-ucommons
  125. 125. Aller plus loin (décembre 2005) (septembre 2007)Et surtout le web : blogs, réseaux sociaux, revues en ligne …

×