Introduction à l'informatique documentaire - 2011
Upcoming SlideShare
Loading in...5
×
 

Introduction à l'informatique documentaire - 2011

on

  • 2,792 views

 

Statistics

Views

Total Views
2,792
Slideshare-icon Views on SlideShare
2,750
Embed Views
42

Actions

Likes
2
Downloads
39
Comments
0

1 Embed 42

http://www.scoop.it 42

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-ShareAlike LicenseCC Attribution-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Introduction à l'informatique documentaire - 2011 Introduction à l'informatique documentaire - 2011 Presentation Transcript

    • informatique documentaire « une courte introduction » Sylvain Machefert – 17·02·2011
    • Généralités Les outils Formats de fichierDescription Échange Actualités
    • GénéralitésDomaine public // Nasa // Wikimedia Commons
    • Le document numérique « Dans son acception courante un document estgénéralement défini comme le support physiquedune information. Plus précisément on peut ledéfinir comme un ensemble de donnéesinformatives présentes sur un support, sous uneforme permanente et lisible par l’homme ou parune machine (permanent par opposition àvolatil). » http://fr.wikipedia.org/wiki/Document
    • Le document numériqueLe document numérique peut être compris dans un sensplus large, comme étant un ensemble de donnéesinformatives sous forme de chiffres (= numérique)lisible par un dispositif informatique restituantles informations.
    • ENJEUX● Interopérabilité● Accessibilité● Pérennité CC-BY-NC-SA // Maurizio DArrigo // Flickr
    • Éléments de vocabulaire● bit → le fameux 0 ou 1● octet → 8 bits → 256 combinaisons● kilooctets → 1024 octets● mégaoctet → 1024 kilooctets● gigaoctet → 1024 mégaoctets● téraoctet → 1024 gigaoctets CC-BY-NC-SA // Stephanie Booth // Flickr
    • Codage des caractères Étendue Codage Création bits Valeurs CaractèresASCII 1961 7 128 95ISO-8859-1 / Latin-1 1987 8 256 191 (accents)UTF-8 1993 8-32 > 2 milliards > 100 000 CC-BY-SA // Paqribas // Wikimedia Commons
    • Des outils 9CC-BY-SA // Wolfgang Sauber // Wikimedia Commons
    • SIGB / OPAC 10Domaine public // David Rees // Wikimedia Commons
    • place aux briques ? 11Domaine public // Ministère de la défense des États-Unis
    • Recherche fédérée CC-BY-NC-SA // Eddie Codel // Flickr
    • GEDDomaine public // DustyDingo // Wikimedia Commons
    • + tout un écosystème wikiAtoZ ERMS blog portail CMS Reverse proxy résolveur Gestion OpenURL postes publics excel !
    • le logiciel libreCC-BY-NC-SA // Francesco Lodolo // Flickr
    • Formats de fichiers 16CC-BY // Marc Mateus // Flickr
    • HTML – 1989● structuration des pages web● se limite à la présentation (peu de sémantique)● support variable selon les outils
    • CSS – 1995● feuille de style pour le web● séparation entre structure et présentation main.css
    • XML – 1998● Recommandation du W3C● Intimement lié au web● Structure arborescente● Format générique décliné en schémas ● TEI : Text Encoding Initiative ● EAD : Encoded Archival Description ● TEF : Thèses Électroniques Françaises ● METS : Metadata Encoding and Transmission Standard
    • Epub – 2007● Format ouvert pour les ebooks● Archive composée de HTML, css, images CC-BY // Dan Taylor // Flickr
    • DigitalRightsManagement 21 CC-BY // Martin Krzywinski // Flickr
    • Description 22 CC-BY-SA // Julian Fong // Flickr
    • Les métadonnéesdescriptives techniques juridiques● importance du choix de format● ne pas sisoler de ses partenaires● qui peut le plus peut le moins … CC-BY // MG Shelton // Flickr
    • IdentifiantSuite de caractères alphanumériquespermettant didentifier une ressourcephysique ou une ressource logique,selon une granularité particulière.
    • Identifier lunité physique● Enregistrements musicaux (ISRC)● Œuvre audiovisuelle (ISAN)● Texte (ISTC)● partie dun périodique (SICI)
    • Identifier lunité physique● Livre  → ISBN → 978-2-7654-0954-0● Périodique → ISSN → 0335-1793● Musique → ISMN → M-060-11561-5
    • Identifier en ligneLes URI (Uniform Resource Identifier) sont lélémentcentral de lidentication en ligne.Leur but est de :● Nommer● Adresse● Décrire (jusquà un certain point)
    • URN – Uniform Resource Name● Indépendant de lemplacement● Nécessite un répertoire de correspondanceex : « urn:isbn:0-395-36341-1 » ; « doi:10.1000/182 »
    • URL – Uniform Resource Locator● Localisation des pages web en HTTP● Très lié à lhébergeur http://fr.wikipedia.org/wiki/URLprotocole sous-domaine nom de domaine 2nd niveau nom de domaine 1er niveau nom de la ressource
    • URL – Enjeux de la lisibilité● Permet un accès direct à la ressource● Facilite la citation (cf. permalien)● Indexation dans les moteurs de recherche● Moissonnage OAI
    • ARK – Archival Resource Key● Créé et maintenu par la California Digital Library● Utilisé par la BnF● Plusieurs niveaux de granularité : ● page dans un document ● image dans un lot de documents http://catalogue.bnf.fr/ ark:/12148/bpt6k103226k/f263.pagination http://gallica.bnf.fr/ adresse du résolveur (optionnel) espace de nom institution Identifiant unique niveau plus fin
    • DOI – Digital Object Identifier● Géré par Crossref pour le domaine de la recherche● Plus de 48 millions denregistrements http://dx.doi.org/ doi:10.1045/may2006-apps http://hdl.handle.net/ résolveur espace de nom code handle du DOI organisme gestionnaire identifiant de lobjet
    • Description ≠ Stockage Dublin Core MARC Onix iso2709 XMLFormat binaire
    • Description – Les format MARC – 1965● Par et pour les bibliothécaires● Deux niveaux darborescence● Variations nationales (Marc 21, unimarc …)● Principal format utilisé en bibliothèque
    • Description – Dublin Core – 1995● 15 éléments de base ● contenu : titre, type, sujet ... ● Propriété intellectuelle : créateur, éditeur ... ● Instanciation : date, identifiant, format● Version étendue : DC qualifié● Utilisé par OAI
    • Description – RDF – 1999● Ressources du Web, pour le web sémantique● Définition par triplets : Sujet – Prédicat – Objet <Écrivain> <Auteur_de> <Livre> <Écrivain> <Date_de_Naissance> <Année>● Relations définies dans des vocabulaires ● FOAF : personnes et leurs relations ● SKOS : thesaurus Linked data exemples DBpedia
    • StockageXML iso2709 binaire
    • Échange 38CC-BY // JC i Nuria // Flickr
    • Échanger ses données pour ...● Être présent sur le web● Ne pas réinventer la roue● Sintégrer dans un Système dInformation● Faciliter la vie de lusager● Rendre le système évolutif
    • RSS – Really Simple SyndicationSabonner aux mises à jour dun site et centraliser les alertes sur cesmises à jour © Matthew Forsythe
    • Les Web Services → Usages divers● Technologie Web déchange de données entre applications● Facilite ● lintégration avec dautres outils ● les possibilités de « mash-up »● AJAX : « Asynchronous JavaScript and XML »
    • OAI-PMH → Échange de métadonnées● Format XML● Données Dublin Core● Protocole très simple● Nécessite des urls pérennes ex. 1 ; ex. 2
    • Z39.50 → Interrogation● Format historique (1970)● Possibilités très larges● Utilisé pour la recherche fédérée et la dérivation de notices CC-BY-SA – Alexander Drachmann – Flickr
    • SRU / SRW → Interrogation● Protocole Web● Langage dinterrogation dédié● Assez simple (3 opérations) exemple CC-BY-SA – Alexander Drachmann – Flickr
    • OpenURL → Aiguillage du lecteur …● Lier les métadonnées à la ressource quelles décrivent en fonction des accès dont dispose lutilisateur● « résolveur de lien » pour fournir ce lien et/ou dautres services CC-BY-SA – Tennen Gas – Wikimedia Commons
    • Sans OpenURL Notice repérée Rechercheau catalogue Site de Texte l’éditeur intégral
    • Avec OpenURL Notice repérée Résolveur Recherche de liensau catalogue Site de Texte l’éditeur intégral
    • OpenURL – Exemple1 2
    • « Actualités » 49 CC-BY // Alex Barth // Flickr
    • le nuageCC-BY // Kevin dooley // Flickr
    • Web de donnéesCC-BY-SA // Richard Cyganiak and Anja Jentzsch // loc-cloud.net
    • FRBR / RDADomaine public // Mhrmaw // Wikimedia Commons
    • Aller plus loin (décembre 2005) (septembre 2007)Et surtout les blogs : « Bibliothèques [reloaded] » ; « Face-Écran » ;« Vingt-sept point sept » ...
    • 1ère page : CC-BY-NC-SA – Don Solo – Flickr CC-BY-NC // Tinker*Tailor // Flickr