SlideShare a Scribd company logo
1 of 103
OAI-PMH Pratiques et problématiques de l’interopérabilité Muriel Foulonneau Centre de Recherche Public Henri Tudor Luxembourg Oct 2009 [email_address]
Vers l’interopérabilité des systèmes documentaires ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
L’environnement OAI-PMH Oct 2009 [email_address] Service provider Harvester Data provider Data provider Data provider Agregator ,[object Object],Portal interface Repository Data provider Repository Repository
[object Object]
Partager ses contenus ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Construire de multiples services sur des contenus partagés ,[object Object],[object Object],Oct 2009 [email_address] Collection service
Coexistence de différents services Oct 2009 [email_address] Plein texte Métadonnées Desc. collections Métadonnées et ressources Métadonnées Métadonnées et ressources
[object Object]
Qu’est-ce que l’interopérabilité ,[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address] 01-04-04 ,[object Object],[object Object],[object Object]
Différents niveaux d’interopérabilité ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Métadonnées ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Un format de métadonnées ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Le Dublin Core Metadata Element Set ,[object Object],Oct 2009 [email_address] Content Intellectual property Instantiation Coverage Description Relation Type Source Title Subject Rights Contributor Publisher Creator Language Identifier Format Date
Où se trouvent les métadonnées Oct 2009 [email_address] Ex. Z39.50, SRU/SRW ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Library of Congress home page <HTML> <HEAD> <TITLE> The Library of Congress </TITLE> <META NAME=&quot; description &quot; CONTENT=&quot;Home page of the Library of Congress, Washington, D.C. The Library of Congress is the nation's oldest federal cultural institution, and it serves as the research arm of Congress. […].&quot;> <META NAME=&quot; keywords &quot; CONTENT=&quot;library of congress, home page, catalog, copyright office, […]&quot;>
Partage de métadonnées – la fédération ,[object Object],Oct 2009 [email_address] moulin? Ex. Z39.50, SRU/SRW <title>My resource</title> <date>04 <title>My resource</title> <date>04 <title>My resource</title> <date>04
L’agrégation de métadonnées ,[object Object],[object Object],Oct 2009 Moteurs de recherche, catalogues collectifs, OAI [email_address] <title>My resource</title> <date>04
L’OAI divise le monde entre fournisseurs de données et fournisseurs de services Oct 2009 [email_address]
Transférées des données structurées Oct 2009 [email_address] Service provider Harvester Data provider Data provider Data provider Agregator ,[object Object],[object Object],[object Object],Portal interface Repository Data provider Repository Repository
Moisson incrémentale Moissonneur Fournisseurs de données Quoi de neuf depuis mon dernier passage? ,[object Object],[object Object],[email_address] Oct 2009 <title>My resource</title> <date>04
Displayed record Dublin Core MARC21 MODS Plusieurs représentations d’une ressource School of arts for girls Kiz Sanayi Mektebi] oai:lcoa1.loc.gov:loc.pnp/cph.3b23005 [email_address] Oct 2009
Les bases OAI peuvent être organisées en ensembles Oct 2009 [email_address] ,[object Object],[object Object],[object Object]
OAI est basé sur des standards ,[object Object],[object Object],[object Object],Oct 2009 [email_address]
6 requêtes OAI ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[email_address] Oct 2009
Une réponse OAI Oct 2009 [email_address] <record> - < header >     <identifier> oai:images.library.uiuc.edu:emblems/324 </identifier>      <datestamp> 2003-10-22 </datestamp>      <setSpec> emblems </setSpec>      </header> - < metadata > - <oai_dc:dc xmlns:oai_dc=&quot; http://www.openarchives.org/OAI/2.0/oai_dc/ &quot; xmlns:dc=&quot; http://purl.org/dc/elements/1.1/ &quot; xmlns:xsi=&quot; http://www.w3.org/2001/XMLSchema-instance &quot; xsi:schemaLocation=&quot; http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd &quot;>     <dc:creator> Müller, Johann Heinrich Traugott, 1631-1675 </dc:creator>          <dc:identifier> http://images.library.uiuc.edu:8081/u?/emblems,324 </dc:identifier>      </oai_dc:dc>     </metadata>     </record> ,[object Object],[object Object]
[object Object],Oct 2009 [email_address]
Retraitement des données Nettoyage Normalisation Augmentation Ex: ajout DCMIType, ajout collection Ex: mapping Format – Extent quand « 163 pages » Ex: supprimer les valeurs nulles <dc:format/>  <dc:date>--</dc:date> Ex: exclusion si pas d’objet numérique – par rapport à la politique documentaire Oct 2009 [email_address] moisson archivage Record selection
Service d’agrégation de données Oct 2009 [email_address] Métas enrichies Moissons Interface SRU Interface OAI Interface Web Services de méta-recherche Services OAI Utilisateurs Agrégation Transformation Partage   Public   interface  RSS Services
Nor malisation/augmentation des données Date : 71%  Localisation : 21% Oct 2009 [email_address] Concept % enregistrements CIC Type  99% Format 66% Language 60% Collection 100% Resource URL 72%
Accessibilité ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address] DC:Type =  Identification photographs DC:Type =  StillImage DC:Type =  Image
Perte du contexte de l’information Oct 2009 [email_address]
Ce qui se trouve derrière les URLs Oct 2009 [email_address]
Des métadonnées aux objets numériques Sur 96 collections (CIC, juin 2006) # de clics entre la liste de résultats chez le fournisseur de services et la ressource numérique Oct 2009 [email_address] # collections (en considérant une vignette et une table des matières comme ressource) # collections (sans considérer une vignette ou une table des matières comme ressource) 1click 54 26 2 clicks 39 53 3 clicks 3 17 Total 96 96
Des pratiques de créations des métadonnées différentes http://www.oaforum.org/otherfiles/bath_cole.ppt Oct 2009 [email_address]
Des questions de langue ,[object Object],Oct 2009 [email_address] oai:images.library.uiuc.edu:RussianPublics/8     < oai_dc:dc > < title > Moloshnitsa i Prachka.  La laitière et la blanchisseuse.  Das milchweib und die Wäscherinn. </ title >       < description > (unknown) </ description >       < creator > (unknown) </ creator >       < subject   />       < source > Volshebnoi fonar' </ source >       < description > Image was captured using Epson ### scanner and SilverFast import utility in Adobe Photoshop 6. Scanned at 42->24 Bit Colour at 300 dpi. No archival images were created, but access images were created as JPEGs with quality of 0. </ description >       < rights > Contact the owner of the material for copyright information. If you have comments relating to this record, please contact the Slavic and East European Library, http://www.library.uiuc.edu/spx/. </ rights >       < identifier > http://images.library.uiuc.edu:8081/u?/RussianPublics,8 </ identifier >   </ oai_dc:dc >
Exemples de valeurs trouvées dans DC:Date ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],XVIII Dynasty Winter 2003 era of redevelopment various 2002-00 1980, refurbished 1997 China: Neolithic Period (5000 BCE-ca 1600 BCE)? 19691968 21. Nouemb. Anno. 1564 . And finisshed on the euen of thanunciacion of our said bilissid Lady falling on the wednesday the xxiiij daye of Marche. in the xix yeer of Kyng Edwarde the fourthe [1479]] 19193 xxxx Oct xx Various 1938-05-38 1963 to 1953 [not after 1579] 163[5?] [email_address] Oct 2009
Tout le monde comprend différemment ,[object Object],Jens Finke's reference  sizes for thumbnails  Oct 2009 [email_address] Dimension (width x height) Descriptive name 48x48 very small 64x64 Small 96x96 Medium 128x128 Large 144x144 extra large 160x160 super large 192x192 ridiculous large
Les formats ,[object Object],[object Object],[object Object],Oct 2009 [email_address]
Les implémentations ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Utilisation de paramètres optionnels Description des ensembles OAI : 14% dans l’annuaire UIUC des entrepôts Oct 2009 [email_address]  OAI ensembles OAI <50% entre 1 et 175 Plusieurs formats de métadonnées >50% 15 schémas différents, 6 non standards  Resumption token (envoi par tranches) et nombre d’enregistrements 85%  Gestion des enregistrements supprimés 20% persistent, 20% transient  Granularité de la date des enregistrements 25% à la seconde
Les métadonnées ne disent rien de leur utilisation Anywhere? Date Title Creator/Contrib. Subject Creator Type Oct 2009 [email_address]
Problématiques techniques  http://arxiv.org/ftp/cs/papers/0601/0601125.pdf Oct 2009 [email_address]
Les principales problématiques ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
[object Object],Oct 2009 [email_address]
L’évolution des sources de données Oct 2009 [email_address] By collection + regular increase By collection only Regular increase No change Dead
Problème de la fraîcheur des données ,[object Object],[object Object],Oct 2009 [email_address]
Contraintes liées à l’agrégation de ressources ,[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Ressemblance des enregistrements Concatenation of properties for two records of the lib.umich.edu.kdimgbib collection Oct 2009 [email_address]
Les applications utilisent des sous-ensembles de propriétés ,[object Object],Oct 2009 [email_address] oai:digital.lib.umn.edu:AS999995 < identifier > AS999995 </ identifier >       < identifier > http://snuffy.lib.umn.edu/image/srch/bin/Dispatcher?mode=600&id=AS999995 </ identifier >       < rights > These images may be copyright protected. Please contact the [American Studies Department] on use and access restrictions. </ rights >       < relation > This object is part of a larger series in the digital collections database, available at http://digital.lib.umn.edu. The specific series is American Studies Department Images (). </ relation >
Utilisation de sous-ensembles de propriétés ,[object Object],Oct 2009 [email_address]
Impact sur les requêtes ,[object Object],Oct 2009 [email_address] % queries with 0-10% items retrieved % queries with =100% items retrieved Affinity for retrieval Resemblance of full record lib.umich.edu.brutbib 0 1 1 0.97 digital.lib.umn.edu.gpgovman 0 1 1 0.86 lib.umich.edu.borobudurbib 0 1 1 0.82 lib.umich.edu.ppotpusbib 0.3 0.48 0.66 0.51 lib.umich.edu.cjsbib 0.75 0.09 0.46 0.31 digital.lib.umn.edu.shm 0.85 0.06 0.1 0.26 lib.umich.edu.postidbib 0.88 0.1 0.12 0.19 etd.ohiolink.edu.osu 0.99 0 0.01 0.04 iubio.bio.indiana.edu.biosoft.OAI2.iubio 0.98 0 0.01 0.03 scout.wisc.edu.scout 0.96 0 0.02 0.01 Average (mean) in the CIC repository 0.82 0.13 0.16 0.39
Mécanismes spécifiques à implémenter ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
[object Object],Oct 2009 [email_address]
PictureAustralia ,[object Object],[object Object],[object Object],Using OAI has the advantage that only new and changed records need to be harvested, while for web crawl harvesting all records have to be re-harvested each time a harvest is run. http://www.pictureaustralia.org/schemas/pa/index.html Oct 2009 [email_address]
OAIster ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
BASE Number of documents: 21,083,405 Number of content sources: 1,366 Indexed with full texts: 38 Last update: 29.09.2009 Oct 2009 [email_address]
National Science Digital Library Oct 2009 [email_address]
AVANO Oct 2009 [email_address]
DRIVER Oct 2009 [email_address]
Europeana Oct 2009 [email_address]
IVOA – synchronization of service repositories [email_address] Oct 2009
Etude d’utilisabilité CIC metadata portal ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Certains ont jugé que le bilan OAI était mitigé ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],“ moving from a data model that is metadata-centric to one that is resource-centric” Oct 2009 [email_address]
[object Object],Oct 2009 [email_address]
Baisser encore les exigences ,[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Incitations ,[object Object],[object Object],Oct 2009 [email_address]
Dialogue avec les fournisseurs de logiciels
Agir sur les pratiques de création de métadonnées ,[object Object],[object Object],Oct 2009 [email_address]
Qualité des métadonnées ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Thomas R. Bruce and Diane I. Hillman  The Continuum of Metadata Quality , in Metadata in Practice Oct 2009 [email_address]
Enrichissement des métadonnées ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Validation ,[object Object],[object Object],[object Object],Oct 2009 [email_address]
Agrégations dans des infrastructures de données pour diminuer le coût d’agrégation pour les fournisseurs de services Oct 2009 [email_address]
[object Object],Oct 2009 [email_address]
Mais pourquoi mettre ses ressources en commun? ,[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Perdre la maîtrise sur la représentation de ses données ,[object Object],Oct 2009 [email_address]
Droits sur les métadonnées ,[object Object],[object Object],[object Object],Oct 2009 [email_address]
Droits d’utilisation ,[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
[object Object],[object Object],[object Object],Oct 2009 [email_address]
Ajouter des vignettes à une agrégation ,[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Des vues multiples sur une image Oct 2009 [email_address]
Annotations Oct 2009 [email_address]
Les articles ont des relations avec des choses externes http://www.openarchives.org/ore/1.0/primer.html Oct 2009 [email_address]
Différentes stratégies ,[object Object],[object Object],Oct 2009 [email_address]
Transférer des objets complexes From DRIVER II TechWatch, report Oct 2009 [email_address]
Les problèmes posés ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Plusieurs approches pour les objets complexes ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
[object Object],[object Object],[object Object],Oct 2009 [email_address]
OAI-ORE ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
OAI-ORE n’est pas un successeur d’OAI-PMH ,[object Object],Oct 2009 [email_address]
ReM et Agrégation ,[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
Les Ressources agrégées ,[object Object],[object Object],http://www.openarchives.org/ore/1.0/datamodel.html Oct 2009 [email_address]
Les Proxies ,[object Object],[object Object],[object Object],Oct 2009 [email_address]
Lineage ,[object Object],[object Object],[object Object],Oct 2009 [email_address]
Le modèle de données Oct 2009 [email_address]
Les relations de ORE ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
ORE en RDFa Oct 2009 [email_address]
ReM en OAI-PMH ,[object Object],[object Object],Oct 2009 [email_address]
Scénarios ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Oct 2009 [email_address]
DSpace ,[object Object],http://txspace.tamu.edu/handle/1969.1/86479?show=full Oct 2009 [email_address]
Des journaux http://www.openarchives.org/ore/meetings/Soton/foresite-ore_uk.pdf Oct 2009 [email_address]
Des annotations http://www.openarchives.org/ore/meetings/Soton/Cole-OAI-ORE-Roll-Out-OR08.pdf Oct 2009 [email_address]
Conservation des données http://www.openarchives.org/ore/meetings/Soton/ore-amf-client-side-southampton.pdf http://www.cs.odu.edu/~skoneru/indstd/test/arxiv.html Oct 2009 [email_address]
Des relations explicites ,[object Object],[object Object],[object Object],http://www.openarchives.org/ore/1.0/primer.html Oct 2009 [email_address]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Références [email_address] Oct 2009

More Related Content

More from chessmu

Modélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de donnéesModélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de données
chessmu
 

More from chessmu (9)

Modélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de donnéesModélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de données
 
Open Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata HarvestingOpen Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata Harvesting
 
Dublin Core et partage de métadonnées - Faire interagir les objets numériques
Dublin Core et partage de métadonnées - Faire interagir les objets numériquesDublin Core et partage de métadonnées - Faire interagir les objets numériques
Dublin Core et partage de métadonnées - Faire interagir les objets numériques
 
Dublin Core Metadata Initiative - Exemples d'applications
Dublin Core Metadata Initiative - Exemples d'applications Dublin Core Metadata Initiative - Exemples d'applications
Dublin Core Metadata Initiative - Exemples d'applications
 
Infrastructures de recherche - Meta-Portails
Infrastructures de recherche - Meta-PortailsInfrastructures de recherche - Meta-Portails
Infrastructures de recherche - Meta-Portails
 
Archives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives EuropeennesArchives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives Europeennes
 
Virtual Collections for researchers
Virtual Collections for researchersVirtual Collections for researchers
Virtual Collections for researchers
 
Dublin Core Collection Application Profile - task group
Dublin Core Collection Application Profile - task groupDublin Core Collection Application Profile - task group
Dublin Core Collection Application Profile - task group
 
Stratégie de partage des ressources
Stratégie de partage des ressources  Stratégie de partage des ressources
Stratégie de partage des ressources
 

Recently uploaded

Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
zidani2
 

Recently uploaded (12)

Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
 
Présentation sur les Risques Électriques et Leur Prévention en Algérie
Présentation sur les Risques Électriques et Leur Prévention en AlgériePrésentation sur les Risques Électriques et Leur Prévention en Algérie
Présentation sur les Risques Électriques et Leur Prévention en Algérie
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
 
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les ÉcolesEL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
 
Système National de Santé au- Maroc-(2017)."pdf"
Système National de Santé au- Maroc-(2017)."pdf"Système National de Santé au- Maroc-(2017)."pdf"
Système National de Santé au- Maroc-(2017)."pdf"
 
MARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptx
MARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptxMARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptx
MARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptx
 
Gestion des flux de trésorerie dans les entreprises
Gestion des flux de trésorerie dans les entreprisesGestion des flux de trésorerie dans les entreprises
Gestion des flux de trésorerie dans les entreprises
 
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 
Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
Comment enseigner la langue française en Colombie?
Comment enseigner la langue française en Colombie?Comment enseigner la langue française en Colombie?
Comment enseigner la langue française en Colombie?
 
Quitter la nuit. pptx
Quitter        la             nuit.   pptxQuitter        la             nuit.   pptx
Quitter la nuit. pptx
 

Oai5 1e Partie

  • 1. OAI-PMH Pratiques et problématiques de l’interopérabilité Muriel Foulonneau Centre de Recherche Public Henri Tudor Luxembourg Oct 2009 [email_address]
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7. Coexistence de différents services Oct 2009 [email_address] Plein texte Métadonnées Desc. collections Métadonnées et ressources Métadonnées Métadonnées et ressources
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. L’OAI divise le monde entre fournisseurs de données et fournisseurs de services Oct 2009 [email_address]
  • 18.
  • 19.
  • 20. Displayed record Dublin Core MARC21 MODS Plusieurs représentations d’une ressource School of arts for girls Kiz Sanayi Mektebi] oai:lcoa1.loc.gov:loc.pnp/cph.3b23005 [email_address] Oct 2009
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26. Retraitement des données Nettoyage Normalisation Augmentation Ex: ajout DCMIType, ajout collection Ex: mapping Format – Extent quand « 163 pages » Ex: supprimer les valeurs nulles <dc:format/> <dc:date>--</dc:date> Ex: exclusion si pas d’objet numérique – par rapport à la politique documentaire Oct 2009 [email_address] moisson archivage Record selection
  • 27. Service d’agrégation de données Oct 2009 [email_address] Métas enrichies Moissons Interface SRU Interface OAI Interface Web Services de méta-recherche Services OAI Utilisateurs Agrégation Transformation Partage Public interface RSS Services
  • 28. Nor malisation/augmentation des données Date : 71% Localisation : 21% Oct 2009 [email_address] Concept % enregistrements CIC Type 99% Format 66% Language 60% Collection 100% Resource URL 72%
  • 29.
  • 30. Perte du contexte de l’information Oct 2009 [email_address]
  • 31. Ce qui se trouve derrière les URLs Oct 2009 [email_address]
  • 32. Des métadonnées aux objets numériques Sur 96 collections (CIC, juin 2006) # de clics entre la liste de résultats chez le fournisseur de services et la ressource numérique Oct 2009 [email_address] # collections (en considérant une vignette et une table des matières comme ressource) # collections (sans considérer une vignette ou une table des matières comme ressource) 1click 54 26 2 clicks 39 53 3 clicks 3 17 Total 96 96
  • 33. Des pratiques de créations des métadonnées différentes http://www.oaforum.org/otherfiles/bath_cole.ppt Oct 2009 [email_address]
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39. Utilisation de paramètres optionnels Description des ensembles OAI : 14% dans l’annuaire UIUC des entrepôts Oct 2009 [email_address]  OAI ensembles OAI <50% entre 1 et 175 Plusieurs formats de métadonnées >50% 15 schémas différents, 6 non standards  Resumption token (envoi par tranches) et nombre d’enregistrements 85%  Gestion des enregistrements supprimés 20% persistent, 20% transient  Granularité de la date des enregistrements 25% à la seconde
  • 40. Les métadonnées ne disent rien de leur utilisation Anywhere? Date Title Creator/Contrib. Subject Creator Type Oct 2009 [email_address]
  • 41. Problématiques techniques http://arxiv.org/ftp/cs/papers/0601/0601125.pdf Oct 2009 [email_address]
  • 42.
  • 43.
  • 44. L’évolution des sources de données Oct 2009 [email_address] By collection + regular increase By collection only Regular increase No change Dead
  • 45.
  • 46.
  • 47. Ressemblance des enregistrements Concatenation of properties for two records of the lib.umich.edu.kdimgbib collection Oct 2009 [email_address]
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55. BASE Number of documents: 21,083,405 Number of content sources: 1,366 Indexed with full texts: 38 Last update: 29.09.2009 Oct 2009 [email_address]
  • 56. National Science Digital Library Oct 2009 [email_address]
  • 57. AVANO Oct 2009 [email_address]
  • 58. DRIVER Oct 2009 [email_address]
  • 59. Europeana Oct 2009 [email_address]
  • 60. IVOA – synchronization of service repositories [email_address] Oct 2009
  • 61.
  • 62.
  • 63.
  • 64.
  • 65.
  • 66. Dialogue avec les fournisseurs de logiciels
  • 67.
  • 68.
  • 69.
  • 70.
  • 71. Agrégations dans des infrastructures de données pour diminuer le coût d’agrégation pour les fournisseurs de services Oct 2009 [email_address]
  • 72.
  • 73.
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79. Des vues multiples sur une image Oct 2009 [email_address]
  • 80. Annotations Oct 2009 [email_address]
  • 81. Les articles ont des relations avec des choses externes http://www.openarchives.org/ore/1.0/primer.html Oct 2009 [email_address]
  • 82.
  • 83. Transférer des objets complexes From DRIVER II TechWatch, report Oct 2009 [email_address]
  • 84.
  • 85.
  • 86.
  • 87.
  • 88.
  • 89.
  • 90.
  • 91.
  • 92.
  • 93. Le modèle de données Oct 2009 [email_address]
  • 94.
  • 95. ORE en RDFa Oct 2009 [email_address]
  • 96.
  • 97.
  • 98.
  • 101. Conservation des données http://www.openarchives.org/ore/meetings/Soton/ore-amf-client-side-southampton.pdf http://www.cs.odu.edu/~skoneru/indstd/test/arxiv.html Oct 2009 [email_address]
  • 102.
  • 103.

Editor's Notes

  1. … . + rights + preservation + analytical