Your SlideShare is downloading. ×
Corpus numériques et SHS : infrastructures, outils, ISIDORE
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Corpus numériques et SHS : infrastructures, outils, ISIDORE

620
views

Published on


0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
620
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
6
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Signalement, accès, et mise à disposition desdonnées numériques de la recherche en SHS rechercheisidore.fr Stéphane POUYLLAU, Ingénieur de recherche au CNRS Directeur de Corpus-IR (UMS 3534) Responsable du projet ISIDORE - TGE Adonis Twitter @spouyllau – Email stephane.pouyllau@corpus-ir.fr
  • 2. Adonis- Adonis est un très grand équipement pour lessciences humaines et sociales- Acteur de la feuille de route ESFRI (DARIAH)- Missions 2012-2015 : - Accès aux données et documents numérique des SHS (ISIDORE) - Grille de services : hébergement web ; stokage de données ; Archivage à long terme (OAIS / CINES-SIAF)- Site : www.tge-adonis.fr- Contact : contact@tge-adonis.fr
  • 3. Corpus-IR- Corpus-IR (très grande Infrastructure de Recherche) est un réseau déquipes produisant des corpus numériques de sources : - Équipes (UMR, EA, etc.) - consortiums « disciplinaires » (mais pas que) - 12 consortiums à 15 consortiums - Financement de la production de corpus (numérisation ; documentation ; diffusion des données) - Points clés : qualité des métadonnées ; diffusion obligatoire des métadonnées ; diffusion selon des formats ouverts et normalisés (ISIDORE ; Gallica ; Europeana)
  • 4. Corpus-IR- Acteur de la feuille de route ESFRI (CLARIN)- UMS 3534 (Aix Marseille Université et CNRS) ● Paris / Marseille- Contact : www.corpus-ir.fr
  • 5. Des corpus... Isidore de Séville ? Mais de quoi parle-t-il ?
  • 6. Photos : SP. 2006.
  • 7. Photos : SP. 1999-2009.
  • 8. Photos : SP. 2006.
  • 9. Production de données « sources »- Sources ? Données et matériaux numériques – souvent non édités/éditables (coûts, place, droits)- Monde numérique (capteurs ; photos ; enregistrements ; GPS ; enquêtes en ligne ; numérisation de sauvegarde...)- Utilisation et ré-utilisation ? Reconnaissance du travail de collecte et de création de « corpus »- Valorisation des fonds documentaires
  • 10. ISIDORE et les fonds darchivesMettre en place lenvironnement pour relier données de la recherche et publications- Faciliter ladministration de la preuve scientifiqueISIDORE est un outil pour les communautés scientifiquesISIDORE est un outil de signalement et daccès- Exposition générique des données- Importance de la qualité des métadonnéesISIDORE est un moteur de recherche ; un site web ; un point daccès à des métadonnnées enrichies et reliées aux publications scientifiques   
  • 11. ISIDORE est un site web... avec « une » + de 1000 sources de données moissonnées + de 1.300.000 ressources indexés   
  • 12. Quelques chiffresDébut du projet : mai 2009Ouverture : déc. 2010Version 1 : mars 2011Version 1.2 : déc. 2011Version 2 : sept. 2012+ 1.700.000 de ressources numériques : archives et corpus, actualités scientifiques publications, etc.+ 1600 sources de données+ 60000 visiteurs uniques / mois   
  • 13. Participer à ISIDORE ?   
  • 14. Fonctionnement général (1) Référentiels Référentiels Données Données Données Données   
  • 15. Fonctionnement général (2) rechercheisidore.fr Référentiels Référentiels Collecte Traitements AccèsDonnées (crawl) (API et facettes) Référentiels OAI-PMH Normalisés (RDF/SKOS)Données RDFa Utilisateurs Enrichissement desDonnées des métadonnées et données (format pivot RDF) RSS SPARQL endpointDonnées Extension de recherche sur les catalogues de pour les producteurs bibliothèques (SRU/SRW - de données Z3950) Gestion, Monitoring, Statistiques
  • 16. Rameau Geonames (lieux) Pactols ISIDORE Lexvo (langues)Thésaurus W (SIAF) Référentiels OpenEdition HALSHS Calenda.org (personnes, (catégories) disciplines)
  • 17. Isidore dans le nuage du web sémantique
  • 18. Principes du projet- Implication des opérateurs SHS produisant des données (non-éditées, sources éditées, publications)- Utilisation de standards internationaux- Formats ouverts (indépendance vis à vis de fournisseurs de données)- Mise en valeur des données, métadonnées, référentiels structurés produits par les équipes.- Développement et mode de fonctionnement itératif   
  • 19. Aspects documentaires- ISIDORE collecte des métadonnées et indexe le texte intégral ou les données « embarquées » (IPTC ; XMP ; MS Word ; MS Excel ; ODT ; MPEG 7) - métadonnées (OAI-PMH + Dces / DC Terms) - actulités (RSS ; Atom) - données (RDFa = RDF dans une page web)   
  • 20. Aspects éditoriaux (1)- ISIDORE collecte tous les types de données (publications ; corpus ; actualités scientifiques) - Limportant dans ISIDORE : linformation - la question du « bibliographique »- Annuaire des sources : http://www.rechercheisidore.fr/annuaire- Ils participent : Open Edition ; Erudit ; Cairn ; Persee ; CCSD (HAL-SHS, MédiHAL) ; plate-forme de MSH ; UQAM ; UOH ; Cerimes ; Gallica/BNF ; ABES...   
  • 21. Aspects éditoriaux (2)-ISIDORE affecte aux métadonnées moissonnées des identifiants pérennes (handle) ce qui permet de citer les « notices » dISIDORE et donc les ressources - Si le producteur à déjà donné un id. pérenne (DOI, ark, handle, OAI) => ISIDORE peut ré-exposer celui du producteur - Dans tous les cas, les handle ISIDORE sont à votre disposition (producteurs, utilisateurs) => Cest un service gratuit   
  • 22. Alors ? Et vous ?   
  • 23. En tous cas, nous vous attendons dans ISIDORE... … et merci pour votre attention !