Signalements, accès et mise à disposition des données numériques en SHS

703 views
605 views

Published on

Présentation d'Isidore, l'accès unifié aux données et métadonnées numériques des sciences humaines et sociales, créé par le TGE Adonis avec l'aide du CCSD

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
703
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
7
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • Hypothèses sur les modes accès - volumes des données - l'organisation des données - catégorisation des données
  • Signalements, accès et mise à disposition des données numériques en SHS

    1. 1. Signalement, accès, et mise à disposition desdonnées numériques de la recherche en SHS rechercheisidore.fr Stéphane POUYLLAU, Ingénieur de recherche au CNRS Directeur de Corpus-IR (UMS 3534) Responsable du projet ISIDORE - TGE Adonis Twitter @spouyllau – Email stephane.pouyllau@corpus-ir.fr
    2. 2. Adonis- Adonis est un très grand équipement pour lessciences humaines et sociales- Acteur de la feuille de route ESFRI (DARIAH)- Missions 2012-2015 : - Accès aux données et documents numérique des SHS (ISIDORE) - Grille de services : hébergement web ; stokage de données ; Archivage à long terme (OAIS / CINES-SIAF)- Site : www.tge-adonis.fr- Contact : contact@tge-adonis.fr
    3. 3. Corpus-IR- Corpus-IR (très grande Infrastructure de Recherche) est un réseau déquipes produisant des corpus numériques de sources : - Équipes (UMR, EA, etc.) - consortiums « disciplinaires » (mais pas que) - 12 consortiums à 15 consortiums - Financement de la production de corpus (numérisation ; documentation ; diffusion des données) - Points clés : qualité des métadonnées ; diffusion obligatoire des métadonnées ; diffusion selon des formats ouverts et normalisés (ISIDORE ; Gallica ; Europeana)
    4. 4. Corpus-IR- Acteur de la feuille de route ESFRI (CLARIN)- UMS 3534 (Aix Marseille Université et CNRS) ● Paris / Marseille- Contact : www.corpus-ir.fr
    5. 5. Des corpus... Isidore de Séville ? Mais de quoi parle-t-il ?
    6. 6. Photos : SP. 2006.
    7. 7. Photos : SP. 1999-2009.
    8. 8. Photos : SP. 2006.
    9. 9. Production de données « sources »- Sources ? Données et matériaux numériques – souvent non édités/éditables (coûts, place, droits)- Monde numérique (capteurs ; photos ; enregistrements ; GPS ; enquêtes en ligne ; numérisation de sauvegarde...)- Utilisation et ré-utilisation ? Reconnaissance du travail de collecte et de création de « corpus »- Valorisation des fonds documentaires
    10. 10. ISIDORE et les fonds darchivesMettre en place lenvironnement pour relier données de la recherche et publications- Faciliter ladministration de la preuve scientifiqueISIDORE est un outil pour les communautés scientifiquesISIDORE est un outil de signalement et daccès- Exposition générique des données- Importance de la qualité des métadonnéesISIDORE est un moteur de recherche ; un site web ; un point daccès à des métadonnnées enrichies et reliées aux publications scientifiques   
    11. 11. ISIDORE est un site web... avec « une » + de 1000 sources de données moissonnées + de 1.300.000 ressources indexés   
    12. 12. Quelques chiffresDébut du projet : mai 2009Ouverture : déc. 2010Version 1 : mars 2011Version 1.2 : déc. 2011Version 2 : sept. 2012+ 1.700.000 de ressources numériques : archives et corpus, actualités scientifiques publications, etc.+ 1600 sources de données+ 60000 visiteurs uniques / mois   
    13. 13. Participer à ISIDORE ?   
    14. 14. Fonctionnement général (1) Référentiels Référentiels Données Données Données Données   
    15. 15. Fonctionnement général (2) rechercheisidore.fr Référentiels Référentiels Collecte Traitements AccèsDonnées (crawl) (API et facettes) Référentiels OAI-PMH Normalisés (RDF/SKOS)Données RDFa UtilisateursDonnées Enrichissement des des métadonnées et données (format pivot RDF) RSS SPARQL endpointDonnées Extension de recherche sur les pour les producteurs catalogues de bibliothèques (SRU/SRW de données - Z3950) Gestion, Monitoring, Statistiques
    16. 16. Rameau Geonames (lieux) Pactols ISIDORE Lexvo (langues)Thésaurus W (SIAF) Référentiels OpenEdition HALSHS Calenda.org (personnes, (catégories) disciplines)
    17. 17. Isidore dans le nuage du web sémantique
    18. 18. Principes du projet- Implication des opérateurs SHS produisant des données (non-éditées, sources éditées, publications)- Utilisation de standards internationaux- Formats ouverts (indépendance vis à vis de fournisseurs de données)- Mise en valeur des données, métadonnées, référentiels structurés produits par les équipes.- Développement et mode de fonctionnement itératif   
    19. 19. Aspects documentaires- ISIDORE collecte des métadonnées et indexe le texte intégral ou les données « embarquées » (IPTC ; XMP ; MS Word ; MS Excel ; ODT ; MPEG 7) - métadonnées (OAI-PMH + Dces / DC Terms) - actulités (RSS ; Atom) - données (RDFa = RDF dans une page web)   
    20. 20. Aspects éditoriaux (1)- ISIDORE collecte tous les types de données (publications ; corpus ; actualités scientifiques) - Limportant dans ISIDORE : linformation - la question du « bibliographique »- Annuaire des sources : http://www.rechercheisidore.fr/annuaire- Ils participent : Open Edition ; Erudit ; Cairn ; Persee ; CCSD (HAL-SHS, MédiHAL) ; plate-forme de MSH ; UQAM ; UOH ; Cerimes ; Gallica/BNF ; ABES...   
    21. 21. Aspects éditoriaux (2)-ISIDORE affecte aux métadonnées moissonnées des identifiants pérennes (handle) ce qui permet de citer les « notices » dISIDORE et donc les ressources - Si le producteur à déjà donné un id. pérenne (DOI, ark, handle, OAI) => ISIDORE peut ré-exposer celui du producteur - Dans tous les cas, les handle ISIDORE sont à votre disposition (producteurs, utilisateurs) => Cest un service gratuit   
    22. 22. Alors ? Et vous ?   
    23. 23. En tous cas, nous vous attendons dans ISIDORE... … et merci pour votre attention !   

    ×