Corpus-IR : présentation générale - juillet 2012

  • 603 views
Uploaded on

Présentation générale de Corpus-IR (juillet 2012).

Présentation générale de Corpus-IR (juillet 2012).

More in: Business
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
603
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
2
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Très grande infrastructure de recherchepour les sciences de l’Homme et de la société www.corpus-ir.fr IN S H S
  • 2. Corpus-IR : objectifs scientifiquesCorpus-IR est une Très Grande Infrastructure de Recherche décidée par la feuille de route ESFRI de décembre 2008, crée en 2011, dont les missions sont :- de favoriser la Coopération des Opérateurs de Recherche Pour un Usage des Sources numériques en Sciences Humaines et Sociales.- de favoriser la consolidation, la mise en place de dispositifs collectifs pour la production de corpus (images, sons, textes).- de favoriser ladoption des bonnes pratiques méthodologiques, scientifiques et techniques en matière de traitement, diffusion, archivage des données numériques.
  • 3. Quest-ce que Corpus-IR ?Corpus IR est un dispositif de financement, de coopération et de mise en synergie pour la production de données à ladresse déquipes regroupés en consortiums et labellisés pour 4 ans (UMR, EA, UMS).La mission des consortiums est de :- Produire des corpus numériques (numérisation de fonds darchives, jeux de données, collections scientifiques, etc.).- Accompagner et favoriser la re-documentarisation de corpus numériques anciens.- Développer les synergies pour le développement de nouvelles façon dencodage des corpus dans le respect des standards internationaux 
  • 4. Organisation Actuellement : - 4 consortiums labellisés en  2011 (2 en Linguistique,  Littérature et philosophie,  Anthropologie). - 4 en cours de construction  pour 2012 : Musicologie,  Histoire médiévale,  Archéologie, Géographie. Un consortium = plusieurs  laboratoires ou équipes 
  • 5. OrganisationCorpus-IR regroupe :- 42 équipes/unités partenaires- 26 programmes de corpus de données en cours ou en train d’être lancés- 15 actions en cours ou en préparation (formations, guides de bonnes pratiques…) Photo par futurshape/flickr/cc-by-2.0Une organisation qui utilise les réseaux existants : 
  • 6. Fonctionnement Conseils,  évaluations Comité Conseil de  scientifiq pilotage ue Adresse les programmes Cellule  de  2) conseille,  direction labellise soutien Corpus- IR Finance via le  CNRS 1) Soumission  dun programme  dactions Définition dun  programme de  consortium
  • 7. Programme
  • 8. Quest-ce quun corpus ?- Ensemble de données (numériques) organisées pour faire de la recherche.- Il sagit dencourager la mise à disposition de corpus constitués de données.- quel que soit la nature des données : « papier », analogique, numérique. Photo : S. Pouyllau, CNRS 2008.
  • 9. Quest-ce quun corpus ?- fonds darchives- archives de chercheurs- archives de laboratoires- reportages photographiques- collections de bibliothèque 
  • 10. Constituer des corpus numériques ?Corpus-IR, avec les consortiums, souhaite : - Rendre plus accessible les données numériques non-éditées ou difficilement éditables.- Rendre plus facile la réutilisation des données scientifiques.- Éviter la perte de données dans un monde devenu numérique. Pub apple II, © Apple inc. 1977.
  • 11. Constituer des corpus numériques ?Méthodes issues de :La rechercheLarchivistique Recherche en sciencesLa documentation humaines DocumentLédition électronique ation IST Informatiq ueLe web Archives EditionLinformatique Cc-by-2.0 – 2003 Stéphane Pouyllau
  • 12. Constituer des corpus numériques ?- La définition des objectifs - Le danger de loutil pour loutil- Les méthodes mal adaptés- Des formations trop génériques- Des formations trop spécifiques Manuscrits dAmpère – CNRS/Académie des sciences  – 2007 www.ampere.cnrs.fr - domaine public
  • 13. Constituer des corpus numériques ?Corpus-IR encourage :- La ré-utilisation de plate-formes déjà existantes- Lutilisation de formats ouverts et documentés pour le codage des données- Les échanges entre les consortiums (q. juridiques, méthodologiques, techniques)- Le travail en réseau (en particulier sur les métiers ITA)
  • 14. Ex. daction inter-consortiums
  • 15. De nombreuses plate-formes déjà disponibles http://medihal.archives-ouvertes.fr - CCSD/CNRS
  • 16. De nombreuses plate-formes déjà disponibles http://medihal.archives-ouvertes.fr - CCSD/CNRS
  • 17. De nombreuses plate-formes déjà disponibles http://www.odsas.fr - CREDO/CNRS-EHESS-Aix Marseille Univ.
  • 18. De nombreuses plate-formes déjà disponibles http://www.cn-telma.fr - IRHT/CNRS
  • 19. De nombreuses plate-formes déjà disponibles http://www.arch.cn2sv.cnrs.fr - AOMS-CN2SV
  • 20. De nombreuses plate-formes déjà disponibles http://archeovision.cnrs.fr - ARCHEOVISION/CNRS
  • 21. De nombreuses plate-formes déjà disponibles http://cargos.tge-adonis.fr - CARGOS/MSH Dijon
  • 22. Standards, interopérabilité... favorise la diffusion http://bnsa.patrimoines.aquitaine.fr - BnSA/ Région Aquitaine
  • 23. Standards, interopérabilité... favorise la diffusion http://www.rechercheisidore.fr - TGE Adonis + CCSD / CNRS
  • 24. Corpus-IR Corpus-IR www.corpus-ir.fr Twitter : @corpusir Unité mixte de services 3534 CNRS/AMU IN S H S