Corpus-IR : présentation générale - juillet 2012

1,059 views
889 views

Published on

Présentation générale de Corpus-IR (juillet 2012).

Published in: Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,059
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
6
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Corpus-IR : présentation générale - juillet 2012

  1. 1. Très grande infrastructure de recherchepour les sciences de l’Homme et de la société www.corpus-ir.fr IN S H S
  2. 2. Corpus-IR : objectifs scientifiquesCorpus-IR est une Très Grande Infrastructure de Recherche décidée par la feuille de route ESFRI de décembre 2008, crée en 2011, dont les missions sont :- de favoriser la Coopération des Opérateurs de Recherche Pour un Usage des Sources numériques en Sciences Humaines et Sociales.- de favoriser la consolidation, la mise en place de dispositifs collectifs pour la production de corpus (images, sons, textes).- de favoriser ladoption des bonnes pratiques méthodologiques, scientifiques et techniques en matière de traitement, diffusion, archivage des données numériques.
  3. 3. Quest-ce que Corpus-IR ?Corpus IR est un dispositif de financement, de coopération et de mise en synergie pour la production de données à ladresse déquipes regroupés en consortiums et labellisés pour 4 ans (UMR, EA, UMS).La mission des consortiums est de :- Produire des corpus numériques (numérisation de fonds darchives, jeux de données, collections scientifiques, etc.).- Accompagner et favoriser la re-documentarisation de corpus numériques anciens.- Développer les synergies pour le développement de nouvelles façon dencodage des corpus dans le respect des standards internationaux 
  4. 4. Organisation Actuellement : - 4 consortiums labellisés en  2011 (2 en Linguistique,  Littérature et philosophie,  Anthropologie). - 4 en cours de construction  pour 2012 : Musicologie,  Histoire médiévale,  Archéologie, Géographie. Un consortium = plusieurs  laboratoires ou équipes 
  5. 5. OrganisationCorpus-IR regroupe :- 42 équipes/unités partenaires- 26 programmes de corpus de données en cours ou en train d’être lancés- 15 actions en cours ou en préparation (formations, guides de bonnes pratiques…) Photo par futurshape/flickr/cc-by-2.0Une organisation qui utilise les réseaux existants : 
  6. 6. Fonctionnement Conseils,  évaluations Comité Conseil de  scientifiq pilotage ue Adresse les programmes Cellule  de  2) conseille,  direction labellise soutien Corpus- IR Finance via le  CNRS 1) Soumission  dun programme  dactions Définition dun  programme de  consortium
  7. 7. Programme
  8. 8. Quest-ce quun corpus ?- Ensemble de données (numériques) organisées pour faire de la recherche.- Il sagit dencourager la mise à disposition de corpus constitués de données.- quel que soit la nature des données : « papier », analogique, numérique. Photo : S. Pouyllau, CNRS 2008.
  9. 9. Quest-ce quun corpus ?- fonds darchives- archives de chercheurs- archives de laboratoires- reportages photographiques- collections de bibliothèque 
  10. 10. Constituer des corpus numériques ?Corpus-IR, avec les consortiums, souhaite : - Rendre plus accessible les données numériques non-éditées ou difficilement éditables.- Rendre plus facile la réutilisation des données scientifiques.- Éviter la perte de données dans un monde devenu numérique. Pub apple II, © Apple inc. 1977.
  11. 11. Constituer des corpus numériques ?Méthodes issues de :La rechercheLarchivistique Recherche en sciencesLa documentation humaines DocumentLédition électronique ation IST Informatiq ueLe web Archives EditionLinformatique Cc-by-2.0 – 2003 Stéphane Pouyllau
  12. 12. Constituer des corpus numériques ?- La définition des objectifs - Le danger de loutil pour loutil- Les méthodes mal adaptés- Des formations trop génériques- Des formations trop spécifiques Manuscrits dAmpère – CNRS/Académie des sciences  – 2007 www.ampere.cnrs.fr - domaine public
  13. 13. Constituer des corpus numériques ?Corpus-IR encourage :- La ré-utilisation de plate-formes déjà existantes- Lutilisation de formats ouverts et documentés pour le codage des données- Les échanges entre les consortiums (q. juridiques, méthodologiques, techniques)- Le travail en réseau (en particulier sur les métiers ITA)
  14. 14. Ex. daction inter-consortiums
  15. 15. De nombreuses plate-formes déjà disponibles http://medihal.archives-ouvertes.fr - CCSD/CNRS
  16. 16. De nombreuses plate-formes déjà disponibles http://medihal.archives-ouvertes.fr - CCSD/CNRS
  17. 17. De nombreuses plate-formes déjà disponibles http://www.odsas.fr - CREDO/CNRS-EHESS-Aix Marseille Univ.
  18. 18. De nombreuses plate-formes déjà disponibles http://www.cn-telma.fr - IRHT/CNRS
  19. 19. De nombreuses plate-formes déjà disponibles http://www.arch.cn2sv.cnrs.fr - AOMS-CN2SV
  20. 20. De nombreuses plate-formes déjà disponibles http://archeovision.cnrs.fr - ARCHEOVISION/CNRS
  21. 21. De nombreuses plate-formes déjà disponibles http://cargos.tge-adonis.fr - CARGOS/MSH Dijon
  22. 22. Standards, interopérabilité... favorise la diffusion http://bnsa.patrimoines.aquitaine.fr - BnSA/ Région Aquitaine
  23. 23. Standards, interopérabilité... favorise la diffusion http://www.rechercheisidore.fr - TGE Adonis + CCSD / CNRS
  24. 24. Corpus-IR Corpus-IR www.corpus-ir.fr Twitter : @corpusir Unité mixte de services 3534 CNRS/AMU IN S H S

×