Spire : l'archive ouverte de Sciences Po

2,699 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,699
On SlideShare
0
From Embeds
0
Number of Embeds
694
Actions
Shares
0
Downloads
28
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Spire : l'archive ouverte de Sciences Po

  1. 1. Spire Sciences Po Institutional Repository Journées d’étude sur les Archives Ouvertes Consortium Couperin, 3 avril 2009
  2. 2. Qu’est ce que Spire? Spire, Sciences Po Institutional REpository <ul><li>Spire est l’acronyme de « Sciences Po Intitutional Repository », nom donné à l’Archive Ouverte de Sciences Po. </li></ul><ul><li>Initiée en 2005-2006 par la bibliothèque, suite à son adhésion au réseau Nereus </li></ul><ul><li>Accessible à l’adresse : http://spire.sciences-po.fr </li></ul><ul><li>2 200 références bibliographiques, principalement en économie </li></ul><ul><li>50% avec texte intégral </li></ul><ul><li>Utilise actuellement le logiciel Dspace 1.4 </li></ul>Sciences Po Intitutional REpository
  3. 3. Qu’est ce que Spire? Spire, Sciences Po Institutional REpository <ul><li>La bibliothèque, la Direction Scientifique et la Direction des Systèmes d’information de Sciences Po développent depuis février 2008 un nouveau logiciel d’Archive Ouverte dénommé Spire. </li></ul><ul><li>Ce logiciel est développé en Java. </li></ul><ul><li>La mise en production aura lieu fin mai 2009. </li></ul>Un nouveau logiciel d’Archive Ouverte
  4. 4. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>HAL du CCSD </li></ul><ul><li>Dspace </li></ul><ul><li>Fedora </li></ul><ul><li>ePrint </li></ul><ul><li>Castor </li></ul><ul><li>ORI-OAI </li></ul><ul><li>… </li></ul>Il existe déjà des solutions
  5. 5. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>Résolveur de liens </li></ul><ul><li>Intranet </li></ul><ul><li>Formation en ligne </li></ul><ul><li>Assistance en ligne </li></ul><ul><li>Sitothèque </li></ul><ul><li>Statistiques </li></ul><ul><li>Numérisation de masse </li></ul><ul><li>Portail documentaire </li></ul>N’y a t’il pas des projets plus prioritaires à la bibliothèque ? <ul><li>SIGB </li></ul><ul><li>OPAC </li></ul><ul><li>Site web </li></ul><ul><li>Accès distant </li></ul><ul><li>Bases de données et revues en ligne </li></ul><ul><li>Moteur de recherche fédéré </li></ul><ul><li>ERMS </li></ul><ul><li>Shibboleth </li></ul>
  6. 6. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>Archivage de grand volume de métadonnées et de fichiers </li></ul><ul><li>Moteur de recherche en texte intégral </li></ul><ul><li>Conversion de métadonnées </li></ul><ul><li>Moissonnage (OAI-PMH) </li></ul><ul><li>Recherche (Z39.50, SRU) </li></ul><ul><li>Dépôt (SWORD…) </li></ul><ul><li>Statistiques </li></ul><ul><li>SOA </li></ul>Quelles sont les problématiques récurrentes ?
  7. 7. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository Peut on fusionner quelques projets ? <ul><li>Archive Ouverte </li></ul><ul><li>Numérisation des dossiers de presse </li></ul><ul><li>Numérisation des ouvrages </li></ul><ul><li>Sitothèque </li></ul><ul><li>Produits documentaires </li></ul><ul><li>Gestion de références bibliographiques </li></ul><ul><li>Statistiques d’usage </li></ul><ul><li>Bibliométrie </li></ul>
  8. 8. Briques technologiques Spire, Sciences Po Institutional REpository Stockage et recherche : JackRabbit <ul><li>Protocole normé Java Content Repository JCR (JSR 170) </li></ul><ul><li>Système de stockage et de recherche </li></ul><ul><li>JackRabbit est l’implémentation de Référence du protocole JCR développé par la fondation Apache </li></ul><ul><li>Basé sur le moteur d’indexation Lucene </li></ul><ul><li>Différentes stratégie de stockage des données et des fichiers binaires : disque ou base de données (Oracle, MySQL, PostgreSQL…) </li></ul><ul><li>Possibilité de « clusteriser » plusieurs instance de JackRabbit </li></ul><ul><li>Fonctionnement testé jusqu’à 500 To </li></ul>
  9. 9. Briques technologiques Spire, Sciences Po Institutional REpository Conversion XML vers Java : JibX <ul><li>OXM : Object XML Mapping </li></ul><ul><li>Permet la conversion du Java vers XML (marshalling) et réciproquement (unmarshalling) </li></ul><ul><li>Une fois le mapping JibX développé et testé, il n’y aura plus d’erreur d’écriture et de lecture du XML. </li></ul><ul><li>Très bonne performance au niveau de la rapidité de conversion et de la faible consommation de mémoire. </li></ul>
  10. 10. Briques technologiques Spire, Sciences Po Institutional REpository Formats de métadonnées bibliographiques <ul><li>MarcXML </li></ul><ul><li>Mods </li></ul><ul><li>Qualified Dublin Core </li></ul><ul><li>RSS </li></ul><ul><li>TEF </li></ul><ul><li>UNIMARC </li></ul><ul><li>AOFR </li></ul><ul><li>Atom </li></ul><ul><li>ContextObject (OpenURL) </li></ul><ul><li>Crossref </li></ul><ul><li>Dublin Core </li></ul><ul><li>EndNote </li></ul><ul><li>Marc21 </li></ul>
  11. 11. Briques technologiques Spire, Sciences Po Institutional REpository Formats de personnes morales ou physiques <ul><li>ResearcherML </li></ul><ul><li>Vcard </li></ul><ul><li>FOAF </li></ul><ul><li>MADS </li></ul>Formats de classifications <ul><li>VDEX </li></ul>Formats d’objets complexes <ul><li>METS </li></ul><ul><li>DIDL </li></ul><ul><li>ORE-OAI </li></ul><ul><li>SCORM </li></ul>Formats de Préservation <ul><li>Premis </li></ul>Formats de statistique <ul><li>Sushi </li></ul><ul><li>SWUP </li></ul>Formats de Droit d’Auteur <ul><li>METS Rights </li></ul>
  12. 12. Briques technologiques Spire, Sciences Po Institutional REpository Moissonnage <ul><li>OAI-PMH </li></ul>Divers <ul><li>Romeo </li></ul><ul><li>HAL WebServices </li></ul><ul><li>LDAP </li></ul>Recherche <ul><li>Z39.50 (is dead) </li></ul><ul><li>SRU / SRW </li></ul>Dépôt <ul><li>SWORD </li></ul><ul><li>SRU Record update </li></ul>Protocoles
  13. 13. Modèle de données Spire, Sciences Po Institutional REpository Structuration des Nodes de JackRabbit <ul><li>Item </li></ul><ul><ul><li>Correspondant à la structure des objets complexes (METS, DIDL, OAI-ORE) </li></ul></ul><ul><ul><li>Permet de stocker n’importe quel type de métadonnée (Mods, ResearcherML, Vdex, LOM, DDI….) </li></ul></ul><ul><ul><li>Permet de stocker n’importe quel type de fichier </li></ul></ul><ul><li>Repository </li></ul><ul><ul><li>Contient la description du Dépôt. </li></ul></ul><ul><li>Classification </li></ul><ul><ul><li>Mini moteur d’ontologies </li></ul></ul>
  14. 14. Import des données Spire, Sciences Po Institutional REpository De Z39.50 à SRU <ul><li>Le protocole Z39.50 va petit à petit être remplacé par le protocole SRU. </li></ul><ul><li>SRU est un protocole moderne basé sur des technologies Web (HTTP, WebServices, XML) </li></ul><ul><li>Connexion aux catalogues de bibliothèques </li></ul><ul><ul><li>Soit directement si le SIGB implémente ce protocole </li></ul></ul><ul><ul><li>Soit par le Yaz Proxy (Z39.50 vers SRU) </li></ul></ul><ul><li>Connexion aux bases de données commerciales (ex JSTOR) </li></ul><ul><li>Récupérer les données d’autres instances de Spire, communication entre les archives. </li></ul>
  15. 15. Import des données Spire, Sciences Po Institutional REpository Import HAL <ul><li>Utilisation de 3 WebServices </li></ul><ul><li>Synchronisation des référentiels </li></ul><ul><ul><li>Laboratoires, affiliations, collections… </li></ul></ul><ul><ul><li>Revues </li></ul></ul><ul><ul><li>Projets ANR </li></ul></ul><ul><ul><li>… </li></ul></ul><ul><li>Récupération des publications déjà déposées dans HAL </li></ul>
  16. 16. Import des données Spire, Sciences Po Institutional REpository Moissonnage OAI-PMH <ul><li>Récupérer des publications par : </li></ul><ul><ul><li>collection </li></ul></ul><ul><ul><li>identifiant </li></ul></ul><ul><ul><li>intégralité </li></ul></ul><ul><li>Répliquer de façon synchrone d’autres Archives Ouvertes </li></ul><ul><li>Permettra la récupération les données de Spire v1 sous DSpace </li></ul>
  17. 17. Import des données Spire, Sciences Po Institutional REpository Enrichissement OpenURL <ul><li>Les résolveurs de liens peuvent permettre de compléter les métadonnées (ISSN, volume…) </li></ul><ul><li>Crossref permet de faire une requête OpenURL et à l’aide d’un petit paramètre de récupérer le DOI de la publication </li></ul><ul><li>Récupérer le texte intégral déjà en ligne </li></ul>
  18. 18. Import des données Spire, Sciences Po Institutional REpository Import CKB : Copyright Knowledge Base <ul><li>Implémentation du protocole REST de RoMEO (RoMEO API) </li></ul><ul><li>récupérer pour chaque éditeur sa politique de droit d’auteur dans le contexte des Archives Ouvertes </li></ul><ul><li>Uniquement RoMEO dans un premier temps. Le système allemand, espagnol et français par la suite… </li></ul>
  19. 19. Import des données Spire, Sciences Po Institutional REpository Import LDAP <ul><li>Le LDAP n’est pas uniquement un système d’authentification </li></ul><ul><li>Il permet aussi l’identification, ie la récupération d’information sur une personne physique ou morale. </li></ul><ul><li>Dans nos annuaires LDAP il y a nos chercheurs et leur affiliation. </li></ul><ul><li>Le LDAP est une sorte de liste d’autorités synchronisées avec le système d’information de l’université (DRH, Scolarité, Recherche…) </li></ul>
  20. 20. De Nereus à NEEO Spire, Sciences Po Institutional REpository Nereus <ul><li>Consortium européen pour les archives ouvertes en sciences économiques </li></ul><ul><li>Créé en 2003 </li></ul><ul><li>Projet pilote de portail pour les économistes avec le principe du moissonnage des partenaires </li></ul>NEEO <ul><li>Projet européen financé par la CE dans le cadre du projet eContentPlus de septembre 2007 à février 2010 </li></ul><ul><li>16 partenaires (Oxford, LSE, Tilburg, ULB, KU Leuven, Kiel, Dauphine, Toulouse 1…) </li></ul>
  21. 21. De Nereus à NEEO Spire, Sciences Po Institutional REpository Work Package 5 : Metadata et Protocol <ul><li>Sélection de normes pour : </li></ul><ul><ul><li>les métadonnées bibliographiques : Mods </li></ul></ul><ul><ul><li>les objets complexes : DIDL (en attendant OAI-ORE) </li></ul></ul><ul><ul><li>DAI : Digital Author Identifier (sans spécification précise) </li></ul></ul><ul><ul><li>Statistique d’usage : Profile SWUP du ContextObject (OpenURL) </li></ul></ul><ul><ul><li>NEEO Admin File : description du repository, des ses institutions et de ses auteurs (avec DAI) </li></ul></ul>Normes récupérées par Driver pour l’uniformisation des Archives Ouvertes européennes
  22. 22. De Nereus à NEEO Spire, Sciences Po Institutional REpository Work Package 5 : Metadata et Protocol <ul><li>Documentation technique : </li></ul><ul><ul><li>http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Technical%20guidelines.pdf </li></ul></ul><ul><ul><li>http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Usage%20metadata%20guidelines.pdf </li></ul></ul>
  23. 23. Envoi des publications dans HAL Spire, Sciences Po Institutional REpository Stratégie nationale importante <ul><li>Besoin d’une archive ouverte de référence pour les agences de financement de la recherche afin de contrôler la présence des publications en accès libre pour les projets financés. </li></ul><ul><ul><li>Regroupement des publications pour l’évaluation d’un projet ANR </li></ul></ul><ul><ul><li>Bientôt les projets européens? </li></ul></ul><ul><ul><li>Nos chercheurs et nos centres de recherches sont souvent affiliés au CNRS </li></ul></ul><ul><ul><li>Visibilité international: très bon classement dans le Web Ranking des Archives Institutionnelles </li></ul></ul>
  24. 24. Liens avec les données brutes : Dataset Spire, Sciences Po Institutional REpository Les données quali et quanti doivent être diffusées <ul><li>Deux formats utilisés dans les SHS: </li></ul><ul><ul><li>DDI (quali : comme les enquêtes et quanti : tableau de données) </li></ul></ul><ul><ul><li>SDMX (quanti, données macros) </li></ul></ul><ul><ul><li>NEEO a sélectionnée le Dataverse Network d’Harvard </li></ul></ul><ul><ul><li>Sciences Po souhaite utiliser son serveur Nesstar pour décrire ses données, puis envoyer les notices vers Dataverse en DDI </li></ul></ul><ul><ul><li>Faire un lien des publications vers les données </li></ul></ul><ul><ul><li>Objectif de 10 datasets de 10 chercheurs différents liés à 10 publications différentes sur l’archive ouverte. </li></ul></ul>
  25. 25. Demo d’un logiciel en cours de développement… Spire, Sciences Po Institutional REpository Liens pour démo. Attention aux bugs! <ul><li>http://spirepprd.sciences-po.fr/backoffice/ </li></ul><ul><li>http://spirepprd.sciences-po.fr/web/ </li></ul><ul><li> http://spirepprd.sciences-po.fr/dissemination/oaipmh2-publications.xml?verb=ListRecords&metadataPrefix=didl&set=NEREUS:NEEO </li></ul><ul><li> http://spirepprd.sciences-po.fr/dissemination/adminfile.rdf.xml </li></ul>
  26. 26. Planning Spire, Sciences Po Institutional REpository Si tout va bien… <ul><li>Livraison du lot 1 (fin mai 2009) </li></ul><ul><li>Lot 2: ajout de la bibliométrie (fin juin 2009) </li></ul><ul><li>Lot 3: numérisation des dossiers de presse (novembre 2009) </li></ul><ul><li>Lot 4: numérisation d’ouvrages </li></ul><ul><li>Lot 5: sitothèque </li></ul><ul><li>Lot 6: thèses en ligne </li></ul><ul><li>Lot 7: hébergement de produits documentaires </li></ul><ul><li>Lot 8: plateforme de gestion de référence bibliographique pour la communauté de Sciences Po (Etudiants, Chercheurs, …) </li></ul>

×