Spire Sciences Po Institutional Repository Journées d’étude sur les Archives Ouvertes Consortium Couperin, 3 avril 2009
Qu’est ce que Spire? Spire, Sciences Po Institutional REpository <ul><li>Spire est l’acronyme de « Sciences Po Intitutiona...
Qu’est ce que Spire? Spire, Sciences Po Institutional REpository <ul><li>La bibliothèque, la Direction Scientifique et la ...
Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>HAL du CCSD </li></ul><...
Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>Résolveur de liens </li...
Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>Archivage de grand volu...
Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository Peut on fusionner quelques proj...
Briques technologiques Spire, Sciences Po Institutional REpository Stockage et recherche : JackRabbit <ul><li>Protocole no...
Briques technologiques Spire, Sciences Po Institutional REpository Conversion XML vers Java : JibX <ul><li>OXM : Object XM...
Briques technologiques Spire, Sciences Po Institutional REpository Formats de métadonnées bibliographiques <ul><li>MarcXML...
Briques technologiques Spire, Sciences Po Institutional REpository Formats de personnes morales ou physiques <ul><li>Resea...
Briques technologiques Spire, Sciences Po Institutional REpository Moissonnage <ul><li>OAI-PMH </li></ul>Divers <ul><li>Ro...
Modèle de données Spire, Sciences Po Institutional REpository Structuration des Nodes de JackRabbit <ul><li>Item </li></ul...
Import des données Spire, Sciences Po Institutional REpository De Z39.50 à SRU <ul><li>Le protocole Z39.50 va petit à peti...
Import des données Spire, Sciences Po Institutional REpository Import HAL <ul><li>Utilisation de 3 WebServices </li></ul><...
Import des données Spire, Sciences Po Institutional REpository Moissonnage OAI-PMH <ul><li>Récupérer des publications par ...
Import des données Spire, Sciences Po Institutional REpository Enrichissement OpenURL <ul><li>Les résolveurs de liens peuv...
Import des données Spire, Sciences Po Institutional REpository Import CKB : Copyright Knowledge Base <ul><li>Implémentatio...
Import des données Spire, Sciences Po Institutional REpository Import LDAP <ul><li>Le LDAP n’est pas uniquement un système...
De Nereus à NEEO Spire, Sciences Po Institutional REpository Nereus <ul><li>Consortium européen pour les archives ouvertes...
De Nereus à NEEO Spire, Sciences Po Institutional REpository Work Package 5 : Metadata et Protocol <ul><li>Sélection de no...
De Nereus à NEEO Spire, Sciences Po Institutional REpository Work Package 5 : Metadata et Protocol <ul><li>Documentation t...
Envoi des publications dans HAL Spire, Sciences Po Institutional REpository Stratégie nationale importante <ul><li>Besoin ...
Liens avec les données brutes : Dataset Spire, Sciences Po Institutional REpository Les données quali et quanti doivent êt...
Demo d’un logiciel en cours de développement…  Spire, Sciences Po Institutional REpository Liens pour démo. Attention aux ...
Planning Spire, Sciences Po Institutional REpository Si tout va bien… <ul><li>Livraison du lot 1 (fin mai 2009) </li></ul>...
Upcoming SlideShare
Loading in...5
×

Spire : l'archive ouverte de Sciences Po

1,984

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,984
On Slideshare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
23
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Spire : l'archive ouverte de Sciences Po

  1. 1. Spire Sciences Po Institutional Repository Journées d’étude sur les Archives Ouvertes Consortium Couperin, 3 avril 2009
  2. 2. Qu’est ce que Spire? Spire, Sciences Po Institutional REpository <ul><li>Spire est l’acronyme de « Sciences Po Intitutional Repository », nom donné à l’Archive Ouverte de Sciences Po. </li></ul><ul><li>Initiée en 2005-2006 par la bibliothèque, suite à son adhésion au réseau Nereus </li></ul><ul><li>Accessible à l’adresse : http://spire.sciences-po.fr </li></ul><ul><li>2 200 références bibliographiques, principalement en économie </li></ul><ul><li>50% avec texte intégral </li></ul><ul><li>Utilise actuellement le logiciel Dspace 1.4 </li></ul>Sciences Po Intitutional REpository
  3. 3. Qu’est ce que Spire? Spire, Sciences Po Institutional REpository <ul><li>La bibliothèque, la Direction Scientifique et la Direction des Systèmes d’information de Sciences Po développent depuis février 2008 un nouveau logiciel d’Archive Ouverte dénommé Spire. </li></ul><ul><li>Ce logiciel est développé en Java. </li></ul><ul><li>La mise en production aura lieu fin mai 2009. </li></ul>Un nouveau logiciel d’Archive Ouverte
  4. 4. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>HAL du CCSD </li></ul><ul><li>Dspace </li></ul><ul><li>Fedora </li></ul><ul><li>ePrint </li></ul><ul><li>Castor </li></ul><ul><li>ORI-OAI </li></ul><ul><li>… </li></ul>Il existe déjà des solutions
  5. 5. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>Résolveur de liens </li></ul><ul><li>Intranet </li></ul><ul><li>Formation en ligne </li></ul><ul><li>Assistance en ligne </li></ul><ul><li>Sitothèque </li></ul><ul><li>Statistiques </li></ul><ul><li>Numérisation de masse </li></ul><ul><li>Portail documentaire </li></ul>N’y a t’il pas des projets plus prioritaires à la bibliothèque ? <ul><li>SIGB </li></ul><ul><li>OPAC </li></ul><ul><li>Site web </li></ul><ul><li>Accès distant </li></ul><ul><li>Bases de données et revues en ligne </li></ul><ul><li>Moteur de recherche fédéré </li></ul><ul><li>ERMS </li></ul><ul><li>Shibboleth </li></ul>
  6. 6. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository <ul><li>Archivage de grand volume de métadonnées et de fichiers </li></ul><ul><li>Moteur de recherche en texte intégral </li></ul><ul><li>Conversion de métadonnées </li></ul><ul><li>Moissonnage (OAI-PMH) </li></ul><ul><li>Recherche (Z39.50, SRU) </li></ul><ul><li>Dépôt (SWORD…) </li></ul><ul><li>Statistiques </li></ul><ul><li>SOA </li></ul>Quelles sont les problématiques récurrentes ?
  7. 7. Mais pourquoi développer un nouveau logiciel ? Spire, Sciences Po Institutional REpository Peut on fusionner quelques projets ? <ul><li>Archive Ouverte </li></ul><ul><li>Numérisation des dossiers de presse </li></ul><ul><li>Numérisation des ouvrages </li></ul><ul><li>Sitothèque </li></ul><ul><li>Produits documentaires </li></ul><ul><li>Gestion de références bibliographiques </li></ul><ul><li>Statistiques d’usage </li></ul><ul><li>Bibliométrie </li></ul>
  8. 8. Briques technologiques Spire, Sciences Po Institutional REpository Stockage et recherche : JackRabbit <ul><li>Protocole normé Java Content Repository JCR (JSR 170) </li></ul><ul><li>Système de stockage et de recherche </li></ul><ul><li>JackRabbit est l’implémentation de Référence du protocole JCR développé par la fondation Apache </li></ul><ul><li>Basé sur le moteur d’indexation Lucene </li></ul><ul><li>Différentes stratégie de stockage des données et des fichiers binaires : disque ou base de données (Oracle, MySQL, PostgreSQL…) </li></ul><ul><li>Possibilité de « clusteriser » plusieurs instance de JackRabbit </li></ul><ul><li>Fonctionnement testé jusqu’à 500 To </li></ul>
  9. 9. Briques technologiques Spire, Sciences Po Institutional REpository Conversion XML vers Java : JibX <ul><li>OXM : Object XML Mapping </li></ul><ul><li>Permet la conversion du Java vers XML (marshalling) et réciproquement (unmarshalling) </li></ul><ul><li>Une fois le mapping JibX développé et testé, il n’y aura plus d’erreur d’écriture et de lecture du XML. </li></ul><ul><li>Très bonne performance au niveau de la rapidité de conversion et de la faible consommation de mémoire. </li></ul>
  10. 10. Briques technologiques Spire, Sciences Po Institutional REpository Formats de métadonnées bibliographiques <ul><li>MarcXML </li></ul><ul><li>Mods </li></ul><ul><li>Qualified Dublin Core </li></ul><ul><li>RSS </li></ul><ul><li>TEF </li></ul><ul><li>UNIMARC </li></ul><ul><li>AOFR </li></ul><ul><li>Atom </li></ul><ul><li>ContextObject (OpenURL) </li></ul><ul><li>Crossref </li></ul><ul><li>Dublin Core </li></ul><ul><li>EndNote </li></ul><ul><li>Marc21 </li></ul>
  11. 11. Briques technologiques Spire, Sciences Po Institutional REpository Formats de personnes morales ou physiques <ul><li>ResearcherML </li></ul><ul><li>Vcard </li></ul><ul><li>FOAF </li></ul><ul><li>MADS </li></ul>Formats de classifications <ul><li>VDEX </li></ul>Formats d’objets complexes <ul><li>METS </li></ul><ul><li>DIDL </li></ul><ul><li>ORE-OAI </li></ul><ul><li>SCORM </li></ul>Formats de Préservation <ul><li>Premis </li></ul>Formats de statistique <ul><li>Sushi </li></ul><ul><li>SWUP </li></ul>Formats de Droit d’Auteur <ul><li>METS Rights </li></ul>
  12. 12. Briques technologiques Spire, Sciences Po Institutional REpository Moissonnage <ul><li>OAI-PMH </li></ul>Divers <ul><li>Romeo </li></ul><ul><li>HAL WebServices </li></ul><ul><li>LDAP </li></ul>Recherche <ul><li>Z39.50 (is dead) </li></ul><ul><li>SRU / SRW </li></ul>Dépôt <ul><li>SWORD </li></ul><ul><li>SRU Record update </li></ul>Protocoles
  13. 13. Modèle de données Spire, Sciences Po Institutional REpository Structuration des Nodes de JackRabbit <ul><li>Item </li></ul><ul><ul><li>Correspondant à la structure des objets complexes (METS, DIDL, OAI-ORE) </li></ul></ul><ul><ul><li>Permet de stocker n’importe quel type de métadonnée (Mods, ResearcherML, Vdex, LOM, DDI….) </li></ul></ul><ul><ul><li>Permet de stocker n’importe quel type de fichier </li></ul></ul><ul><li>Repository </li></ul><ul><ul><li>Contient la description du Dépôt. </li></ul></ul><ul><li>Classification </li></ul><ul><ul><li>Mini moteur d’ontologies </li></ul></ul>
  14. 14. Import des données Spire, Sciences Po Institutional REpository De Z39.50 à SRU <ul><li>Le protocole Z39.50 va petit à petit être remplacé par le protocole SRU. </li></ul><ul><li>SRU est un protocole moderne basé sur des technologies Web (HTTP, WebServices, XML) </li></ul><ul><li>Connexion aux catalogues de bibliothèques </li></ul><ul><ul><li>Soit directement si le SIGB implémente ce protocole </li></ul></ul><ul><ul><li>Soit par le Yaz Proxy (Z39.50 vers SRU) </li></ul></ul><ul><li>Connexion aux bases de données commerciales (ex JSTOR) </li></ul><ul><li>Récupérer les données d’autres instances de Spire, communication entre les archives. </li></ul>
  15. 15. Import des données Spire, Sciences Po Institutional REpository Import HAL <ul><li>Utilisation de 3 WebServices </li></ul><ul><li>Synchronisation des référentiels </li></ul><ul><ul><li>Laboratoires, affiliations, collections… </li></ul></ul><ul><ul><li>Revues </li></ul></ul><ul><ul><li>Projets ANR </li></ul></ul><ul><ul><li>… </li></ul></ul><ul><li>Récupération des publications déjà déposées dans HAL </li></ul>
  16. 16. Import des données Spire, Sciences Po Institutional REpository Moissonnage OAI-PMH <ul><li>Récupérer des publications par : </li></ul><ul><ul><li>collection </li></ul></ul><ul><ul><li>identifiant </li></ul></ul><ul><ul><li>intégralité </li></ul></ul><ul><li>Répliquer de façon synchrone d’autres Archives Ouvertes </li></ul><ul><li>Permettra la récupération les données de Spire v1 sous DSpace </li></ul>
  17. 17. Import des données Spire, Sciences Po Institutional REpository Enrichissement OpenURL <ul><li>Les résolveurs de liens peuvent permettre de compléter les métadonnées (ISSN, volume…) </li></ul><ul><li>Crossref permet de faire une requête OpenURL et à l’aide d’un petit paramètre de récupérer le DOI de la publication </li></ul><ul><li>Récupérer le texte intégral déjà en ligne </li></ul>
  18. 18. Import des données Spire, Sciences Po Institutional REpository Import CKB : Copyright Knowledge Base <ul><li>Implémentation du protocole REST de RoMEO (RoMEO API) </li></ul><ul><li>récupérer pour chaque éditeur sa politique de droit d’auteur dans le contexte des Archives Ouvertes </li></ul><ul><li>Uniquement RoMEO dans un premier temps. Le système allemand, espagnol et français par la suite… </li></ul>
  19. 19. Import des données Spire, Sciences Po Institutional REpository Import LDAP <ul><li>Le LDAP n’est pas uniquement un système d’authentification </li></ul><ul><li>Il permet aussi l’identification, ie la récupération d’information sur une personne physique ou morale. </li></ul><ul><li>Dans nos annuaires LDAP il y a nos chercheurs et leur affiliation. </li></ul><ul><li>Le LDAP est une sorte de liste d’autorités synchronisées avec le système d’information de l’université (DRH, Scolarité, Recherche…) </li></ul>
  20. 20. De Nereus à NEEO Spire, Sciences Po Institutional REpository Nereus <ul><li>Consortium européen pour les archives ouvertes en sciences économiques </li></ul><ul><li>Créé en 2003 </li></ul><ul><li>Projet pilote de portail pour les économistes avec le principe du moissonnage des partenaires </li></ul>NEEO <ul><li>Projet européen financé par la CE dans le cadre du projet eContentPlus de septembre 2007 à février 2010 </li></ul><ul><li>16 partenaires (Oxford, LSE, Tilburg, ULB, KU Leuven, Kiel, Dauphine, Toulouse 1…) </li></ul>
  21. 21. De Nereus à NEEO Spire, Sciences Po Institutional REpository Work Package 5 : Metadata et Protocol <ul><li>Sélection de normes pour : </li></ul><ul><ul><li>les métadonnées bibliographiques : Mods </li></ul></ul><ul><ul><li>les objets complexes : DIDL (en attendant OAI-ORE) </li></ul></ul><ul><ul><li>DAI : Digital Author Identifier (sans spécification précise) </li></ul></ul><ul><ul><li>Statistique d’usage : Profile SWUP du ContextObject (OpenURL) </li></ul></ul><ul><ul><li>NEEO Admin File : description du repository, des ses institutions et de ses auteurs (avec DAI) </li></ul></ul>Normes récupérées par Driver pour l’uniformisation des Archives Ouvertes européennes
  22. 22. De Nereus à NEEO Spire, Sciences Po Institutional REpository Work Package 5 : Metadata et Protocol <ul><li>Documentation technique : </li></ul><ul><ul><li>http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Technical%20guidelines.pdf </li></ul></ul><ul><ul><li>http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Usage%20metadata%20guidelines.pdf </li></ul></ul>
  23. 23. Envoi des publications dans HAL Spire, Sciences Po Institutional REpository Stratégie nationale importante <ul><li>Besoin d’une archive ouverte de référence pour les agences de financement de la recherche afin de contrôler la présence des publications en accès libre pour les projets financés. </li></ul><ul><ul><li>Regroupement des publications pour l’évaluation d’un projet ANR </li></ul></ul><ul><ul><li>Bientôt les projets européens? </li></ul></ul><ul><ul><li>Nos chercheurs et nos centres de recherches sont souvent affiliés au CNRS </li></ul></ul><ul><ul><li>Visibilité international: très bon classement dans le Web Ranking des Archives Institutionnelles </li></ul></ul>
  24. 24. Liens avec les données brutes : Dataset Spire, Sciences Po Institutional REpository Les données quali et quanti doivent être diffusées <ul><li>Deux formats utilisés dans les SHS: </li></ul><ul><ul><li>DDI (quali : comme les enquêtes et quanti : tableau de données) </li></ul></ul><ul><ul><li>SDMX (quanti, données macros) </li></ul></ul><ul><ul><li>NEEO a sélectionnée le Dataverse Network d’Harvard </li></ul></ul><ul><ul><li>Sciences Po souhaite utiliser son serveur Nesstar pour décrire ses données, puis envoyer les notices vers Dataverse en DDI </li></ul></ul><ul><ul><li>Faire un lien des publications vers les données </li></ul></ul><ul><ul><li>Objectif de 10 datasets de 10 chercheurs différents liés à 10 publications différentes sur l’archive ouverte. </li></ul></ul>
  25. 25. Demo d’un logiciel en cours de développement… Spire, Sciences Po Institutional REpository Liens pour démo. Attention aux bugs! <ul><li>http://spirepprd.sciences-po.fr/backoffice/ </li></ul><ul><li>http://spirepprd.sciences-po.fr/web/ </li></ul><ul><li> http://spirepprd.sciences-po.fr/dissemination/oaipmh2-publications.xml?verb=ListRecords&metadataPrefix=didl&set=NEREUS:NEEO </li></ul><ul><li> http://spirepprd.sciences-po.fr/dissemination/adminfile.rdf.xml </li></ul>
  26. 26. Planning Spire, Sciences Po Institutional REpository Si tout va bien… <ul><li>Livraison du lot 1 (fin mai 2009) </li></ul><ul><li>Lot 2: ajout de la bibliométrie (fin juin 2009) </li></ul><ul><li>Lot 3: numérisation des dossiers de presse (novembre 2009) </li></ul><ul><li>Lot 4: numérisation d’ouvrages </li></ul><ul><li>Lot 5: sitothèque </li></ul><ul><li>Lot 6: thèses en ligne </li></ul><ul><li>Lot 7: hébergement de produits documentaires </li></ul><ul><li>Lot 8: plateforme de gestion de référence bibliographique pour la communauté de Sciences Po (Etudiants, Chercheurs, …) </li></ul>
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×