Présentation réalisée par Simon Hodson, Programme Manager au JISC (Joint Information Systems Committee - Royaume-Uni) pour son intervention lors de la journée d'étude du 26 novembre 2012, organisée par le réseau des Urfist sur le thème de 30 ans de politiques d'information scientifique et technique.
1. lundi 26 novembre 201
Quatrième journée nationale du réseau des URFIS
UNIVERSITÉ DE PARIS-DIDEROT – Paris
La gestion des données de recherche: histoire des
politiques et défis actuels au Royaume-Uni
Simon Hodson
JISC Programme Manager, Managing Research Data
2. Qu’est-ce que c’est JISC?
Organisation pour promouvoir l’utilisation innovatrice des
technologies numériques et de l'information aux universités
britanniques.
– Janet: Réseau national de la recherche et de l'enseignement
– JISC Collections: achat de contenu numérique pour l'enseignement et la
recherche
– Centres de données pour les services numériques
– Services de conseil et de soutien (e.g. Centre de Conservation
Numérique) DCC http://www.dcc.ac.uk )
– Programmes et projets d’innovation (e.g. programme pour la gestion et
préservation des données de recherche)
JISC: http://www.jisc.ac.uk
3. Parcours de la présentation
1. Pourquoi promouvoir l’accès aux données de recherche et leurs
préservation?
2. Historique des politiques sur l’accès aux données de recherche et
trajectoires britanniques.
3. Activités de JISC: comment établir des services de gestion des
données de recherche à l’échelle institutionelle.
4. Comment former les professionels d’information et engager les
intérêts et motivations des chercheurs?
4. Politiques sur les données de recherche
Politique sur les données de recherche de la ‘Royal
Society’ Britannique
1663
Nullius in Verba
Ne prenez la parole de personne (sans preuve…)
Vérifiez toutes déclarations faites par un recours à des faits déterminés par
l'expérience
5. Rapport de la ‘Royal Society”
La Science: une entreprise ouverte
Étude sur ‘comment la conduite et la
communication de la science a besoin de
s'adapter à cette nouvelle ère de technologie de
l'information’.
La conclusion la plus importante est que les
données de recherche devraient être librement
accessibles.
‘En tant que première étape vers cette
ouverture intelligente, les données qui
soutiennent les conclusions d’un article de
revue scientifique doivent se faire
simultanément disponibles dans une base de
données accessible.
Nous sommes maintenant sur le point d'un objectif
réalisable: que toute la littérature scientifique soit
en ligne, et que l'ensemble des données soit
également en ligne et que les deux soient
interopérables.’
6. Pourquoi les politiques sur libre accès
aux données de recherche?
l’accès aux données de la recherche accroît le retour sur
l’investissement public dans ce domaine, il renforce la
liberté de l’investigation scientifique, il encourage la
diversité des études et opinions, il favorise de nouveaux
domaines d’activité et permet l’exploration de thèmes qui
n’avaient pas été envisagés par les chercheurs d’origine.
Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche
financée sur fonds publics, 2007
http://www.oecd.org/fr/science/politiquesscientifiquesettechnologiques/principesetlignes
directricesdelocdepourlaccesauxdonneesdelarecherchefinanceesurfondspublics.htm
7. Pourquoi les politiques sur la disponibilité
des données de recherche?
La disponibilité des données est une bonne chose pour la
recherche!
– Vérifier les résultats de la recherche
– Éviter la fraude scientifique
– La reproductibilité de la recherche est l'un des principes fondamentales de
la science.
– L'utilisation de données anciennes pour la recherche nouvelle peut
améliorer le retour sur investissement pour les organisations qui financent
la recherche.
– Les ‘Metastudies’ et des revues systématiques: la une plus grande valeur
statistique des résultats intégrés.
– Utilisation des données dans la recherche interdisciplinaire: les grandes
questions (environnement, société, santé) nécessitent de multiples
ensembles de données
8. Réutilisation des données:
poser de nouvelles questions
Le nombre d’articles basés sur la réutilisation des observations archivées par
le télescope spatial Hubble dépasse maintenant celui des articles basées sur
l'utilisation décrite dans la proposition initiale.
http://archive.stsci.edu/hst/bibliography/pubstat.html
9. Aperçu historique sur les politiques
des données de recherche
Research data policy developments
New ESRC policy
NERC data policy handbook New NERC policy
EPSRC policy
AHRC dataset requirements (c.1999)
Wellcome Trust policy
Edinburgh Uni policy
MRC policy STFC policy
BBSRC policy
ESRC data policy
CRUK
policy New MRC policy
1996 1998 2000 2002 2004 2006 2008 2010 2012 2014
RCUK good scientific practice OECD declaration
OECD principles RCUK common principles
& guidelines
RCUK good research conduct
UKRIO code of practice
Chart from Sarah Jones, DCC: Developments in Research Funder Data Policy, http://www.ijdc.net/index.php/ijdc/article/view/209
11. Politiques sur les données de recherche:
Principes des RCUK
RCUK (Conseils de recherche du Royaume Uni) ‘principes communes sur les données de
recherche’: http://www.rcuk.ac.uk/research/Pages/DataPolicy.aspx
1. Le bien public: les données de recherche financées par l'État sont produites dans l'intérêt
public et doivent être aisément accessibles avec le moins de restrictions possible
2. La planification de la conservation: les institutions et les chercheurs doivent mettre tout
en place au début du projet afin que les données soient bien conservées et utilisables
après la fin du projet.
3. Découverte: les métadonnées doivent être disponibles et à découvrir; les résultats publiés
doivent indiquer comment accéder aux données
4. Le traitement de données sensibles: les organisations et les projets de recherche
doivent avoir les politiques et pratiques robustes pour s'assurer du respect des contraintes
juridiques, éthiques et commerciales
5. Première utilisation: provision pour une période d'utilisation exclusive, pour permettre
aux équipes de recherche de publier les résultats
6. Reconnaissance: les utilisateurs des données doivent reconnaître les sources de
données et les termes et conditions d'accès
7. Le financement public: l'utilisation de fonds publics pour les infrastructures de gestion
des données de recherche est appropriée et doit être efficace et rentable.
12. EPSRC (CR ingénierie et sciences physiques)
Politique sur les données de recherche
Les organismes de recherche doivent avoir une politique sur les données de
recherche, ainsi que des activités de formation et d'appui. (i, iii)
Les données de recherche doivent être gérées efficacement et préservées tout au long du
cycle de recherche (viii)
Les organismes de recherche doivent maintenir un catalogue public des fonds de
données de recherche, avec des métadonnées adéquates et des identificateurs
permanents (v)
Les publications scientifique doivent indiquer comment les données de recherche peuvent
être consulté (ii)
Les données de recherche doivent être conservées pendant 10 ans à partir du
dernier utilisation (vii)
Les organismes de recherche peuvent utiliser les budgets appropriés pour financier la
gestion et conservation des données de recherche (ix)
Les organismes de recherche doivent avoir un plan pour la conformité en place le
1er mai 2012
Les organismes de recherche doivent être conforme le 1 May 2015
13. Pourquoi est la politique du EPSRC
si important?
Value of research grants awarded by RCUK members
in 2009-10
600 000
500 000
Amount in £000s
400 000
300 000
200 000
100 000
0
BBSR EPSR
AHRC
ESRC MRC NERC STFC
C C
RCUK members 58 463 402 837 135 009 530 040 249 275 120 532 120 429
Chart from Sarah Jones, DCC: Developments in Research Funder Data Policy, http://www.ijdc.net/index.php/ijdc/article/view/209
14. Principaux développements dans les politiques
des données de recherche
Toutes les principaux financeurs de recherche ont maintenant une politique
qui exige la disponibilité des données de recherche.
NERC (environnement naturel) et ESRC (sciences économiques et sociales)
continue à financer des centres de données.
NERC et ESRC primaient sur les responsabilités des chercheurs à préparer
un plan pour la gestion et conservation des données
BBSRC (technologies et sciences biologiques): suivre les conventions de la
discipline et déposer les données dans un centre de données / base de
données où l'on existe
AHRC (arts et sciences humaines) a cessé de financer le AHDS (service des
données pour les arts et sciences humaines), plaçant la responsabilité des
universités.
EPSRC (ingénierie et sciences physiques) ne finance pas un centre de
données, et laisse ainsi la responsabilité avec des universités.
15. Défis et trajectoires
Divergences entre politiques et pratiques…
– une politique est une chose, la pratique une autre…
– beaucoup de changements sont nécessaire avant que la vision des politiques ne devienne la
réalité…
Responsabilité croissante chez les organismes de recherche et universités pour
la gestion des données de recherche
– développer des compétences et de l'infrastructure
– conservation à long terme des données de recherche quand il n’y a pas un centre de données
(national ou international) pour ce type de données
– éviter atteinte à la réputation (e.g. s’il y a perte de données importantes ou protégées
– e.g. JISC Managing Research Data Programme
La publication des données qui font la preuve des conclusions scientifique
– établir des liens entre les articles de revue et les données
– la publication des données deviendra partie des la publication des conclusions dans les articles
de revue scientifique.
– e.g. Dryad
16. JISC programme
augmentation de la capacité institutionnelle
pour la gestion des données de recherche
Formation
5 projets
Infrastructures
et services
institutionnels
17 projets
Publication Planification
3 projects 10 projets
Deuxième programme sur la gestion des données de recherche, 2011-13: http://bit.ly/jiscmrd2009-
11
17. Éléments d'un service institutionnel
pour la gestion des données de recherche
Politiques et
‘feuilles de route’
Plan d’affaires /
Orientation et
comment soutenir
formation
le service
Catalogues de Planification
données et (pour la gestion
metadonnées des données)
Systèmes pour la
Dépôt / archive
gestion des
de données
données actives
Comment
sélectionner les
données?
18. University of Bath RDM Roadmap: http://www.bath.ac.uk/rdso/University-of-Bath-Roadmap-for-EPSRC.pdf
DCC Links to Roadmaps: http://www.dcc.ac.uk/resources/policy-and-legal/epsrc-institutional-roadmaps
19. Centre de Conservation Numérique
DCC (Centre de Conservation Numérique), un centre d’expertise: http://www.dcc.ac.uk/
Outils pour planifier la gestion des données
– DMPonline: outil pour préparer des plans pour la gestion des données: http://www.dcc.ac.uk/dmponline
– DAF et CARDIO: outils pour aider un institution à se préparer et mieux organiser la gestion des données
de recherche
Documents d'information et guides pratiques: http://www.dcc.ac.uk/resources/how-guides
Politiques institutionelles: http://www.dcc.ac.uk/resources/policy-and-legal/institutional-data-
policies/uk-institutional-data-policies
‘Feuilles de route’ pour la gestion des données: http://www.dcc.ac.uk/resources/policy-and-
legal/epsrc-institutional-roadmaps
International Digital Curation Conference, Amsterdam, 13-17 janvier 2013:
http://www.dcc.ac.uk/events/idcc13
20. Deux défis majeurs…
De nombreux défis importants:
– techniques (systèmes, stockage, metadonnées…)
– économique (comment payer!)
– formation, compétences
– culture
1. Comment former les professionnels d’information, bibliothécaires et
personnel de soutien?
2. Comment engager les intérêts et motivations des chercheurs?
21. Orientation et formation: recommandations
1. On a besoin de conseils accessibles et
Project Page:
simples à créer, stocker et gérer des http://www.lib.cam.ac.uk/p
données eservation/incremental/ind
x.html
• http://www.gla.ac.uk/services/datamanagemen
t/
• http://www2.le.ac.uk/services/research-data
• https://www.soton.ac.uk/library/research/resea
rchdata/index.shtml
2. Il faut offrir des ressources de formation
pratique avec des exemples spécifiques à
chaque discipline.
• http://bit.ly/JISCMRD02-RDMtrain
3. Connectez chercheurs avec le personnel de
soutien pour des conseils personnalisés et
des partenariats.
22. MANTRA Formation en ligne
University of Edinburgh
Cours en ligne sur les gestion des
données de recherche.
Les sections incluent:
– Comment planifier la gestion des
données de recherche?
– Comment organiser les données?
– Formats de fichiers, transformations
– Documentation et métadonnées
– Stockage et securité
– La protection des données sensibles
– Conservation des données
– Licence pour les utilisateurs
Des exercices pratiques pour les
utilisateurs de logiciels comme SPSS, R,
ArcGIS, Nvivo
Research Data MANTRA:
http://datalib.edina.ac.uk/mantra/
23. Rôles nouveaux pour les bibliothécaires?
Nouvelles compétences pour appuyer la recherche
Rapport pour RLUK (bibliothèques de
recherche du R-U): nouvelles compétences
pour appuyer la recherche
Les rôles des bibliothécaires
universitaires vont s'adapter.
Les bibliothécaires universitaires
joueront un rôle beaucoup plus important
dans le processus de recherche et en
particulier dans la gestion, la
conservation et la préservation des
données de recherche, et dans la
communication scientifique et à la
diffusion efficace des résultats de
recherche.
RLUK (Bibliothèques de recherche UK) / Mary Auckland,
Reskilling for Research http://www.rluk.ac.uk/content/re-
skilling-research
24. Nouvelles compétences pour appuyer la recherche
Trois plus importantes …
1. Aptitude à conseiller sur la préservation les résultats de la recherche (49% essentiel
dans 2 - 5 ans, 10% aujourd'hui)
2. Connaissances nécessaires pour conseiller sur la gestion et la conservation des
données de recherche, y compris informations sur le dépôt, la découverte, l'accès,
la diffusion, la conservation et la portabilité des données (48% essentiel dans 2 - 5
ans, 16% aujourd'hui)
3. Connaissances pour aider les chercheurs à se conformer aux divers politiques des
financeurs de recherche, y compris les exigences de libre accès (40% essentiel
dans 2 - 5 ans, 16% aujourd'hui)
25. Formation pour les bibliothécaires
et professionnels d’information
RDMRose Project: produire des cours d'apprentissage dans la gestion des
données de recherche adapté pour les rôles des bibliothécaires
universitaires (développement professionnel) ainsi que pour les cours pour
les professionnels de l'information (troisième cycle).
http://www.sheffield.ac.uk/is/research/projects
Sondage en ligne sur les roles des bibliothécaires dans la gestion des
données de recherche: http://rdmrose.blogspot.fr/2012/11/rdm-in-libraries-
survey.html
26. Comment engager les motivations des chercheurs?
Reconnaissance
Préoccupations des chercheurs:
– Que les données peuvent être mal utilisées ou mal comprises.
– Qu’ils perdront l’avantage professionnel et scientifique s’ils publient les
Reconnaissance
données avant de les exploiter pleinement.
– Le désir de conserver le contrôle d'un actif professionnel.
– Préoccupation que ne seront pas crédités pour leur contribution.
Reconnaissance
– Actuellement un manque de récompenses de carrière pour la publication
des données.
Rapport ODE: http://www.alliancepermanentaccess.org/wp-
content/uploads/downloads/2011/11/ODE-ReportOnIntegrationOfDataAndPublications-1_1.pdf
Rapport RIN, ‘To Share or not to share’, http://www.rin.ac.uk/our-work/data-management-and-curation/share-or-not-
share-research-data-outputs
27. Modification de la pratique de la communication savante
Dryad Archive de Données
Dryad dépôt de données de recherche: http://datadryad.org/
Permet aux chercheurs de publier des données liées à des articles de revue
scientifique.
Encourage les éditeurs à soutenir les bonnes pratiques.
Fournit une citation et un identificateur d'objet numérique pour les données.
Dryad is…
sans but lucratif
soutenu et régi par la collectivité qu'il dessert (membres, conseil d'administration)
accent mis actuellement sur les domaines de recherche biologique et médicale
systèmes de tarification sera annoncé au début de 2013
modèle d'entreprise durable
28. Merci de votre attention!
Premier JISC MRD Programme, 2009-11: http://bit.ly/jiscmrd2009-11
JISC MRD Page d’Informations: http://bit.ly/jiscmrd2009-11-outputs
Deuxième JISC MRD Programme, 2011-13: http://bit.ly/jiscmrd2011-13
Blog du programme: http://researchdata.jiscinvolve.org/
E-mail: s.hodson@jisc.ac.uk
Twitter: simonhodson99
29. Institutional data repositories
as an elevator for data collections
The Data Pyramid: taken from Royal Society Report, Science as an Open Enterprise:
http://royalsociety.org/policy/projects/science-public-enterprise/report/
30. Science as an Open Enterprise Report:
six key changes
1. a shift away from a research culture where data is viewed as a private
preserve;
2. expanding the criteria used to evaluate research to give credit for useful
data communication and novel ways of collaborating;
3. the development of common standards for communicating data;
4. mandating intelligent openness for data relevant to published scientific
papers;
5. strengthening the cohort of data scientists needed to manage and support
the use of digital data (which will also be crucial to the success of private
sector data analysis and the government’s Open Data strategy);
6. the development and use of new software tools to automate and simplify the
creation and exploitation of datasets.
Royal Society 2012, Science as an Open Enterprise,
http://royalsociety.org/policy/projects/science-public-enterprise/report/
31. Development of Institutional RDM Capacity
The Royal Society Science as an Open Enterprise report recommended that
the JISC Managing Research Data Programme ‘should be expanded beyond
the pilot 17 institutions within the next five years.’
[Royal Society 2012, Science as an Open Enterprise, p.73]
32. Journal Data Availability Policies
DNA and Protein Sequences
– Bermuda (1996) principles for immediate (pre-publication) sharing of human
genome data.
– Led to journal policies requiring data deposit making accession numbers for DNA
sequences a requirement in the late nineties (e.g. Nature, 1998).
Acceleration in numbers of journal data polices from 2004/5. Since 2010
becoming more widespread (subjects) and specific (requirements).
Dryad Joint Data Archiving Policy (2010): http://datadryad.org/jdap
– Joint declarations, Feb 2010, in American Naturalist, Evolution, the Journal of
Evolutionary Biology, Molecular Ecology, Heredity, and other key journals in
evolution and ecology: http://www.journals.uchicago.edu/doi/full/10.1086/650340
– This journal requires, as a condition for publication, that data supporting the results
in the paper should be archived in an appropriate public archive, such as GenBank,
TreeBASE, Dryad, or the Knowledge Network for Biocomplexity.
BioMed Central Journal Policies (2011-12)
– Twenty BMC journals adopted coordinated data policies ‘encourage or require
authors, as a condition of publication, to include in some article types a section that
provides a permanent link to the data supporting the results reported in the article’:
http://www.biomedcentral.com/about/supportingdata
33. JoRD
Research shows that journal data availability and sharing policies are
influential upon researcher data archiving.
– Piwowar HA (2011) Who Shares? Who Doesn't? Factors Associated with Openly Archiving Raw Research
Data. PLoS ONE 6(7): e18657; doi:10.1371/journal.pone.0018657
Useful for researchers, research support staff, data repository
managers, librarians and policy makers to have readily accessible
summary of journal policies (à la Sherpa RoMEO).
Feasibility study and analysis of business models for a registry
of journal research data availability and sharing policies:
http://jordproject.wordpress.com/