Open Science, Open Access, Science2.0 : de nouvelles modalités pour la communication scientifique
Open Science, Open Access,
Science 2.0
Les nouvelles modalités de la communication
scientifique
Julien Sicot <julien.sicot@univ-rennes2.fr>
Stage URFIST
1er juin 2010
mercredi 2 juin 2010 1
Les grandes évolutions de la
communication scientifique
1970 2002
2009
Bases de données Budapest Open
Web sémantique
1948 e-mails Access Initiative
Échanges Request For 1989 Linked data
Vannevar Bush Le Web Green and Gold
épistolaires Comments Data repositories
le Memex Tim Bernes-Lee Roads
1665 1963 1975 1991
2004
Invention de la revue scientifique Eugène Garfield Facteur ArXiv
Google
H. Oldenburg : Philosophical Science Citation d’Impact Premier
Transactions of the Royal Society serveur de Scholar
Index
(London) preprints
Marin Mersenne. Journal des savants
(Paris)
D’après Gabriel Gallezot et al., “Chercheurs 2.0 ?,” Les Cahiers du numérique 5, no. 2 (Juin 15, 2009): 15-32,
http://archivesic.ccsd.cnrs.fr/sic_00396278/en/
mercredi 2 juin 2010 3
Acteurs de la recherche
• Chercheurs, équipes, laboratoires
• Financeurs de la Recherche (acteurs institutionnels :
universités et bibliothèques, agences nationales, acteurs
privés)
• Acteurs éditoriaux (éditeurs scientifiques : “Big Four” :
Elsevier, Springer Verlag, Blackwell-Wiley, Thomson
Scientific)
• Diffuseurs (Agences d’abonnement, agrégateurs, portails,
moteurs de recherche (Google Scholar, Books /
Microsoft),
serveurs de bases de données
bibliographiques)
mercredi 2 juin 2010 4
Le cycle de la Recherche
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 5
Journée type du chercheur
50% administratif, 50% enseignement, 50% recherche !
• Navigation internet (veille) / recherche documentaire / lecture
d’articles scientifiques
• Vérification dates prochaines conférences / Organisation de
colloques, de communications
• Réfléchir à d’éventuelles hypothèses de recherche / Trouver des
financements / répondre à des appels à projet
• Relations avec ses pairs / collaborateurs / partenaires
• Activités pédagogiques (cours, etc)
• Participation aux referees d’articles
• Aspects politiques, groupes de travail, vie universitaire, etc...
mercredi 2 juin 2010 6
Le cycle de l’Information scientifique
D’après G. Gallezot
Bases
bibliographiques
Banques de
données
Collecte
Revues, ouvrages Recherche de documents
Colloques
Extraction d’information
Archives ouvertes
Sites web
Listes de discussion - Activité cognitive
Bibliothèques du chercheur
Diffusion de Traitement de - Manipulation par
…
document l’information des outils
informatiques
Production de Construction de
documents connaissance
Production d’information
mercredi 2 juin 2010 7
La cycle de la Revue
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 8
Fonctions remplies par la revue
• Aujourd’hui = principal vecteur de l’IST
• Diffusion des résultats de recherche
• Garant de la qualité de la recherche “en
amont” (autorité, peer-reviewing)
• Constitution d’une mémoire scientifique
(archives pérennes)
• Évaluation des chercheurs “en aval” (OST,
AERES, citations, h-index, classements, etc)
mercredi 2 juin 2010 9
Nbre d’articles par discipline et par an
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 10
Une croissance exponentielle
• + de 25 000 titres de revues
• 1,5 Millions d’articles publiés par an (2,5 Millions en 2004)
• Sur la totalité des chercheurs, 90% sont en vie aujourd’hui
• 2000 éditeurs
• 3% de croissance / an
• 1 millions d’auteurs (chercheurs)
• 10 à 15 millions de lecteurs dans plus de 10000 institutions
mercredi 2 juin 2010 11
Croissance des revues à comité de
lecture depuis 1665
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 12
Corrélation entre augmentation nombres
de chercheurs, revues et articles
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 13
Vers le e-only ?
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 14
Le big deal
• 39% (780) des éditeurs basés en Europe = 49% de la
production d’articles = puissant lobby
• Big 3 = 80% du marché STM (Thomson Reuters $2.639,
Reed Elsevier $1.764, Wolters Kluwer $1.158) Other
$1.250 Total : $6.811
• Augmentation du prix des périodiques : +10% par an de
1975 à 2000 (de 1975 à 1995 +300%)
• Depuis 2000, inflation annuelle de 6 à 8% en moy.
mercredi 2 juin 2010 15
Ghost writing
"... during key marketing periods as many as 40% of published
articles focusing on specific drugs are ghost managed"
Sismondo S. « Ghost Management: How Much of the Medical Literature Is Shaped Behind
the Scenes by the Pharmaceutical Industry? ». PLoS Med [En ligne]. 2007,Vol. 4, n°9, p. e286.
Disponible sur : < http://dx.doi.org/10.1371/journal.pmed.0040286 > (consulté le 30 Mai,
2010)
mercredi 2 juin 2010 17
Des résultats erronés
"Simulations show that for most study designs and settings, it is more
likely for a research claim to be false than true. Moreover, most study
designs and settings, it is more likely for a research claim to be false
than true. Moreover, for many current scientific fields, claimed research
findings may often be simply accurate measures of the prevailing bias."
Ioannidis JPA. « Why Most Published Research Findings Are False ». PLoS Med [En
ligne]. 2005,Vol. 2, n°8, p. e124. Disponible sur : < http://dx.doi.org/10.1371/
journal.pmed.0020124 > (consulté le 30 Mai, 2010)
mercredi 2 juin 2010 18
Fake journals
Source : http://www.the-scientist.com/blog/display/55671/ et http://www.the-scientist.com/blog/display/55679/
mercredi 2 juin 2010 19
“Duplicate articles”
Mounir Errami et Harold Garner, “A tale of two citations,” Nature 451, no. 7177 (Janvier 24, 2008): 397-399, http://dx.doi.org/
10.1038/451397a.
mercredi 2 juin 2010 20
Vers de nouvelles pratiques ?
Source: Mark Ware et Michael Mabe, The stm report : An overview of scientific and scholarly journals publishing
(Oxford, United Kingdom: STM: International Association of Scientific, Technical and Medical Publishers, Septembre 2009).
mercredi 2 juin 2010 21
Et l’évaluation scientifique ?
2 types d’évaluation :
• En amont, qualitative, par les pairs = peer
reviewing
• En aval, quantitative, par les citations des pairs
D’après P. Mounier et G. Gallezot
mercredi 2 juin 2010 22
Évaluer l’activité recherche ?
• Pour qui ? Le pilotage (DGES, universités…) : orientation de la prod.
Scientifique, répartition budgétaire, recrutement…
• Comment ? Quels référentiels ? Quels
indicateurs ?
• Qui, quoi ?
programmes…
Les chercheurs, les établissements, les revues, les
• Par qui ? OST, AERES, CNU, Universités…
mercredi 2 juin 2010 23
Évaluer l’activité
recherche?
• Un modèle prégnant et valeur de cette publication par la
Publication (article de revue)
mesure des citations « reçues » par d’autres publications
(bibliométrie)
• Un modèle dominant (STM) et quasi monopole
de l’analyse et du référentiel (ISI - Institute of
Scientific Information, Groupe U.S. Thomson
Reuters)
d’après G. Gallezot
mercredi 2 juin 2010 24
Le facteur d’impact
• Concerne les revues scientifiques
• Fréquence annuelle moyenne de citation des articles d’un journal
donné, estimé sur les 2 années précédentes
• Calculé par l’ISI à partir de la base JCR (Journal Citations Report)
- Statistiques de citation et facteur d’impact des principales revues en
science
- Corpus de + de 7600 revues, les plus citées au monde (nombreuses
revues françaises absentes)
• Limites :
- Contrainte de durée (2 ans)
- % de revues sur la base de données ISI
- Indice de visibilité des revues et non des articles
mercredi 2 juin 2010 25
Le facteur d’Impact
Créé en 1960 par Eugene Garfield (ISI)
citations / articles
2008 2006 et 2007
IF=5
Les articles publiés en 2006/07
ont été cités en moyenne 5 fois en 2008.
D’après Björn Brembs
mercredi 2 juin 2010 26
L’index-H
• Créé par J. Hirsh
(université de Californie à
San Diego)
• Mesure des citations au
niveau du chercheur
• Le nombre h d'articles de
l'auteur qui ont été cités
au moins h fois chacun
Source : http://fr.wikipedia.org/wiki/Indice_h
mercredi 2 juin 2010 27
L’évaluation en question
• Problème des critères quantitatifs d’évaluation de la
recherche : Nombre de publications dans les revues internationales « peer-reviewed »,
facteur d’impact
• Déséquilibre structurel en France, GB et Allemagne :
➡ Problème du différentiel de publication entre chercheurs français et anglais, du classement de
Shanghai
➡ Problème de visibilité de la recherche
• Quelle explication ? Poids écrasant des « Big 4 » de
l’édition scientifique
• Aujourd’hui : la performance bibliométrique l’emporte sur
la découverte scientifique !
mercredi 2 juin 2010 28
Les biais du facteur
d’impact
Source : PhD Comics : http://www.phdcomics.com/comics.php?n=1108
A lire : Gingras Y. « La fièvre de l’évaluation de la recherche – Du mauvais usage de faux
indicateurs ». Bulletin de méthodologie sociologique [En ligne]. 1 Octobre 2008, n°100,
p. 42-44. Disponible sur : < http://bms.revues.org/index3313.html > (consulté le 30
Mai, 2010)
mercredi 2 juin 2010 29
“Le durcissement actuel de l'évaluation de
l’activité scientifique n’est-il pas un frein majeur à
l’ouverture des systèmes de lecture et d’écriture
des travaux scientifiques ?”
Broudoux E, Chartron G. « La communication scientifique face au Web2.0 : Premiers constats
et analyse ». In : H2PTM [En ligne]. [s.l.] : Hermès Science - Lavoisier, 2009. p. 323-336.
Disponible sur : < http://archivesic.ccsd.cnrs.fr/sic_00424826/en/ >
mercredi 2 juin 2010 30
Quelques anomalies
• Barrière technologique : comment jongler entre les
multiples outils/ressources ?
• Barrière économique : Coût de l’IST, les
bibliothèque ne sont pas abonnées à toutes les
bases et revues
• Barrière juridique : Editeur détenteur du copyright
=> ne facilite pas la créativité /réutilisation /
l’exploitation des contenus. Obstacle au partage et à
la collaboration
Parrini M. barriers, 2007. Disponible sur : < http://www.flickr.com/photos/remuz78/463810013/ >
mercredi 2 juin 2010 31
Crise(s) ?
Vers un épuisement des modèles classiques
• Crise de l’édition scientifique (copyright, scandales,
concentration, augmentation des coût, nouveaux modèles de publications,
l’article n’est pas le seul support de l’IST)
• Crise du chercheur (individualisme & impersonnalité de la
recherche ? Concurrence, compétition, “publish or perish”, mutations
profondes des pratiques, etc.)
• Crise de l’évaluation (diktat “publish or perish” (encore),
Shanghai, biais du facteur d’impact, facéties de la bibliométrie, etc.)
mercredi 2 juin 2010 32
Vers une e-Science ?
Nouvelles formes de publication : Open Access,
Archives Ouvertes et Revues en libre accès
Nouvelles pratiques de la recherche : Science 2.0,
Open Science, Open data
Nouvelles formes d’évaluation : Open peer
reviewing, facteurs d’usages, etc
mercredi 2 juin 2010 33
Le Libre accès : repères
historiques
• 1991 : naissance d’ArXiv = 1er serveur de preprints
• 1999 : naissance du mouvement Open Archives Initiative
(OAI)
• 2002 : Budapest Open Access Initiative (BOAI)
• 2003 : Déclaration de Berlin
• 2006 : en France, signature d’un accord inter-établissements
• 2009 : Berlin 7 > 9 universités françaises signent la
déclaration de Berlin pour le libre accès à la littérature
scientifique
mercredi 2 juin 2010 35
BOAI
Fondements de l’Open Access
• Une définition : « Le libre accès à la littérature scientifique est sa mise
à disposition gratuite sur l’Internet public, permettant à tout un chacun de lire,
télécharger, copier, transmettre, imprimer (…), ou s’en servir à toute autre fin
légale, sans barrière financière, légale ou technique autre que celles
indissociables de l’accès et l’utilisation d’Internet. » (d’après Libre Accès Inist).
• Deux stratégies (2 voies)
• La voie verte (Green road – BOAI 1) : l’auto-archivage des
publications par les chercheurs
• La voie dorée (Gold road – BOAI 2) : la publication d’articles dans des
revues en libre accès
mercredi 2 juin 2010 36
• H. Varmus <http://seedmagazine.com/
content/article/science_2.0_pioneers/>
“True “open access” is different from “public access.” It
means that the author holds the copyrights, that the journal
places the work immediately and freely in the public domain
under a Creative Common license or something equivalent
to it, and that the work is in public libraries and available for
all kinds of reasonable use, as long as attribution is
maintained.”
mercredi 2 juin 2010 37
La déclaration de Berlin
La déclaration de Berlin date de 2003 et a été signée à ce jour
par plus de 300 institutions scientifiques majeures dans le monde.
Étape clé dans le développement libre accès = implication des
principaux organismes de recherche Européens signataires qui
s’engagent à :
« promouvoir un Internet qui soit un instrument fonctionnel au service
d’une base de connaissance globale et de la pensée humaine »,
et à définir « des mesures (…) à envisager par les responsables
politiques en charge de la science, les institutions de recherche, les
agences de financement, les bibliothèques, les archives et les musées. »
mercredi 2 juin 2010 38
Les archives ouvertes
La communication scientifique directe
• La parabole d’Harnad
• La solution : promouvoir chez les chercheurs le processus d’auto-
archivage des pré-publications et post-publications sur des
serveurs dédiés à cet effet.
• « Archive, repository » synonymes d’« entrepôt / réservoir de
données » où sont déposées des données issues de la recherche
scientifique et de l’enseignement et dont l’accès se veut ouvert,
c’est à dire sans barrières (techniques, économiques,
juridiques) …»
• Architecture technique distribuée et interopérable (OAI-PMH)
mercredi 2 juin 2010 39
Accès restreint -- Impact Restreint
LE CYCLE D’IMPACT
DÉMARRE : Le chercheur écrit
La recherche se fait le « prétirage » de
son article
Le prétirage est
soumis à une revue
Le prétirage est évalué
12-18 Mois
par un comité de lecture
Le prétirage corrigé par l’auteur
devient un «post-tirage»
Le post-tirage est accepté,
validé et publié par une revue
Les autres chercheurs
ne peuvent accéder au
post-tirage que si leur
université est abonnée NOUVEAUX CYCLES
à la revue où il est D’IMPACT : les nouvelles
D’après S. HARNAD publié recherches s’appuient sur
les recherches précédentes
mercredi 2 juin 2010 40
Accès maximal - Impact maximal
LE CYCLE D’IMPACT Le chercheur écrit
DÉMARRE : le « prétirage » de
La recherche se fait son article Le pré-tirage est
auto-archivé sur le
site Web de
l’établissement où
travaille le chercheur
Le prétirage est soumis
à une revue
Le prétirage est évalué Le post-tirage est publié
12-18 Mois
par un comité de lecture dans une revue à accès libre
Le prétirage corrigé ou auto-archivé
par l’auteur: devient un sur le site Web de
« post-tirage » l’établissement du chercheur
Le post-tirage est accepté,
validé et publié par la revue
NOUVEAUX CYCLES D’IMPACT
L’impact scientifique des
articles de recherche libres
d’accès s’accroît et s’accélère
grâce à l’augmentation de
Les autres chercheurs ne l’accès
peuvent accéder au post-
tirage que si leur université
est abonnée NOUVEAUX CYCLES D’IMPACT :
Les nouvelles recherches s’appuient
D’après S. HARNAD
sur les recherches précédentes
mercredi 2 juin 2010 41
Les Archives ouvertes :
bénéfice pour le chercheur
• Disposer d’un moyen de communication scientifique directe et rapide : une
mise en ligne simple et rapide des résultats de la recherche
• Accéder à un corpus scientifique ouvert et accessible
• Améliorer son audience et sa visibilité face à ses pairs et ses sources de
financement (L’impact d’une publication est accru de manière substantielle si celle-ci est accessible
librement sur le Web ? S. Lawrence)
• Disposer d´études d´impact sur ces publications récentes
• Augmenter le cycle de vie d’un article au-delà de la publication dans une
revue : e-publication
• Garantir l’archivage à long terme et la citation électronique : URLs pérennes
mercredi 2 juin 2010 46
Les éditeurs et AO
• Liste ROMEO/SHERPA (UK) sur la politique éditoriale (copyright) de 686
éditeurs
• Elle recense les possibilités de mise sur le web (donc d’auto-archiver) des
articles scientifiques par éditeurs.
• Les revues blanches : celles dont les éditeurs n'ont pas de politique formelle autorisant
l'auto-archivage
• Les revues jaunes : autorisent l'auto-archivage des pré-publications (avant les révisions
par le comité de lecture)
• Les revues bleues : autorisent l'auto-archivage des post-publications (version finale
après révision)
• Les revues vertes : autorisent l'auto-archivage des pré- ET des postpublications
• Liste JULIET/SHERPA (UK) politiques des “financeurs »
mercredi 2 juin 2010 47
Rechercher dans les AO
• Identifier les archives ouvertes (+ de 1400 dans le monde)
• L’OpenDOAR : The Directory of Open Access Repositories http://www.opendoar.org/index.html
• Registry of Open Access Repositories (ROAR) http://roar.eprints.org/
• Rechercher des articles scientifiques à l’aide des moissonneurs
(harvesters) = « moteurs pour les archives ouvertes »
• OAIster http://www.oaister.org (versé dans le WorldCat depuis 2009)
• Scientific Commons http://www.scientificcommons.org
• Driver (Digital Repository Infrastructure Vision for European Research) http://
search.driver.research-infrastructures.eu/
• Base (Bielefeld Academic Search Engine) http://www.base-search.net
• Évaluer une Archive Ouverte
• Ranking repositories http://repositories.webometrics.info/
mercredi 2 juin 2010 50
OpenDOAR
http://www.opendoar.org/find.php
mercredi 2 juin 2010 51
ROAR
http://roar.eprints.org/
mercredi 2 juin 2010 52
Repository Maps
http://maps.repository66.org/
mercredi 2 juin 2010 53
BASE
http://www.base-search.net
mercredi 2 juin 2010 54
ScientificCommons
http://www.scientificcommons.org/
mercredi 2 juin 2010 55
Un mouvement irréversible, mais
progressif…
• Des soutiens institutionnels importants : Sénat américain, Union
Européenne, gouvernements, grands organismes scientifiques : ANR,
CNRS, INSERM, INRIA (Fr.), NIH (E.U.), RCUK (G.B.)…
• Des initiatives nationales fortes (France : HAL, G.B.: The Depot )
• Vers une obligation de dépôt ? ROARMAP (Registry of Open Access
Repository Material Archiving Policies) et SHERPA/Juliet (Research
funders' open access policies) 179 mandats institutionnels + financeurs de
la recherche
• Aux USA : PubMed (pour les recherches financées par le NIH) ; projet de loi en juin
2009 pour toutes les disciplines ;
• Au niveau européen : 7ème PCRD > Open Access Pilot / OpenAIRE (Open Access
Infrastructure for Research in Europe)
• Prise en compte dans l’évaluation des chercheurs (ex : université de Liège,
etc)
mercredi 2 juin 2010 56
ROARMAP
http://www.eprints.org/openaccess/policysignup/
mercredi 2 juin 2010 57
SHERPA / Juliet
http://www.sherpa.ac.uk/juliet/
mercredi 2 juin 2010 58
Ranking Web of World
Repositories
http://repositories.webometrics.info
mercredi 2 juin 2010 59
Les revues en libre accès
Une revue en libre accès (open access journal) est une revue
scientifique, « nouvelle ou existante, qui répond aux exigences de
qualité des articles par la présence d’un comité de lecture, mais qui a
un mode de financement permettant une diffusion aussi large que
possible, sans restriction d’accès et d’utilisation » (d’après l’INIST)
• PloS : http://www.plos.org
• Revues.org : http://www.revues.org/
• BiomedCentral : http://www.biomedcentral.com/e/
• Scielo : http://www.scielo.br/
mercredi 2 juin 2010 60
Les revues en libre accès
• Deuxième composante de l’Open Access (voie
dorée)
• Nouveau modèle économique :
• frais de publication supportés par les auteurs ou leurs institutions
• généralement subventionnées
• Revues en libre accès = revues scientifiques
• Articles soumis aux règles d’évaluation habituelles du « peer-reviewing »
• Sont évaluées avec les mêmes indicateurs bibliométriques (IF)
• + de 500 revues en OA comptabilisées dans le JCR
mercredi 2 juin 2010 61
Modèle traditionnel
Source : Björn Brembs, What's wrong with scholarly publishing today?, http://www.slideshare.net/brembs/whats-wrong-with-scholarly-
publishing-today-ii
mercredi 2 juin 2010 62
Modèle auteur/payeur
Source : Björn Brembs, What's wrong with scholarly publishing today?, http://www.slideshare.net/brembs/whats-wrong-with-scholarly-
publishing-today-ii
mercredi 2 juin 2010 63
DOAJ : Directory of Open Access Journals Open J-Gate
4576 revues 6255 revues
Trouver des revues
en libre accès
mercredi 2 juin 2010 64
Le web 2.0
(O'Reilly, 2005)
• longue traine
• les données sont toutes puissantes
• centré/orienté utilisateur
• effets de réseau / réseaux sociaux
• Quelques droits réservés / favoriser
l’exploitation, la réutilisation des
contenus
• bêta perpétuelle
• coopération / collaboration
• les applications sont accessibles sur
tous les supports
http://oreilly.com/web2/archive/what-is-web-20.html?page=5
mercredi 2 juin 2010 66
Michel Roland “alors que l’internet est d’origine
(en grande partie) universitaire, ses plus récents
développements (le web 2.0) sont globalement
appréhendés comme venant l’impacter de
l’extérieur”
source : http://www.slideshare.net/bibliothecaire/100330-pmlpa-science-20-new
mercredi 2 juin 2010 67
Génération Y : Nouvelles
pratiques informationnelles
Source : Education for Change Ltd., Researchers of Tomorrow : A three year (BL/JISC) study tracking the research
behaviour of 'Generation Y' doctoral students (British Library & JISC, Octobre 2009).
mercredi 2 juin 2010 68
Google Scholar : nouvelle
donne ?
✓ Explosion,informationnelset hybridation
des outils
diversification
✓ Risques d’infobésité ?
✓ Autorité VS Popularité
✓ Économie de l’attention / Âge de l’accès
✓ Besoins : ouverture, accessibilité, accès
unifié aux documents de la recherche,
immédiateté, “gratuité”, texte intégral !
✓ Compétences informationnelles de + en
+ importantes (évaluation de
l’information)
mercredi 2 juin 2010 69
Multiplication et diversification
des moteurs de recherche
scientifique
Un corpus “dit” scientifique : Des fonctionnalités avancées
• Recherche en texte intégral, simplicité
• sites et portails académiques (.edu, etc.) • Possibilité de créer des alertes (cf nouvelle
fonctionnalité dans GS)
• bases de revues d'éditeurs (SpringerLink,
ScienceDirect, Wiley-Blackwell, IEEE, etc.) • Exportation et exploitation de références
bibliographiques (dans différents formats : bibTeX, RIS,
• bases de sommaires (Ingenta Connect) Refworks, etc.)
• bases de données bibliographiques (INIST)
• Analyse Bibliométrique (taux de citations, etc.)
• catalogues de bibliothèques (WorldCat,
• Support du résolveur de liens d’une bibliothèque
SUDOC) (partenariat avec les bibliothèques pour faciliter le lien
vers le texte intégral des documents - technologie
• bases de brevets
OpenURL)
• ressources en Open Access (archives ouvertes,
• Fonctionnalités avancées de recherche (par auteur, par
revues)
titre de revue, etc)
mercredi 2 juin 2010 70
Les moteurs de recherche
scientifique
Wikipedia : List of academic databases and search engines
mercredi 2 juin 2010 71
Multiplication des outils
numériques pour le chercheur
Digital Research Tools
http://digitalresearchtools.pbworks.com/
mercredi 2 juin 2010 72
Nouvelle façon de veiller
La recherche d’information :
énergie, temps, analyse, stratégie
Nécessité de rentabiliser sa
recherche (veille) : suivi des
nouveautés sur une sujet, mise à
jour des informations
Économie par la création
d’alertes, sauvegardes de
recherche = déléguer la
recherche ! Mike Lee, Newspaper RSS Feed Icon, Juin 6, 2009
Flickr, http://www.flickr.com/photos/curiouslee/3602683294/.
mercredi 2 juin 2010 73
Les flux RSS ?
• RSS = Rich Site Summary (sommaire d’un site enrichi)
• RSS = Really Simple Syndication (souscription vraiment
simple)
• Un flux RSS = un fichier (format XML) ou fil de contenu
qui va stocker et diffuser les dernières mises à jour d’un
site web (ou blogs (hypotheses.org), sites d’actualités (Le
Monde), sites institutionnels, Archives ouvertes (ArXiv,
HAL), revues scientifiques (Cairn, TicToCs),
socialbookmarking (Delicious), etc)
• Autre avantage : RSS déconnecte le texte de sa mise en
forme. A partir d’un flux RSS, il est possible de lire le
contenu d’un site A sur un site B !
mercredi 2 juin 2010 75
Intérêts des flux RSS
• Recevoir automatiquement les mises à jour d’un site sans avoir à
retourner sur ce dernier
• Suivre l’activité de plusieurs sites à partir d’un seul point d’entrée
(“guichet unique” = rôle de l’agrégateur)
• S’abonner aux flux RSS des sommaires de revues
• Générer un flux à partir de requêtes dans des bases de données en
IST
• Possibilité de catégoriser / d’organiser ses abonnements (flux rss) +
filtres + tags
• Alimenter une véritable base de connaissances
• Moins intrusif que l’e-mail (pubs, spams)
mercredi 2 juin 2010 76
Entrez dans le flux
Repérer les sites & services
proposant un flux RSS (ou fil RSS,
Syndication RSS, RSS feeds, etc)
Icône identifiable (sur la page ou au
niveau de l’URL)
Choisir un lecteur de flux RSS (ou
Agrégateur, ou Reader), en ligne
(Google Reader, netvibes) ou un
logiciel client (Firefox, Thunderbird,
feeddemon)
mercredi 2 juin 2010 77
RSS & OPML ?
• Importer et Exporter sa
liste de Flux
(sauvegarde)
• Echanger et partager sa
liste d’abonnements
mercredi 2 juin 2010 78
Journal TOCs
http://www.journaltocs.hw.ac.uk/
mercredi 2 juin 2010 79
TiCToCs
Recevoir les tables des matières de revues par fils RSS
http://www.tictocs.ac.uk/
mercredi 2 juin 2010 80
Folksonomie
Folksonomie : combinaison des termes
“folks” (usagers) et “taxinomie” (règle de
classification)
Systèmes s’appuyant sur réseaux sociaux et
permettant aux utilisateurs de donner des
indications de contenu aux ressources qu’ils
rencontrent, sous la forme de tags (mot-
clés)
Esprit collaboratif, notion de partage,
ouverture, simplicité d’utilisation...
Ex : plateformes de partage de signets et de
Cambodia4kids.org Beth Kanter, Tags: Keywords to describe digital objects, Octobre 3, 2006,
références bibliographiques Flickr, http://www.flickr.com/photos/cambodia4kidsorg/260004685/.
mercredi 2 juin 2010 82
Delicious
http://delicious.com
mercredi 2 juin 2010 83
Services de partage de signets
• Avantages
• Permet un classement des ressources mais aussi une navigation et un accès simple aux
informations via les tags
• Fonctions innovantes de tri ou de classement et de visualisation : nuages de tags
• Les tags sont plus précis et répondent mieux au vocabulaire et aux attentes des utilisateurs
• Permet de parcourir des sources faisant partie du web invisible
• Inconvénients
• Mots-clés détournés ou “Folks Bombing”
• Problèmes de validité, de cohérence (doublons) et de pérennisation
A utiliser pour
• Un accès rapide à l’information
• Pour mettre en place une veille en utilisant le « tag tracking » (repérage de termes (tags)
précis) qui consiste à suivre les ressources annotées avec un mot-clé (tag) précis
mercredi 2 juin 2010 85
Science 2.0 / Open Science
Objectifs
• Changer les pratiques de la recherche afin de rendre ses
résultats plus accessibles, d'une manière plus efficace et plus
rapide
• Comprend l’Open Access, l’Open Data et l’Open Process
(accès aux codes sources, par exemple, et aux protocoles
d’expérimentation)
mercredi 2 juin 2010 86
Science 2.0 / Open Science
Concepts
• Échange / Conversation / Partage / Collaboration / favoriser la
découverte (Sérendipité)
• Transparence / Ouverture / Accessibilité / Réciprocité / Intéropérabilité
• Enrichissement et valorisation des données (data mashups & Open
Data) / Web (2.0 et sémantique) / Infrastructure Numérique de
recherche (TGE Adonis)
• L’article n’est pas le seul vecteur de la recherche ! L’IST est multiforme !
• Des services et outils orientés chercheur, pas seulement contenu
mercredi 2 juin 2010 87
D’après Cameron Neylon, Open Science@PSB Introduction, <http://
www.slideshare.net/CameronNeylon/open-sciencepsb-introduction-presentation>
mercredi 2 juin 2010 88
D’après Cameron Neylon, Open Science@PSB Introduction, <http://
www.slideshare.net/CameronNeylon/open-sciencepsb-introduction-presentation>
mercredi 2 juin 2010 89
Web 2.0
D’après Cameron Neylon, Open Science@PSB Introduction, <http://
www.slideshare.net/CameronNeylon/open-sciencepsb-introduction-presentation>
mercredi 2 juin 2010 90
Quelles formes ?
• Carnets de recherche en ligne (Blogs, Wikis, Open
Notebook Science)
• Open Labs, Open Data (datasets, protocoles de
recherche, expérimentations)
• Espaces informationnels et conversationnels : réseaux
sociaux, microblogging, life streaming)
• Social bookmarking et plateformes de partage
mercredi 2 juin 2010 91
La blogosphère scientifque
Carnets de recherche 2.0
Typologie de la blogosphère scientifique
• Blogs de chercheur, de doctorant
• Blogs thématiques ou collectifs
• Blogs de séminaires
• Blogs “compagnons” d’une publication, d’une thèses
• Plateformes d’hébergement / Agrégateurs de blogs (commerciales,
institutionnelles, communautaires)
2008 : entre 3 000 et 10 000 blogs scientifiques dans le monde, dont
2 000 aux USA
“According to Adam Bly from Science Blogs (Seed Media Group), around
33% of scientists are now using blogs for writing, reading or as a lab
notebook.” source : http://www.info.scopus.com/researchtrends/archive/RT17/beh_dat_17.html
mercredi 2 juin 2010 92
Diversités de blogs = diversité
de contenus, de pratiques
• Un carnet de recherche, projet de recherche, "atelier" de chercheur
• Un cahier de laboratoire
• L'actualité de la recherche, réflexions et débats
• Les informations d'une communauté scientifique (calendrier des
manifestations, annonces de parutions...)
• Des conférences, colloques, séminaires virtuels
• La communication institutionnelle
• Des revues de littérature, des comptes-rendus
• Une lettre scientifique, ou un site accompagnant une publication
• Des cours, carnets pédagogiques
• Une veille sur l'information scientifique et technique
mercredi 2 juin 2010 93
ResearchBlogging
http://researchblogging.org/
mercredi 2 juin 2010 96
Nature Blogs
http://blogs.nature.com/
mercredi 2 juin 2010 97
PostGenomic
http://postgenomic.com/index.php
mercredi 2 juin 2010 98
Stanford Blogs
http://blog.stanford.edu/
mercredi 2 juin 2010 99
Hypothèses
http://hypotheses.org/
mercredi 2 juin 2010 100
C@fé des sciences
http://www.cafe-sciences.org/
mercredi 2 juin 2010 101
Pourquoi un blog ?
• Esquisser ses réflexions
• “La recherche en train de se faire” - A . Blanchard
• “Deadline is dead”, nouveaux rythmes d’écriture - A. Gunthert
• Le séminaire permanent : modèle conversationnel. “Un forum de pairs à
ciel ouvert” A. Blanchard
• S’enrichir des réflexions et des commentaires de la communauté
(lecteurs et blogosphère scientifique = intelligence collective)
• Transparence : démocratisation des savoirs, insérer la science dans la
société civile, vulgarisation scientifique
Adapté de A. Serres : LA blogosphère en sciences humaines et sociales, présentation de la plateforme Hypothèses
http://www.slideshare.net/revuesorg/le-blogosphre-en-sciences-humaines-et-sociales-prsentation-de-la-plateforme-
hypothses
mercredi 2 juin 2010 102
Blanchard A. « Ce que le blog apporte à la recherche ». In : Dacos M (éd.). Read/
Write Book [En ligne]. [s.l.] : Cléo/revues.org, 2010. p. 157-166. Disponible sur :
< http://cleo.revues.org/172 > (consulté le 30 Mai, 2010) ISBN :
978-2-9536419-0-5
mercredi 2 juin 2010 103
Archives Ouvertes et Blogs
Les trackbacks
Antoine Blanchard (Enro), Ce que le blog apporte à la Recherche, 12/08, http://www.enroweb.com/
blogsciences/index.php?2008/12/04/359-ce-que-le-blog-apporte-a-la-recherche
mercredi 2 juin 2010 104
Academic Blog Portal Google Blogs Search
http://www.academicblogs.net http://blogsearch.google.com/
Trouver des blogs
scientifiques
mercredi 2 juin 2010 105
Open Labs / Open Notebooks
Science / Open Data
• L’article ne donne pas suffisamment accès aux résultats de
la recherche / 95% des résultats de la recherche ne seraient
jamais publiés
• Rendre public et accessible les résultats d’expérimentations
• Mettre à disposition des autres chercheurs, des protocoles
de recherche, des données brutes (grilles de calcul (grids),
datasets, etc.)
• Permettre le transfert de compétences, la vérification et la
reproduction des expériences
mercredi 2 juin 2010 106
OpenWetWare
http://openwetware.org
mercredi 2 juin 2010 107
UsefulChem
http://usefulchem.wikispaces.com/
mercredi 2 juin 2010 108
MyExperiment
http://www.myexperiment.org/
mercredi 2 juin 2010 109
Many Eyes
http://manyeyes.alphaworks.ibm.com/manyeyes/
mercredi 2 juin 2010 110
Nouvelles formes de
diffusion de l’IST
• Trouver les diaporamas d’une
soutenance, d’une
présentation à un colloque /
une conférence
• Trouver une vidéo illustrant
un projet de recherche, etc
(YouTube edu)...
• Podcasts audio : iTunes U
• Trouver des images libres de
droits (http://www.flickr.com/
creativecommons/)
mercredi 2 juin 2010 111
Scivee
http://www.scivee.tv/
mercredi 2 juin 2010 112
Socialisation et personnalisation des
pratiques informationnelles
La pratique des outils ne peut pas être dissociée des questions
culturelles et sociales qui l’entoure
• Socialisation (> e-science : “we-science”)
• Combien de personnes ont lu cet article ?
• Quels sont mes “amis” / “ennemis” de lecture ?
• Quels sont les autres documents qu’ils ont lu / recommandé ?
• Personnalisation (> e-science : “me-science”)
• Signaler / référencer / valoriser ses publications
• Présenter et gérer sa bibliographie (choses que je lis / que j’ai lu)
• Les bibliothèques numériques sont “centrées sur le document” plutôt que “centrées sur le
chercheur”
• Le chercheur est-il prêt à devenir un nombre ? (ResearcherID, Scopus Author ID, ORCID)
Duncan Hull, Bibliography 2.0: A case study from the Wellcome Trust Genome Campus
http://www.slideshare.net/dullhunk/nesc-4198183
mercredi 2 juin 2010 115
Plateformes de partage de
références bibliographiques
• Gérer ses références bibliographiques
• Partager / recommander / annoter des références
• Alimenter une bibliographie sur un sujet à plusieurs
(Groupes)
• Générer automatiquement ses bibliographies
• Favoriser et faciliter la découverte d’articles /
mutualiser sa veille avec les autres utilisateurs
mercredi 2 juin 2010 116
Le social bookmarking pour le
chercheur
• Communautés spécifiques (recherche, académique)
• Fonctionnalités spécifiques (formats biblio, interconnexions avec sites
d’éditeurs scientifiques, recherches par auteurs, titre, revue,...)
• Pourquoi utiliser un service de partage de citations ?
• Possibilité de savoir qui lit les mêmes publications que vous
• Possibilité de voir la bibliographie (publique) de cette personne
• S’intégrer à un groupe thématique, éventuellement...
• ... ou suivre le travail de ce groupe
• Bénéficier de reviews sur des articles
• Bénéficier d’une évaluation des articles via un système de vote intégré à la plate-
forme
• Réaliser une veille via des fils RSS
d’après A. Marois
mercredi 2 juin 2010 117
CiteULike
http://www.citeulike.org/
mercredi 2 juin 2010 118
Texte
Connotea
http://www.connotea.org/
mercredi 2 juin 2010 119
MyPeers
http://codingseed.com/ (MacOS)
mercredi 2 juin 2010 122
Microblogging
Twitter :
• Réseauter / prendre des nouvelles de ses collègues
• Signaler une information / Recommander un article
• Solliciter de l’aide sur un sujet
• Soumettre une idée, une hypothèse / sentir les
nouveaux sujets de recherche
• Commenter une conférence en live (réactions, etc)
• Tweeter ses articles
http://www.phdcomics.com/comics.php?f=1198
mercredi 2 juin 2010 123
Saunders N, Beltrão P, Jensen L, Jurczak D, Krause R, et al. 2009 Microblogging the ISMB: A New
Approach to Conference Reporting. PLoS Comput Biol 5(1): e1000263. doi:10.1371/journal.pcbi.1000263
mercredi 2 juin 2010 124
“Online or Invisible?”
Steve Lawrence - Nature,Volume 411, Number 6837, p. 521, 2001
mercredi 2 juin 2010 139
Impact du web 2.0 sur
processus d’évaluation
• Problème : évaluation tributaire d’éditeurs commerciaux
(Thomson : Web of Science et Elsevier : Scopus)
• Nouvelles métries basées sur des pratiques sociales, réseaux
sociaux et le web (complémentaires à l’évaluation traditionnelle)
• Nouvelles formes d’évaluations (open peer commentary,
recommandations, annotations, etc)
mercredi 2 juin 2010 140
Quelques alternatives à
Thomson
• Eigenfactor : indice pondérant le nbre de
citations par le prestige des revues dont elles
proviennent (PageRank). Corpus du JCR, sur 5
ans.
• Scimago Journal Rank : fondé sur algorithme de
Google PageRank. Corpus : Scopus. Evaluation
sur 2, 3, 4 ans
• Harzing Publish Or Perish et Scholarometer
(permettent de retrouver le facteur H d’un
chercheur, fondés sur le corpus de Google
Scholar)
mercredi 2 juin 2010 141
“Article level metrics”
Bollen J, Van de Sompel H, Hagberg A, Bettencourt L, Chute R, et al. 2009 Clickstream Data Yields High-Resolution Maps of
Science. PLoS ONE 4(3): e4803. doi:10.1371/journal.pone.0004803
mercredi 2 juin 2010 143
“ Enhanced publications”
Selon Hubert Guillaud “Les clefs de cette nouvelle organisation
de l’information scientifique repose sur :
• une présentation hiérarchique du texte et des données qui refonde la
structure organisationnelle de l’article, afin que les lecteurs puissent naviguer
entre les couches de contenu selon leur niveau d’expertise et d’intérêt.
• un résumé graphique qui permet d’acquérir rapidement une compréhension
du message du document
• mise en évidence des principaux résultats de l’article
• on peut naviguer sur l’auteur et son affiliation
• l’article peut intégrer de l’audio et de la vidéo
• les procédures expérimentales sont accessibles
• les listes de citations enrichissent l’environnement de l’article…”
Source : http://lafeuille.blog.lemonde.fr/2009/08/20/larticle-scientifique-du-futur/
mercredi 2 juin 2010 145
• Sur le web = croissance exponentielle
“d’objets numériques” d’origines
scientifiques (blogs, multimédia, données
brutes, etc)
• De plus en plus de publications font
références à ces objets numériques
➡ Pourtant, dans la plupart des cas, ces
données et contenus ne sont pas reliés
entre eux
mercredi 2 juin 2010 146
Linked data
• Lier les données entre elles
• Le web comme base de
données
D’après Yann Nicolas
mercredi 2 juin 2010 147
Publication liquide
http://liquidpub.org/
“des objets évolutifs, collaboratifs et multiformes pouvant être composés et
consommés à différents niveaux de détail, remplaçant les journaux et conférences
classiques par des collections
Certes, ceci implique qu’on admette le caractère évolutif de l’écrit, son instabilité
dans le temps en fonction de l’évolution du savoir, son caractère collaboratif, chacun
pouvant apporter sa contribution personnelle, et son caractère multiforme, incluant
tous les modes d’expression modernes actuels et à venir. Ceci demande également
une révision profonde et une adaptation des méthodes de jugement, préalables à la
publication (le peer review) qui devient plus difficile à maintenir en place, et a
posteriori, lors de l’évaluation des programmes, des équipes et des individus.”
Source : Bernard Rentier, http://recteur.blogs.ulg.ac.be/?p=188
mercredi 2 juin 2010 155
Comment expliquer la faible participation
des chercheurs ?
David Stuart, Web 2.0 fails to excite today's researchers, Research Information, Oct/Nov 2009
mercredi 2 juin 2010 156
“(...) Quelles sont les dérives de la communication médiatisée par la
technique ? (...) Le cercle vertueux procuré par la « présence
Web2.0 » des scientifiques sur le net ne se traduit-il pas
essentiellement par un certain nombre d’invitations, de sollicitations
à des conférences et à l’écriture d’articles, ces effets positifs
participent-ils au renouvellement du débat d’idées ?”
Broudoux E, Chartron G. « La communication scientifique face au Web2.0 : Premiers constats
et analyse ». In : H2PTM [En ligne]. [s.l.] : Hermès Science - Lavoisier, 2009. p. 323-336.
Disponible sur : < http://archivesic.ccsd.cnrs.fr/sic_00424826/en/ >
mercredi 2 juin 2010 157
Quelques limites
• question des données nominatives et privées (e-réputation,
gestion des traces)
• pérennité de ces outils
• données au mains d’acteurs privés ou commerciaux
(citeulike : Springer, Connotea : Nature)
• Masse critique ?
• légitimité et non reconnaissance de ces outils, faible
d’incitation de la part des politiques, des institutions
• multiplication de ces outils, question de l’intéropérabilité ?
mercredi 2 juin 2010 158
“L’utilisation à des fins professionnelles des nombreux services gratuits disponibles sur
Internet (messagerie électronique, hébergement de sites web, stockage de données,…)
suscite de manière générale de sérieuses réserves. En toute rigueur, l’externalisation
d’un service n’est concevable que dans le cadre d’un contrat où juridiquement toutes les
implications auront bien été étudiées et où techniquement toutes les mesures destinées
à assurer la disponibilité, l’intégrité et la confidentialité des informations auront été
correctement mises en œuvre. Il est bien évident que l’on ne peut attendre de telles
garanties d’un fournisseur de service gratuit. Les risques sont accrus lorsque ce
fournisseur est situé à l’étranger.”
Source : CNRS/FSD/Sécurité des Systèmes d’Information. Recommandations
pour l’utilisation des services gratuits sur Internet. 2008. Disponible sur : http://
www.sg.cnrs.fr/FSD/securite-systemes/documentations_pdf/securite_systemes/
Recommandations%20sur%20les%20services%20gratuits.pdf
mercredi 2 juin 2010 159
Rôles et opportunités pour les
bibliothèques
• Médiateurs de l’IST
• Formateurs et veilleur (nouveaux outils et nouvelles méthodes de
la science 2.0)
• Gestionnaires des données, Fournisseurs de métadonnées,
garants de la qualité de ces dernières
• Diffuseurs de la connaissance
• Chargés de la valorisation des contenus
• Prestataires de services auprès des chercheurs
• Bibliomètres
mercredi 2 juin 2010 160
Vers des services et outils
orientés chercheurs
• Les chercheurs ne viennent pas à la bibliothèque. Il faut aller
vers eux (se déplacer dans les labos)
• Penser au fait que les chercheurs n’utilisent pas qu’une seule
bibliothèque, qu’une seule source d’information ou qu’un seul
outil !
• Les services de la bibliothèque doivent s’intégrer dans les
outils et dans l’environnement numérique de travail du
chercheur
• La bibliothèque doit disséminer l’information, et ses services,
devenir invisible et transparente pour le chercheur
mercredi 2 juin 2010 161