Doctorat sciences - Bibliométrie : le JCR et les modèles alternatives

Facteur d’impact, h-
index, bibliométrie :
pourquoi et comment?
Dernière mise à jour : 23/10/2015 - Auteur : Frédérique Flamerie

Plan
De quoi parle-t-on?
Le facteur d’impact
Les modèles alternatifs au
facteur d’impact
Le h-index
Perspectives

Lectures indispensables
+ rapport de l’Académie des Sciences
+ bibliographie et webographie BUPMC
Disponible à la
Bibliothèque BCPR
(Biologie Chimie
Physique Recherche)
cote 507.2 GIN

« Do metrics matter ? »
Alison Abbott , David Cyranoski , Nicola Jones , Brendan Maher , Quirin Schiermeier & Richard
Van Noorden. Metrics : do metrics matter?, Nature, n° 465, p. 860-862 (2010).
De quoi parle-t-on?

Qu’est-ce que la bibliométrie ?
Elle se définit comme l’exploitation
statistique des publications
Elle « procède du calcul de divers indicateurs
à partir des bases de données
bibliographiques couvrant la quasi-totalité de
la littérature scientifique et de leurs citations
dans la plupart des disciplines. »
Du bon, usage de la bibliométrie pour l’évaluation individuelle des
chercheurs : Rapport de l’Académie des Sciences, 17 janvier 2011
De quoi parle-t-on?

A quoi la bibliométrie sert-elle?
De quoi parle-t-on?
Analyse des citations = outil multi-usage
• recherche documentaire et gestion de
collections de revues
• histoire et sociologie des sciences
• caractérisation
• évaluation
• classement

Plusieurs objets et plusieurs
niveaux
Sources, revues
Pays
Laboratoires, institutions
Chercheurs
De quoi parle-t-on?

Les palmarès : un apercçu
De quoi parle-t-on?
Caractériser
• U-Multirank
• Approche
pluridimensionnelle
• Comparer ce qui est
comparable
Classer
• Classement de
Shangaï
• Monodimensionnel :
critères de prestige
scientifique
• N’est plus significatif
au-delà de la 10e
place
any number beats no number

 Pour les institutions et les chercheurs :
• Thomson Reuters : Web of Science Core
Collection (+ de 8 600 titres) et Essential
Science Indicators
• Elsevier : Scopus (+ de 20 000 titres)
 Pour les sources / revues :
• le Journal Citation Reports : données du
Web of Science Core Collection
• Journal Metrics : données de Scopus
De quoi parle-t-on?
Bases de données de référence

Pourquoi le Web of Science est-il (si) sélectif?
Loi de Bradford
Effet Mathieu
évangile selon St Matthieu 25-
29 : « Car on donnera à celui
qui a et il sera dans
l’abondance, mais à celui qui
n’a pas, même ce qu’il a lui
sera retiré »
Voir : A. Blanchard, Distributions et lois Bibliométriques - 31/01/2005
0
20
40
60
80
100
120
0 1000 2000 3000 4000 5000 6000
# of journals
%ofdatabase
Articles Citations
Distributions bibliométriques : 20/80
Source : Thomson-Reuters - présentation UPMC 2011

Notion clé = la citation
 Une citation au sens du Web of Science est la
référence à :
• une review,
• un article de recherche,
• un éditorial,
• etc. : article de toute nature
 Mise en relation nombre de citations/nombre
d’articles au fondement des 2 indicateurs les +
utilisés
• facteur d’impact
• h-index
De quoi parle-t-on?

Mode de calcul
Exemple :
Facteur d’impact de The Astrophysical Journal en 2012 =
nb de citations reçues en 2012 par des articles publiés en
2011 et 2010 (33485)
------------------------------------------------------------------------
nb d'articles citables publiés en 2011 et en 2010 (4973)
Soit 33485 / 4973 = 6,733
Le facteur d’impact 2012 de cette revue est de 6,733
Impact factor
année 2012 =
Nombre de citations reçues en 2012
par des articles publiés en 2011 et 2010
Nombre d’articles « citables » publiés en
2011 et 2010

201020092008
Impact
Factor
Années
précédentes
Temps
Publications de 2010
Publications citées en 2010,
publiées en 2008 et 2009
Schéma d’après
Mode de calcul

Où trouver l’information : Journal Citation Reports
Le JCR fait partie de l’abonnement de l’UPMC au Web of Science.
3 modes d’accès :
• Jubil > Ressources en ligne : les essentiels > Bases de données

Accès contextuel depuis la liste A-Z et le menu du résolveur de
liens SFX
Ce service n’apparaît que si la
revue a un facteur d’impact

Accès depuis le Web of Science
Accès contextuel
depuis un résultat de
recherche
Accès depuis le menu en
haut de chaque page

Le JCR :
Données
générales sur
une revue
Facteur d’impact
Eigenfactor
indice bibliométrique
pondérant le nbre de
citations par le prestige
des revues dont elles
proviennent (cf. infra)
Rank et Box Plot
analyse du
positionnement d’une
revue dans la (ou les)
catégorie(s) dont elle fait
partie

Le JCR : Rank
• Situer une revue par rapport aux autres revues de la
même discipline
• Voir l’évolution de son positionnement dans le temps

Le JCR : Box Plot
Facteur
d’impact de
la revue

Le JCR : Données d’une catégorie de revues
NB Par défaut les 2 index
Science citation index
expanded et Social
sciences citation index
sont sélectionnés

Le JCR : autres indicateurs
Liens de citations
• Revue citée - Cited Journal Data
identifie les publications qui citent le plus souvent une revue
donnée
mettre en évidence un réseau de revues
• Revue citante - Citing Journal Data
identifie les publications le plus souvent citée par une revue
donnée
mettre en évidence un réseau de revues
• Revues connexes - Journal Relationships
analyse des liens de citation entre les revues
déterminer des proximités sémantiques
identifier les liens entre les revues

Cited Journal Graph : comment la revue est-elle citée?
Demi-vie
de citation
Citations utilisées
pour calculer le
facteur d’impact
Le JCR : Cited Journal

Cited Journal Data : comment la revue est-elle citée?
En 2013, PloS One est la
revue qui a le plus cité la
revue Bioinformatics
Le JCR : Cited Journal

Visualisation des relations de citation avec les 20
principales revues du réseau de citations de la revue
Le JCR : Journal Relationships
Survol de l’arc =
facteur d’impact
de la revue
Survol des
cordes = nombre
de citation à la
revue parente

Comparer le positionnement (Quartile) ou l’évolution
(Trends) de revues appartenant à une même catégorie
Le JCR : Compare Journals
Sélectionner
les revues et
la catégorie

Les limites du facteur d’impact
Les limites du facteur
d’impact
« Like nuclear energy,
the impact factor is a
mixed blessing. »
Eugène Garfield, The agony
and the ecstasy - The
history and meaning of the
journal impact factor

Avis de chercheurs
d’impact

D’importantes différences entre disciplines
% of cites older than 10 years
35%
29%
70%
43%43%
45%
39%39%42%
46%
42%
0.00%
10.00%
20.00%
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
BehaviouralScience
Biom
edical&
Life
Sciences
Business
&
Econom
ics
C
hem
istry
&
M
aterials
Science
C
om
puterScience
Earth
&
Environm
entalScienceEngineering
H
um
anities,Soc.Sci.&
Law
M
ath
&
Statistics
M
edicine
Physics
&
Astronom
y
Antériorité des citations : % d’articles de plus de 10 ans
d’impact
Source : Springer

Densité et temporalité des citations
« En biologie moléculaire, il n’est pas rare qu’un article recueille 10 à 30 citations
en 2 ans, alors qu’une revue de premier rang en mathématiques n’en recevra
que deux ». Manuel Durand-Barthez, L’évaluation des publications scientifiques :
nouvelles approches, nouveaux enjeux, 2009
D’importantes différences entre disciplines
d’impact
Source : http://www.eigenfactor.org/whyeigenfactor.php

 Limites du mode de calcul
délai de 2 ans du facteur d’impact critiquable, celui
de 5 ans également
NB : l’impact sur 2 ans reste l’indicateur de référence
 Importance des critères éditoriaux
• Nombre de fascicules dans l’année
• Nombre de pages et d’articles par n°
• Type d’article : reviews sont citées 2 fois plus en
moyenne
d’impact

Le facteur d'impact se rapporte à une revue et non à
un article.
Les articles d'une revue à fort facteur d'impact ne
sont pas tous cités de manière identique
« Les revues les plus prestigieuses, à facteur d’impact
très élevé, contiennent un pourcentage significatif
d’articles de qualité moyenne »
Rapport de l’Académie des Sciences, op. cit., p.2
Ex de Nature : en 2004, 25% des articles ont constitué 89% du FI
Depuis 2008 + de 50% de ses articles ont reçu zéro ou 1 citation.
d’impact
Danger de l’extrapolation

3. Les modèles alternatifs
au facteur d’impact

« fonde le statut d’une page web sur une
combinaison des liens qui pointent vers
une page et sur le statut des pages dont
sont issus ces liens. En prenant en
compte à la fois des facteurs de
popularité et de prestige, Google a pu
éviter d’attribuer des rangs élevés à des
pages web populaires mais par ailleurs
non pertinentes. »
Rodriguez M.A., Bollen J., Van de Sompel
H., « Journal Status », Scientometrics, vol.
69, n° 3, 2006, p. 669
revues populaires vs. revues
prestigieuses
Les modèles alternatifs
L’algorithme du PageRank : influence weight
Narin - 1976

• Conçu par Carl T. Bergström, Université de
Washington, 2007
• S’appuie sur le corpus du JCR
• Prise en compte d’un « poids » des
citations, lié à l’influence relative des
revues dans la communauté scientifique
• Les auto-citations sont exclues du calcul
• Fondé sur les 5 années les plus récentes
Eigenfactor

• Eigenfactor Score
= mesure de l’influence d’un journal pour la communauté
scientifique - influence globale d’une revue
Somme des Eingenfactor scores de toutes les revues du JCR = 100
• Article Influence Score
= mesure de l’influence moyenne de chaque article sur les 5
dernières années - influence moyenne par article
Article Influence Score moyen du JCR = 1
• Cost effectiveness Score
= prix/Eigenfactor score
Cost effectiveness score moyen = 1
Les indicateurs de l’Eigenfactor

http://www.eigenfactor.org
Eigenfactor

http://well-formed.eigenfactor.org
Données de 1997 à 2005
Citation patterns : liens de citation entre revues et entre domaines disciplinaires
Change over time : évolution du Eigenfactor score
Clustering : classement par Article Influence et liens de citation entre revues
Map : réseau de citations
Clustering

Indicateurs Scopus
• Source Normalized Impact per
Paper (SNIP)
en savoir + : Fiche CoopIST (Cirad)
• Impact per Publication (IPP)
• SCImago Journal Rank (SJR)

 Fenêtre d’analyse des citations = 3 ans
 Différents modes d’accès (gratuits)
• Journal Metrics (Elsevier) : SNIP, IPP,
SJR
• Journal Indicators (Université de
Leiden): SNIP et IPP
• Scimago Journal & Country Rank
(Scimago Lab): SJR et IPP
Indicateurs Scopus

SNIP
• Objectif : permettre des comparaisons
directes entre revues de champs
disciplinaires différents
• Normalisation a priori : pondération des
citations en fonction des disciplines
• NB pas de définition a priori de
catégories disciplinaires
• Ratio nombre de citations/potentiel de
citations de la discipline

IPP
• Indice équivalent au facteur d’impact : ratio
nombre de citations/nombre d’articles
• Mais fenêtre d’analyse des citations de 3 ans,
couverture Scopus ≠ Web of Science Core
Collection,
• Mais « articles » a le même sens dans le
numérateur et le dénominateur = articles
peer-reviewed
• = RIP sur Journal Indicators
• = Cites/doc (3 years) sur Scimago Journal &
Country Rank

SJR
• SJR = indice fondé sur le principe de
l’Eigenfactor
• Objectif = mesurer le prestige des revues,
compte les “citations pondérées”,
“weighted citations”
• Description détaillée :
http://www.scimagojr.com/SCImagoJourn
alRank.pdf

Scimago - Compare : revues ou pays

Scimago - The Shape of Science

Jorge E. Hirsch - 2005
An index to quantify an individual’s scientific research output. Proceedings of the National Academy
of Sciences, 102(46), 16569-16572. [en ligne sur : dx.doi.org/10.1073/pnas.0507655102 et sur arXiv :
http://arxiv.org/abs/physics/0508025]
« I propose the index h, defined as the number of
papers with citation number ≥h, as a useful index to
characterize the scientific output of a researcher. »
Un chercheur ayant publié 2 articles cité au
moins 2 fois a un indice H de 2.
Un chercheur ayant publié 150 articles parmi lesquels 82 ont été
cité au moins 82 fois a un indice H de 82.
Un chercheur ayant publié 35 articles ne peut pas avoir un indice
H supérieur à 35.
Définition
Le h-index

Le h-index
Auteur : Chessor (Own work) [CC BY-SA 3.0
(http://creativecommons.org/licenses/by-sa/3.0)], via Wikimedia Commons
Mode de calcul

Le h-index dans le Web of Science Core Collection
Le h-index
A partir d’une liste de résultats (< 10 000
résultats)

Le h-index
La limite qui permet de déterminer l’indice H
apparaît dans la liste des résultats
Le h-index dans le Web of Science Core Collection

Les limites du h-index
Source : Flickr
- auteur :
fragmented

Le h-index suppose :
•une ancienneté de carrière
 la comparaison de l’indice H n’a de sens qu’en
tenant compte de la « séniorité » des
chercheurs concernés, car il augmente avec
l’âge
•un grand nombre de publications, générant un
grand nombre de citations
 lien avec l’âge mais aussi la discipline du
chercheur
Les limites
du h-index

• Les différences de pratiques entre disciplines
sont peu prises en compte :
la comparaison n’a de sens que dans un même
domaine
• Les contributions exactes des auteurs ne sont
pas prises en compte : différences majeures
entre disciplines (ordre alphabétique ou
hiérarchie des contributions)
pondérer le h-index par un facteur reflétant le
nombre moyen de co-auteurs et le rôle de chacun ?
Les limites
du h-index

 Biologie / Sciences du vivant : entre 5 et 10 signataires,
parfois plus
• Étudiant ou post-doc qui a fait la manip : 1er signataire
• Personne qui lui est la plus proche : 2e signataire
• En remontant : directeur du groupe, directeur du labo etc.
 validité des indicateurs pour les signataires « du milieu » ?
 confusion entre « auteur » et « collaborateur » ?
 Géosciences : en général moins de 10 auteurs et encore
assez souvent moins de 5. Ordre en général lié à l’importance
décroissante des contributions. De plus en plus fréquemment
mention des ingénieurs de recherche comme co-auteurs
 Mathématiques : plus de la moitié des articles n’ont qu’un
seul auteur
Exemples
Les limites
du h-index

Le h-index ne permet pas de faire la différence entre articles
très au-dessus ou très au-dessous de l’indice moyen : il
ne valorise pas les travaux à très gros impact et/ou à
impact durable, « gelés » par l’indice H
 Création par Léo Egghe de l’indice G, en 2006, afin de
« distinguer l’excellence dans la productivité »
(Rapport de l’Académie des Sciences)
Un chercheur aura un facteur G de 83 si ses 83 articles
les plus cités totalisent au moins 6889 citations, c’est-à-
dire G au carré
Indice encore peu connu et encore peu utilisé.
L’indice G
Les limites
du h-index

 Part réelle de chaque co-auteur difficile à
évaluer
 Mauvaises pratiques de citations : références
biblio choisies par opportunisme
• citations d’articles de la revue dans laquelle on publie,
• cartels de citations,
• autocitations, etc.
 Articles non-cités parce qu’ils sont des quasi-
classiques ou parce qu’ils sont très originaux
 qualité/impact
information/évaluation
Perspectives
Limites de l’analyse des citations

Les limites de la
citation
Le top 100 des
articles les + cités
depuis 50 ans
Image en grande dimension
Source : Van Noorden R., Maher B., Nuzzo R. « The top 100
papers ». Nature. 29 octobre 2014. Vol. 514, n°7524, p. 550-553.
Disponible sur : < http://dx.doi.org/10.1038/514550a >
Still, there is one powerful lesson for
researchers, notes Peter Moore, a
chemist at Yale University in New
Haven, Connecticut. “If citations are
what you want,” he says, “devising
a method that makes it possible for
people to do the experiments they
want at all, or more easily, will get
you a lot further than, say,
discovering the secret of the
Universe”.
= méthodes + logiciels

Altmetrics
Les limites de la
citation
Mesures alternatives (ou
alternatives aux
mesures) :
• usage
• recommendantion
• partage
• réutilisation
généralistes, grand public
(Twitter)
vs.
spécialisés, recherche
(Mendeley, ResearchGate,
blogs scientifiques, etc.)
Altmetrics manifesto

Commentaire du top 100
2013 altmetric.com
• 58/100 = dans revues sur
abonnement
• 2è et 4è : sur l’obésité et le
sommeil
• Parus dans NEJM et Science
Différents fournisseurs
• Altmetric.com : utilisé par
Elsevier et Nature
notamment
• PLOS : utilisé par
Copernicus
• Impactstory : utilisable par
les chercheurs
• Plum Analytics (appartient
à Ebsco)
Altmetrics
Après le h-index, le k-index?
Hall, N. The Kardashian index: a measure of discrepant social media profile for
scientists. Genome Biology 15, 424 (2014). DOI : 10.1186/s13059-014-0424-0
Perspectives

Source:
http://www.phdcomics.com/comics/archive.php?comicid=1737
Doctorat/BibliométriePerspectives

Bibliographie et webographie
Perspectives

Doctorat sciences - Bibliométrie : le JCR et les modèles alternatives

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (8)

Similaire à Doctorat sciences - Bibliométrie : le JCR et les modèles alternatives

Similaire à Doctorat sciences - Bibliométrie : le JCR et les modèles alternatives (20)

Plus de Frédérique Flamerie

Plus de Frédérique Flamerie (19)

Dernier

Dernier (20)

Doctorat sciences - Bibliométrie : le JCR et les modèles alternatives

Notes de l'éditeur