Loading…

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

Like this presentation? Why not share!

Like this? Share it with your network

Share

 

Statistics

Views

Total Views
3,020
Views on SlideShare
3,020
Embed Views
0

Actions

Likes
3
Downloads
68
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Comparazione con la storiografia: si basa su documenti per arrivare ad un'interpretazione di fatti, eventi, azioni Tipici argomenti di ricerca bibliometrici: numero di pubblicazioni/citazioni prodotte/ricevute da un autore, da un gruppo di ricerca, da un’istituzione, da una nazione; numero e provenienza geografica di autori per pubblicazione; numero medio di pagine per pubblicazione
  • BIBLIOMETRIA: applicazione della matematica e di metodi statistici ai prodotti della comunicazione (testi, libri, articoli, bibliografie). SCIENTOMETRIA: applicazione della matematica e dei metodi statistici ai prodotti della comunicazione scientifica e tecnologica finalizzata ad accertare il contributo relativo di scienziati, istituzioni, nazioni al progresso delle conoscenze. INFORMETRICA: studio degli aspetti quantitativi dell’informazione in qualunque forma (non solo informazione registrata in libri, articoli, etc.) e presso qualunque gruppo sociale (non solo scienziati). WEBMETRICA (CYBERMETRICA, NETMETRICA): estensione dei metodi biblio-sciento-informetrici ai flussi informativi che si materializzano sulla rete Internet (non solo Web, ma anche posta elettronica, ftp, reti p2p).
  • Distinguere citazioni bibliografiche e quotations La scienza va avanti grazie al fatto che i risultati nuovi vengono comunicati ed usati da qualcuno
  • La lingua italiana non aiuta: si parla di citazioni per riferirsi: - ai documenti elencati in una bibliografia - ai record di un database bibliografico (una citazione tratta da MEDLINE) - al fatto di essere menzionati in una bibliografia altrui (è stato citato da ...) - alle quotations ovvero le la ripetizione parola per parola di passi da testi altrui
  • Network è uno dei termini più ricorrenti nella letteratura bibliometrica dalle origini a oggi: si studia la rete con strumenti come il calcolo delle probabilità, la statistica, la teoria dei grafi
  • Per i non bibliotecari in ascolto “si indicizzano” = si identificano e si rendono ricercabili tutti gli elementi che compongono il record del documento citato, ovvero autore, titolo articolo, titolo rivista, anno, etc.
  • Il 25 ottobre 2010 è stato lanciato l’Indian Citation Index (ICI) e analoghi strumenti esistono per la Cina e la Corea. Per quanto riguarda i libri, Google Scholar è un primo passo verso l’estensione del citation indexing alle monografie. In prospettiva, gli sviluppi più interessanti possono arrivare ancora dall’orbita Google, sia attraverso il progetto Google Books che mediante il consorzio Hathi Trust che ha permesso alle biblioteche Google di creare una piattaforma condivisa per immagazzinare e conservare, in funzione dell’accesso, le loro copie dei documenti confluiti in Google Books. ESEMPIO PER MEDICI E INFORMATICI - Persino nell'ambito di aree dominate dall'articolo scientifico, come la biomedicina, esistono discipline dove bisognerebbe tenere conto delle monografie e degli atti di convegni, ad esempio la psicologia (PsicINFO indicizza entrambe in misura maggiore rispetto a WoS). Citazione: Insofar as publishing papers in peer-reviewed international journals comes to be regarded as the main business of scientists, therefore, ISI citation data offer the raw materials for building indicators of scientific performance. And even when, as in the above examples of computer science and biomedicine, their poor representativeness is acknowledged outright, it is generally agreed that further inquiry into the conditions under which they can be integrated with complementary information sources is worthwhile. For instance, Leiden bibliometricians at the CWTS completed a pilot study in 2006 for expanding ISI indexes with source papers from refereed proceedings of computer science international conferences in view of developing field-specific bibliometric indicators. Similarly, Grant Lewison has envisioned the expansion of the set of analytical tools necessary to trace the multiple routes along which biomedical research influences health decisions through the bibliometric analysis of nonjournal citation linkages, such as citations to biomedical articles from patents, clinical guidelines, and newspapers. ESEMPIO PER BIBLIOTECARI: se si volesse determinare l'impatto esercitato dai bibliotecari italiani sulla letteratura professionale bisognerebbe indicizzare le bibliografie di almeno Biblioteche Oggi e Bollettino AIB e di tutti i volumi editi dalla Bibliografica.
  • http://attiministeriali.miur.it/anno-2009/luglio/dm-28072009-n-89.aspx Cosa non va: - “settori scientifico disciplinari in cui ne è riconosciuto l’uso a livello internazionale” ----------- non esiste accordo - ordine gerarchico inverso: gli indici meno validi vengono prima - l’indice di Hirsch non è una combinazione di precedenti parametri ma un indice nuovo - “e simili” non significa niente: g index? R index? ...
  • L'obiettivo è giustificare l'esistenza / qualità / utilità del fondo agli occhi dei finanziatori. Si può usare la bibliometria per dimostrare che qualcosa non ha (ancora) impatto quindi è originale?
  • Acquisire una conoscenza basilare del contesto in cui gli indici bibliometrici hanno un senso ... ammesso che lo abbiano : se Einstein fosse morto nel 1906 il suo indice h sarebbe 4 e ciononostante grazie alla sua relatività speciale abbiamo avuto gli acceleratori di particelle e la radioterapia oncologica con acceleratori lineari La risposta a tali quesiti non può essere solo un numero o una lista di articoli ordinati per numero di citazioni
  • JOHN DESMOND BERNAL (1901-1971): la scienza come sistema materiale di relazioni sociali e simboliche ROBERT K. MERTON (1910-2003): concezione normativa della scienza. EUGENE GARFIELD (1925-) & HENRY SMALL (1941-): le citazioni bibliografiche come simboli di concetti ( concept symbols ). DEREK J. DE SOLLA PRICE (1922-1983): la scienza come sistema “termodinamico” governato da leggi matematiche.
  • Non è diverso dal sistema valido in altri contesti sociali, in particolare da quello dello star system: carriera di un calciatore o di un musicista
  • Uno scienziato si riconosce non dal fatto di lavorare in un’istituzione etichettata come scientifica o dall’aver ricevuto una certa formazione ma dal fatto che, almeno una volta nella vita, ha pubblicato un contributo letto e approvato dalla comunità dei colleghi E’ un criterio molto restrittivo: si può confrontare con la domanda ‘’come si riconosce un bibliotecario”? La ricerca condotta secondo il modello normativo garantisce il progresso = sostituzione di un paradigma con un altro più aderente alla realtà
  • L'ANALISI DELLE CITAZIONI SUPPORTATA DAL MODELLO NORMATIVO LEGITTIMA UNA VISIONE STATICA E CONSERVATIVA DELLA COMUNITA' SCIENTIFICA ... proneness to perpetuate and theoretically justify the existing order of things—marked by an unfair allocation of social, economic, and symbolic capital—by telling a story that Garfield’s citation indexes would have brought to a logical completion, the story of a stratified scientific literature produced by a stratified community wherein scientific excellence is confined to a few minds that live and work in a few institutions and deliver the fruit of their creativity to a few, high-quality, “must-buy” international journals owned by a decreasing number of multinational corporations ruling the roost in the global information market.
  • Illustrare il significato delle tre leggi: 1) se trovo il modo di isolare gli autori prolifici e impattati in ogni settore di ricerca ho risolto il problema della valutazione; 2) se trovo il modo di isolare il nucleo di riviste che pubblicano la maggior parte degli articoli rilevanti in una disciplina ho risolto il problema degli acquisti in biblioteca 3) se fisso una soglia (statistica) per delimitare i termini con molte occorrenze dagli altri, posso utilizzare i primi come stop-words e i secondi come parole chiave LOTKA - The Frequency Distribution of Scientific Productivity (1926) - Stila una classifica degli autori ( sources ) elencati in due bibliografie di area chimico-fisica sulla base del numero di pubblicazioni ( items ) prodotte da ciascuno e osserva che la distribuzione della produttività individuale può essere descritta da: numero autori con n pubblicazioni = costante / n^2. Questo significa che esiste un’élite di scienziati molto produttivi a fronte di un gruppo di scienziati che offrono solo contributi occasionali ad un settore di ricerca: ma fino a che punto quantità e qualità sono correlate? Price cercò di dimostrare che gli scienziati molto produttivi sono anche quelli che incidono maggiormente sul progresso scientifico. BRADFORD - Sources of Information on Specific Subjects (1934) - Stila una classifica delle riviste ( sources ) elencate in tre bibliografie di area geofisica sulla base del numero di articoli di argomento affine ( items ) pubblicati in ciascuna rivista e osserva che la distribuzione della produttività delle riviste segue uno schema analogo a quello trovato da Lotka per la produttività degli autori, in particolare: 1) esiste un piccolo nucleo (core) di riviste che produce la maggior parte di letteratura su un dato argomento; 2) per recuperare un numero maggiore di articoli sullo stesso argomento (ed eventualmente per ottenere la copertura bibliografica totale) è necessario ricorrere ad un numero di riviste periferiche che cresce in maniera esponenziale ZIPF - The Psycho-Biology of Language: An Introduction to Dynamic Philology (1936) - Conta le occorrenze individuali ( items ) delle singole parole ( sources ) all’interno di un testo e osserva che, se le parole vengono classificate in ordine di frequenza decrescente (al 1° posto la parola in assoluto più frequente, al 2° la parola più frequente dopo la prima, etc.), allora la loro distribuzione complessiva è tale che il prodotto tra la posizione in classifica ( rank ) ed il numero di occorrenze di ogni parola risulta all’incirca costante. Ad esempio, Moltiplicando 10 per 2653, poi 100 per 265, poi 5000 per 5 si ottiene all’incirca lo stesso risultato , questo significa che ... nell’ Ulisse di Joyce : la 10ma parola più frequente compare 2653 volte la 100esima parola più frequente compare 265 volte la 5000esima parola più frequente compare 5 volte Moltiplicando 10 per 2653, poi 100 per 265, poi 5000 per 5 si ottiene all’incirca lo stesso risultato , questo significa che ... ... esistono poche parole ( sources ) dotate di molte occorrenze individuali ( items ) così come esistono pochi autori ( sources ) che pubblicano molti articoli ( items ) e poche riviste specializzate ( sources ) che pubblicano molti articoli ( items ) su un dato argomento. In termini generali, questa situazione (che non è affatto limitata al contesto bibliometrico o linguistico) si esprime dicendo che ... Il rapporto tra sources e items è caratterizzato, in bibliometria come in molti altri domini della natura e della società, da una profonda diseguaglianza o asimmetria ( skewness ): esiste un ristretto nucleo di fonti molto produttive a fronte di una schiera molto più fitta di fonti dotate di produttività minima o nulla. Tale asimmetria è comunemente tradotta in termini matematici mediante una distribuzione iperbolica o legge di potenza ( power law ). PRICE (articoli 1960-70) - Qualunque indicatore numerico dei vari settori e aspetti della scienza moderna (dalla metà del '600 in poi) si prenda in considerazione (numero di riviste scientifiche, di articoli o di abstract pubblicati, numero di scienziati e ingegneri vissuti) il suo modo normale di crescita è esponenziale , cioè si moltiplica, in eguali periodi di tempo, di un fattore costante. La distribuzione delle citazioni nell’edizione 1961 dello SCI e la distribuzione dei prestiti interbibliotecari di riviste tecnico-scientifiche effettuati dalla biblioteca dello Science Museum di Londra nel 1956 segue un andamento analogo a quello delle pubblicazioni scientifiche: un nucleo ristretto di documenti è di gran lunga più citato e soddisfa molte più richieste di prestito della massa di documenti poco o mai citati/richiesti. In particolare, nel caso delle citazioni ... Price stimò che in un dato anno aprossimativamente il 35% dei documenti prodotti non viene mai citato , il 49% viene citato solo una volta , il 9% due volte , il 3% tre volte , il 2% quattro volte , e soltanto l’1% sei o più volte . Inoltre tali citazioni non sono distribuite sulla letteratura precedente in modo uniforme ... La maggior parte delle citazioni si concentra infatti su documenti (ed autori) più recenti rispetto ai documenti ed autori meno citati ( immediacy effect ). Ciò suggerisce l’esistenza, all’interno di ogni specialità, di un fronte di ricerca attivo, un’élite costituita da poche centinaia di individui che dominano la scena e che sono generalmente interconnessi tra loro sia attraverso accordi formali (es.: co-authorship ), sia per mezzo di reti informali di collaborazione e scambio di informazioni, esperienze, favori (invisible colleges ) .
  • LOTKA - The Frequency Distribution of Scientific Productivity (1926) - Stila una classifica degli autori ( sources ) elencati in due bibliografie di area chimico-fisica sulla base del numero di pubblicazioni ( items ) prodotte da ciascuno e osserva che la distribuzione della produttività individuale può essere descritta da: numero autori con n pubblicazioni = costante / n^2. Questo significa che esiste un’élite di scienziati molto produttivi a fronte di un gruppo di scienziati che offrono solo contributi occasionali ad un settore di ricerca: ma fino a che punto quantità e qualità sono correlate? Price cercò di dimostrare che gli scienziati molto produttivi sono anche quelli che incidono maggiormente sul progresso scientifico.
  • Alle ascisse c'è il logaritmo delle posizioni in classifica 1,2,...,nesima delle fonti in ordine decrescente di produttività, alle ordinate il numero cumulativo di articoli prodotto dalle fonti che occupano le posizioni 1,2,...,nesima. BRADFORD - Sources of Information on Specific Subjects (1934) - Stila una classifica delle riviste ( sources ) elencate in tre bibliografie di area geofisica sulla base del numero di articoli di argomento affine ( items ) pubblicati in ciascuna rivista e osserva che la distribuzione della produttività delle riviste segue uno schema analogo a quello trovato da Lotka per la produttività degli autori, in particolare: 1) esiste un piccolo nucleo (core) di riviste che produce la maggior parte di letteratura su un dato argomento; 2) per recuperare un numero maggiore di articoli sullo stesso argomento (ed eventualmente per ottenere la copertura bibliografica totale) è necessario ricorrere ad un numero di riviste periferiche che cresce in maniera esponenziale
  • Garfield, Eugene. Citation Indexing: its Theory and Application in Science, Technology, and Humanities (Philadelphia: ISI Press, 1983), p. 23 L’immagine dello scienziato sommerso da un mare in di letteratura scientifica è un mito: la letteratura che conta in ogni disciplina è concentrata in poche centinaia di titoli
  • esempio: http://www.slideshare.net/kosson/the-deluge-man-no-animation-no-sound
  • Differenza di prospettiva tra bibliometria e biblioteconomia o teoria economica: nel primo caso interessa la testa della distribuzione, nel secondo la coda (La coda lunga di Chris Anderson ). DIGRESSIONE SU BIBLIOMETRIA E ACQUISTI IN BIBLIOTECA: A) ACQUISTO PERIODICI IN UNA BIBLIOTECA SPECIALIZZATA E' ovvio che i criteri fondamentali di selezione e scarto applicati dai bibliotecari, fermi restando i vincoli del budget, si basano sui giudizi formulati da un comitato di esperti nelle varie materie. Loro stabiliscono quali sono i titoli che non possono assolutamente mancare ed è giusto che sia così anche se le valutazioni hanno comunque una validità limitata per due ragioni: 1) sono influenzate dagli interessi disciplinari dei componenti del comitato (se ci sono molti gastroenterologi e nessun ortopedico difficilmente sarà perorata la causa delle riviste di ortopedia); 2) sono influenzate dalla composizione dei pacchetti di periodici venduti in bundle da Elsevier, Springer, Wiley, ACS. Lo strumento bibliometrico non interviene a questo livello ma solo quando bisogna allargare la scelta a riviste nuove la cui qualità non è facile da determinare. A questo punto illustriamo il JCR con analisi della scheda di AMERICAN JOURNAL OF GASTROENTEROLOGY E GASTROENTEROLOGY. B) ORIGINALITA' DI UN FONDO DOCUMENTARIO Siamo già in grado di dare una risposta al case study n. 2: Innanzitutto esiste un'utilita' molto limitata per un indicatore di originalita' della letteratura grigia: cio' che passa da editori grigi e' per definizione ''originale'', nel senso che e' stato generalmente prodotto per esigenze locali, di qualunque tipo esse siano (didattica, aggiornamento, comunicazione interna etc.). Di conseguenza una collezione di letteratura grigia e' per definizione (non per assunto o ipotesi) originale ed ha valore di per se' in quanto documenta gli sforzi di un'istituzione, di una comunita' di studio, etc. per mantenere o corroborare un certo livello di performance in un particolare settore di studio. Se dovessi far risaltare il valore di tale collezione io punterei molto sull'aspetto istituzionale: quante e quali strutture hanno avuto bisogno di pubblicare materiale grigio per sopravvivere e crescere? Dove c'e' letteratura grigia c'e' normalmente un'intensa attivita' di ricerca che comporta anche una forte esigenza di comunicazione interna: chi, dove e quando? Si tratta di lavorare un po' sugli autori o almeno un campione di essi.   Diverso il discorso per la letteratura commerciale. Qui hanno senso degli indicatori di unicità. Le ricercatrici ne proponevano tre: 1) rapporto tra il numero delle biblioteche in cui è presente il testo e il numero delle biblioteche consultate, 2) rapporto tra biblioteche specializzate e non specializzate, 3)  rapporto tra biblioteche specializzate e numero di biblioteche in cui il testo è presente. Quello piu' appropriato dal mio punto di vista e' il RAPPORTO TRA NUMERO DI BIBLIOTECHE SPECIALIZZATE IN CUI IL TESTO E' PRESENTE E NUMERO DI BIBLIOTECHE SPECIALIZZATE IN CUI IL TESTO NON E' PRESENTE in quanto l'originalita' di una collezione specializzata puo' essere misurata solo in rapporto ad altre collezioni specializzate: un libro italiano di alcologia in una biblioteca nazionale quasi certamente si trova la' per diritto di stampa, mentre in una biblioteca pubblica e' di solito un dono dell'autore a meno che non si tratti di materiale divulgativo sull'alcolismo. Una collezione specializzata in alcologia invece non e' frutto del ''caso'', c'e' dietro un progetto tematico ed e' questo progetto che ha valore. Solo che per misurare il ''valore'' bisogna trovare un denominatore appropriato alla frazione e secondo me l'unico appropriato ad una raccolta specializzata e' il numero di items compresenti in biblioteche simili. Anche in bibliometria funziona cosi: quando c'e' da confrontare qualcosa con qualcos'altro bisogna scegliere un'unita' di misura comune (ad es.: il numero di citazioni ricevute da uno specialista di alcologia va confrontato col numero di citazioni ricevute da altri specialisti di alcologia che possibilmente lavorano su argomenti simili).   La costruzione di un indicatore di questo tipo implica lo sforzo ulteriore e per nulla banale di classificare le biblioteche SBN in specializzate e non (dove mettere una biblioteca di facolta'?). Non e' un problema insormontabile, l'importante e' spiegare bene quale criterio e' stato adottato e quali sono i difetti della scelta adottata. Ad esempio,  se per ''biblioteche consultate'' si intende ''biblioteche in SBN'' allora si deve tenere necessariamente conto del fatto che molte biblioteche non catalogano in SBN oppure sono entrate in SBN solo in anni recenti e non hanno ancora recuperato il pregresso.   Non vedo ''indicatori unici'' applicabili a tale contesto ed e' una fortuna che sia cosi' in quanto tutte le volte che si converge verso l'unicita' si fanno dei danni irreparabili (vedi usi inadeguati dell'impact factor nella valutazione della ricerca). Fossi in voi lavorerei su due livelli:   a) approfondimento dell'indicatore 2) di originalita', magari estendendo la ricerca del posseduto anche ai cataloghi di biblioteche non-SBN; b) uso della cosiddetta ''lista di controllo'' e di un indicatore basato su di essa (questo lo consigliava diversi anni fa anche il manuale Measuring Quality dell'IFLA): ovvero percentuale di documenti posseduti che soddisfano una lista precompilata di titoli ''importanti'' nel settore dell'alcologia (puo' essere una bibliografia di settore tratta da fonti accreditate o anche compilata da esperti).   Ovviamente l'indicatore b) puo' essere interpretato al rovescio, cioe' nel senso: percentuale di documenti posseduti che soddisfano una lista di libri oramai ''fuori commercio'' e quindi introvabili.
  • Aumentando la dimensione del campione , qualunque sia la distribuzione delle variabili casuali sotto osservazione (leggi: indipendentemente dalla variabilità degli stili citazionali e delle motivazioni individuali per citare), la somma di tali variabili (leggi: le misure citazionali aggregate), nell’ipotesi che la varianza sia finita, è una variabile con distribuzione approssimativamente normale (leggi: si possono applicare strumenti statistici standard come correlazione e regressione per stabilire la significatività di tali misure).
  • ISI Web of Science : Accessibile a pagamento attraverso la piattaforma Thomson Reuters Web Of Knowledge . E' l'erede degli indici di citazioni inventati da Eugene Garfield negli anni '60 e comprende, oltre ai tradizionali Science Citation Index Expanded, Social Sciences Citation Index, Arts & Humanities Citation Index, un Conference Proceedings Citation Index per l'analisi citazionale degli atti di convegni, ed il Journal Citation Reports per il calcolo dell' Impact Factor delle riviste. Per lo Science Citation Index Expanded ed il Social Science Citation Index esistono backfiles a partire dal 1900. Scopus : Lanciato nel novembre 2004, è accessibile a pagamento attraverso la piattaforma SciVerse di Elsevier. Indicizza le bibliografie di circa 16.500 riviste scientifiche internazionali con copertura (per l'analisi citazionale) dal 1995. Google Scholar : Lanciato quasi in simultanea con Scopus , è accessibile gratuitamente a partire dalla home page del popolare motore di ricerca. Indicizza il testo completo e le citazioni bibliografiche di una vasta mole di letteratura scientifica online per la quale tuttavia restano ignoti i dettagli circa la copertura e le fonti dell'analisi citazionale. ISI Web of Science e Scopus adottano criteri di selezione più tradizionali Google Scholar non dichiara le fonti ma indicizza le citazioni di tipologie più varie di materiali
  • Sul punto 2 si può accennare all’effetto S. Matteo: prende molte citazioni -> è un ricercatore prestigioso; è un ricercatore prestigioso / socialmente alto -> prende molte citazioni (che dipendono dalla sua posizione sociale)? (Matteo 13,12: Così a chi ha sarà dato e sarà nell'abbondanza; e a chi non ha sarà tolto anche quello che ha) vengono utilizzate a vari livelli (autori individuali, gruppi di ricerca, università, nazioni), ad esempio per le università: 1) http://www.timeshighereducation.co.uk/world-university-rankings/: l'Italia non è tra le prime 200 le citazioni contano per un 32% 2) http://www.arwu.org/indexs.jsp (Università di Shangai): la prima italiana è Milano collocata tra 101 esimo e 150esimo il numero di highly cited papers conta un 20%
  • 1) più si cita più si può essere citati 2) un documento/autore più anziano ha avuto maggiore tempo di esposizione 3) in medicina le rassegne e gli articoli metodologici sono più citati dei research papers 4) hot topics su cui si concentrano molti ricercatori 5) in alcuni campi (fisica, area biomedica) si autocita molto: e’ normale proseguire una linea di ricerca 6) gli studi nati da multi-collaborazione sono più citati ma non esiste accordo su come suddividere la responsabilità (vedi esempio articolo JAMA: http://jama.ama-assn.org/cgi/content/full/302/4/385#AUTHINFO con responsabilità chiaramente ripartite)
  • INDICATORI RELATIVI: ad es. si confronta il citation score di un gruppo di ricerca con il numero medio di citazioni degli articoli pubblicati su tutte le riviste utilizzate dai suoi membri
  • Non siamo più al livello del singolo documento ma della rivista. Le fonti sono tutte le riviste di cui l'ISI Thomson Reuters indicizza le citazioni Perché un rapporto e non un crudo numero di citazioni? Per evitare il bias delle riviste che pubblicano molti articoli rispetto a quelle che ne pubblicano pochi. Perché 2 anni anziché 5, 6, 10? Per evitare il bias a favore di riviste più vecchie che hanno pubblicato in passato articoli molto citati E' una misura ''democratica'' nei confronti di riviste più giovani E' una misura adatta alle riviste nelle scienze naturali e biomediche dove il picco di citazioni per un contributo arriva di solito dopo due anni E’ accompagnato da IMMEDIACY INDEX, CITED HALF LIFE, CITING HALF LIFE: IMMEDIACY INDEX The immediacy index is calculated based on the papers published in a journal in a single calendar year. For example, the 2005 immediacy index for a journal would be calculated as follows: A = the number of times articles published in 2005 were cited in indexed journals during 2005 B = the number of articles, reviews, proceedings or notes published in 2005 2005 immediacy index = A / B As with the impact factor, there are some nuances to this: ISI excludes certain article types (such as news items, correspondence, and errata) from the denominator. CITED HALF LIFE Cited half-life is a measurement used to estimate the impact of a journal. It is the number of years, going back from the current year, that account for 50% of the total citations received by the cited journal in the current year. ISI developed this calculation to provide an indicator as to the long-term value of source items in a single journal publication. CITING HALF LIFE The citing half-life is the median age of articles cited by the journal in the JCR year. For example, in JCR 2003, the journal Food Biotechnology has a citing half-life of 9.0. That means that 50% of all articles cited by articles in Food Biotechnology in 2003 were published between 1995 and 2003 (inclusive). NUOVI INDICATORI CALCOLATI DAL JCR CHE FANNO DA COMPLEMENTO ALL’IF: EIGENFACTOR SCORE The Eigenfactor Score calculation is based on the number of times articles from the journal published in the past five years have been cited in the JCR year, but it also considers which journals have contributed these citations so that highly cited journals will influence the network more than lesser cited journals.  References from one article in a journal to another article from the same journal are removed, so that Eigenfactor Scores are not influenced by journal self-citation.  ARTICLE INFLUENCE SCORE The Article Influence determines the average influence of a journal's articles over the first five years after publication.  It is calculated by dividing a journal’s Eigenfactor Score by the number of articles in the journal.  This measure is roughly analogous to the 5-Year Journal Impact Factor in that it is a ratio of a journal’s citation influence to the size of the journal’s article contribution over a period of five years. The mean Article Influence Score is 1.00. A score greater than 1.00 indicates that each article in the journal has above-average influence. A score less than 1.00 indicates that each article in the journal has below-average influence.
  • 1) richiamo ai presupposti matematici: l’alto IF dipenderà dall’alto numero di citazioni ricevute solo da un limitato numero di articoli 2) - tipologia di articoli pubblicati (le riviste che pubblicano molte rassegne ricevono in media più citazioni delle altre); - tasso di autocitazione delle riviste. 3) INTEGRITA': dati posseduti da una multinazionale, non è possibile verificarli; ACCURATEZZA: l’IF non tiene conto di scissioni, fusioni, cambiamenti di titolo GESTIONE DEI CAMBI DI TITOLO After a title change, two JCR years must pass before the new title fully replaces the previous title in JCR. In the first year after a journal title change, the new title is listed with an Immediacy Index but no impact factor because the article count for the two preceding years, used in Impact Factor calculations, is zero. The superseded title is listed with a normal two-year Impact Factor. One year later, JCR lists separate impact factors for the new title and for the superseded title, but only the new title will have an Immediacy Index. In this second year, the Impact Factor for a new title may be lower than expected because the article count includes only earlier articles. Similarly, the Impact Factor for the superseded title may be higher than expected because it is based upon only older articles. To calculate a unified Impact Factor, you can total the cites to the two previous years and divide that by the sum of the article counts for the two titles. For a listing of journal title changes, where both the new title and the superseded title appear in JCR, see the Journal Title Changes page, which is accessible from the Journal page, the Journal Search page and the Summary List page). Esempio:  NAT CLIN PRACT GASTR  changed to  NAT REV GASTRO HEPAT nel 2009 Il secondo (NAT REV GASTRO HEPAT) risulta avere IF nullo, in realtà è una delle più importanti riviste di gastroenterologia, infatti se si cerca NAT CLIN PRACT GASTR si trova un IF = 4.520. Come si fa se devo elencare tra i titoli di un CV l'IF di NAT REV GASTRO HEPAT ??? Siccome la rivista ha cambiato titolo nel 2009 e gli anni rilevanti per il calcolo dell'IF sono 2007 e 2008 non c'è problema, l'IF 2009 da comunicare è quello del vecchio titolo. Ma se devo comunicare l'IF 2010 allora le cose cambiano perché devo tenere conto del cambiamento di titolo, quindi si fa un conteggio manuale: A = NUMERO DI CITAZIONI RICEVUTE DAL TITOLO 2008 (NAT CLIN PRACT GASTR ) NEL 2010 B = NUMERO DI CITAZIONI RICEVUTE DAL TITOLO 2009 ( NAT REV GASTRO HEPAT) NEL 2010 C = NUMERO DI ARTICOLI PUBBLICATI NEL 2008 COL VECCHIO TITOLO (NAT CLIN PRACT GASTR) C = NUMERO DI ARTICOLI PUBBLICATI NEL 2008 COL NUOVO TITOLO ( NAT REV GASTRO HEPAT ) IF 2010 = A+B / C+D NUOVI INDICATORI CALCOLATI DAL JCR CHE FANNO DA COMPLEMENTO ALL’IF: EIGENFACTOR SCORE The Eigenfactor Score calculation is based on the number of times articles from the journal published in the past five years have been cited in the JCR year, but it also considers which journals have contributed these citations so that highly cited journals will influence the network more than lesser cited journals.  References from one article in a journal to another article from the same journal are removed, so that Eigenfactor Scores are not influenced by journal self-citation.  ARTICLE INFLUENCE SCORE The Article Influence determines the average influence of a journal's articles over the first five years after publication.  It is calculated by dividing a journal’s Eigenfactor Score by the number of articles in the journal.  This measure is roughly analogous to the 5-Year Journal Impact Factor in that it is a ratio of a journal’s citation influence to the size of the journal’s article contribution over a period of five years. The mean Article Influence Score is 1.00. A score greater than 1.00 indicates that each article in the journal has above-average influence. A score less than 1.00 indicates that each article in the journal has below-average influence.
  • 1) quantità di pubblicazioni e impatto 2) calcolato automaticamente in WoS e Scopus 3) chi pubblica poco, anche se molto citato, ha un h piccolo al pari di chi pubblica molto ricevendo poche citazioni 4) Poynard et al. (2010): l’h degli autori di 474 articoli sulla cirrosi epatica o epatite pubblicati tra il 1945 e il 1999 è positivamente correlato con il rigore metodologico dei trial clinici, la correttezza delle conclusioni ed il valore predittivo, ma non necessariamente con la durata della validità di tali risultati accertata indipendentemente sulla base del giudizio di un gruppo di esperti (studio condotto da un gruppo di epatologi dell’ospedale Pierre e Marie Curie di Parigi) < http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0012044>
  • 1) chi ha pubblicato poco, magari puntando sulla qualità e l'accuratezza, è penalizzato nei confronti di chi ha pubblicato molto in passato e magari vive di rendita 2) in fisica e nelle scienze biomediche autocitazioni e paternità multipla falsano la maggior parte dei conteggi ma il DM non dice nulla al riguardo: le autocitazioni possono essere eliminate in modo relativamente facile mentre non c'è nessun accordo su come attribuire i crediti nel caso di autori multipli: dividere 1/numero di autori o contare 1 per tutti? 3) il database dovrebbe essere sufficientemente completo da coprire tutta la carriera scientifica del candidato; Jacso (2008) ha calcolato gli h index di Jorge H. Hirsch e ha ottenuto 8 risultati diversi su 8 database: 51 su WoS; 41 su Astrophysics Data System; 38 su Google Scholar; 33 su Scopus.
  • IL PROBLEMA FONDAMENTALE DEGLI INDICI DI CITAZIONI: per motivi economici e di tempo, il record che si va a creare per ogni citazione indicizzata non è mai completo, ci si limita ai dati che si trovano citati senza ulteriore approfondimento. Inoltre non si effettuano controlli rigorosi sul marching CITING-CITED Se, ad esempio, in bibliografia c’è un articolo citato in modo approssimativo, nessun controllo bibliografico ulteriore viene compiuto sui nomi autori, titolo, pagine, etc. a meno che quell’articolo non sia esso stesso una fonte. Esempio: Pink L., Orange K., White J. et al., Why the sky is not so blue anymore. Journal of Skyology 2010 22: 245-70 Pink LW, Orange KC., White J. et al., Why the sky is not so blue anymore. Journal of Skyology 2010 22(3): 245-70 Pink L. et al., Why the sky is not so blue anymore. Journal of Skyology 22(4): 245-70 Pink L. et al., Why the sky is not so blue anymore. Journal of Skiology 22(4): 245-70 danno luogo a 4 record diversi
  • La ricerca per citazione, a differenza di quella tradizionale, si muove sia in avanti che indietro nel tempo e permette anche di associare (quindi recuperare) articoli che, per "affinità elettive", citano lo stesso documento. Quando è utile: Quando si ha in mano un articolo perfettamente centrato sull'argomento della propria ricerca e si vuole risalire velocemente ad altri articoli più recenti di argomento affine. Quando, per la particolarità dell'argomento, la bibliografia ricavata da database tradizionali è scarsa o nulla. Ad esempio, se la ricerca ha un'impostazione interdisciplinare e le riviste potrebbero essere indicizzate in database diversi da quelli di medicina (ad es.: psicologia sociale, space biology ).
  • L'ARTICOLO PIU' CITATO NELLA STORIA DELLA SCIENZA: Oliver Lowry’s 1951 method for measuring the amount of proteins in solutions. On the admission of Lowry himself, that paper contained “almost nothing original,” and its citation score didn’t signify to him any great scientific accomplishment. Siamo in grado di rispondere al case study 3: una bibliografia ordinata per citazione non è il modo migliore per scremare la letteratura su un certo argomento quando i risultati sono tanti. FACCIO UNA PROVA ALL'INTERNO DI ISI WEB OF SCIENCE cerco come TITLE OR TOPIC shoulder dislocation ottengo come risultato una lista i cui primi due articoli sono usciti nel 1992. Avrebbe più senso individuare le riviste piu' importanti del settore (che sono anche le più citate) e restringere la MEDLINE con i titoli di rivista. Potrei utilizzare il servizio PubFocus (http://pubfocus.com/) ma non è chiaro l'algoritmo con cui lavora e ci mette molto tempo ad elaborare i risultati,
  • ISI Web of Science : Accessibile a pagamento attraverso la piattaforma Thomson Reuters Web Of Knowledge . E' l'erede degli indici di citazioni inventati da Eugene Garfield negli anni '60 e comprende, oltre ai tradizionali Science Citation Index Expanded, Social Sciences Citation Index, Arts & Humanities Citation Index, un Conference Proceedings Citation Index per l'analisi citazionale degli atti di convegni, ed il Journal Citation Reports per il calcolo dell' Impact Factor delle riviste. Per lo Science Citation Index Expanded ed il Social Science Citation Index esistono backfiles a partire dal 1900. Scopus : Lanciato nel novembre 2004, è accessibile a pagamento attraverso la piattaforma SciVerse di Elsevier. Indicizza le bibliografie di circa 16.500 riviste scientifiche internazionali con copertura (per l'analisi citazionale) dal 1995. Google Scholar : Lanciato quasi in simultanea con Scopus , è accessibile gratuitamente a partire dalla home page del popolare motore di ricerca. Indicizza il testo completo e le citazioni bibliografiche di una vasta mole di letteratura scientifica online per la quale tuttavia restano ignoti i dettagli circa la copertura e le fonti dell'analisi citazionale. ISI Web of Science e Scopus adottano criteri di selezione più tradizionali Google Scholar non dichiara le fonti ma indicizza le citazioni di tipologie più varie di materiali INDICI DISCIPLINARI SPIRES HEP / INSPIRE per la fisica delle alte energie; Scitation per la fisica, la chimica, le geoscienze e diversi settori dell'ingegneria; MathSciNet per la matematica; CiteSeer x e IEEE Xplore per l'informatica e l'ingegneria elettrica ed elettronica; Citebase per la fisica ed alcune aree della biologia; Chemical Abstract Service (CAS) per la chimica (accessibile a pagamento attraverso strumenti analitici come SciFinder e STN ); SAO/NASA Astrophysics Data System (ADS) per l'astronomia; Psyc INFO per la psicologia (indicizza anche capitoli di monografie e atti di convegni) CINHAL per le scienze infermieristiche RePEc (Research Papers in Economics) per l'economia.
  • 1) Dimensioni del database reference enhanced : MegaFile di EBSCO contiene circa lo stesso numero di record di Scopus e un numero maggiore di record dell'edizione 1980-2010 di WoS ma la parte reference enhanced è solo il 2%. Sotto questo profilo il confronto tra WoS e Scopus è impari: WoS è stato pensato e strutturato appositamente per la ricerca per citazioni 2) Copertura temporale: se si vuole studiare l'impatto citazionale di fisici Nobel agli inizi del '900 nessuno dei database va bene. 3) Le bibliografie hanno normalmente un'impostazione disciplinare, le citazioni no, si può essere citati anche da documenti di tutt'altra area disciplinare rispetto a quella in cui si scrive, un database è tanto migliore quanto maggiore il numero delle discipline che copre: gli indici disciplinari possono andare bene se l'area in cui pubblica l'autore è ben delimitata: ad es., per un fisico delle particelle SPIRES/INSPIRE di Stanford può fornire un calcolo affidabile; per Jorge H. Hirsch non va bene perché il suo articolo più citato (quello sull'indice) riceve citazioni anche da riviste di area biomedica e storico-sociale. 4) Tipologia di documenti indicizzati: per l'area umanistica e storico sociale, ma anche per alcuni settori dell'area biomedica come la psicologia, un buon database dovrebbe indicizzare anche le citazioni di bibliografie e atti di convegni 5) Comprende due problemi: a) Gli stili citazionali delle riviste sono molto diversi, variando l'abbreviazione della rivista, la punteggiatura, il numero di autori citati quando sono più di due o tre, il modo di scrivere i nomi autori se traslitterati o composti e così via. Non sempre il software che effetua l'analisi delle bibliografie è in grado di riconoscere che due citazioni apparentemente diverse si riferiscono ad uno stesso documento, esistono pertanto citazioni isolate (stray references) che non vengono tenute in considerazione nel calcolo del numero di citazioni (quindi tutti gli indicatori derivati). b) Esiste poi il problema delle citazioni orfane (orphan references), ovvero citazioni di articoli di riviste che non sono a loro volta fonti e citazioni di oggetti diversi dall'articolo di rivista (libri, relazioni di convegni, report, pagine web etc.): IN TUTTI QUESTI CASI IL CALCOLO DEGLI INDICATORI ANDREBBE FATTO MANUALMENTE SENZA FIDARSI DELLE CIFRE FORNITE IN AUTOMATICO DAL SISTEMA PERCHE' UN AUTORE POTREBBE AVER SCRITTO UN LIBRO MOLTO CITATO CHE PERO', NON ESSENDO FONTE INDICIZZATA, NON RISULTA AVERE IMPATTO CITAZIONALE. L'ISI ad esempio non cataloga tutti gli autori delle cited references a meno che non si tratti di ''source item'', cioe' di articoli di riviste a loro volta spogliate dall'ISI (in realta' per molto tempo nemmeno quelli). Negli altri casi cataloga solo il primo anche perche' nelle bibliografie OCR-ate dai loro scanner abbondano gli ''et al.'' Questo significa che per avere risultati precisi bisogna fare piu' ricerche incrociate (per primo autore dell'articolo) e assemblare i risultati nella marked list prima di passare al calcolo degli indicatori.
  • DICHIARARE SEMPRE L’EDIZIONE USATA PER IL CALCOLO DEGLI INDICATORI QUANDO SI CERCA PER NOME AUTORE: Cognome N (niente punteggiatura, se necessario un asterisco dopo N) E’ BUONA NORMA INVERTIRE L’ORDINE DELLE INIZIALI (NOME E MIDDLE INITIAL) IN MODO DA RECUPERARE ANCHE CITAZIONI CON AUTORE ERRATO, ad es. “Lancaster FW” ma anche “Lancaster WF” CRITERI DI SELEZIONE DELLE FONTI QUALITATIVI : giudizio di un comitato di esperti , reputazione scientifica dell'editore e del comitato di redazione; formato dei dati bibliografici predisposto alla codifica e all'elaborazione computerizzata; rispetto di alcuni standard editoriali di base (puntualità dei fascicoli, accuratezza e completezza dei dati bibliografici, inclusione di indici e abstract in lingua inglese); QUANTITATIVI : impatto citazionale della rivista lungo un certo arco di tempo ( Impact Factor ).
  • SJR = SCIMAGO JOURNAL RANK: è simile all’IF in quanto rapporto tra citazioni ricevute e numero di articoli ma: 1) si calcola su tre anni anziché su due; 2) si basa su un algoritmo simile a PageRank di Google: le citazioni ricevute ricevono un peso maggiore se provengono da riviste a loro volta più citate delle altre; 3) non calcola le auto-citazioni; 4) non distingue gli articoli citabili dagli altri SNIP = SOURCE NORMALIZED IMPACT PER PAPER / sviluppato dal CWTS di Leida = tiene conto di due fattori trascurati dal JIF = il numero medio di riferimenti bibliografici per articolo di una data area disciplinare e la copertura del database. E’ definito come rapporto tra numero medio di citazioni (per articolo) ricevute in un dato anno dagli articoli pubblicati nei tre anni precedenti (RAW IMPACT PER PAPER) e potenziale citazionale relativo del database nel dominio disciplinare della rivista (RELATIVE DATABASE CITATION POTENTIAL IN THE JOURNAL’S SUBFIELD) dove il subject field citation potential è definito come il numero medio di riferimenti bibliografici per articolo del dominio disciplinare ed il dominio disciplinare ( subject field ) di una rivista è definito come l’insieme degli articoli che citano quella rivista. Quindi il citation potential di un subject field è il numero medio di riferimenti bibliografici per articolo nel subject field e dipende dalla copertura del database in quel particolare subject field .
  • Esclude dal calcolo del h index tutte le pubblicazioni anteriori al 1996 anche se sono state molto citate negli anni successivi
  • QUANDO SI CERCA PER NOME AUTORE: la punteggiatura è ignorata, “FW Lancaster” e “F.W. Lancaster” danno gli stessi risultati MA BISOGNA RICORDARSI DI METTERE TRA VIRGOLETTE LA STRINGA ALTRIMENTI VENGONO CERCATI ANCHE ALTRI LANCASTER Sottolineare i vantaggi per chi fa document delivery del link alle versioni alternative di un articolo non OA
  • Due assurdità di GS: 1) funzionamento dell'operatore OR: lancaster -> 668.000 record lancaster OR lancester -> 524.000 2) se si cerca per autore "online" o "sign" vengono trovati tanti record
  • (1) Gavel & Iselid (2008) (2) Norris & Oppenheim (2007) sulla preferibilità di Scopus per le scienze sociali in generale; Gorraiz & Schloegel (2008) per la farmacologia; López-Illescas, de Moya-Anegón, & Moed (2008) per l’oncologia; Meho & Rogers (2008) per gli studi sull’interazione uomo-computer (3) Levine-Clark & Gil (2009)
  • (4) Bar-Ilan, Levene & Lin (2007) sulla similarità di risultati tra WoS e Scopus: studiano un campione di 22 ricercatori israeliani molto citati; (5) Torres-Salinas et al. (?) trova una percentuale del 15% superiore di citazioni in Scopus per un campione di articoli biomedici dell’Università di Navarra; Meho & Rogers (2008) trova un h più alto in Scopus per 22 top ricercatori sull’interazione uomo-computer (6) Meho & Young (2007): comparano i citation scores di 25 facoltà di LIS
  • Jacsó, P. (2008). "Testing the calculation of a realistic h-index in Google Scholar, Scopus, and Web of Science for F. W. Lancaster." Library Trends 56 (4): 784-815. p. 787
  • Comprende due problemi: a) Gli stili citazionali delle riviste sono molto diversi, variando l'abbreviazione della rivista, la punteggiatura, il numero di autori citati quando sono più di due o tre, il modo di scrivere i nomi autori se traslitterati o composti e così via. Non sempre il software che effetua l'analisi delle bibliografie è in grado di riconoscere che due citazioni apparentemente diverse si riferiscono ad uno stesso documento, esistono pertanto citazioni isolate (stray references) che non vengono tenute in considerazione nel calcolo del numero di citazioni (quindi tutti gli indicatori derivati). b) Esiste poi il problema delle citazioni orfane (orphan references), ovvero citazioni di articoli di riviste che non sono a loro volta fonti e citazioni di oggetti diversi dall'articolo di rivista (libri, relazioni di convegni, report, pagine web etc.): IN TUTTI QUESTI CASI IL CALCOLO DEGLI INDICATORI ANDREBBE FATTO MANUALMENTE SENZA FIDARSI DELLE CIFRE FORNITE IN AUTOMATICO DAL SISTEMA PERCHE' UN AUTORE POTREBBE AVER SCRITTO UN LIBRO MOLTO CITATO CHE PERO', NON ESSENDO FONTE INDICIZZATA, NON RISULTA AVERE IMPATTO CITAZIONALE. L'ISI ad esempio non cataloga tutti gli autori delle cited references a meno che non si tratti di ''source item'', cioe' di articoli di riviste a loro volta spogliate dall'ISI (in realta' per molto tempo nemmeno quelli). Negli altri casi cataloga solo il primo anche perche' nelle bibliografie OCR-ate dai loro scanner abbondano gli ''et al.'' Questo significa che per avere risultati precisi bisogna fare piu' ricerche incrociate (per primo autore dell'articolo) e assemblare i risultati nella marked list prima di passare al calcolo degli indicatori. LA COSA MIGLIORE E’ PARTIRE DAL CURRICULUM DELL’AUTORE, effettuare cited reference search per ogni documento e calcolare manualmente l'indice.
  • Quando decido di indicizzare solo articoli di un certo numero di riviste internazionali faccio una scelta di campo molto precisa dando per scontato che: le riviste selezionate sono un campione rappresentativo della produzione scientifica della comunità di studiosi; l’articolo di rivista è il principale strumento di comunicazione adottato dagli studiosi (chiaramente falso per le scienze sociali e umane ma non solo).
  • Mettetevi nei panni di un bibliotecario che riceve una richiesta di calcolo dell’ h per un autore che non conosce bene. E’ un ricercatore operante prevalentemente nel settore della gastroenterologia, epatopatie ed oncologia, la sua attività scientifica dal 1984 a oggi riguarda i seguenti settori: Epidemiologia, Cinetica cellulare, Biologia molecolare e Genetica Formale dei Tumori Colorettali, con particolare riferimento alle neoplasie su base ereditaria. A) WEB OF SCIENCE 1) INTERROGHIAMO PRIMA MEDLINE, in generale un database bibliografico appropriato per la disciplina. Si trovano due forme PONZ DE LEON M (forma preferita cn cui l'autore si identifica negli articoli) e DE LEON MP, in entrambi i casi corrispondenti all’autore. Esistono inoltre anche uno o più “de leon m” che lavorano in altri ambiti ma che avrei dovuto tenere in considerazione se non conoscessi un minimo l’autore. 2) passiamo a WoS ed effettuiamo una ricerca nel campo AUTHOR usando PONZ DE LEON M si trova solo un articolo del 2010 Stage I colorectal carcinoma: VEGF immunohistochemical expression che tuttavia non rappresenta un problema per il calcolo dell’ h in quanto risulta citato zero volte usando DE LEON MP si trovano 134 risultati, è il set su cui devo lavorare La funzione VIEW DISTINCT AUTHOR SETS dovrebbe aiutare a identificare tutti i record di articoli scritti dallo stesso autore ma in questo caso, a parte un articolo che risulta pubblicato nel dominio PHYSICAL SCIENCES, tutti gli altri sono di area biomedica e non possono essere disambiguati senza conoscere un minimo di curriculum dell’autore LA PRIMA OPERAZIONE DA FARE (in ottica bibliometrica / non di ricerca bibliografica): ordino i risultati per TIMES CITED = NUMERO DI CITAZIONI RICEVUTE Dando un’occhiata alle SUBJECT AREAS sulla sinistra, clicco su MORE OPTIONS e comincio a raffinare la ricerca: i risultati comprendono anche articoli di AGRICOLTURA, CHIMICA APPLICATA, PALEONTOLOGIA che posso escludere con relativa tranquillità (le seleziono e clicco su EXCLUDE), restano 132 record. In teoria potrei utilizzare il filtro INSTITUTIONS per escludere gli autori di istituzioni diverse da quella in cui l’autore ha lavorato, ma bisogna tener conto di come è costruito questo campo: è quasi sempre l’istituzione di appartenenza dell’autore primo nominato sul record bibliografico o sulla prima pagina dell’articolo, quindi nel caso di articoli nati da collaborazioni internazionali è fuorviante. Analogamente potrei utilizzare il filtro SOURCES per escludere le riviste su cui sicuramente l’autore non ha pubblicato, ma per essere sicuro, nel caso di autori con oltre 100 pubblicazioni, dovrei avere in mano il curriculum. I primi due articoli in ordine di TIMES CITED possono essere subito esclusi perché, nonostante pubblicati su NATURE e SCIENCE, parlano di ominidi e potrebbero essere chiaramente esclusi dal conteggio, tuttavia a questo punto è inutile procedere manualmente perché WoS implementa la funzione CREATE CITATION REPORT che calcola in automatico una serie di indici, tra cui l’h, e poi mi da la possibilità di escludere manualmente i record non rilevanti. A questo punto COMINCIO AD ESCLUDERE UNO AD UNO I RECORD NON RILEVANTI: basta selezionarli e cliccare su GO- Escludo i due articoli sugli ominidi, escludo anche i tre sul JOURNAL OF VIROLOGY sulla prima pagina (guardando il record vedo che si tratta di ricercatori delle PENN UNIVERSITY) ed i 4 di JOURNAL OF VIROLOGY e VIROLOGY sulla pagina successiva Escludo anche il record 22 di un articolo pubblicato su ALLERGY che proviene da un gruppo di ricerca australiano. Mi fermo a scopo didattico e calcolo gli indicatori. INDICATORI CALCOLATI DAL CITATION REPORT (NON ESCLUDO LE AUTOCITAZIONI PERCHE’ IL TESTO DEL DECRETO NON DICE NIENTE AL RIGUARDO) 1) NUMERO TOTALE DI CITAZIONI = 1629 2) NUMERO MEDIO DI CITAZIONI PER PUBBLICAZIONE = 13.81 3) IMPACT FACTOR TOTALE: NON C’E’ MODO DI CALCOLARLO AUTOMATICAMENTE Serve la lista di tutte le riviste in cui l’autore ha pubblicato ed il numero complessivo degli articoli. Conviene ordinare la lista per SOURCE TITLE, tirare giù l’elenco delle riviste, se possibile con ISSN, e passare al JCR. Il modulo di ricerca non funziona bene, bisogna conoscere il titolo completo della rivista e l’abbreviazione esatta secondo WoS (che è diversa dall’abbreviazione MEDLINE). Far vedere che ad es. AM J GASTROENTEROL e AMERICAN JOURNAL OF GASTROENTEROLOGY li trova mentre non trova niente con AM* J* GASTRO; inoltre l’abbreviazione del New England Journal of Medicine non è “N Engl J Med” o “NEJM” (MEDLINE) ma “New Engl J Med” . 4) IMPACT FACTOR MEDIO PER PUBBLICAZIONE: NON C’E’ MODO DI CALCOLARLO AUTOMATICAMENTE Serve la lista di tutte le riviste in cui l’autore ha pubblicato ed il numero complessivo degli articoli = 94 5) INDICE DI HIRSCH E SIMILI All’altezza del 22esimo record vedo una linea verde: e’ quella che designa il mio indice h per M Ponz de Leon: ha scritto 22 articoli citati almeno un numero di volte maggiore o uguale a 22 Qui entra in gioco L’AVVERTENZA PIU’ IMPORTANTE DI TUTTE: “This report reflects citations to source items indexed within Web of Science. Perform a Cited Reference Search to include citations to items not indexed within Web of Science“ Pertanto per essere sicuro di non lasciare fuori niente devo fare UNA CITED REFERENCE SEARCH: in questo caso sono a posto perché ogni citazione (tranne una non sua) registrata è anche una fonte, quindi il calcolatore automatico ne ha tenuto conto. Non risultano citazioni ai suoi due libri: 1) Familial and hereditary tumors -Springer-Verlag, Volume, 347 pagine, 1994; 2) Tumori: una sfida per il XXI secolo - Springer Italia Volume di 269 pagine, 1997. PER RESTRINGERE IL CALCOLO ALLE PUBBLICAZIONI DEGLI ULTIMI DIECI ANNI AL MOMENTO DI EFFETTUARE LA RICERCA DEVO SELEZIONARE "2000-2010" IN YEAR PUBLISHED E METTERLO IN AND CON "DE LEON MP" B) SCOPUS Nella AUTHOR SEARCH compilo i campi cognome PONZ DE LEON e nome M. Potrei restringere per INSTITUTION ma l’usanza di indicare la provenienza per tutti gli autori elencati nella byline è relativamente recente. Ottengo 19 entries per PONZ DE LEON, di cui solo la 19esima associata a 217 documenti ... perché? Il software di SCOPUS utilizza un algoritmo per identificare come unico autore le tante varianti di nomi simili che compaiono negli articoli: appartenenza istituzionale ( affiliation), indirizzo, dominio disciplinare, titolo della rivista, date di pubblicazione, citazioni, e coautori. Tutte sembrano riferirsi allo stesso autore, il nostro PONZ, quindi le seleziono e creo una CITATION OVERVIEW, ma lui mi dice che c’è un limite di 14, pertanto ne devo eliminare 5: DEVO FARE ATTENZIONE A NON ELIMINARE ARTICOLI CHE POSSONO INCIDERE SULL’h-core, quindi elimino quelli che hanno meno di 20 citazioni ad esempio l’1, 2, 3, 4, 5 (attenzione NON SELEZIONARE TUTTI GLI ARTICOLI ALTRIMENTI LUI LI CONSIDERA SEMPRE PIU’ DI 15, bisogna METTERE I SEGNI DI SPUNTA UNO A UNO). Ordino i risultati per CITATION DESCENDING. Seleziono TIMESPAN 1996-2019 E ORDINO I RISULTATI PER CITATION DESCENDING - Attenzione: si tratta DELLE CITAZIONI RICEVUTE DAL 1996 AL 2010 da tutti i lavori scritti da Ponz de Leon, non delle citazioni ricevute dai lavori con anno di pubblicazione dal 1996 al 2010, per quest’ultimo limite bisogna andare nell’h graph. INDICATORI CALCOLATI DAL CITATION OVERVIEW (NON ESCLUDO LE AUTOCITAZIONI PERCHE’ IL TESTO DEL DECRETO NON DICE NIENTE AL RIGUARDO) 1) NUMERO TOTALE DI CITAZIONI = 4807 2) NUMERO MEDIO DI CITAZIONI PER PUBBLICAZIONE = 4807/240=20.02 Ottengo un h index = 33. Se visualizzo l’h graph ottengo un ennesimo esempio di distribuzione iperbolica. QUA MI PERMETTE DI RESTRINGERE L’ANALISI AI DOCUMENTI PUBBLICATI NEGLI ULTIMI DIECI ANNI e OTTENGO h=23 (senza escludere le autocitazioni). Fondamentale l’avvertenza: When an h index is calculated for the authors, articles published before 1996 are not included in the graph, because complete citation information for articles published prior to 1996 is not available in Scopus.” C) GOOGLE SCHOLAR VIA PUBLISH OR PERISH SOFTWARE Effettua una ricerca avanzata su GS e ordina i risultati per numero di citazioni. Esiste un limite di 1000 risultati per ricerca. Se scrivo solo PONZ DE LEON M nella AUTHOR IMPACT lui mi cerca anche PONZ S, DE LEON P, SMITH M, etc. quindi conviene usare le virgolette “PONZ DE LEON M”; anche così però lui mi trova LM PONZ e MP LEON. Ci sono molti articoli che non c’entrano, quindi una strategia opportuna in questo caso è delimitare per area disciplinare. Lascio selezionati solo medicina e scienze della vita. Mi trova h=29, quindi come previsto un h gonfiato rispetto agli altri due sistemi. Attenzione alla differenza tra LOOKUP e LOOKUP DIRECT: la prima cerca nella cache locale di PoP, la seconda direttamente su Google Scholar. Se si effettuano LOOKUP DIRECT multiple GS potrebbe essere sovraccaricato e risultare indisponibile per un pò. Lui calcola: Total number of papers Total number of citations Average number of citations per paper Average number of citations per author Average number of papers per author Hirsch's h-index and related parameters, shown as h-index and Hirsch a= y.yy , m= z .zz in the output. Also Zhang's e-index . Egghe's g-index , shown as g-index in the output The contemporary h-index , shown as hc-index and ac= y.yy in the output Three variations of the individual h-index , shown as hI-index , hI,norm , and hm-index in the output The age-weighted citation rate An analysis of the number of authors per paper. Citation metrics Publish or Perish calculates the following citation metrics: Total number of papers Total number of citations Average number of citations per paper Average number of citations per author Average number of papers per author Hirsch's h-index and related parameters, shown as h-index and Hirsch a= y.yy , m= z .zz in the output. Also Zhang's e-index . Egghe's g-index , shown as g-index in the output The contemporary h-index , shown as hc-index and ac= y.yy in the output Three variations of the individual h-index , shown as hI-index , hI,norm , and hm-index in the output The age-weighted citation rate An analysis of the number of authors per paper. Please note that these metrics are only as good as their input. We recommend that you consult the following topics for information about the limitations of the citation metrics and the underlying sources that Publish or Perish uses h-index The h-index was proposed by J.E. Hirsch in his paper An index to quantify an individual's scientific research output , arXiv:physics/0508025 v5 29 Sep 2005 . It is defined as follows: A scientist has index h if h of his/her Np papers have at least h citations each, and the other (Np-h) papers have no more than h citations each. It aims to measure the cumulative impact of a researcher's output by looking at the amount of citation his/her work has received. Publish or Perish calculates and displays the h index proper, its associated proportionality constant a (from Nc,tot = ah2 ), and the rate parameter m (from h ~ mn , where n is the number of years since the first publication). The properties of the h-index have been analyzed in various papers; see for example Leo Egghe and Ronald Rousseau: An informetric model for the Hirsch-index , Scientometrics, Vol. 69, No. 1 (2006), pp. 121-129 . Publish or Perish also calculates the e-index as proposed by Chun-Ting Zhang in his paper The e-index, complementing the h-index for excess citations , PLoS ONE , Vol 5, Issue 5 (May 2009), e5429. The e-index is the (square root) of the surplus of citations in the h-set beyond h2, i.e., beyond the theoretical minimum required to obtain a h-index of 'h'. The aim of the e-index is to differentiate between scientists with similar h-indices but different citation patterns. These metrics are shown as h-index , Hirsch a= y.yy , m= z .zz , and e-index in the output. g-index The g-index was proposed by Leo Egghe in his paper Theory and practice of the g-index , Scientometrics, Vol. 69, No 1 (2006), pp. 131-152. It is defined as follows: [Given a set of articles] ranked in decreasing order of the number of citations that they received, the g-index is the (unique) largest number such that the top g articles received (together) at least g2 citations. It aims to improve on the h-index by giving more weight to highly-cited articles. This metric is shown as g-index in the output. Contemporary h-index The Contemporary h-index was proposed by Antonis Sidiropoulos, Dimitrios Katsaros, and Yannis Manolopoulos in their paper Generalized h-index for disclosing latent facts in citation networks , arXiv:cs.DL/0607066 v1 13 Jul 2006 . It adds an age-related weighting to each cited article, giving (by default; this depends on the parametrization) less weight to older articles. The weighting is parametrized; the Publish or Perish implementation uses gamma =4 and delta =1, like the authors did for their experiments. This means that for an article published during the current year, its citations account four times. For an article published 4 years ago, its citations account only one time. For an article published 6 years ago, its citations account 4/6 times, and so on. This metric is shown as hc-index and ac= y.yy in the output. Individual h-index (3 variations) The Individual h-index was proposed by Pablo D. Batista, Monica G. Campiteli, Osame Kinouchi, and Alexandre S. Martinez in their paper Is it possible to compare researchers with different scientific interests? , Scientometrics , Vol 68, No. 1 (2006), pp. 179-189. It divides the standard h-index by the average number of authors in the articles that contribute to the h-index, in order to reduce the effects of co-authorship; the resulting index is called hI. Publish or Perish also implements an alternative individual h-index, hI,norm, that takes a different approach: instead of dividing the total h-index, it first normalizes the number of citations for each paper by dividing the number of citations by the number of authors for that paper, then calculates hI,norm as the h-index of the normalized citation counts. This approach is much more fine-grained than Batista et al.'s; we believe that it more accurately accounts for any co-authorship effects that might be present and that it is a better approximation of the per-author impact, which is what the original h-index set out to provide. The third variation is due to Michael Schreiber and first described in his paper To share the fame in a fair way, hm modifies h for multi-authored manuscripts , New Journal of Physics , Vol 10 (2008), 040201-1-8. Schreiber's method uses fractional paper counts instead of reduced citation counts to account for shared authorship of papers, and then determines the multi-authored hm index based on the resulting effective rank of the papers using undiluted citation counts. These metrics are shown as hI-index (Batista et al.'s), hI,norm (PoP's), and hm-index (Schreiber's) in the output. Age-weighted citation rate (AWCR, AWCRpA) and AW-index The age-weighted citation rate was inspired by Bihui Jin's note The AR-index: complementing the h-index , ISSI Newsletter , 2007, 3(1), p. 6. The AWCR measures the number of citations to an entire body of work, adjusted for the age of each individual paper. It is an age-weighted citation rate, where the number of citations to a given paper is divided by the age of that paper. Jin defines the AR-index as the square root of the sum of all age-weighted citation counts over all papers that contribute to the h-index. However, in the Publish or Perish implementation we sum over all papers instead, because we feel that this represents the impact of the total body of work more accurately. (In particular, it allows younger and as yet less cited papers to contribute to the AWCR, even though they may not yet contribute to the h-index.) The AW-index is defined as the square root of the AWCR to allow comparison with the h-index; it approximates the h-index if the (average) citation rate remains more or less constant over the years. The per-author age-weighted citation rate is similar to the plain AWCR, but is normalized to the number of authors for each paper. These metrics are shown as AWCR , AWCRpA and AW-index in the output. In particolare: e -index (Chun-Ting Zhang) e -index, where e 2 represents the ignored excess citations, in addition to the h 2 citations for h -core papers. Citation information can be completely depicted by using the h -index together with the e -index, which are independent of each other. Some other h -type indices, such as a and R , are h -dependent, have information redundancy with h , and therefore, when used together with h , mask the real differences in excess citations of different researchers. (http://www.plosone.org/article/info:doi/10.1371/journal.pone.0005429) hm-inedx (M. Schreiber) In order to take multiple co-authorship appropriately into account, a straightforward modification of the Hirsch index was recently proposed. Fractionalised counting of the papers yields an appropriate measure which is called the h m-index.

Bibliometria Presentation Transcript

  • 1. INTRODUZIONE ALLA BIBLIOMETRIA Nicola De Bellis [email_address] Università di Modena e Reggio Emilia, 11/11/2010
  • 2. BIBLIOMETRIA
    • Una metodologia d’indagine che si basa sull'analisi di documenti ma
    • non guarda al contenuto / significato / messaggio / interpretazione
    • studia le relazioni quantitative tra i documenti e gli elementi che li compongono: parole, citazioni bibliografiche, autori, istituzioni, etc.
  • 3. CONFUSIONE TERMINOLOGICA
    • Esistono molti termini riferiti alle aree di ricerca che utilizzano questa metodologia:
    • bibliometria , scientometria , informetrica , webmetrica , cybermetrica ...
  • 4. BIBLIOMETRIA E CITAZIONI
    • In anni recenti gran parte della ricerca bibliometrica si è concentrata sull'analisi statistica delle citazioni bibliografiche:
    • le citazioni indicano connessioni intellettuali tra documenti
    • il numero di citazioni ricevute da un documento fornisce un indicatore del suo impatto cognitivo
  • 5. REFERENCE & CITATION
    • Le citazioni sono il filo rosso che lega i due corsi sulla bibliometria ed i software bibliografici
    Bibliometria: punto di vista del documento citato ( citation ) Software bibliografico: punto di vista del documento citante ( reference )
  • 6. ESEMPIO: UNO A UNO A cita B in un riferimento bibliografico R Dal punto di vista di A , l’entità R è un riferimento bibliografico ( reference ) Dal punto di vista di B , l’entità R è una citazione bibliografica ( citation )
  • 7. ESEMPIO: QUATTRO A UNO Il documento/autore B riceve 4 citazioni, ovvero 4 riferimenti bibliografici di autori diversi puntano a B
  • 8. ESEMPIO: LA RETE Se aggiungo altri link citazionali ottengo una rete bibliografica che può essere analizzata con metodi matematici
  • 9.
    • Il punto di vista delle citazioni si assume dopo aver costruito un indice di citazioni:
    • si sceglie un certo numero di fonti e si indicizzano tutti i documenti citati nelle note e nelle bibliografie finali
    • si inverte la lista così ottenuta in modo da poter risalire da un particolare documento a tutte le fonti di partenza che lo hanno citato
    DA REFERENCE A CITATION
  • 10.
    • Le fonti di cui si analizzano le citazioni sono perlopiù riviste scientifiche internazionali in lingua inglese:
    • motivi storici: gli indici di citazioni sono nati per facilitare la ricerca bibliografica nelle scienze naturali e biomediche
    • convenienza: gli articoli scientifici hanno una struttura che si presta all'indicizzazione delle bibliografie
    LE FONTI
  • 11.
    • Almeno per ora:
    • l’analisi delle citazioni è applicabile solo nei settori dove regna l'articolo scientifico in lingua inglese
    • per l’area umanistica / storico sociale e per aree geografico-linguistiche non anglocentriche non esistono strumenti bibliometrici adeguati
    APPLICABILITA’
  • 12. Perché è diventata così importante in ambito accademico? ANALISI DELLE CITAZIONI
  • 13.  
  • 14. CASE STUDIES
    • Il Prof. Maurizio Ponz de Leon, Dipartimento di Medicine e Specialità Mediche dell'Università di Modena, deve presentare una richiesta di finanziamento al Ministero.
    • La richiesta può essere inoltrata solo da ricercatori con indice di Hirsch maggiore o uguale a 25 per le pubblicazioni degli ultimi dieci anni.
    • Quanto vale l'h di M. Ponz de Leon e come si fa a documentare la validità dell'indice trovato?
  • 15. CASE STUDIES Due ricercatrici del Centro Alcologico Regionale Toscano chiedono a NDB un parere bibliometrico in relazione al seguente problema: definire un indicatore di originalità per un fondo documentario specializzato in alcologia contenente sia letteratura grigia che monografie. Che relazione c’è tra indicatori bibliometrici e qualità delle collezioni?
  • 16.
    • Uno studente che si appresta a scrivere una tesi di laurea sulle dislocazioni della spalla riceve la seguente indicazione dal relatore:
    • per velocizzare la ricerca e la compilazione della bibliografia dovrà leggere e citare solo gli articoli più citati recuperati da MEDLINE.
    • E’ un suggerimento corretto? Che utilità può avere l’analisi delle citazioni per la ricerca bibliografica?
    CASE STUDIES
  • 17. OBIETTIVI DEL CORSO
    • Al termine di questa giornata dovreste essere in grado di:
    • definire i principali indicatori bibliometrici elencati nel DM (Impact Factor, indice h ,...)
    • interrogare i database necessari per calcolarli e rispondere ai quesiti 1-3
    • contestualizzare la risposta: non può essere solo un numero o una lista di documenti ordinati per numero di citazioni
  • 18. BIBLIOMETRIA PRESUPPOSTI MATEMATICI PRESUPPOSTI FILOSOFICI INDICATORI STRUMENTI: INDICI DI CITAZIONI 1 2 3 4
  • 19. PRESUPPOSTI FILOSOFICI 1
  • 20.
    • Ha senso contare le citazioni se:
    • la citazione veicola un’idea, un concetto = si cita per confermare, smentire, segnalare ... qualcosa
    • gli scienziati hanno un codice etico “interno” che gli impone di riconoscere le fonti delle loro idee citandole
    CULTURA DELLA CITAZIONE
  • 21. IL CODICE DI R.K. MERTON
    • La ricerca scientifica secondo il modello bibliometrico:
    • ispirata da criteri universali e impersonali di valutazione
    • destinata a non rimanere segreta ma a diventare bene pubblico
    • disinteressata
    • basata su affermazioni logicamente coerenti e verificate o verificabili
  • 22. IL MODELLO NORMATIVO Ricompensa Verifica e approvazione Comunicazione Ricerca e scoperta Onoreficenze Premi Peer review Citazioni Articoli Report Processi mentali
  • 23. RIDUZIONISMO
    • Dogma bibliometrico:
    • la scienza si identifica con la letteratura scientifica pubblicata
    • la letteratura scientifica pubblicata riflette l’attività di ricerca condotta in conformità al modello normativo
  • 24. QUALCOSA NON VA
    • Il modello normativo trascura:
    • violazioni delle norme = frodi, vanity press , favoritismi personali, citazioni ornamentali o reverenziali
    • attività che non lasciano traccia in letteratura: insegnamento, costruzione strumenti, coordinamento attività altrui, etc.
  • 25. PRESUPPOSTI MATEMATICI 2
  • 26. NORMALITA'
    • Molti fenomeni osservabili hanno una distribuzione normale o Gaussiana:
    • esiste un valore centrale più probabile di tutti gli altri attorno al quale si distribuiscono in maniera ordinata tutti i restanti valori
    • tale regolarità permette la formulazione di ipotesi e l’uso di test statistici collaudati
  • 27. DISTRIBUZIONE NORMALE
  • 28. ASIMMETRIA I fenomeni bibliometrici hanno invece una distribuzione profondamente asimmetrica = la maggior parte dei prodotti (pubblicazioni, citazioni) deriva da / si concentra su una piccola porzione di fonti (autori, riviste)
  • 29. DISTRIBUZIONE IPERBOLICA
  • 30. LOTKA pochi autori pubblicano la maggior parte degli articoli rilevanti per un settore di ricerca
  • 31. BRADFORD poche riviste pubblicano la maggior parte degli articoli rilevanti per un settore di ricerca
  • 32.
    • “ Talmente ampia è la sovrapposizione tra discipline, che la letteratura del nucleo di tutte le discipline scientifiche coinvolge un gruppo di non più di 1000 riviste, e può arrivare a comprenderne anche solo 500”
    • (Eugene Garfield)
    LEGGE DI CONCENTRAZIONE
  • 33.
    • Lo scienziato è sommerso da un diluvio di informazione
    • Bibliotecari, archivisti, ..., etc. sono gli unici che possono salvarlo
    IL MITO DEL DILUVIO
  • 34. LA CODA LUNGA
  • 35. CITAZIONI: UN BENE RARO Ogni anno approssimativamente il 35% dei documenti prodotti non viene mai citato, il 49% viene citato solo una volta, il 9% due volte, il 3% tre volte, il 2% quattro volte, e soltanto l’1% sei o più volte ... (D. Price) ... quindi i conteggi a livello individuale sono inaffidabili dal punto di vista statistico
  • 36.
    • Quando aumenta la dimensione del campione la variabilità individuale è bilanciata dalla regolarità del comportamento aggregato: si può allora utilizzare la distribuzione normale anche per oggetti “non-normali” ...
    • ... quindi ha senso contare le citazioni se sono tante!
    TEOREMA DEL LIMITE CENTRALE
  • 37. INDICATORI 3
  • 38.
    • Elencati nel DM:
    • numero di citazioni
    • Impact Factor
    • indice h ... e simili (?)
    • Ne esistono molti altri ma non così facili da calcolare
    I PIU’ (AB)USATI
  • 39.
    • Numero di volte in cui un documento/autore è stato citato da un gruppo selezionato di fonti:
    • è il mattone per costruire gli altri indicatori bibliometrici
    • è correlato positivamente con fattori qualitativi come peer judgement , premi, incarichi di prestigio, etc.
    NUMERO DI CITAZIONI
  • 40.
    • Dipende da fattori che non c’entrano con la qualità:
    • lunghezza media delle bibliografie
    • età
    • tipologia di documento
    • settore di ricerca e argomento
    • autocitazioni
    • multi- authorship
    DIFETTI
  • 41.
    • Le citazioni sono un bene raro, i confronti individuali risultano statisticamente non significativi, si cerca pertanto di
    • contare le citazioni a livello aggregato = rivista, gruppo di ricerca, università, etc.
    • confrontare il simile con il simile
    • costruire indicatori relativi
    L’ANTIDOTO
  • 42. Si contano le citazioni ricevute, in un dato anno, da tutti gli articoli usciti su una rivista nei due anni precedenti e si divide il risultato per il numero complessivo di articoli pubblicati in tale intervallo. La classifica delle riviste in ordine di IF esce ogni anno nel Journal Citation Reports di Thomson Reuters. IMPACT FACTOR (IF)
  • 43.
    • Non può essere utilizzato come indicatore della qualità del singolo articolo/autore:
    • non esiste l'articolo “medio” di una rivista
    • può essere gonfiato artificialmente
    • problema di integrità e accuratezza dei dati
    • Resta comunque fondamentale per definire standard disciplinari
    DIFETTI
  • 44.
    • Uno scienziato ha indice h se h degli articoli di cui è autore (o co-autore) hanno guadagnato almeno h citazioni ciascuno:
    • misura sia la quantità che la “qualità”
    • facile da calcolare
    • insensibile ai valori estremi
    • correlato positivamente con fattori qualitativi come peer judgement , rigore metodologico, etc.
    INDICE DI HIRSCH / INDICE H
  • 45.
    • Nonostante la popolarità è un indicatore molto discusso:
    • penalizza i ricercatori più giovani
    • non tiene conto di autocitazioni e multi-authorship
    • dipende dal database utilizzato
    DIFETTI
  • 46. STRUMENTI: INDICI DI CITAZIONI 4
  • 47.
    • Sono nati per facilitare le ricerche bibliografiche, dando per scontato che
    • il rapporto citante - citato è governato dal criterio di rilevanza
    • non si tratta di rilevanza stabilita da un bibliotecario ma dall'autore stesso del documento citante
    USO BIBLIOGRAFICO
  • 48. Ricerca per citazione Ricerca tradizionale per parola chiave 2002 2002 1982 paper 1957 paper 1996 paper 1982 paper 1996 paper 1957 paper 1987 paper 2010 paper 2006 paper 1993 paper
  • 49.
    • Non va confuso con l'uso bibliografico:
    • un articolo molto citato non è necessariamente più rilevante di uno meno citato
    • il ranking per citazione produce bibliografie con molti articoli vecchi
    • in alcuni settori gli articoli più citati non dicono niente di nuovo, ad es. le rassegne in medicina
    USO BIBLIOMETRICO
  • 50. Pink L., Orange K., White J. et al., Why the sky is not so blue anymore. Journal of Skyology 2010 22: 245-70 Pink LW, Orange KC., White J. et al., Why the sky is not so blue anymore. Journal of Skyology 2010 22(3): 245-70 Pink L. et al., Why the sky is not so blue anymore. Journal of Skyology 22(4): 245-70 Pink L. et al., Why the sky is not so blue anymore. Journal of Skiology 22(4): 245-70 danno luogo a 4 record diversi IL PROBLEMA FONDAMENTALE
  • 51.
    • Tre interdisciplinari:
    • ISI WEB OF SCIENCE di Thomson Reuters
    • SCOPUS di Elsevier
    • GOOGLE SCHOLAR
    • Molti altri di carattere disciplinare che forniscono risultati plausibili in alcuni casi: SPIRES HEP/Inspire, ADS, MathSciNet, PsycINFO, etc.
    GLI ATTREZZI DI LAVORO
  • 52.
    • 5 fondamentali:
    • dimensioni del database
    • copertura temporale
    • copertura disciplinare
    • tipologia di documenti indicizzati
    • accuratezza nel citation matching
    CRITERI DI VALUTAZIONE
  • 53. ISI WEB OF SCIENCE Integrazione con altri database: Current Contents , Medline , Index Chemicus ... Autorevolezza: erede dei Citation Indexes di Eugene Garfield, è lo strumento principale usato dai bibliometri Comprende l’ Impact Factor delle riviste e calcola l’indice h Copertura: circa 11.500 riviste dal 1970 in poi, con backfiles dal 1901 Criteri rigorosi di selezione delle fonti: qualitativi e quantitativi Indicizza le bibliografie degli atti di convegni PRO
  • 54. ISI WEB OF SCIENCE Privilegia riviste occidentali in lingua inglese (92% in SCI ) Scarsa copertura delle scienze umane e storico-sociali La funzione per disambiguare i nomi autori è scadente Nel calcolo dell ’ Impact Factor non tiene conto di scissioni, fusioni e cambiamenti di titolo delle riviste Non indicizza le monografie Non indicizza le citazioni dei documenti in open archives CONTRO
  • 55. SCOPUS Include molte riviste periferiche (no IF per la selezione) Copertura: circa 16.500 riviste ( reference enhanced dal 1995) Funzioni analitiche più sofisticate che in WoS, ad es. per i nomi autori Calcola l ’ indice h e indicatori d ’ impatto delle riviste alternativi all ’ Impact Factor : SJR, SNIP Indicizza più atti di convegni rispetto a WoS Buona copertura delle scienze sociali PRO
  • 56. SCOPUS Indicizza le citazioni solo per record post-1996 Il calcolo dell ’ indice h è falsato per ricercatori con una lunga carriera Non indicizza le citazioni dei documenti in open archives Troppo giovane: ancora poco testato dai bibliometri Prevalenza fonti in lingua inglese (82%) Gli indicatori d’impatto delle riviste alternativi all’ Impact Factor sono ancora “sperimentali” CONTRO
  • 57. GOOGLE SCHOLAR E ’ gratis Link al testo completo di versioni alternative (preprint, postprint) di uno articolo non OA No limiti geografici e di lingua Indicizza le monografie di Google Books Indicizza i materiali depositati negli open archives Copertura: non solo riviste scientifiche ma siti web, letteratura grigia, tesi, preprints, etc. PRO
  • 58. GOOGLE SCHOLAR Non ordina i record per citation score e non calcola l ’ indice h , bisogna usare software esterni Copertura: ignote le fonti e le annate Non permette di disambiguare autori con le stesse iniziali I risultati includono spesso duplicati dello stesso articolo (preprint, postprint, ...) Include tra le citazioni anche record catalografici e liste di testi consigliati Produce citation scores e h gonfiati e instabili CONTRO
  • 59. 1 2 84% dei titoli WoS è anche in Scopus mentre solo il 54% dei titoli Scopus è anche in WoS CONFRONTI Scopus è preferibile a WoS in alcuni settori delle bioscienze (farmacologia, oncologia) e delle scienze sociali (studi sulla interazione uomo - computer) 3 Per le riviste di economia e finanza solo l’utilizzo combinato dei 3 database permette conteggi affidabili
  • 60. 4 WoS e Scopus forniscono risultati comparabili tra loro, GS no 5 Scopus fornisce citation scores e h più alti in alcuni settori delle scienze biomediche e sociali 6 Una classifica di autori per numero di citazioni può cambiare se si aggiungono le citazioni di Scopus a quelle di WoS CONFRONTI
  • 61.
    • “ All three systems have limitations [...] but the deficiencies in Google Scholar are so voluminous, unscholarly, and often so hidden that its hit counts and citation counts should not be accepted even as a starting point for evaluating the research output of real scholars. In an interesting twist, Google Scholar can help in revealing the shortcomings of WoS and Scopus by showing information about publications that are not covered by the automatic h-index generators of either” (Péter Jacsó)
  • 62.
    • Sia WoS che Scopus calcolano automaticamente l’ h ma:
    • non si tiene conto delle citazioni isolate e orfane
    • il calcolo è falsato se l’autore ha pubblicato libri e/o articoli che non hanno un master record pur essendo molto citati
    INDICATORI PRECALCOLATI
  • 63.
    • Gli indicatori bibliometrici più usati sono facili da (auto)-calcolare ma pieni di difetti:
    • è necessario conoscere bene i limiti dei database utilizzati e renderne consapevole l'utente
    • hanno senso solo nel contesto di una valutazione qualitativa
    CONCLUSIONI
  • 64. ESERCITAZIONE Calcolo dell’ h index di Maurizio Ponz de Leon in WoS, Scopus e Google Scholar
  • 65. PER SAPERNE DI PIU' Pagina Web SBA: Indicatori bibliometrici < http://www.sba.unimore.it/Inside/Biblioteca%20Digitale/Indicatori%20bibliometrici.asp > ftp://ddbibmed:ddelivery@ftpext.unimo.it/BIBLIO PER SCARICARE QUESTA PRESENTAZIONE