Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche.
1. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Condividere l’authority
control con Wikipedia
e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
Pierfranco Minsenti
2. Indice
1. Condividere i dati catalografici
2. L’Authority control in Wikipedia
3. Verso il VIAF: il dibattito 1961-2001
4. Che cos’è il VIAF
5. Il contributo italiano: SBN e VIAF
6. Wikipedia, OCLC e il VIAF
7. Identificativi nazionali. Wikipedia e SBN
8. L’inserimento manuale in Wikidata: istruzioni
9. Navigare da Wikipedia agli opac
3. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
1. Condividere i dati catalografici
4. 4
Collaborazione tra Wikimedia e OCLC: caso concreto
di riuso dei dati catalografici prodotti dalle
biblioteche
1.Problema:riusodeidaticatalografici
OCLC e la collaborazione con Wikipedia grazie al VIAF
Dimostra:
1. le potenzialità dell’apertura dei cataloghi delle
biblioteche
2. le opportunità, gli spazi di miglioramento e la necessità
di adottare una strategia precisa
3. il grosso divario tra l’Italia e il resto del mondo nel
campo del controllo di autorità svolto dalle biblioteche
5. 5
Il riuso dei dati catalografici: le sfide che pone al bibliotecario
☞ è una potenzialità che nasce dall’evoluzione
del Web verso i Linked Open Data
1.Problema:riusodeidaticatalografici
il riuso dei dati catalografici fuori dal catalogo è un problema
nuovo per il bibliotecario.
Il bibliotecario non è abituato a porselo perché nel contesto
cartaceo non esisteva la possibilità di riutilizzare i dati
catalografici.
Vantaggi ad aprire a collaborazioni e sinergie
6. 6
Vantaggi della collaborazione tra Wikimedia e OCLC: creare una
sinergia utile a Wikipedia e alle biblioteche
1. per Wikipedia: l’identificazione delle persone a cui
sono dedicate le voci di Wikipedia tramite l’uso degli
identificativi ricavati da un archivio internazionale: il
VIAF
2. consentire la navigazione da Wikipedia ai
cataloghi: vantaggio per Wikipedia e per le biblioteche
per offrire opportunità di approfondimento ai lettori
1.Problema:riusodeidaticatalografici
OCLC e la collaborazione con Wikipedia tramite il VIAF
☞ nelle voci di Wikipedia si aprono delle
“finestre” verso i cataloghi
7. 7
Benefici per le biblioteche
Perché alle biblioteche dovrebbe interessare?
1.Problema:riusodeidaticatalografici
☞ Se gli utenti sono sempre più abituati a
trascurare il catalogo e iniziare la ricerca su
Wikipedia, una soluzione è quella di portarli da
Wikipedia al catalogo della biblioteca
8. 8
I record delle biblioteche non sono “aperti”: sono
consultabili liberamente grazie agli Opac, ma non
esistono soluzioni per favorire il riuso.
1.Problema:riusodeidaticatalografici
Dati liberi per consentire il riuso
Le condizioni:
Quali condizioni minime?
9. 9
1.Problema:riusodeidaticatalografici
Dati liberi per consentire il riuso
1. mettere a disposizione i record in dataset completi, scaricabili
liberamente e in diversi formati*
2. adottare una licenza che consenta la libera riutilizzazione dei
record. Per il VIAF OCLC ha adottato la licenza ODC-By: Open
Data Commons Attribution License.**
3. infrastruttura tecnica
4. la definzione di ruoli precisi tramite accordi tra le istituzioni, la
creazione di agli organi di governo, la condivisione nella decisione
sulle strategie (partecipazione), la raccolta del feedback
4 condizioni minime:
* I dataset del VIAF sono messi a disposizione dalla pagina http://viaf.org/viaf/data/
** Vedi: http://opendatacommons.org/licenses/by/
10. 10
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Non è possibile importare record in Wikipedia dai
singoli cataloghi. È necessario un archivio globale
di record che svolga la funzione di archivio
intermedio che faciliti l’esportazione dai cataloghi e
l’importazione in Wikipedia
L’infrastruttura tecnica:
La pagina da cui scaricare i dataset completi del VIAF aggiornati mensilmente:
http://viaf.org/viaf/data/
11. 11
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Non è possibile importare record in Wikipedia dai
singoli cataloghi. È necessario un archivio globale
di record che svolga la funzione di archivio
intermedio che faciliti l’esportazione dai cataloghi e
l’importazione in Wikipedia
L’infrastruttura tecnica:
La licenza dei record del VIAF del tipo ODC-By: Open Data Commons Attribution License alla
pagina: http://viaf.org/viaf/data/
Consentito il riuso!
12. 12
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Non è possibile importare record in Wikipedia dai
singoli cataloghi. È necessario un archivio globale
di record che svolga la funzione di archivio
intermedio che faciliti l’esportazione dai cataloghi
e l’importazione in Wikipedia
L’infrastruttura tecnica:
13. 13
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
☞ il VIAF è un archivio globale di record di
autorità. Tra le altre funzioni svolge anche
quella di collettore di record per esportarli in
altri contesti come Wikipedia.
La partecipazione è gratuita.
1.Problema:riusodeidaticatalografici
Il VIAF è l’esempio concreto di una soluzione:
14. 14
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Il VIAF è lo strumento che rende possibile una
collaborazione tra biblioteche e Wikipedia per il riuso dei
dati catalografici e la creazione di hyperlinks reciproci.
OCLC riveste un ruolo chiave come gestore del VIAF.
È una cooperazione tra 3 tipi di istituzioni:
Cataloghi
Biblioteche OCLC
VIAF
Wikimedia
Wikidata
Wikipedia
link dalle versioni di Wikipedia ai cataloghi
☞ Gli hyperlinks assicurano la reciprocità, l’interesse comune a cooperare
facilitando la navigazione all’utente.
15. 15
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
VIAF
Catalogo
Catalogo
Catalogo
Catalogo
Catalogo
Virtual International
Authority File
Flusso dei dati: dai cataloghi al VIAF a Wikidata alle versioni di Wikipedia:
(archivio globale dei
record di autorità)
(database
unico che
alimenta
tutte le
voci di
Wikipedia)
WikimediaBiblioteche OCLC
WIKIDATA
http://viaf.org
16. 16
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Volontari
17. 17
La sinergia Biblioteche/VIAF/Wikipedia offre un esempio
concreto della riutilizzazione dei dati bibliotecari in altri
contesti.
1.Problema:riusodeidaticatalografici
I problemi
Le criticità della situazione italiana
Tuttavia per i motivi che analizzeremo, l’Italia è tra le nazioni
meno preparate per avvantaggiarsi di questo tipo di
soluzioni e sinergie.
☞ questa presentazione farà emergere il divario
tra le opportunità offerte a livello
internazionale e le scarse possibilità che ha
l’Italia di avvalersene
18. 2. L’Authority control in Wikipedia
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
19. Wikipedia e l’authority control
L’authority control non è uno strumento
fondamentale solo per i cataloghi delle biblioteche
ma anche per Wikipedia.
19
2.AuthoritycontrolinWikipediaebiblioteche
Nelle biblioteche duplice scopo: rendere possibile
la funzione identificativa e collocativa del catalogo.
1. identificare le “entità” con rilevanza bibliografica = quelle che
consentono raggruppamenti delle descrizioni per punti
d’accesso rilevanti ai fini della ricerca di una risorsa informativa
2. uso di forme controllate per designare i nomi delle entità
20. L’authority control: un concetto recente, una pratica radicata
Entità a rilevanza bibliografica:
1. nomi personali, collettivi, geografici
2. titoli uniformi; titoli di collana;
3. soggetti
20
2.AuthoritycontrolinWikipediaebiblioteche
21. Wikipedia e l’authority control
Esigenza comune da parte di biblioteche e
Wikipedia del controllo sulla forma dei nomi.
3 problemi da risolvere:
1. polisemia
es.: Winston Churchill (storico, 1620-1688); Winston Churchill (uomo
politico, 1874-1965);
2. sinonimia
es.: Ada Prospero; Ada Marchesini Gobetti Prospero
3. controllo delle forme correlate
es.: Lewis Carroll / Charles Dodgson
es.: Joseph Ratzinger / Papa Benedetto XVI
21
2.AuthoritycontrolinWikipediaebiblioteche
22. Wikipedia e l’authority control
Wikipedia condivide con le biblioteche anche il
principio di dare priorità al punto di vista
dell’utente nel trattamento della selezione della forma
principale e dei rinvii dalle forme varianti.
Es. la voce su Charles Dodgson / Lewis Carroll è
intitolata a Lewis Carroll e ha rinvio da Charles
Dodgson:
➡ https://it.wikipedia.org/wiki/Lewis_Carroll
➡ http://it.wikipedia.org/wiki/
Charles_Lutwidge_Dodgson
22
2.AuthoritycontrolinWikipediaebiblioteche
23. Wikipedia e l’authority control
Infine Wikipedia condivide con le biblioteche anche
l’uso di:
1. strumento per disambiguare gli omonomi: le
qualificazioni
2. liste di snodo per consentire la selezione del
nome + qualificazione
3. rinvii (redirect) nei casi di forme varianti correlate
23
2.AuthoritycontrolinWikipediaebiblioteche
24. Wikipedia e l’authority control
Charles Dodgson / Lewis Carroll
Una ricerca per Charles Dodgson porta a una pagina
di disambiguazione: https://en.wikipedia.org/wiki/
Charles_Dodgson che contiene una scelta fra 3
possibili voci:
➡ Charles Dodgson (bishop) (c. 1722–1795), Anglican Bishop of Elphin, grandfather of
the archdeacon https://en.wikipedia.org/wiki/Charles_Dodgson_(bishop)
➡ Charles Dodgson (archdeacon) (1800–1868), Anglican Archdeacon of Richmond, father
of the author https://en.wikipedia.org/wiki/Charles_Dodgson_(archdeacon)
➡ Charles Lutwidge Dodgson (1832–1898), better known by the pseudonym Lewis
Carroll, renowned children's and fantasy author https://en.wikipedia.org/wiki/
Lewis_Carroll
24
2.AuthoritycontrolinWikipediaebiblioteche
25. Wikipedia e l’authority control
Pagina di disambiguazione per Winston Churchill:
https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29
25
Pagina di disambiguazione per Winston Churchill
https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29
2.AuthoritycontrolinWikipediaebiblioteche
26. 26
☞ il VIAF ha reso possibile l’avvio di una sinergia
consolidando soluzioni e strumenti
Wikipedia e l’authority control
era destino che Wikipedia individuasse nei records di
autorità prodotti dalle biblioteche un valido ausilio per
consolidare il suo lavoro
2.AuthoritycontrolinWikipediaebiblioteche
27. 3. Verso il VIAF: il dibattito 1961-2001
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
28. Il VIAF è un archivio elettronico internazionale dei
records di autorità dei nomi (personali, autori
collettivi, geografici, titoli uniformi) e costituisce la
soluzione pragmatica a una serie di problemi teorici
e pratici che hanno caratterizzato il dibattito
sull’authority control per circa 40 anni.
Allo stesso tempo crea nuove sfide perché aumenta
la complessità dei problemi portando l’authority
control su una scala internazionale.
28
☞ il VIAF è un work in progress
Il VIAF
3.VersoilVIAF:ildibattito1961-2001
29. 29
Il dibattito 1961-1998 sulla forma del nome
1. forma con cui l’autore è più frequentemente
identificato nelle edizioni delle sue opere
OPPURE:
2. forma ricorrente nella critica e nei repertori
OPPURE:
3. forma diventuta costante nell’uso generale
Conferenza internazionale di Parigi del 1961: la
selezione della forma del nome*
* Vedi: Statement of principles adopted at the International Conference on Cataloguing
Principles, sezione 8.
3.VersoilVIAF:ildibattito1961-2001
30. 30
Il dibattito 1961-1998 sulla forma del nome
Conferenza internazionale di Parigi del 1961: le
indicazioni sulla selezione della forma del nome
portano a un risultato contraddittorio tra 2
opposti obiettivi: la standardizzazione per
consentire la cooperazione vs. tradizioni
catalografiche nazionali familiari all’utente: gli “usi”
sono diversi!*
3.VersoilVIAF:ildibattito1961-2001
Questa contraddizione non emerge subito in maniera
consapevole ma percorre tutto il dibattito dei 40 anni
successivi.
* Vedi: M. Guerrini, L. Sardo, Authority control, Roma, AIB, 2003.
31. 31
Il dibattito 1961-1998 sulla forma del nome
Alla base del lavoro dell’IFLA nei decenni successivi, in
particolare a partire dall’iniziaitva UBC: Universal
Bibliographic Control (1974) sta l’idea che la
cooperazione si ottenga tramite la standardizzazione e
che questa richieda l’adozione generale di una unica
forma universale del nome da parte di tutte le diverse
agenzie bibliografiche nazionali.
La forma unica universale del nome
3.VersoilVIAF:ildibattito1961-2001
32. 32
Il dibattito 1961-1998 sulla forma del nome
1. uso di lingue diverse (incide per es. sui nomi geografici; sui titoli
uniformi)
2. uso di alfabeti diversi
3. uso di traslitterazioni da alfabeti non latini fatte con criteri diversi
(per es. in Francia il nome dell’autore della Sinfonia Patetica viene trascritto come
Čajkovskij, Petr Ilʹič, mentre negli Stati Uniti viene trascritto come: Tchaikovsky,
Peter Ilich)
4. uso di forme vernacolari (es. Pétrarque; Petrarch)
5. differenze concettuali nella definzione dell’entità a cui si riferisce il
“nome”: per es. distinzione tra identità bibliografica e identità
personale (vedi il caso dello scrittore irlandese John Banville pubblica romanzi
con il suo nome reale e gialli con lo pseudonimo di Benjamin Black)
6. altre differenze catalografiche: per es. uso tedesco delle iniziali
puntate
La standardizzazione nei nomi si scontra con differenze rilevanti
nelle tradizioni catalografiche nazionali:
3.VersoilVIAF:ildibattito1961-2001
33. 33
Il dibattito 1961-1998 sulla forma del nome
Il conflitto tra forma unica universale vs. tradizioni locali ha
dominato il dibattito interno all’IFLA.
1998: anno di svolta, Conferenza IFLA di Amsterdam: Il
gruppo di lavoro IFLA sul Minimal Level Authority Records
conclude il proprio lavoro sostenendo che è irrealistico
aspettarsi che tutte le agenzie bibliografiche nazionali
adottino la stessa forma.
☞ è necessario trovare una soluzione che
metta assieme l’esigenza di preservare le
abitudini nazionali e i vantaggi della
cooperazione internazionale.
3.VersoilVIAF:ildibattito1961-2001
34. 34
La tecnologia offre una soluzione
2001: GARR (Guidelines for authority and reference
records): la soluzione consiste nel mantenere la pluralità
delle forme nazionali e ricorrere alla tecnologia per creare
collegamenti tra le diverse forme.
☞ collegamenti, non fusione; molteplicità,
non forma unica
☞ preservare le differenze linguistico-
culturali facendole convivere con la
cooperazione/scambio e il principio della
uniformità di accesso
3.VersoilVIAF:ildibattito1961-2001
35. 35
La tecnologia offre una soluzione
collegamenti tra forme diverse del nome riferite alla
stessa entità: il collegamento sostituisce l’idea della
forma “unica”. Le diverse forme sono considerate come
varianti correlate di pari importanza.
☞ nel VIAF questa soluzione dà vita ai
cluster: grappoli di records
3.VersoilVIAF:ildibattito1961-2001
36. 4. Che cos’è il VIAF
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
37. Che cos’è il VIAF
Il VIAF, Virtual International Authority File*, è un archivio elettronico
multinazionale dei record di autorità, nato nel 2003 grazie a un
accordo tra la Library of Congress, la Deutsche Nationalbibliothek e
OCLC.
Nel 2007 si aggiunse la Bibliothèque Nationale de France.
L'interfaccia pubblica di ricerca è stata aperta nel 2007, dalla URL:
http://orlabs.oclc.org/viaf/ e dall'inizio del 2009 dalla URL: http://
viaf.org/.**
37
** Queste informazioni si ricavano da una consultazione del servizio WayBackMachine di
Internet Archive. Nella bibliografia sul VIAF non abbiamo trovato informazioni relative alla data
di apertura al pubblico dell'interfaccia utente del VIAF.
* Per informazioni generali si veda: http://www.oclc.org/viaf.en.html
4.IlVIAF
38. Che cos’è il VIAF
Nell'aprile 2012 le quattro istituzioni bibliotecarie principali decisero di
modificare l'organizzazione del servizio trasferendone la titolarità a
OCLC.*
Attualmente la governance del progetto spetta al VIAF Council i cui
membri sono designati dalle agenzie catalografiche che forniscono
record al VIAF.
Dal maggio 2012 dataset completi vengono messi a disposizione con
aggiornamento mensile dalla pagina http://viaf.org/viaf/data con licenza
ODC-By**
38
** Open Data Commons Attribution License. Vedi: http://opendatacommons.org/licenses/by/
* Vedi l'annuncio di OCLC del 4 aprile 2012: «Virtual International Authority File service
transitions to OCLC; contributing institutions continue to shape direction through VIAF
Council»: http://www.oclc.org/news/releases/2012/201224.en.html.
4.IlVIAF
39. Che cos’è il VIAF
Il VIAF*, Virtual International Authority File, è un archivio elettronico
multinazionale dei record di autorità, nato nel 2003 e gestito da
OCLC e che attualmente ospita record di autori personali e
collettivi, titoli uniformi, nomi geografici forniti da agenzie
catalografiche di ogni parte del mondo, tra cui l’Italia.
Complessivamente al settembre 2013 il VIAF vede l'adesione di 34
agenzie catalografiche che rappresentano 28 paesi e hanno fornito
un totale di circa 33 milioni di record di autorità.
Il VIAF implementa Unicode e attualmente visualizza intestazioni che
possono essere in un qualsiasi set di caratteri appartenenti a 5
diversi alfabeti usati dalle agenzie catalografiche che collaborano
all'iniziativa: latino; cirillico; arabo; israeliano; giapponese.
39
* VIAF: http://viaf.org/
4.IlVIAF
VIAF: http://viaf.org/
40. Che cos’è il VIAF
L’infrastruttura tecnica è gestita da OCLC. Attualmente
ospita record di autori personali e collettivi, titoli
uniformi, nomi geografici forniti da agenzie
catalografiche di ogni parte del mondo, tra cui l’Italia.
Complessivamente al febbraio 2015 il VIAF vede
l'adesione di 39 agenzie catalografiche che
rappresentano 27 paesi e hanno fornito un totale di circa
45 milioni di record di autorità, di cui 35 relativi a nomi
di autori personali.
40
4.IlVIAF
41. Che cos’è il VIAF
Le informazioni più aggiornate sul VIAF si trovano sul
blog personale di Thomas Hickey, Chief Scientist di
OCLC e coordinatore dello staff tecnico che gestisce il
VIAF.*
Altre informazioni si trovano su slides e report messi a
disposizione dalla pagina: VIAF news.**
41
☞ Il VIAF è un work-in-progress in evoluzione
continua
* Thomas Hickey, Outgoing. Library metadata techniques and trends by Thom Hickey: http://
outgoing.typepad.com/outgoing/
** VIAF news: http://www.oclc.org/viaf/news.en.html
4.IlVIAF
42. Che cos’è il VIAF
Definizione per i non bibliotecari:
42
☞ il VIAF è una specie di anagrafe mondiale di tutti coloro a
cui viene riconosciuta una responsabilità in opere
dell’intelletto o in creazioni artistiche:
ci sono innanzitutto scrittori, come Alessandro Manzoni: http://viaf.org/viaf/14356/#Manzoni,_Alessandro,_1785-1873
Ma nel VIAF, come anche nei cataloghi delle biblioteche, non ci sono solo scrittori. Ci sono anche:
artisti, come il pittore Giorgione: http://viaf.org/viaf/39385864/#Giorgione,_1477-1511
registi, come Woody Allen: http://viaf.org/viaf/59077912/#Allen,_Woody,_1935-....
attori, come John Wayne: http://viaf.org/viaf/37103799/#Wayne,_John,_1907-1979
musicisti, come Giuseppe Verdi: http://viaf.org/viaf/22329110/#Verdi,_Giuseppe,_1813-1901
ballerini e coreografi, come Rudolf Nureyev: http://viaf.org/viaf/148483/#Nureyev,_Rudolf,_1938-1993
cantanti, come Lady Gaga: http://viaf.org/viaf/49555103/#Lady_Gaga
uomini di stato, come: Napoleone Bonaparte: http://viaf.org/viaf/106964661/#Napol
%C3%A9on_I,_Emperor_of_the_French,_1769-1821
traduttori famosi di opere letterarie, come Ettore Capriolo: http://viaf.org/viaf/283936245/#Capriolo,_Ettore
4.IlVIAF
43. Che cos’è il VIAF
43
☞ inoltre è una specie di anagrafe mondiale anche per:
nomi di autori collettivi (enti, ecc.), come la Wikimedia Foundation: http://viaf.org/viaf/
137022054/#Wikimedia_Foundation
nomi geografici (solo di autorità politico territoriali), come la Regione Toscana: http://viaf.org/
viaf/130807311/#Tuscany_(Italy)
titoli di opere, come Hamlet: http://viaf.org/viaf/176993890/
#Shakespeare,_William,_1564-1616._|_Hamlet
4.IlVIAF
44. Che cos’è il VIAF
Il VIAF implementa Unicode e attualmente visualizza intestazioni che
possono essere in un qualsiasi set di caratteri appartenenti ai
diversi alfabeti usati dalle agenzie catalografiche che collaborano
all'iniziativa: come latino; cirillico; arabo; israeliano; giapponese.
Per es.: il VIAF è l’unico strumento che può rispondere alla
domanda: quali forme del nome assume l’autore del Giardino dei
ciliegi nei vari cataloghi mondiali? Quale è la forma preferita nella
lingua e nell’alfabeto del catalogo nazionale del suo paese di
origine?
44
4.IlVIAF
45. Che cos’è il VIAF
Il VIAF implementa Unicode e attualmente visualizza intestazioni che
possono essere in un qualsiasi set di caratteri appartenenti a 5
diversi alfabeti usati dalle agenzie catalografiche che collaborano
all'iniziativa: latino; cirillico; arabo; israeliano; giapponese.
Per es.: il VIAF è l’unico strumento che può rispondere alla
domanda: quali forme del nome assume l’autore del Giardino dei
ciliegi nei vari cataloghi mondiali?
45
Il VIAF come strumento di consultazione: le diverse forme del nome
dell’autore del Giardino dei ciliegi nei vari cataloghi mondiali
e in diverse traslitterazioni e alfabeti nel cluster 95216565
Il record del
commediografo Anton
Pavlovič Čehov in cirillico
Il record del
commediografo Anton
Pavlovič Čehov dal
catalogo SBN
http://viaf.org/viaf/search?query=local.personalNames+all+%22cehov
%22&sortKeys=holdingscount&recordSchema=BriefVIAF
4.IlVIAF
46. I cluster
Il VIAF raccoglie insieme le diverse forme dei nomi in un “grappolo” di nomi che si
riferiscono alla stessa entità: il “grappolo” è chiamato cluster
46
http://viaf.org/viaf/39382430/#Petrarca,_Francesco,_1304-1374
cluster del record di
Francesco Petrarca
rappresentato con
un poligono stellato
4.IlVIAF
47. Come sono realizzati i cluster: due fasi
Il procedimento per la clusterizzazione è basato su 2 fasi*:
1. i record originali forniti dalle biblioteche vengono “arricchiti” con
informazioni ricavate dai record bibliografici che i contributori
devono fornire insieme ai record di autorità: vengono così
associati al record autore informazioni aggiuntive come titoli
associati all'autore, il nome di eventuali coautori inserite in tag
appositi del blocco 9XX. Il record viene definito enhanced
2. il confronto (matching) tra i record enhanced
47
* Informazioni ricavate da: Richard Bennett, et al. «VIAF (Virtual International Authority File) : Linking Die Deutsche Bibliothek and Library of
Congress Name Authority Files». Relazione presentata alla Conferenza IFLA 2006, Seoul, Korea, 20–24 agosto 2006. http://
citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.150.5328&rep=rep1&type=pdf. Giulia Manzotti. «Analisi e riflessioni sul VIAF, Virtual
International Authority File». JLIS.it 1.2 (2010): pp. 357–381. http://leo.cilea.it/index.php/jlis/article/view/4520.
4.IlVIAF
48. Come sono realizzati i cluster: l’algoritmo per il matching
I cluster sono stati realizzati tramite procedure automatiche di
confronto tra record (matching) basate su un algoritmo che
confronta:
1. il nome: per stabilire in una prima fase di confronto la
“compatibilità”
2. altre informazioni direttamente collegate all'autore, come le
specificazioni cronologiche (date di nascita e morte o solo data
di nascita)
3. altri dati ricavati dai record bibliografici associati alle notizie di
autorità (titoli associati all'autore, il nome di eventuali coautori
ecc.)
48
4.IlVIAF
49. Come sono realizzati i cluster del VIAF: esiti del matching
L'esito della procedura di matching può essere duplice:
1. in caso di esito positivo il record fornito dall'agenzia
catalografica viene aggregato a un cluster già esistente formato
da uno o più record = cluster multirecord
2. in caso negativo, il record viene importato nel VIAF ma crea un
nuovo cluster che contiene un unico record = cluster
monorecord
49
4.IlVIAF
50. Come sono realizzati i cluster del VIAF: esiti del matching
50
☞ Nel VIAF ci sono parecchi doppioni (cioè cluster
monorecord, effetto di un matching negativo)
☞ il casi di matching negativo possono riguardare:
1. nomi forniti solo da una certa agenzia: il loro isolamento è
corretto
2. nomi che avrebbero dovuto essere inclusi nei cluster già
formati
4.IlVIAF
51. Come sono realizzati i cluster del VIAF: esiti del matching
Le 3 variabili che contano:
1. la raffinatezza dell’algoritmo di matching
2. la qualità del record di autorità: dati che contiene e correttezza
3. i record bibliografici forniti
51
4.IlVIAF
52. Gli identificativi dei cluster
Come in un’anagrafe si usa il codice fiscale come identificativo
univoco delle persone fisiche, così nel VIAF ogni entità
rappresentata da un cluster ha un proprio identificativo numerico.
Per es.:
Francesco Petrarca: 99258155
Lady Gaga: 49555103
52
4.IlVIAF
53. Uso degli identificativi dei VIAF cluster nei cataloghi di biblioteca
53
Diverse agenzie catalografiche che partecipano al VIAF, inseriscono nei loro authority files, per
ogni record che hanno fornito, anche l'identificativo del cluster VIAF con cui è avvenuto il match
e il relativo link che punta al cluster VIAF.
Per es.
Library of Congress,
Bibliothèque Nationale de France,
Biblioteca Nazionale Svedese
Biblioteca della Dieta Nazionale del Giappone
☞ problema dell’authority file di SBN: non cita mai
nei record il numero identificativo del record VIAF
(i record di autorità SBN contengono un numero
ISADN, inutile).
SBN non è allineato alle pratiche internazionali che
stanno emergendo in relazione al VIAF.
4.IlVIAF
54. 5. Il contributo italiano: SBN e VIAF
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
55. La partecipazione dell’Italia al VIAF
Avviene tramite l’ICCU che fornisce a OCLC per il
VIAF i record di autorità provenienti dal catalogo
SBN.
2009: inizio della partecipazione italiana al VIAF*.
55
5.SBNeilVIAF
* Vedi le informazioni fornite nelle due pagine web dell’Istituto Centrale per il Catalogo Unico: «Attività internazionali: Virtual International
Authority File (VIAF)» http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/internaz/pagina_367.html; Attività nazionali: Authority
Control», http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/naz/pagina_335.html .
56. La situazione dei record forniti dall’Italia al VIAF
Nel caso dei record di autori personali forniti
dall’Italia e provenienti dal catalogo SBN ci sono
problemi di:
1. quantità dei record forniti
2. matching con i record già presenti nel VIAF
A partire da fine 2013 la situazione è migliorata,
tuttavia il report annuale 2014 sul VIAF realizzato
da OCLC dimostra che la situazione dei record
italiani nel VIAF è molto indietro rispetto a quella di
altri paesi europei.
56
5.SBNeilVIAF
57. La situazione dei record da SBN dal 2009 a ottobre 2013:
57
** Vedi i dati quantitativi pubblicati alla pagina: http://www.iccu.sbn.it/opencms/opencms/it/main/bd/index.html Secondo i dati aggiornati al
gennaio 2015, i record di autorità autori sono: 3.911.525 autori (personali e collettivi).
Quantità e percentuali di matching dei record italiani nel VIAF*
45.189 record
forniti
costituivano solo
il 1,22% del totale
dei record di
autorità presenti
nel catalogo SBN
al giugno 2013:
3.714.476 **
☞ I record italiani nel VIAF hanno creato cluster
“doppioni” nell’87% dei casi = 39.215 record
I problemi del matching nel caso dei record forniti dall’Italia
* Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato al luglio 2013: OCLC. «2013 Annual Report to VIAF Council».
2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx.
5.SBNeilVIAF
58. La situazione del VIAF: confronto tra record SBN e da altri cataloghi a
primavera 2013:
58
VIAF: totale 33.667.856 di record
(al settembre 2013)
Totale record di autorità SBN:
3.714.476 (al luglio 2013)
VIAF
Record da SBN che hanno avuto un
match con almeno 1 altro record
VIAF: 5.993
(= 13% dei record forniti)
Record da SBN forniti al VIAF: 45.208
(= 1,2% del totale dei record di
autorità SBN)
39.215 record sono cluster “isolati”
Record da SBN
nel VIAF
45.208 tra
2009-2013
(= solo 1,2% dei
record autori in
SBN)
Germania
ca. 10 milioni
di record
USA, Canada,
UK
ca. 9 milioni
di record
Portogallo
Francia
Spagna
5.SBNeilVIAF
La situazione dei record forniti dall’Italia al VIAF
59. La situazione dei record forniti dall’Italia al VIAF
La quantità limitata di record forniti inizialmente al VIAF dall’ICCU si
spiega con la scelta di fornire solo i record con il livello massimo
di autorità: AUF (livello 97)
I livelli di catalogazione dei record autori in SBN sono ordinati secondo una progressione,
da quello inferiore a quello più elevato:
04
REC = 05
MIN = 6–51
MED = 52–71
MAX = 72–90
SUP = 91–95
AUF = 97
Appartengono al livello AUF innanzitutto i record che sono stati sottoposti a specifiche
procedure retrospettive di bonifica e arricchimento condotte a partire dagli anni 2001–2002
grazie al progetto Valorizzazione dell’Indice SBN.*
59
* Vedi: Cristina Magliano, «Direttive e metodologia per la creazione dell’authority file di SBN». In: Authority Control : definizioni ed esperienze
internazionali : Atti del convegno internazionale, Firenze, 10–12 Febbraio 2003, a cura di Mauro Guerrini e Barbara B. Tillett. Firenze: Firenze
University press, 2003, pp. 61–69. Il livello SUP in origine era riservato alle due Biblioteche Nazionali Centrali di Firenze e di Roma, ma da
tempo anche in altri Poli vengono create notizie autori con quel livello. Il livello AUF è riservato ai componenti di un gruppo di lavoro attivo
presso 14 istituzioni bibliotecarie della rete SBN.
5.SBNeilVIAF
60. La situazione dei record forniti dall’Italia al VIAF
Al VIAF non erano stati forniti i record con livello di autorità inferiore a
AUF. Mancavano, e mancano tutt’ora, per es. i seguenti autori:
- Cesare Beccaria (in SBN livello MAX CFIV016390)
- Marco Polo (in SBN livello MED CFIV028383)
- Cecco Angiolieri (in SBN livello MIN CFIV078939)
I record di questi autori erano presenti nel VIAF, ma mancava il record italiano, tutt’ora assente
(al febbraio 2015).
Inoltre fino alla fine del 2013 mancavano i record autori di livello SUP,
come per es.:
- Paolo Giordano (in SBN livello SUP UBOV259046)
- Lorenzo Da Ponte (in SBN livello SUP UBOV259046)
- Francesco Guicciardini (in SBN livello SUP CFIV004242)
- Wu Ming (in SBN livello SUP TO0V385956)
60
5.SBNeilVIAF
61. Diverso esito del matching in base alla fonte di provenienza dei record
61
Tabella 2013 ordinata in ordine decrescente per percentuale di matching: i record da SBN hanno la più bassa percentuale di matching (solo
13%).
Vedi il report: http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx.
5.SBNeilVIAF
62. Esempio di cluster doppioni nel 2013: i cluster relativi a Dante Alighieri
62
http://viaf.org/viaf/59080924/#Alighieri,_Dante
http://viaf.org/viaf/97105654/
#Dante_Alighieri,_1265-1321
VIAF cluster: 97105654VIAF cluster: 59080924
1 sola bandiera: cluster monorecord
poligono stellare: cluster multirecord
come si presentava la situazione dei cluster
relativi a Dante Alighieri nel 2013
5.SBNeilVIAF
63. Il miglioramento dopo la fine del 2013:
63
* Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato ad agosto 2014: OCLC. «2014 Annual Report to VIAF Council».
2014. http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf
Quantità e percentuali di matching dei record italiani nel VIAF nel 2014*
☞ miglioramenti a livello di:
2013 2014 Incremento
Totale'authority'record'nel'VIAF 33.667.856 44.885.233 11.217.377
Fornitura'di'records'da'SBN 45.208 169.028 123.820
%'di'clusterizzazione'dei'record'da'SBN 13% 39%
1. quantità: 169.028 record forniti sono il 4,3% del totale dei
record autori SBN (3.911.525 autori personali e collettivi, al
gennaio 2015). Sono stati forniti anche i record di livello SUP.
2. percentuale di matching (riduzione dei record isolati): ca.
66.000 match con un cluster multirecord
I problemi del matching nel caso dei record forniti dall’Italia
5.SBNeilVIAF
64. Diverso esito del matching in base alla fonte di provenienza dei record
64
Tabella 2014 ordinata in ordine decrescente per percentuale di matching: rispetto al 2013 i record da SBN hanno migliorato la percentuale di matching (dal 13% al 39%).
Vedi il report: http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf
5.SBNeilVIAF
66. Esempi:*
1. uomini politici: per es.: Barack Obama: 305358548 (invece di 52010985); ma anche
Umberto <re d'Italia ; 1.>: 90291016 (invece di 262250334).
2. artisti: per es.: Paolo Uccello: 305358201 (invece di 39395712);
3. registi: per es.: Alfred Hitchcock: 305357650 (invece di 49226917);
4. attori, sia italiani che stranieri, per es.: Monica Bellucci, 90383682 (invece di
106993456); Brad Pitt 305358254 (invece di 12462881); Sergio Castellitto: 90302845
(invece di 37125646); Humphrey Bogart: 305358227 (invece di 68937671);
5. cantanti e altre persone di spettacolo: per es.: Mina: 268502285 (invece di
62360130); Jannacci: 90146253 (invece di 1128716);
66
Casi di record da SBN che creano doppioni nel VIAF
* Ci sono poi casi di nomi che solo SBN ha fornito al VIAF e quindi è corretto che siano isolati in cluster monorecord. Per es. Bianca Berlinguer:
VIAF 90107330.
5.SBNeilVIAF
67. 67
I dati comparativi dimostrano che la situazione
italiana deve migliorare per avvicinarsi quella di
altri paesi.
Come migliorare
5.SBNeilVIAF
è auspicabile:
1. una maggiore collaborazione tra chi gestisce SBN, l’ICCU e
OCLC per risolvere i problemi della situazione italiana.
2. un piano strategico volto a una bonifica dell'authority file di
SBN sfruttando le risorse disponibili
difficile individuare attualmente una strategia fatta di priorità e di organizzazione del lavoro
tramite il coordinamento delle risorse presenti nei Poli considerata la presenza nell’authority file
SBN di casi di record di livello AUF come l'attore di spaghetti western John Ireland http://
id.sbn.it/af/IT%5CICCU%5CUBOV%5C015247 che si accompagna a casi di record molto più
importanti, come Cesare Beccaria (liv. MAX) o Marco Polo (liv. MED) che sono tutt’ora in attesa di
essere sottoposti a bonifica e portati a livello SUP o AUF, per poterli poi fornire al VIAF e renderli
visibili nell’opac SBN, al livello della ricerca Voci di autorità.
68. 6. Wikipedia, OCLC e il VIAF
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
69. 69
Il progetto GLAM lanciato dalla Wikimedia Foundation
La collaborazione tra Wikipedia e le biblioteche
inizia con la GLAM-Wiki Initiative (Galleries,
Libraries, Archives, Museums with Wikipedia),
un progetto nato nel 2010 come collaborazione tra
la Wikimedia Foundation e istituzioni del settore
cultural heritage*.
* Wikipedia:GLAM/About <http://en.wikipedia.org/wiki/Wikipedia:GLAM/About>
6.Wikipedia,OCLCeilVIAF
70. 70
Il progetto GLAM lanciato dalla Wikimedia Foundation
Obiettivo della GLAM-Wiki Initiative:
“aiutare le istituzioni del settore cultural heritage
a promuovere le loro collezioni su Wikipedia
attraverso progetti realizzati in collaborazione
con esperti redattori wikipediani”
6.Wikipedia,OCLCeilVIAF
71. 71
Il programma “Wikipedian in residence”
Lo strumento concreto per realizzare la
collaborazione consiste nel nominare un redattore
esperto di Wikipedia che lavora con e dentro
l’istituzione partner: il “Wikipedian in residence”.*
* Sul programma “Wikipedian in residence” vedi: https://outreach.wikimedia.org/wiki/Wikipedian_in_Residence
6.Wikipedia,OCLCeilVIAF
72. 72
Maggio 2012: due redattori di Wikipedia vengono ingaggiati con il ruolo di
"Wikipedian in Residence" per gestire progetti legati alle biblioteche:
* Vedi: http://www.oclc.org/research/news/2012/05-22.html
Il programma “Wikipedian in residence”
Max Klein negli Stati Uniti presso OCLC*
Andrew Gray in Gran Bretagna presso la British Library
6.Wikipedia,OCLCeilVIAF
Oggi nessuno dei due lavora più come Wikipedian in residence.
73. 73
Il risultato pratico della collaborazione tra OCLC e
Wikimedia riguarda il VIAF, Virtual International
Authority File, e in particolare:
1. inizialmente l’inserimento di link da ogni cluster VIAF a
una corrispondente voce nella Wikipedia inglese
2. successivamente Wikipedia è stata promossa al ruolo di
contributore di record, alla pari di un’agenzia
bibliografica
3. infine le voci biografiche di Wikipedia sono state
arricchite con i link al VIAF
OCLC e la collaborazione con Wikipedia per il VIAF
6.Wikipedia,OCLCeilVIAF
74. Il rapporto tra il VIAF e Wikipedia inizia nel 2012 quando OCLC inserisce nel VIAF, nella
sezione About di ogni record cluster, un link che punta alla relativa voce di Wikipedia con la
funzione di facilitare agli utenti l'accesso diretto a informazioni più complete sull'autore.
74
Inserimento di link esterni dai cluster VIAF a Wikipedia
Sezione About del record
6.Wikipedia,OCLCeilVIAF
75. A seguito della adesione di OCLC alla GLAM Initiative, nel corso del
primo semestre del 2012 OCLC decise di promuovere Wikipedia al
livello di una vera e propria source di record equiparandola agli
authority files delle agenzie catalografiche.*
75
* Attualmente solo 4 fonti non create da biblioteche alimentano il VIAF come source alla pari
dei cataloghi delle biblioteche: la Union List of Artist Names del Getty Museum, la versione
inglese di Wikipedia, il database ISNI, e la biblioteca digitale Perseus.
Estate 2012: la svolta. Wikipedia da repertorio esterno a fonte del VIAF
☞ è una evoluzione di grande importanza:
a Wikipedia viene riconosciuta la stessa
autorevolezza di un catalogo di biblioteca
6.Wikipedia,OCLCeilVIAF
76. Il motivo per cui Wikipedia è stata elevata lo status di source è
spiegato nel report annuale 2013 del VIAF:*
poter sfruttare i dati identificativi presenti in Wikipedia (come quelli
biografici, i titoli di opere citate nella voce dell’autore ecc.) in modo da
poter migliorare la capacità aggregativa dei record VIAF cluster che
tra le altre cose dipende anche dal numero di dati inseriti nel cluster,
dato che la loro quantità aumenta le possibilità di ottenere un match
con nuovi record in arrivo.
76
* OCLC. «2013 Annual Report to VIAF Council». 2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-
Annual-Report-to-VIAF-Council.docx.
Perché Wikipedia viene promossa a source del VIAF
6.Wikipedia,OCLCeilVIAF
77. L’algoritmo di matching con cui è realizzato il clustering è facilitato
dalla presenza di un maggior numero di record:
«The efficiency of VIAF clusters is improved with the number of
contributing files because of the nature of this matching. There can be
situations where A matches B and B matches C, but C doesn’t match
A, yet A,B,C are a cluster».*
77
* Vedi Maximilian Klein e Alex Kyrios, "VIAFbot and the Integration of Library Data on Wikipedia2, in: code{4}lib, n. 22, 2013, http://
journal.code4lib.org/articles/8964
Perché Wikipedia viene promossa a source del VIAF
6.Wikipedia,OCLCeilVIAF
A
B
C
all’interno del cluster non tutti i record
hanno relazioni di matching tra di loro, ma
questo non impedisce il clustering
se non avessi avuto il record B
che fa da anello intermedio, A e
C non sarebbero nello stesso
cluster
78. 78
Per poter trattare Wikipedia come una “fonte” di record, OCLC ricava
dai dati presenti in ogni voce della versione inglese di Wikipedia
dedicate ad autori personali un record (per ogni voce), strutturato in
formato MARC.
Questo “falso” record viene sottoposto alle procedure di matching già
usate per gli altri record e che determinano l’inserimento del record in
un certo cluster VIAF dove è identificato dalla sigla WKP.
L’importazione dei “record” da Wikipedia nel VIAF
6.Wikipedia,OCLCeilVIAF
79. 79
Dalla voce di Wikipedia al record importato nel VIAF:
Creazione di record da Wikipedia e importazione nel VIAF
Record WKP: Luigi_Pirandello
http://viaf.org/processed/WKP|Luigi_Pirandellohttp://en.wikipedia.org/wiki/Luigi_Pirandello
Box dei dati biografici
Titoli delle opere
La voce di Wikipedia: Luigi_Pirandello
6.Wikipedia,OCLCeilVIAF
80. 80
Il record WKP ricavato dalla voce su Luigi Pirandello nella versione inglese di
Wikipedia viene importato nel cluster VIAF insieme ai record forniti dai cataloghi
delle biblioteche
http://viaf.org/processed/WKP|Luigi_Pirandello
Il record ricavato da Wikipedia viene importato nei cluster del VIAF
http://viaf.org/viaf/64010465/#Pirandello,_Luigi,_1867-1936
Record cluster di Luigi Pirandello
Record WKP da Wikipedia è compreso nel cluster
6.Wikipedia,OCLCeilVIAF
81. 1.135.025 record importati nel VIAF dalle voci della
Wikipedia in lingua inglese.
(ad agosto 2014; al luglio 2013 erano 1.075.291)*
81
Qualche dato numerico sui record importati nel VIAF
* Totale voci di Wikipedia in lingua inglese: 4.728.038 a fine febbraio 2015.
6.Wikipedia,OCLCeilVIAF
82. Nell’estate 2012 OCLC decide di rendere reciproci i link VIAF / Wikipedia:
82
Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot
da:
VIAF → Wikipedia EN
(solo link)
a:
VIAF
(identificativi dei cluster)
Wikipedia EN
(voci di W)
→
←
VIAFWikipedia EN
(record)
→
a:
6.Wikipedia,OCLCeilVIAF
83. 83
L’importazione dei “record” da Wikipedia nel VIAF
Nelle voci di Wikipedia in lingua inglese viene inserito l’identificativo
dello specifico cluster VIAF in cui è già stato importato anche il “falso”
record WKP.
Questo lavoro viene eseguito tramite una procedura automatica detta
VIAFbot.
** VIAFbot Edits 250,000 Wikipedia Articles to Reciprocate All Links from VIAF into Wikipedia (7 dicembre 2012), http://www.oclc.org/research/
news/2012/12-07a.html
Gli identificativi VIAF vengono inseriti in un template già esistente: {{authority control}}.*
Nel 2012 il template {{authority control}} risultava già largamente usato dalla versione in lingua
tedesca (in 220.000 voci) ma poco usato dalla versione in lingua inglese (in 4.000 voci). Fino a
quel momento gli identificativi erano stati aggiunti “manualmente”. La nuova proposta intende
invece usare una procedura automatica: il VIAFbot.
La procedura è stata conclusa nel novembre 2012 e ha dato come
risultato l’importazione di 250.000 identificativi di cluster VIAF
all’interno delle relative voci della Wikipedia in lingua inglese.**
* Wikipedia:Authority control: https://en.wikipedia.org/wiki/Wikipedia:Authority_control
6.Wikipedia,OCLCeilVIAF
84. 84
Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot
* La proposta: Authority control integration è ora archiviata a: http://en.wikipedia.org/w/index.php?
title=Wikipedia:Village_pump_(proposals)&oldid=499166049#Authority_Control_Integration
Dopo aver raccolto i primi pareri sulla base di una bozza*, crea una pagina specifica che
contiene una stesura più definita della proposta chiamata: “Authority control integration
proposal” che sottopone a votazione. I pareri espressi su quella pagina non sono tutti
favorevoli, ma prevalgono i pareri positivi.**
☞ In realtà OCLC “NON” decide nulla in maniera autonoma: si tratta di una proposta che
Max Klein rivolge alla Community di Wikipedia pubblicandola nella apposita sezione
per la discussione di nuove proposte: Village pump *
La proposta viene approvata ma da allora la discussione non si è fermata perché i redattori di
Wikipedia si confrontano su vari problemi. Vedi la pagina: Wikipedia talk:Authority control:
https://en.wikipedia.org/wiki/Wikipedia_talk:Authority_control
** Wikipedia:Authority control integration proposal/RFC: http://en.wikipedia.org/wiki/Wikipedia:Authority_control_integration_proposal/RFC
6.Wikipedia,OCLCeilVIAF
85. Il progetto di importazione degli identificativi dei record VIAF si proponeva di:
85
Obiettivi dell’integrazione dell’authority control in Wikipedia
1. funzione identificativa: attribuire alle voci biografiche un identificativo autorevole che
certificasse l’identificazione del soggetto della voce
2. facilitare il lavoro di creazione e manutenzione delle voci di Wikipedia collegando a
un repertorio che contiene tante forme alternative dello stesso nome
3. creare link dalle voci di Wikipedia al VIAF: nel VIAF si possono trovare informazioni
non contenute nell’enciclopedia, in particolare le forme autorizzate dei nomi, in diverse
lingue e in diversi alfabeti, usate nei cataloghi di biblioteca di varie parti del mondo
4. utilizzare gli identificativi per creare servizi di redirect precisi, perché basati su
identificativi, verso le voci di Wikipedia o verso altri servizi, come nel caso del servizio
tedesco Wikipedia Personensuche: http://tools.wmflabs.org/persondata/index.php *
3. creare le premesse per costruire servizi di collegamento ai cataloghi delle
biblioteche
* Esempio di utilizzo del servizio di redirect Wikipedia Personensuche: utilizzando l’identificativo del record di autorità dell’authority file
tedesco, è possibile creare una URL con una sintassi standard che porta a una pagina di snodo. Esempio con Galileo Galilei: authority
record GND 118537229 http://tools.wmflabs.org/persondata/p/gnd/118537229
6.Wikipedia,OCLCeilVIAF
86. 86
Il posizionamento dell’authority control al fondo della voce
6.Wikipedia,OCLCeilVIAF
i codici identificativi dei record di autorità funzionano anche da link esterni
87. A fine 2012 gli stessi dati sono stati importati anche in Wikidata* il
database che contiene tutti i dati che sono condivisi dalle versioni di
Wikipedia nelle diverse lingue. Nei record di Wikidata gli identificativi
dei cluster VIAF sono diventati una specifica “proprietà”, identificata
dal codice: P214**
Al 26 febbraio 2015 il numero totale di identificativi dei record
VIAF importati in Wikidata è pari a: 506.201.***
87
L’importazione in Wikidata
** Vedi Wikidata: https://www.wikidata.org/wiki/Property:P214?uselang=en-gb
*** Il dato si ricava utilizzando il Wikidata Query editor a: http://wdq.wmflabs.org/wdq/
l'apposita interfaccia di interrogazione del database Wikidata, e interrogandolo usando come
parametro la presenza di P214. Produce una lista di tutti gli items di Wikidata che contengono
la property P214: http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[214]
* Wikidata: http://www.wikidata.org/wiki/Wikidata:Main_Page
6.Wikipedia,OCLCeilVIAF
88. Nella Wikipedia inglese è stata creata una pagina per la segnalazione di errori:
Wikipedia: VIAF / errors: https://en.wikipedia.org/wiki/Wikipedia:VIAF/errors
88
Il lavoro di correzione manuale nella Wikipedia in lingua inglese
Al momento contiene le seguenti tipologie di errori:
1. la voce di Wikipedia si riferisce a una persona diversa che non coincide con la parsona a
cui fa riferimento l’identificativo VIAF
2. Due o più identificativi VIAF nella stessa voce
3. il VIAF ha messo insieme diverse identità in un unico cluster
4. Nel VIAF c’è più di un cluster per la stessa identità
5. Il link che all’interno del VIAF punta a un voce biografica di Wikipedia non è più aggiornato
6. Voci di Wikipedia dedicate a più di una persona, contengono l’identificativo VIAF solo per
una di queste persone
7. Altri errori
6.Wikipedia,OCLCeilVIAF
89. Il problema dei numerosi doppioni creati dai record da SBN è quello
che viene definito come: “Parallel VIAF clusters for one identity”:
https://en.wikipedia.org/wiki/Wikipedia:VIAF/
errors#Parallel_VIAF_clusters_for_one_identity
89
Problemi degli identificativi VIAF in Wikipedia in lingua italiana
6.Wikipedia,OCLCeilVIAF
90. Tra fine 2012 e inizio 2013 l'identificativo VIAF è stato condiviso con le
versioni di Wikipedia nelle altre lingue, tra cui la versione italiana.*
Nel corso del primo semestre del 2013, circa 72.000 voci della
versione italiana di Wikipedia sono state arricchite con gli
identificativi provenienti dal VIAF utilizzando il VIAFbot.**
A fine febbraio 2015 le voci della Wikipedia italiana popolate dal
VIAF sono diventate 75.793. La lista completa in ordine alfabetico si
trova alla pagina Categoria:Voci con codici di controllo di autorità.***
90
* Sull'importazione degli identificativi VIAF in Wikipedia, vedi: Max Klein, «VIAFbot Debriefing», 28 November 2012. hangingtogether.org.
http://hangingtogether.org/?p=2306 e «Library Data in Wikipedia and Wikidata», presentazione tenuta a EMEARC, 26 febbraio 2013,
Strasbourg, France. http://www.slideshare.net/oclcr/library-data-in-wikipedia-and-wikidata?from_search=3.
L’importazione degli identificativi VIAF in Wikipedia in lingua italiana
** Sull'importazione degli identificativi VIAF nella versione italiana di Wikipedia, vedi: GLAM/Newsletter/July 2013/Contents/Italy report:
http://outreach.wikimedia.org/wiki/GLAM/Newsletter/June_2013/Contents/Italy_report.
*** Vedi https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0.La lista viene aggiornata automaticamente
in base alla presenza del template Controllo di autorità al fondo delle voci.
6.Wikipedia,OCLCeilVIAF
91. 7. Identificativi nazionali. Wikipedia e SBN
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
92. Per i lettori di Wikipedia è importante anche poter avere link che
puntano al proprio catalogo nazionale.
92
L’importazione di altri identificativi in Wikipedia EN e in altre versioni
☞ Importanza della cultura locale, sia in Wikipedia
che negli authority files
☞ l’importazione automatica è stata resa possibile
dal fatto che esisteva già l’identificativo
internazionale VIAF che serviva a identificare la
voce in cui importare l’identificativo nazionale
A inizio 2013 sono stati importati in diverse versioni di Wikipedia gli
identificativi dei record nazionali.
7.Glialtriidentificativi,WikipediaITeSBN
93. 93
Tra 2013 e 2014 sono aumentati considerevolmente i tipi diversi di
identificativi per l’authority control ammessi in Wikidata: ora sono
104.
Vedi: la tabella “Controllo di autorità” alla pagina Wikidata:Lista di proprietà/Generiche
https://www.wikidata.org/wiki/Special:MyLanguage/Wikidata:List_of_properties/Generic
I numerosi identificativi per l’authority control in WikiData
7.Glialtriidentificativi,WikipediaITeSBN
94. 94
A un anno di distanza dall’importazione del VIAF, la Wikipedia inglese
ha arricchito la sezione Authority control che ora contiene vari
identificativi e relativi link:
• WorldCat (= WorldCat Identities)
• VIAF
• LCCN (= Library of Congress Control Number)
• ISNI (= International Standard Name Identifier)
• GND (= authority file tedesco: Gemeinsame Normdatei, o: Universal Authority File)
• BNF (= Bibliothèque National de France)
• ecc.
L’importazione di altri identificativi in Wikipedia EN e in altre versioni
7.Glialtriidentificativi,WikipediaITeSBN
95. L’importazione dell’identificativo nazionale ha riguardato anche la
versione italiana di Wikipedia.
La presenza degli identificativi VIAF ha consentito l’importazione degli
identificativi SBN in Wikidata e Wikipedia tramite una procedura
automatica.
A maggio 2013 è stata rivolta una proposta alla comunità di Wikipedia
in lingua italiana a cui è seguita una discussione.*
95
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
* Vedi la proposta e la discussione alla pagina: https://it.wikipedia.org/wiki/Discussioni_template:Controllo_di_autorità#ICCU.
7.Glialtriidentificativi,WikipediaITeSBN
96. 96
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
6.Glialtriidentificativi,WikipediaITeSBN
Box dei 3
identificativi:
- VIAF
- LCCN
- SBN
97. Per poter ottenere il match corretto tra una voce di Wikipedia (versione italiana), per es. la
voce dedicata all’autore X e il relativo identificativo SBN, è stato usato come elemento di
riferimento l’identificativo del cluster VIAF in cui è compreso anche l’identificativo Wikipedia
del medesimo autore X, già importato anche nelle altre versioni di Wikipedia.
Questo significa che la procedura automatica ha consentito di importare solo quegli
identificativi SBN che a inizio 2013 non erano “isolati” nel VIAF ma avevano un match con
un cluster VIAF multirecord che inoltre conteneva anche il record da Wikipedia:
circa 1400 voci di Wikipedia in versione italiana sono state arricchite con l’identificativo
del record SBN
97
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
☞ questo spiega perché la procedura automatica iniziale
ha potuto importare l’identificativo SBN solo in 1400 voci
Problema di quantità e di matching
7.Glialtriidentificativi,WikipediaITeSBN
98. La situazione del VIAF: confronto tra record SBN e da altri cataloghi a
primavera 2013:
98
VIAF: totale 33.667.856 di record
(al settembre 2013)
Totale record di autorità SBN:
3.714.476 (al luglio 2013)
VIAF
Record da SBN che hanno avuto un
match con almeno 1 altro record
VIAF: 5.993
(= 13% dei record forniti)
Record da SBN forniti al VIAF: 45.208
(= 1,2% del totale dei record di
autorità SBN)
39.215 record sono cluster “isolati”
Germania
ca. 10 milioni
di record
USA, Canada,
UK
ca. 9 milioni
di record
Portogallo
Francia
Spagna
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
A inizio 2013 i record da SBN che avevano un match con un cluster VIAF multirecord che conteneva anche un
record WKP erano un sottogruppo dei 5.993 record che avevano avuto un match con almeno 1 altro record
7.Glialtriidentificativi,WikipediaITeSBN
Record da SBN nel VIAF
45.208 tra 2009-2013
(= solo 1,2% dei record
autori in SBN)
99. La situazione dell’importazione degli identificativi nazionali in 4 versioni
di Wikipedia al 3 ottobre 2013:
99
Situazione 2013 dell’importazione degli identificativi nazionali
Wikipedia EN
Germania
Francia
Italia
LCCN [P244]
GND [P227]
BNF [P268]
SBN [P396]
157.992
218.898
161.168
1.534
Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData
Il numero di identificativi SBN importati automaticamente era di circa 1400.
Con un successivo lavoro di aggiunta manuale tra l’estate e il settembre 2013, erano
diventati 1534.
7.Glialtriidentificativi,WikipediaITeSBN
100. La situazione dell’importazione degli identificativi nazionali in 4 versioni
di Wikipedia al 26 febbraio 2015:
100
Situazione inizio 2015 dell’importazione degli identificativi nazionali
Wikipedia EN
Germania
Francia
Italia
LCCN [P244]
GND [P227]
BNF [P268]
SBN [P396]
211.940
336.700
149.431
3.756
Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData
7.Glialtriidentificativi,WikipediaITeSBN
101. La situazione del VIAF: confronto tra record da SBN e da altri
cataloghi a inizio 2015:
101
VIAF: totale 44.885.233 di record
(ad agosto 2014)
Totale record di autorità autori in
SBN: 3.911.525 (al gennaio 2015)
VIAF
Record da SBN che hanno avuto un
match con almeno 1 altro record
VIAF: ca. 66.000
(= 39% dei record forniti)
Record da SBN forniti al VIAF: 169.028
(= 4,3% del totale dei record di
autorità SBN)
Germania
ca. 10 milioni
di record
USA, Canada,
UK
ca. 9 milioni
di record
Portogallo
Francia
Spagna
La composizione del VIAF a inizio 2015
A inizio 2015 i record da SBN che hanno un match con un cluster VIAF multirecord che contiene un record WKP (=da
Wikipedia) sono un sottogruppo dei ca. 66.000 record che hanno avuto un match con almeno 1 altro record
7.Glialtriidentificativi,WikipediaITeSBN
Record da SBN nel VIAF
169.028 nel 2014
(= solo 4,3% dei record
autori in SBN)
102. Rimane un grosso scompenso nella Wikipedia italiana: a fine febbraio
2015:
75.793 VIAF ma solo 3.756 identificativi SBN
Tenendo comunque conto che:
1. se un identificativo SBN non è entrato a far parte di un cluster VIAF
nel quale è compreso anche l’identificativo WKP, non è importato in
WikiData
2. 169.028 record forniti sono solo il 4,3% del totale dei record autori
SBN (3.911.525 autori personali e collettivi, al gennaio 2015, e tutti i
record con livello inferiore a SUP non sono stati forniti al VIAF
3. per una differenza nelle regole catalografiche, non sempre a un
identificativo VIAF “può” corrispondere un identificativo SBN
102
Le criticità della importazione degli identificativi SBN
7.Glialtriidentificativi,WikipediaITeSBN
103. I problemi aperti:
1. il numero totale di identificativi importati rimane molto basso: il 4,3%
del totale
2. non è chiaro come funzioni la sincronizzazione tra VIAF e Wikidata
per quanto riguarda gli identificativi nazionali (questo nodo andrebbe
chiarito prima di optare per l’inserimento manuale degli identificativi
SBN, soluzione adottata nel biennio precedente dalle versioni
francese e tedesca di Wikipedia)
3. soprattutto non è chiara la strategia della rete SBN in relazione alla
manutenzione dell’authority file e quindi alla fornitura di record a
OCLC per il VIAF
103
Le criticità della importazione degli identificativi SBN
7.Glialtriidentificativi,WikipediaITeSBN
104. 8. L’inserimento manuale in Wikidata
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
105. L’aggiunta degli identificativi SBN si fa in Wikidata (non in Wikipedia).
La procedura è semplice:
1. si cerca l’identificativo del record di autorità SBN nella sezione Ricerca voci di autorità dell’opac SBN a: http://
opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth
2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record
3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in
Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova
riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P396 (che
nella struttura record di Wikidata corrisponde a: SBN Identifier). In alternativa alla digitazione del codice si può digitare
direttamente in lettere: SBN identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del
record SBN e si clicca sul link [save]
4. sotto all’identificativo SBN è necessario aggiunge la specificazione della fonte di provenienza del record di autorità. Si
clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143 utile per
specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato da” se si
lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported from. Nel
box di destra si inserisce il codice Q576951 utile per specificare la fonte e che corrisponde a: Servizio Bibliotecario
Nazionale. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Servizio Bibliotecario
Nazionale. Si clicca di nuovo sul link [save]
A questo punto la procedura di inserimento dell’identificativo SBN è conclusa.
105
* Wikidata: https://www.wikidata.org/. Una volta aggiunto un identificativo SBN in Wikidata, una procedura automatica lo aggiunge alla relativa
voce di Wikipedia.
Come si inseriscono manualmente gli identificativi SBN
8.Illavorodafare
106. L’aggiunta degli identificativi VIAF si fa sempre in WikiData (non in
Wikipedia).
La procedura è semplice:
1. si cerca l’identificativo del cluster VIAF usando l’interfaccia di ricerca del VIAF a http://viaf.org/ Nel menù a tendina a
sinistra Select Field si seleziona: Personal Names e se esiste più di un cluster VIAF si sceglie quello che al suo interno
contiene il record da Wikipedia, identificato dalla icona con la lettera W e il codice WKP
2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record
3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in
Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova
riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P214 (che
nella struttura record di Wikidata corrisponde a: VIAF Identifier). In alternativa alla digitazione del codice si può digitare
direttamente in lettere: VIAF identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del
cluster VIAF e si clicca sul link [save]
4. sotto all’identificativo del cluster VIAF è necessario aggiunge la specificazione della fonte di provenienza del record di
autorità. Si clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143
utile per specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato
da” se si lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported
from. Nel box di destra si inserisce il codice Q54919 utile per specificare la fonte e che corrisponde a: Virtual
International Authority File. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Virtual
International Authority File. Si clicca di nuovo sul link [save]
A questo punto la procedura di inserimento dell’identificativo VIAF è conclusa.
106
Come si inseriscono manualmente gli identificativi VIAF (se assenti)
8.Illavorodafare
107. Esempio con la voce dedicata a Elena Ferrante: https://it.wikipedia.org/wiki/Elena_Ferrante
L’identificativo SBN è: ITICCURAVV076631
Manca l’identificativo
del record SBN
110. identificativo del record SBN
Selezionare l’identificativo del record, copiarlo e poi incollarlo in WikiData.
ATTENZIONE: non copiare l’identificativo internazionale! Solo l’identificativo
SBN.
111. Dalla voce di Wikipedia è possibile arrivare al relativo item di Wikidata
cliccando su: Modifica link nella colonna di sinistra al termine dei link
112. In alternativa si fa una
ricerca per nome in
WikiData dall’apposito box
113. Il record dedicato a Elena
Ferrante nel database di
Wikidata a:
https://www.wikidata.org/
wiki/Q368127
114. Per editare gli items di
Wikidata bisogna prima
autenticarsi (o registrarsi)
115. Per aggiungere
l’identificativo SBN è
necessario scorrere la
tabella
“Dichiarazioni”
(“Statements”) fino al
fondo e aggiungere una
nuova riga dove
inseriremo la nuova
Proprietà: l’identificativo
SBN. Cliccare sul link
[add]
116. È stata aggiunta una
nuova riga evidenziata in
colore azzurro che
contiene il nuovo campo
utilizzabile per inserire una
nuova Proprietà: nel
nostro caso lo useremo
per inserire nel nuovo
campo vuoto il codice:
P396 (che corrisponde
alla proprietà SBN)
117. Nel box di sinistra inserire
il codice P396. Quando lo
si inserisce il sistema
visualizza il valore che
corrisponde al codice:
SBN Identifier Con il
mouse andare sopra il
suggerimento e cliccare
per selezionarlo.
In alternativa alla
digitazione del codice
P396 possiamo digitare
direttamente in lettere:
SBN identifier (se si lavora
con l’interfaccia in
inglese) o identificativo
SBN (se si lavora con
l’interfaccia in italiano).
118. Nel campo di destra inserire
l’identificativo del record SBN: nel
caso di Elena Ferrante:
ITICCURAVV076631
121. Nel nuovo campo che è comparso,
inserire il codice: P143 che
corrisponde all’etichetta: imported
from (se si lavora nella versione in
lingua inglese di Wikidata, o:
importato da se si lavora nella
versione in lingua italiana di
Wikidata). In alternativa alla
digitazione del codice è possibile
digitare direttamente in lettere:
imported from oppure importato da
(a seconda della lingua scelta per
l’interfaccia di lavorazione).
122. Quando si inserisce il
codice P143 il sistema
visualizza un
suggerimento in blu. Con
il mouse andare sopra il
suggerimento e cliccare
per selezionarlo.
123. Nel campo di destra inserire il
codice: Q576951 comparirà un
suggerimento in blu che contiene la
scritta: Servizio Bibliotecario
Nazionale corrispondente al valore
del codice inserito. Dare Invio per
salvare l’identificazione della fonte
del dato.
In alternativa alla digitazione del
codice è possibile digitare
direttamente in lettere: Servizio
Bibliotecario Nazionale.
126. l’identificativo del
record SBN è stato
aggiunto
automaticamente
alla voce in Wikipedia
☞ non occorre essere
bibliotecari e tantomeno
catalogatori
126
127. Una volta concluso l’inserimento in Wikidata, per ottenere che l'identificativo SBN
sia visibile anche nella relativa voce di Wikipedia non bisogna fare nulla. Il template
Controllo di autorità in Wikipedia è programmato per condividere automaticamente
con Wikidata l'identificativo SBN, che quindi è immediatamente visibile in
Wikipedia.
Nel caso che una verifica in Wikipedia non desse risultato positivo, è possibile che:
1. ci sia un problema di cache: per pulire la cache della pagina e ricaricarla si usa la
funzione "purge". Si proceda in questo modo: in Wikipedia, alla fine della URL della voce
che abbiamo aperto, aggiungere: ?action=purge
2. oppure è possibile che il template Controllo di autorità non sia visibile. Questo succede
se si tratta di una nuova voce a cui non è stato ancora aggiunto oppure per altri motivi. In
ogni caso, per renderlo visibile è necessario aggiungerlo manualmente con una normale
operazione di editing della voce di Wikipedia: ci si autentica, si clicca sul link in alto a
destra Modifica wikitesto, si scorre il testo della pagina per posizionarsi al fondo della
voce dove si aggiunge la seguente la stringa di caratteri:
{{Controllo di autorità}}
Quindi salvare e il template verrà visualizzato, popolato dagli identificativi presenti nel
relativo item in Wikidata.
127
Gli identificativi SBN nelle voci di Wikipedia
8.Illavorodafare
128. 2. clic su Modifica wikitesto
1. autenticarsi
3. interfaccia per l’editing della voce
4. al fondo della voce aggiungere:
{{Controllo di autorità}}
128
129. Come ottenere una lista aggiornata dinamicamente degli item di
Wikidata dotati di identificativo SBN:
129
In Wikidata utilizzare il parametro: pagine che puntano alla proprietà
[P396]*
https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P396
8.Illavorodafare
Lista dinamica degli item di Wikidata già dotati di identificativi SBN
oppure, in Wikidata, nella pagina della Property 396: https://
www.wikidata.org/wiki/Property:P396 cliccare nel menù a sinistra sul
link: What links here / Puntano qui
130. Come si ottiene una lista aggiornata dinamicamente degli item di
Wikidata dotati di identificativo SBN: in Wikidata, nella pagina della
Property 396: https://www.wikidata.org/wiki/Property:P396
130
8.Illavorodafare
Lista dinamica degli item di Wikidata già dotati di identificativi SBN
Cliccare su questo link
131. Stime sul lavoro manuale di aggiunta degli identificativi:
131
Il numero totale degli items relativi a nomi di persona ancora da
arricchire è stimabile al 26 febbraio 2015 in < 354.612 *
* Il totale di 354.612 items si ricava da una query di Wikidata impostata su 3 condizioni: avere una professione [P106], non avere
l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214].
Se si volesse una lista di lavoro limitata a nomi italiani, il numero
totale degli items relativi a nomi di persona ancora da arricchire
sarebbe stimabile al 26 febbraio 2015 in ≤ 11.219 **
** Il totale di 11.219 items si ricava da una query di Wikidata impostata su 3 condizioni: avere come paese di nascita l’Italia [P27:Q38], non
avere l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214].
8.Illavorodafare
Il lavoro che resta da fare: inserire gli identificativi SBN
132. Liste di lavoro aggiornate ricavabili da Wikidata:
132
1. Lista di item di Wikidata di tipo persona (= che hanno una professione [P106]), prive
di identificativo SBN [P396] ma dotate di identificativo VIAF [P214] e con link a una
voce nella Wikipedia italiana:
CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki]
8.Illavorodafare
Inserire manualmente gli identificativi SBN: il lavoro da fare
2. Lista di item di Wikidata di tipo persona, che hanno come paese di nascita l’Italia
[P27:Q38], sono privi di identificativo SBN [P396] ma hanno l’identificativo VIAF
[P214], e con link a una voce nella Wikipedia italiana:
CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki]
Oppure:
3. Lista di item di Wikidata che possiedono l’identificativo VIAF [P214], identificate in
base al parametro: Pages that link to "Property:P214" (non contiene solo persone)
https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P214
http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND
LINK[itwiki]
http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND
LINK[itwiki]
133. Lista di lavoro ricavabile da Wikipedia:
lista di quasi 76.000 voci, in ordine alfabetico, che hanno la sezione Controllo di autorità già
popolata (perlomeno dall’identificativo VIAF).
Questa lista si trova alla pagina: Categoria:Voci con codici di controllo di autorità e viene
aggiornata automaticamente in base alla presenza in una voce della sezione Controllo di
autorità*. Tuttavia, a differenza delle liste ricavabili da Wikidata, questa lista contiene sia voci
che possiedono già l’identificativo SBN, sia voci che non lo possiedono.
133
8.Illavorodafare
* Vedi: https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0
Inserire manualmente gli identificativi SBN: il lavoro da fare
134. Attenzione:
In WikiData devono essere inseriti SOLO gli identificativi SBN che sono rintracciabili
dall’Opac SBN nella sezione Ricerca voci di autorità*.
Infatti solo per questi identificativi è attivo il servizio di risoluzione* che con l'aggiunta
dell'identificativo del record SBN consente di creare hyperlink funzionanti da Wikidata/
Wikipedia all’opac SBN.
Pertanto non devono essere inseriti identificativi di record di autorità SBN che sono
rintracciabili solo usando un gestionale per SBN ( = tutti i record appartenenti a uno dei
seguenti livelli: 04; REC (05), MIN (6–51), MED (52–71) e MAX (72–90)
Se in Wikidata venissero inseriti identificativi SBN non rintracciabili con una ricerca dall’opac
SBN, l’hyperlink nella relativa voce di Wikipedia porterebbe all’opac SBN che visualizzerebbe il
messaggio: Nessun risultato trovato.
134
8.Illavorodafare
* Da: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth
Inserire manualmente gli identificativi SBN: il lavoro da fare
** Il servizio di risoluzione http://id.sbn.it/af/ che consente per es. di creare hyperlinks basati su URL con questa sintassi: http://id.sbn.it/af/IT/
ICCU/CFIV/009079
136. 136
La pagina di istruzioni in Wikipedia
8.Illavorodafare
Istruzioni per importare manualmente nelle voci di Wikipedia gli identificativi dei record di autorità
utilizzati nel catalogo SBN: https://it.wikipedia.org/wiki/Progetto:GLAM/Biblioteche/VIAF/SBN
137. 137
Elenco dei nomi con identificativi SBN che non possono essere inseriti
8.Illavorodafare
Elenco di identificativi SBN con livelli inferiori a SUP: https://it.wikipedia.org/wiki/Progetto:GLAM/
Biblioteche/VIAF/SBN/Elenco_autori_privi_di_identificativo_SBN_in_Voci_di_autorit%C3%A0_dell
%27opac_SBN
138. 138
La pagina per discutere, confrontarsi, porre problemi
8.Illavorodafare
La discussione sul template Controllo di autorità: http://it.wikipedia.org/wiki/
Discussioni_template:Controllo_di_autorit%C3%A0
se sono autenticato compaiono le
segnalazioni sulle risposte ai miei
interventi
139. 139
La pagina dei sondaggi sul Controllo di autorità
8.Illavorodafare
Wikipedia:Sondaggi/Controllo di autorità: http://it.wikipedia.org/wiki/Wikipedia:Sondaggi/
Controllo_di_autorit%C3%A0
140. 9. Navigare da Wikipedia agli opac
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
141. 141
L’inserimento nelle voci di Wikipedia degli
identificativi nazionali dei record di autorità consente
di ottenere dei link da Wikipedia agli opac di 2
diversi tipi:
1. link ai record di autorità negli authority files
2. link a liste di record bibliografici: sia per le
opere “di” che per le opere “su”
Da Wikipedia agli opac
9.NavigaredaWikipediaagliopac
142. L’identificativo da SBN è anche un link che consente di navigare verso
l’Authority file dell’opac web di SBN e da qui alle notizie bibliografiche
142
La realizzazione dell'hyperlink è stata resa possibile grazie al lavoro dei tecnici dell'ICCU che con
la supervisione di Giovanni Bergamin nel giugno 2013 hanno realizzato un risolutore http://
id.sbn.it/af/ che con l'aggiunta dell'identificativo SBN del record consente di creare un link
permanente che punta a un record di autorità nella interfaccia web dell'opac SBN. Per es. la URL
http://id.sbn.it/af/IT/ICCU/CFIV/009079 punta al record di autorità di Alessandro Manzoni
nell'opac web SBN.
Navigazione: dall’identificativo SBN al catalogo SBN
9.NavigaredaWikipediaagliopac
143. 143
Da Wikipedia agli opac
La creazione di link a liste di record bibliografici è stata sviluppata
dal bibliotecario americano John Ockerbloom* che ha creato 2
strumenti:
1. un apposito template da inserire nelle voci di Wikipedia:
“Library resources box”,
2. un servizio di redirect basato su una knowledge base per poter
creare link che a partire da una voce di Wikipedia, reindirizzano
a vari cataloghi, a scelta del lettore.
In questo modo si ottengono link a liste di opere “di” e liste di opere
“su” un certo autore usando un identificativo nazionale.*
* Vedi: John Ockerbloom, “From Wikipedia to our libraries”, in Everybody’s Libraries, 4 marzo
2013 http://everybodyslibraries.com/2013/03/04/from-wikipedia-to-our-libraries/ Il servizio di
redirect è attivo dalla pagina FTL: Forward to Libraries: http://tools.wmflabs.org/ftl/cgi-bin/ftl
9.NavigaredaWikipediaagliopac
144. 144
Da Wikipedia agli opac: la soluzione Ockerbloom
Esempio: la voce su Jane Austen nella versione inglese di Wikipedia
con il “Library resources box”
il template creato da Ockerbloom
Jane Austen: https://en.wikipedia.org/wiki/Jane_Austen
9.NavigaredaWikipediaagliopac
145. 145
Esempio: dalla voce su Jane Austen nella versione inglese di
Wikipedia è possibile grazie al 1: “Library resources box” navigare
al 3: catalogo della National Library of Australia passando dal 2:
servizio di redirect.
Da Wikipedia agli opac: la soluzione Ockerbloom
1 3
2
9.NavigaredaWikipediaagliopac
146. 146
La soluzione di Ockerbloom basata su un servizio
di redirect consente 3 vantaggi:
1. avere link diretti a liste di record bibliografici
2. invece di avere link che puntano solo al
catalogo nazionale, consente di puntare a
diversi cataloghi
3. consente all’utente di registrare la sua
preferenza per linkare a un singolo catalogo
tramite l’uso di cookie
Da Wikipedia agli opac
9.NavigaredaWikipediaagliopac
147. 147
Gli identificativi dei record di autorirà importati
nelle voci di Wikipedia possono servire anche per
creare dei link precisi dai cataloghi di biblioteca a
Wikipedia.
Navigare dagli opac alle voci di Wikipedia
Bisogna creare un servizio di redirect che
consente di usare URL che riutilizzano gli
identificativi dei record di autorità per puntare a
voci specifiche di una certa versione di Wikipedia
☞ come creare link dagli opac a specifiche voci di Wikipedia?
9.NavigaredaWikipediaagliopac
148. 148
Navigare dagli opac alle voci di Wikipedia
Nel caso di Wikipedia in lingua tedesca è già
stato creato un servizio di redirect, Wikipedia
Personsuche, che consente di inserire in qualsiasi
Opac URL create usando come parametro
specifico l’identifivativo nazionale del record di
autorità puntando alla pagina di Wikipedia che
contiene la voce di un autore.
Es. nel caso di Galileo Galilei, è possibile creare una URL diretta
usando l’identificativo 118537229 che nell’authority file tedesco GND
(Gemeinsame Normdatei) passa alla Wikipedia in tedesco tramite un
redirect: http://tools.wmflabs.org/persondata/p/gnd/118537229
9.NavigaredaWikipediaagliopac
149. 149
Pagina di Galileo Galilei in Wikipedia Personsuche:
http://tools.wmflabs.org/persondata/p/gnd/
118537229
9.NavigaredaWikipediaagliopac
150. 150
Nel caso di link dagli opac italiani alla versione
italiana di Wikipedia, bisognerebbe creare un
servizio di redirect analogo a quello tedesco in
modo che possa gestire URL che impieghino
come parametro l’identificativo SBN in questo
modo:
http://tools.wmflabs.org/persondata/p/sbn/IT%5CICCU%5CCFIV%5C009079
Dagli opac italiani alla versione italiana di Wikipedia
Verrebbe facilitato il linking dagli opac delle
biblioteche che lavorano in SBN a Wikipedia per
consentire agli utenti di trovare altre informazioni
sugli autori.
9.NavigaredaWikipediaagliopac
151. 151
Opac 1
Opac 2
Opac 3
Opac 4
Opac 5
Il funzionamento del servizio di redirect per gestire i link dai record negli opac a specifiche voci di
Wikipedia dedicate ad autori:
Servizio
nazionale
di
Redirect
(utilizza gli
identificativi
nazionali dei
record di
autorità)
Wikimedia IT
Link dagli opac a Wikipedia tramite un servizio di redirect
9.NavigaredaWikipediaagliopac
152. 152
Criticità del dialogo Wikipedia / Opac nel caso dell’Italia
☞ inserire anche nella versione italiana di Wikipedia un
numero significativo di identificativi
Problemi della situazione italiana da superare:
9.NavigaredaWikipediaagliopac
Innanzitutto, per far dialogare Wikipedia con i cataloghi
delle biblioteche sfruttando hyperlink precisi basati sugli
identificativi dei record di autorità è necessario:
153. 153
☞ Nuove sfide per le biblioteche:
Problemi:
1. i bibliotecari sono pronti a ottimizzare i loro
record catalografici per:
essere importati insieme ad altri in un contesto
internazionale?
essere importati in un nuovo contesto come
Wikipedia?
2. i nostri cataloghi sono “linkabili” dall’esterno
anche al livello di singolo record e di liste di
record?
9.NavigaredaWikipediaagliopac
Il riuso dei dati catalografici: le sfide che pone al bibliotecario
154. 154
I nuovi problemi sono culturali, tecnologici, di
visione del ruolo rinnovato del catalogo della
biblioteca nell’era del Web e della necessità di
aprire il catalogo al colloquio con sistemi esterni
molto popolari tra gli utenti.
☞ nell’era del Web il catalogo non basta più,
l’utente vuole più informazioni. Far dialogare
Wikipedia e gli opac è un modo per rispondere a
questa aspettativa.
9.NavigaredaWikipediaagliopac
Il riuso dei dati catalografici: le sfide che pone al bibliotecario
155. Grazie
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015