SlideShare a Scribd company logo
1 of 155
Download to read offline
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Condividere l’authority
control con Wikipedia
e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
Pierfranco Minsenti
Indice
1. Condividere i dati catalografici
2. L’Authority control in Wikipedia
3. Verso il VIAF: il dibattito 1961-2001
4. Che cos’è il VIAF
5. Il contributo italiano: SBN e VIAF
6. Wikipedia, OCLC e il VIAF
7. Identificativi nazionali. Wikipedia e SBN
8. L’inserimento manuale in Wikidata: istruzioni
9. Navigare da Wikipedia agli opac
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
1. Condividere i dati catalografici
4
Collaborazione tra Wikimedia e OCLC: caso concreto
di riuso dei dati catalografici prodotti dalle
biblioteche
1.Problema:riusodeidaticatalografici
OCLC e la collaborazione con Wikipedia grazie al VIAF
Dimostra:
1. le potenzialità dell’apertura dei cataloghi delle
biblioteche
2. le opportunità, gli spazi di miglioramento e la necessità
di adottare una strategia precisa
3. il grosso divario tra l’Italia e il resto del mondo nel
campo del controllo di autorità svolto dalle biblioteche
5
Il riuso dei dati catalografici: le sfide che pone al bibliotecario
☞ è una potenzialità che nasce dall’evoluzione
del Web verso i Linked Open Data
1.Problema:riusodeidaticatalografici
il riuso dei dati catalografici fuori dal catalogo è un problema
nuovo per il bibliotecario.
Il bibliotecario non è abituato a porselo perché nel contesto
cartaceo non esisteva la possibilità di riutilizzare i dati
catalografici.
Vantaggi ad aprire a collaborazioni e sinergie
6
Vantaggi della collaborazione tra Wikimedia e OCLC: creare una
sinergia utile a Wikipedia e alle biblioteche
1. per Wikipedia: l’identificazione delle persone a cui
sono dedicate le voci di Wikipedia tramite l’uso degli
identificativi ricavati da un archivio internazionale: il
VIAF
2. consentire la navigazione da Wikipedia ai
cataloghi: vantaggio per Wikipedia e per le biblioteche
per offrire opportunità di approfondimento ai lettori
1.Problema:riusodeidaticatalografici
OCLC e la collaborazione con Wikipedia tramite il VIAF
☞ nelle voci di Wikipedia si aprono delle
“finestre” verso i cataloghi
7
Benefici per le biblioteche
Perché alle biblioteche dovrebbe interessare?
1.Problema:riusodeidaticatalografici
☞ Se gli utenti sono sempre più abituati a
trascurare il catalogo e iniziare la ricerca su
Wikipedia, una soluzione è quella di portarli da
Wikipedia al catalogo della biblioteca
8
I record delle biblioteche non sono “aperti”: sono
consultabili liberamente grazie agli Opac, ma non
esistono soluzioni per favorire il riuso.
1.Problema:riusodeidaticatalografici
Dati liberi per consentire il riuso
Le condizioni:
Quali condizioni minime?
9
1.Problema:riusodeidaticatalografici
Dati liberi per consentire il riuso
1. mettere a disposizione i record in dataset completi, scaricabili
liberamente e in diversi formati*
2. adottare una licenza che consenta la libera riutilizzazione dei
record. Per il VIAF OCLC ha adottato la licenza ODC-By: Open
Data Commons Attribution License.**
3. infrastruttura tecnica
4. la definzione di ruoli precisi tramite accordi tra le istituzioni, la
creazione di agli organi di governo, la condivisione nella decisione
sulle strategie (partecipazione), la raccolta del feedback
4 condizioni minime:
* I dataset del VIAF sono messi a disposizione dalla pagina http://viaf.org/viaf/data/
** Vedi: http://opendatacommons.org/licenses/by/
10
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Non è possibile importare record in Wikipedia dai
singoli cataloghi. È necessario un archivio globale
di record che svolga la funzione di archivio
intermedio che faciliti l’esportazione dai cataloghi e
l’importazione in Wikipedia
L’infrastruttura tecnica:
La pagina da cui scaricare i dataset completi del VIAF aggiornati mensilmente:
http://viaf.org/viaf/data/
11
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Non è possibile importare record in Wikipedia dai
singoli cataloghi. È necessario un archivio globale
di record che svolga la funzione di archivio
intermedio che faciliti l’esportazione dai cataloghi e
l’importazione in Wikipedia
L’infrastruttura tecnica:
La licenza dei record del VIAF del tipo ODC-By: Open Data Commons Attribution License alla
pagina: http://viaf.org/viaf/data/
Consentito il riuso!
12
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Non è possibile importare record in Wikipedia dai
singoli cataloghi. È necessario un archivio globale
di record che svolga la funzione di archivio
intermedio che faciliti l’esportazione dai cataloghi
e l’importazione in Wikipedia
L’infrastruttura tecnica:
13
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
☞ il VIAF è un archivio globale di record di
autorità. Tra le altre funzioni svolge anche
quella di collettore di record per esportarli in
altri contesti come Wikipedia.
La partecipazione è gratuita.
1.Problema:riusodeidaticatalografici
Il VIAF è l’esempio concreto di una soluzione:
14
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Il VIAF è lo strumento che rende possibile una
collaborazione tra biblioteche e Wikipedia per il riuso dei
dati catalografici e la creazione di hyperlinks reciproci.
OCLC riveste un ruolo chiave come gestore del VIAF.
È una cooperazione tra 3 tipi di istituzioni:
Cataloghi
Biblioteche OCLC
VIAF
Wikimedia
Wikidata
Wikipedia
link dalle versioni di Wikipedia ai cataloghi
☞ Gli hyperlinks assicurano la reciprocità, l’interesse comune a cooperare
facilitando la navigazione all’utente.
15
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
VIAF
Catalogo
Catalogo
Catalogo
Catalogo
Catalogo
Virtual International
Authority File
Flusso dei dati: dai cataloghi al VIAF a Wikidata alle versioni di Wikipedia:
(archivio globale dei
record di autorità)
(database
unico che
alimenta
tutte le
voci di
Wikipedia)
WikimediaBiblioteche OCLC
WIKIDATA
http://viaf.org
16
Il riuso dei dati catalografici: il caso VIAF → Wikipedia
1.Problema:riusodeidaticatalografici
Volontari
17
La sinergia Biblioteche/VIAF/Wikipedia offre un esempio
concreto della riutilizzazione dei dati bibliotecari in altri
contesti.
1.Problema:riusodeidaticatalografici
I problemi
Le criticità della situazione italiana
Tuttavia per i motivi che analizzeremo, l’Italia è tra le nazioni
meno preparate per avvantaggiarsi di questo tipo di
soluzioni e sinergie.
☞ questa presentazione farà emergere il divario
tra le opportunità offerte a livello
internazionale e le scarse possibilità che ha
l’Italia di avvalersene
2. L’Authority control in Wikipedia
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Wikipedia e l’authority control
L’authority control non è uno strumento
fondamentale solo per i cataloghi delle biblioteche
ma anche per Wikipedia.
19
2.AuthoritycontrolinWikipediaebiblioteche
Nelle biblioteche duplice scopo: rendere possibile
la funzione identificativa e collocativa del catalogo.
1. identificare le “entità” con rilevanza bibliografica = quelle che
consentono raggruppamenti delle descrizioni per punti
d’accesso rilevanti ai fini della ricerca di una risorsa informativa
2. uso di forme controllate per designare i nomi delle entità
L’authority control: un concetto recente, una pratica radicata
Entità a rilevanza bibliografica:
1. nomi personali, collettivi, geografici
2. titoli uniformi; titoli di collana;
3. soggetti
20
2.AuthoritycontrolinWikipediaebiblioteche
Wikipedia e l’authority control
Esigenza comune da parte di biblioteche e
Wikipedia del controllo sulla forma dei nomi.
3 problemi da risolvere:
1. polisemia
es.: Winston Churchill (storico, 1620-1688); Winston Churchill (uomo
politico, 1874-1965);
2. sinonimia
es.: Ada Prospero; Ada Marchesini Gobetti Prospero
3. controllo delle forme correlate
es.: Lewis Carroll / Charles Dodgson
es.: Joseph Ratzinger / Papa Benedetto XVI
21
2.AuthoritycontrolinWikipediaebiblioteche
Wikipedia e l’authority control
Wikipedia condivide con le biblioteche anche il
principio di dare priorità al punto di vista
dell’utente nel trattamento della selezione della forma
principale e dei rinvii dalle forme varianti.
Es. la voce su Charles Dodgson / Lewis Carroll è
intitolata a Lewis Carroll e ha rinvio da Charles
Dodgson:
➡ https://it.wikipedia.org/wiki/Lewis_Carroll
➡ http://it.wikipedia.org/wiki/
Charles_Lutwidge_Dodgson
22
2.AuthoritycontrolinWikipediaebiblioteche
Wikipedia e l’authority control
Infine Wikipedia condivide con le biblioteche anche
l’uso di:
1. strumento per disambiguare gli omonomi: le
qualificazioni
2. liste di snodo per consentire la selezione del
nome + qualificazione
3. rinvii (redirect) nei casi di forme varianti correlate
23
2.AuthoritycontrolinWikipediaebiblioteche
Wikipedia e l’authority control
Charles Dodgson / Lewis Carroll
Una ricerca per Charles Dodgson porta a una pagina
di disambiguazione: https://en.wikipedia.org/wiki/
Charles_Dodgson che contiene una scelta fra 3
possibili voci:
➡ Charles Dodgson (bishop) (c. 1722–1795), Anglican Bishop of Elphin, grandfather of
the archdeacon https://en.wikipedia.org/wiki/Charles_Dodgson_(bishop)
➡ Charles Dodgson (archdeacon) (1800–1868), Anglican Archdeacon of Richmond, father
of the author https://en.wikipedia.org/wiki/Charles_Dodgson_(archdeacon)
➡ Charles Lutwidge Dodgson (1832–1898), better known by the pseudonym Lewis
Carroll, renowned children's and fantasy author https://en.wikipedia.org/wiki/
Lewis_Carroll
24
2.AuthoritycontrolinWikipediaebiblioteche
Wikipedia e l’authority control
Pagina di disambiguazione per Winston Churchill:
https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29
25
Pagina di disambiguazione per Winston Churchill
https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29
2.AuthoritycontrolinWikipediaebiblioteche
26
☞ il VIAF ha reso possibile l’avvio di una sinergia
consolidando soluzioni e strumenti
Wikipedia e l’authority control
era destino che Wikipedia individuasse nei records di
autorità prodotti dalle biblioteche un valido ausilio per
consolidare il suo lavoro
2.AuthoritycontrolinWikipediaebiblioteche
3. Verso il VIAF: il dibattito 1961-2001
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Il VIAF è un archivio elettronico internazionale dei
records di autorità dei nomi (personali, autori
collettivi, geografici, titoli uniformi) e costituisce la
soluzione pragmatica a una serie di problemi teorici
e pratici che hanno caratterizzato il dibattito
sull’authority control per circa 40 anni.
Allo stesso tempo crea nuove sfide perché aumenta
la complessità dei problemi portando l’authority
control su una scala internazionale.
28
☞ il VIAF è un work in progress
Il VIAF
3.VersoilVIAF:ildibattito1961-2001
29
Il dibattito 1961-1998 sulla forma del nome
1. forma con cui l’autore è più frequentemente
identificato nelle edizioni delle sue opere
OPPURE:
2. forma ricorrente nella critica e nei repertori
OPPURE:
3. forma diventuta costante nell’uso generale
Conferenza internazionale di Parigi del 1961: la
selezione della forma del nome*
* Vedi: Statement of principles adopted at the International Conference on Cataloguing
Principles, sezione 8.
3.VersoilVIAF:ildibattito1961-2001
30
Il dibattito 1961-1998 sulla forma del nome
Conferenza internazionale di Parigi del 1961: le
indicazioni sulla selezione della forma del nome
portano a un risultato contraddittorio tra 2
opposti obiettivi: la standardizzazione per
consentire la cooperazione vs. tradizioni
catalografiche nazionali familiari all’utente: gli “usi”
sono diversi!*
3.VersoilVIAF:ildibattito1961-2001
Questa contraddizione non emerge subito in maniera
consapevole ma percorre tutto il dibattito dei 40 anni
successivi.
* Vedi: M. Guerrini, L. Sardo, Authority control, Roma, AIB, 2003.
31
Il dibattito 1961-1998 sulla forma del nome
Alla base del lavoro dell’IFLA nei decenni successivi, in
particolare a partire dall’iniziaitva UBC: Universal
Bibliographic Control (1974) sta l’idea che la
cooperazione si ottenga tramite la standardizzazione e
che questa richieda l’adozione generale di una unica
forma universale del nome da parte di tutte le diverse
agenzie bibliografiche nazionali.
La forma unica universale del nome
3.VersoilVIAF:ildibattito1961-2001
32
Il dibattito 1961-1998 sulla forma del nome
1. uso di lingue diverse (incide per es. sui nomi geografici; sui titoli
uniformi)
2. uso di alfabeti diversi
3. uso di traslitterazioni da alfabeti non latini fatte con criteri diversi
(per es. in Francia il nome dell’autore della Sinfonia Patetica viene trascritto come
Čajkovskij, Petr Ilʹič, mentre negli Stati Uniti viene trascritto come: Tchaikovsky,
Peter Ilich)
4. uso di forme vernacolari (es. Pétrarque; Petrarch)
5. differenze concettuali nella definzione dell’entità a cui si riferisce il
“nome”: per es. distinzione tra identità bibliografica e identità
personale (vedi il caso dello scrittore irlandese John Banville pubblica romanzi
con il suo nome reale e gialli con lo pseudonimo di Benjamin Black)
6. altre differenze catalografiche: per es. uso tedesco delle iniziali
puntate
La standardizzazione nei nomi si scontra con differenze rilevanti
nelle tradizioni catalografiche nazionali:
3.VersoilVIAF:ildibattito1961-2001
33
Il dibattito 1961-1998 sulla forma del nome
Il conflitto tra forma unica universale vs. tradizioni locali ha
dominato il dibattito interno all’IFLA.
1998: anno di svolta, Conferenza IFLA di Amsterdam: Il
gruppo di lavoro IFLA sul Minimal Level Authority Records
conclude il proprio lavoro sostenendo che è irrealistico
aspettarsi che tutte le agenzie bibliografiche nazionali
adottino la stessa forma.
☞ è necessario trovare una soluzione che
metta assieme l’esigenza di preservare le
abitudini nazionali e i vantaggi della
cooperazione internazionale.
3.VersoilVIAF:ildibattito1961-2001
34
La tecnologia offre una soluzione
2001: GARR (Guidelines for authority and reference
records): la soluzione consiste nel mantenere la pluralità
delle forme nazionali e ricorrere alla tecnologia per creare
collegamenti tra le diverse forme.
☞ collegamenti, non fusione; molteplicità,
non forma unica
☞ preservare le differenze linguistico-
culturali facendole convivere con la
cooperazione/scambio e il principio della
uniformità di accesso
3.VersoilVIAF:ildibattito1961-2001
35
La tecnologia offre una soluzione
collegamenti tra forme diverse del nome riferite alla
stessa entità: il collegamento sostituisce l’idea della
forma “unica”. Le diverse forme sono considerate come
varianti correlate di pari importanza.
☞ nel VIAF questa soluzione dà vita ai
cluster: grappoli di records
3.VersoilVIAF:ildibattito1961-2001
4. Che cos’è il VIAF
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Che cos’è il VIAF
Il VIAF, Virtual International Authority File*, è un archivio elettronico
multinazionale dei record di autorità, nato nel 2003 grazie a un
accordo tra la Library of Congress, la Deutsche Nationalbibliothek e
OCLC.
Nel 2007 si aggiunse la Bibliothèque Nationale de France.
L'interfaccia pubblica di ricerca è stata aperta nel 2007, dalla URL:
http://orlabs.oclc.org/viaf/ e dall'inizio del 2009 dalla URL: http://
viaf.org/.**
37
** Queste informazioni si ricavano da una consultazione del servizio WayBackMachine di
Internet Archive. Nella bibliografia sul VIAF non abbiamo trovato informazioni relative alla data
di apertura al pubblico dell'interfaccia utente del VIAF.
* Per informazioni generali si veda: http://www.oclc.org/viaf.en.html
4.IlVIAF
Che cos’è il VIAF
Nell'aprile 2012 le quattro istituzioni bibliotecarie principali decisero di
modificare l'organizzazione del servizio trasferendone la titolarità a
OCLC.*
Attualmente la governance del progetto spetta al VIAF Council i cui
membri sono designati dalle agenzie catalografiche che forniscono
record al VIAF.
Dal maggio 2012 dataset completi vengono messi a disposizione con
aggiornamento mensile dalla pagina http://viaf.org/viaf/data con licenza
ODC-By**
38
** Open Data Commons Attribution License. Vedi: http://opendatacommons.org/licenses/by/
* Vedi l'annuncio di OCLC del 4 aprile 2012: «Virtual International Authority File service
transitions to OCLC; contributing institutions continue to shape direction through VIAF
Council»: http://www.oclc.org/news/releases/2012/201224.en.html.
4.IlVIAF
Che cos’è il VIAF
Il VIAF*, Virtual International Authority File, è un archivio elettronico
multinazionale dei record di autorità, nato nel 2003 e gestito da
OCLC e che attualmente ospita record di autori personali e
collettivi, titoli uniformi, nomi geografici forniti da agenzie
catalografiche di ogni parte del mondo, tra cui l’Italia.
Complessivamente al settembre 2013 il VIAF vede l'adesione di 34
agenzie catalografiche che rappresentano 28 paesi e hanno fornito
un totale di circa 33 milioni di record di autorità.
Il VIAF implementa Unicode e attualmente visualizza intestazioni che
possono essere in un qualsiasi set di caratteri appartenenti a 5
diversi alfabeti usati dalle agenzie catalografiche che collaborano
all'iniziativa: latino; cirillico; arabo; israeliano; giapponese.
39
* VIAF: http://viaf.org/
4.IlVIAF
VIAF: http://viaf.org/
Che cos’è il VIAF
L’infrastruttura tecnica è gestita da OCLC. Attualmente
ospita record di autori personali e collettivi, titoli
uniformi, nomi geografici forniti da agenzie
catalografiche di ogni parte del mondo, tra cui l’Italia.
Complessivamente al febbraio 2015 il VIAF vede
l'adesione di 39 agenzie catalografiche che
rappresentano 27 paesi e hanno fornito un totale di circa
45 milioni di record di autorità, di cui 35 relativi a nomi
di autori personali.
40
4.IlVIAF
Che cos’è il VIAF
Le informazioni più aggiornate sul VIAF si trovano sul
blog personale di Thomas Hickey, Chief Scientist di
OCLC e coordinatore dello staff tecnico che gestisce il
VIAF.*
Altre informazioni si trovano su slides e report messi a
disposizione dalla pagina: VIAF news.**
41
☞ Il VIAF è un work-in-progress in evoluzione
continua
* Thomas Hickey, Outgoing. Library metadata techniques and trends by Thom Hickey: http://
outgoing.typepad.com/outgoing/
** VIAF news: http://www.oclc.org/viaf/news.en.html
4.IlVIAF
Che cos’è il VIAF
Definizione per i non bibliotecari:
42
☞ il VIAF è una specie di anagrafe mondiale di tutti coloro a
cui viene riconosciuta una responsabilità in opere
dell’intelletto o in creazioni artistiche:
ci sono innanzitutto scrittori, come Alessandro Manzoni: http://viaf.org/viaf/14356/#Manzoni,_Alessandro,_1785-1873
Ma nel VIAF, come anche nei cataloghi delle biblioteche, non ci sono solo scrittori. Ci sono anche:
artisti, come il pittore Giorgione: http://viaf.org/viaf/39385864/#Giorgione,_1477-1511
registi, come Woody Allen: http://viaf.org/viaf/59077912/#Allen,_Woody,_1935-....
attori, come John Wayne: http://viaf.org/viaf/37103799/#Wayne,_John,_1907-1979
musicisti, come Giuseppe Verdi: http://viaf.org/viaf/22329110/#Verdi,_Giuseppe,_1813-1901
ballerini e coreografi, come Rudolf Nureyev: http://viaf.org/viaf/148483/#Nureyev,_Rudolf,_1938-1993
cantanti, come Lady Gaga: http://viaf.org/viaf/49555103/#Lady_Gaga
uomini di stato, come: Napoleone Bonaparte: http://viaf.org/viaf/106964661/#Napol
%C3%A9on_I,_Emperor_of_the_French,_1769-1821
traduttori famosi di opere letterarie, come Ettore Capriolo: http://viaf.org/viaf/283936245/#Capriolo,_Ettore
4.IlVIAF
Che cos’è il VIAF
43
☞ inoltre è una specie di anagrafe mondiale anche per:
nomi di autori collettivi (enti, ecc.), come la Wikimedia Foundation: http://viaf.org/viaf/
137022054/#Wikimedia_Foundation
nomi geografici (solo di autorità politico territoriali), come la Regione Toscana: http://viaf.org/
viaf/130807311/#Tuscany_(Italy)
titoli di opere, come Hamlet: http://viaf.org/viaf/176993890/
#Shakespeare,_William,_1564-1616._|_Hamlet
4.IlVIAF
Che cos’è il VIAF
Il VIAF implementa Unicode e attualmente visualizza intestazioni che
possono essere in un qualsiasi set di caratteri appartenenti ai
diversi alfabeti usati dalle agenzie catalografiche che collaborano
all'iniziativa: come latino; cirillico; arabo; israeliano; giapponese.
Per es.: il VIAF è l’unico strumento che può rispondere alla
domanda: quali forme del nome assume l’autore del Giardino dei
ciliegi nei vari cataloghi mondiali? Quale è la forma preferita nella
lingua e nell’alfabeto del catalogo nazionale del suo paese di
origine?
44
4.IlVIAF
Che cos’è il VIAF
Il VIAF implementa Unicode e attualmente visualizza intestazioni che
possono essere in un qualsiasi set di caratteri appartenenti a 5
diversi alfabeti usati dalle agenzie catalografiche che collaborano
all'iniziativa: latino; cirillico; arabo; israeliano; giapponese.
Per es.: il VIAF è l’unico strumento che può rispondere alla
domanda: quali forme del nome assume l’autore del Giardino dei
ciliegi nei vari cataloghi mondiali?
45
Il VIAF come strumento di consultazione: le diverse forme del nome
dell’autore del Giardino dei ciliegi nei vari cataloghi mondiali
e in diverse traslitterazioni e alfabeti nel cluster 95216565
Il record del
commediografo Anton
Pavlovič Čehov in cirillico
Il record del
commediografo Anton
Pavlovič Čehov dal
catalogo SBN
http://viaf.org/viaf/search?query=local.personalNames+all+%22cehov
%22&sortKeys=holdingscount&recordSchema=BriefVIAF
4.IlVIAF
I cluster
Il VIAF raccoglie insieme le diverse forme dei nomi in un “grappolo” di nomi che si
riferiscono alla stessa entità: il “grappolo” è chiamato cluster
46
http://viaf.org/viaf/39382430/#Petrarca,_Francesco,_1304-1374
cluster del record di
Francesco Petrarca
rappresentato con
un poligono stellato
4.IlVIAF
Come sono realizzati i cluster: due fasi
Il procedimento per la clusterizzazione è basato su 2 fasi*:
1. i record originali forniti dalle biblioteche vengono “arricchiti” con
informazioni ricavate dai record bibliografici che i contributori
devono fornire insieme ai record di autorità: vengono così
associati al record autore informazioni aggiuntive come titoli
associati all'autore, il nome di eventuali coautori inserite in tag
appositi del blocco 9XX. Il record viene definito enhanced
2. il confronto (matching) tra i record enhanced
47
* Informazioni ricavate da: Richard Bennett, et al. «VIAF (Virtual International Authority File) : Linking Die Deutsche Bibliothek and Library of
Congress Name Authority Files». Relazione presentata alla Conferenza IFLA 2006, Seoul, Korea, 20–24 agosto 2006. http://
citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.150.5328&rep=rep1&type=pdf. Giulia Manzotti. «Analisi e riflessioni sul VIAF, Virtual
International Authority File». JLIS.it 1.2 (2010): pp. 357–381. http://leo.cilea.it/index.php/jlis/article/view/4520.
4.IlVIAF
Come sono realizzati i cluster: l’algoritmo per il matching
I cluster sono stati realizzati tramite procedure automatiche di
confronto tra record (matching) basate su un algoritmo che
confronta:
1. il nome: per stabilire in una prima fase di confronto la
“compatibilità”
2. altre informazioni direttamente collegate all'autore, come le
specificazioni cronologiche (date di nascita e morte o solo data
di nascita)
3. altri dati ricavati dai record bibliografici associati alle notizie di
autorità (titoli associati all'autore, il nome di eventuali coautori
ecc.)
48
4.IlVIAF
Come sono realizzati i cluster del VIAF: esiti del matching
L'esito della procedura di matching può essere duplice:
1. in caso di esito positivo il record fornito dall'agenzia
catalografica viene aggregato a un cluster già esistente formato
da uno o più record = cluster multirecord
2. in caso negativo, il record viene importato nel VIAF ma crea un
nuovo cluster che contiene un unico record = cluster
monorecord
49
4.IlVIAF
Come sono realizzati i cluster del VIAF: esiti del matching
50
☞ Nel VIAF ci sono parecchi doppioni (cioè cluster
monorecord, effetto di un matching negativo)
☞ il casi di matching negativo possono riguardare:
1. nomi forniti solo da una certa agenzia: il loro isolamento è
corretto
2. nomi che avrebbero dovuto essere inclusi nei cluster già
formati
4.IlVIAF
Come sono realizzati i cluster del VIAF: esiti del matching
Le 3 variabili che contano:
1. la raffinatezza dell’algoritmo di matching
2. la qualità del record di autorità: dati che contiene e correttezza
3. i record bibliografici forniti
51
4.IlVIAF
Gli identificativi dei cluster
Come in un’anagrafe si usa il codice fiscale come identificativo
univoco delle persone fisiche, così nel VIAF ogni entità
rappresentata da un cluster ha un proprio identificativo numerico.
Per es.:
Francesco Petrarca: 99258155
Lady Gaga: 49555103
52
4.IlVIAF
Uso degli identificativi dei VIAF cluster nei cataloghi di biblioteca
53
Diverse agenzie catalografiche che partecipano al VIAF, inseriscono nei loro authority files, per
ogni record che hanno fornito, anche l'identificativo del cluster VIAF con cui è avvenuto il match
e il relativo link che punta al cluster VIAF.
Per es.
Library of Congress,
Bibliothèque Nationale de France,
Biblioteca Nazionale Svedese
Biblioteca della Dieta Nazionale del Giappone
☞ problema dell’authority file di SBN: non cita mai
nei record il numero identificativo del record VIAF
(i record di autorità SBN contengono un numero
ISADN, inutile).
SBN non è allineato alle pratiche internazionali che
stanno emergendo in relazione al VIAF.
4.IlVIAF
5. Il contributo italiano: SBN e VIAF
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
La partecipazione dell’Italia al VIAF
Avviene tramite l’ICCU che fornisce a OCLC per il
VIAF i record di autorità provenienti dal catalogo
SBN.
2009: inizio della partecipazione italiana al VIAF*.
55
5.SBNeilVIAF
* Vedi le informazioni fornite nelle due pagine web dell’Istituto Centrale per il Catalogo Unico: «Attività internazionali: Virtual International
Authority File (VIAF)» http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/internaz/pagina_367.html; Attività nazionali: Authority
Control», http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/naz/pagina_335.html .
La situazione dei record forniti dall’Italia al VIAF
Nel caso dei record di autori personali forniti
dall’Italia e provenienti dal catalogo SBN ci sono
problemi di:
1. quantità dei record forniti
2. matching con i record già presenti nel VIAF
A partire da fine 2013 la situazione è migliorata,
tuttavia il report annuale 2014 sul VIAF realizzato
da OCLC dimostra che la situazione dei record
italiani nel VIAF è molto indietro rispetto a quella di
altri paesi europei.
56
5.SBNeilVIAF
La situazione dei record da SBN dal 2009 a ottobre 2013:
57
** Vedi i dati quantitativi pubblicati alla pagina: http://www.iccu.sbn.it/opencms/opencms/it/main/bd/index.html Secondo i dati aggiornati al
gennaio 2015, i record di autorità autori sono: 3.911.525 autori (personali e collettivi).
Quantità e percentuali di matching dei record italiani nel VIAF*
45.189 record
forniti
costituivano solo
il 1,22% del totale
dei record di
autorità presenti
nel catalogo SBN
al giugno 2013:
3.714.476 **
☞ I record italiani nel VIAF hanno creato cluster
“doppioni” nell’87% dei casi = 39.215 record
I problemi del matching nel caso dei record forniti dall’Italia
* Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato al luglio 2013: OCLC. «2013 Annual Report to VIAF Council».
2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx.
5.SBNeilVIAF
La situazione del VIAF: confronto tra record SBN e da altri cataloghi a
primavera 2013:
58
VIAF: totale 33.667.856 di record
(al settembre 2013)
Totale record di autorità SBN:
3.714.476 (al luglio 2013)
VIAF
Record da SBN che hanno avuto un
match con almeno 1 altro record
VIAF: 5.993
(= 13% dei record forniti)
Record da SBN forniti al VIAF: 45.208
(= 1,2% del totale dei record di
autorità SBN)
39.215 record sono cluster “isolati”
Record da SBN
nel VIAF
45.208 tra
2009-2013
(= solo 1,2% dei
record autori in
SBN)
Germania
ca. 10 milioni
di record
USA, Canada,
UK
ca. 9 milioni
di record
Portogallo
Francia
Spagna
5.SBNeilVIAF
La situazione dei record forniti dall’Italia al VIAF
La situazione dei record forniti dall’Italia al VIAF
La quantità limitata di record forniti inizialmente al VIAF dall’ICCU si
spiega con la scelta di fornire solo i record con il livello massimo
di autorità: AUF (livello 97)
I livelli di catalogazione dei record autori in SBN sono ordinati secondo una progressione,
da quello inferiore a quello più elevato:
04
REC = 05
MIN = 6–51
MED = 52–71
MAX = 72–90
SUP = 91–95
AUF = 97
Appartengono al livello AUF innanzitutto i record che sono stati sottoposti a specifiche
procedure retrospettive di bonifica e arricchimento condotte a partire dagli anni 2001–2002
grazie al progetto Valorizzazione dell’Indice SBN.*
59
* Vedi: Cristina Magliano, «Direttive e metodologia per la creazione dell’authority file di SBN». In: Authority Control : definizioni ed esperienze
internazionali : Atti del convegno internazionale, Firenze, 10–12 Febbraio 2003, a cura di Mauro Guerrini e Barbara B. Tillett. Firenze: Firenze
University press, 2003, pp. 61–69. Il livello SUP in origine era riservato alle due Biblioteche Nazionali Centrali di Firenze e di Roma, ma da
tempo anche in altri Poli vengono create notizie autori con quel livello. Il livello AUF è riservato ai componenti di un gruppo di lavoro attivo
presso 14 istituzioni bibliotecarie della rete SBN.
5.SBNeilVIAF
La situazione dei record forniti dall’Italia al VIAF
Al VIAF non erano stati forniti i record con livello di autorità inferiore a
AUF. Mancavano, e mancano tutt’ora, per es. i seguenti autori:
- Cesare Beccaria (in SBN livello MAX CFIV016390)
- Marco Polo (in SBN livello MED CFIV028383)
- Cecco Angiolieri (in SBN livello MIN CFIV078939)
I record di questi autori erano presenti nel VIAF, ma mancava il record italiano, tutt’ora assente
(al febbraio 2015).
Inoltre fino alla fine del 2013 mancavano i record autori di livello SUP,
come per es.:
- Paolo Giordano (in SBN livello SUP UBOV259046)
- Lorenzo Da Ponte (in SBN livello SUP UBOV259046)
- Francesco Guicciardini (in SBN livello SUP CFIV004242)
- Wu Ming (in SBN livello SUP TO0V385956)
60
5.SBNeilVIAF
Diverso esito del matching in base alla fonte di provenienza dei record
61
Tabella 2013 ordinata in ordine decrescente per percentuale di matching: i record da SBN hanno la più bassa percentuale di matching (solo
13%).
Vedi il report: http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx.
5.SBNeilVIAF
Esempio di cluster doppioni nel 2013: i cluster relativi a Dante Alighieri
62
http://viaf.org/viaf/59080924/#Alighieri,_Dante
http://viaf.org/viaf/97105654/
#Dante_Alighieri,_1265-1321
VIAF cluster: 97105654VIAF cluster: 59080924
1 sola bandiera: cluster monorecord
poligono stellare: cluster multirecord
come si presentava la situazione dei cluster
relativi a Dante Alighieri nel 2013
5.SBNeilVIAF
Il miglioramento dopo la fine del 2013:
63
* Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato ad agosto 2014: OCLC. «2014 Annual Report to VIAF Council».
2014. http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf
Quantità e percentuali di matching dei record italiani nel VIAF nel 2014*
☞ miglioramenti a livello di:
2013 2014 Incremento
Totale'authority'record'nel'VIAF 33.667.856 44.885.233 11.217.377
Fornitura'di'records'da'SBN 45.208 169.028 123.820
%'di'clusterizzazione'dei'record'da'SBN 13% 39%
1. quantità: 169.028 record forniti sono il 4,3% del totale dei
record autori SBN (3.911.525 autori personali e collettivi, al
gennaio 2015). Sono stati forniti anche i record di livello SUP.
2. percentuale di matching (riduzione dei record isolati): ca.
66.000 match con un cluster multirecord
I problemi del matching nel caso dei record forniti dall’Italia
5.SBNeilVIAF
Diverso esito del matching in base alla fonte di provenienza dei record
64
Tabella 2014 ordinata in ordine decrescente per percentuale di matching: rispetto al 2013 i record da SBN hanno migliorato la percentuale di matching (dal 13% al 39%).
Vedi il report: http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf
5.SBNeilVIAF
65
http://viaf.org/viaf/97105654/#Dante_Alighieri,_1265-1321
record proveniente da SBN è incluso nel
cluster VIAF 97105654 e non forma più un
cluster isolato (eliminato VIAF 59080924)
Il cluster di Dante Alighieri: da fine 2013 è incluso in VIAF 97105654
5.SBNeilVIAF
Esempi:*
1. uomini politici: per es.: Barack Obama: 305358548 (invece di 52010985); ma anche
Umberto <re d'Italia ; 1.>: 90291016 (invece di 262250334).
2. artisti: per es.: Paolo Uccello: 305358201 (invece di 39395712);
3. registi: per es.: Alfred Hitchcock: 305357650 (invece di 49226917);
4. attori, sia italiani che stranieri, per es.: Monica Bellucci, 90383682 (invece di
106993456); Brad Pitt 305358254 (invece di 12462881); Sergio Castellitto: 90302845
(invece di 37125646); Humphrey Bogart: 305358227 (invece di 68937671);
5. cantanti e altre persone di spettacolo: per es.: Mina: 268502285 (invece di
62360130); Jannacci: 90146253 (invece di 1128716);
66
Casi di record da SBN che creano doppioni nel VIAF
* Ci sono poi casi di nomi che solo SBN ha fornito al VIAF e quindi è corretto che siano isolati in cluster monorecord. Per es. Bianca Berlinguer:
VIAF 90107330.
5.SBNeilVIAF
67
I dati comparativi dimostrano che la situazione
italiana deve migliorare per avvicinarsi quella di
altri paesi.
Come migliorare
5.SBNeilVIAF
è auspicabile:
1. una maggiore collaborazione tra chi gestisce SBN, l’ICCU e
OCLC per risolvere i problemi della situazione italiana.
2. un piano strategico volto a una bonifica dell'authority file di
SBN sfruttando le risorse disponibili
difficile individuare attualmente una strategia fatta di priorità e di organizzazione del lavoro
tramite il coordinamento delle risorse presenti nei Poli considerata la presenza nell’authority file
SBN di casi di record di livello AUF come l'attore di spaghetti western John Ireland http://
id.sbn.it/af/IT%5CICCU%5CUBOV%5C015247 che si accompagna a casi di record molto più
importanti, come Cesare Beccaria (liv. MAX) o Marco Polo (liv. MED) che sono tutt’ora in attesa di
essere sottoposti a bonifica e portati a livello SUP o AUF, per poterli poi fornire al VIAF e renderli
visibili nell’opac SBN, al livello della ricerca Voci di autorità.
6. Wikipedia, OCLC e il VIAF
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
69
Il progetto GLAM lanciato dalla Wikimedia Foundation
La collaborazione tra Wikipedia e le biblioteche
inizia con la GLAM-Wiki Initiative (Galleries,
Libraries, Archives, Museums with Wikipedia),
un progetto nato nel 2010 come collaborazione tra
la Wikimedia Foundation e istituzioni del settore
cultural heritage*.
* Wikipedia:GLAM/About <http://en.wikipedia.org/wiki/Wikipedia:GLAM/About>
6.Wikipedia,OCLCeilVIAF
70
Il progetto GLAM lanciato dalla Wikimedia Foundation
Obiettivo della GLAM-Wiki Initiative:
“aiutare le istituzioni del settore cultural heritage
a promuovere le loro collezioni su Wikipedia
attraverso progetti realizzati in collaborazione
con esperti redattori wikipediani”
6.Wikipedia,OCLCeilVIAF
71
Il programma “Wikipedian in residence”
Lo strumento concreto per realizzare la
collaborazione consiste nel nominare un redattore
esperto di Wikipedia che lavora con e dentro
l’istituzione partner: il “Wikipedian in residence”.*
* Sul programma “Wikipedian in residence” vedi: https://outreach.wikimedia.org/wiki/Wikipedian_in_Residence
6.Wikipedia,OCLCeilVIAF
72
Maggio 2012: due redattori di Wikipedia vengono ingaggiati con il ruolo di
"Wikipedian in Residence" per gestire progetti legati alle biblioteche:
* Vedi: http://www.oclc.org/research/news/2012/05-22.html
Il programma “Wikipedian in residence”
Max Klein negli Stati Uniti presso OCLC*
Andrew Gray in Gran Bretagna presso la British Library
6.Wikipedia,OCLCeilVIAF
Oggi nessuno dei due lavora più come Wikipedian in residence.
73
Il risultato pratico della collaborazione tra OCLC e
Wikimedia riguarda il VIAF, Virtual International
Authority File, e in particolare:
1. inizialmente l’inserimento di link da ogni cluster VIAF a
una corrispondente voce nella Wikipedia inglese
2. successivamente Wikipedia è stata promossa al ruolo di
contributore di record, alla pari di un’agenzia
bibliografica
3. infine le voci biografiche di Wikipedia sono state
arricchite con i link al VIAF
OCLC e la collaborazione con Wikipedia per il VIAF
6.Wikipedia,OCLCeilVIAF
Il rapporto tra il VIAF e Wikipedia inizia nel 2012 quando OCLC inserisce nel VIAF, nella
sezione About di ogni record cluster, un link che punta alla relativa voce di Wikipedia con la
funzione di facilitare agli utenti l'accesso diretto a informazioni più complete sull'autore.
74
Inserimento di link esterni dai cluster VIAF a Wikipedia
Sezione About del record
6.Wikipedia,OCLCeilVIAF
A seguito della adesione di OCLC alla GLAM Initiative, nel corso del
primo semestre del 2012 OCLC decise di promuovere Wikipedia al
livello di una vera e propria source di record equiparandola agli
authority files delle agenzie catalografiche.*
75
* Attualmente solo 4 fonti non create da biblioteche alimentano il VIAF come source alla pari
dei cataloghi delle biblioteche: la Union List of Artist Names del Getty Museum, la versione
inglese di Wikipedia, il database ISNI, e la biblioteca digitale Perseus.
Estate 2012: la svolta. Wikipedia da repertorio esterno a fonte del VIAF
☞ è una evoluzione di grande importanza:
a Wikipedia viene riconosciuta la stessa
autorevolezza di un catalogo di biblioteca
6.Wikipedia,OCLCeilVIAF
Il motivo per cui Wikipedia è stata elevata lo status di source è
spiegato nel report annuale 2013 del VIAF:*
poter sfruttare i dati identificativi presenti in Wikipedia (come quelli
biografici, i titoli di opere citate nella voce dell’autore ecc.) in modo da
poter migliorare la capacità aggregativa dei record VIAF cluster che
tra le altre cose dipende anche dal numero di dati inseriti nel cluster,
dato che la loro quantità aumenta le possibilità di ottenere un match
con nuovi record in arrivo.
76
* OCLC. «2013 Annual Report to VIAF Council». 2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-
Annual-Report-to-VIAF-Council.docx.
Perché Wikipedia viene promossa a source del VIAF
6.Wikipedia,OCLCeilVIAF
L’algoritmo di matching con cui è realizzato il clustering è facilitato
dalla presenza di un maggior numero di record:
«The efficiency of VIAF clusters is improved with the number of
contributing files because of the nature of this matching. There can be
situations where A matches B and B matches C, but C doesn’t match
A, yet A,B,C are a cluster».*
77
* Vedi Maximilian Klein e Alex Kyrios, "VIAFbot and the Integration of Library Data on Wikipedia2, in: code{4}lib, n. 22, 2013, http://
journal.code4lib.org/articles/8964
Perché Wikipedia viene promossa a source del VIAF
6.Wikipedia,OCLCeilVIAF
A
B
C
all’interno del cluster non tutti i record
hanno relazioni di matching tra di loro, ma
questo non impedisce il clustering
se non avessi avuto il record B
che fa da anello intermedio, A e
C non sarebbero nello stesso
cluster
78
Per poter trattare Wikipedia come una “fonte” di record, OCLC ricava
dai dati presenti in ogni voce della versione inglese di Wikipedia
dedicate ad autori personali un record (per ogni voce), strutturato in
formato MARC.
Questo “falso” record viene sottoposto alle procedure di matching già
usate per gli altri record e che determinano l’inserimento del record in
un certo cluster VIAF dove è identificato dalla sigla WKP.
L’importazione dei “record” da Wikipedia nel VIAF
6.Wikipedia,OCLCeilVIAF
79
Dalla voce di Wikipedia al record importato nel VIAF:
Creazione di record da Wikipedia e importazione nel VIAF
Record WKP: Luigi_Pirandello
http://viaf.org/processed/WKP|Luigi_Pirandellohttp://en.wikipedia.org/wiki/Luigi_Pirandello
Box dei dati biografici
Titoli delle opere
La voce di Wikipedia: Luigi_Pirandello
6.Wikipedia,OCLCeilVIAF
80
Il record WKP ricavato dalla voce su Luigi Pirandello nella versione inglese di
Wikipedia viene importato nel cluster VIAF insieme ai record forniti dai cataloghi
delle biblioteche
http://viaf.org/processed/WKP|Luigi_Pirandello
Il record ricavato da Wikipedia viene importato nei cluster del VIAF
http://viaf.org/viaf/64010465/#Pirandello,_Luigi,_1867-1936
Record cluster di Luigi Pirandello
Record WKP da Wikipedia è compreso nel cluster
6.Wikipedia,OCLCeilVIAF
1.135.025 record importati nel VIAF dalle voci della
Wikipedia in lingua inglese.
(ad agosto 2014; al luglio 2013 erano 1.075.291)*
81
Qualche dato numerico sui record importati nel VIAF
* Totale voci di Wikipedia in lingua inglese: 4.728.038 a fine febbraio 2015.
6.Wikipedia,OCLCeilVIAF
Nell’estate 2012 OCLC decide di rendere reciproci i link VIAF / Wikipedia:
82
Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot
da:
VIAF → Wikipedia EN
(solo link)
a:
VIAF
(identificativi dei cluster)
Wikipedia EN
(voci di W)
→
←
VIAFWikipedia EN
(record)
→
a:
6.Wikipedia,OCLCeilVIAF
83
L’importazione dei “record” da Wikipedia nel VIAF
Nelle voci di Wikipedia in lingua inglese viene inserito l’identificativo
dello specifico cluster VIAF in cui è già stato importato anche il “falso”
record WKP.
Questo lavoro viene eseguito tramite una procedura automatica detta
VIAFbot.
** VIAFbot Edits 250,000 Wikipedia Articles to Reciprocate All Links from VIAF into Wikipedia (7 dicembre 2012), http://www.oclc.org/research/
news/2012/12-07a.html
Gli identificativi VIAF vengono inseriti in un template già esistente: {{authority control}}.*
Nel 2012 il template {{authority control}} risultava già largamente usato dalla versione in lingua
tedesca (in 220.000 voci) ma poco usato dalla versione in lingua inglese (in 4.000 voci). Fino a
quel momento gli identificativi erano stati aggiunti “manualmente”. La nuova proposta intende
invece usare una procedura automatica: il VIAFbot.
La procedura è stata conclusa nel novembre 2012 e ha dato come
risultato l’importazione di 250.000 identificativi di cluster VIAF
all’interno delle relative voci della Wikipedia in lingua inglese.**
* Wikipedia:Authority control: https://en.wikipedia.org/wiki/Wikipedia:Authority_control
6.Wikipedia,OCLCeilVIAF
84
Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot
* La proposta: Authority control integration è ora archiviata a: http://en.wikipedia.org/w/index.php?
title=Wikipedia:Village_pump_(proposals)&oldid=499166049#Authority_Control_Integration
Dopo aver raccolto i primi pareri sulla base di una bozza*, crea una pagina specifica che
contiene una stesura più definita della proposta chiamata: “Authority control integration
proposal” che sottopone a votazione. I pareri espressi su quella pagina non sono tutti
favorevoli, ma prevalgono i pareri positivi.**
☞ In realtà OCLC “NON” decide nulla in maniera autonoma: si tratta di una proposta che
Max Klein rivolge alla Community di Wikipedia pubblicandola nella apposita sezione
per la discussione di nuove proposte: Village pump *
La proposta viene approvata ma da allora la discussione non si è fermata perché i redattori di
Wikipedia si confrontano su vari problemi. Vedi la pagina: Wikipedia talk:Authority control:
https://en.wikipedia.org/wiki/Wikipedia_talk:Authority_control
** Wikipedia:Authority control integration proposal/RFC: http://en.wikipedia.org/wiki/Wikipedia:Authority_control_integration_proposal/RFC
6.Wikipedia,OCLCeilVIAF
Il progetto di importazione degli identificativi dei record VIAF si proponeva di:
85
Obiettivi dell’integrazione dell’authority control in Wikipedia
1. funzione identificativa: attribuire alle voci biografiche un identificativo autorevole che
certificasse l’identificazione del soggetto della voce
2. facilitare il lavoro di creazione e manutenzione delle voci di Wikipedia collegando a
un repertorio che contiene tante forme alternative dello stesso nome
3. creare link dalle voci di Wikipedia al VIAF: nel VIAF si possono trovare informazioni
non contenute nell’enciclopedia, in particolare le forme autorizzate dei nomi, in diverse
lingue e in diversi alfabeti, usate nei cataloghi di biblioteca di varie parti del mondo
4. utilizzare gli identificativi per creare servizi di redirect precisi, perché basati su
identificativi, verso le voci di Wikipedia o verso altri servizi, come nel caso del servizio
tedesco Wikipedia Personensuche: http://tools.wmflabs.org/persondata/index.php *
3. creare le premesse per costruire servizi di collegamento ai cataloghi delle
biblioteche
* Esempio di utilizzo del servizio di redirect Wikipedia Personensuche: utilizzando l’identificativo del record di autorità dell’authority file
tedesco, è possibile creare una URL con una sintassi standard che porta a una pagina di snodo. Esempio con Galileo Galilei: authority
record GND 118537229 http://tools.wmflabs.org/persondata/p/gnd/118537229
6.Wikipedia,OCLCeilVIAF
86
Il posizionamento dell’authority control al fondo della voce
6.Wikipedia,OCLCeilVIAF
i codici identificativi dei record di autorità funzionano anche da link esterni
A fine 2012 gli stessi dati sono stati importati anche in Wikidata* il
database che contiene tutti i dati che sono condivisi dalle versioni di
Wikipedia nelle diverse lingue. Nei record di Wikidata gli identificativi
dei cluster VIAF sono diventati una specifica “proprietà”, identificata
dal codice: P214**
Al 26 febbraio 2015 il numero totale di identificativi dei record
VIAF importati in Wikidata è pari a: 506.201.***
87
L’importazione in Wikidata
** Vedi Wikidata: https://www.wikidata.org/wiki/Property:P214?uselang=en-gb
*** Il dato si ricava utilizzando il Wikidata Query editor a: http://wdq.wmflabs.org/wdq/
l'apposita interfaccia di interrogazione del database Wikidata, e interrogandolo usando come
parametro la presenza di P214. Produce una lista di tutti gli items di Wikidata che contengono
la property P214: http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[214]
* Wikidata: http://www.wikidata.org/wiki/Wikidata:Main_Page
6.Wikipedia,OCLCeilVIAF
Nella Wikipedia inglese è stata creata una pagina per la segnalazione di errori:
Wikipedia: VIAF / errors: https://en.wikipedia.org/wiki/Wikipedia:VIAF/errors
88
Il lavoro di correzione manuale nella Wikipedia in lingua inglese
Al momento contiene le seguenti tipologie di errori:
1. la voce di Wikipedia si riferisce a una persona diversa che non coincide con la parsona a
cui fa riferimento l’identificativo VIAF
2. Due o più identificativi VIAF nella stessa voce
3. il VIAF ha messo insieme diverse identità in un unico cluster
4. Nel VIAF c’è più di un cluster per la stessa identità
5. Il link che all’interno del VIAF punta a un voce biografica di Wikipedia non è più aggiornato
6. Voci di Wikipedia dedicate a più di una persona, contengono l’identificativo VIAF solo per
una di queste persone
7. Altri errori
6.Wikipedia,OCLCeilVIAF
Il problema dei numerosi doppioni creati dai record da SBN è quello
che viene definito come: “Parallel VIAF clusters for one identity”:
https://en.wikipedia.org/wiki/Wikipedia:VIAF/
errors#Parallel_VIAF_clusters_for_one_identity
89
Problemi degli identificativi VIAF in Wikipedia in lingua italiana
6.Wikipedia,OCLCeilVIAF
Tra fine 2012 e inizio 2013 l'identificativo VIAF è stato condiviso con le
versioni di Wikipedia nelle altre lingue, tra cui la versione italiana.*
Nel corso del primo semestre del 2013, circa 72.000 voci della
versione italiana di Wikipedia sono state arricchite con gli
identificativi provenienti dal VIAF utilizzando il VIAFbot.**
A fine febbraio 2015 le voci della Wikipedia italiana popolate dal
VIAF sono diventate 75.793. La lista completa in ordine alfabetico si
trova alla pagina Categoria:Voci con codici di controllo di autorità.***
90
* Sull'importazione degli identificativi VIAF in Wikipedia, vedi: Max Klein, «VIAFbot Debriefing», 28 November 2012. hangingtogether.org.
http://hangingtogether.org/?p=2306 e «Library Data in Wikipedia and Wikidata», presentazione tenuta a EMEARC, 26 febbraio 2013,
Strasbourg, France. http://www.slideshare.net/oclcr/library-data-in-wikipedia-and-wikidata?from_search=3.
L’importazione degli identificativi VIAF in Wikipedia in lingua italiana
** Sull'importazione degli identificativi VIAF nella versione italiana di Wikipedia, vedi: GLAM/Newsletter/July 2013/Contents/Italy report:
http://outreach.wikimedia.org/wiki/GLAM/Newsletter/June_2013/Contents/Italy_report.
*** Vedi https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0.La lista viene aggiornata automaticamente
in base alla presenza del template Controllo di autorità al fondo delle voci.
6.Wikipedia,OCLCeilVIAF
7. Identificativi nazionali. Wikipedia e SBN
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
Per i lettori di Wikipedia è importante anche poter avere link che
puntano al proprio catalogo nazionale.
92
L’importazione di altri identificativi in Wikipedia EN e in altre versioni
☞ Importanza della cultura locale, sia in Wikipedia
che negli authority files
☞ l’importazione automatica è stata resa possibile
dal fatto che esisteva già l’identificativo
internazionale VIAF che serviva a identificare la
voce in cui importare l’identificativo nazionale
A inizio 2013 sono stati importati in diverse versioni di Wikipedia gli
identificativi dei record nazionali.
7.Glialtriidentificativi,WikipediaITeSBN
93
Tra 2013 e 2014 sono aumentati considerevolmente i tipi diversi di
identificativi per l’authority control ammessi in Wikidata: ora sono
104.
Vedi: la tabella “Controllo di autorità” alla pagina Wikidata:Lista di proprietà/Generiche
https://www.wikidata.org/wiki/Special:MyLanguage/Wikidata:List_of_properties/Generic
I numerosi identificativi per l’authority control in WikiData
7.Glialtriidentificativi,WikipediaITeSBN
94
A un anno di distanza dall’importazione del VIAF, la Wikipedia inglese
ha arricchito la sezione Authority control che ora contiene vari
identificativi e relativi link:
• WorldCat (= WorldCat Identities)
• VIAF
• LCCN (= Library of Congress Control Number)
• ISNI (= International Standard Name Identifier)
• GND (= authority file tedesco: Gemeinsame Normdatei, o: Universal Authority File)
• BNF (= Bibliothèque National de France)
• ecc.
L’importazione di altri identificativi in Wikipedia EN e in altre versioni
7.Glialtriidentificativi,WikipediaITeSBN
L’importazione dell’identificativo nazionale ha riguardato anche la
versione italiana di Wikipedia.
La presenza degli identificativi VIAF ha consentito l’importazione degli
identificativi SBN in Wikidata e Wikipedia tramite una procedura
automatica.
A maggio 2013 è stata rivolta una proposta alla comunità di Wikipedia
in lingua italiana a cui è seguita una discussione.*
95
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
* Vedi la proposta e la discussione alla pagina: https://it.wikipedia.org/wiki/Discussioni_template:Controllo_di_autorità#ICCU.
7.Glialtriidentificativi,WikipediaITeSBN
96
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
6.Glialtriidentificativi,WikipediaITeSBN
Box dei 3
identificativi:
- VIAF
- LCCN
- SBN
Per poter ottenere il match corretto tra una voce di Wikipedia (versione italiana), per es. la
voce dedicata all’autore X e il relativo identificativo SBN, è stato usato come elemento di
riferimento l’identificativo del cluster VIAF in cui è compreso anche l’identificativo Wikipedia
del medesimo autore X, già importato anche nelle altre versioni di Wikipedia.
Questo significa che la procedura automatica ha consentito di importare solo quegli
identificativi SBN che a inizio 2013 non erano “isolati” nel VIAF ma avevano un match con
un cluster VIAF multirecord che inoltre conteneva anche il record da Wikipedia:
circa 1400 voci di Wikipedia in versione italiana sono state arricchite con l’identificativo
del record SBN
97
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
☞ questo spiega perché la procedura automatica iniziale
ha potuto importare l’identificativo SBN solo in 1400 voci
Problema di quantità e di matching
7.Glialtriidentificativi,WikipediaITeSBN
La situazione del VIAF: confronto tra record SBN e da altri cataloghi a
primavera 2013:
98
VIAF: totale 33.667.856 di record
(al settembre 2013)
Totale record di autorità SBN:
3.714.476 (al luglio 2013)
VIAF
Record da SBN che hanno avuto un
match con almeno 1 altro record
VIAF: 5.993
(= 13% dei record forniti)
Record da SBN forniti al VIAF: 45.208
(= 1,2% del totale dei record di
autorità SBN)
39.215 record sono cluster “isolati”
Germania
ca. 10 milioni
di record
USA, Canada,
UK
ca. 9 milioni
di record
Portogallo
Francia
Spagna
L’importazione degli identificativi SBN nella versione italiana di Wikipedia
A inizio 2013 i record da SBN che avevano un match con un cluster VIAF multirecord che conteneva anche un
record WKP erano un sottogruppo dei 5.993 record che avevano avuto un match con almeno 1 altro record
7.Glialtriidentificativi,WikipediaITeSBN
Record da SBN nel VIAF
45.208 tra 2009-2013
(= solo 1,2% dei record
autori in SBN)
La situazione dell’importazione degli identificativi nazionali in 4 versioni
di Wikipedia al 3 ottobre 2013:
99
Situazione 2013 dell’importazione degli identificativi nazionali
Wikipedia EN
Germania
Francia
Italia
LCCN [P244]
GND [P227]
BNF [P268]
SBN [P396]
157.992
218.898
161.168
1.534
Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData
Il numero di identificativi SBN importati automaticamente era di circa 1400.
Con un successivo lavoro di aggiunta manuale tra l’estate e il settembre 2013, erano
diventati 1534.
7.Glialtriidentificativi,WikipediaITeSBN
La situazione dell’importazione degli identificativi nazionali in 4 versioni
di Wikipedia al 26 febbraio 2015:
100
Situazione inizio 2015 dell’importazione degli identificativi nazionali
Wikipedia EN
Germania
Francia
Italia
LCCN [P244]
GND [P227]
BNF [P268]
SBN [P396]
211.940
336.700
149.431
3.756
Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData
7.Glialtriidentificativi,WikipediaITeSBN
La situazione del VIAF: confronto tra record da SBN e da altri
cataloghi a inizio 2015:
101
VIAF: totale 44.885.233 di record
(ad agosto 2014)
Totale record di autorità autori in
SBN: 3.911.525 (al gennaio 2015)
VIAF
Record da SBN che hanno avuto un
match con almeno 1 altro record
VIAF: ca. 66.000
(= 39% dei record forniti)
Record da SBN forniti al VIAF: 169.028
(= 4,3% del totale dei record di
autorità SBN)
Germania
ca. 10 milioni
di record
USA, Canada,
UK
ca. 9 milioni
di record
Portogallo
Francia
Spagna
La composizione del VIAF a inizio 2015
A inizio 2015 i record da SBN che hanno un match con un cluster VIAF multirecord che contiene un record WKP (=da
Wikipedia) sono un sottogruppo dei ca. 66.000 record che hanno avuto un match con almeno 1 altro record
7.Glialtriidentificativi,WikipediaITeSBN
Record da SBN nel VIAF
169.028 nel 2014
(= solo 4,3% dei record
autori in SBN)
Rimane un grosso scompenso nella Wikipedia italiana: a fine febbraio
2015:
75.793 VIAF ma solo 3.756 identificativi SBN
Tenendo comunque conto che:
1. se un identificativo SBN non è entrato a far parte di un cluster VIAF
nel quale è compreso anche l’identificativo WKP, non è importato in
WikiData
2. 169.028 record forniti sono solo il 4,3% del totale dei record autori
SBN (3.911.525 autori personali e collettivi, al gennaio 2015, e tutti i
record con livello inferiore a SUP non sono stati forniti al VIAF
3. per una differenza nelle regole catalografiche, non sempre a un
identificativo VIAF “può” corrispondere un identificativo SBN
102
Le criticità della importazione degli identificativi SBN
7.Glialtriidentificativi,WikipediaITeSBN
I problemi aperti:
1. il numero totale di identificativi importati rimane molto basso: il 4,3%
del totale
2. non è chiaro come funzioni la sincronizzazione tra VIAF e Wikidata
per quanto riguarda gli identificativi nazionali (questo nodo andrebbe
chiarito prima di optare per l’inserimento manuale degli identificativi
SBN, soluzione adottata nel biennio precedente dalle versioni
francese e tedesca di Wikipedia)
3. soprattutto non è chiara la strategia della rete SBN in relazione alla
manutenzione dell’authority file e quindi alla fornitura di record a
OCLC per il VIAF
103
Le criticità della importazione degli identificativi SBN
7.Glialtriidentificativi,WikipediaITeSBN
8. L’inserimento manuale in Wikidata
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
L’aggiunta degli identificativi SBN si fa in Wikidata (non in Wikipedia).
La procedura è semplice:
1. si cerca l’identificativo del record di autorità SBN nella sezione Ricerca voci di autorità dell’opac SBN a: http://
opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth
2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record
3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in
Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova
riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P396 (che
nella struttura record di Wikidata corrisponde a: SBN Identifier). In alternativa alla digitazione del codice si può digitare
direttamente in lettere: SBN identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del
record SBN e si clicca sul link [save]
4. sotto all’identificativo SBN è necessario aggiunge la specificazione della fonte di provenienza del record di autorità. Si
clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143 utile per
specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato da” se si
lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported from. Nel
box di destra si inserisce il codice Q576951 utile per specificare la fonte e che corrisponde a: Servizio Bibliotecario
Nazionale. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Servizio Bibliotecario
Nazionale. Si clicca di nuovo sul link [save]
A questo punto la procedura di inserimento dell’identificativo SBN è conclusa.
105
* Wikidata: https://www.wikidata.org/. Una volta aggiunto un identificativo SBN in Wikidata, una procedura automatica lo aggiunge alla relativa
voce di Wikipedia.
Come si inseriscono manualmente gli identificativi SBN
8.Illavorodafare
L’aggiunta degli identificativi VIAF si fa sempre in WikiData (non in
Wikipedia).
La procedura è semplice:
1. si cerca l’identificativo del cluster VIAF usando l’interfaccia di ricerca del VIAF a http://viaf.org/ Nel menù a tendina a
sinistra Select Field si seleziona: Personal Names e se esiste più di un cluster VIAF si sceglie quello che al suo interno
contiene il record da Wikipedia, identificato dalla icona con la lettera W e il codice WKP
2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record
3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in
Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova
riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P214 (che
nella struttura record di Wikidata corrisponde a: VIAF Identifier). In alternativa alla digitazione del codice si può digitare
direttamente in lettere: VIAF identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del
cluster VIAF e si clicca sul link [save]
4. sotto all’identificativo del cluster VIAF è necessario aggiunge la specificazione della fonte di provenienza del record di
autorità. Si clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143
utile per specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato
da” se si lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported
from. Nel box di destra si inserisce il codice Q54919 utile per specificare la fonte e che corrisponde a: Virtual
International Authority File. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Virtual
International Authority File. Si clicca di nuovo sul link [save]
A questo punto la procedura di inserimento dell’identificativo VIAF è conclusa.
106
Come si inseriscono manualmente gli identificativi VIAF (se assenti)
8.Illavorodafare
Esempio con la voce dedicata a Elena Ferrante: https://it.wikipedia.org/wiki/Elena_Ferrante
L’identificativo SBN è: ITICCURAVV076631
Manca l’identificativo
del record SBN
108
Tecnicamente è facile!
5.Glialtriidentificativi,WikipediaITeSBN
Inserire nel campo
il nome dell’autore
L’identificativo del record SBN va cercato nell’opac SBN > Voci di autorità
a: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth
Ferrante, Elena
risultato della ricerca: cliccare sull’hyperlink
per aprire la finestra con il record completo
identificativo del record SBN
Selezionare l’identificativo del record, copiarlo e poi incollarlo in WikiData.
ATTENZIONE: non copiare l’identificativo internazionale! Solo l’identificativo
SBN.
Dalla voce di Wikipedia è possibile arrivare al relativo item di Wikidata
cliccando su: Modifica link nella colonna di sinistra al termine dei link
In alternativa si fa una
ricerca per nome in
WikiData dall’apposito box
Il record dedicato a Elena
Ferrante nel database di
Wikidata a:
https://www.wikidata.org/
wiki/Q368127
Per editare gli items di
Wikidata bisogna prima
autenticarsi (o registrarsi)
Per aggiungere
l’identificativo SBN è
necessario scorrere la
tabella
“Dichiarazioni”
(“Statements”) fino al
fondo e aggiungere una
nuova riga dove
inseriremo la nuova
Proprietà: l’identificativo
SBN. Cliccare sul link
[add]
È stata aggiunta una
nuova riga evidenziata in
colore azzurro che
contiene il nuovo campo
utilizzabile per inserire una
nuova Proprietà: nel
nostro caso lo useremo
per inserire nel nuovo
campo vuoto il codice:
P396 (che corrisponde
alla proprietà SBN)
Nel box di sinistra inserire
il codice P396. Quando lo
si inserisce il sistema
visualizza il valore che
corrisponde al codice:
SBN Identifier Con il
mouse andare sopra il
suggerimento e cliccare
per selezionarlo.
In alternativa alla
digitazione del codice
P396 possiamo digitare
direttamente in lettere:
SBN identifier (se si lavora
con l’interfaccia in
inglese) o identificativo
SBN (se si lavora con
l’interfaccia in italiano).
Nel campo di destra inserire
l’identificativo del record SBN: nel
caso di Elena Ferrante:
ITICCURAVV076631
Cliccare sul link [save]
Aggiungere la fonte
dell’identificativo appena inserito:
cliccare sul link [add source]
Nel nuovo campo che è comparso,
inserire il codice: P143 che
corrisponde all’etichetta: imported
from (se si lavora nella versione in
lingua inglese di Wikidata, o:
importato da se si lavora nella
versione in lingua italiana di
Wikidata). In alternativa alla
digitazione del codice è possibile
digitare direttamente in lettere:
imported from oppure importato da
(a seconda della lingua scelta per
l’interfaccia di lavorazione).
Quando si inserisce il
codice P143 il sistema
visualizza un
suggerimento in blu. Con
il mouse andare sopra il
suggerimento e cliccare
per selezionarlo.
Nel campo di destra inserire il
codice: Q576951 comparirà un
suggerimento in blu che contiene la
scritta: Servizio Bibliotecario
Nazionale corrispondente al valore
del codice inserito. Dare Invio per
salvare l’identificazione della fonte
del dato.
In alternativa alla digitazione del
codice è possibile digitare
direttamente in lettere: Servizio
Bibliotecario Nazionale.
cliccare sul link [save]
L’inserimento dell’identificativo e
della fonte è completato.
l’identificativo del
record SBN è stato
aggiunto
automaticamente
alla voce in Wikipedia
☞ non occorre essere
bibliotecari e tantomeno
catalogatori
126
Una volta concluso l’inserimento in Wikidata, per ottenere che l'identificativo SBN
sia visibile anche nella relativa voce di Wikipedia non bisogna fare nulla. Il template
Controllo di autorità in Wikipedia è programmato per condividere automaticamente
con Wikidata l'identificativo SBN, che quindi è immediatamente visibile in
Wikipedia.
Nel caso che una verifica in Wikipedia non desse risultato positivo, è possibile che:
1. ci sia un problema di cache: per pulire la cache della pagina e ricaricarla si usa la
funzione "purge". Si proceda in questo modo: in Wikipedia, alla fine della URL della voce
che abbiamo aperto, aggiungere: ?action=purge
2. oppure è possibile che il template Controllo di autorità non sia visibile. Questo succede
se si tratta di una nuova voce a cui non è stato ancora aggiunto oppure per altri motivi. In
ogni caso, per renderlo visibile è necessario aggiungerlo manualmente con una normale
operazione di editing della voce di Wikipedia: ci si autentica, si clicca sul link in alto a
destra Modifica wikitesto, si scorre il testo della pagina per posizionarsi al fondo della
voce dove si aggiunge la seguente la stringa di caratteri:
{{Controllo di autorità}}
Quindi salvare e il template verrà visualizzato, popolato dagli identificativi presenti nel
relativo item in Wikidata.
127
Gli identificativi SBN nelle voci di Wikipedia
8.Illavorodafare
2. clic su Modifica wikitesto
1. autenticarsi
3. interfaccia per l’editing della voce
4. al fondo della voce aggiungere:
{{Controllo di autorità}}
128
Come ottenere una lista aggiornata dinamicamente degli item di
Wikidata dotati di identificativo SBN:
129
In Wikidata utilizzare il parametro: pagine che puntano alla proprietà
[P396]*
https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P396
8.Illavorodafare
Lista dinamica degli item di Wikidata già dotati di identificativi SBN
oppure, in Wikidata, nella pagina della Property 396: https://
www.wikidata.org/wiki/Property:P396 cliccare nel menù a sinistra sul
link: What links here / Puntano qui
Come si ottiene una lista aggiornata dinamicamente degli item di
Wikidata dotati di identificativo SBN: in Wikidata, nella pagina della
Property 396: https://www.wikidata.org/wiki/Property:P396
130
8.Illavorodafare
Lista dinamica degli item di Wikidata già dotati di identificativi SBN
Cliccare su questo link
Stime sul lavoro manuale di aggiunta degli identificativi:
131
Il numero totale degli items relativi a nomi di persona ancora da
arricchire è stimabile al 26 febbraio 2015 in < 354.612 *
* Il totale di 354.612 items si ricava da una query di Wikidata impostata su 3 condizioni: avere una professione [P106], non avere
l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214].
Se si volesse una lista di lavoro limitata a nomi italiani, il numero
totale degli items relativi a nomi di persona ancora da arricchire
sarebbe stimabile al 26 febbraio 2015 in ≤ 11.219 **
** Il totale di 11.219 items si ricava da una query di Wikidata impostata su 3 condizioni: avere come paese di nascita l’Italia [P27:Q38], non
avere l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214].
8.Illavorodafare
Il lavoro che resta da fare: inserire gli identificativi SBN
Liste di lavoro aggiornate ricavabili da Wikidata:
132
1. Lista di item di Wikidata di tipo persona (= che hanno una professione [P106]), prive
di identificativo SBN [P396] ma dotate di identificativo VIAF [P214] e con link a una
voce nella Wikipedia italiana:
CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki]
8.Illavorodafare
Inserire manualmente gli identificativi SBN: il lavoro da fare
2. Lista di item di Wikidata di tipo persona, che hanno come paese di nascita l’Italia
[P27:Q38], sono privi di identificativo SBN [P396] ma hanno l’identificativo VIAF
[P214], e con link a una voce nella Wikipedia italiana:
CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki]
Oppure:
3. Lista di item di Wikidata che possiedono l’identificativo VIAF [P214], identificate in
base al parametro: Pages that link to "Property:P214" (non contiene solo persone)
https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P214
http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND
LINK[itwiki]
http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND
LINK[itwiki]
Lista di lavoro ricavabile da Wikipedia:
lista di quasi 76.000 voci, in ordine alfabetico, che hanno la sezione Controllo di autorità già
popolata (perlomeno dall’identificativo VIAF).
Questa lista si trova alla pagina: Categoria:Voci con codici di controllo di autorità e viene
aggiornata automaticamente in base alla presenza in una voce della sezione Controllo di
autorità*. Tuttavia, a differenza delle liste ricavabili da Wikidata, questa lista contiene sia voci
che possiedono già l’identificativo SBN, sia voci che non lo possiedono.
133
8.Illavorodafare
* Vedi: https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0
Inserire manualmente gli identificativi SBN: il lavoro da fare
Attenzione:
In WikiData devono essere inseriti SOLO gli identificativi SBN che sono rintracciabili
dall’Opac SBN nella sezione Ricerca voci di autorità*.
Infatti solo per questi identificativi è attivo il servizio di risoluzione* che con l'aggiunta
dell'identificativo del record SBN consente di creare hyperlink funzionanti da Wikidata/
Wikipedia all’opac SBN.
Pertanto non devono essere inseriti identificativi di record di autorità SBN che sono
rintracciabili solo usando un gestionale per SBN ( = tutti i record appartenenti a uno dei
seguenti livelli: 04; REC (05), MIN (6–51), MED (52–71) e MAX (72–90)
Se in Wikidata venissero inseriti identificativi SBN non rintracciabili con una ricerca dall’opac
SBN, l’hyperlink nella relativa voce di Wikipedia porterebbe all’opac SBN che visualizzerebbe il
messaggio: Nessun risultato trovato.
134
8.Illavorodafare
* Da: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth
Inserire manualmente gli identificativi SBN: il lavoro da fare
** Il servizio di risoluzione http://id.sbn.it/af/ che consente per es. di creare hyperlinks basati su URL con questa sintassi: http://id.sbn.it/af/IT/
ICCU/CFIV/009079
135
Hyerlink all’opac SBN non funzionante nel caso del record Pinturicchio
8.Illavorodafare
136
La pagina di istruzioni in Wikipedia
8.Illavorodafare
Istruzioni per importare manualmente nelle voci di Wikipedia gli identificativi dei record di autorità
utilizzati nel catalogo SBN: https://it.wikipedia.org/wiki/Progetto:GLAM/Biblioteche/VIAF/SBN
137
Elenco dei nomi con identificativi SBN che non possono essere inseriti
8.Illavorodafare
Elenco di identificativi SBN con livelli inferiori a SUP: https://it.wikipedia.org/wiki/Progetto:GLAM/
Biblioteche/VIAF/SBN/Elenco_autori_privi_di_identificativo_SBN_in_Voci_di_autorit%C3%A0_dell
%27opac_SBN
138
La pagina per discutere, confrontarsi, porre problemi
8.Illavorodafare
La discussione sul template Controllo di autorità: http://it.wikipedia.org/wiki/
Discussioni_template:Controllo_di_autorit%C3%A0
se sono autenticato compaiono le
segnalazioni sulle risposte ai miei
interventi
139
La pagina dei sondaggi sul Controllo di autorità
8.Illavorodafare
Wikipedia:Sondaggi/Controllo di autorità: http://it.wikipedia.org/wiki/Wikipedia:Sondaggi/
Controllo_di_autorit%C3%A0
9. Navigare da Wikipedia agli opac
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015
141
L’inserimento nelle voci di Wikipedia degli
identificativi nazionali dei record di autorità consente
di ottenere dei link da Wikipedia agli opac di 2
diversi tipi:
1. link ai record di autorità negli authority files
2. link a liste di record bibliografici: sia per le
opere “di” che per le opere “su”
Da Wikipedia agli opac
9.NavigaredaWikipediaagliopac
L’identificativo da SBN è anche un link che consente di navigare verso
l’Authority file dell’opac web di SBN e da qui alle notizie bibliografiche
142
La realizzazione dell'hyperlink è stata resa possibile grazie al lavoro dei tecnici dell'ICCU che con
la supervisione di Giovanni Bergamin nel giugno 2013 hanno realizzato un risolutore http://
id.sbn.it/af/ che con l'aggiunta dell'identificativo SBN del record consente di creare un link
permanente che punta a un record di autorità nella interfaccia web dell'opac SBN. Per es. la URL
http://id.sbn.it/af/IT/ICCU/CFIV/009079 punta al record di autorità di Alessandro Manzoni
nell'opac web SBN.
Navigazione: dall’identificativo SBN al catalogo SBN
9.NavigaredaWikipediaagliopac
143
Da Wikipedia agli opac
La creazione di link a liste di record bibliografici è stata sviluppata
dal bibliotecario americano John Ockerbloom* che ha creato 2
strumenti:
1. un apposito template da inserire nelle voci di Wikipedia:
“Library resources box”,
2. un servizio di redirect basato su una knowledge base per poter
creare link che a partire da una voce di Wikipedia, reindirizzano
a vari cataloghi, a scelta del lettore.
In questo modo si ottengono link a liste di opere “di” e liste di opere
“su” un certo autore usando un identificativo nazionale.*
* Vedi: John Ockerbloom, “From Wikipedia to our libraries”, in Everybody’s Libraries, 4 marzo
2013 http://everybodyslibraries.com/2013/03/04/from-wikipedia-to-our-libraries/ Il servizio di
redirect è attivo dalla pagina FTL: Forward to Libraries: http://tools.wmflabs.org/ftl/cgi-bin/ftl
9.NavigaredaWikipediaagliopac
144
Da Wikipedia agli opac: la soluzione Ockerbloom
Esempio: la voce su Jane Austen nella versione inglese di Wikipedia
con il “Library resources box”
il template creato da Ockerbloom
Jane Austen: https://en.wikipedia.org/wiki/Jane_Austen
9.NavigaredaWikipediaagliopac
145
Esempio: dalla voce su Jane Austen nella versione inglese di
Wikipedia è possibile grazie al 1: “Library resources box” navigare
al 3: catalogo della National Library of Australia passando dal 2:
servizio di redirect.
Da Wikipedia agli opac: la soluzione Ockerbloom
1 3
2
9.NavigaredaWikipediaagliopac
146
La soluzione di Ockerbloom basata su un servizio
di redirect consente 3 vantaggi:
1. avere link diretti a liste di record bibliografici
2. invece di avere link che puntano solo al
catalogo nazionale, consente di puntare a
diversi cataloghi
3. consente all’utente di registrare la sua
preferenza per linkare a un singolo catalogo
tramite l’uso di cookie
Da Wikipedia agli opac
9.NavigaredaWikipediaagliopac
147
Gli identificativi dei record di autorirà importati
nelle voci di Wikipedia possono servire anche per
creare dei link precisi dai cataloghi di biblioteca a
Wikipedia.
Navigare dagli opac alle voci di Wikipedia
Bisogna creare un servizio di redirect che
consente di usare URL che riutilizzano gli
identificativi dei record di autorità per puntare a
voci specifiche di una certa versione di Wikipedia
☞ come creare link dagli opac a specifiche voci di Wikipedia?
9.NavigaredaWikipediaagliopac
148
Navigare dagli opac alle voci di Wikipedia
Nel caso di Wikipedia in lingua tedesca è già
stato creato un servizio di redirect, Wikipedia
Personsuche, che consente di inserire in qualsiasi
Opac URL create usando come parametro
specifico l’identifivativo nazionale del record di
autorità puntando alla pagina di Wikipedia che
contiene la voce di un autore.
Es. nel caso di Galileo Galilei, è possibile creare una URL diretta
usando l’identificativo 118537229 che nell’authority file tedesco GND
(Gemeinsame Normdatei) passa alla Wikipedia in tedesco tramite un
redirect: http://tools.wmflabs.org/persondata/p/gnd/118537229
9.NavigaredaWikipediaagliopac
149
Pagina di Galileo Galilei in Wikipedia Personsuche:
http://tools.wmflabs.org/persondata/p/gnd/
118537229
9.NavigaredaWikipediaagliopac
150
Nel caso di link dagli opac italiani alla versione
italiana di Wikipedia, bisognerebbe creare un
servizio di redirect analogo a quello tedesco in
modo che possa gestire URL che impieghino
come parametro l’identificativo SBN in questo
modo:
http://tools.wmflabs.org/persondata/p/sbn/IT%5CICCU%5CCFIV%5C009079
Dagli opac italiani alla versione italiana di Wikipedia
Verrebbe facilitato il linking dagli opac delle
biblioteche che lavorano in SBN a Wikipedia per
consentire agli utenti di trovare altre informazioni
sugli autori.
9.NavigaredaWikipediaagliopac
151
Opac 1
Opac 2
Opac 3
Opac 4
Opac 5
Il funzionamento del servizio di redirect per gestire i link dai record negli opac a specifiche voci di
Wikipedia dedicate ad autori:
Servizio
nazionale
di
Redirect
(utilizza gli
identificativi
nazionali dei
record di
autorità)
Wikimedia IT
Link dagli opac a Wikipedia tramite un servizio di redirect
9.NavigaredaWikipediaagliopac
152
Criticità del dialogo Wikipedia / Opac nel caso dell’Italia
☞ inserire anche nella versione italiana di Wikipedia un
numero significativo di identificativi
Problemi della situazione italiana da superare:
9.NavigaredaWikipediaagliopac
Innanzitutto, per far dialogare Wikipedia con i cataloghi
delle biblioteche sfruttando hyperlink precisi basati sugli
identificativi dei record di autorità è necessario:
153
☞ Nuove sfide per le biblioteche:
Problemi:
1. i bibliotecari sono pronti a ottimizzare i loro
record catalografici per:
essere importati insieme ad altri in un contesto
internazionale?
essere importati in un nuovo contesto come
Wikipedia?
2. i nostri cataloghi sono “linkabili” dall’esterno
anche al livello di singolo record e di liste di
record?
9.NavigaredaWikipediaagliopac
Il riuso dei dati catalografici: le sfide che pone al bibliotecario
154
I nuovi problemi sono culturali, tecnologici, di
visione del ruolo rinnovato del catalogo della
biblioteca nell’era del Web e della necessità di
aprire il catalogo al colloquio con sistemi esterni
molto popolari tra gli utenti.
☞ nell’era del Web il catalogo non basta più,
l’utente vuole più informazioni. Far dialogare
Wikipedia e gli opac è un modo per rispondere a
questa aspettativa.
9.NavigaredaWikipediaagliopac
Il riuso dei dati catalografici: le sfide che pone al bibliotecario
Grazie
Condividere l’authority control
con Wikipedia e Wikidata.
La nuova vita dei dati
prodotti dalle biblioteche.
“Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche”
Corso per AIB Toscana
Università di Firenze, Biblioteca di Scienze sociali, Aula didattica
2 – 3 marzo 2015

More Related Content

What's hot

Internet facile - Wikipedia @Acquanegra
Internet facile - Wikipedia @AcquanegraInternet facile - Wikipedia @Acquanegra
Internet facile - Wikipedia @AcquanegraValentina Tosi
 
Internet Facile - Wikipedia @Castiglione2014
Internet Facile - Wikipedia @Castiglione2014Internet Facile - Wikipedia @Castiglione2014
Internet Facile - Wikipedia @Castiglione2014Valentina Tosi
 
Internet facile wikipedia @Canneto
Internet facile wikipedia @CannetoInternet facile wikipedia @Canneto
Internet facile wikipedia @CannetoValentina Tosi
 
Biblioteche pubbliche tra mode passeggere e prospettive che si consolidano
Biblioteche pubbliche tra mode passeggere e prospettive che si consolidanoBiblioteche pubbliche tra mode passeggere e prospettive che si consolidano
Biblioteche pubbliche tra mode passeggere e prospettive che si consolidanoAnna Galluzzi
 
La biblioteca pubblica oggi e domani
La biblioteca pubblica oggi e domaniLa biblioteca pubblica oggi e domani
La biblioteca pubblica oggi e domaniAnna Galluzzi
 
Proposte per un servizio reference contemporaneo in biblioteca
Proposte per un servizio reference contemporaneo in bibliotecaProposte per un servizio reference contemporaneo in biblioteca
Proposte per un servizio reference contemporaneo in bibliotecaLaura Testoni
 
57congresso-aib-slide-testoni
57congresso-aib-slide-testoni57congresso-aib-slide-testoni
57congresso-aib-slide-testoniLaura Testoni
 
Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...
Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...
Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...Simonetta Sarzana
 
Reti documentare toscane Prato marzo 2011
Reti documentare toscane Prato marzo 2011Reti documentare toscane Prato marzo 2011
Reti documentare toscane Prato marzo 2011Susanna Giaccai
 
Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0
Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0
Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0Biblioragazzi-blog
 
Servizi di reference e assistenza al pubblico
Servizi di reference e assistenza al pubblicoServizi di reference e assistenza al pubblico
Servizi di reference e assistenza al pubblicospanero
 
New librarianship: un futuro sociale per biblioteche e bibliotecari?
New librarianship: un futuro sociale per biblioteche e bibliotecari?New librarianship: un futuro sociale per biblioteche e bibliotecari?
New librarianship: un futuro sociale per biblioteche e bibliotecari?Anna Galluzzi
 
Biblioteche: conoscenze, comunità, sostenibilità
Biblioteche: conoscenze, comunità, sostenibilitàBiblioteche: conoscenze, comunità, sostenibilità
Biblioteche: conoscenze, comunità, sostenibilitàGabriele De Veris
 
Information literacy (1)
Information literacy (1)Information literacy (1)
Information literacy (1)Laura Testoni
 
Biblioteche: accesso alla conoscenza tra dimensione locale e globale
Biblioteche: accesso alla conoscenza tra dimensione locale e globaleBiblioteche: accesso alla conoscenza tra dimensione locale e globale
Biblioteche: accesso alla conoscenza tra dimensione locale e globaleAnna Galluzzi
 
Il Progetto Vivarium e Wikibooks
Il Progetto Vivarium e WikibooksIl Progetto Vivarium e Wikibooks
Il Progetto Vivarium e WikibooksLuigi Catalani
 
2.i servizi delle biblioteche universitarie scn unipa_2011_secondaparte
2.i servizi delle biblioteche universitarie   scn  unipa_2011_secondaparte2.i servizi delle biblioteche universitarie   scn  unipa_2011_secondaparte
2.i servizi delle biblioteche universitarie scn unipa_2011_secondaparteSimonetta Sarzana
 
Biblioteche per tutti? Imparare dal passato e riflettere sul presente
Biblioteche per tutti? Imparare dal passato e riflettere sul presenteBiblioteche per tutti? Imparare dal passato e riflettere sul presente
Biblioteche per tutti? Imparare dal passato e riflettere sul presenteAnna Galluzzi
 

What's hot (20)

Internet facile - Wikipedia @Acquanegra
Internet facile - Wikipedia @AcquanegraInternet facile - Wikipedia @Acquanegra
Internet facile - Wikipedia @Acquanegra
 
Internet Facile - Wikipedia @Castiglione2014
Internet Facile - Wikipedia @Castiglione2014Internet Facile - Wikipedia @Castiglione2014
Internet Facile - Wikipedia @Castiglione2014
 
Internet facile wikipedia @Canneto
Internet facile wikipedia @CannetoInternet facile wikipedia @Canneto
Internet facile wikipedia @Canneto
 
Biblioteche pubbliche tra mode passeggere e prospettive che si consolidano
Biblioteche pubbliche tra mode passeggere e prospettive che si consolidanoBiblioteche pubbliche tra mode passeggere e prospettive che si consolidano
Biblioteche pubbliche tra mode passeggere e prospettive che si consolidano
 
La biblioteca pubblica oggi e domani
La biblioteca pubblica oggi e domaniLa biblioteca pubblica oggi e domani
La biblioteca pubblica oggi e domani
 
Proposte per un servizio reference contemporaneo in biblioteca
Proposte per un servizio reference contemporaneo in bibliotecaProposte per un servizio reference contemporaneo in biblioteca
Proposte per un servizio reference contemporaneo in biblioteca
 
57congresso-aib-slide-testoni
57congresso-aib-slide-testoni57congresso-aib-slide-testoni
57congresso-aib-slide-testoni
 
Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...
Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...
Esperienze di web2.0 nelle biblioteche: una nuova identità per un mestiere an...
 
Reti documentare toscane Prato marzo 2011
Reti documentare toscane Prato marzo 2011Reti documentare toscane Prato marzo 2011
Reti documentare toscane Prato marzo 2011
 
Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0
Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0
Favorire l’accesso all’informazione della Net Generation: La biblioteca 2.0
 
Servizi di reference e assistenza al pubblico
Servizi di reference e assistenza al pubblicoServizi di reference e assistenza al pubblico
Servizi di reference e assistenza al pubblico
 
New librarianship: un futuro sociale per biblioteche e bibliotecari?
New librarianship: un futuro sociale per biblioteche e bibliotecari?New librarianship: un futuro sociale per biblioteche e bibliotecari?
New librarianship: un futuro sociale per biblioteche e bibliotecari?
 
Biblioteche: conoscenze, comunità, sostenibilità
Biblioteche: conoscenze, comunità, sostenibilitàBiblioteche: conoscenze, comunità, sostenibilità
Biblioteche: conoscenze, comunità, sostenibilità
 
Information literacy (1)
Information literacy (1)Information literacy (1)
Information literacy (1)
 
Biblioteche: accesso alla conoscenza tra dimensione locale e globale
Biblioteche: accesso alla conoscenza tra dimensione locale e globaleBiblioteche: accesso alla conoscenza tra dimensione locale e globale
Biblioteche: accesso alla conoscenza tra dimensione locale e globale
 
Il Progetto Vivarium e Wikibooks
Il Progetto Vivarium e WikibooksIl Progetto Vivarium e Wikibooks
Il Progetto Vivarium e Wikibooks
 
2.i servizi delle biblioteche universitarie scn unipa_2011_secondaparte
2.i servizi delle biblioteche universitarie   scn  unipa_2011_secondaparte2.i servizi delle biblioteche universitarie   scn  unipa_2011_secondaparte
2.i servizi delle biblioteche universitarie scn unipa_2011_secondaparte
 
Seminario Wiki Manuzio
Seminario Wiki ManuzioSeminario Wiki Manuzio
Seminario Wiki Manuzio
 
Biblioteca digitale
Biblioteca digitaleBiblioteca digitale
Biblioteca digitale
 
Biblioteche per tutti? Imparare dal passato e riflettere sul presente
Biblioteche per tutti? Imparare dal passato e riflettere sul presenteBiblioteche per tutti? Imparare dal passato e riflettere sul presente
Biblioteche per tutti? Imparare dal passato e riflettere sul presente
 

Similar to Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche.

Lezione 12: Creazione collettiva
Lezione 12: Creazione collettivaLezione 12: Creazione collettiva
Lezione 12: Creazione collettivaRoberto Polillo
 
Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)
Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)
Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)Iolanda Pensa
 
Wikipedia all'Università
Wikipedia all'UniversitàWikipedia all'Università
Wikipedia all'UniversitàLoretta Manzato
 
Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.
Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.
Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.Iolanda Pensa
 
Corso Web 2.0: Creazione collettiva
Corso Web 2.0: Creazione collettivaCorso Web 2.0: Creazione collettiva
Corso Web 2.0: Creazione collettivaRoberto Polillo
 
La Biblioteca Digitale come metafora
La Biblioteca Digitale come metaforaLa Biblioteca Digitale come metafora
La Biblioteca Digitale come metaforaDARIAH-IT
 
11. Creazione collettiva
11. Creazione collettiva11. Creazione collettiva
11. Creazione collettivaRoberto Polillo
 
GLAM: progetti nazionali e GLAM/AIB Campania
GLAM: progetti nazionali e GLAM/AIB CampaniaGLAM: progetti nazionali e GLAM/AIB Campania
GLAM: progetti nazionali e GLAM/AIB CampaniaClaudio Forziati
 
19 - Wiki, Wikipedia e Open Internet
19 - Wiki, Wikipedia e Open Internet19 - Wiki, Wikipedia e Open Internet
19 - Wiki, Wikipedia e Open InternetGiuseppe Vizzari
 
Introduzione a Wikipedia. Wikimuseums, Napoli 05052016
Introduzione a Wikipedia. Wikimuseums, Napoli 05052016Introduzione a Wikipedia. Wikimuseums, Napoli 05052016
Introduzione a Wikipedia. Wikimuseums, Napoli 05052016Claudio Forziati
 
Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)
Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)
Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)Iolanda Pensa
 
14 - I Wiki, Wikipedia e “open internet”
14 - I Wiki, Wikipedia e “open internet”14 - I Wiki, Wikipedia e “open internet”
14 - I Wiki, Wikipedia e “open internet”Giuseppe Vizzari
 
Wikibib : un nuovo ecosistema per i dati bibliografici
Wikibib : un nuovo ecosistema per i dati bibliograficiWikibib : un nuovo ecosistema per i dati bibliografici
Wikibib : un nuovo ecosistema per i dati bibliograficiChiara Storti
 
The Wikipedia Library e #1Lib1Ref
The Wikipedia Library e #1Lib1RefThe Wikipedia Library e #1Lib1Ref
The Wikipedia Library e #1Lib1RefChiara Storti
 

Similar to Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. (20)

Lezione 12: Creazione collettiva
Lezione 12: Creazione collettivaLezione 12: Creazione collettiva
Lezione 12: Creazione collettiva
 
Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)
Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)
Corso Wikipediani in residenza seconda puntata (a cura di Remulazz)
 
Wikipedia all'Università
Wikipedia all'UniversitàWikipedia all'Università
Wikipedia all'Università
 
Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.
Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.
Programma del Corso per WIkipediani in Residenza marzo-maggio 2012.
 
Corso Web 2.0: Creazione collettiva
Corso Web 2.0: Creazione collettivaCorso Web 2.0: Creazione collettiva
Corso Web 2.0: Creazione collettiva
 
La Biblioteca Digitale come metafora
La Biblioteca Digitale come metaforaLa Biblioteca Digitale come metafora
La Biblioteca Digitale come metafora
 
Wiki e open internet
Wiki e open internetWiki e open internet
Wiki e open internet
 
11. Creazione collettiva
11. Creazione collettiva11. Creazione collettiva
11. Creazione collettiva
 
GLAM: progetti nazionali e GLAM/AIB Campania
GLAM: progetti nazionali e GLAM/AIB CampaniaGLAM: progetti nazionali e GLAM/AIB Campania
GLAM: progetti nazionali e GLAM/AIB Campania
 
19 - Wiki, Wikipedia e Open Internet
19 - Wiki, Wikipedia e Open Internet19 - Wiki, Wikipedia e Open Internet
19 - Wiki, Wikipedia e Open Internet
 
Introduzione a Wikipedia. Wikimuseums, Napoli 05052016
Introduzione a Wikipedia. Wikimuseums, Napoli 05052016Introduzione a Wikipedia. Wikimuseums, Napoli 05052016
Introduzione a Wikipedia. Wikimuseums, Napoli 05052016
 
Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)
Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)
Corso Wikipediani in residenza. Prima puntata (a cura di Remulazz)
 
22. I wiki e wikipedia
22. I wiki e wikipedia22. I wiki e wikipedia
22. I wiki e wikipedia
 
Cristina Cocever, Il progetto GLAM
Cristina Cocever, Il progetto GLAMCristina Cocever, Il progetto GLAM
Cristina Cocever, Il progetto GLAM
 
14 - I Wiki, Wikipedia e “open internet”
14 - I Wiki, Wikipedia e “open internet”14 - I Wiki, Wikipedia e “open internet”
14 - I Wiki, Wikipedia e “open internet”
 
Web20 Agripolis 2009
Web20 Agripolis 2009Web20 Agripolis 2009
Web20 Agripolis 2009
 
Wikipedia
WikipediaWikipedia
Wikipedia
 
La Biblioteca 2.0
La Biblioteca 2.0La Biblioteca 2.0
La Biblioteca 2.0
 
Wikibib : un nuovo ecosistema per i dati bibliografici
Wikibib : un nuovo ecosistema per i dati bibliograficiWikibib : un nuovo ecosistema per i dati bibliografici
Wikibib : un nuovo ecosistema per i dati bibliografici
 
The Wikipedia Library e #1Lib1Ref
The Wikipedia Library e #1Lib1RefThe Wikipedia Library e #1Lib1Ref
The Wikipedia Library e #1Lib1Ref
 

Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche.

  • 1. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015 Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. Pierfranco Minsenti
  • 2. Indice 1. Condividere i dati catalografici 2. L’Authority control in Wikipedia 3. Verso il VIAF: il dibattito 1961-2001 4. Che cos’è il VIAF 5. Il contributo italiano: SBN e VIAF 6. Wikipedia, OCLC e il VIAF 7. Identificativi nazionali. Wikipedia e SBN 8. L’inserimento manuale in Wikidata: istruzioni 9. Navigare da Wikipedia agli opac
  • 3. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015 Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. 1. Condividere i dati catalografici
  • 4. 4 Collaborazione tra Wikimedia e OCLC: caso concreto di riuso dei dati catalografici prodotti dalle biblioteche 1.Problema:riusodeidaticatalografici OCLC e la collaborazione con Wikipedia grazie al VIAF Dimostra: 1. le potenzialità dell’apertura dei cataloghi delle biblioteche 2. le opportunità, gli spazi di miglioramento e la necessità di adottare una strategia precisa 3. il grosso divario tra l’Italia e il resto del mondo nel campo del controllo di autorità svolto dalle biblioteche
  • 5. 5 Il riuso dei dati catalografici: le sfide che pone al bibliotecario ☞ è una potenzialità che nasce dall’evoluzione del Web verso i Linked Open Data 1.Problema:riusodeidaticatalografici il riuso dei dati catalografici fuori dal catalogo è un problema nuovo per il bibliotecario. Il bibliotecario non è abituato a porselo perché nel contesto cartaceo non esisteva la possibilità di riutilizzare i dati catalografici. Vantaggi ad aprire a collaborazioni e sinergie
  • 6. 6 Vantaggi della collaborazione tra Wikimedia e OCLC: creare una sinergia utile a Wikipedia e alle biblioteche 1. per Wikipedia: l’identificazione delle persone a cui sono dedicate le voci di Wikipedia tramite l’uso degli identificativi ricavati da un archivio internazionale: il VIAF 2. consentire la navigazione da Wikipedia ai cataloghi: vantaggio per Wikipedia e per le biblioteche per offrire opportunità di approfondimento ai lettori 1.Problema:riusodeidaticatalografici OCLC e la collaborazione con Wikipedia tramite il VIAF ☞ nelle voci di Wikipedia si aprono delle “finestre” verso i cataloghi
  • 7. 7 Benefici per le biblioteche Perché alle biblioteche dovrebbe interessare? 1.Problema:riusodeidaticatalografici ☞ Se gli utenti sono sempre più abituati a trascurare il catalogo e iniziare la ricerca su Wikipedia, una soluzione è quella di portarli da Wikipedia al catalogo della biblioteca
  • 8. 8 I record delle biblioteche non sono “aperti”: sono consultabili liberamente grazie agli Opac, ma non esistono soluzioni per favorire il riuso. 1.Problema:riusodeidaticatalografici Dati liberi per consentire il riuso Le condizioni: Quali condizioni minime?
  • 9. 9 1.Problema:riusodeidaticatalografici Dati liberi per consentire il riuso 1. mettere a disposizione i record in dataset completi, scaricabili liberamente e in diversi formati* 2. adottare una licenza che consenta la libera riutilizzazione dei record. Per il VIAF OCLC ha adottato la licenza ODC-By: Open Data Commons Attribution License.** 3. infrastruttura tecnica 4. la definzione di ruoli precisi tramite accordi tra le istituzioni, la creazione di agli organi di governo, la condivisione nella decisione sulle strategie (partecipazione), la raccolta del feedback 4 condizioni minime: * I dataset del VIAF sono messi a disposizione dalla pagina http://viaf.org/viaf/data/ ** Vedi: http://opendatacommons.org/licenses/by/
  • 10. 10 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Non è possibile importare record in Wikipedia dai singoli cataloghi. È necessario un archivio globale di record che svolga la funzione di archivio intermedio che faciliti l’esportazione dai cataloghi e l’importazione in Wikipedia L’infrastruttura tecnica: La pagina da cui scaricare i dataset completi del VIAF aggiornati mensilmente: http://viaf.org/viaf/data/
  • 11. 11 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Non è possibile importare record in Wikipedia dai singoli cataloghi. È necessario un archivio globale di record che svolga la funzione di archivio intermedio che faciliti l’esportazione dai cataloghi e l’importazione in Wikipedia L’infrastruttura tecnica: La licenza dei record del VIAF del tipo ODC-By: Open Data Commons Attribution License alla pagina: http://viaf.org/viaf/data/ Consentito il riuso!
  • 12. 12 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Non è possibile importare record in Wikipedia dai singoli cataloghi. È necessario un archivio globale di record che svolga la funzione di archivio intermedio che faciliti l’esportazione dai cataloghi e l’importazione in Wikipedia L’infrastruttura tecnica:
  • 13. 13 Il riuso dei dati catalografici: il caso VIAF → Wikipedia ☞ il VIAF è un archivio globale di record di autorità. Tra le altre funzioni svolge anche quella di collettore di record per esportarli in altri contesti come Wikipedia. La partecipazione è gratuita. 1.Problema:riusodeidaticatalografici Il VIAF è l’esempio concreto di una soluzione:
  • 14. 14 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Il VIAF è lo strumento che rende possibile una collaborazione tra biblioteche e Wikipedia per il riuso dei dati catalografici e la creazione di hyperlinks reciproci. OCLC riveste un ruolo chiave come gestore del VIAF. È una cooperazione tra 3 tipi di istituzioni: Cataloghi Biblioteche OCLC VIAF Wikimedia Wikidata Wikipedia link dalle versioni di Wikipedia ai cataloghi ☞ Gli hyperlinks assicurano la reciprocità, l’interesse comune a cooperare facilitando la navigazione all’utente.
  • 15. 15 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici VIAF Catalogo Catalogo Catalogo Catalogo Catalogo Virtual International Authority File Flusso dei dati: dai cataloghi al VIAF a Wikidata alle versioni di Wikipedia: (archivio globale dei record di autorità) (database unico che alimenta tutte le voci di Wikipedia) WikimediaBiblioteche OCLC WIKIDATA http://viaf.org
  • 16. 16 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Volontari
  • 17. 17 La sinergia Biblioteche/VIAF/Wikipedia offre un esempio concreto della riutilizzazione dei dati bibliotecari in altri contesti. 1.Problema:riusodeidaticatalografici I problemi Le criticità della situazione italiana Tuttavia per i motivi che analizzeremo, l’Italia è tra le nazioni meno preparate per avvantaggiarsi di questo tipo di soluzioni e sinergie. ☞ questa presentazione farà emergere il divario tra le opportunità offerte a livello internazionale e le scarse possibilità che ha l’Italia di avvalersene
  • 18. 2. L’Authority control in Wikipedia Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 19. Wikipedia e l’authority control L’authority control non è uno strumento fondamentale solo per i cataloghi delle biblioteche ma anche per Wikipedia. 19 2.AuthoritycontrolinWikipediaebiblioteche Nelle biblioteche duplice scopo: rendere possibile la funzione identificativa e collocativa del catalogo. 1. identificare le “entità” con rilevanza bibliografica = quelle che consentono raggruppamenti delle descrizioni per punti d’accesso rilevanti ai fini della ricerca di una risorsa informativa 2. uso di forme controllate per designare i nomi delle entità
  • 20. L’authority control: un concetto recente, una pratica radicata Entità a rilevanza bibliografica: 1. nomi personali, collettivi, geografici 2. titoli uniformi; titoli di collana; 3. soggetti 20 2.AuthoritycontrolinWikipediaebiblioteche
  • 21. Wikipedia e l’authority control Esigenza comune da parte di biblioteche e Wikipedia del controllo sulla forma dei nomi. 3 problemi da risolvere: 1. polisemia es.: Winston Churchill (storico, 1620-1688); Winston Churchill (uomo politico, 1874-1965); 2. sinonimia es.: Ada Prospero; Ada Marchesini Gobetti Prospero 3. controllo delle forme correlate es.: Lewis Carroll / Charles Dodgson es.: Joseph Ratzinger / Papa Benedetto XVI 21 2.AuthoritycontrolinWikipediaebiblioteche
  • 22. Wikipedia e l’authority control Wikipedia condivide con le biblioteche anche il principio di dare priorità al punto di vista dell’utente nel trattamento della selezione della forma principale e dei rinvii dalle forme varianti. Es. la voce su Charles Dodgson / Lewis Carroll è intitolata a Lewis Carroll e ha rinvio da Charles Dodgson: ➡ https://it.wikipedia.org/wiki/Lewis_Carroll ➡ http://it.wikipedia.org/wiki/ Charles_Lutwidge_Dodgson 22 2.AuthoritycontrolinWikipediaebiblioteche
  • 23. Wikipedia e l’authority control Infine Wikipedia condivide con le biblioteche anche l’uso di: 1. strumento per disambiguare gli omonomi: le qualificazioni 2. liste di snodo per consentire la selezione del nome + qualificazione 3. rinvii (redirect) nei casi di forme varianti correlate 23 2.AuthoritycontrolinWikipediaebiblioteche
  • 24. Wikipedia e l’authority control Charles Dodgson / Lewis Carroll Una ricerca per Charles Dodgson porta a una pagina di disambiguazione: https://en.wikipedia.org/wiki/ Charles_Dodgson che contiene una scelta fra 3 possibili voci: ➡ Charles Dodgson (bishop) (c. 1722–1795), Anglican Bishop of Elphin, grandfather of the archdeacon https://en.wikipedia.org/wiki/Charles_Dodgson_(bishop) ➡ Charles Dodgson (archdeacon) (1800–1868), Anglican Archdeacon of Richmond, father of the author https://en.wikipedia.org/wiki/Charles_Dodgson_(archdeacon) ➡ Charles Lutwidge Dodgson (1832–1898), better known by the pseudonym Lewis Carroll, renowned children's and fantasy author https://en.wikipedia.org/wiki/ Lewis_Carroll 24 2.AuthoritycontrolinWikipediaebiblioteche
  • 25. Wikipedia e l’authority control Pagina di disambiguazione per Winston Churchill: https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29 25 Pagina di disambiguazione per Winston Churchill https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29 2.AuthoritycontrolinWikipediaebiblioteche
  • 26. 26 ☞ il VIAF ha reso possibile l’avvio di una sinergia consolidando soluzioni e strumenti Wikipedia e l’authority control era destino che Wikipedia individuasse nei records di autorità prodotti dalle biblioteche un valido ausilio per consolidare il suo lavoro 2.AuthoritycontrolinWikipediaebiblioteche
  • 27. 3. Verso il VIAF: il dibattito 1961-2001 Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 28. Il VIAF è un archivio elettronico internazionale dei records di autorità dei nomi (personali, autori collettivi, geografici, titoli uniformi) e costituisce la soluzione pragmatica a una serie di problemi teorici e pratici che hanno caratterizzato il dibattito sull’authority control per circa 40 anni. Allo stesso tempo crea nuove sfide perché aumenta la complessità dei problemi portando l’authority control su una scala internazionale. 28 ☞ il VIAF è un work in progress Il VIAF 3.VersoilVIAF:ildibattito1961-2001
  • 29. 29 Il dibattito 1961-1998 sulla forma del nome 1. forma con cui l’autore è più frequentemente identificato nelle edizioni delle sue opere OPPURE: 2. forma ricorrente nella critica e nei repertori OPPURE: 3. forma diventuta costante nell’uso generale Conferenza internazionale di Parigi del 1961: la selezione della forma del nome* * Vedi: Statement of principles adopted at the International Conference on Cataloguing Principles, sezione 8. 3.VersoilVIAF:ildibattito1961-2001
  • 30. 30 Il dibattito 1961-1998 sulla forma del nome Conferenza internazionale di Parigi del 1961: le indicazioni sulla selezione della forma del nome portano a un risultato contraddittorio tra 2 opposti obiettivi: la standardizzazione per consentire la cooperazione vs. tradizioni catalografiche nazionali familiari all’utente: gli “usi” sono diversi!* 3.VersoilVIAF:ildibattito1961-2001 Questa contraddizione non emerge subito in maniera consapevole ma percorre tutto il dibattito dei 40 anni successivi. * Vedi: M. Guerrini, L. Sardo, Authority control, Roma, AIB, 2003.
  • 31. 31 Il dibattito 1961-1998 sulla forma del nome Alla base del lavoro dell’IFLA nei decenni successivi, in particolare a partire dall’iniziaitva UBC: Universal Bibliographic Control (1974) sta l’idea che la cooperazione si ottenga tramite la standardizzazione e che questa richieda l’adozione generale di una unica forma universale del nome da parte di tutte le diverse agenzie bibliografiche nazionali. La forma unica universale del nome 3.VersoilVIAF:ildibattito1961-2001
  • 32. 32 Il dibattito 1961-1998 sulla forma del nome 1. uso di lingue diverse (incide per es. sui nomi geografici; sui titoli uniformi) 2. uso di alfabeti diversi 3. uso di traslitterazioni da alfabeti non latini fatte con criteri diversi (per es. in Francia il nome dell’autore della Sinfonia Patetica viene trascritto come Čajkovskij, Petr Ilʹič, mentre negli Stati Uniti viene trascritto come: Tchaikovsky, Peter Ilich) 4. uso di forme vernacolari (es. Pétrarque; Petrarch) 5. differenze concettuali nella definzione dell’entità a cui si riferisce il “nome”: per es. distinzione tra identità bibliografica e identità personale (vedi il caso dello scrittore irlandese John Banville pubblica romanzi con il suo nome reale e gialli con lo pseudonimo di Benjamin Black) 6. altre differenze catalografiche: per es. uso tedesco delle iniziali puntate La standardizzazione nei nomi si scontra con differenze rilevanti nelle tradizioni catalografiche nazionali: 3.VersoilVIAF:ildibattito1961-2001
  • 33. 33 Il dibattito 1961-1998 sulla forma del nome Il conflitto tra forma unica universale vs. tradizioni locali ha dominato il dibattito interno all’IFLA. 1998: anno di svolta, Conferenza IFLA di Amsterdam: Il gruppo di lavoro IFLA sul Minimal Level Authority Records conclude il proprio lavoro sostenendo che è irrealistico aspettarsi che tutte le agenzie bibliografiche nazionali adottino la stessa forma. ☞ è necessario trovare una soluzione che metta assieme l’esigenza di preservare le abitudini nazionali e i vantaggi della cooperazione internazionale. 3.VersoilVIAF:ildibattito1961-2001
  • 34. 34 La tecnologia offre una soluzione 2001: GARR (Guidelines for authority and reference records): la soluzione consiste nel mantenere la pluralità delle forme nazionali e ricorrere alla tecnologia per creare collegamenti tra le diverse forme. ☞ collegamenti, non fusione; molteplicità, non forma unica ☞ preservare le differenze linguistico- culturali facendole convivere con la cooperazione/scambio e il principio della uniformità di accesso 3.VersoilVIAF:ildibattito1961-2001
  • 35. 35 La tecnologia offre una soluzione collegamenti tra forme diverse del nome riferite alla stessa entità: il collegamento sostituisce l’idea della forma “unica”. Le diverse forme sono considerate come varianti correlate di pari importanza. ☞ nel VIAF questa soluzione dà vita ai cluster: grappoli di records 3.VersoilVIAF:ildibattito1961-2001
  • 36. 4. Che cos’è il VIAF Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 37. Che cos’è il VIAF Il VIAF, Virtual International Authority File*, è un archivio elettronico multinazionale dei record di autorità, nato nel 2003 grazie a un accordo tra la Library of Congress, la Deutsche Nationalbibliothek e OCLC. Nel 2007 si aggiunse la Bibliothèque Nationale de France. L'interfaccia pubblica di ricerca è stata aperta nel 2007, dalla URL: http://orlabs.oclc.org/viaf/ e dall'inizio del 2009 dalla URL: http:// viaf.org/.** 37 ** Queste informazioni si ricavano da una consultazione del servizio WayBackMachine di Internet Archive. Nella bibliografia sul VIAF non abbiamo trovato informazioni relative alla data di apertura al pubblico dell'interfaccia utente del VIAF. * Per informazioni generali si veda: http://www.oclc.org/viaf.en.html 4.IlVIAF
  • 38. Che cos’è il VIAF Nell'aprile 2012 le quattro istituzioni bibliotecarie principali decisero di modificare l'organizzazione del servizio trasferendone la titolarità a OCLC.* Attualmente la governance del progetto spetta al VIAF Council i cui membri sono designati dalle agenzie catalografiche che forniscono record al VIAF. Dal maggio 2012 dataset completi vengono messi a disposizione con aggiornamento mensile dalla pagina http://viaf.org/viaf/data con licenza ODC-By** 38 ** Open Data Commons Attribution License. Vedi: http://opendatacommons.org/licenses/by/ * Vedi l'annuncio di OCLC del 4 aprile 2012: «Virtual International Authority File service transitions to OCLC; contributing institutions continue to shape direction through VIAF Council»: http://www.oclc.org/news/releases/2012/201224.en.html. 4.IlVIAF
  • 39. Che cos’è il VIAF Il VIAF*, Virtual International Authority File, è un archivio elettronico multinazionale dei record di autorità, nato nel 2003 e gestito da OCLC e che attualmente ospita record di autori personali e collettivi, titoli uniformi, nomi geografici forniti da agenzie catalografiche di ogni parte del mondo, tra cui l’Italia. Complessivamente al settembre 2013 il VIAF vede l'adesione di 34 agenzie catalografiche che rappresentano 28 paesi e hanno fornito un totale di circa 33 milioni di record di autorità. Il VIAF implementa Unicode e attualmente visualizza intestazioni che possono essere in un qualsiasi set di caratteri appartenenti a 5 diversi alfabeti usati dalle agenzie catalografiche che collaborano all'iniziativa: latino; cirillico; arabo; israeliano; giapponese. 39 * VIAF: http://viaf.org/ 4.IlVIAF VIAF: http://viaf.org/
  • 40. Che cos’è il VIAF L’infrastruttura tecnica è gestita da OCLC. Attualmente ospita record di autori personali e collettivi, titoli uniformi, nomi geografici forniti da agenzie catalografiche di ogni parte del mondo, tra cui l’Italia. Complessivamente al febbraio 2015 il VIAF vede l'adesione di 39 agenzie catalografiche che rappresentano 27 paesi e hanno fornito un totale di circa 45 milioni di record di autorità, di cui 35 relativi a nomi di autori personali. 40 4.IlVIAF
  • 41. Che cos’è il VIAF Le informazioni più aggiornate sul VIAF si trovano sul blog personale di Thomas Hickey, Chief Scientist di OCLC e coordinatore dello staff tecnico che gestisce il VIAF.* Altre informazioni si trovano su slides e report messi a disposizione dalla pagina: VIAF news.** 41 ☞ Il VIAF è un work-in-progress in evoluzione continua * Thomas Hickey, Outgoing. Library metadata techniques and trends by Thom Hickey: http:// outgoing.typepad.com/outgoing/ ** VIAF news: http://www.oclc.org/viaf/news.en.html 4.IlVIAF
  • 42. Che cos’è il VIAF Definizione per i non bibliotecari: 42 ☞ il VIAF è una specie di anagrafe mondiale di tutti coloro a cui viene riconosciuta una responsabilità in opere dell’intelletto o in creazioni artistiche: ci sono innanzitutto scrittori, come Alessandro Manzoni: http://viaf.org/viaf/14356/#Manzoni,_Alessandro,_1785-1873 Ma nel VIAF, come anche nei cataloghi delle biblioteche, non ci sono solo scrittori. Ci sono anche: artisti, come il pittore Giorgione: http://viaf.org/viaf/39385864/#Giorgione,_1477-1511 registi, come Woody Allen: http://viaf.org/viaf/59077912/#Allen,_Woody,_1935-.... attori, come John Wayne: http://viaf.org/viaf/37103799/#Wayne,_John,_1907-1979 musicisti, come Giuseppe Verdi: http://viaf.org/viaf/22329110/#Verdi,_Giuseppe,_1813-1901 ballerini e coreografi, come Rudolf Nureyev: http://viaf.org/viaf/148483/#Nureyev,_Rudolf,_1938-1993 cantanti, come Lady Gaga: http://viaf.org/viaf/49555103/#Lady_Gaga uomini di stato, come: Napoleone Bonaparte: http://viaf.org/viaf/106964661/#Napol %C3%A9on_I,_Emperor_of_the_French,_1769-1821 traduttori famosi di opere letterarie, come Ettore Capriolo: http://viaf.org/viaf/283936245/#Capriolo,_Ettore 4.IlVIAF
  • 43. Che cos’è il VIAF 43 ☞ inoltre è una specie di anagrafe mondiale anche per: nomi di autori collettivi (enti, ecc.), come la Wikimedia Foundation: http://viaf.org/viaf/ 137022054/#Wikimedia_Foundation nomi geografici (solo di autorità politico territoriali), come la Regione Toscana: http://viaf.org/ viaf/130807311/#Tuscany_(Italy) titoli di opere, come Hamlet: http://viaf.org/viaf/176993890/ #Shakespeare,_William,_1564-1616._|_Hamlet 4.IlVIAF
  • 44. Che cos’è il VIAF Il VIAF implementa Unicode e attualmente visualizza intestazioni che possono essere in un qualsiasi set di caratteri appartenenti ai diversi alfabeti usati dalle agenzie catalografiche che collaborano all'iniziativa: come latino; cirillico; arabo; israeliano; giapponese. Per es.: il VIAF è l’unico strumento che può rispondere alla domanda: quali forme del nome assume l’autore del Giardino dei ciliegi nei vari cataloghi mondiali? Quale è la forma preferita nella lingua e nell’alfabeto del catalogo nazionale del suo paese di origine? 44 4.IlVIAF
  • 45. Che cos’è il VIAF Il VIAF implementa Unicode e attualmente visualizza intestazioni che possono essere in un qualsiasi set di caratteri appartenenti a 5 diversi alfabeti usati dalle agenzie catalografiche che collaborano all'iniziativa: latino; cirillico; arabo; israeliano; giapponese. Per es.: il VIAF è l’unico strumento che può rispondere alla domanda: quali forme del nome assume l’autore del Giardino dei ciliegi nei vari cataloghi mondiali? 45 Il VIAF come strumento di consultazione: le diverse forme del nome dell’autore del Giardino dei ciliegi nei vari cataloghi mondiali e in diverse traslitterazioni e alfabeti nel cluster 95216565 Il record del commediografo Anton Pavlovič Čehov in cirillico Il record del commediografo Anton Pavlovič Čehov dal catalogo SBN http://viaf.org/viaf/search?query=local.personalNames+all+%22cehov %22&sortKeys=holdingscount&recordSchema=BriefVIAF 4.IlVIAF
  • 46. I cluster Il VIAF raccoglie insieme le diverse forme dei nomi in un “grappolo” di nomi che si riferiscono alla stessa entità: il “grappolo” è chiamato cluster 46 http://viaf.org/viaf/39382430/#Petrarca,_Francesco,_1304-1374 cluster del record di Francesco Petrarca rappresentato con un poligono stellato 4.IlVIAF
  • 47. Come sono realizzati i cluster: due fasi Il procedimento per la clusterizzazione è basato su 2 fasi*: 1. i record originali forniti dalle biblioteche vengono “arricchiti” con informazioni ricavate dai record bibliografici che i contributori devono fornire insieme ai record di autorità: vengono così associati al record autore informazioni aggiuntive come titoli associati all'autore, il nome di eventuali coautori inserite in tag appositi del blocco 9XX. Il record viene definito enhanced 2. il confronto (matching) tra i record enhanced 47 * Informazioni ricavate da: Richard Bennett, et al. «VIAF (Virtual International Authority File) : Linking Die Deutsche Bibliothek and Library of Congress Name Authority Files». Relazione presentata alla Conferenza IFLA 2006, Seoul, Korea, 20–24 agosto 2006. http:// citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.150.5328&rep=rep1&type=pdf. Giulia Manzotti. «Analisi e riflessioni sul VIAF, Virtual International Authority File». JLIS.it 1.2 (2010): pp. 357–381. http://leo.cilea.it/index.php/jlis/article/view/4520. 4.IlVIAF
  • 48. Come sono realizzati i cluster: l’algoritmo per il matching I cluster sono stati realizzati tramite procedure automatiche di confronto tra record (matching) basate su un algoritmo che confronta: 1. il nome: per stabilire in una prima fase di confronto la “compatibilità” 2. altre informazioni direttamente collegate all'autore, come le specificazioni cronologiche (date di nascita e morte o solo data di nascita) 3. altri dati ricavati dai record bibliografici associati alle notizie di autorità (titoli associati all'autore, il nome di eventuali coautori ecc.) 48 4.IlVIAF
  • 49. Come sono realizzati i cluster del VIAF: esiti del matching L'esito della procedura di matching può essere duplice: 1. in caso di esito positivo il record fornito dall'agenzia catalografica viene aggregato a un cluster già esistente formato da uno o più record = cluster multirecord 2. in caso negativo, il record viene importato nel VIAF ma crea un nuovo cluster che contiene un unico record = cluster monorecord 49 4.IlVIAF
  • 50. Come sono realizzati i cluster del VIAF: esiti del matching 50 ☞ Nel VIAF ci sono parecchi doppioni (cioè cluster monorecord, effetto di un matching negativo) ☞ il casi di matching negativo possono riguardare: 1. nomi forniti solo da una certa agenzia: il loro isolamento è corretto 2. nomi che avrebbero dovuto essere inclusi nei cluster già formati 4.IlVIAF
  • 51. Come sono realizzati i cluster del VIAF: esiti del matching Le 3 variabili che contano: 1. la raffinatezza dell’algoritmo di matching 2. la qualità del record di autorità: dati che contiene e correttezza 3. i record bibliografici forniti 51 4.IlVIAF
  • 52. Gli identificativi dei cluster Come in un’anagrafe si usa il codice fiscale come identificativo univoco delle persone fisiche, così nel VIAF ogni entità rappresentata da un cluster ha un proprio identificativo numerico. Per es.: Francesco Petrarca: 99258155 Lady Gaga: 49555103 52 4.IlVIAF
  • 53. Uso degli identificativi dei VIAF cluster nei cataloghi di biblioteca 53 Diverse agenzie catalografiche che partecipano al VIAF, inseriscono nei loro authority files, per ogni record che hanno fornito, anche l'identificativo del cluster VIAF con cui è avvenuto il match e il relativo link che punta al cluster VIAF. Per es. Library of Congress, Bibliothèque Nationale de France, Biblioteca Nazionale Svedese Biblioteca della Dieta Nazionale del Giappone ☞ problema dell’authority file di SBN: non cita mai nei record il numero identificativo del record VIAF (i record di autorità SBN contengono un numero ISADN, inutile). SBN non è allineato alle pratiche internazionali che stanno emergendo in relazione al VIAF. 4.IlVIAF
  • 54. 5. Il contributo italiano: SBN e VIAF Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 55. La partecipazione dell’Italia al VIAF Avviene tramite l’ICCU che fornisce a OCLC per il VIAF i record di autorità provenienti dal catalogo SBN. 2009: inizio della partecipazione italiana al VIAF*. 55 5.SBNeilVIAF * Vedi le informazioni fornite nelle due pagine web dell’Istituto Centrale per il Catalogo Unico: «Attività internazionali: Virtual International Authority File (VIAF)» http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/internaz/pagina_367.html; Attività nazionali: Authority Control», http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/naz/pagina_335.html .
  • 56. La situazione dei record forniti dall’Italia al VIAF Nel caso dei record di autori personali forniti dall’Italia e provenienti dal catalogo SBN ci sono problemi di: 1. quantità dei record forniti 2. matching con i record già presenti nel VIAF A partire da fine 2013 la situazione è migliorata, tuttavia il report annuale 2014 sul VIAF realizzato da OCLC dimostra che la situazione dei record italiani nel VIAF è molto indietro rispetto a quella di altri paesi europei. 56 5.SBNeilVIAF
  • 57. La situazione dei record da SBN dal 2009 a ottobre 2013: 57 ** Vedi i dati quantitativi pubblicati alla pagina: http://www.iccu.sbn.it/opencms/opencms/it/main/bd/index.html Secondo i dati aggiornati al gennaio 2015, i record di autorità autori sono: 3.911.525 autori (personali e collettivi). Quantità e percentuali di matching dei record italiani nel VIAF* 45.189 record forniti costituivano solo il 1,22% del totale dei record di autorità presenti nel catalogo SBN al giugno 2013: 3.714.476 ** ☞ I record italiani nel VIAF hanno creato cluster “doppioni” nell’87% dei casi = 39.215 record I problemi del matching nel caso dei record forniti dall’Italia * Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato al luglio 2013: OCLC. «2013 Annual Report to VIAF Council». 2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx. 5.SBNeilVIAF
  • 58. La situazione del VIAF: confronto tra record SBN e da altri cataloghi a primavera 2013: 58 VIAF: totale 33.667.856 di record (al settembre 2013) Totale record di autorità SBN: 3.714.476 (al luglio 2013) VIAF Record da SBN che hanno avuto un match con almeno 1 altro record VIAF: 5.993 (= 13% dei record forniti) Record da SBN forniti al VIAF: 45.208 (= 1,2% del totale dei record di autorità SBN) 39.215 record sono cluster “isolati” Record da SBN nel VIAF 45.208 tra 2009-2013 (= solo 1,2% dei record autori in SBN) Germania ca. 10 milioni di record USA, Canada, UK ca. 9 milioni di record Portogallo Francia Spagna 5.SBNeilVIAF La situazione dei record forniti dall’Italia al VIAF
  • 59. La situazione dei record forniti dall’Italia al VIAF La quantità limitata di record forniti inizialmente al VIAF dall’ICCU si spiega con la scelta di fornire solo i record con il livello massimo di autorità: AUF (livello 97) I livelli di catalogazione dei record autori in SBN sono ordinati secondo una progressione, da quello inferiore a quello più elevato: 04 REC = 05 MIN = 6–51 MED = 52–71 MAX = 72–90 SUP = 91–95 AUF = 97 Appartengono al livello AUF innanzitutto i record che sono stati sottoposti a specifiche procedure retrospettive di bonifica e arricchimento condotte a partire dagli anni 2001–2002 grazie al progetto Valorizzazione dell’Indice SBN.* 59 * Vedi: Cristina Magliano, «Direttive e metodologia per la creazione dell’authority file di SBN». In: Authority Control : definizioni ed esperienze internazionali : Atti del convegno internazionale, Firenze, 10–12 Febbraio 2003, a cura di Mauro Guerrini e Barbara B. Tillett. Firenze: Firenze University press, 2003, pp. 61–69. Il livello SUP in origine era riservato alle due Biblioteche Nazionali Centrali di Firenze e di Roma, ma da tempo anche in altri Poli vengono create notizie autori con quel livello. Il livello AUF è riservato ai componenti di un gruppo di lavoro attivo presso 14 istituzioni bibliotecarie della rete SBN. 5.SBNeilVIAF
  • 60. La situazione dei record forniti dall’Italia al VIAF Al VIAF non erano stati forniti i record con livello di autorità inferiore a AUF. Mancavano, e mancano tutt’ora, per es. i seguenti autori: - Cesare Beccaria (in SBN livello MAX CFIV016390) - Marco Polo (in SBN livello MED CFIV028383) - Cecco Angiolieri (in SBN livello MIN CFIV078939) I record di questi autori erano presenti nel VIAF, ma mancava il record italiano, tutt’ora assente (al febbraio 2015). Inoltre fino alla fine del 2013 mancavano i record autori di livello SUP, come per es.: - Paolo Giordano (in SBN livello SUP UBOV259046) - Lorenzo Da Ponte (in SBN livello SUP UBOV259046) - Francesco Guicciardini (in SBN livello SUP CFIV004242) - Wu Ming (in SBN livello SUP TO0V385956) 60 5.SBNeilVIAF
  • 61. Diverso esito del matching in base alla fonte di provenienza dei record 61 Tabella 2013 ordinata in ordine decrescente per percentuale di matching: i record da SBN hanno la più bassa percentuale di matching (solo 13%). Vedi il report: http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx. 5.SBNeilVIAF
  • 62. Esempio di cluster doppioni nel 2013: i cluster relativi a Dante Alighieri 62 http://viaf.org/viaf/59080924/#Alighieri,_Dante http://viaf.org/viaf/97105654/ #Dante_Alighieri,_1265-1321 VIAF cluster: 97105654VIAF cluster: 59080924 1 sola bandiera: cluster monorecord poligono stellare: cluster multirecord come si presentava la situazione dei cluster relativi a Dante Alighieri nel 2013 5.SBNeilVIAF
  • 63. Il miglioramento dopo la fine del 2013: 63 * Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato ad agosto 2014: OCLC. «2014 Annual Report to VIAF Council». 2014. http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf Quantità e percentuali di matching dei record italiani nel VIAF nel 2014* ☞ miglioramenti a livello di: 2013 2014 Incremento Totale'authority'record'nel'VIAF 33.667.856 44.885.233 11.217.377 Fornitura'di'records'da'SBN 45.208 169.028 123.820 %'di'clusterizzazione'dei'record'da'SBN 13% 39% 1. quantità: 169.028 record forniti sono il 4,3% del totale dei record autori SBN (3.911.525 autori personali e collettivi, al gennaio 2015). Sono stati forniti anche i record di livello SUP. 2. percentuale di matching (riduzione dei record isolati): ca. 66.000 match con un cluster multirecord I problemi del matching nel caso dei record forniti dall’Italia 5.SBNeilVIAF
  • 64. Diverso esito del matching in base alla fonte di provenienza dei record 64 Tabella 2014 ordinata in ordine decrescente per percentuale di matching: rispetto al 2013 i record da SBN hanno migliorato la percentuale di matching (dal 13% al 39%). Vedi il report: http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf 5.SBNeilVIAF
  • 65. 65 http://viaf.org/viaf/97105654/#Dante_Alighieri,_1265-1321 record proveniente da SBN è incluso nel cluster VIAF 97105654 e non forma più un cluster isolato (eliminato VIAF 59080924) Il cluster di Dante Alighieri: da fine 2013 è incluso in VIAF 97105654 5.SBNeilVIAF
  • 66. Esempi:* 1. uomini politici: per es.: Barack Obama: 305358548 (invece di 52010985); ma anche Umberto <re d'Italia ; 1.>: 90291016 (invece di 262250334). 2. artisti: per es.: Paolo Uccello: 305358201 (invece di 39395712); 3. registi: per es.: Alfred Hitchcock: 305357650 (invece di 49226917); 4. attori, sia italiani che stranieri, per es.: Monica Bellucci, 90383682 (invece di 106993456); Brad Pitt 305358254 (invece di 12462881); Sergio Castellitto: 90302845 (invece di 37125646); Humphrey Bogart: 305358227 (invece di 68937671); 5. cantanti e altre persone di spettacolo: per es.: Mina: 268502285 (invece di 62360130); Jannacci: 90146253 (invece di 1128716); 66 Casi di record da SBN che creano doppioni nel VIAF * Ci sono poi casi di nomi che solo SBN ha fornito al VIAF e quindi è corretto che siano isolati in cluster monorecord. Per es. Bianca Berlinguer: VIAF 90107330. 5.SBNeilVIAF
  • 67. 67 I dati comparativi dimostrano che la situazione italiana deve migliorare per avvicinarsi quella di altri paesi. Come migliorare 5.SBNeilVIAF è auspicabile: 1. una maggiore collaborazione tra chi gestisce SBN, l’ICCU e OCLC per risolvere i problemi della situazione italiana. 2. un piano strategico volto a una bonifica dell'authority file di SBN sfruttando le risorse disponibili difficile individuare attualmente una strategia fatta di priorità e di organizzazione del lavoro tramite il coordinamento delle risorse presenti nei Poli considerata la presenza nell’authority file SBN di casi di record di livello AUF come l'attore di spaghetti western John Ireland http:// id.sbn.it/af/IT%5CICCU%5CUBOV%5C015247 che si accompagna a casi di record molto più importanti, come Cesare Beccaria (liv. MAX) o Marco Polo (liv. MED) che sono tutt’ora in attesa di essere sottoposti a bonifica e portati a livello SUP o AUF, per poterli poi fornire al VIAF e renderli visibili nell’opac SBN, al livello della ricerca Voci di autorità.
  • 68. 6. Wikipedia, OCLC e il VIAF Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 69. 69 Il progetto GLAM lanciato dalla Wikimedia Foundation La collaborazione tra Wikipedia e le biblioteche inizia con la GLAM-Wiki Initiative (Galleries, Libraries, Archives, Museums with Wikipedia), un progetto nato nel 2010 come collaborazione tra la Wikimedia Foundation e istituzioni del settore cultural heritage*. * Wikipedia:GLAM/About <http://en.wikipedia.org/wiki/Wikipedia:GLAM/About> 6.Wikipedia,OCLCeilVIAF
  • 70. 70 Il progetto GLAM lanciato dalla Wikimedia Foundation Obiettivo della GLAM-Wiki Initiative: “aiutare le istituzioni del settore cultural heritage a promuovere le loro collezioni su Wikipedia attraverso progetti realizzati in collaborazione con esperti redattori wikipediani” 6.Wikipedia,OCLCeilVIAF
  • 71. 71 Il programma “Wikipedian in residence” Lo strumento concreto per realizzare la collaborazione consiste nel nominare un redattore esperto di Wikipedia che lavora con e dentro l’istituzione partner: il “Wikipedian in residence”.* * Sul programma “Wikipedian in residence” vedi: https://outreach.wikimedia.org/wiki/Wikipedian_in_Residence 6.Wikipedia,OCLCeilVIAF
  • 72. 72 Maggio 2012: due redattori di Wikipedia vengono ingaggiati con il ruolo di "Wikipedian in Residence" per gestire progetti legati alle biblioteche: * Vedi: http://www.oclc.org/research/news/2012/05-22.html Il programma “Wikipedian in residence” Max Klein negli Stati Uniti presso OCLC* Andrew Gray in Gran Bretagna presso la British Library 6.Wikipedia,OCLCeilVIAF Oggi nessuno dei due lavora più come Wikipedian in residence.
  • 73. 73 Il risultato pratico della collaborazione tra OCLC e Wikimedia riguarda il VIAF, Virtual International Authority File, e in particolare: 1. inizialmente l’inserimento di link da ogni cluster VIAF a una corrispondente voce nella Wikipedia inglese 2. successivamente Wikipedia è stata promossa al ruolo di contributore di record, alla pari di un’agenzia bibliografica 3. infine le voci biografiche di Wikipedia sono state arricchite con i link al VIAF OCLC e la collaborazione con Wikipedia per il VIAF 6.Wikipedia,OCLCeilVIAF
  • 74. Il rapporto tra il VIAF e Wikipedia inizia nel 2012 quando OCLC inserisce nel VIAF, nella sezione About di ogni record cluster, un link che punta alla relativa voce di Wikipedia con la funzione di facilitare agli utenti l'accesso diretto a informazioni più complete sull'autore. 74 Inserimento di link esterni dai cluster VIAF a Wikipedia Sezione About del record 6.Wikipedia,OCLCeilVIAF
  • 75. A seguito della adesione di OCLC alla GLAM Initiative, nel corso del primo semestre del 2012 OCLC decise di promuovere Wikipedia al livello di una vera e propria source di record equiparandola agli authority files delle agenzie catalografiche.* 75 * Attualmente solo 4 fonti non create da biblioteche alimentano il VIAF come source alla pari dei cataloghi delle biblioteche: la Union List of Artist Names del Getty Museum, la versione inglese di Wikipedia, il database ISNI, e la biblioteca digitale Perseus. Estate 2012: la svolta. Wikipedia da repertorio esterno a fonte del VIAF ☞ è una evoluzione di grande importanza: a Wikipedia viene riconosciuta la stessa autorevolezza di un catalogo di biblioteca 6.Wikipedia,OCLCeilVIAF
  • 76. Il motivo per cui Wikipedia è stata elevata lo status di source è spiegato nel report annuale 2013 del VIAF:* poter sfruttare i dati identificativi presenti in Wikipedia (come quelli biografici, i titoli di opere citate nella voce dell’autore ecc.) in modo da poter migliorare la capacità aggregativa dei record VIAF cluster che tra le altre cose dipende anche dal numero di dati inseriti nel cluster, dato che la loro quantità aumenta le possibilità di ottenere un match con nuovi record in arrivo. 76 * OCLC. «2013 Annual Report to VIAF Council». 2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF- Annual-Report-to-VIAF-Council.docx. Perché Wikipedia viene promossa a source del VIAF 6.Wikipedia,OCLCeilVIAF
  • 77. L’algoritmo di matching con cui è realizzato il clustering è facilitato dalla presenza di un maggior numero di record: «The efficiency of VIAF clusters is improved with the number of contributing files because of the nature of this matching. There can be situations where A matches B and B matches C, but C doesn’t match A, yet A,B,C are a cluster».* 77 * Vedi Maximilian Klein e Alex Kyrios, "VIAFbot and the Integration of Library Data on Wikipedia2, in: code{4}lib, n. 22, 2013, http:// journal.code4lib.org/articles/8964 Perché Wikipedia viene promossa a source del VIAF 6.Wikipedia,OCLCeilVIAF A B C all’interno del cluster non tutti i record hanno relazioni di matching tra di loro, ma questo non impedisce il clustering se non avessi avuto il record B che fa da anello intermedio, A e C non sarebbero nello stesso cluster
  • 78. 78 Per poter trattare Wikipedia come una “fonte” di record, OCLC ricava dai dati presenti in ogni voce della versione inglese di Wikipedia dedicate ad autori personali un record (per ogni voce), strutturato in formato MARC. Questo “falso” record viene sottoposto alle procedure di matching già usate per gli altri record e che determinano l’inserimento del record in un certo cluster VIAF dove è identificato dalla sigla WKP. L’importazione dei “record” da Wikipedia nel VIAF 6.Wikipedia,OCLCeilVIAF
  • 79. 79 Dalla voce di Wikipedia al record importato nel VIAF: Creazione di record da Wikipedia e importazione nel VIAF Record WKP: Luigi_Pirandello http://viaf.org/processed/WKP|Luigi_Pirandellohttp://en.wikipedia.org/wiki/Luigi_Pirandello Box dei dati biografici Titoli delle opere La voce di Wikipedia: Luigi_Pirandello 6.Wikipedia,OCLCeilVIAF
  • 80. 80 Il record WKP ricavato dalla voce su Luigi Pirandello nella versione inglese di Wikipedia viene importato nel cluster VIAF insieme ai record forniti dai cataloghi delle biblioteche http://viaf.org/processed/WKP|Luigi_Pirandello Il record ricavato da Wikipedia viene importato nei cluster del VIAF http://viaf.org/viaf/64010465/#Pirandello,_Luigi,_1867-1936 Record cluster di Luigi Pirandello Record WKP da Wikipedia è compreso nel cluster 6.Wikipedia,OCLCeilVIAF
  • 81. 1.135.025 record importati nel VIAF dalle voci della Wikipedia in lingua inglese. (ad agosto 2014; al luglio 2013 erano 1.075.291)* 81 Qualche dato numerico sui record importati nel VIAF * Totale voci di Wikipedia in lingua inglese: 4.728.038 a fine febbraio 2015. 6.Wikipedia,OCLCeilVIAF
  • 82. Nell’estate 2012 OCLC decide di rendere reciproci i link VIAF / Wikipedia: 82 Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot da: VIAF → Wikipedia EN (solo link) a: VIAF (identificativi dei cluster) Wikipedia EN (voci di W) → ← VIAFWikipedia EN (record) → a: 6.Wikipedia,OCLCeilVIAF
  • 83. 83 L’importazione dei “record” da Wikipedia nel VIAF Nelle voci di Wikipedia in lingua inglese viene inserito l’identificativo dello specifico cluster VIAF in cui è già stato importato anche il “falso” record WKP. Questo lavoro viene eseguito tramite una procedura automatica detta VIAFbot. ** VIAFbot Edits 250,000 Wikipedia Articles to Reciprocate All Links from VIAF into Wikipedia (7 dicembre 2012), http://www.oclc.org/research/ news/2012/12-07a.html Gli identificativi VIAF vengono inseriti in un template già esistente: {{authority control}}.* Nel 2012 il template {{authority control}} risultava già largamente usato dalla versione in lingua tedesca (in 220.000 voci) ma poco usato dalla versione in lingua inglese (in 4.000 voci). Fino a quel momento gli identificativi erano stati aggiunti “manualmente”. La nuova proposta intende invece usare una procedura automatica: il VIAFbot. La procedura è stata conclusa nel novembre 2012 e ha dato come risultato l’importazione di 250.000 identificativi di cluster VIAF all’interno delle relative voci della Wikipedia in lingua inglese.** * Wikipedia:Authority control: https://en.wikipedia.org/wiki/Wikipedia:Authority_control 6.Wikipedia,OCLCeilVIAF
  • 84. 84 Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot * La proposta: Authority control integration è ora archiviata a: http://en.wikipedia.org/w/index.php? title=Wikipedia:Village_pump_(proposals)&oldid=499166049#Authority_Control_Integration Dopo aver raccolto i primi pareri sulla base di una bozza*, crea una pagina specifica che contiene una stesura più definita della proposta chiamata: “Authority control integration proposal” che sottopone a votazione. I pareri espressi su quella pagina non sono tutti favorevoli, ma prevalgono i pareri positivi.** ☞ In realtà OCLC “NON” decide nulla in maniera autonoma: si tratta di una proposta che Max Klein rivolge alla Community di Wikipedia pubblicandola nella apposita sezione per la discussione di nuove proposte: Village pump * La proposta viene approvata ma da allora la discussione non si è fermata perché i redattori di Wikipedia si confrontano su vari problemi. Vedi la pagina: Wikipedia talk:Authority control: https://en.wikipedia.org/wiki/Wikipedia_talk:Authority_control ** Wikipedia:Authority control integration proposal/RFC: http://en.wikipedia.org/wiki/Wikipedia:Authority_control_integration_proposal/RFC 6.Wikipedia,OCLCeilVIAF
  • 85. Il progetto di importazione degli identificativi dei record VIAF si proponeva di: 85 Obiettivi dell’integrazione dell’authority control in Wikipedia 1. funzione identificativa: attribuire alle voci biografiche un identificativo autorevole che certificasse l’identificazione del soggetto della voce 2. facilitare il lavoro di creazione e manutenzione delle voci di Wikipedia collegando a un repertorio che contiene tante forme alternative dello stesso nome 3. creare link dalle voci di Wikipedia al VIAF: nel VIAF si possono trovare informazioni non contenute nell’enciclopedia, in particolare le forme autorizzate dei nomi, in diverse lingue e in diversi alfabeti, usate nei cataloghi di biblioteca di varie parti del mondo 4. utilizzare gli identificativi per creare servizi di redirect precisi, perché basati su identificativi, verso le voci di Wikipedia o verso altri servizi, come nel caso del servizio tedesco Wikipedia Personensuche: http://tools.wmflabs.org/persondata/index.php * 3. creare le premesse per costruire servizi di collegamento ai cataloghi delle biblioteche * Esempio di utilizzo del servizio di redirect Wikipedia Personensuche: utilizzando l’identificativo del record di autorità dell’authority file tedesco, è possibile creare una URL con una sintassi standard che porta a una pagina di snodo. Esempio con Galileo Galilei: authority record GND 118537229 http://tools.wmflabs.org/persondata/p/gnd/118537229 6.Wikipedia,OCLCeilVIAF
  • 86. 86 Il posizionamento dell’authority control al fondo della voce 6.Wikipedia,OCLCeilVIAF i codici identificativi dei record di autorità funzionano anche da link esterni
  • 87. A fine 2012 gli stessi dati sono stati importati anche in Wikidata* il database che contiene tutti i dati che sono condivisi dalle versioni di Wikipedia nelle diverse lingue. Nei record di Wikidata gli identificativi dei cluster VIAF sono diventati una specifica “proprietà”, identificata dal codice: P214** Al 26 febbraio 2015 il numero totale di identificativi dei record VIAF importati in Wikidata è pari a: 506.201.*** 87 L’importazione in Wikidata ** Vedi Wikidata: https://www.wikidata.org/wiki/Property:P214?uselang=en-gb *** Il dato si ricava utilizzando il Wikidata Query editor a: http://wdq.wmflabs.org/wdq/ l'apposita interfaccia di interrogazione del database Wikidata, e interrogandolo usando come parametro la presenza di P214. Produce una lista di tutti gli items di Wikidata che contengono la property P214: http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[214] * Wikidata: http://www.wikidata.org/wiki/Wikidata:Main_Page 6.Wikipedia,OCLCeilVIAF
  • 88. Nella Wikipedia inglese è stata creata una pagina per la segnalazione di errori: Wikipedia: VIAF / errors: https://en.wikipedia.org/wiki/Wikipedia:VIAF/errors 88 Il lavoro di correzione manuale nella Wikipedia in lingua inglese Al momento contiene le seguenti tipologie di errori: 1. la voce di Wikipedia si riferisce a una persona diversa che non coincide con la parsona a cui fa riferimento l’identificativo VIAF 2. Due o più identificativi VIAF nella stessa voce 3. il VIAF ha messo insieme diverse identità in un unico cluster 4. Nel VIAF c’è più di un cluster per la stessa identità 5. Il link che all’interno del VIAF punta a un voce biografica di Wikipedia non è più aggiornato 6. Voci di Wikipedia dedicate a più di una persona, contengono l’identificativo VIAF solo per una di queste persone 7. Altri errori 6.Wikipedia,OCLCeilVIAF
  • 89. Il problema dei numerosi doppioni creati dai record da SBN è quello che viene definito come: “Parallel VIAF clusters for one identity”: https://en.wikipedia.org/wiki/Wikipedia:VIAF/ errors#Parallel_VIAF_clusters_for_one_identity 89 Problemi degli identificativi VIAF in Wikipedia in lingua italiana 6.Wikipedia,OCLCeilVIAF
  • 90. Tra fine 2012 e inizio 2013 l'identificativo VIAF è stato condiviso con le versioni di Wikipedia nelle altre lingue, tra cui la versione italiana.* Nel corso del primo semestre del 2013, circa 72.000 voci della versione italiana di Wikipedia sono state arricchite con gli identificativi provenienti dal VIAF utilizzando il VIAFbot.** A fine febbraio 2015 le voci della Wikipedia italiana popolate dal VIAF sono diventate 75.793. La lista completa in ordine alfabetico si trova alla pagina Categoria:Voci con codici di controllo di autorità.*** 90 * Sull'importazione degli identificativi VIAF in Wikipedia, vedi: Max Klein, «VIAFbot Debriefing», 28 November 2012. hangingtogether.org. http://hangingtogether.org/?p=2306 e «Library Data in Wikipedia and Wikidata», presentazione tenuta a EMEARC, 26 febbraio 2013, Strasbourg, France. http://www.slideshare.net/oclcr/library-data-in-wikipedia-and-wikidata?from_search=3. L’importazione degli identificativi VIAF in Wikipedia in lingua italiana ** Sull'importazione degli identificativi VIAF nella versione italiana di Wikipedia, vedi: GLAM/Newsletter/July 2013/Contents/Italy report: http://outreach.wikimedia.org/wiki/GLAM/Newsletter/June_2013/Contents/Italy_report. *** Vedi https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0.La lista viene aggiornata automaticamente in base alla presenza del template Controllo di autorità al fondo delle voci. 6.Wikipedia,OCLCeilVIAF
  • 91. 7. Identificativi nazionali. Wikipedia e SBN Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 92. Per i lettori di Wikipedia è importante anche poter avere link che puntano al proprio catalogo nazionale. 92 L’importazione di altri identificativi in Wikipedia EN e in altre versioni ☞ Importanza della cultura locale, sia in Wikipedia che negli authority files ☞ l’importazione automatica è stata resa possibile dal fatto che esisteva già l’identificativo internazionale VIAF che serviva a identificare la voce in cui importare l’identificativo nazionale A inizio 2013 sono stati importati in diverse versioni di Wikipedia gli identificativi dei record nazionali. 7.Glialtriidentificativi,WikipediaITeSBN
  • 93. 93 Tra 2013 e 2014 sono aumentati considerevolmente i tipi diversi di identificativi per l’authority control ammessi in Wikidata: ora sono 104. Vedi: la tabella “Controllo di autorità” alla pagina Wikidata:Lista di proprietà/Generiche https://www.wikidata.org/wiki/Special:MyLanguage/Wikidata:List_of_properties/Generic I numerosi identificativi per l’authority control in WikiData 7.Glialtriidentificativi,WikipediaITeSBN
  • 94. 94 A un anno di distanza dall’importazione del VIAF, la Wikipedia inglese ha arricchito la sezione Authority control che ora contiene vari identificativi e relativi link: • WorldCat (= WorldCat Identities) • VIAF • LCCN (= Library of Congress Control Number) • ISNI (= International Standard Name Identifier) • GND (= authority file tedesco: Gemeinsame Normdatei, o: Universal Authority File) • BNF (= Bibliothèque National de France) • ecc. L’importazione di altri identificativi in Wikipedia EN e in altre versioni 7.Glialtriidentificativi,WikipediaITeSBN
  • 95. L’importazione dell’identificativo nazionale ha riguardato anche la versione italiana di Wikipedia. La presenza degli identificativi VIAF ha consentito l’importazione degli identificativi SBN in Wikidata e Wikipedia tramite una procedura automatica. A maggio 2013 è stata rivolta una proposta alla comunità di Wikipedia in lingua italiana a cui è seguita una discussione.* 95 L’importazione degli identificativi SBN nella versione italiana di Wikipedia * Vedi la proposta e la discussione alla pagina: https://it.wikipedia.org/wiki/Discussioni_template:Controllo_di_autorità#ICCU. 7.Glialtriidentificativi,WikipediaITeSBN
  • 96. 96 L’importazione degli identificativi SBN nella versione italiana di Wikipedia 6.Glialtriidentificativi,WikipediaITeSBN Box dei 3 identificativi: - VIAF - LCCN - SBN
  • 97. Per poter ottenere il match corretto tra una voce di Wikipedia (versione italiana), per es. la voce dedicata all’autore X e il relativo identificativo SBN, è stato usato come elemento di riferimento l’identificativo del cluster VIAF in cui è compreso anche l’identificativo Wikipedia del medesimo autore X, già importato anche nelle altre versioni di Wikipedia. Questo significa che la procedura automatica ha consentito di importare solo quegli identificativi SBN che a inizio 2013 non erano “isolati” nel VIAF ma avevano un match con un cluster VIAF multirecord che inoltre conteneva anche il record da Wikipedia: circa 1400 voci di Wikipedia in versione italiana sono state arricchite con l’identificativo del record SBN 97 L’importazione degli identificativi SBN nella versione italiana di Wikipedia ☞ questo spiega perché la procedura automatica iniziale ha potuto importare l’identificativo SBN solo in 1400 voci Problema di quantità e di matching 7.Glialtriidentificativi,WikipediaITeSBN
  • 98. La situazione del VIAF: confronto tra record SBN e da altri cataloghi a primavera 2013: 98 VIAF: totale 33.667.856 di record (al settembre 2013) Totale record di autorità SBN: 3.714.476 (al luglio 2013) VIAF Record da SBN che hanno avuto un match con almeno 1 altro record VIAF: 5.993 (= 13% dei record forniti) Record da SBN forniti al VIAF: 45.208 (= 1,2% del totale dei record di autorità SBN) 39.215 record sono cluster “isolati” Germania ca. 10 milioni di record USA, Canada, UK ca. 9 milioni di record Portogallo Francia Spagna L’importazione degli identificativi SBN nella versione italiana di Wikipedia A inizio 2013 i record da SBN che avevano un match con un cluster VIAF multirecord che conteneva anche un record WKP erano un sottogruppo dei 5.993 record che avevano avuto un match con almeno 1 altro record 7.Glialtriidentificativi,WikipediaITeSBN Record da SBN nel VIAF 45.208 tra 2009-2013 (= solo 1,2% dei record autori in SBN)
  • 99. La situazione dell’importazione degli identificativi nazionali in 4 versioni di Wikipedia al 3 ottobre 2013: 99 Situazione 2013 dell’importazione degli identificativi nazionali Wikipedia EN Germania Francia Italia LCCN [P244] GND [P227] BNF [P268] SBN [P396] 157.992 218.898 161.168 1.534 Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData Il numero di identificativi SBN importati automaticamente era di circa 1400. Con un successivo lavoro di aggiunta manuale tra l’estate e il settembre 2013, erano diventati 1534. 7.Glialtriidentificativi,WikipediaITeSBN
  • 100. La situazione dell’importazione degli identificativi nazionali in 4 versioni di Wikipedia al 26 febbraio 2015: 100 Situazione inizio 2015 dell’importazione degli identificativi nazionali Wikipedia EN Germania Francia Italia LCCN [P244] GND [P227] BNF [P268] SBN [P396] 211.940 336.700 149.431 3.756 Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData 7.Glialtriidentificativi,WikipediaITeSBN
  • 101. La situazione del VIAF: confronto tra record da SBN e da altri cataloghi a inizio 2015: 101 VIAF: totale 44.885.233 di record (ad agosto 2014) Totale record di autorità autori in SBN: 3.911.525 (al gennaio 2015) VIAF Record da SBN che hanno avuto un match con almeno 1 altro record VIAF: ca. 66.000 (= 39% dei record forniti) Record da SBN forniti al VIAF: 169.028 (= 4,3% del totale dei record di autorità SBN) Germania ca. 10 milioni di record USA, Canada, UK ca. 9 milioni di record Portogallo Francia Spagna La composizione del VIAF a inizio 2015 A inizio 2015 i record da SBN che hanno un match con un cluster VIAF multirecord che contiene un record WKP (=da Wikipedia) sono un sottogruppo dei ca. 66.000 record che hanno avuto un match con almeno 1 altro record 7.Glialtriidentificativi,WikipediaITeSBN Record da SBN nel VIAF 169.028 nel 2014 (= solo 4,3% dei record autori in SBN)
  • 102. Rimane un grosso scompenso nella Wikipedia italiana: a fine febbraio 2015: 75.793 VIAF ma solo 3.756 identificativi SBN Tenendo comunque conto che: 1. se un identificativo SBN non è entrato a far parte di un cluster VIAF nel quale è compreso anche l’identificativo WKP, non è importato in WikiData 2. 169.028 record forniti sono solo il 4,3% del totale dei record autori SBN (3.911.525 autori personali e collettivi, al gennaio 2015, e tutti i record con livello inferiore a SUP non sono stati forniti al VIAF 3. per una differenza nelle regole catalografiche, non sempre a un identificativo VIAF “può” corrispondere un identificativo SBN 102 Le criticità della importazione degli identificativi SBN 7.Glialtriidentificativi,WikipediaITeSBN
  • 103. I problemi aperti: 1. il numero totale di identificativi importati rimane molto basso: il 4,3% del totale 2. non è chiaro come funzioni la sincronizzazione tra VIAF e Wikidata per quanto riguarda gli identificativi nazionali (questo nodo andrebbe chiarito prima di optare per l’inserimento manuale degli identificativi SBN, soluzione adottata nel biennio precedente dalle versioni francese e tedesca di Wikipedia) 3. soprattutto non è chiara la strategia della rete SBN in relazione alla manutenzione dell’authority file e quindi alla fornitura di record a OCLC per il VIAF 103 Le criticità della importazione degli identificativi SBN 7.Glialtriidentificativi,WikipediaITeSBN
  • 104. 8. L’inserimento manuale in Wikidata Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 105. L’aggiunta degli identificativi SBN si fa in Wikidata (non in Wikipedia). La procedura è semplice: 1. si cerca l’identificativo del record di autorità SBN nella sezione Ricerca voci di autorità dell’opac SBN a: http:// opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth 2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record 3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P396 (che nella struttura record di Wikidata corrisponde a: SBN Identifier). In alternativa alla digitazione del codice si può digitare direttamente in lettere: SBN identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del record SBN e si clicca sul link [save] 4. sotto all’identificativo SBN è necessario aggiunge la specificazione della fonte di provenienza del record di autorità. Si clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143 utile per specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato da” se si lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported from. Nel box di destra si inserisce il codice Q576951 utile per specificare la fonte e che corrisponde a: Servizio Bibliotecario Nazionale. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Servizio Bibliotecario Nazionale. Si clicca di nuovo sul link [save] A questo punto la procedura di inserimento dell’identificativo SBN è conclusa. 105 * Wikidata: https://www.wikidata.org/. Una volta aggiunto un identificativo SBN in Wikidata, una procedura automatica lo aggiunge alla relativa voce di Wikipedia. Come si inseriscono manualmente gli identificativi SBN 8.Illavorodafare
  • 106. L’aggiunta degli identificativi VIAF si fa sempre in WikiData (non in Wikipedia). La procedura è semplice: 1. si cerca l’identificativo del cluster VIAF usando l’interfaccia di ricerca del VIAF a http://viaf.org/ Nel menù a tendina a sinistra Select Field si seleziona: Personal Names e se esiste più di un cluster VIAF si sceglie quello che al suo interno contiene il record da Wikipedia, identificato dalla icona con la lettera W e il codice WKP 2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record 3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P214 (che nella struttura record di Wikidata corrisponde a: VIAF Identifier). In alternativa alla digitazione del codice si può digitare direttamente in lettere: VIAF identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del cluster VIAF e si clicca sul link [save] 4. sotto all’identificativo del cluster VIAF è necessario aggiunge la specificazione della fonte di provenienza del record di autorità. Si clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143 utile per specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato da” se si lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported from. Nel box di destra si inserisce il codice Q54919 utile per specificare la fonte e che corrisponde a: Virtual International Authority File. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Virtual International Authority File. Si clicca di nuovo sul link [save] A questo punto la procedura di inserimento dell’identificativo VIAF è conclusa. 106 Come si inseriscono manualmente gli identificativi VIAF (se assenti) 8.Illavorodafare
  • 107. Esempio con la voce dedicata a Elena Ferrante: https://it.wikipedia.org/wiki/Elena_Ferrante L’identificativo SBN è: ITICCURAVV076631 Manca l’identificativo del record SBN
  • 108. 108 Tecnicamente è facile! 5.Glialtriidentificativi,WikipediaITeSBN Inserire nel campo il nome dell’autore L’identificativo del record SBN va cercato nell’opac SBN > Voci di autorità a: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth Ferrante, Elena
  • 109. risultato della ricerca: cliccare sull’hyperlink per aprire la finestra con il record completo
  • 110. identificativo del record SBN Selezionare l’identificativo del record, copiarlo e poi incollarlo in WikiData. ATTENZIONE: non copiare l’identificativo internazionale! Solo l’identificativo SBN.
  • 111. Dalla voce di Wikipedia è possibile arrivare al relativo item di Wikidata cliccando su: Modifica link nella colonna di sinistra al termine dei link
  • 112. In alternativa si fa una ricerca per nome in WikiData dall’apposito box
  • 113. Il record dedicato a Elena Ferrante nel database di Wikidata a: https://www.wikidata.org/ wiki/Q368127
  • 114. Per editare gli items di Wikidata bisogna prima autenticarsi (o registrarsi)
  • 115. Per aggiungere l’identificativo SBN è necessario scorrere la tabella “Dichiarazioni” (“Statements”) fino al fondo e aggiungere una nuova riga dove inseriremo la nuova Proprietà: l’identificativo SBN. Cliccare sul link [add]
  • 116. È stata aggiunta una nuova riga evidenziata in colore azzurro che contiene il nuovo campo utilizzabile per inserire una nuova Proprietà: nel nostro caso lo useremo per inserire nel nuovo campo vuoto il codice: P396 (che corrisponde alla proprietà SBN)
  • 117. Nel box di sinistra inserire il codice P396. Quando lo si inserisce il sistema visualizza il valore che corrisponde al codice: SBN Identifier Con il mouse andare sopra il suggerimento e cliccare per selezionarlo. In alternativa alla digitazione del codice P396 possiamo digitare direttamente in lettere: SBN identifier (se si lavora con l’interfaccia in inglese) o identificativo SBN (se si lavora con l’interfaccia in italiano).
  • 118. Nel campo di destra inserire l’identificativo del record SBN: nel caso di Elena Ferrante: ITICCURAVV076631
  • 119. Cliccare sul link [save]
  • 120. Aggiungere la fonte dell’identificativo appena inserito: cliccare sul link [add source]
  • 121. Nel nuovo campo che è comparso, inserire il codice: P143 che corrisponde all’etichetta: imported from (se si lavora nella versione in lingua inglese di Wikidata, o: importato da se si lavora nella versione in lingua italiana di Wikidata). In alternativa alla digitazione del codice è possibile digitare direttamente in lettere: imported from oppure importato da (a seconda della lingua scelta per l’interfaccia di lavorazione).
  • 122. Quando si inserisce il codice P143 il sistema visualizza un suggerimento in blu. Con il mouse andare sopra il suggerimento e cliccare per selezionarlo.
  • 123. Nel campo di destra inserire il codice: Q576951 comparirà un suggerimento in blu che contiene la scritta: Servizio Bibliotecario Nazionale corrispondente al valore del codice inserito. Dare Invio per salvare l’identificazione della fonte del dato. In alternativa alla digitazione del codice è possibile digitare direttamente in lettere: Servizio Bibliotecario Nazionale.
  • 124. cliccare sul link [save]
  • 126. l’identificativo del record SBN è stato aggiunto automaticamente alla voce in Wikipedia ☞ non occorre essere bibliotecari e tantomeno catalogatori 126
  • 127. Una volta concluso l’inserimento in Wikidata, per ottenere che l'identificativo SBN sia visibile anche nella relativa voce di Wikipedia non bisogna fare nulla. Il template Controllo di autorità in Wikipedia è programmato per condividere automaticamente con Wikidata l'identificativo SBN, che quindi è immediatamente visibile in Wikipedia. Nel caso che una verifica in Wikipedia non desse risultato positivo, è possibile che: 1. ci sia un problema di cache: per pulire la cache della pagina e ricaricarla si usa la funzione "purge". Si proceda in questo modo: in Wikipedia, alla fine della URL della voce che abbiamo aperto, aggiungere: ?action=purge 2. oppure è possibile che il template Controllo di autorità non sia visibile. Questo succede se si tratta di una nuova voce a cui non è stato ancora aggiunto oppure per altri motivi. In ogni caso, per renderlo visibile è necessario aggiungerlo manualmente con una normale operazione di editing della voce di Wikipedia: ci si autentica, si clicca sul link in alto a destra Modifica wikitesto, si scorre il testo della pagina per posizionarsi al fondo della voce dove si aggiunge la seguente la stringa di caratteri: {{Controllo di autorità}} Quindi salvare e il template verrà visualizzato, popolato dagli identificativi presenti nel relativo item in Wikidata. 127 Gli identificativi SBN nelle voci di Wikipedia 8.Illavorodafare
  • 128. 2. clic su Modifica wikitesto 1. autenticarsi 3. interfaccia per l’editing della voce 4. al fondo della voce aggiungere: {{Controllo di autorità}} 128
  • 129. Come ottenere una lista aggiornata dinamicamente degli item di Wikidata dotati di identificativo SBN: 129 In Wikidata utilizzare il parametro: pagine che puntano alla proprietà [P396]* https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P396 8.Illavorodafare Lista dinamica degli item di Wikidata già dotati di identificativi SBN oppure, in Wikidata, nella pagina della Property 396: https:// www.wikidata.org/wiki/Property:P396 cliccare nel menù a sinistra sul link: What links here / Puntano qui
  • 130. Come si ottiene una lista aggiornata dinamicamente degli item di Wikidata dotati di identificativo SBN: in Wikidata, nella pagina della Property 396: https://www.wikidata.org/wiki/Property:P396 130 8.Illavorodafare Lista dinamica degli item di Wikidata già dotati di identificativi SBN Cliccare su questo link
  • 131. Stime sul lavoro manuale di aggiunta degli identificativi: 131 Il numero totale degli items relativi a nomi di persona ancora da arricchire è stimabile al 26 febbraio 2015 in < 354.612 * * Il totale di 354.612 items si ricava da una query di Wikidata impostata su 3 condizioni: avere una professione [P106], non avere l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214]. Se si volesse una lista di lavoro limitata a nomi italiani, il numero totale degli items relativi a nomi di persona ancora da arricchire sarebbe stimabile al 26 febbraio 2015 in ≤ 11.219 ** ** Il totale di 11.219 items si ricava da una query di Wikidata impostata su 3 condizioni: avere come paese di nascita l’Italia [P27:Q38], non avere l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214]. 8.Illavorodafare Il lavoro che resta da fare: inserire gli identificativi SBN
  • 132. Liste di lavoro aggiornate ricavabili da Wikidata: 132 1. Lista di item di Wikidata di tipo persona (= che hanno una professione [P106]), prive di identificativo SBN [P396] ma dotate di identificativo VIAF [P214] e con link a una voce nella Wikipedia italiana: CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki] 8.Illavorodafare Inserire manualmente gli identificativi SBN: il lavoro da fare 2. Lista di item di Wikidata di tipo persona, che hanno come paese di nascita l’Italia [P27:Q38], sono privi di identificativo SBN [P396] ma hanno l’identificativo VIAF [P214], e con link a una voce nella Wikipedia italiana: CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki] Oppure: 3. Lista di item di Wikidata che possiedono l’identificativo VIAF [P214], identificate in base al parametro: Pages that link to "Property:P214" (non contiene solo persone) https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P214 http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki] http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki]
  • 133. Lista di lavoro ricavabile da Wikipedia: lista di quasi 76.000 voci, in ordine alfabetico, che hanno la sezione Controllo di autorità già popolata (perlomeno dall’identificativo VIAF). Questa lista si trova alla pagina: Categoria:Voci con codici di controllo di autorità e viene aggiornata automaticamente in base alla presenza in una voce della sezione Controllo di autorità*. Tuttavia, a differenza delle liste ricavabili da Wikidata, questa lista contiene sia voci che possiedono già l’identificativo SBN, sia voci che non lo possiedono. 133 8.Illavorodafare * Vedi: https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0 Inserire manualmente gli identificativi SBN: il lavoro da fare
  • 134. Attenzione: In WikiData devono essere inseriti SOLO gli identificativi SBN che sono rintracciabili dall’Opac SBN nella sezione Ricerca voci di autorità*. Infatti solo per questi identificativi è attivo il servizio di risoluzione* che con l'aggiunta dell'identificativo del record SBN consente di creare hyperlink funzionanti da Wikidata/ Wikipedia all’opac SBN. Pertanto non devono essere inseriti identificativi di record di autorità SBN che sono rintracciabili solo usando un gestionale per SBN ( = tutti i record appartenenti a uno dei seguenti livelli: 04; REC (05), MIN (6–51), MED (52–71) e MAX (72–90) Se in Wikidata venissero inseriti identificativi SBN non rintracciabili con una ricerca dall’opac SBN, l’hyperlink nella relativa voce di Wikipedia porterebbe all’opac SBN che visualizzerebbe il messaggio: Nessun risultato trovato. 134 8.Illavorodafare * Da: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth Inserire manualmente gli identificativi SBN: il lavoro da fare ** Il servizio di risoluzione http://id.sbn.it/af/ che consente per es. di creare hyperlinks basati su URL con questa sintassi: http://id.sbn.it/af/IT/ ICCU/CFIV/009079
  • 135. 135 Hyerlink all’opac SBN non funzionante nel caso del record Pinturicchio 8.Illavorodafare
  • 136. 136 La pagina di istruzioni in Wikipedia 8.Illavorodafare Istruzioni per importare manualmente nelle voci di Wikipedia gli identificativi dei record di autorità utilizzati nel catalogo SBN: https://it.wikipedia.org/wiki/Progetto:GLAM/Biblioteche/VIAF/SBN
  • 137. 137 Elenco dei nomi con identificativi SBN che non possono essere inseriti 8.Illavorodafare Elenco di identificativi SBN con livelli inferiori a SUP: https://it.wikipedia.org/wiki/Progetto:GLAM/ Biblioteche/VIAF/SBN/Elenco_autori_privi_di_identificativo_SBN_in_Voci_di_autorit%C3%A0_dell %27opac_SBN
  • 138. 138 La pagina per discutere, confrontarsi, porre problemi 8.Illavorodafare La discussione sul template Controllo di autorità: http://it.wikipedia.org/wiki/ Discussioni_template:Controllo_di_autorit%C3%A0 se sono autenticato compaiono le segnalazioni sulle risposte ai miei interventi
  • 139. 139 La pagina dei sondaggi sul Controllo di autorità 8.Illavorodafare Wikipedia:Sondaggi/Controllo di autorità: http://it.wikipedia.org/wiki/Wikipedia:Sondaggi/ Controllo_di_autorit%C3%A0
  • 140. 9. Navigare da Wikipedia agli opac Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  • 141. 141 L’inserimento nelle voci di Wikipedia degli identificativi nazionali dei record di autorità consente di ottenere dei link da Wikipedia agli opac di 2 diversi tipi: 1. link ai record di autorità negli authority files 2. link a liste di record bibliografici: sia per le opere “di” che per le opere “su” Da Wikipedia agli opac 9.NavigaredaWikipediaagliopac
  • 142. L’identificativo da SBN è anche un link che consente di navigare verso l’Authority file dell’opac web di SBN e da qui alle notizie bibliografiche 142 La realizzazione dell'hyperlink è stata resa possibile grazie al lavoro dei tecnici dell'ICCU che con la supervisione di Giovanni Bergamin nel giugno 2013 hanno realizzato un risolutore http:// id.sbn.it/af/ che con l'aggiunta dell'identificativo SBN del record consente di creare un link permanente che punta a un record di autorità nella interfaccia web dell'opac SBN. Per es. la URL http://id.sbn.it/af/IT/ICCU/CFIV/009079 punta al record di autorità di Alessandro Manzoni nell'opac web SBN. Navigazione: dall’identificativo SBN al catalogo SBN 9.NavigaredaWikipediaagliopac
  • 143. 143 Da Wikipedia agli opac La creazione di link a liste di record bibliografici è stata sviluppata dal bibliotecario americano John Ockerbloom* che ha creato 2 strumenti: 1. un apposito template da inserire nelle voci di Wikipedia: “Library resources box”, 2. un servizio di redirect basato su una knowledge base per poter creare link che a partire da una voce di Wikipedia, reindirizzano a vari cataloghi, a scelta del lettore. In questo modo si ottengono link a liste di opere “di” e liste di opere “su” un certo autore usando un identificativo nazionale.* * Vedi: John Ockerbloom, “From Wikipedia to our libraries”, in Everybody’s Libraries, 4 marzo 2013 http://everybodyslibraries.com/2013/03/04/from-wikipedia-to-our-libraries/ Il servizio di redirect è attivo dalla pagina FTL: Forward to Libraries: http://tools.wmflabs.org/ftl/cgi-bin/ftl 9.NavigaredaWikipediaagliopac
  • 144. 144 Da Wikipedia agli opac: la soluzione Ockerbloom Esempio: la voce su Jane Austen nella versione inglese di Wikipedia con il “Library resources box” il template creato da Ockerbloom Jane Austen: https://en.wikipedia.org/wiki/Jane_Austen 9.NavigaredaWikipediaagliopac
  • 145. 145 Esempio: dalla voce su Jane Austen nella versione inglese di Wikipedia è possibile grazie al 1: “Library resources box” navigare al 3: catalogo della National Library of Australia passando dal 2: servizio di redirect. Da Wikipedia agli opac: la soluzione Ockerbloom 1 3 2 9.NavigaredaWikipediaagliopac
  • 146. 146 La soluzione di Ockerbloom basata su un servizio di redirect consente 3 vantaggi: 1. avere link diretti a liste di record bibliografici 2. invece di avere link che puntano solo al catalogo nazionale, consente di puntare a diversi cataloghi 3. consente all’utente di registrare la sua preferenza per linkare a un singolo catalogo tramite l’uso di cookie Da Wikipedia agli opac 9.NavigaredaWikipediaagliopac
  • 147. 147 Gli identificativi dei record di autorirà importati nelle voci di Wikipedia possono servire anche per creare dei link precisi dai cataloghi di biblioteca a Wikipedia. Navigare dagli opac alle voci di Wikipedia Bisogna creare un servizio di redirect che consente di usare URL che riutilizzano gli identificativi dei record di autorità per puntare a voci specifiche di una certa versione di Wikipedia ☞ come creare link dagli opac a specifiche voci di Wikipedia? 9.NavigaredaWikipediaagliopac
  • 148. 148 Navigare dagli opac alle voci di Wikipedia Nel caso di Wikipedia in lingua tedesca è già stato creato un servizio di redirect, Wikipedia Personsuche, che consente di inserire in qualsiasi Opac URL create usando come parametro specifico l’identifivativo nazionale del record di autorità puntando alla pagina di Wikipedia che contiene la voce di un autore. Es. nel caso di Galileo Galilei, è possibile creare una URL diretta usando l’identificativo 118537229 che nell’authority file tedesco GND (Gemeinsame Normdatei) passa alla Wikipedia in tedesco tramite un redirect: http://tools.wmflabs.org/persondata/p/gnd/118537229 9.NavigaredaWikipediaagliopac
  • 149. 149 Pagina di Galileo Galilei in Wikipedia Personsuche: http://tools.wmflabs.org/persondata/p/gnd/ 118537229 9.NavigaredaWikipediaagliopac
  • 150. 150 Nel caso di link dagli opac italiani alla versione italiana di Wikipedia, bisognerebbe creare un servizio di redirect analogo a quello tedesco in modo che possa gestire URL che impieghino come parametro l’identificativo SBN in questo modo: http://tools.wmflabs.org/persondata/p/sbn/IT%5CICCU%5CCFIV%5C009079 Dagli opac italiani alla versione italiana di Wikipedia Verrebbe facilitato il linking dagli opac delle biblioteche che lavorano in SBN a Wikipedia per consentire agli utenti di trovare altre informazioni sugli autori. 9.NavigaredaWikipediaagliopac
  • 151. 151 Opac 1 Opac 2 Opac 3 Opac 4 Opac 5 Il funzionamento del servizio di redirect per gestire i link dai record negli opac a specifiche voci di Wikipedia dedicate ad autori: Servizio nazionale di Redirect (utilizza gli identificativi nazionali dei record di autorità) Wikimedia IT Link dagli opac a Wikipedia tramite un servizio di redirect 9.NavigaredaWikipediaagliopac
  • 152. 152 Criticità del dialogo Wikipedia / Opac nel caso dell’Italia ☞ inserire anche nella versione italiana di Wikipedia un numero significativo di identificativi Problemi della situazione italiana da superare: 9.NavigaredaWikipediaagliopac Innanzitutto, per far dialogare Wikipedia con i cataloghi delle biblioteche sfruttando hyperlink precisi basati sugli identificativi dei record di autorità è necessario:
  • 153. 153 ☞ Nuove sfide per le biblioteche: Problemi: 1. i bibliotecari sono pronti a ottimizzare i loro record catalografici per: essere importati insieme ad altri in un contesto internazionale? essere importati in un nuovo contesto come Wikipedia? 2. i nostri cataloghi sono “linkabili” dall’esterno anche al livello di singolo record e di liste di record? 9.NavigaredaWikipediaagliopac Il riuso dei dati catalografici: le sfide che pone al bibliotecario
  • 154. 154 I nuovi problemi sono culturali, tecnologici, di visione del ruolo rinnovato del catalogo della biblioteca nell’era del Web e della necessità di aprire il catalogo al colloquio con sistemi esterni molto popolari tra gli utenti. ☞ nell’era del Web il catalogo non basta più, l’utente vuole più informazioni. Far dialogare Wikipedia e gli opac è un modo per rispondere a questa aspettativa. 9.NavigaredaWikipediaagliopac Il riuso dei dati catalografici: le sfide che pone al bibliotecario
  • 155. Grazie Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015