Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche.

1,338 views

Published on

Slides del corso tenuto per AIB Toscana presso Università di Firenze, Biblioteca di Scienze sociali, Aula didattica, 3 marzo 2015.

Published in: Internet

Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche.

  1. 1. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015 Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. Pierfranco Minsenti
  2. 2. Indice 1. Condividere i dati catalografici 2. L’Authority control in Wikipedia 3. Verso il VIAF: il dibattito 1961-2001 4. Che cos’è il VIAF 5. Il contributo italiano: SBN e VIAF 6. Wikipedia, OCLC e il VIAF 7. Identificativi nazionali. Wikipedia e SBN 8. L’inserimento manuale in Wikidata: istruzioni 9. Navigare da Wikipedia agli opac
  3. 3. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015 Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. 1. Condividere i dati catalografici
  4. 4. 4 Collaborazione tra Wikimedia e OCLC: caso concreto di riuso dei dati catalografici prodotti dalle biblioteche 1.Problema:riusodeidaticatalografici OCLC e la collaborazione con Wikipedia grazie al VIAF Dimostra: 1. le potenzialità dell’apertura dei cataloghi delle biblioteche 2. le opportunità, gli spazi di miglioramento e la necessità di adottare una strategia precisa 3. il grosso divario tra l’Italia e il resto del mondo nel campo del controllo di autorità svolto dalle biblioteche
  5. 5. 5 Il riuso dei dati catalografici: le sfide che pone al bibliotecario ☞ è una potenzialità che nasce dall’evoluzione del Web verso i Linked Open Data 1.Problema:riusodeidaticatalografici il riuso dei dati catalografici fuori dal catalogo è un problema nuovo per il bibliotecario. Il bibliotecario non è abituato a porselo perché nel contesto cartaceo non esisteva la possibilità di riutilizzare i dati catalografici. Vantaggi ad aprire a collaborazioni e sinergie
  6. 6. 6 Vantaggi della collaborazione tra Wikimedia e OCLC: creare una sinergia utile a Wikipedia e alle biblioteche 1. per Wikipedia: l’identificazione delle persone a cui sono dedicate le voci di Wikipedia tramite l’uso degli identificativi ricavati da un archivio internazionale: il VIAF 2. consentire la navigazione da Wikipedia ai cataloghi: vantaggio per Wikipedia e per le biblioteche per offrire opportunità di approfondimento ai lettori 1.Problema:riusodeidaticatalografici OCLC e la collaborazione con Wikipedia tramite il VIAF ☞ nelle voci di Wikipedia si aprono delle “finestre” verso i cataloghi
  7. 7. 7 Benefici per le biblioteche Perché alle biblioteche dovrebbe interessare? 1.Problema:riusodeidaticatalografici ☞ Se gli utenti sono sempre più abituati a trascurare il catalogo e iniziare la ricerca su Wikipedia, una soluzione è quella di portarli da Wikipedia al catalogo della biblioteca
  8. 8. 8 I record delle biblioteche non sono “aperti”: sono consultabili liberamente grazie agli Opac, ma non esistono soluzioni per favorire il riuso. 1.Problema:riusodeidaticatalografici Dati liberi per consentire il riuso Le condizioni: Quali condizioni minime?
  9. 9. 9 1.Problema:riusodeidaticatalografici Dati liberi per consentire il riuso 1. mettere a disposizione i record in dataset completi, scaricabili liberamente e in diversi formati* 2. adottare una licenza che consenta la libera riutilizzazione dei record. Per il VIAF OCLC ha adottato la licenza ODC-By: Open Data Commons Attribution License.** 3. infrastruttura tecnica 4. la definzione di ruoli precisi tramite accordi tra le istituzioni, la creazione di agli organi di governo, la condivisione nella decisione sulle strategie (partecipazione), la raccolta del feedback 4 condizioni minime: * I dataset del VIAF sono messi a disposizione dalla pagina http://viaf.org/viaf/data/ ** Vedi: http://opendatacommons.org/licenses/by/
  10. 10. 10 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Non è possibile importare record in Wikipedia dai singoli cataloghi. È necessario un archivio globale di record che svolga la funzione di archivio intermedio che faciliti l’esportazione dai cataloghi e l’importazione in Wikipedia L’infrastruttura tecnica: La pagina da cui scaricare i dataset completi del VIAF aggiornati mensilmente: http://viaf.org/viaf/data/
  11. 11. 11 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Non è possibile importare record in Wikipedia dai singoli cataloghi. È necessario un archivio globale di record che svolga la funzione di archivio intermedio che faciliti l’esportazione dai cataloghi e l’importazione in Wikipedia L’infrastruttura tecnica: La licenza dei record del VIAF del tipo ODC-By: Open Data Commons Attribution License alla pagina: http://viaf.org/viaf/data/ Consentito il riuso!
  12. 12. 12 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Non è possibile importare record in Wikipedia dai singoli cataloghi. È necessario un archivio globale di record che svolga la funzione di archivio intermedio che faciliti l’esportazione dai cataloghi e l’importazione in Wikipedia L’infrastruttura tecnica:
  13. 13. 13 Il riuso dei dati catalografici: il caso VIAF → Wikipedia ☞ il VIAF è un archivio globale di record di autorità. Tra le altre funzioni svolge anche quella di collettore di record per esportarli in altri contesti come Wikipedia. La partecipazione è gratuita. 1.Problema:riusodeidaticatalografici Il VIAF è l’esempio concreto di una soluzione:
  14. 14. 14 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Il VIAF è lo strumento che rende possibile una collaborazione tra biblioteche e Wikipedia per il riuso dei dati catalografici e la creazione di hyperlinks reciproci. OCLC riveste un ruolo chiave come gestore del VIAF. È una cooperazione tra 3 tipi di istituzioni: Cataloghi Biblioteche OCLC VIAF Wikimedia Wikidata Wikipedia link dalle versioni di Wikipedia ai cataloghi ☞ Gli hyperlinks assicurano la reciprocità, l’interesse comune a cooperare facilitando la navigazione all’utente.
  15. 15. 15 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici VIAF Catalogo Catalogo Catalogo Catalogo Catalogo Virtual International Authority File Flusso dei dati: dai cataloghi al VIAF a Wikidata alle versioni di Wikipedia: (archivio globale dei record di autorità) (database unico che alimenta tutte le voci di Wikipedia) WikimediaBiblioteche OCLC WIKIDATA http://viaf.org
  16. 16. 16 Il riuso dei dati catalografici: il caso VIAF → Wikipedia 1.Problema:riusodeidaticatalografici Volontari
  17. 17. 17 La sinergia Biblioteche/VIAF/Wikipedia offre un esempio concreto della riutilizzazione dei dati bibliotecari in altri contesti. 1.Problema:riusodeidaticatalografici I problemi Le criticità della situazione italiana Tuttavia per i motivi che analizzeremo, l’Italia è tra le nazioni meno preparate per avvantaggiarsi di questo tipo di soluzioni e sinergie. ☞ questa presentazione farà emergere il divario tra le opportunità offerte a livello internazionale e le scarse possibilità che ha l’Italia di avvalersene
  18. 18. 2. L’Authority control in Wikipedia Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  19. 19. Wikipedia e l’authority control L’authority control non è uno strumento fondamentale solo per i cataloghi delle biblioteche ma anche per Wikipedia. 19 2.AuthoritycontrolinWikipediaebiblioteche Nelle biblioteche duplice scopo: rendere possibile la funzione identificativa e collocativa del catalogo. 1. identificare le “entità” con rilevanza bibliografica = quelle che consentono raggruppamenti delle descrizioni per punti d’accesso rilevanti ai fini della ricerca di una risorsa informativa 2. uso di forme controllate per designare i nomi delle entità
  20. 20. L’authority control: un concetto recente, una pratica radicata Entità a rilevanza bibliografica: 1. nomi personali, collettivi, geografici 2. titoli uniformi; titoli di collana; 3. soggetti 20 2.AuthoritycontrolinWikipediaebiblioteche
  21. 21. Wikipedia e l’authority control Esigenza comune da parte di biblioteche e Wikipedia del controllo sulla forma dei nomi. 3 problemi da risolvere: 1. polisemia es.: Winston Churchill (storico, 1620-1688); Winston Churchill (uomo politico, 1874-1965); 2. sinonimia es.: Ada Prospero; Ada Marchesini Gobetti Prospero 3. controllo delle forme correlate es.: Lewis Carroll / Charles Dodgson es.: Joseph Ratzinger / Papa Benedetto XVI 21 2.AuthoritycontrolinWikipediaebiblioteche
  22. 22. Wikipedia e l’authority control Wikipedia condivide con le biblioteche anche il principio di dare priorità al punto di vista dell’utente nel trattamento della selezione della forma principale e dei rinvii dalle forme varianti. Es. la voce su Charles Dodgson / Lewis Carroll è intitolata a Lewis Carroll e ha rinvio da Charles Dodgson: ➡ https://it.wikipedia.org/wiki/Lewis_Carroll ➡ http://it.wikipedia.org/wiki/ Charles_Lutwidge_Dodgson 22 2.AuthoritycontrolinWikipediaebiblioteche
  23. 23. Wikipedia e l’authority control Infine Wikipedia condivide con le biblioteche anche l’uso di: 1. strumento per disambiguare gli omonomi: le qualificazioni 2. liste di snodo per consentire la selezione del nome + qualificazione 3. rinvii (redirect) nei casi di forme varianti correlate 23 2.AuthoritycontrolinWikipediaebiblioteche
  24. 24. Wikipedia e l’authority control Charles Dodgson / Lewis Carroll Una ricerca per Charles Dodgson porta a una pagina di disambiguazione: https://en.wikipedia.org/wiki/ Charles_Dodgson che contiene una scelta fra 3 possibili voci: ➡ Charles Dodgson (bishop) (c. 1722–1795), Anglican Bishop of Elphin, grandfather of the archdeacon https://en.wikipedia.org/wiki/Charles_Dodgson_(bishop) ➡ Charles Dodgson (archdeacon) (1800–1868), Anglican Archdeacon of Richmond, father of the author https://en.wikipedia.org/wiki/Charles_Dodgson_(archdeacon) ➡ Charles Lutwidge Dodgson (1832–1898), better known by the pseudonym Lewis Carroll, renowned children's and fantasy author https://en.wikipedia.org/wiki/ Lewis_Carroll 24 2.AuthoritycontrolinWikipediaebiblioteche
  25. 25. Wikipedia e l’authority control Pagina di disambiguazione per Winston Churchill: https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29 25 Pagina di disambiguazione per Winston Churchill https://en.wikipedia.org/wiki/Winston_Churchill_%28disambiguation%29 2.AuthoritycontrolinWikipediaebiblioteche
  26. 26. 26 ☞ il VIAF ha reso possibile l’avvio di una sinergia consolidando soluzioni e strumenti Wikipedia e l’authority control era destino che Wikipedia individuasse nei records di autorità prodotti dalle biblioteche un valido ausilio per consolidare il suo lavoro 2.AuthoritycontrolinWikipediaebiblioteche
  27. 27. 3. Verso il VIAF: il dibattito 1961-2001 Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  28. 28. Il VIAF è un archivio elettronico internazionale dei records di autorità dei nomi (personali, autori collettivi, geografici, titoli uniformi) e costituisce la soluzione pragmatica a una serie di problemi teorici e pratici che hanno caratterizzato il dibattito sull’authority control per circa 40 anni. Allo stesso tempo crea nuove sfide perché aumenta la complessità dei problemi portando l’authority control su una scala internazionale. 28 ☞ il VIAF è un work in progress Il VIAF 3.VersoilVIAF:ildibattito1961-2001
  29. 29. 29 Il dibattito 1961-1998 sulla forma del nome 1. forma con cui l’autore è più frequentemente identificato nelle edizioni delle sue opere OPPURE: 2. forma ricorrente nella critica e nei repertori OPPURE: 3. forma diventuta costante nell’uso generale Conferenza internazionale di Parigi del 1961: la selezione della forma del nome* * Vedi: Statement of principles adopted at the International Conference on Cataloguing Principles, sezione 8. 3.VersoilVIAF:ildibattito1961-2001
  30. 30. 30 Il dibattito 1961-1998 sulla forma del nome Conferenza internazionale di Parigi del 1961: le indicazioni sulla selezione della forma del nome portano a un risultato contraddittorio tra 2 opposti obiettivi: la standardizzazione per consentire la cooperazione vs. tradizioni catalografiche nazionali familiari all’utente: gli “usi” sono diversi!* 3.VersoilVIAF:ildibattito1961-2001 Questa contraddizione non emerge subito in maniera consapevole ma percorre tutto il dibattito dei 40 anni successivi. * Vedi: M. Guerrini, L. Sardo, Authority control, Roma, AIB, 2003.
  31. 31. 31 Il dibattito 1961-1998 sulla forma del nome Alla base del lavoro dell’IFLA nei decenni successivi, in particolare a partire dall’iniziaitva UBC: Universal Bibliographic Control (1974) sta l’idea che la cooperazione si ottenga tramite la standardizzazione e che questa richieda l’adozione generale di una unica forma universale del nome da parte di tutte le diverse agenzie bibliografiche nazionali. La forma unica universale del nome 3.VersoilVIAF:ildibattito1961-2001
  32. 32. 32 Il dibattito 1961-1998 sulla forma del nome 1. uso di lingue diverse (incide per es. sui nomi geografici; sui titoli uniformi) 2. uso di alfabeti diversi 3. uso di traslitterazioni da alfabeti non latini fatte con criteri diversi (per es. in Francia il nome dell’autore della Sinfonia Patetica viene trascritto come Čajkovskij, Petr Ilʹič, mentre negli Stati Uniti viene trascritto come: Tchaikovsky, Peter Ilich) 4. uso di forme vernacolari (es. Pétrarque; Petrarch) 5. differenze concettuali nella definzione dell’entità a cui si riferisce il “nome”: per es. distinzione tra identità bibliografica e identità personale (vedi il caso dello scrittore irlandese John Banville pubblica romanzi con il suo nome reale e gialli con lo pseudonimo di Benjamin Black) 6. altre differenze catalografiche: per es. uso tedesco delle iniziali puntate La standardizzazione nei nomi si scontra con differenze rilevanti nelle tradizioni catalografiche nazionali: 3.VersoilVIAF:ildibattito1961-2001
  33. 33. 33 Il dibattito 1961-1998 sulla forma del nome Il conflitto tra forma unica universale vs. tradizioni locali ha dominato il dibattito interno all’IFLA. 1998: anno di svolta, Conferenza IFLA di Amsterdam: Il gruppo di lavoro IFLA sul Minimal Level Authority Records conclude il proprio lavoro sostenendo che è irrealistico aspettarsi che tutte le agenzie bibliografiche nazionali adottino la stessa forma. ☞ è necessario trovare una soluzione che metta assieme l’esigenza di preservare le abitudini nazionali e i vantaggi della cooperazione internazionale. 3.VersoilVIAF:ildibattito1961-2001
  34. 34. 34 La tecnologia offre una soluzione 2001: GARR (Guidelines for authority and reference records): la soluzione consiste nel mantenere la pluralità delle forme nazionali e ricorrere alla tecnologia per creare collegamenti tra le diverse forme. ☞ collegamenti, non fusione; molteplicità, non forma unica ☞ preservare le differenze linguistico- culturali facendole convivere con la cooperazione/scambio e il principio della uniformità di accesso 3.VersoilVIAF:ildibattito1961-2001
  35. 35. 35 La tecnologia offre una soluzione collegamenti tra forme diverse del nome riferite alla stessa entità: il collegamento sostituisce l’idea della forma “unica”. Le diverse forme sono considerate come varianti correlate di pari importanza. ☞ nel VIAF questa soluzione dà vita ai cluster: grappoli di records 3.VersoilVIAF:ildibattito1961-2001
  36. 36. 4. Che cos’è il VIAF Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  37. 37. Che cos’è il VIAF Il VIAF, Virtual International Authority File*, è un archivio elettronico multinazionale dei record di autorità, nato nel 2003 grazie a un accordo tra la Library of Congress, la Deutsche Nationalbibliothek e OCLC. Nel 2007 si aggiunse la Bibliothèque Nationale de France. L'interfaccia pubblica di ricerca è stata aperta nel 2007, dalla URL: http://orlabs.oclc.org/viaf/ e dall'inizio del 2009 dalla URL: http:// viaf.org/.** 37 ** Queste informazioni si ricavano da una consultazione del servizio WayBackMachine di Internet Archive. Nella bibliografia sul VIAF non abbiamo trovato informazioni relative alla data di apertura al pubblico dell'interfaccia utente del VIAF. * Per informazioni generali si veda: http://www.oclc.org/viaf.en.html 4.IlVIAF
  38. 38. Che cos’è il VIAF Nell'aprile 2012 le quattro istituzioni bibliotecarie principali decisero di modificare l'organizzazione del servizio trasferendone la titolarità a OCLC.* Attualmente la governance del progetto spetta al VIAF Council i cui membri sono designati dalle agenzie catalografiche che forniscono record al VIAF. Dal maggio 2012 dataset completi vengono messi a disposizione con aggiornamento mensile dalla pagina http://viaf.org/viaf/data con licenza ODC-By** 38 ** Open Data Commons Attribution License. Vedi: http://opendatacommons.org/licenses/by/ * Vedi l'annuncio di OCLC del 4 aprile 2012: «Virtual International Authority File service transitions to OCLC; contributing institutions continue to shape direction through VIAF Council»: http://www.oclc.org/news/releases/2012/201224.en.html. 4.IlVIAF
  39. 39. Che cos’è il VIAF Il VIAF*, Virtual International Authority File, è un archivio elettronico multinazionale dei record di autorità, nato nel 2003 e gestito da OCLC e che attualmente ospita record di autori personali e collettivi, titoli uniformi, nomi geografici forniti da agenzie catalografiche di ogni parte del mondo, tra cui l’Italia. Complessivamente al settembre 2013 il VIAF vede l'adesione di 34 agenzie catalografiche che rappresentano 28 paesi e hanno fornito un totale di circa 33 milioni di record di autorità. Il VIAF implementa Unicode e attualmente visualizza intestazioni che possono essere in un qualsiasi set di caratteri appartenenti a 5 diversi alfabeti usati dalle agenzie catalografiche che collaborano all'iniziativa: latino; cirillico; arabo; israeliano; giapponese. 39 * VIAF: http://viaf.org/ 4.IlVIAF VIAF: http://viaf.org/
  40. 40. Che cos’è il VIAF L’infrastruttura tecnica è gestita da OCLC. Attualmente ospita record di autori personali e collettivi, titoli uniformi, nomi geografici forniti da agenzie catalografiche di ogni parte del mondo, tra cui l’Italia. Complessivamente al febbraio 2015 il VIAF vede l'adesione di 39 agenzie catalografiche che rappresentano 27 paesi e hanno fornito un totale di circa 45 milioni di record di autorità, di cui 35 relativi a nomi di autori personali. 40 4.IlVIAF
  41. 41. Che cos’è il VIAF Le informazioni più aggiornate sul VIAF si trovano sul blog personale di Thomas Hickey, Chief Scientist di OCLC e coordinatore dello staff tecnico che gestisce il VIAF.* Altre informazioni si trovano su slides e report messi a disposizione dalla pagina: VIAF news.** 41 ☞ Il VIAF è un work-in-progress in evoluzione continua * Thomas Hickey, Outgoing. Library metadata techniques and trends by Thom Hickey: http:// outgoing.typepad.com/outgoing/ ** VIAF news: http://www.oclc.org/viaf/news.en.html 4.IlVIAF
  42. 42. Che cos’è il VIAF Definizione per i non bibliotecari: 42 ☞ il VIAF è una specie di anagrafe mondiale di tutti coloro a cui viene riconosciuta una responsabilità in opere dell’intelletto o in creazioni artistiche: ci sono innanzitutto scrittori, come Alessandro Manzoni: http://viaf.org/viaf/14356/#Manzoni,_Alessandro,_1785-1873 Ma nel VIAF, come anche nei cataloghi delle biblioteche, non ci sono solo scrittori. Ci sono anche: artisti, come il pittore Giorgione: http://viaf.org/viaf/39385864/#Giorgione,_1477-1511 registi, come Woody Allen: http://viaf.org/viaf/59077912/#Allen,_Woody,_1935-.... attori, come John Wayne: http://viaf.org/viaf/37103799/#Wayne,_John,_1907-1979 musicisti, come Giuseppe Verdi: http://viaf.org/viaf/22329110/#Verdi,_Giuseppe,_1813-1901 ballerini e coreografi, come Rudolf Nureyev: http://viaf.org/viaf/148483/#Nureyev,_Rudolf,_1938-1993 cantanti, come Lady Gaga: http://viaf.org/viaf/49555103/#Lady_Gaga uomini di stato, come: Napoleone Bonaparte: http://viaf.org/viaf/106964661/#Napol %C3%A9on_I,_Emperor_of_the_French,_1769-1821 traduttori famosi di opere letterarie, come Ettore Capriolo: http://viaf.org/viaf/283936245/#Capriolo,_Ettore 4.IlVIAF
  43. 43. Che cos’è il VIAF 43 ☞ inoltre è una specie di anagrafe mondiale anche per: nomi di autori collettivi (enti, ecc.), come la Wikimedia Foundation: http://viaf.org/viaf/ 137022054/#Wikimedia_Foundation nomi geografici (solo di autorità politico territoriali), come la Regione Toscana: http://viaf.org/ viaf/130807311/#Tuscany_(Italy) titoli di opere, come Hamlet: http://viaf.org/viaf/176993890/ #Shakespeare,_William,_1564-1616._|_Hamlet 4.IlVIAF
  44. 44. Che cos’è il VIAF Il VIAF implementa Unicode e attualmente visualizza intestazioni che possono essere in un qualsiasi set di caratteri appartenenti ai diversi alfabeti usati dalle agenzie catalografiche che collaborano all'iniziativa: come latino; cirillico; arabo; israeliano; giapponese. Per es.: il VIAF è l’unico strumento che può rispondere alla domanda: quali forme del nome assume l’autore del Giardino dei ciliegi nei vari cataloghi mondiali? Quale è la forma preferita nella lingua e nell’alfabeto del catalogo nazionale del suo paese di origine? 44 4.IlVIAF
  45. 45. Che cos’è il VIAF Il VIAF implementa Unicode e attualmente visualizza intestazioni che possono essere in un qualsiasi set di caratteri appartenenti a 5 diversi alfabeti usati dalle agenzie catalografiche che collaborano all'iniziativa: latino; cirillico; arabo; israeliano; giapponese. Per es.: il VIAF è l’unico strumento che può rispondere alla domanda: quali forme del nome assume l’autore del Giardino dei ciliegi nei vari cataloghi mondiali? 45 Il VIAF come strumento di consultazione: le diverse forme del nome dell’autore del Giardino dei ciliegi nei vari cataloghi mondiali e in diverse traslitterazioni e alfabeti nel cluster 95216565 Il record del commediografo Anton Pavlovič Čehov in cirillico Il record del commediografo Anton Pavlovič Čehov dal catalogo SBN http://viaf.org/viaf/search?query=local.personalNames+all+%22cehov %22&sortKeys=holdingscount&recordSchema=BriefVIAF 4.IlVIAF
  46. 46. I cluster Il VIAF raccoglie insieme le diverse forme dei nomi in un “grappolo” di nomi che si riferiscono alla stessa entità: il “grappolo” è chiamato cluster 46 http://viaf.org/viaf/39382430/#Petrarca,_Francesco,_1304-1374 cluster del record di Francesco Petrarca rappresentato con un poligono stellato 4.IlVIAF
  47. 47. Come sono realizzati i cluster: due fasi Il procedimento per la clusterizzazione è basato su 2 fasi*: 1. i record originali forniti dalle biblioteche vengono “arricchiti” con informazioni ricavate dai record bibliografici che i contributori devono fornire insieme ai record di autorità: vengono così associati al record autore informazioni aggiuntive come titoli associati all'autore, il nome di eventuali coautori inserite in tag appositi del blocco 9XX. Il record viene definito enhanced 2. il confronto (matching) tra i record enhanced 47 * Informazioni ricavate da: Richard Bennett, et al. «VIAF (Virtual International Authority File) : Linking Die Deutsche Bibliothek and Library of Congress Name Authority Files». Relazione presentata alla Conferenza IFLA 2006, Seoul, Korea, 20–24 agosto 2006. http:// citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.150.5328&rep=rep1&type=pdf. Giulia Manzotti. «Analisi e riflessioni sul VIAF, Virtual International Authority File». JLIS.it 1.2 (2010): pp. 357–381. http://leo.cilea.it/index.php/jlis/article/view/4520. 4.IlVIAF
  48. 48. Come sono realizzati i cluster: l’algoritmo per il matching I cluster sono stati realizzati tramite procedure automatiche di confronto tra record (matching) basate su un algoritmo che confronta: 1. il nome: per stabilire in una prima fase di confronto la “compatibilità” 2. altre informazioni direttamente collegate all'autore, come le specificazioni cronologiche (date di nascita e morte o solo data di nascita) 3. altri dati ricavati dai record bibliografici associati alle notizie di autorità (titoli associati all'autore, il nome di eventuali coautori ecc.) 48 4.IlVIAF
  49. 49. Come sono realizzati i cluster del VIAF: esiti del matching L'esito della procedura di matching può essere duplice: 1. in caso di esito positivo il record fornito dall'agenzia catalografica viene aggregato a un cluster già esistente formato da uno o più record = cluster multirecord 2. in caso negativo, il record viene importato nel VIAF ma crea un nuovo cluster che contiene un unico record = cluster monorecord 49 4.IlVIAF
  50. 50. Come sono realizzati i cluster del VIAF: esiti del matching 50 ☞ Nel VIAF ci sono parecchi doppioni (cioè cluster monorecord, effetto di un matching negativo) ☞ il casi di matching negativo possono riguardare: 1. nomi forniti solo da una certa agenzia: il loro isolamento è corretto 2. nomi che avrebbero dovuto essere inclusi nei cluster già formati 4.IlVIAF
  51. 51. Come sono realizzati i cluster del VIAF: esiti del matching Le 3 variabili che contano: 1. la raffinatezza dell’algoritmo di matching 2. la qualità del record di autorità: dati che contiene e correttezza 3. i record bibliografici forniti 51 4.IlVIAF
  52. 52. Gli identificativi dei cluster Come in un’anagrafe si usa il codice fiscale come identificativo univoco delle persone fisiche, così nel VIAF ogni entità rappresentata da un cluster ha un proprio identificativo numerico. Per es.: Francesco Petrarca: 99258155 Lady Gaga: 49555103 52 4.IlVIAF
  53. 53. Uso degli identificativi dei VIAF cluster nei cataloghi di biblioteca 53 Diverse agenzie catalografiche che partecipano al VIAF, inseriscono nei loro authority files, per ogni record che hanno fornito, anche l'identificativo del cluster VIAF con cui è avvenuto il match e il relativo link che punta al cluster VIAF. Per es. Library of Congress, Bibliothèque Nationale de France, Biblioteca Nazionale Svedese Biblioteca della Dieta Nazionale del Giappone ☞ problema dell’authority file di SBN: non cita mai nei record il numero identificativo del record VIAF (i record di autorità SBN contengono un numero ISADN, inutile). SBN non è allineato alle pratiche internazionali che stanno emergendo in relazione al VIAF. 4.IlVIAF
  54. 54. 5. Il contributo italiano: SBN e VIAF Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  55. 55. La partecipazione dell’Italia al VIAF Avviene tramite l’ICCU che fornisce a OCLC per il VIAF i record di autorità provenienti dal catalogo SBN. 2009: inizio della partecipazione italiana al VIAF*. 55 5.SBNeilVIAF * Vedi le informazioni fornite nelle due pagine web dell’Istituto Centrale per il Catalogo Unico: «Attività internazionali: Virtual International Authority File (VIAF)» http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/internaz/pagina_367.html; Attività nazionali: Authority Control», http://www.iccu.sbn.it/opencms/opencms/it/main/attivita/naz/pagina_335.html .
  56. 56. La situazione dei record forniti dall’Italia al VIAF Nel caso dei record di autori personali forniti dall’Italia e provenienti dal catalogo SBN ci sono problemi di: 1. quantità dei record forniti 2. matching con i record già presenti nel VIAF A partire da fine 2013 la situazione è migliorata, tuttavia il report annuale 2014 sul VIAF realizzato da OCLC dimostra che la situazione dei record italiani nel VIAF è molto indietro rispetto a quella di altri paesi europei. 56 5.SBNeilVIAF
  57. 57. La situazione dei record da SBN dal 2009 a ottobre 2013: 57 ** Vedi i dati quantitativi pubblicati alla pagina: http://www.iccu.sbn.it/opencms/opencms/it/main/bd/index.html Secondo i dati aggiornati al gennaio 2015, i record di autorità autori sono: 3.911.525 autori (personali e collettivi). Quantità e percentuali di matching dei record italiani nel VIAF* 45.189 record forniti costituivano solo il 1,22% del totale dei record di autorità presenti nel catalogo SBN al giugno 2013: 3.714.476 ** ☞ I record italiani nel VIAF hanno creato cluster “doppioni” nell’87% dei casi = 39.215 record I problemi del matching nel caso dei record forniti dall’Italia * Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato al luglio 2013: OCLC. «2013 Annual Report to VIAF Council». 2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx. 5.SBNeilVIAF
  58. 58. La situazione del VIAF: confronto tra record SBN e da altri cataloghi a primavera 2013: 58 VIAF: totale 33.667.856 di record (al settembre 2013) Totale record di autorità SBN: 3.714.476 (al luglio 2013) VIAF Record da SBN che hanno avuto un match con almeno 1 altro record VIAF: 5.993 (= 13% dei record forniti) Record da SBN forniti al VIAF: 45.208 (= 1,2% del totale dei record di autorità SBN) 39.215 record sono cluster “isolati” Record da SBN nel VIAF 45.208 tra 2009-2013 (= solo 1,2% dei record autori in SBN) Germania ca. 10 milioni di record USA, Canada, UK ca. 9 milioni di record Portogallo Francia Spagna 5.SBNeilVIAF La situazione dei record forniti dall’Italia al VIAF
  59. 59. La situazione dei record forniti dall’Italia al VIAF La quantità limitata di record forniti inizialmente al VIAF dall’ICCU si spiega con la scelta di fornire solo i record con il livello massimo di autorità: AUF (livello 97) I livelli di catalogazione dei record autori in SBN sono ordinati secondo una progressione, da quello inferiore a quello più elevato: 04 REC = 05 MIN = 6–51 MED = 52–71 MAX = 72–90 SUP = 91–95 AUF = 97 Appartengono al livello AUF innanzitutto i record che sono stati sottoposti a specifiche procedure retrospettive di bonifica e arricchimento condotte a partire dagli anni 2001–2002 grazie al progetto Valorizzazione dell’Indice SBN.* 59 * Vedi: Cristina Magliano, «Direttive e metodologia per la creazione dell’authority file di SBN». In: Authority Control : definizioni ed esperienze internazionali : Atti del convegno internazionale, Firenze, 10–12 Febbraio 2003, a cura di Mauro Guerrini e Barbara B. Tillett. Firenze: Firenze University press, 2003, pp. 61–69. Il livello SUP in origine era riservato alle due Biblioteche Nazionali Centrali di Firenze e di Roma, ma da tempo anche in altri Poli vengono create notizie autori con quel livello. Il livello AUF è riservato ai componenti di un gruppo di lavoro attivo presso 14 istituzioni bibliotecarie della rete SBN. 5.SBNeilVIAF
  60. 60. La situazione dei record forniti dall’Italia al VIAF Al VIAF non erano stati forniti i record con livello di autorità inferiore a AUF. Mancavano, e mancano tutt’ora, per es. i seguenti autori: - Cesare Beccaria (in SBN livello MAX CFIV016390) - Marco Polo (in SBN livello MED CFIV028383) - Cecco Angiolieri (in SBN livello MIN CFIV078939) I record di questi autori erano presenti nel VIAF, ma mancava il record italiano, tutt’ora assente (al febbraio 2015). Inoltre fino alla fine del 2013 mancavano i record autori di livello SUP, come per es.: - Paolo Giordano (in SBN livello SUP UBOV259046) - Lorenzo Da Ponte (in SBN livello SUP UBOV259046) - Francesco Guicciardini (in SBN livello SUP CFIV004242) - Wu Ming (in SBN livello SUP TO0V385956) 60 5.SBNeilVIAF
  61. 61. Diverso esito del matching in base alla fonte di provenienza dei record 61 Tabella 2013 ordinata in ordine decrescente per percentuale di matching: i record da SBN hanno la più bassa percentuale di matching (solo 13%). Vedi il report: http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF-Annual-Report-to-VIAF-Council.docx. 5.SBNeilVIAF
  62. 62. Esempio di cluster doppioni nel 2013: i cluster relativi a Dante Alighieri 62 http://viaf.org/viaf/59080924/#Alighieri,_Dante http://viaf.org/viaf/97105654/ #Dante_Alighieri,_1265-1321 VIAF cluster: 97105654VIAF cluster: 59080924 1 sola bandiera: cluster monorecord poligono stellare: cluster multirecord come si presentava la situazione dei cluster relativi a Dante Alighieri nel 2013 5.SBNeilVIAF
  63. 63. Il miglioramento dopo la fine del 2013: 63 * Dati ricavati dalla tabella contenuta nel report annuale di OCLC, aggiornato ad agosto 2014: OCLC. «2014 Annual Report to VIAF Council». 2014. http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf Quantità e percentuali di matching dei record italiani nel VIAF nel 2014* ☞ miglioramenti a livello di: 2013 2014 Incremento Totale'authority'record'nel'VIAF 33.667.856 44.885.233 11.217.377 Fornitura'di'records'da'SBN 45.208 169.028 123.820 %'di'clusterizzazione'dei'record'da'SBN 13% 39% 1. quantità: 169.028 record forniti sono il 4,3% del totale dei record autori SBN (3.911.525 autori personali e collettivi, al gennaio 2015). Sono stati forniti anche i record di livello SUP. 2. percentuale di matching (riduzione dei record isolati): ca. 66.000 match con un cluster multirecord I problemi del matching nel caso dei record forniti dall’Italia 5.SBNeilVIAF
  64. 64. Diverso esito del matching in base alla fonte di provenienza dei record 64 Tabella 2014 ordinata in ordine decrescente per percentuale di matching: rispetto al 2013 i record da SBN hanno migliorato la percentuale di matching (dal 13% al 39%). Vedi il report: http://www.oclc.org/content/dam/oclc/viaf/OCLC-2014-VIAF-Annual-Report-to-VIAF-Council.pdf 5.SBNeilVIAF
  65. 65. 65 http://viaf.org/viaf/97105654/#Dante_Alighieri,_1265-1321 record proveniente da SBN è incluso nel cluster VIAF 97105654 e non forma più un cluster isolato (eliminato VIAF 59080924) Il cluster di Dante Alighieri: da fine 2013 è incluso in VIAF 97105654 5.SBNeilVIAF
  66. 66. Esempi:* 1. uomini politici: per es.: Barack Obama: 305358548 (invece di 52010985); ma anche Umberto <re d'Italia ; 1.>: 90291016 (invece di 262250334). 2. artisti: per es.: Paolo Uccello: 305358201 (invece di 39395712); 3. registi: per es.: Alfred Hitchcock: 305357650 (invece di 49226917); 4. attori, sia italiani che stranieri, per es.: Monica Bellucci, 90383682 (invece di 106993456); Brad Pitt 305358254 (invece di 12462881); Sergio Castellitto: 90302845 (invece di 37125646); Humphrey Bogart: 305358227 (invece di 68937671); 5. cantanti e altre persone di spettacolo: per es.: Mina: 268502285 (invece di 62360130); Jannacci: 90146253 (invece di 1128716); 66 Casi di record da SBN che creano doppioni nel VIAF * Ci sono poi casi di nomi che solo SBN ha fornito al VIAF e quindi è corretto che siano isolati in cluster monorecord. Per es. Bianca Berlinguer: VIAF 90107330. 5.SBNeilVIAF
  67. 67. 67 I dati comparativi dimostrano che la situazione italiana deve migliorare per avvicinarsi quella di altri paesi. Come migliorare 5.SBNeilVIAF è auspicabile: 1. una maggiore collaborazione tra chi gestisce SBN, l’ICCU e OCLC per risolvere i problemi della situazione italiana. 2. un piano strategico volto a una bonifica dell'authority file di SBN sfruttando le risorse disponibili difficile individuare attualmente una strategia fatta di priorità e di organizzazione del lavoro tramite il coordinamento delle risorse presenti nei Poli considerata la presenza nell’authority file SBN di casi di record di livello AUF come l'attore di spaghetti western John Ireland http:// id.sbn.it/af/IT%5CICCU%5CUBOV%5C015247 che si accompagna a casi di record molto più importanti, come Cesare Beccaria (liv. MAX) o Marco Polo (liv. MED) che sono tutt’ora in attesa di essere sottoposti a bonifica e portati a livello SUP o AUF, per poterli poi fornire al VIAF e renderli visibili nell’opac SBN, al livello della ricerca Voci di autorità.
  68. 68. 6. Wikipedia, OCLC e il VIAF Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  69. 69. 69 Il progetto GLAM lanciato dalla Wikimedia Foundation La collaborazione tra Wikipedia e le biblioteche inizia con la GLAM-Wiki Initiative (Galleries, Libraries, Archives, Museums with Wikipedia), un progetto nato nel 2010 come collaborazione tra la Wikimedia Foundation e istituzioni del settore cultural heritage*. * Wikipedia:GLAM/About <http://en.wikipedia.org/wiki/Wikipedia:GLAM/About> 6.Wikipedia,OCLCeilVIAF
  70. 70. 70 Il progetto GLAM lanciato dalla Wikimedia Foundation Obiettivo della GLAM-Wiki Initiative: “aiutare le istituzioni del settore cultural heritage a promuovere le loro collezioni su Wikipedia attraverso progetti realizzati in collaborazione con esperti redattori wikipediani” 6.Wikipedia,OCLCeilVIAF
  71. 71. 71 Il programma “Wikipedian in residence” Lo strumento concreto per realizzare la collaborazione consiste nel nominare un redattore esperto di Wikipedia che lavora con e dentro l’istituzione partner: il “Wikipedian in residence”.* * Sul programma “Wikipedian in residence” vedi: https://outreach.wikimedia.org/wiki/Wikipedian_in_Residence 6.Wikipedia,OCLCeilVIAF
  72. 72. 72 Maggio 2012: due redattori di Wikipedia vengono ingaggiati con il ruolo di "Wikipedian in Residence" per gestire progetti legati alle biblioteche: * Vedi: http://www.oclc.org/research/news/2012/05-22.html Il programma “Wikipedian in residence” Max Klein negli Stati Uniti presso OCLC* Andrew Gray in Gran Bretagna presso la British Library 6.Wikipedia,OCLCeilVIAF Oggi nessuno dei due lavora più come Wikipedian in residence.
  73. 73. 73 Il risultato pratico della collaborazione tra OCLC e Wikimedia riguarda il VIAF, Virtual International Authority File, e in particolare: 1. inizialmente l’inserimento di link da ogni cluster VIAF a una corrispondente voce nella Wikipedia inglese 2. successivamente Wikipedia è stata promossa al ruolo di contributore di record, alla pari di un’agenzia bibliografica 3. infine le voci biografiche di Wikipedia sono state arricchite con i link al VIAF OCLC e la collaborazione con Wikipedia per il VIAF 6.Wikipedia,OCLCeilVIAF
  74. 74. Il rapporto tra il VIAF e Wikipedia inizia nel 2012 quando OCLC inserisce nel VIAF, nella sezione About di ogni record cluster, un link che punta alla relativa voce di Wikipedia con la funzione di facilitare agli utenti l'accesso diretto a informazioni più complete sull'autore. 74 Inserimento di link esterni dai cluster VIAF a Wikipedia Sezione About del record 6.Wikipedia,OCLCeilVIAF
  75. 75. A seguito della adesione di OCLC alla GLAM Initiative, nel corso del primo semestre del 2012 OCLC decise di promuovere Wikipedia al livello di una vera e propria source di record equiparandola agli authority files delle agenzie catalografiche.* 75 * Attualmente solo 4 fonti non create da biblioteche alimentano il VIAF come source alla pari dei cataloghi delle biblioteche: la Union List of Artist Names del Getty Museum, la versione inglese di Wikipedia, il database ISNI, e la biblioteca digitale Perseus. Estate 2012: la svolta. Wikipedia da repertorio esterno a fonte del VIAF ☞ è una evoluzione di grande importanza: a Wikipedia viene riconosciuta la stessa autorevolezza di un catalogo di biblioteca 6.Wikipedia,OCLCeilVIAF
  76. 76. Il motivo per cui Wikipedia è stata elevata lo status di source è spiegato nel report annuale 2013 del VIAF:* poter sfruttare i dati identificativi presenti in Wikipedia (come quelli biografici, i titoli di opere citate nella voce dell’autore ecc.) in modo da poter migliorare la capacità aggregativa dei record VIAF cluster che tra le altre cose dipende anche dal numero di dati inseriti nel cluster, dato che la loro quantità aumenta le possibilità di ottenere un match con nuovi record in arrivo. 76 * OCLC. «2013 Annual Report to VIAF Council». 2013. http://www.oclc.org/content/dam/oclc/events/2013/viaf-council/OCLC-2013-VIAF- Annual-Report-to-VIAF-Council.docx. Perché Wikipedia viene promossa a source del VIAF 6.Wikipedia,OCLCeilVIAF
  77. 77. L’algoritmo di matching con cui è realizzato il clustering è facilitato dalla presenza di un maggior numero di record: «The efficiency of VIAF clusters is improved with the number of contributing files because of the nature of this matching. There can be situations where A matches B and B matches C, but C doesn’t match A, yet A,B,C are a cluster».* 77 * Vedi Maximilian Klein e Alex Kyrios, "VIAFbot and the Integration of Library Data on Wikipedia2, in: code{4}lib, n. 22, 2013, http:// journal.code4lib.org/articles/8964 Perché Wikipedia viene promossa a source del VIAF 6.Wikipedia,OCLCeilVIAF A B C all’interno del cluster non tutti i record hanno relazioni di matching tra di loro, ma questo non impedisce il clustering se non avessi avuto il record B che fa da anello intermedio, A e C non sarebbero nello stesso cluster
  78. 78. 78 Per poter trattare Wikipedia come una “fonte” di record, OCLC ricava dai dati presenti in ogni voce della versione inglese di Wikipedia dedicate ad autori personali un record (per ogni voce), strutturato in formato MARC. Questo “falso” record viene sottoposto alle procedure di matching già usate per gli altri record e che determinano l’inserimento del record in un certo cluster VIAF dove è identificato dalla sigla WKP. L’importazione dei “record” da Wikipedia nel VIAF 6.Wikipedia,OCLCeilVIAF
  79. 79. 79 Dalla voce di Wikipedia al record importato nel VIAF: Creazione di record da Wikipedia e importazione nel VIAF Record WKP: Luigi_Pirandello http://viaf.org/processed/WKP|Luigi_Pirandellohttp://en.wikipedia.org/wiki/Luigi_Pirandello Box dei dati biografici Titoli delle opere La voce di Wikipedia: Luigi_Pirandello 6.Wikipedia,OCLCeilVIAF
  80. 80. 80 Il record WKP ricavato dalla voce su Luigi Pirandello nella versione inglese di Wikipedia viene importato nel cluster VIAF insieme ai record forniti dai cataloghi delle biblioteche http://viaf.org/processed/WKP|Luigi_Pirandello Il record ricavato da Wikipedia viene importato nei cluster del VIAF http://viaf.org/viaf/64010465/#Pirandello,_Luigi,_1867-1936 Record cluster di Luigi Pirandello Record WKP da Wikipedia è compreso nel cluster 6.Wikipedia,OCLCeilVIAF
  81. 81. 1.135.025 record importati nel VIAF dalle voci della Wikipedia in lingua inglese. (ad agosto 2014; al luglio 2013 erano 1.075.291)* 81 Qualche dato numerico sui record importati nel VIAF * Totale voci di Wikipedia in lingua inglese: 4.728.038 a fine febbraio 2015. 6.Wikipedia,OCLCeilVIAF
  82. 82. Nell’estate 2012 OCLC decide di rendere reciproci i link VIAF / Wikipedia: 82 Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot da: VIAF → Wikipedia EN (solo link) a: VIAF (identificativi dei cluster) Wikipedia EN (voci di W) → ← VIAFWikipedia EN (record) → a: 6.Wikipedia,OCLCeilVIAF
  83. 83. 83 L’importazione dei “record” da Wikipedia nel VIAF Nelle voci di Wikipedia in lingua inglese viene inserito l’identificativo dello specifico cluster VIAF in cui è già stato importato anche il “falso” record WKP. Questo lavoro viene eseguito tramite una procedura automatica detta VIAFbot. ** VIAFbot Edits 250,000 Wikipedia Articles to Reciprocate All Links from VIAF into Wikipedia (7 dicembre 2012), http://www.oclc.org/research/ news/2012/12-07a.html Gli identificativi VIAF vengono inseriti in un template già esistente: {{authority control}}.* Nel 2012 il template {{authority control}} risultava già largamente usato dalla versione in lingua tedesca (in 220.000 voci) ma poco usato dalla versione in lingua inglese (in 4.000 voci). Fino a quel momento gli identificativi erano stati aggiunti “manualmente”. La nuova proposta intende invece usare una procedura automatica: il VIAFbot. La procedura è stata conclusa nel novembre 2012 e ha dato come risultato l’importazione di 250.000 identificativi di cluster VIAF all’interno delle relative voci della Wikipedia in lingua inglese.** * Wikipedia:Authority control: https://en.wikipedia.org/wiki/Wikipedia:Authority_control 6.Wikipedia,OCLCeilVIAF
  84. 84. 84 Autunno 2012: integrare l’authority control in Wikipedia con il VIAFbot * La proposta: Authority control integration è ora archiviata a: http://en.wikipedia.org/w/index.php? title=Wikipedia:Village_pump_(proposals)&oldid=499166049#Authority_Control_Integration Dopo aver raccolto i primi pareri sulla base di una bozza*, crea una pagina specifica che contiene una stesura più definita della proposta chiamata: “Authority control integration proposal” che sottopone a votazione. I pareri espressi su quella pagina non sono tutti favorevoli, ma prevalgono i pareri positivi.** ☞ In realtà OCLC “NON” decide nulla in maniera autonoma: si tratta di una proposta che Max Klein rivolge alla Community di Wikipedia pubblicandola nella apposita sezione per la discussione di nuove proposte: Village pump * La proposta viene approvata ma da allora la discussione non si è fermata perché i redattori di Wikipedia si confrontano su vari problemi. Vedi la pagina: Wikipedia talk:Authority control: https://en.wikipedia.org/wiki/Wikipedia_talk:Authority_control ** Wikipedia:Authority control integration proposal/RFC: http://en.wikipedia.org/wiki/Wikipedia:Authority_control_integration_proposal/RFC 6.Wikipedia,OCLCeilVIAF
  85. 85. Il progetto di importazione degli identificativi dei record VIAF si proponeva di: 85 Obiettivi dell’integrazione dell’authority control in Wikipedia 1. funzione identificativa: attribuire alle voci biografiche un identificativo autorevole che certificasse l’identificazione del soggetto della voce 2. facilitare il lavoro di creazione e manutenzione delle voci di Wikipedia collegando a un repertorio che contiene tante forme alternative dello stesso nome 3. creare link dalle voci di Wikipedia al VIAF: nel VIAF si possono trovare informazioni non contenute nell’enciclopedia, in particolare le forme autorizzate dei nomi, in diverse lingue e in diversi alfabeti, usate nei cataloghi di biblioteca di varie parti del mondo 4. utilizzare gli identificativi per creare servizi di redirect precisi, perché basati su identificativi, verso le voci di Wikipedia o verso altri servizi, come nel caso del servizio tedesco Wikipedia Personensuche: http://tools.wmflabs.org/persondata/index.php * 3. creare le premesse per costruire servizi di collegamento ai cataloghi delle biblioteche * Esempio di utilizzo del servizio di redirect Wikipedia Personensuche: utilizzando l’identificativo del record di autorità dell’authority file tedesco, è possibile creare una URL con una sintassi standard che porta a una pagina di snodo. Esempio con Galileo Galilei: authority record GND 118537229 http://tools.wmflabs.org/persondata/p/gnd/118537229 6.Wikipedia,OCLCeilVIAF
  86. 86. 86 Il posizionamento dell’authority control al fondo della voce 6.Wikipedia,OCLCeilVIAF i codici identificativi dei record di autorità funzionano anche da link esterni
  87. 87. A fine 2012 gli stessi dati sono stati importati anche in Wikidata* il database che contiene tutti i dati che sono condivisi dalle versioni di Wikipedia nelle diverse lingue. Nei record di Wikidata gli identificativi dei cluster VIAF sono diventati una specifica “proprietà”, identificata dal codice: P214** Al 26 febbraio 2015 il numero totale di identificativi dei record VIAF importati in Wikidata è pari a: 506.201.*** 87 L’importazione in Wikidata ** Vedi Wikidata: https://www.wikidata.org/wiki/Property:P214?uselang=en-gb *** Il dato si ricava utilizzando il Wikidata Query editor a: http://wdq.wmflabs.org/wdq/ l'apposita interfaccia di interrogazione del database Wikidata, e interrogandolo usando come parametro la presenza di P214. Produce una lista di tutti gli items di Wikidata che contengono la property P214: http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[214] * Wikidata: http://www.wikidata.org/wiki/Wikidata:Main_Page 6.Wikipedia,OCLCeilVIAF
  88. 88. Nella Wikipedia inglese è stata creata una pagina per la segnalazione di errori: Wikipedia: VIAF / errors: https://en.wikipedia.org/wiki/Wikipedia:VIAF/errors 88 Il lavoro di correzione manuale nella Wikipedia in lingua inglese Al momento contiene le seguenti tipologie di errori: 1. la voce di Wikipedia si riferisce a una persona diversa che non coincide con la parsona a cui fa riferimento l’identificativo VIAF 2. Due o più identificativi VIAF nella stessa voce 3. il VIAF ha messo insieme diverse identità in un unico cluster 4. Nel VIAF c’è più di un cluster per la stessa identità 5. Il link che all’interno del VIAF punta a un voce biografica di Wikipedia non è più aggiornato 6. Voci di Wikipedia dedicate a più di una persona, contengono l’identificativo VIAF solo per una di queste persone 7. Altri errori 6.Wikipedia,OCLCeilVIAF
  89. 89. Il problema dei numerosi doppioni creati dai record da SBN è quello che viene definito come: “Parallel VIAF clusters for one identity”: https://en.wikipedia.org/wiki/Wikipedia:VIAF/ errors#Parallel_VIAF_clusters_for_one_identity 89 Problemi degli identificativi VIAF in Wikipedia in lingua italiana 6.Wikipedia,OCLCeilVIAF
  90. 90. Tra fine 2012 e inizio 2013 l'identificativo VIAF è stato condiviso con le versioni di Wikipedia nelle altre lingue, tra cui la versione italiana.* Nel corso del primo semestre del 2013, circa 72.000 voci della versione italiana di Wikipedia sono state arricchite con gli identificativi provenienti dal VIAF utilizzando il VIAFbot.** A fine febbraio 2015 le voci della Wikipedia italiana popolate dal VIAF sono diventate 75.793. La lista completa in ordine alfabetico si trova alla pagina Categoria:Voci con codici di controllo di autorità.*** 90 * Sull'importazione degli identificativi VIAF in Wikipedia, vedi: Max Klein, «VIAFbot Debriefing», 28 November 2012. hangingtogether.org. http://hangingtogether.org/?p=2306 e «Library Data in Wikipedia and Wikidata», presentazione tenuta a EMEARC, 26 febbraio 2013, Strasbourg, France. http://www.slideshare.net/oclcr/library-data-in-wikipedia-and-wikidata?from_search=3. L’importazione degli identificativi VIAF in Wikipedia in lingua italiana ** Sull'importazione degli identificativi VIAF nella versione italiana di Wikipedia, vedi: GLAM/Newsletter/July 2013/Contents/Italy report: http://outreach.wikimedia.org/wiki/GLAM/Newsletter/June_2013/Contents/Italy_report. *** Vedi https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0.La lista viene aggiornata automaticamente in base alla presenza del template Controllo di autorità al fondo delle voci. 6.Wikipedia,OCLCeilVIAF
  91. 91. 7. Identificativi nazionali. Wikipedia e SBN Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  92. 92. Per i lettori di Wikipedia è importante anche poter avere link che puntano al proprio catalogo nazionale. 92 L’importazione di altri identificativi in Wikipedia EN e in altre versioni ☞ Importanza della cultura locale, sia in Wikipedia che negli authority files ☞ l’importazione automatica è stata resa possibile dal fatto che esisteva già l’identificativo internazionale VIAF che serviva a identificare la voce in cui importare l’identificativo nazionale A inizio 2013 sono stati importati in diverse versioni di Wikipedia gli identificativi dei record nazionali. 7.Glialtriidentificativi,WikipediaITeSBN
  93. 93. 93 Tra 2013 e 2014 sono aumentati considerevolmente i tipi diversi di identificativi per l’authority control ammessi in Wikidata: ora sono 104. Vedi: la tabella “Controllo di autorità” alla pagina Wikidata:Lista di proprietà/Generiche https://www.wikidata.org/wiki/Special:MyLanguage/Wikidata:List_of_properties/Generic I numerosi identificativi per l’authority control in WikiData 7.Glialtriidentificativi,WikipediaITeSBN
  94. 94. 94 A un anno di distanza dall’importazione del VIAF, la Wikipedia inglese ha arricchito la sezione Authority control che ora contiene vari identificativi e relativi link: • WorldCat (= WorldCat Identities) • VIAF • LCCN (= Library of Congress Control Number) • ISNI (= International Standard Name Identifier) • GND (= authority file tedesco: Gemeinsame Normdatei, o: Universal Authority File) • BNF (= Bibliothèque National de France) • ecc. L’importazione di altri identificativi in Wikipedia EN e in altre versioni 7.Glialtriidentificativi,WikipediaITeSBN
  95. 95. L’importazione dell’identificativo nazionale ha riguardato anche la versione italiana di Wikipedia. La presenza degli identificativi VIAF ha consentito l’importazione degli identificativi SBN in Wikidata e Wikipedia tramite una procedura automatica. A maggio 2013 è stata rivolta una proposta alla comunità di Wikipedia in lingua italiana a cui è seguita una discussione.* 95 L’importazione degli identificativi SBN nella versione italiana di Wikipedia * Vedi la proposta e la discussione alla pagina: https://it.wikipedia.org/wiki/Discussioni_template:Controllo_di_autorità#ICCU. 7.Glialtriidentificativi,WikipediaITeSBN
  96. 96. 96 L’importazione degli identificativi SBN nella versione italiana di Wikipedia 6.Glialtriidentificativi,WikipediaITeSBN Box dei 3 identificativi: - VIAF - LCCN - SBN
  97. 97. Per poter ottenere il match corretto tra una voce di Wikipedia (versione italiana), per es. la voce dedicata all’autore X e il relativo identificativo SBN, è stato usato come elemento di riferimento l’identificativo del cluster VIAF in cui è compreso anche l’identificativo Wikipedia del medesimo autore X, già importato anche nelle altre versioni di Wikipedia. Questo significa che la procedura automatica ha consentito di importare solo quegli identificativi SBN che a inizio 2013 non erano “isolati” nel VIAF ma avevano un match con un cluster VIAF multirecord che inoltre conteneva anche il record da Wikipedia: circa 1400 voci di Wikipedia in versione italiana sono state arricchite con l’identificativo del record SBN 97 L’importazione degli identificativi SBN nella versione italiana di Wikipedia ☞ questo spiega perché la procedura automatica iniziale ha potuto importare l’identificativo SBN solo in 1400 voci Problema di quantità e di matching 7.Glialtriidentificativi,WikipediaITeSBN
  98. 98. La situazione del VIAF: confronto tra record SBN e da altri cataloghi a primavera 2013: 98 VIAF: totale 33.667.856 di record (al settembre 2013) Totale record di autorità SBN: 3.714.476 (al luglio 2013) VIAF Record da SBN che hanno avuto un match con almeno 1 altro record VIAF: 5.993 (= 13% dei record forniti) Record da SBN forniti al VIAF: 45.208 (= 1,2% del totale dei record di autorità SBN) 39.215 record sono cluster “isolati” Germania ca. 10 milioni di record USA, Canada, UK ca. 9 milioni di record Portogallo Francia Spagna L’importazione degli identificativi SBN nella versione italiana di Wikipedia A inizio 2013 i record da SBN che avevano un match con un cluster VIAF multirecord che conteneva anche un record WKP erano un sottogruppo dei 5.993 record che avevano avuto un match con almeno 1 altro record 7.Glialtriidentificativi,WikipediaITeSBN Record da SBN nel VIAF 45.208 tra 2009-2013 (= solo 1,2% dei record autori in SBN)
  99. 99. La situazione dell’importazione degli identificativi nazionali in 4 versioni di Wikipedia al 3 ottobre 2013: 99 Situazione 2013 dell’importazione degli identificativi nazionali Wikipedia EN Germania Francia Italia LCCN [P244] GND [P227] BNF [P268] SBN [P396] 157.992 218.898 161.168 1.534 Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData Il numero di identificativi SBN importati automaticamente era di circa 1400. Con un successivo lavoro di aggiunta manuale tra l’estate e il settembre 2013, erano diventati 1534. 7.Glialtriidentificativi,WikipediaITeSBN
  100. 100. La situazione dell’importazione degli identificativi nazionali in 4 versioni di Wikipedia al 26 febbraio 2015: 100 Situazione inizio 2015 dell’importazione degli identificativi nazionali Wikipedia EN Germania Francia Italia LCCN [P244] GND [P227] BNF [P268] SBN [P396] 211.940 336.700 149.431 3.756 Nazione/Wikipedia/catalogo Identificativo del record N° identificativi in WikiData 7.Glialtriidentificativi,WikipediaITeSBN
  101. 101. La situazione del VIAF: confronto tra record da SBN e da altri cataloghi a inizio 2015: 101 VIAF: totale 44.885.233 di record (ad agosto 2014) Totale record di autorità autori in SBN: 3.911.525 (al gennaio 2015) VIAF Record da SBN che hanno avuto un match con almeno 1 altro record VIAF: ca. 66.000 (= 39% dei record forniti) Record da SBN forniti al VIAF: 169.028 (= 4,3% del totale dei record di autorità SBN) Germania ca. 10 milioni di record USA, Canada, UK ca. 9 milioni di record Portogallo Francia Spagna La composizione del VIAF a inizio 2015 A inizio 2015 i record da SBN che hanno un match con un cluster VIAF multirecord che contiene un record WKP (=da Wikipedia) sono un sottogruppo dei ca. 66.000 record che hanno avuto un match con almeno 1 altro record 7.Glialtriidentificativi,WikipediaITeSBN Record da SBN nel VIAF 169.028 nel 2014 (= solo 4,3% dei record autori in SBN)
  102. 102. Rimane un grosso scompenso nella Wikipedia italiana: a fine febbraio 2015: 75.793 VIAF ma solo 3.756 identificativi SBN Tenendo comunque conto che: 1. se un identificativo SBN non è entrato a far parte di un cluster VIAF nel quale è compreso anche l’identificativo WKP, non è importato in WikiData 2. 169.028 record forniti sono solo il 4,3% del totale dei record autori SBN (3.911.525 autori personali e collettivi, al gennaio 2015, e tutti i record con livello inferiore a SUP non sono stati forniti al VIAF 3. per una differenza nelle regole catalografiche, non sempre a un identificativo VIAF “può” corrispondere un identificativo SBN 102 Le criticità della importazione degli identificativi SBN 7.Glialtriidentificativi,WikipediaITeSBN
  103. 103. I problemi aperti: 1. il numero totale di identificativi importati rimane molto basso: il 4,3% del totale 2. non è chiaro come funzioni la sincronizzazione tra VIAF e Wikidata per quanto riguarda gli identificativi nazionali (questo nodo andrebbe chiarito prima di optare per l’inserimento manuale degli identificativi SBN, soluzione adottata nel biennio precedente dalle versioni francese e tedesca di Wikipedia) 3. soprattutto non è chiara la strategia della rete SBN in relazione alla manutenzione dell’authority file e quindi alla fornitura di record a OCLC per il VIAF 103 Le criticità della importazione degli identificativi SBN 7.Glialtriidentificativi,WikipediaITeSBN
  104. 104. 8. L’inserimento manuale in Wikidata Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  105. 105. L’aggiunta degli identificativi SBN si fa in Wikidata (non in Wikipedia). La procedura è semplice: 1. si cerca l’identificativo del record di autorità SBN nella sezione Ricerca voci di autorità dell’opac SBN a: http:// opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth 2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record 3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P396 (che nella struttura record di Wikidata corrisponde a: SBN Identifier). In alternativa alla digitazione del codice si può digitare direttamente in lettere: SBN identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del record SBN e si clicca sul link [save] 4. sotto all’identificativo SBN è necessario aggiunge la specificazione della fonte di provenienza del record di autorità. Si clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143 utile per specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato da” se si lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported from. Nel box di destra si inserisce il codice Q576951 utile per specificare la fonte e che corrisponde a: Servizio Bibliotecario Nazionale. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Servizio Bibliotecario Nazionale. Si clicca di nuovo sul link [save] A questo punto la procedura di inserimento dell’identificativo SBN è conclusa. 105 * Wikidata: https://www.wikidata.org/. Una volta aggiunto un identificativo SBN in Wikidata, una procedura automatica lo aggiunge alla relativa voce di Wikipedia. Come si inseriscono manualmente gli identificativi SBN 8.Illavorodafare
  106. 106. L’aggiunta degli identificativi VIAF si fa sempre in WikiData (non in Wikipedia). La procedura è semplice: 1. si cerca l’identificativo del cluster VIAF usando l’interfaccia di ricerca del VIAF a http://viaf.org/ Nel menù a tendina a sinistra Select Field si seleziona: Personal Names e se esiste più di un cluster VIAF si sceglie quello che al suo interno contiene il record da Wikipedia, identificato dalla icona con la lettera W e il codice WKP 2. in Wikidata* si fa una ricerca per nome di autore per trovare il relativo record 3. nel record di un autore in Wikidata, nella tabella della sezione chiamata “Statements” (o “Dichiarazioni” se si lavora in Wikidata con l’interfaccia in italiano), si scorre fino al fondo e si clicca dove compare il link [add]: comparirà una nuova riga (in azzurro): nel box a sinistra si digita il codice della property, in questo caso quindi si digita il codice P214 (che nella struttura record di Wikidata corrisponde a: VIAF Identifier). In alternativa alla digitazione del codice si può digitare direttamente in lettere: VIAF identifier. Si dà invio. A destra appare un altro box in cui si inserisce l’identificativo del cluster VIAF e si clicca sul link [save] 4. sotto all’identificativo del cluster VIAF è necessario aggiunge la specificazione della fonte di provenienza del record di autorità. Si clicca sul link [add reference]. Comparirà una nuova riga: nel box di sinistra si inserisce la Property: P143 utile per specificare l’etichetta: “imported from” (se si lavora nella versione in lingua inglese di Wikidata; o: “importato da” se si lavora nella versione in lingua italiana di Wikidata). In alternativa all’inserimento del codice si digita: imported from. Nel box di destra si inserisce il codice Q54919 utile per specificare la fonte e che corrisponde a: Virtual International Authority File. In alternativa alla digitazione del codice si può digitare direttamente in lettere: Virtual International Authority File. Si clicca di nuovo sul link [save] A questo punto la procedura di inserimento dell’identificativo VIAF è conclusa. 106 Come si inseriscono manualmente gli identificativi VIAF (se assenti) 8.Illavorodafare
  107. 107. Esempio con la voce dedicata a Elena Ferrante: https://it.wikipedia.org/wiki/Elena_Ferrante L’identificativo SBN è: ITICCURAVV076631 Manca l’identificativo del record SBN
  108. 108. 108 Tecnicamente è facile! 5.Glialtriidentificativi,WikipediaITeSBN Inserire nel campo il nome dell’autore L’identificativo del record SBN va cercato nell’opac SBN > Voci di autorità a: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth Ferrante, Elena
  109. 109. risultato della ricerca: cliccare sull’hyperlink per aprire la finestra con il record completo
  110. 110. identificativo del record SBN Selezionare l’identificativo del record, copiarlo e poi incollarlo in WikiData. ATTENZIONE: non copiare l’identificativo internazionale! Solo l’identificativo SBN.
  111. 111. Dalla voce di Wikipedia è possibile arrivare al relativo item di Wikidata cliccando su: Modifica link nella colonna di sinistra al termine dei link
  112. 112. In alternativa si fa una ricerca per nome in WikiData dall’apposito box
  113. 113. Il record dedicato a Elena Ferrante nel database di Wikidata a: https://www.wikidata.org/ wiki/Q368127
  114. 114. Per editare gli items di Wikidata bisogna prima autenticarsi (o registrarsi)
  115. 115. Per aggiungere l’identificativo SBN è necessario scorrere la tabella “Dichiarazioni” (“Statements”) fino al fondo e aggiungere una nuova riga dove inseriremo la nuova Proprietà: l’identificativo SBN. Cliccare sul link [add]
  116. 116. È stata aggiunta una nuova riga evidenziata in colore azzurro che contiene il nuovo campo utilizzabile per inserire una nuova Proprietà: nel nostro caso lo useremo per inserire nel nuovo campo vuoto il codice: P396 (che corrisponde alla proprietà SBN)
  117. 117. Nel box di sinistra inserire il codice P396. Quando lo si inserisce il sistema visualizza il valore che corrisponde al codice: SBN Identifier Con il mouse andare sopra il suggerimento e cliccare per selezionarlo. In alternativa alla digitazione del codice P396 possiamo digitare direttamente in lettere: SBN identifier (se si lavora con l’interfaccia in inglese) o identificativo SBN (se si lavora con l’interfaccia in italiano).
  118. 118. Nel campo di destra inserire l’identificativo del record SBN: nel caso di Elena Ferrante: ITICCURAVV076631
  119. 119. Cliccare sul link [save]
  120. 120. Aggiungere la fonte dell’identificativo appena inserito: cliccare sul link [add source]
  121. 121. Nel nuovo campo che è comparso, inserire il codice: P143 che corrisponde all’etichetta: imported from (se si lavora nella versione in lingua inglese di Wikidata, o: importato da se si lavora nella versione in lingua italiana di Wikidata). In alternativa alla digitazione del codice è possibile digitare direttamente in lettere: imported from oppure importato da (a seconda della lingua scelta per l’interfaccia di lavorazione).
  122. 122. Quando si inserisce il codice P143 il sistema visualizza un suggerimento in blu. Con il mouse andare sopra il suggerimento e cliccare per selezionarlo.
  123. 123. Nel campo di destra inserire il codice: Q576951 comparirà un suggerimento in blu che contiene la scritta: Servizio Bibliotecario Nazionale corrispondente al valore del codice inserito. Dare Invio per salvare l’identificazione della fonte del dato. In alternativa alla digitazione del codice è possibile digitare direttamente in lettere: Servizio Bibliotecario Nazionale.
  124. 124. cliccare sul link [save]
  125. 125. L’inserimento dell’identificativo e della fonte è completato.
  126. 126. l’identificativo del record SBN è stato aggiunto automaticamente alla voce in Wikipedia ☞ non occorre essere bibliotecari e tantomeno catalogatori 126
  127. 127. Una volta concluso l’inserimento in Wikidata, per ottenere che l'identificativo SBN sia visibile anche nella relativa voce di Wikipedia non bisogna fare nulla. Il template Controllo di autorità in Wikipedia è programmato per condividere automaticamente con Wikidata l'identificativo SBN, che quindi è immediatamente visibile in Wikipedia. Nel caso che una verifica in Wikipedia non desse risultato positivo, è possibile che: 1. ci sia un problema di cache: per pulire la cache della pagina e ricaricarla si usa la funzione "purge". Si proceda in questo modo: in Wikipedia, alla fine della URL della voce che abbiamo aperto, aggiungere: ?action=purge 2. oppure è possibile che il template Controllo di autorità non sia visibile. Questo succede se si tratta di una nuova voce a cui non è stato ancora aggiunto oppure per altri motivi. In ogni caso, per renderlo visibile è necessario aggiungerlo manualmente con una normale operazione di editing della voce di Wikipedia: ci si autentica, si clicca sul link in alto a destra Modifica wikitesto, si scorre il testo della pagina per posizionarsi al fondo della voce dove si aggiunge la seguente la stringa di caratteri: {{Controllo di autorità}} Quindi salvare e il template verrà visualizzato, popolato dagli identificativi presenti nel relativo item in Wikidata. 127 Gli identificativi SBN nelle voci di Wikipedia 8.Illavorodafare
  128. 128. 2. clic su Modifica wikitesto 1. autenticarsi 3. interfaccia per l’editing della voce 4. al fondo della voce aggiungere: {{Controllo di autorità}} 128
  129. 129. Come ottenere una lista aggiornata dinamicamente degli item di Wikidata dotati di identificativo SBN: 129 In Wikidata utilizzare il parametro: pagine che puntano alla proprietà [P396]* https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P396 8.Illavorodafare Lista dinamica degli item di Wikidata già dotati di identificativi SBN oppure, in Wikidata, nella pagina della Property 396: https:// www.wikidata.org/wiki/Property:P396 cliccare nel menù a sinistra sul link: What links here / Puntano qui
  130. 130. Come si ottiene una lista aggiornata dinamicamente degli item di Wikidata dotati di identificativo SBN: in Wikidata, nella pagina della Property 396: https://www.wikidata.org/wiki/Property:P396 130 8.Illavorodafare Lista dinamica degli item di Wikidata già dotati di identificativi SBN Cliccare su questo link
  131. 131. Stime sul lavoro manuale di aggiunta degli identificativi: 131 Il numero totale degli items relativi a nomi di persona ancora da arricchire è stimabile al 26 febbraio 2015 in < 354.612 * * Il totale di 354.612 items si ricava da una query di Wikidata impostata su 3 condizioni: avere una professione [P106], non avere l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214]. Se si volesse una lista di lavoro limitata a nomi italiani, il numero totale degli items relativi a nomi di persona ancora da arricchire sarebbe stimabile al 26 febbraio 2015 in ≤ 11.219 ** ** Il totale di 11.219 items si ricava da una query di Wikidata impostata su 3 condizioni: avere come paese di nascita l’Italia [P27:Q38], non avere l’identificativo SBN [P396] ma avere l’identificativo VIAF [P214]. 8.Illavorodafare Il lavoro che resta da fare: inserire gli identificativi SBN
  132. 132. Liste di lavoro aggiornate ricavabili da Wikidata: 132 1. Lista di item di Wikidata di tipo persona (= che hanno una professione [P106]), prive di identificativo SBN [P396] ma dotate di identificativo VIAF [P214] e con link a una voce nella Wikipedia italiana: CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki] 8.Illavorodafare Inserire manualmente gli identificativi SBN: il lavoro da fare 2. Lista di item di Wikidata di tipo persona, che hanno come paese di nascita l’Italia [P27:Q38], sono privi di identificativo SBN [P396] ma hanno l’identificativo VIAF [P214], e con link a una voce nella Wikipedia italiana: CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki] Oppure: 3. Lista di item di Wikidata che possiedono l’identificativo VIAF [P214], identificate in base al parametro: Pages that link to "Property:P214" (non contiene solo persone) https://www.wikidata.org/wiki/Special:WhatLinksHere/Property:P214 http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[106] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki] http://tools.wmflabs.org/autolist/autolist1.html?lang=it&q=CLAIM[27:38] AND CLAIM[214] AND NOCLAIM[396] AND LINK[itwiki]
  133. 133. Lista di lavoro ricavabile da Wikipedia: lista di quasi 76.000 voci, in ordine alfabetico, che hanno la sezione Controllo di autorità già popolata (perlomeno dall’identificativo VIAF). Questa lista si trova alla pagina: Categoria:Voci con codici di controllo di autorità e viene aggiornata automaticamente in base alla presenza in una voce della sezione Controllo di autorità*. Tuttavia, a differenza delle liste ricavabili da Wikidata, questa lista contiene sia voci che possiedono già l’identificativo SBN, sia voci che non lo possiedono. 133 8.Illavorodafare * Vedi: https://it.wikipedia.org/wiki/Categoria:Voci_con_codici_di_controllo_di_autorit%C3%A0 Inserire manualmente gli identificativi SBN: il lavoro da fare
  134. 134. Attenzione: In WikiData devono essere inseriti SOLO gli identificativi SBN che sono rintracciabili dall’Opac SBN nella sezione Ricerca voci di autorità*. Infatti solo per questi identificativi è attivo il servizio di risoluzione* che con l'aggiunta dell'identificativo del record SBN consente di creare hyperlink funzionanti da Wikidata/ Wikipedia all’opac SBN. Pertanto non devono essere inseriti identificativi di record di autorità SBN che sono rintracciabili solo usando un gestionale per SBN ( = tutti i record appartenenti a uno dei seguenti livelli: 04; REC (05), MIN (6–51), MED (52–71) e MAX (72–90) Se in Wikidata venissero inseriti identificativi SBN non rintracciabili con una ricerca dall’opac SBN, l’hyperlink nella relativa voce di Wikipedia porterebbe all’opac SBN che visualizzerebbe il messaggio: Nessun risultato trovato. 134 8.Illavorodafare * Da: http://opac.sbn.it/opacsbn/opac/iccu/authority.jsp?db=solr_auth Inserire manualmente gli identificativi SBN: il lavoro da fare ** Il servizio di risoluzione http://id.sbn.it/af/ che consente per es. di creare hyperlinks basati su URL con questa sintassi: http://id.sbn.it/af/IT/ ICCU/CFIV/009079
  135. 135. 135 Hyerlink all’opac SBN non funzionante nel caso del record Pinturicchio 8.Illavorodafare
  136. 136. 136 La pagina di istruzioni in Wikipedia 8.Illavorodafare Istruzioni per importare manualmente nelle voci di Wikipedia gli identificativi dei record di autorità utilizzati nel catalogo SBN: https://it.wikipedia.org/wiki/Progetto:GLAM/Biblioteche/VIAF/SBN
  137. 137. 137 Elenco dei nomi con identificativi SBN che non possono essere inseriti 8.Illavorodafare Elenco di identificativi SBN con livelli inferiori a SUP: https://it.wikipedia.org/wiki/Progetto:GLAM/ Biblioteche/VIAF/SBN/Elenco_autori_privi_di_identificativo_SBN_in_Voci_di_autorit%C3%A0_dell %27opac_SBN
  138. 138. 138 La pagina per discutere, confrontarsi, porre problemi 8.Illavorodafare La discussione sul template Controllo di autorità: http://it.wikipedia.org/wiki/ Discussioni_template:Controllo_di_autorit%C3%A0 se sono autenticato compaiono le segnalazioni sulle risposte ai miei interventi
  139. 139. 139 La pagina dei sondaggi sul Controllo di autorità 8.Illavorodafare Wikipedia:Sondaggi/Controllo di autorità: http://it.wikipedia.org/wiki/Wikipedia:Sondaggi/ Controllo_di_autorit%C3%A0
  140. 140. 9. Navigare da Wikipedia agli opac Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015
  141. 141. 141 L’inserimento nelle voci di Wikipedia degli identificativi nazionali dei record di autorità consente di ottenere dei link da Wikipedia agli opac di 2 diversi tipi: 1. link ai record di autorità negli authority files 2. link a liste di record bibliografici: sia per le opere “di” che per le opere “su” Da Wikipedia agli opac 9.NavigaredaWikipediaagliopac
  142. 142. L’identificativo da SBN è anche un link che consente di navigare verso l’Authority file dell’opac web di SBN e da qui alle notizie bibliografiche 142 La realizzazione dell'hyperlink è stata resa possibile grazie al lavoro dei tecnici dell'ICCU che con la supervisione di Giovanni Bergamin nel giugno 2013 hanno realizzato un risolutore http:// id.sbn.it/af/ che con l'aggiunta dell'identificativo SBN del record consente di creare un link permanente che punta a un record di autorità nella interfaccia web dell'opac SBN. Per es. la URL http://id.sbn.it/af/IT/ICCU/CFIV/009079 punta al record di autorità di Alessandro Manzoni nell'opac web SBN. Navigazione: dall’identificativo SBN al catalogo SBN 9.NavigaredaWikipediaagliopac
  143. 143. 143 Da Wikipedia agli opac La creazione di link a liste di record bibliografici è stata sviluppata dal bibliotecario americano John Ockerbloom* che ha creato 2 strumenti: 1. un apposito template da inserire nelle voci di Wikipedia: “Library resources box”, 2. un servizio di redirect basato su una knowledge base per poter creare link che a partire da una voce di Wikipedia, reindirizzano a vari cataloghi, a scelta del lettore. In questo modo si ottengono link a liste di opere “di” e liste di opere “su” un certo autore usando un identificativo nazionale.* * Vedi: John Ockerbloom, “From Wikipedia to our libraries”, in Everybody’s Libraries, 4 marzo 2013 http://everybodyslibraries.com/2013/03/04/from-wikipedia-to-our-libraries/ Il servizio di redirect è attivo dalla pagina FTL: Forward to Libraries: http://tools.wmflabs.org/ftl/cgi-bin/ftl 9.NavigaredaWikipediaagliopac
  144. 144. 144 Da Wikipedia agli opac: la soluzione Ockerbloom Esempio: la voce su Jane Austen nella versione inglese di Wikipedia con il “Library resources box” il template creato da Ockerbloom Jane Austen: https://en.wikipedia.org/wiki/Jane_Austen 9.NavigaredaWikipediaagliopac
  145. 145. 145 Esempio: dalla voce su Jane Austen nella versione inglese di Wikipedia è possibile grazie al 1: “Library resources box” navigare al 3: catalogo della National Library of Australia passando dal 2: servizio di redirect. Da Wikipedia agli opac: la soluzione Ockerbloom 1 3 2 9.NavigaredaWikipediaagliopac
  146. 146. 146 La soluzione di Ockerbloom basata su un servizio di redirect consente 3 vantaggi: 1. avere link diretti a liste di record bibliografici 2. invece di avere link che puntano solo al catalogo nazionale, consente di puntare a diversi cataloghi 3. consente all’utente di registrare la sua preferenza per linkare a un singolo catalogo tramite l’uso di cookie Da Wikipedia agli opac 9.NavigaredaWikipediaagliopac
  147. 147. 147 Gli identificativi dei record di autorirà importati nelle voci di Wikipedia possono servire anche per creare dei link precisi dai cataloghi di biblioteca a Wikipedia. Navigare dagli opac alle voci di Wikipedia Bisogna creare un servizio di redirect che consente di usare URL che riutilizzano gli identificativi dei record di autorità per puntare a voci specifiche di una certa versione di Wikipedia ☞ come creare link dagli opac a specifiche voci di Wikipedia? 9.NavigaredaWikipediaagliopac
  148. 148. 148 Navigare dagli opac alle voci di Wikipedia Nel caso di Wikipedia in lingua tedesca è già stato creato un servizio di redirect, Wikipedia Personsuche, che consente di inserire in qualsiasi Opac URL create usando come parametro specifico l’identifivativo nazionale del record di autorità puntando alla pagina di Wikipedia che contiene la voce di un autore. Es. nel caso di Galileo Galilei, è possibile creare una URL diretta usando l’identificativo 118537229 che nell’authority file tedesco GND (Gemeinsame Normdatei) passa alla Wikipedia in tedesco tramite un redirect: http://tools.wmflabs.org/persondata/p/gnd/118537229 9.NavigaredaWikipediaagliopac
  149. 149. 149 Pagina di Galileo Galilei in Wikipedia Personsuche: http://tools.wmflabs.org/persondata/p/gnd/ 118537229 9.NavigaredaWikipediaagliopac
  150. 150. 150 Nel caso di link dagli opac italiani alla versione italiana di Wikipedia, bisognerebbe creare un servizio di redirect analogo a quello tedesco in modo che possa gestire URL che impieghino come parametro l’identificativo SBN in questo modo: http://tools.wmflabs.org/persondata/p/sbn/IT%5CICCU%5CCFIV%5C009079 Dagli opac italiani alla versione italiana di Wikipedia Verrebbe facilitato il linking dagli opac delle biblioteche che lavorano in SBN a Wikipedia per consentire agli utenti di trovare altre informazioni sugli autori. 9.NavigaredaWikipediaagliopac
  151. 151. 151 Opac 1 Opac 2 Opac 3 Opac 4 Opac 5 Il funzionamento del servizio di redirect per gestire i link dai record negli opac a specifiche voci di Wikipedia dedicate ad autori: Servizio nazionale di Redirect (utilizza gli identificativi nazionali dei record di autorità) Wikimedia IT Link dagli opac a Wikipedia tramite un servizio di redirect 9.NavigaredaWikipediaagliopac
  152. 152. 152 Criticità del dialogo Wikipedia / Opac nel caso dell’Italia ☞ inserire anche nella versione italiana di Wikipedia un numero significativo di identificativi Problemi della situazione italiana da superare: 9.NavigaredaWikipediaagliopac Innanzitutto, per far dialogare Wikipedia con i cataloghi delle biblioteche sfruttando hyperlink precisi basati sugli identificativi dei record di autorità è necessario:
  153. 153. 153 ☞ Nuove sfide per le biblioteche: Problemi: 1. i bibliotecari sono pronti a ottimizzare i loro record catalografici per: essere importati insieme ad altri in un contesto internazionale? essere importati in un nuovo contesto come Wikipedia? 2. i nostri cataloghi sono “linkabili” dall’esterno anche al livello di singolo record e di liste di record? 9.NavigaredaWikipediaagliopac Il riuso dei dati catalografici: le sfide che pone al bibliotecario
  154. 154. 154 I nuovi problemi sono culturali, tecnologici, di visione del ruolo rinnovato del catalogo della biblioteca nell’era del Web e della necessità di aprire il catalogo al colloquio con sistemi esterni molto popolari tra gli utenti. ☞ nell’era del Web il catalogo non basta più, l’utente vuole più informazioni. Far dialogare Wikipedia e gli opac è un modo per rispondere a questa aspettativa. 9.NavigaredaWikipediaagliopac Il riuso dei dati catalografici: le sfide che pone al bibliotecario
  155. 155. Grazie Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei dati prodotti dalle biblioteche. “Wikidata. Riuso dati aperti tra Wikipedia e Biblioteche” Corso per AIB Toscana Università di Firenze, Biblioteca di Scienze sociali, Aula didattica 2 – 3 marzo 2015

×