Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Le prospettive del riuso dei dati bibliografici con Wikibase
245 $aIl MARC è morto?$cKaren Coyle260 $c2000
• il problema p...
Le prospettive del riuso dei dati bibliografici con Wikibase
200 $aIl MARC deve morire$fRoy Tennant210$c2002
• quando il M...
Le prospettive del riuso dei dati bibliografici con Wikibase
La LC annuncia un nuovo formato per i dati bibliografici - Il...
Le prospettive del riuso dei dati bibliografici con Wikibase
RDF in Wikpedia
Giovanni Bergamin, Cristian Bacchi – Sfide e ...
Le prospettive del riuso dei dati bibliografici con Wikibase
web: dei documenti, dei dati, semantico
Il web si sta arricch...
Le prospettive del riuso dei dati bibliografici con Wikibase
Un anno fa: una proposta di sperimentazione per ..
• rivedere...
Le prospettive del riuso dei dati bibliografici con Wikibase
Quest’anno: una nuova ipotesi di lavoro
il modello di dati Wi...
Le prospettive del riuso dei dati bibliografici con Wikibase
Cosa sono WikiData e WikiBase
WikiData è una Knowledge-Base c...
Le prospettive del riuso dei dati bibliografici con Wikibase
Il funzionamento di WikiData dal punto di vista dell'utenza
G...
Le prospettive del riuso dei dati bibliografici con Wikibase
...puntano al medesimo Item WikiData, dove sono raccolti i “d...
Le prospettive del riuso dei dati bibliografici con Wikibase
Il WikiBase data-model
L'Item di WikiData è identificato da u...
Le prospettive del riuso dei dati bibliografici con Wikibase
Gli Item sono “descritti” mediante una serie di Statement
Gio...
Le prospettive del riuso dei dati bibliografici con Wikibase
Gli Statement fanno uso di Property, come avviene di consueto...
Le prospettive del riuso dei dati bibliografici con Wikibase
..ma gli Statement di WikiBase integrano la tripletta semanti...
Le prospettive del riuso dei dati bibliografici con Wikibase
Tutte le revisioni dell'Item sono conservate nella cronologia...
Le prospettive del riuso dei dati bibliografici con Wikibase
Test di caricamento MARC in WikiBase: il caso UNIMARC proveni...
Le prospettive del riuso dei dati bibliografici con Wikibase
I campi MARC sono archiviati come Statement, gli indicatori e...
Le prospettive del riuso dei dati bibliografici con Wikibase
Tutti gli elementi MARC (campi, indicatori e sottocampi) sono...
Le prospettive del riuso dei dati bibliografici con Wikibase
Il Fingerprint di ciascun Item contiene il BID del record
In ...
Le prospettive del riuso dei dati bibliografici con Wikibase
Ciascun campo (Statement) contiene la fonte (Source, Referenc...
Le prospettive del riuso dei dati bibliografici con Wikibase
I campi MARC contenenti voci di autorità sono gestiti con pun...
Le prospettive del riuso dei dati bibliografici con Wikibase
La voce della lista di autorità diventa un Item separato
L'id...
Le prospettive del riuso dei dati bibliografici con Wikibase
WikiBase gestisce il reindirizzamento nel caso di “sostituzio...
Le prospettive del riuso dei dati bibliografici con Wikibase
Viene conservata la cronologia di tutte le versioni degli Ite...
Le prospettive del riuso dei dati bibliografici con Wikibase
L'esposizione dei dati in RDF “puro”, utilizzando WikiBase si...
Le prospettive del riuso dei dati bibliografici con Wikibase
WikiBase può gestire molteplici modelli descrittivi nel medes...
Le prospettive del riuso dei dati bibliografici con Wikibase
WikiBase può gestire molteplici flussi di modifica: il protoc...
Le prospettive del riuso dei dati bibliografici con Wikibase
Perché una sperimentazione su larga scala potrebbe essere int...
Upcoming SlideShare
Loading in …5
×

Le prospettive del riuso dei dati bibliografici con Wikibase / Cristian Bacchi - Giovanni Bergamin

339 views

Published on

Intervento al Convegno Sfide e alleanze tra Biblioteche e Wikipedia 2, 27 novembre 2015 - Biblioteca Nazionale Centrale di Firenze https://it.wikipedia.org/wiki/Progetto:GLAM/Biblioteche/Progetti/Sfide_e_alleanze_tra_Biblioteche_e_Wikipedia_2

Published in: Technology
  • Be the first to comment

Le prospettive del riuso dei dati bibliografici con Wikibase / Cristian Bacchi - Giovanni Bergamin

  1. 1. Le prospettive del riuso dei dati bibliografici con Wikibase 245 $aIl MARC è morto?$cKaren Coyle260 $c2000 • il problema principale è che il MARC non è un formato largamente diffuso (mainstream format): è usato dalle biblioteche e solo dalle biblioteche. Non esistono applicazioni di uso comune (per esempio un browser) in grado di leggere il MARC • è questo un grosso problema? no, dato che rispetto ad altre istituzioni abbiamo grazie al MARC un enorme insieme di informazioni codificate http://www.kcoyle.net/marcdead.html Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 1 / 28
  2. 2. Le prospettive del riuso dei dati bibliografici con Wikibase 200 $aIl MARC deve morire$fRoy Tennant210$c2002 • quando il MARC è stato creato, i Beatles erano un gruppo innovativo e quelli che di noi allora c’erano facevano sfoggio di vestiti e pettinature imbarazzanti • il MARC è un anacronismo: è stato pensato quando le tecnologie informatiche erano totalmente diverse da quelle di ora • (anche se l’età non è sinonimo di obsolescenza tecnologica: per esempio la tecnologia della matita non è molto cambiata negli ultimi 40 anni) http://lj.libraryjournal.com/2002/10/ljarchives/marc-must-die Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 2 / 28
  3. 3. Le prospettive del riuso dei dati bibliografici con Wikibase La LC annuncia un nuovo formato per i dati bibliografici - Il post nel blog di Karen Coyle 2011 http://kcoyle.blogspot.it/2011/11/future-format-goals-and-measures.html Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 3 / 28
  4. 4. Le prospettive del riuso dei dati bibliografici con Wikibase RDF in Wikpedia Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 4 / 28
  5. 5. Le prospettive del riuso dei dati bibliografici con Wikibase web: dei documenti, dei dati, semantico Il web si sta arricchendo: • oltre a documenti fruibili dall’essere umano vengono pubblicati anche dati fruibili da applicazioni (si parla di web dei documenti e web dei dati) • i dati nel web possono diventare grazie a RDF “leggibili dalla macchina” • web semantico = web che ospita “dati leggibili dalla macchina” • molte le iniziative in questo campo delle biblioteche Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 5 / 28
  6. 6. Le prospettive del riuso dei dati bibliografici con Wikibase Un anno fa: una proposta di sperimentazione per .. • rivedere criticamente standard / pratiche / strumenti di produzione della informazione bibliografica (IB) alla luce di modelli di successo emergenti (Wikidata/Wikibase) • evitare la tentazione del n+1 standard • gestire una IB multilingue e “multistandard” (=punti di vista differenti, sedimentazione storica dei cataloghi) • contribuire al nuovo “inglese” dei dati (Baker) Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 6 / 28
  7. 7. Le prospettive del riuso dei dati bibliografici con Wikibase Quest’anno: una nuova ipotesi di lavoro il modello di dati Wikidata può: • ospitare l’attuale IB (UNIMARC, MARC21 ecc) senza perdite di informazioni • facilitare l’evoluzione dell’attuale IB verso “il formato bibliografico del futuro” Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 7 / 28
  8. 8. Le prospettive del riuso dei dati bibliografici con Wikibase Cosa sono WikiData e WikiBase WikiData è una Knowledge-Base collaborativa (“collaboratively edited knowledge base” o “free linked database”), mantenuta dalla WikiMedia Foundation e aperta in consultazione e modifica a utenti e robot automatizzati. WikiData svolge una funzione di archiviazione centrale dei “dati puntuali” (“structured data”, come date o luoghi) contenuti in altri progetti WikiMedia quali Wikipedia, Wikivoyage, Wikisource ed altri. La centralizzazione dei dati comuni è mirata a facilitare • la loro manutenzione, in modo indipendente dalle specificità dei diversi progetti Wikimedia (per esempio le diverse lingue) • ed il loro ri-utilizzo in nuovi contesti, con un'impostazione Linked Open Data. L'iniziativa è stata avviata da un gruppo di ricercatori di Wikimedia Deutschland, con il supporto della Paul Allen Institute for Artificial Intelligence, dal Gordon and Betty Moore Foundation e da Google. WikiBase è il software libero con il quale il servizio viene gestito Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 8 / 28
  9. 9. Le prospettive del riuso dei dati bibliografici con Wikibase Il funzionamento di WikiData dal punto di vista dell'utenza Gli articoli nelle differenti lingue di Wikipedia riguardanti Leonardo... Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 9 / 28
  10. 10. Le prospettive del riuso dei dati bibliografici con Wikibase ...puntano al medesimo Item WikiData, dove sono raccolti i “dati puntuali” Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 10 / 28
  11. 11. Le prospettive del riuso dei dati bibliografici con Wikibase Il WikiBase data-model L'Item di WikiData è identificato da un “Item Identifier”: un numero preceduto da una “Q” Nell'esempio: Q762 ...e dal Fingerprint: cioè Label, Alias e Description nelle diverse lingue I puntatori alle diverse pagine dei progetti WikiMedia sono gestiti nella sezione Link dell'Item Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 11 / 28
  12. 12. Le prospettive del riuso dei dati bibliografici con Wikibase Gli Item sono “descritti” mediante una serie di Statement Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 12 / 28
  13. 13. Le prospettive del riuso dei dati bibliografici con Wikibase Gli Statement fanno uso di Property, come avviene di consueto nelle triplette del web-semantico Le Property, come gli Item, sono identificate con Fingerprint e descritte con Statement Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 13 / 28
  14. 14. Le prospettive del riuso dei dati bibliografici con Wikibase ..ma gli Statement di WikiBase integrano la tripletta semantica con Qualifier descritti anch'essi con Property e Target: qualificano l'informazione e Source (“Reference”) anche questi descritti con Property e Target: indicano la fonte dell'informazione Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 14 / 28
  15. 15. Le prospettive del riuso dei dati bibliografici con Wikibase Tutte le revisioni dell'Item sono conservate nella cronologia, e rimangono sempre accessibili Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 15 / 28
  16. 16. Le prospettive del riuso dei dati bibliografici con Wikibase Test di caricamento MARC in WikiBase: il caso UNIMARC proveniente da SBN Replica in WikiBase di tutto il dettaglio informativo del record bibliografico unimarc La sperimentazione qui descritta mirava ad ottenere, come base per futuri ri-utilizzi dei dati, una replica in WikiBase di tutto il dettaglio informativo del record bibliografico UNIMARC (così come esposto dall'Indice-2). Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 16 / 28
  17. 17. Le prospettive del riuso dei dati bibliografici con Wikibase I campi MARC sono archiviati come Statement, gli indicatori ed i sotto-campi come Qualifier Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 17 / 28
  18. 18. Le prospettive del riuso dei dati bibliografici con Wikibase Tutti gli elementi MARC (campi, indicatori e sottocampi) sono mappati con specifiche Property Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 18 / 28
  19. 19. Le prospettive del riuso dei dati bibliografici con Wikibase Il Fingerprint di ciascun Item contiene il BID del record In questo modo i record/Item potranno essere individuati in base all'identificativo assegnato nel sistema di origine. Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 19 / 28
  20. 20. Le prospettive del riuso dei dati bibliografici con Wikibase Ciascun campo (Statement) contiene la fonte (Source, Reference) da cui proviene il dato Vengono registrati, con apposite Property: • l'istituzione da cui proviene il record, con un puntatore ad un Item a sé • il puntatore al record originale, con permanent URL alla fonte Un apposito campo/Qualifier registra l'esatto ordine dei sottocampi di origine Nella sperimentazione, i Target testuali degli Statement (campo) contenenti Qualifier (sottocampi) sono compilati semplicemente con l'elenco dei sottocampi (esclusi quelli contenenti codici) con un separatore. In prospettiva si potrebbe implementare l'inserimento della punteggiatura ISBD. Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 20 / 28
  21. 21. Le prospettive del riuso dei dati bibliografici con Wikibase I campi MARC contenenti voci di autorità sono gestiti con puntatori ad Item esterni Nell'Item del record bibliografico, per gestire le intestazioni ai nomi si registrano • il puntatore all'Item esterno (si noti che WikiBase espone automaticamente la Label dell'Item collegato) • e i dati specifici come il Relator-code dell'intestazione al nome Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 21 / 28
  22. 22. Le prospettive del riuso dei dati bibliografici con Wikibase La voce della lista di autorità diventa un Item separato L'identificativo della voce di autorità (in questo caso il VID) viene registrato nel Fingerprint dell'Item. I “sottocampi descrittivi” del nome sono registrati come Statement, sempre con apposite Property Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 22 / 28
  23. 23. Le prospettive del riuso dei dati bibliografici con Wikibase WikiBase gestisce il reindirizzamento nel caso di “sostituzioni” (“schiacciamenti”) di Item Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 23 / 28
  24. 24. Le prospettive del riuso dei dati bibliografici con Wikibase Viene conservata la cronologia di tutte le versioni degli Item (con il riferimento agli autori delle modifiche) Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 24 / 28
  25. 25. Le prospettive del riuso dei dati bibliografici con Wikibase L'esposizione dei dati in RDF “puro”, utilizzando WikiBase si ottiene for-free Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 25 / 28
  26. 26. Le prospettive del riuso dei dati bibliografici con Wikibase WikiBase può gestire molteplici modelli descrittivi nel medesimo Item: ogni elemento è qualificato Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 26 / 28
  27. 27. Le prospettive del riuso dei dati bibliografici con Wikibase WikiBase può gestire molteplici flussi di modifica: il protocollo si basa su API pubbliche e documentate Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 27 / 28
  28. 28. Le prospettive del riuso dei dati bibliografici con Wikibase Perché una sperimentazione su larga scala potrebbe essere interessante. Questi i punti da considerare • le potenzialità di collaborazione del modello Wiki; • organizzazione dei dati pronta per RDF/Linked data; • organizzazione dei dati “multistandard” (fonte e qualificatori); • capacità nativa di trattare i dati in ambiente multilingua; • forte integrazione con il web; • disponibilità dei dati (in lettura e in scrittura) con protocolli aperti (SPARQL, API Wiki*, ecc); • disponibilità di software e di programmi di utilità aperti con una larga base di sviluppo/sperimentazione a livello mondiale; Giovanni Bergamin, Cristian Bacchi – Sfide e alleanze tra biblioteche e Wikipedia, 2, BNCF, 27 novembre 2015 28 / 28

×