1La conversione dei metadati del Thesaurus delNuovo soggettario nel formato SKOS/RDFProblematiche generaliAnna Lucarelli(B...
2Sommario• Nuovo soggettario:uno strumento di indicizzazione in colloquio con altri strumenti (diambito bibliotecario e no...
3Uno strumento italiano per l’indicizzazione semanticaDue settori della BNCF al lavoro:1. “Ricerche e strumenti di indiciz...
4I Prodottidel Nuovo soggettarioCorredo sintattico – applicativo• Note sintattiche• Manuale applicativo(on-line da febbrai...
5Il primo Thesaurus italiano generale (“universale”)• disponibile sul Web dal 2007: http://thes.bncf.firenze.sbn.it/ricerc...
6Uno strumento costruito in cooperazioneAccoglie e gestisce terminologia proposta da altre biblioteche, istituzioni, archi...
7Esempi di termini del Nuovo soggettarioche attivano interoperabilitàSTRUTTURA del RECORDDati gestionaliArea delle note e ...
8Linee di sviluppo del NS (2010-2013)1. Interoperabilità– metadati disponibili in:• Zthes dal 2007• SKOS/RDF dal 2010 http...
9SKOS per i Thesauri• Simple Knowledge Organisation Systemsviluppato dal W3C Semantic Web Deployment Working Group (SWDWG)...
10SKOS, i metadati e la terminologia del Web semanticoNellambito del web semantico non si è ancora raggiunto unconsenso ne...
11
12Etichette SKOSL’assegnazione di un valore univoco ai concetti facilital’interoperabilità tra KOS differenti, cioè la pos...
13Il Thesaurus del Nuovo soggettario nel formato SKOS• Prima mappatura nel 2010• Il lavoro ha seguito varie fasi ed è in c...
14Etichetta di nodo = skos:Collection
15Variante storica• raffinamento di skos:altLabelnsogi:obsoleteTerm
16Composizione / Scomposizione• In SKOS non è prevista la relazione tra concetti (Concept) e termini (Label)• Estensione S...
17Implementazione dei linked dataCome abbiamo potuto vedere dagli esempi mostrati, nel NS le corrispondenzepossono essere ...
18Equivalenze del Thesaurus attive (marzo 2013)Link tramite il campo Fonte (in odine decrescente)
19Equivalenze del Thesaurus attive (marzo 2013)skos:closeMatch
20Incremento delle equivalenze negli ultimi 6 mesi(ottobre 2012- marzo 2013)
21Pubblicazione dei dati e trasparenza informativa• Dati pubblicati open source: http://thes.bncf.firenze.sbn.it/thes-dati...
22Grazie per l’attenzioneAnna Lucarelli(Biblioteca Nazionale Centrale Firenze)anna.lucarelli@beniculturali.it
Upcoming SlideShare
Loading in...5
×

La conversione dei metadati del Thesaurus del Nuovo soggettario nel formato SKOS/RDF / Anna Lucarelli

1,058
-1

Published on

Conferenza tenuta presso la ex SSAB da Anna Lucarelli il 3-05-2013 nell'ambito del 7. ciclo "Biblioteche libri documenti: dall'informazione alla conoscenza", a.a. 2012-2013, Prof.ssa M.T. Biagetti

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,058
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

La conversione dei metadati del Thesaurus del Nuovo soggettario nel formato SKOS/RDF / Anna Lucarelli

  1. 1. 1La conversione dei metadati del Thesaurus delNuovo soggettario nel formato SKOS/RDFProblematiche generaliAnna Lucarelli(Biblioteca Nazionale Centrale Firenze)3 maggio 2013Università di Roma La SapienzaDip. Scienze Documentarie, Linguistico-Filologiche e Geografiche(blog.semantic-web.at)
  2. 2. 2Sommario• Nuovo soggettario:uno strumento di indicizzazione in colloquio con altri strumenti (diambito bibliotecario e non)• Dall’interoperabilità semantica a quella tecnica: evoluzione del NSnellottica del Web semantico• L’impiego dello standard SKOS per potenziarne linteroperabilità– Un work in progress– Le caratteristiche– I punti critici– Le nostre soluzioni attuali• Dati qualitativi e quantitativi della conversione in SKOS del Thesaurus
  3. 3. 3Uno strumento italiano per l’indicizzazione semanticaDue settori della BNCF al lavoro:1. “Ricerche e strumenti di indicizzazione semantica”2. “Servizi informatici”Il Nuovo soggettario concepito per• l’indicizzazione e la ricerca di risorse eterogenee• l’uso da parte biblioteche generali e specializzate• l’uso in ambito archivistico, museale, ecc.• l’integrazione con gli OpacUn apparato di regole semantiche e sintatticheUn sistema a più componenti
  4. 4. 4I Prodottidel Nuovo soggettarioCorredo sintattico – applicativo• Note sintattiche• Manuale applicativo(on-line da febbraio 2010)OPACArchivio dei soggettiAggiornamenti semestrali
  5. 5. 5Il primo Thesaurus italiano generale (“universale”)• disponibile sul Web dal 2007: http://thes.bncf.firenze.sbn.it/ricerca.phpda aprile 2013 con interfaccia anche in inglese• strumento “in progress”, in continua evoluzionead oggi oltre 47.800 terminidati quantitativi disaggregati• costruito secondo gli standard ISO• integrato con l’OPAC della BNCF• interoperabile con altri thesauri, con enciclopedie,ecc.• prevede accessi multilingue
  6. 6. 6Uno strumento costruito in cooperazioneAccoglie e gestisce terminologia proposta da altre biblioteche, istituzioni, archiviBiblioteca Naz. CentraleFirenzePrivatiIDEST (LIBER)ICCU - Istituto centrale per il catalogounico delle biblioteche italiane e per leInformaz. bibliograficheBiblioteche generali e special.UniversitarieMario Rostoni – LIUCUniversità di PisaUniversità degli studi di MilanoUniversità BocconiAltre bibliotecheBiblioteca Centrale GiuridicaAccademia della CruscaPolimodaReti di bibliotecheBiblioteche ecclesiasticheCOBISSDIAFCNRIstituto di Teoria e Tecnica dellaInformazione giuridica (ITTIG)Ambiti della cooperazione:1. proposte di terminologia per l’incremento del Thesaurus2. interoperabilità semantica e tecnicaIstituto EnciclopediaItaliana Treccani- Sopr. Archivistica Toscana- Cesvot
  7. 7. 7Esempi di termini del Nuovo soggettarioche attivano interoperabilitàSTRUTTURA del RECORDDati gestionaliArea delle note e altrielementiArea delle relazionistoricheArea delle relazionistandardArea del termineWeb semantico Motori di ricerca Mediatori BadantiQuesti esempi evidenziano collegamenti con altristrumenti come Thesauri, altri sistemi di indicizzazione (es.LCSH), Enciclopedie on-line, ecc.In particolare:•Web semantico DDC23 ; Wikipedia; Rameau; LCSH•Motori di ricerca proposto da Bocconi; relazioni recipr.LIUC /NS; da rdf: Treccani nonespone i dati in SKOS•Mediatori relazioni reciproche LIUC / NS•Badanti relazioni reciproche Acc. Crusca / NS
  8. 8. 8Linee di sviluppo del NS (2010-2013)1. Interoperabilità– metadati disponibili in:• Zthes dal 2007• SKOS/RDF dal 2010 http://thes.bncf.firenze.sbn.it/thes-dati.htm– Implementazione di collegamenti con altri strumenti onlinehttp://digitale.bncf.firenze.sbn.it/NS-SPARQL/ (pag.provvisoria)– uso del NS in ambiti non bibliotecari (es. opendata del Comune diFirenze; Cesvot)2. Indicizzazione (semi) automaticasviluppi in linea con quanto si sta realizzando in altri Paesinellambito dellindicizzazione
  9. 9. 9SKOS per i Thesauri• Simple Knowledge Organisation Systemsviluppato dal W3C Semantic Web Deployment Working Group (SWDWG)• SKOS si autodefinisce come data model– il suo oggetto non sono le cose (entità) ma i concetti e le gerarchieconcettuali presi in considerazione senza un diretto riferimento alle cose(entità)– I concetti sono considerati indipendentemente dalla loro espressionelinguistica/letteraleL’assegnazione di un valore univoco ai concetti facilita l’interoperabilitàtra KOS differenti, cioè la possibilità di mappare entità semantiche dischemi concettuali diversi• Utilizza il linguaggio RDF (Resource Description Framework)• Largamente usato per far migrare Thesauri esistenti (conformi a ISO)nel mondo dei Linked data
  10. 10. 10SKOS, i metadati e la terminologia del Web semanticoNellambito del web semantico non si è ancora raggiunto unconsenso nelluso della terminologia di settore. La tabella chesegue mostra concordanze e differenze di significati.Nella colonna di destra possibili usi italiani nella terminologiarelativa ai metadati, secondo una proposta elaborata da GiovanniBergamin
  11. 11. 11
  12. 12. 12Etichette SKOSL’assegnazione di un valore univoco ai concetti facilital’interoperabilità tra KOS differenti, cioè la possibilità di mappareentità semantiche di schemi concettuali diversi.A tale scopo, lo standard definisce alcune “etichette”Le relazioni thesaurali tra concetti vengono codificate con leseguenti “etichette”:skos:closeMatch / skos:exactMatch (differenti livelli di equivalenza)skos:broaderMatchskos:narrowerMatchskos:relatedMatch
  13. 13. 13Il Thesaurus del Nuovo soggettario nel formato SKOS• Prima mappatura nel 2010• Il lavoro ha seguito varie fasi ed è in continua evoluzioneLa Scomposizione non ha trovatoun’adeguata esplicitazione in SKOSHanno tutte trovato un’adeguataesplicitazione in SKOS– Collezioni / etichette di nodo– Relazione di variante storica(per termini che hanno cambiato forma)– Relazione di scomposizioneNote• Definizione• Scope note• History note• Fonti• DDC, ecc.Problemi incontratiNessun problema
  14. 14. 14Etichetta di nodo = skos:Collection
  15. 15. 15Variante storica• raffinamento di skos:altLabelnsogi:obsoleteTerm
  16. 16. 16Composizione / Scomposizione• In SKOS non è prevista la relazione tra concetti (Concept) e termini (Label)• Estensione SKOSXL ? Non abbiamo trovato applicazioni. Proposta unasoluzione nell’ambito del Thesaurus Eurovoc.
  17. 17. 17Implementazione dei linked dataCome abbiamo potuto vedere dagli esempi mostrati, nel NS le corrispondenzepossono essere attivate mediante:• “Citazione” nel campo “Fonte” dello strumento che si desidera collegare(es. Agrovoc, Treccani ecc).Se il “citato” è disponibile in SKOS/RDF, NS si arricchisce della relazioneskos:closeMatch• Indicazione esplicita di equivalenza nel campo apposito Equiv. LCSH(corrispettivi previsti da Library of Congress Subject Headings)Viene utilizzata la relazione closeMatch, concettualmente più ampia diexactMatch inizialmente impiegata• Viene creato sempre un deep link allo strumento “citato”• Le diverse scelte e “politiche” di LoC; BNF; DNB: es. Basque language
  18. 18. 18Equivalenze del Thesaurus attive (marzo 2013)Link tramite il campo Fonte (in odine decrescente)
  19. 19. 19Equivalenze del Thesaurus attive (marzo 2013)skos:closeMatch
  20. 20. 20Incremento delle equivalenze negli ultimi 6 mesi(ottobre 2012- marzo 2013)
  21. 21. 21Pubblicazione dei dati e trasparenza informativa• Dati pubblicati open source: http://thes.bncf.firenze.sbn.it/thes-dati.htm• Licenza Creative Commons(dati usabili liberamente purché ne venga citata la paternità BNCF)http://creativecommons.org/licenses/by/2.5/it/deed.it• Non imponiamo la registrazione a chi scarica il nostro SKOS (Agrovoc invecechiede di registrarsi prima di scaricare i dati)Il nostro interesse è che il Nuovo soggettario venga utilizzato:non vogliamo blindare lo strumento!!• Al momento possiamo:– Avere statistiche sugli accessi al server– Vedere quali e quanti utenti lo scaricano, anche mese per mese, anno per annoAnche nel mondo del Web semantico è importante lavorare sul pianodelle politiche oltre che delle tecnologie !! …..
  22. 22. 22Grazie per l’attenzioneAnna Lucarelli(Biblioteca Nazionale Centrale Firenze)anna.lucarelli@beniculturali.it
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×