La conversione dei metadati del Thesaurus del Nuovo soggettario nel formato SKOS/RDF / Anna Lucarelli
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

La conversione dei metadati del Thesaurus del Nuovo soggettario nel formato SKOS/RDF / Anna Lucarelli

  • 1,159 views
Uploaded on

Conferenza tenuta presso la ex SSAB da Anna Lucarelli il 3-05-2013 nell'ambito del 7. ciclo "Biblioteche libri documenti: dall'informazione alla conoscenza", a.a. 2012-2013, Prof.ssa M.T. Biagetti

Conferenza tenuta presso la ex SSAB da Anna Lucarelli il 3-05-2013 nell'ambito del 7. ciclo "Biblioteche libri documenti: dall'informazione alla conoscenza", a.a. 2012-2013, Prof.ssa M.T. Biagetti

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,159
On Slideshare
613
From Embeds
546
Number of Embeds
1

Actions

Shares
Downloads
10
Comments
0
Likes
0

Embeds 546

http://libriedocumenti.pbworks.com 546

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 1La conversione dei metadati del Thesaurus delNuovo soggettario nel formato SKOS/RDFProblematiche generaliAnna Lucarelli(Biblioteca Nazionale Centrale Firenze)3 maggio 2013Università di Roma La SapienzaDip. Scienze Documentarie, Linguistico-Filologiche e Geografiche(blog.semantic-web.at)
  • 2. 2Sommario• Nuovo soggettario:uno strumento di indicizzazione in colloquio con altri strumenti (diambito bibliotecario e non)• Dall’interoperabilità semantica a quella tecnica: evoluzione del NSnellottica del Web semantico• L’impiego dello standard SKOS per potenziarne linteroperabilità– Un work in progress– Le caratteristiche– I punti critici– Le nostre soluzioni attuali• Dati qualitativi e quantitativi della conversione in SKOS del Thesaurus
  • 3. 3Uno strumento italiano per l’indicizzazione semanticaDue settori della BNCF al lavoro:1. “Ricerche e strumenti di indicizzazione semantica”2. “Servizi informatici”Il Nuovo soggettario concepito per• l’indicizzazione e la ricerca di risorse eterogenee• l’uso da parte biblioteche generali e specializzate• l’uso in ambito archivistico, museale, ecc.• l’integrazione con gli OpacUn apparato di regole semantiche e sintatticheUn sistema a più componenti
  • 4. 4I Prodottidel Nuovo soggettarioCorredo sintattico – applicativo• Note sintattiche• Manuale applicativo(on-line da febbraio 2010)OPACArchivio dei soggettiAggiornamenti semestrali
  • 5. 5Il primo Thesaurus italiano generale (“universale”)• disponibile sul Web dal 2007: http://thes.bncf.firenze.sbn.it/ricerca.phpda aprile 2013 con interfaccia anche in inglese• strumento “in progress”, in continua evoluzionead oggi oltre 47.800 terminidati quantitativi disaggregati• costruito secondo gli standard ISO• integrato con l’OPAC della BNCF• interoperabile con altri thesauri, con enciclopedie,ecc.• prevede accessi multilingue
  • 6. 6Uno strumento costruito in cooperazioneAccoglie e gestisce terminologia proposta da altre biblioteche, istituzioni, archiviBiblioteca Naz. CentraleFirenzePrivatiIDEST (LIBER)ICCU - Istituto centrale per il catalogounico delle biblioteche italiane e per leInformaz. bibliograficheBiblioteche generali e special.UniversitarieMario Rostoni – LIUCUniversità di PisaUniversità degli studi di MilanoUniversità BocconiAltre bibliotecheBiblioteca Centrale GiuridicaAccademia della CruscaPolimodaReti di bibliotecheBiblioteche ecclesiasticheCOBISSDIAFCNRIstituto di Teoria e Tecnica dellaInformazione giuridica (ITTIG)Ambiti della cooperazione:1. proposte di terminologia per l’incremento del Thesaurus2. interoperabilità semantica e tecnicaIstituto EnciclopediaItaliana Treccani- Sopr. Archivistica Toscana- Cesvot
  • 7. 7Esempi di termini del Nuovo soggettarioche attivano interoperabilitàSTRUTTURA del RECORDDati gestionaliArea delle note e altrielementiArea delle relazionistoricheArea delle relazionistandardArea del termineWeb semantico Motori di ricerca Mediatori BadantiQuesti esempi evidenziano collegamenti con altristrumenti come Thesauri, altri sistemi di indicizzazione (es.LCSH), Enciclopedie on-line, ecc.In particolare:•Web semantico DDC23 ; Wikipedia; Rameau; LCSH•Motori di ricerca proposto da Bocconi; relazioni recipr.LIUC /NS; da rdf: Treccani nonespone i dati in SKOS•Mediatori relazioni reciproche LIUC / NS•Badanti relazioni reciproche Acc. Crusca / NS
  • 8. 8Linee di sviluppo del NS (2010-2013)1. Interoperabilità– metadati disponibili in:• Zthes dal 2007• SKOS/RDF dal 2010 http://thes.bncf.firenze.sbn.it/thes-dati.htm– Implementazione di collegamenti con altri strumenti onlinehttp://digitale.bncf.firenze.sbn.it/NS-SPARQL/ (pag.provvisoria)– uso del NS in ambiti non bibliotecari (es. opendata del Comune diFirenze; Cesvot)2. Indicizzazione (semi) automaticasviluppi in linea con quanto si sta realizzando in altri Paesinellambito dellindicizzazione
  • 9. 9SKOS per i Thesauri• Simple Knowledge Organisation Systemsviluppato dal W3C Semantic Web Deployment Working Group (SWDWG)• SKOS si autodefinisce come data model– il suo oggetto non sono le cose (entità) ma i concetti e le gerarchieconcettuali presi in considerazione senza un diretto riferimento alle cose(entità)– I concetti sono considerati indipendentemente dalla loro espressionelinguistica/letteraleL’assegnazione di un valore univoco ai concetti facilita l’interoperabilitàtra KOS differenti, cioè la possibilità di mappare entità semantiche dischemi concettuali diversi• Utilizza il linguaggio RDF (Resource Description Framework)• Largamente usato per far migrare Thesauri esistenti (conformi a ISO)nel mondo dei Linked data
  • 10. 10SKOS, i metadati e la terminologia del Web semanticoNellambito del web semantico non si è ancora raggiunto unconsenso nelluso della terminologia di settore. La tabella chesegue mostra concordanze e differenze di significati.Nella colonna di destra possibili usi italiani nella terminologiarelativa ai metadati, secondo una proposta elaborata da GiovanniBergamin
  • 11. 11
  • 12. 12Etichette SKOSL’assegnazione di un valore univoco ai concetti facilital’interoperabilità tra KOS differenti, cioè la possibilità di mappareentità semantiche di schemi concettuali diversi.A tale scopo, lo standard definisce alcune “etichette”Le relazioni thesaurali tra concetti vengono codificate con leseguenti “etichette”:skos:closeMatch / skos:exactMatch (differenti livelli di equivalenza)skos:broaderMatchskos:narrowerMatchskos:relatedMatch
  • 13. 13Il Thesaurus del Nuovo soggettario nel formato SKOS• Prima mappatura nel 2010• Il lavoro ha seguito varie fasi ed è in continua evoluzioneLa Scomposizione non ha trovatoun’adeguata esplicitazione in SKOSHanno tutte trovato un’adeguataesplicitazione in SKOS– Collezioni / etichette di nodo– Relazione di variante storica(per termini che hanno cambiato forma)– Relazione di scomposizioneNote• Definizione• Scope note• History note• Fonti• DDC, ecc.Problemi incontratiNessun problema
  • 14. 14Etichetta di nodo = skos:Collection
  • 15. 15Variante storica• raffinamento di skos:altLabelnsogi:obsoleteTerm
  • 16. 16Composizione / Scomposizione• In SKOS non è prevista la relazione tra concetti (Concept) e termini (Label)• Estensione SKOSXL ? Non abbiamo trovato applicazioni. Proposta unasoluzione nell’ambito del Thesaurus Eurovoc.
  • 17. 17Implementazione dei linked dataCome abbiamo potuto vedere dagli esempi mostrati, nel NS le corrispondenzepossono essere attivate mediante:• “Citazione” nel campo “Fonte” dello strumento che si desidera collegare(es. Agrovoc, Treccani ecc).Se il “citato” è disponibile in SKOS/RDF, NS si arricchisce della relazioneskos:closeMatch• Indicazione esplicita di equivalenza nel campo apposito Equiv. LCSH(corrispettivi previsti da Library of Congress Subject Headings)Viene utilizzata la relazione closeMatch, concettualmente più ampia diexactMatch inizialmente impiegata• Viene creato sempre un deep link allo strumento “citato”• Le diverse scelte e “politiche” di LoC; BNF; DNB: es. Basque language
  • 18. 18Equivalenze del Thesaurus attive (marzo 2013)Link tramite il campo Fonte (in odine decrescente)
  • 19. 19Equivalenze del Thesaurus attive (marzo 2013)skos:closeMatch
  • 20. 20Incremento delle equivalenze negli ultimi 6 mesi(ottobre 2012- marzo 2013)
  • 21. 21Pubblicazione dei dati e trasparenza informativa• Dati pubblicati open source: http://thes.bncf.firenze.sbn.it/thes-dati.htm• Licenza Creative Commons(dati usabili liberamente purché ne venga citata la paternità BNCF)http://creativecommons.org/licenses/by/2.5/it/deed.it• Non imponiamo la registrazione a chi scarica il nostro SKOS (Agrovoc invecechiede di registrarsi prima di scaricare i dati)Il nostro interesse è che il Nuovo soggettario venga utilizzato:non vogliamo blindare lo strumento!!• Al momento possiamo:– Avere statistiche sugli accessi al server– Vedere quali e quanti utenti lo scaricano, anche mese per mese, anno per annoAnche nel mondo del Web semantico è importante lavorare sul pianodelle politiche oltre che delle tecnologie !! …..
  • 22. 22Grazie per l’attenzioneAnna Lucarelli(Biblioteca Nazionale Centrale Firenze)anna.lucarelli@beniculturali.it