Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Biblioteche digitali, Web e Linked Data

831 views

Published on

Carlo Meghini
14 ottobre 2013
Seminario di Cultura Digitale, Università di Pisa

Published in: Education
  • Be the first to comment

Biblioteche digitali, Web e Linked Data

  1. 1. Biblioteche Digitali, Web e Linked Data Carlo Meghini Istituto di Scienza e Tecnologie della Informazione Consiglio Nazionale delle Ricerche – Pisa
  2. 2. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Outline 1 Introduzione 2 Biblioteche Digitali 3 Il web 4 I Linked Data 5 Conclusioni 2 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  3. 3. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Introduzione Biblioteca Digitale: un’app per l’acquisizione di conoscenza da fonti digitali. Un’evoluzione della nozione di biblioteca, così come l’abbiamo sempre conosciuta: deposito −→ app libri −→ fonti digitali Si possono fare alcuni distinguo: l’app del meteo non è una BD lo scopo non è sempre e solo professionale (per esempio, l’intrattenimento) La conoscenza é il bene che una BD gestisce e rende fruibile attraverso i suoi servizi. 3 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  4. 4. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Collocazione Le biblioteche sono materia di studio (da molto tempo) delle discipline umanistiche. Biblioteconomia: http://it.wikipedia.org/wiki/Biblioteconomia I sistemi informativi digitali, per contro, sono nel dominio dell’informatica. Dove si collocano le biblioteche digitali? Le BD sono al centro di una disciplina che tratta dei metodi per il trattamento (acquisizione, memorizzazione, documentazione, accesso, e conservazione) con strumenti digitali delle risorse informative (digitali, ma non solo). Elementi di questa disciplina si posso individuare in varie aree dell’informatica, dell’archivistica, dell’information science, e altre ancora. Ma la disciplina che raccoglie e tratta organicamente tutti questi argomenti al momento non si vede. 4 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  5. 5. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Esito Nonostante le BD potessero contare su un retroterra culturale vasto, la loro natura interdisciplinare ha determinato incomunicabilità tra le comunità coinvolte. Questo non è accaduto per l’intelligenza artificiale, in cui informatici, logici, fisici, psicologi, linguisti e persino filosofi hanno saputo creare una comunità che si è data obiettivi e strumenti condivisi. Oggi l’intelligenza artificiale è una disciplina molto solida, con un curriculum molto ben definito e supportato da una comunità scientificamente molto forte. Le comunità delle BD non hanno saputo fare altrettanto, creando o quantomeno convergendo verso una visione condivisa di cosa dovesse essere una BD. Di conseguenza: i ricercatori lavorano in tante direzioni diverse in modo non organico chi ha costruito i sistemi ha lavorato “dal basso” adottando di volta in volta gli strumenti più disparati, spesso lavorando a mani nude. 5 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  6. 6. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Nello stesso lasso di tempo, le basi di dati o l’information retrieval hanno sviluppato un corpus di conoscenze e di tecnologie molto solido. Il risultato è che esistono: molte BD (alcune note come repository istituzionali) qualche prototipo di Digital Library Management System ma non una vera e propria tecnologia delle BD. Anche il corpus delle conoscenze teoriche è molto frammentato. Le BD non hanno molto da offrire alle nuove sfide che emergono: data infrastructures e-government, e-health, . . . cyber-physical infrastructures 6 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  7. 7. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Breve (e parziale) storia 1994: Digital Library Initiative, Phase 1 (6 projects) 1994: The First Annual Conference on the Theory and Practice of Digital Libraries (College Station, Texas) 1997: First European Conference on Digital Libraries (Pisa) 1999: Digital Library Initiative, Phase 2 (24 projects) 1999, 2000 – 2003, 2004 – 2007: DELOS Working Group, later Network of Excellence in Digital Libraries (Pisa) 2006: BRICKS Integrated Project 2009: Europeana, primo prototipo 2010: Europeana, prima versione L. Candela, D. Castelli, P. Pagano. "History, Evolution and Impact of Digital Libraries". Iglezakis, I.; Synodinou, T.-E. & Kapidakis, S. (eds.) e-Publishing and Digital Libraries: Legal and Organizational Issues, IGI Global, 2011 7 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  8. 8. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni L’informatica nella BD Uno degli aspetti più controversi riguarda la divisione dei ruoli tra gli attori che concorrono alla costruzione di una BD, e soprattutto l’individuazione del dominio dell’informatica. Si tratta dividere lo spazio dei problemi da risolvere in tre parti: 1 la riserva, dove l’informatico opera autonomamente 2 i confini, dove l’informatico collabora con gli altri attori 3 la zona out, dove l’informatico non deve entrare. L’identificazione della conoscenza come bene primario trattato da una BD permette di definire chiaramente queste tre aree. 8 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  9. 9. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Confine Il confine è l’area in cui gli informatici elicitano i requisiti dai destinatari dei servizi. L’elicitazione è un dialogo che porta a specificare: tipologia di conoscenza da rappresentare servizi relativi a tale conoscenza interfacce utente per l’accesso a tali servizi. È di gran lunga il compito più difficile: l’utenza ha un problema ma non conosce a sufficienza l’informatica per determinare come risolverlo l’informatico ha una serie di strumenti ma non conosce a sufficienza il problema per determinare quale proporre 9 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  10. 10. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Nelle BD il problema è aggravato dal fatto che i destinatari dei servizi (gli addetti della BD, detti anche digital librarian): non parlano il linguaggio della modellistica informatica (problema di comunicazione) sono formati su determinati modelli della conoscenza, e su determinate pratiche, e vogliono vedere questi modelli e queste pratiche implementate tout cour. Casi tipici: le gerachie degli archivisti e i cataloghi dei bibliotecari. L’UML è il linguaggio di comunicazione tra l’informatico e il digital librarian, cui è richiesto di sapere la modellazione semantica. 10 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  11. 11. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni 11 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  12. 12. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Outline 1 Introduzione 2 Biblioteche Digitali 3 Il web 4 I Linked Data 5 Conclusioni 12 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  13. 13. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Biblioteche Digitali Volendo essere più specifici sull’aspetto tecnico, una BD offre un insieme di servizi su un insieme di contenuti digitali a un insieme di utenti. Abbiamo tre tipologie di risorse principali. Vedremo che non sono le uniche. 13 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  14. 14. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Contenuti Digitali I contenuti digitali sono le risorse che contengono la conoscenza della BD. La conoscenza può essere rappresentata in diversi linguaggi. Una classificazione concettualmente semplice dei contenuti di una BD può essere basata sul modo in cui questi esprimono la conoscenza: contenuti in cui la conoscenza è rappresentata in linguaggio naturale: testo, immagini ferme o in movimento, messaggi audio, audio-visuali, e aggregazioni complesse. Questi contenuti includono: oggetti del dominio (opere letterarie, brani musicali, dipinti, film, etc.) risultato di digitalizzazione o born-digital ontologie informali del dominio, ossia lessici e glossari in linguaggio naturale, possibilmente in più lingue, con i relativi dizionari testi o saggi usati per la formazione nel dominio articoli scientifici usati per lo scambio di conoscenze tra i ricercatori del dominio 14 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  15. 15. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni contenuti in cui la conoscenza è rappresentata in linguaggi artificiali: espressioni di logiche per la rappresentazione della conoscenza. Questi contenuti includono: oggetti del dominio (datasets stratigrafici di scavi archeologici, tabelle di dati su fenomeni fisici inviate dai satelliti) ontologie formali di dominio (soggettari, tassonomie, vocabolari, liste controllate, etc.) Un BD può anche avere contenuti non digitali. L’aspetto qualificante sono i servizi digitali. Ovviamente, i servizi digitali di una BD sono meno efficaci se non possono essere applicati ai contenuti (ricerca per contenuto, ri-uso, scambio, etc.). 15 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  16. 16. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Utenti Gli utenti sono i soggetti per i quali vengono implementati i servizi della BD. Un utente può essere naturale o artificale: se naturale può essere un individuo o un gruppo di individui se artificiale può essere un’organizzazione, un ente giuridico, una BD, il web, e in generale tutto ciò che esprime un determinato insieme di requisiti omogenei che la BD accoglie e soddisfa. 16 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  17. 17. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Una divisione più utile degli utenti si basa sul ruolo che un utente può assumere: produttori della conoscenza, quindi fornitori dei contenuti digitali della BD. I produttori variano, possono essere: gli esperti del dominio che alimentano la BD con le loro opere gli studiosi del dominio (ricercatori, accademici) che lavorano ad accrescere la conoscenza del dominio sensori (montati su satelliti, su postazioni fisse terrestri, o su postazioni mobili) della BD che fanno pervenire la conoscenza attraverso una rete di comunicazione possibilmente su larga scala servizi interni della BD che aggiungono conoscenza attraverso processi inferenziali servizi esterni (sistemi di acquisizione automatica, di notificazione, etc.) 17 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  18. 18. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni consumatori della conoscenza, quindi i fruitori della conoscenza. Questi possono essere caratterizzati in: consumatori casuali, che accedono ai servizi in modo occasionale designated community della BD, cioè i consumatori ufficiali, per i quali la BD esiste e svolge il suo lavoro. La designated community è una categoria definita dal modello OAIS, uno standard ISO per la conservazione a lungo termine. An identified group of potential Consumers who should be able to understand a particular set of information. L’enfasi è su understand, un concetto chiave nella conservazione a lungo a termine ma anche in molti altri servizi della BD. Vedremo più avanti perché la designated community è fondamentale in una BD. 18 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  19. 19. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Servizi Possiamo distinguere due categorie di servizi in una BD: servizi di base, realizzano la acquisizione, memorizzazione, accesso e conservazione a lungo termine della conoscenza. Sono quelli che dovrebbeo essere offerti da un DLMS, perché comuni a tutte le applicazioni, analogamente ai servizi offerti da un SQL engine di un database relazionale. servizi applicativi, sono i servizi specifici per la designated community della BD, e variano di volta in volta. Per esempio, una BD per dati medicali potrebbe offrire il servizio di analisi di immagini mediche, mentre una BD sui manoscritti medievali potrebbe fornire un servizio di ricerca per similarity sulla scrittura manuale. 19 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  20. 20. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Le tre dimensioni di una BD non sono fra di loro indipendenti: molti servizi dipendono dai contenuti su cui sono offerti ma dovrebbero dipendenre anche dall’utenza cui sono offerti. Personalizzazione: lo stesso servizio si comporta in maniera diversa per utenti diversi. Non è solo un problema di adattabilità della GUI, ma di comportamento del servizio (caso delle interrogazioni). 20 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  21. 21. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Risorse ausiliarie La realizzazione dei servizi richiede di gestire un’ampia serie di risorse che possiamo considerare ausiliarie, ma che non per questo sono meno importanti. Sono risorse ausiliare quelle che supportano (ad esempio): la comunicazione tra utenti e sistema (reti, display, GUI) l’accesso controllato alle risorse della BD (liste di controllo di accesso, meccanismi di autenticazione, diritti digitali, ecc.) la privatezza e la riservatezza dei contenuti (encryption, ecc.) le operazioni di discovery (indici dei motori di ricerca) Le BD si distinguono da altri sistemi informativi per aver posto l’enfasi fin dall’inizio su una specifica risorsa ausiliaria, che svolge un ruolo fondamentale in una BD, e cioè la conoscenza di supporto, rappresentata nei metadati. 21 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  22. 22. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni I metadati Letteralmente, i metadati sono “dati sui dati”. Più specificamente, i metadati sono espressioni linguistiche che rappresentano conoscenza relativa a risorse della BD e necessaria ai servizi della BD. Fare da metadato è un ruolo dipendente dal contesto. Il saggio di Nabokov sul Don Chisciotte può essere dato in una BD di saggi letterari e metadato in una BD sulle opere di Cervantes. Un’immagine digitale di un’eclissi solare può essere dato in una BD di supporto a un canale educativo e metadato in una BD di astrofisica che contiene osservazioni grezze per esempio da satellite. Come si distingue un dato da un metadato in una BD? Le risorse informative che appartengono al dominio della BD, o ne sono rappresentazioni dirette sono il contenuto della BD. Le risorse che invece si riferiscono o sono “a proposito” (about) le risorse di dominio, sono metadati, e così via. 22 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  23. 23. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Anche i metadati possono espressi in linguaggio naturale o in linguaggio artificiale. I più sono in linguaggio artificiale, per poter essere utilizzati in maniera diretta dai servizi. I metadati in linguaggio formale sono espressioni (variamente camuffate) di una logica, dette record, ciascuna costituita da tre parti: 1 una descrizione (un predicato a un posto) romanzo di Walter Scott in lingua inglese pubblicato da Penguin scrittore nato a Trieste nel 1861 2 un identificatore univoco di una una risorsa individuale, (un simbolo di costante) il numero N di inventario di un certo libro il codice fiscale CF di una persona 3 l’associazione della descrizione all’identificatore (predicazione) N è un romanzo di Walter Scott in lingua inglese pubblicato da Penguin CF è uno scrittore nato a Trieste nel 1861 23 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  24. 24. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni La gestione dei metadati richiede una serie di altre strutture di supporto che esprimono diversi tipi di conoscenza: tassonomia −→ classificazione sistematica dei termini di un settore thesaurus −→ relazioni lessicali tra i termini di un linguaggio vocabolario −→ conoscenza lessicale su uno specifico linguaggio authority file −→ conoscenza su persone o gruppi che collaborano alla creazione delle risorse della BD gazetteer −→ conoscenza lessicale su termini geografici ontologia −→ concettualizzazione di uno specifico dominio 24 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  25. 25. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Le logiche descrittive sono strumenti ideali per rappresentare i metadati e le strutture di supporto, e le operazioni fondamentali su di essi: concetti atomici: classi, predicati unari (romanzo, scrittore, inglese) ruoli; proprietà, predicati binari (autore di, in lingua, pubblicato da, nato a, nato nel) individui: identificatori (Walter Scott, Penguin, Trieste, 1861, N, CF) concetti: descrizioni (scrittore nato a Trieste nel 1861) sub/super-concetto: tassonomia di classi (romanzo – opera) sub/super-ruolo: tassonomia di proprietà (amico di – conosce) asserzioni individuali: predicazione (è uno) assiomi terminologici: ontologie sussunzione: sotto-concetto implicito instance-checking: predicazione implicita (query answering) Ampio insieme di risultati e strumenti da utilizzare nelle BD. 25 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  26. 26. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Esistono varie categorie di metadati. Una classificazione classica (Marcia Zeng, Univ. Kent): Descriptive metadata: describes a resource for purposes such as discovery and identification. It can include elements such as title, abstract, author, and keywords. Structural metadata: indicates how compound objects are put together, for example, how pages are ordered to form chapters. Administrative metadata: provides information to help manage a resource, such as when and how it was created, file type and other technical information, and who can access it. There are several subsets of administrative data; two that are sometimes listed as separate metadata types are: Rights management metadata, which deals with intellectual property rights, and Preservation metadata, which contains information needed to archive and preserve a resource. 26 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  27. 27. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Preservation metadata according to OAIS: Content Information Representation Information interpreted using Data Object interpreted using Physical Object Digital Object Preservation Description Information Reference Information Provenance Information Context Information Fixity Information Archival Information Package further described by Packaging Information delimited byderived from * described by identifiesPackage Description 1 Structure Information Semantic Information adds meaning Figure 4-18: Archival Information Package (Detailed View) 27 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  28. 28. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Representation Information: l’informazione che serve alla ricostruzione del significato del contenuto a partire dalla sua rappresentazione digitale: Structural Information: dal bit al segno Semantic Information: dal segno al significato Quale segno, e quale significato? Quelli comprensibili alla designated community. il linguaggio della designated community è il linguaggio in cui deve essere spiegato il contenuto della BD la conoscenza condivisa della designated community fissa il limite alla ricorsione della representation information. L’intepretazione della informazione è un problema centrale delle BD, non solo degli archivi per la conservazione a lungo termine, quindi una funzione essenziale dei metadati di una BD. 28 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  29. 29. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Alcune opinioni personali sui metadati (absit iniuria verbis) Classificare i metadati, e soprattutto imbrigliarli in formati predefiniti e chiusi è una delle molte inutili rigidità che la tradizione bibliotecaria e archivistica vogliono imporre al mondo delle BD. Le BD hanno bisogno di un modello dell’informazione minimo e flessibile, che renda possibile: considerare descrizioni risorse, dotate di loro una propria identità creare descrizioni liberamente prendendo a prestito i necessari termini (classi, proprietà) dai formati appropriati usare descrizioni liberamente per creare record di metadati: la relazione tra risorse e descrizioni è m:n una descrizione è una risorsa quindi può essere a sua volta descritta. 29 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  30. 30. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Outline 1 Introduzione 2 Biblioteche Digitali 3 Il web 4 I Linked Data 5 Conclusioni 30 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  31. 31. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Il web Il web è oggi la più grande piattaforma di distribuzione di servizi mai costruita. Il nucleo della piattaforma del web (URI, HTML, HTTP) è scaturito dal requisito di condividere la conoscenza tra persone, che in estrema sintesi è lo stesso requisito cui risponde una BD. Il web è basato sull’HTML, un linguaggio per l’espressione di iper-testi, ossia di testi strutturati e corredati da link che permettono di associare tra loro porzione di iper-testi anche diversi. L’HTML è quindi un linguaggio formale per esprimere conoscenza in linguaggio naturale. Nel disegno iniziale, il web era un complemento alle biblioteche tradizionali: un mezzo per accedere velocemente e in modo ubiquo a conoscenza rappresentata in oggetti digitali non reperibili in biblioteca: report, memo, bozze di tesi o di articoli scientifici in lavorazione. 31 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  32. 32. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Il web è stato pensato fin dall’inizio per scalare: ogni ricercatore o gruppo di ricerca che voleva partecipare al gioco poteva farlo in modo (concettualmente) semplice: installando un web server su una macchina connessa in rete (dotata del software richiesto e opportunamente configurata), associandolo a un dominio e popolandolo con le risorse che si volevano condividere. Il risultato era una BD molto rudimentale: contenuti: iper-testi in stile monastico servizi: accesso diretto (URL) o navigazione (link) utenti: tutti (potenzialmente, ma in pratica pochi e frustrati) 32 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  33. 33. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Il web di oggi è molto meno rudimentale. Sono cresciuti gli strumenti: HTML (5) è un linguaggio molto potente, con cui è possibile costruire documenti iper-mediali, che includono codice per interfacce molto sofisticate o per scatenare servizi i servizi si sono moltiplicati, e fra questi quelli sulla conoscenza, primi fra tutti i web search engines. Ma soprattutto è cresciuta la base della conoscenza rappresentata (in linguaggio naturale) sul web o accessibile dal web attraverso servizi. Questo ha fatto sì che si allargasse la base di utenza del web: di fatto, il web è la BD cui tutti noi ci rivolgiamo ogni giorno per acquisire la conoscenza di cui abbiamo bisogno per svolgere le nostre attività lavorative e non. 33 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  34. 34. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Rispetto a una BD, il web soffre di una limitazione essenziale: il mancato trattamento della conoscenza formalmente rappresentata. La limitazione agisce su due fronti: sul fronte dei contenuti: viene a mancare un medium espressivo che può essere utile agli umani o alle macchine per l’implementazione di servizi applicativi. sul fronte dei metadati: non è possibile associare alle risorse disponibili sul web le descrizioni formali (metadati) che supportino servizi essenziali, quali: interpretazione discovery semantica curation Il medium in cui è espressa la conoscenza rappresenta una barriera all’uso effettivo della conoscenza. 34 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  35. 35. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Ci sono due modi per superare questa limitazione: estrarre la conoscenza dal web così come esso è, elaborando il linguaggio naturale, le immagini, il video creare accanto al web della conoscenza informalmente espressa, un web della conoscenza formalmente espressa, il web semantico Mentre la ricerca ha lavorato più sul primo approccio, il W3C ha creduto nel secondo, e da circa 15 anni sta lavorando a definire linguaggi e strumenti che possano servire a realizzare la visione del web semantico. 35 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  36. 36. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Architettura del Web semantico   36 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  37. 37. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Il linguaggio più semplice per rappresentare la conoscenza nel semantic web è il Resource Description Framework (RDF). RDF deriva dalle reti semantiche, che erano strumenti per la rappresentazione della conoscenza degli anni 70, ed è poco espressivo: URI e letterali come costanti individuali predicati binari enunciati ground o con variabili esistenzialmente quantificate congiunzione Ma permette di usare i simboli di predicato come simboli di costante. Inizialmente introdotto per annotare pagine web, RDF è stato successivamente esteso in due diverse riprese: RDF Vocabulary (Property, type) RDF Schema: gerarchie di classi e di proprietà, vincoli sul dominio e sul range delle proprietà. Notazione ufficiale: XML, in particolare lo schema RDF/XML. 37 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  38. 38. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Semplice grafo RDF ex:zampanò ex:gelsomina ex:tromba ex:suona ex:ascolta ex:Uomo ex:Donna rdf:type rdf:type "Gelsomina"^^http://www.w3.org/ 2001/XMLSchema#string foaf:name foaf:birthday "1935-03-02"^^http://www.w3.org/ 2001/XMLSchema#date 38 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  39. 39. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Semplice tassonomia ex:Persona ex:Mammifero ex:Donna rdfs:subClassOf ex:Uomo ex:Animale rdfs:subClassOf rdfs:subClassOf rdfs:subClassOf 39 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  40. 40. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Oggi l’RDF è uno strumento ampiamente utilizzato per la rappresentazione della conoscenza formale nelle BD, per diverse ragioni: semplice ricco abbastanza per i record dei metadati (ma senza record) RDFS permette di esprimere le strutture di supporto, dalle tassonomie fino alla semplici ontologie flessibile abbastanza per consentire il riuso di termini da qualsiasi vocabolario in qualsiasi contesto gli URI e la notazione XML costituiscono una base lessicale ideale per una BD: namespaces: liste controllate di termini, globalmente unici, con controllo decentralizzato URI HTTP sono deferenziabili sono in aumento i vocabolari RDF per le BD, per es. SKOS interoperabilità con il web e con le altre BD disponibilità di tool per XML e per RDF 40 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  41. 41. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Nell’architettura del web semantico ci sono anche le logiche descrittive (DL). Le DL sono il frutto di una ricerca iniziata negli anni 90 con lo scopo di dare un fondamento logico e computazionale alle reti semantiche. Il risultato è una contaminazione tra la logica matematica del primo ordine e le reti semantiche: 1 sintassi simile ma meno espressiva della sintassi della logica 2 semantica direttamente derivata da quella della logica. Le DL poggiano su una base matematica molto solida. Due benefici: sviluppo di una serie di strumenti quali i dimostratori (Pellet, Racer) o ambienti di lavoro (Protegé ) analisi computazionale delle DL (sono quasi tutte decidibili, ma intrattabili) e riduzione di alcune logiche ad altre già conosciute. 41 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  42. 42. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Le DL sono state a lungo uno strumento di nicchia, conosciuto solo dagli addetti ai lavori e utilizzato in poche applicazioni. Il W3C ha recepito la necessità di portare le DL nell’architettura del semantic web, e per questo ha lanciato lo sviluppo di un linguaggio appostio. Dopo qualche tentativo iniziale, oggi questo linguaggio è l’Ontology Web Language (OWL). OWL è una famiglia di logiche descrittive, che comprende tre profili: OWL 2 EL is particularly useful in applications employing ontologies that contain very large numbers of properties and/or classes. OWL 2 QL is aimed at applications that use very large volumes of instance data, and where query answering is the most important reasoning task. OWL 2 RL is aimed at applications that require scalable reasoning without sacrificing too much expressive power. Notazione ufficiale: XML, in particolare lo schema OWL/XML 42 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  43. 43. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Outline 1 Introduzione 2 Biblioteche Digitali 3 Il web 4 I Linked Data 5 Conclusioni 43 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  44. 44. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni I Linked Data Per realizzare la visione del web semantico serve anche un meccanismo per integrare la conoscenza formalmente espressa nel web, rispettandone i principi e le assunzioni di base, per garantire la continuità. Principio di base: un web server implementa un servizio fondamentale (GET dell’HTTP) che riceve in input un URI e restituisce in output una rappresentazione della risorsa identificata dall’URI ricevuto. A representation is data that encodes information about resource state. (Web architecture) Nel web, la rappresentazione è tipicamente un documento HTML. Grazie alla content negotiation, la rappresentazione può essere fornita in formati diversi, in realtà un qualsiasi formato MIME. 44 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  45. 45. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Questa visione offre un modo molto semplice per integrare conoscenza formale nel web: considerare le rappresentazioni formali della conoscenza (descrizioni, metadata record, ontologie) come risorse web, identificate da URI considerare un grafo RDF come una representation di una rappresentazione formale della conoscenza usare il web server per servire representation di rappresentazioni formali della conoscenza. 45 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  46. 46. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni I 4 principi dei Linked Data 1 Use URIs as names for things 2 Use HTTP URIs, so that people can look up those names 3 When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) 4 Include links to other URIs, so that they can discover more things Tre di queste raccomandazioni riguardano la rappresentazione della conoscenza, in particolare richiedono di usare RDF come linguaggio di rappresentazione usare URI HTTP come simboli di costante e simboli di predicato minimizzando l’uso di letterali e nodi bianchi (variabili q.e.). La terza raccomandazione riguarda l’associazione tra un URI e la conoscenza formalmente rappresentata relativa a questo URI. 46 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  47. 47. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni In altre parole, come si rendono dereferenziabili gli URI di rappresentazioni formali della conoscenza. Ci sono due strategie. Una di queste si basa sulla re-direzione. 1 The client performs a HTTP GET request on a URI identifying a real-world object or abstract concept. It sends an Accept: application/rdf+xml header along with the request 2 The server answers using the HTTP 303 See Other response code and sends the client the URI of a Web document that describes the real-world object or abstract concept in the requested format (cioè, l’URI di un metadata record). 3 The client now performs an HTTP GET request on this URI returned by the server. 4 The server answers with a HTTP response code 200 OK and sends the client the requested document, describing the original resource in the requested format. 47 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  48. 48. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni È importante quindi distinguere una risorsa dalle sue rappresentazioni, e nei Linked data si usano n+1 diversi URIs: 1 per la risorsa e uno ciascuno per ognuna delle sue n rappresentazioni: http://biglynx.co.uk/people/dave-smith la persona http://biglynx.co.uk/people/dave-smith.rdf la conoscenza formalmente rappresentata sulla persona http://biglynx.co.uk/people/dave-smith.html La seconda strategia è più diretta, e usa l’identificatore di frammento per accedere a una rappresentazione formale. Per esempio: http://biglynx.co.uk/vocab/sme#SmallMediumEnterprise identifica un insieme di triple RDF che descrivono il termine SmallMediumEnterprise nel vocabolario http://biglynx.co.uk/vocab/sme 48 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  49. 49. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Status dei Linked Data http://linkeddata.org 49 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  50. 50. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Outline 1 Introduzione 2 Biblioteche Digitali 3 Il web 4 I Linked Data 5 Conclusioni 50 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data
  51. 51. Introduzione Biblioteche Digitali Il web I Linked Data Conclusioni Conclusioni Il web e le BD sono stretti parenti, che condividono l’obiettivo di rendere la conoscenza accessibile, ma per diversi utenti e con diverse disponibilità di risorse. Il web non ha una designated community, è per tutti. E può contare su un team di design (il W3C) e di sviluppo (progetti open source) che non ha uguali nelle BD (e in nessun altro settore). I due mondi hanno oggi molti punti di contatto, alcuni importanti sono: uso dei linguaggi del web (URI, RDF) nelle biblioteche digitali per l’espressione formale della conoscenza uso della tecnologia del web (web service) da parte delle BD per distribuire i propri servizi e accedere ai servizi altrui uso dei Linked Data per la distribuzione di conoscenza creata e curata all’interno delle BD. E così andranno le cose ancora per un po’. 51 / 51 Carlo Meghini Biblioteche Digitali, Web e Linked Data

×