WEB SEMANTICO:struttura e organizzazione dei dati              Sapienza Università di Roma             Anno Accademico 201...
Web attuale:difficoltà nella ricerca di informazioni                Un limite del Web attuale:                   i risulta...
Web attuale: poca integrazione delle informazioni Ogni informazione si trova in documenti diversie una volta estratta va i...
Web attuale: poche applicazioni         La maggior parte dei siti web             non sono progettatiper interagire tra lo...
La ridondanza nel WebLa ricerca nei grandi cataloghi mostra dei limitiche il modello FRBR vuole superare.Analogamente le r...
I motori di ricerca e le parole nel web“Un browser (Internet Explorer, Firefox o Chrome) o un motore diricerca (Google, Ya...
VERSO IL WEB SEMANTICOTim Berners Lee:«Fino ad oggi il Web si è sviluppato più comestrumento di contenuti per uso ‘umano’,...
T.Berners Lee, inventore del World Wide              Web, scrive:"Il Web fu disegnato come uno spazio di informazioni,non ...
L’interoperabilità tra le applicazioniIl Web si deve dotare di una sovrastruttura perl’interoperabilità (semantica) tra le...
Il WEB come Data BaseI nuovi motori di ricerca dovranno essere in grado dianalizzare non soltanto le parole chiave, ma anc...
Informazioni “su se stessi”E’ necessario che le informazioni possano essereespresse in una forma "comprensibile" per una m...
WEB SEMANTICO = estendere il web   Lidea del Web Semantico nasce per           estendere lattuale webe favorire lo scambio...
Web semantico                       Da Wikipedia, lenciclopedia libera.Con il termine web semantico, termine coniato dal s...
XML e oltrePer la sua costruzione/definizione si utilizza lXML, unlinguaggio che consente di descrivere le diverse parti d...
RDF: un nuovo standardViene approvato dal WW3 un nuovo standard:   l’RDF - Resource Description Framework,         una par...
MEMO: logica dei predicati              Il mondo è analizzato in termini di              OGGETTI, PROPRIETA’, RELAZIONI.Pr...
«semantico»: cosa vuol dire?La semantica (dal greco sémeìon, segno) è quella partedella linguistica che studia il signific...
XML e il Web SemanticoXML non aggiunge senso ai dati, almeno non lo aggiunge in modo«computazionalmente» accessibile e tra...
XML e il Web SemanticoSe si sceglie di percorrere la strada della standardizzazione a prioril’indifferenza semantica di XM...
Oltre XMLNon appena il dominio applicativo si estende o l’ambiente siestende e diviene eterogeneo (come nel Web) l’uniform...
RDF: un linguaggio per il computerAffinché i metadati semantici siano utilizzabili non solo dagliesseri umani ma anche dai...
Il futuro possibile?Attraverso il web sarà possibile, ad esempio, prendere unappuntamento con il chirurgo per un intervent...
Il “cantiere” del WEB SEMANTICOCreazione di linguaggi e tecnologie (agenti intelligenti) in grado di:• estrarre significat...
Le «affermazioni» o «asserzioni»         del WEB SEMANTICO       Nel web semantico non si scrivono testi(allinterno dei qu...
Le “asserzioni” del Web Semantico -1                  Ad esempio, le affermazioni            sul Presidente della Repubbli...
Le “asserzioni” del Web Semantico -2Per questi elementi è possibile reperire sul Web URI che liidentificano univocamente:I...
Gli “agenti” del WEB SEMANTICOl termine Web Semantico, proposto per la prima voltanel 2001 da Tim Berners-Lee, è un Web in...
Verso il web semantico: i metadati• I “metadati” sono linsieme delle informazioni che compongono il  modello di un oggetto...
Concetto di metadati semantici “Annotare semanticamente le risorse”                 significa            associare ad esse...
I metadati semanticiI metadati semantici sono di tipo “comprensibile dallamacchina” e possono essere utilizzati dalle appl...
Il Web Semantico             ha una architettura a livelliIl Web Semantico è un sistema controllato di organizzazione di d...
La piramide del WEB SEMANTICOL’architettura del Web Semantico si compone di vari livelli:•   i dati•   i metadati•   i con...
L’architettura del WEB SEMANTICO   E’ importante lo schema utilizzato per archiviare le informazioni.  Lo schema RDF è un ...
WEB SEMANTICO:  un esempio di applicazione di ontologieSi può fare una ricerca del tipo: quali sono…                  le a...
MEMO: cos’è l’URIURI è acronimo di Uniform Resource Identifier: un     indirizzo che, in forma compatta, consente di ident...
Il Web Semantico                e i livelli di controlloPrevede dei livelli di controllo e validazione interna:• Adotta la...
WEB SEMANTICOIl Web Semantico ha una architettura a livelli     3                                                      37
Web semantico: conclusioniDifficilmente il Web diventerà Web Semantico in breve tempo.                    Il lavoro è lung...
Linguaggi e strumenti per gestire le                ontologieLinguaggi formali per la definizione di ontologie e basidi co...
WEB SEMANTICO – link utili    A. Volpon, Web Semantico, il linguaggio del mondo                          Mytech:URL http:/...
Upcoming SlideShare
Loading in...5
×

9. Il Web semantico

529

Published on

Sapienza Università di Roma
Anno Accademico 2012 – 2013
Informatica per gli Archivi e le Biblioteche
Prof.ssa Linda Giuva

Prof. Maurizio Caminito
Lezione 9

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
529
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
21
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

9. Il Web semantico

  1. 1. WEB SEMANTICO:struttura e organizzazione dei dati Sapienza Università di Roma Anno Accademico 2012 – 2013 Informatica per gli Archivi e le Biblioteche Prof.ssa Linda Giuva Prof. Maurizio Caminito LEZIONE 9 1
  2. 2. Web attuale:difficoltà nella ricerca di informazioni Un limite del Web attuale: i risultati delle ricerche riguardano interi documenti (parole all’interno di pagine) e non la specifica informazione Dopo il lavoro di ricerca dei documenti segue l’estrazione «manuale» delle informazioni desiderate 2
  3. 3. Web attuale: poca integrazione delle informazioni Ogni informazione si trova in documenti diversie una volta estratta va integrata con tutte le altre Mancano applicazioni per il web in grado di combinare informazioni provenienti da fonti diverse in modo da risolvere uno specifico problema 3
  4. 4. Web attuale: poche applicazioni La maggior parte dei siti web non sono progettatiper interagire tra loro o con altre applicazioni.Se il Web venisse progettato per fornire serviziad altri servizi, consentendo la cooperazione siatra programmi che tra programmi ed utenti, cisarebbe un utilizzo diverso di Internet 4
  5. 5. La ridondanza nel WebLa ricerca nei grandi cataloghi mostra dei limitiche il modello FRBR vuole superare.Analogamente le ricerche sul Web finisconospesso in una interminabile serie di risultatispesso irrilevanti che devono essere «filtrati»dall’utente. La sfida del WEB SEMANTICO: risolvere questi problemi 5
  6. 6. I motori di ricerca e le parole nel web“Un browser (Internet Explorer, Firefox o Chrome) o un motore diricerca (Google, Yahoo, Bing) sono in grado, secondo precise istruzioni, didisporre e visualizzare in una certa maniera delle informazioni ma non hannola capacità di riconoscerle o attribuire loro un significato particolare perelaborarle.Infatti un motore di ricerca non distingue se la parola espresso si riferisca adun treno piuttosto che ad un caffè, oppure se verdi sia riferito ad un colore oal compositore.Il motore di ricerca può tentare di recepire i significati ricavandoli dal contestodella pagina, utilizzare sinonimi per espandere le ricerche, ma in ultima analisiil suo archivio è un elenco, certamente molto ben organizzato, di parole chiave.Se fosse in grado di comprendere il significato dei contenuti di una pagina,potrebbe accettare domande più complesse e fornire ununica rispostaaltrettanto complessa ed efficace". 6 (Stefano Epifani, Introduzione al Web semantico)
  7. 7. VERSO IL WEB SEMANTICOTim Berners Lee:«Fino ad oggi il Web si è sviluppato più comestrumento di contenuti per uso ‘umano’,piuttosto che come mezzo di informazione perl’elaborazione automatizzata. Servono datispecificatamente progettati per computer, daticomprensibili alle macchine […] I computerdevono aver accesso a serie strutturate diinformazioni e a regole di deduzione chepermettano un ‘ragionamento’ automatizzato» 7
  8. 8. T.Berners Lee, inventore del World Wide Web, scrive:"Il Web fu disegnato come uno spazio di informazioni,non solo per la comunicazione uomo-uomo, ma affinchéanche le macchine potessero avere la possibilità dipartecipare e dare il loro contributo.Uno dei maggiori ostacoli è stato il fatto che la maggiorparte dellinformazione sul Web è disegnata per esserefruita dalluomo (...), la struttura dei dati non èriconoscibile per un robot che naviga il Web.Lapproccio del Web Semantico, invece, sviluppalinguaggi per esprimere le informazioni in una formaaccessibile e processabile da una macchina". 8
  9. 9. L’interoperabilità tra le applicazioniIl Web si deve dotare di una sovrastruttura perl’interoperabilità (semantica) tra le applicazioni,in modo da poter svolgere automaticamentequelle funzioni che oggi debbono essere eseguitea mano o codificate dentro ai programmi 9
  10. 10. Il WEB come Data BaseI nuovi motori di ricerca dovranno essere in grado dianalizzare non soltanto le parole chiave, ma anche lerelazioni che intercorrono tra loro.Per ottenere questo risultato è necessario che tuttele informazioni presenti sul WWW siano “racchiuse”in un unico grande data base. 10
  11. 11. Informazioni “su se stessi”E’ necessario che le informazioni possano essereespresse in una forma "comprensibile" per una macchina COME?In una risorsa i metadati forniscono informazioni su se stessa. I metadati dovrebbero essere "scritti" in una forma leggibile dalle macchine. 11
  12. 12. WEB SEMANTICO = estendere il web Lidea del Web Semantico nasce per estendere lattuale webe favorire lo scambio di informazioni oltre che tra esseri umani anche tra programmi per computer, tramite una rappresentazione che anche questi ultimi siano in grado di utilizzare e di “comprendere”. 12
  13. 13. Web semantico Da Wikipedia, lenciclopedia libera.Con il termine web semantico, termine coniato dal suo ideatore, TimBerners-Lee, si intende la trasformazione del World Wide Web in unambiente dove i documenti pubblicati (pagine HTML, file, immagini, ecosì via) sono associati ad informazioni e dati (metadati) che nespecificano il contesto semantico in un formato adattoallinterrogazione e linterpretazione (es. tramite motori di ricerca) e,più in generale, allelaborazione automatica.Con linterpretazione del contenuto dei documenti che il Websemantico impone, saranno possibili ricerche molto più evolute delleattuali, basate sulla presenza nel documento di parole chiave, e altreoperazioni specialistiche come la costruzione di reti di relazioni econnessioni tra documenti secondo logiche più elaborate delsemplice collegamento ipertestuale.
  14. 14. XML e oltrePer la sua costruzione/definizione si utilizza lXML, unlinguaggio che consente di descrivere le diverse parti diun documento.Ma la sintassi XML non definisce alcun meccanismoesplicito per qualificare le relazioni tra documenti.Non è di aiuto neppure il meccanismo dei collegamentiipertestuali usato dallHTML perché «amorfo», cioènon prevede la possibilità di descrivere il legamedefinito.
  15. 15. RDF: un nuovo standardViene approvato dal WW3 un nuovo standard: l’RDF - Resource Description Framework, una particolare applicazione XML che standardizza la definizione di relazioni tra informazioniispirandosi ai principi della logica dei predicati (o logica predicativa del primo ordine) e ricorrendo agli strumenti tipici del Web (ad es. URI) e dellXML.
  16. 16. MEMO: logica dei predicati Il mondo è analizzato in termini di OGGETTI, PROPRIETA’, RELAZIONI.Predicato: parte di una proposizione che indica le proprietà o lerelazioni di cui godono i soggetti o termini della proposizione.Per esempio nelle proposizioni “Mario è romano”, “7 è maggiore di3”, “Firenze si trova tra Roma e Milano”, le espressioni “è romano”,“è maggiore di”, “si trova tra... e...” sono dei predicati. La primaindica una proprietà, mentre le altre due indicano delle relazioni
  17. 17. «semantico»: cosa vuol dire?La semantica (dal greco sémeìon, segno) è quella partedella linguistica che studia il significato delle parole,degli insiemi delle parole, delle frasi e dei testi.La semantica è ciò che mette in relazione le espressionilinguistiche con quello che il contenuto di taliespressioni "vuole dire". Implica un processo di interpretazione. 17
  18. 18. XML e il Web SemanticoXML non aggiunge senso ai dati, almeno non lo aggiunge in modo«computazionalmente» accessibile e trattabile(le etichette XML sono leggibili e comprensibili da un utente umano. Di solito ilvocabolario utilizzato nei linguaggi XML usa termini sensati tratti da una linguanaturale)Ma il significato del vocabolario XML è del tutto inaccessibile a un elaboratore. 18
  19. 19. XML e il Web SemanticoSe si sceglie di percorrere la strada della standardizzazione a prioril’indifferenza semantica di XML (e di qualsiasi altro metalinguaggio dimodellizzazione dati) non sarebbe un problema rilevante.In questo caso infatti una comunità di utenti decide di adottare unVocabolario:•condiviso•definito a priori•con una semantica chiara e prefissataSi tratta di una pratica ben nota nel mondo delle biblioteche e degli archiviche sin dai primordi dell’automazione hanno avvertito l’esigenza di definiremodelli di descrizione, formati, vocabolari controllati per la descrizionesemantica tendenzialmente condivisi: da MARC a Dublin Core, da ISBD a ISADa FRBR, dal soggettario LC ai vari thesaura settoriali…..Fabio Ciotti, XML metadati Semantic Web. Dall’interoperabilità sintattica a quella semantica 19
  20. 20. Oltre XMLNon appena il dominio applicativo si estende o l’ambiente siestende e diviene eterogeneo (come nel Web) l’uniformità apriori dei linguaggi descrittivi non è praticabile.Si pone dunque l’esigenza di individuare dei sistemi diinteroperabilità semantica che consentano•l’integrazione di sistemi eterogenei•l’erogazione servizi avanzati di descrizione ed elaborazionesemantica.In questa direzione si muovono le sperimentazioni che ricadononell’area del Semantic Web. 20
  21. 21. RDF: un linguaggio per il computerAffinché i metadati semantici siano utilizzabili non solo dagliesseri umani ma anche dai computer, è necessario che venganoespressi in un linguaggio che sia computazionalmente trattabilesia dal punto di vista sintattico sia da quello semanticoÈ questo il fine del Resource Description Framework (RDF)Si tratta di un metalinguaggio dichiarativo per la formalizzare diasserti (predicati) che esprimono proprietà di e relazioni trarisorse 21
  22. 22. Il futuro possibile?Attraverso il web sarà possibile, ad esempio, prendere unappuntamento con il chirurgo per un intervento, prenotare il postoletto in ospedale, fissare il volo aereo per raggiungere l’ospedale,ottenere un prestito dalla banca a copertura delle spese, con una sola operazione. Saranno le applicazioni di gestione dell’ospedale, della compagnia aerea, della banca a “parlarsi tra loro” per fornire la soluzione al problema indicato 22
  23. 23. Il “cantiere” del WEB SEMANTICOCreazione di linguaggi e tecnologie (agenti intelligenti) in grado di:• estrarre significati (attributi) da informazioni• creare percorsi in base alle informazioni richieste dallutente, guidandolo poi verso di esse• spostarsi di sito in sito collegando logicamente elementi diversi23 dellinformazione richiesta
  24. 24. Le «affermazioni» o «asserzioni» del WEB SEMANTICO Nel web semantico non si scrivono testi(allinterno dei quali le informazioni stanno nascoste erichiedono un intervento umano), ma affermazioni o asserzioni(informazioni non ambigue, che esprimono relazionitra oggetti, risorse, esseri umani, fatti del mondo reale,e che possono essere utilizzate anche da applicazioniautomatiche) 24
  25. 25. Le “asserzioni” del Web Semantico -1 Ad esempio, le affermazioni sul Presidente della Repubblica italiana: Il Signor Napolitano vive a Roma oppure Il Signor Napolitano ha codice fiscale NPLGRG20T09E625Vpossono essere schematicamente così scomposte: Asserzione 1 Asserzione 2Soggetto Il Sig. Napolitano Il Sig. NapolitanoPredicato vive a ha codice fiscaleValore Roma NPLGRG20T09E625V 25
  26. 26. Le “asserzioni” del Web Semantico -2Per questi elementi è possibile reperire sul Web URI che liidentificano univocamente:Il Signor Napolitano http://www.quirinale.it/vive a http://it.wiktionary.org/wiki/vivereRoma http://www.comune.roma.it/index.aspHa codice fiscale http://it.wikipedia.org/wiki/codice_fiscaleIn questo caso, per Il Signor Napolitano si è scelto di fareriferimento alla relativa biografia disponibile sul sito ufficiale delQuirinale. Per Roma si è scelto di utilizzare il sito istituzionale delComune di Roma . Per vive a si è scelto di referenziare ladefinizione del verbo vivere disponibile su Wikizionario;per ha codice fiscale si è scelta la definizione di codice fiscale disponibile su Wikipedia 26
  27. 27. Gli “agenti” del WEB SEMANTICOl termine Web Semantico, proposto per la prima voltanel 2001 da Tim Berners-Lee, è un Web in cuiagiscono agenti intelligenti (applicazioni)• in grado di comprendere il significato dei testi presenti sulla rete• in grado di guidare lutente direttamente verso linformazione ricercata• in grado di sostituirsi a lui nello svolgimento di operazioni. 27
  28. 28. Verso il web semantico: i metadati• I “metadati” sono linsieme delle informazioni che compongono il modello di un oggetto: il nome, il cognome, la data di nascita, etc... sono metadati del set “Carta dIdentità” e sono sufficienti a descrivere una persona in contesti legali e anagrafici.• Titolo, editore, autore, anno di edizione, etc... sono metadati del set “Libro” e sono sufficienti a descrivere un libro di carta quando non lo si vuole leggere, ma solo cercare.• E importante mettersi daccordo su un unico set di metadati che descrivono lo stesso oggetto pur in realtà diverse. Un set di metadati standard per un oggetto in uno specifico contesto così da essere riconosciuto, conservato, trovato. 28
  29. 29. Concetto di metadati semantici “Annotare semanticamente le risorse” significa associare ad esse descrizioni semanticheche consentono di collegarle logicamente ad un certo numero di classi e proprietà 29
  30. 30. I metadati semanticiI metadati semantici sono di tipo “comprensibile dallamacchina” e possono essere utilizzati dalle applicazioniper ottenere una piena interoperabilità ed un retrievalefficace. Nel Web Semantico si fanno asserzioni (statement in inglese) formate da soggetto, predicato e valore (costituite, quindi, da triple). 30
  31. 31. Il Web Semantico  ha una architettura a livelliIl Web Semantico è un sistema controllato di organizzazione di dati.Adotta una serie di standard:  Al livello superiore si pone il livello ontologico.  Una ontologia descrive le relazioni tra i tipi di elementi• lo standard URI (Uniform Resource Identifiers), per la definizione univoca di indirizzi Internet• l’RDF (Resource Description Framework) e RDF Schema, che costituiscono il linguaggio per descrivere le risorse e i loro tipi (derivano da XML). 31
  32. 32. La piramide del WEB SEMANTICOL’architettura del Web Semantico si compone di vari livelli:• i dati• i metadati• i concetti che esprimono le relazioni fra i dati• un linguaggio che descriva la struttura dei dati 32
  33. 33. L’architettura del WEB SEMANTICO E’ importante lo schema utilizzato per archiviare le informazioni. Lo schema RDF è un insieme di regole sullorganizzazione dei dati. Definisce relazioni fra i dati. I metadati devono mappare i dati rispetto a classi, o concetti, di questo schema. In questo modo si hanno strutture in grado di descrivere e automatizzare i collegamenti esistenti fra i dati. Il Web Semantico è, come lXML, un ambiente dichiarativo,  in cui si specifica il significato dei dati.La semantica dei dati consiste nel dare alla macchina delle informazioni utili in modo che essa possa utilizzare i dati nel modo corretto. 33
  34. 34. WEB SEMANTICO:  un esempio di applicazione di ontologieSi può fare una ricerca del tipo: quali sono… le aziende (soggetto)  che hanno come servizio (predicato)  la fornitura di scarpe (oggetto)?N.B. Questa query è diversa da quella che si potrebbe fare ad un motore di ricerca, a cui si propongono le tre parole: azienda, servizio e scarpe, ma senza mai esprimere il legame fra di essi. Da qui derivano appunto le imprecisioni dei motori di ricerca. 34
  35. 35. MEMO: cos’è l’URIURI è acronimo di Uniform Resource Identifier: un indirizzo che, in forma compatta, consente di identificare una qualsiasi risposta come una pagina web, un documento, unimmagine, un indirizzo e- mail e così via. Gli URI sono definiti utilizzando una specifica sintassi, facente riferimento alluso di differenti protocolli. URL (Uniform Resource Locator) e URN (Uniform Resource Name) possono essere considerati sottoinsiemi di URI. 35
  36. 36. Il Web Semantico  e i livelli di controlloPrevede dei livelli di controllo e validazione interna:• Adotta la firma digitale• Prevede un livello di “proof”• Porta ad un risultato univoco e credibile (livello “trust”) 36
  37. 37. WEB SEMANTICOIl Web Semantico ha una architettura a livelli  3  37
  38. 38. Web semantico: conclusioniDifficilmente il Web diventerà Web Semantico in breve tempo.  Il lavoro è lungo e difficile.  Questa proposta ha però affascinato molto la comunità  informatica.  Il W3C ha attivato un gruppo di lavoro.  Le università hanno aperto numerosi programmi di ricerca  legati a questi temi.  Si sono imposti subito degli standardLe critiche sulla validità di questo progetto sono legate al fattore tempo(quanto tempo occorre per mappare tutto il Web sulle ontologie?)oppure sulle difficoltà di comunicazione tra ontologie diverse.Molti ritengono che avranno validità solo nel dominio per le quali sonostate progettate. Diverso, infatti, è il discorso se parliamo delluso di schemisemantici allinterno di architetture legate ad un dominio ben definito, quindia servizio di comunità ristrette di utenti, per ottenere uno scopo preciso. 38
  39. 39. Linguaggi e strumenti per gestire le  ontologieLinguaggi formali per la definizione di ontologie e basidi conoscenza, per supportare il ragionamento su diesse ed interrogarle.RDF produce specifiche di contenuto grazie alle triple (soggetto-predicato-oggetto)RDFS che usa le triple per dichiarare le classi e le relazioni valide sulla base di conoscenzaOWL (Web Ontology Language) è un linguaggio di markup per rappresentare esplicitamente ontologie ( semantica formale di termini e relazioni tra i 39 termini).
  40. 40. WEB SEMANTICO – link utili A. Volpon, Web Semantico, il linguaggio del mondo Mytech:URL http://www.mytech.it/mytech/internet/art006010046709.jsp P. Ceravolo, Che cosè e a cosa serve il Web SemanticoHTML.it: URL: http://pro.html.it/articoli/id_327/id_cat_46/pro.html P. Ceravolo, I linguaggi del Web SemanticoHTML.it: URL: http://pro.html.it/articoli/id_334/id_cat_46/pro.html P. Ceravolo, Costruiamo le ontologie per il Web SemanticoHTML.it: URL: http://pro.html.it/articoli/id_341/id_cat_46/pro.html AA. VV. Semantic Web W3C URL: http://www.w3.org/2001/sw/ 40
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×