Your SlideShare is downloading. ×
3b WEB SEMANTICO: struttura e organizzazione dei dati
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

3b WEB SEMANTICO: struttura e organizzazione dei dati

280
views

Published on

SAPIENZA UNIVERSITA’ DI ROMA …

SAPIENZA UNIVERSITA’ DI ROMA
DIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E GEOGRAFICHE
SCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARI
Anno accademico 2012-2013
 
Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHE
Prof. Giovanni Solimine
  
Modulo integrativo
INFORMATICA PER LE BIBLIOTECHE
Prof. Maurizio Caminito

Published in: Education

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
280
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
17
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 1WEB SEMANTICO:struttura e organizzazione dei datiSAPIENZA UNIVERSITA’ DI ROMADIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE EGEOGRAFICHESCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARIAnno accademico 2012-2013Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHEProf. Giovanni SolimineModulo integrativoINFORMATICA PER LE BIBLIOTECHEProf. Maurizio Caminito
  • 2. 2Web attuale:difficoltà nella ricerca di informazioniUn limite del Web attuale:i risultati delle ricercheriguardano interi documenti (parole all’interno di pagine)e non la specifica informazioneDopo il lavoro di ricerca dei documentiseguel’estrazione «manuale» delle informazioni desiderate
  • 3. 3Web attuale:poca integrazione delle informazioniOgni informazione si trova in documenti diversie una volta estratta va integrata con tutte le altreMancano applicazioni per il webin grado di combinare informazioniprovenienti da fonti diversein modo da risolvere uno specifico problema
  • 4. 4Web attuale: poche applicazioniLa maggior parte dei siti webnon sono progettatiper interagire tra loro o con altre applicazioni.Se il Web venisse progettato per fornire serviziad altri servizi, consentendo la cooperazione siatra programmi che tra programmi ed utenti, cisarebbe un utilizzo diverso di Internet
  • 5. La ridondanza nel WebLa ricerca nei grandi cataloghi mostra dei limitiche il modello FRBR vuole superare.Analogamente le ricerche sul Web finisconospesso in una interminabile serie di risultatispesso irrilevanti che devono essere «filtrati»dall’utente.La sfida del WEB SEMANTICO:risolvere questi problemi 5
  • 6. 6I motori di ricerca e le parole nel web“Un browser (Internet Explorer, Firefox o Chrome) o un motore diricerca (Google, Yahoo, Bing) sono in grado, secondo precise istruzioni, didisporre e visualizzare in una certa maniera delle informazioni ma non hannola capacità di riconoscerle o attribuire loro un significato particolare perelaborarle.Infatti un motore di ricerca non distingue se la parola espresso si riferisca adun treno piuttosto che ad un caffè, oppure se verdi sia riferito ad un colore oal compositore.Il motore di ricerca può tentare di recepire i significati ricavandoli dal contestodella pagina, utilizzare sinonimi per espandere le ricerche, ma in ultima analisiil suo archivio è un elenco, certamente molto ben organizzato, di parolechiave.Se fosse in grado di comprendere il significato dei contenuti di una pagina,potrebbe accettare domande più complesse e fornire ununica rispostaaltrettanto complessa ed efficace".(Stefano Epifani, Introduzione al Web semantico)
  • 7. VERSO IL WEB SEMANTICOTim Berners Lee:«Fino ad oggi il Web si è sviluppato più comestrumento di contenuti per uso ‘umano’,piuttosto che come mezzo di informazione perl’elaborazione automatizzata. Servono datispecificatamente progettati per computer, daticomprensibili alle macchine […] I computerdevono aver accesso a serie strutturate diinformazioni e a regole di deduzione chepermettano un ‘ragionamento’ automatizzato» 7
  • 8. 8T.Berners Lee, inventore del World WideWeb, scrive:"Il Web fu disegnato come uno spazio di informazioni,non solo per la comunicazione uomo-uomo, ma affinchéanche le macchine potessero avere la possibilità dipartecipare e dare il loro contributo.Uno dei maggiori ostacoli è stato il fatto che la maggiorparte dellinformazione sul Web è disegnata per esserefruita dalluomo (...), la struttura dei dati non èriconoscibile per un robot che naviga il Web.Lapproccio del Web Semantico, invece, sviluppalinguaggi per esprimere le informazioni in una formaaccessibile e processabile da una macchina".
  • 9. 9L’interoperabilità tra le applicazioniIl Web si deve dotare di una sovrastruttura perl’interoperabilità (semantica) tra le applicazioni,in modo da poter svolgere automaticamentequelle funzioni che oggi debbono essere eseguitea mano o codificate dentro ai programmi
  • 10. 10Il WEB come Data BaseI nuovi motori di ricerca dovranno essere in grado dianalizzare non soltanto le parole chiave, ma anchelerelazioni che intercorrono tra loro.Per ottenere questo risultato è necessario che tuttele informazioni presenti sul WWW siano “racchiuse”in un unico grande data base.
  • 11. 11Informazioni “su se stessi”E’ necessario che le informazioni possano essereespresse in una forma "comprensibile" per una macchinaCOME?In una risorsa i metadati forniscono informazionisu se stessa.I metadati dovrebbero essere "scritti"in una forma leggibile dalle macchine.
  • 12. 12WEB SEMANTICO = estendere il webLidea del Web Semantico nasce perestendere lattuale webe favorire lo scambio di informazioni oltreche tra esseri umanianche tra programmi per computer,tramite una rappresentazioneche anche questi ultimi siano in grado diutilizzare e di “comprendere”.
  • 13. Web semanticoDa Wikipedia, lenciclopedia libera.Con il termine web semantico, termine coniato dal suo ideatore, TimBerners-Lee, si intende la trasformazione del World Wide Web in unambiente dove i documenti pubblicati (pagine HTML, file, immagini, ecosì via) sono associati ad informazioni e dati (metadati) che nespecificano il contesto semantico in un formato adattoallinterrogazione e linterpretazione (es. tramite motori di ricerca) e,più in generale, allelaborazione automatica.Con linterpretazione del contenuto dei documenti che il Websemantico impone, saranno possibili ricerche molto più evolute delleattuali, basate sulla presenza nel documento di parole chiave, e altreoperazioni specialistiche come la costruzione di reti di relazioni econnessioni tra documenti secondo logiche più elaborate delsemplice collegamento ipertestuale.
  • 14. XML e oltrePer la sua costruzione/definizione si utilizza lXML, unlinguaggio che consente di descrivere le diverse parti diun documento.Ma la sintassi XML non definisce alcun meccanismoesplicito per qualificare le relazioni tra documenti.Non è di aiuto neppure il meccanismo dei collegamentiipertestuali usato dallHTML perché «amorfo», cioènon prevede la possibilità di descrivere il legamedefinito.
  • 15. RDF: un nuovo standardViene approvato dal WW3 un nuovo standard:l’RDF - Resource Description Framework,una particolare applicazione XMLche standardizza la definizione direlazioni tra informazioniispirandosi ai principi della logica dei predicati(o logica predicativa del primo ordine)e ricorrendo agli strumenti tipici del Web(ad es. URI) e dellXML.
  • 16. MEMO: logica dei predicatiIl mondo è analizzato in termini diOGGETTI, PROPRIETA’, RELAZIONI.Predicato: parte di una proposizione che indica le proprietà o lerelazioni di cui godono i soggetti o termini della proposizione.Per esempio nelle proposizioni “Mario è romano”, “7 è maggiore di3”, “Firenze si trova tra Roma e Milano”, le espressioni “è romano”,“è maggiore di”, “si trova tra... e...” sono dei predicati. La primaindica una proprietà, mentre le altre due indicano delle relazioni
  • 17. 17«semantico»: cosa vuol dire?La semantica (dal greco sémeìon, segno) è quella partedella linguistica che studia il significato delle parole,degli insiemi delle parole, delle frasi e dei testi.La semantica è ciò che mette in relazione le espressionilinguistiche con quello che il contenuto di taliespressioni "vuole dire".Implica un processo di interpretazione.
  • 18. XML e il Web SemanticoXML non aggiunge senso ai dati, almeno non lo aggiunge in modo«computazionalmente» accessibile e trattabile(le etichette XML sono leggibili e comprensibili da un utente umano. Di solito ilvocabolario utilizzato nei linguaggi XML usa termini sensati tratti da una linguanaturale)Ma il significato del vocabolario XML è del tutto inaccessibile a un elaboratore.18
  • 19. XML e il Web SemanticoSe si sceglie di percorrere la strada della standardizzazione a prioril’indifferenza semantica di XML (e di qualsiasi altro metalinguaggio dimodellizzazione dati) non sarebbe un problema rilevante.In questo caso infatti una comunità di utenti decide di adottare unVocabolario:•condiviso•definito a priori•con una semantica chiara e prefissataSi tratta di una pratica ben nota nel mondo delle biblioteche e degli archiviche sin dai primordi dell’automazione hanno avvertito l’esigenza di definiremodelli di descrizione, formati, vocabolari controllati per la descrizionesemantica tendenzialmente condivisi: da MARC a Dublin Core, da ISBD a ISADa FRBR, dal soggettario LC ai vari thesaura settoriali…..Fabio Ciotti, XML metadati Semantic Web. Dall’interoperabilità sintattica a quella semantica19
  • 20. Oltre XMLNon appena il dominio applicativo si estende o l’ambiente siestende e diviene eterogeneo (come nel Web) l’uniformità apriori dei linguaggi descrittivi non è praticabile.Si pone dunque l’esigenza di individuare dei sistemi diinteroperabilità semantica che consentano•l’integrazione di sistemi eterogenei•l’erogazione servizi avanzati di descrizione ed elaborazionesemantica.In questa direzione si muovono le sperimentazioni che ricadononell’area del Semantic Web.20
  • 21. RDF: un linguaggio per il computerAffinché i metadati semantici siano utilizzabili non solo dagliesseri umani ma anche dai computer, è necessario che venganoespressi in un linguaggio che sia computazionalmente trattabilesia dal punto di vista sintattico sia da quello semanticoÈ questo il fine del Resource Description Framework (RDF)Si tratta di un metalinguaggio dichiarativo per la formalizzare diasserti (predicati) che esprimono proprietà di e relazioni trarisorse21
  • 22. 22Il futuro possibile?Attraverso il web sarà possibile, ad esempio, prendere unappuntamento con il chirurgo per un intervento, prenotare il postoletto in ospedale, fissare il volo aereo per raggiungere l’ospedale,ottenere un prestito dalla banca a copertura delle spese,con una sola operazione.Saranno le applicazioni di gestione dell’ospedale, dellacompagnia aerea, della banca a “parlarsi tra loro” perfornire la soluzione al problema indicato
  • 23. 23Il “cantiere” del WEB SEMANTICOCreazione di linguaggi e tecnologie (agenti intelligenti) in grado di:• estrarre significati (attributi) da informazioni• creare percorsi in base alle informazioni richieste dallutente,guidandolo poi verso di esse• spostarsi di sito in sito collegando logicamente elementi diversidellinformazione richiesta
  • 24. 24Le «affermazioni» o «asserzioni»del WEB SEMANTICONel web semantico non si scrivono testi(allinterno dei quali le informazioni stanno nascoste erichiedono un intervento umano),ma affermazioni o asserzioni(informazioni non ambigue, che esprimono relazionitra oggetti, risorse, esseri umani, fatti del mondo reale,e che possono essere utilizzate anche da applicazioniautomatiche)
  • 25. 25Le “asserzioni” del Web Semantico -1Ad esempio, le affermazionisul Presidente della Repubblica italiana:Il Signor Napolitano vive a RomaoppureIl Signor Napolitano ha codice fiscale NPLGRG20T09E625Vpossono essere schematicamente così scomposte:Asserzione 1 Asserzione 2Soggetto Il Sig. Napolitano Il Sig. NapolitanoPredicato vive a ha codice fiscaleValore Roma NPLGRG20T09E625V
  • 26. 26Le “asserzioni” del Web Semantico -2Per questi elementi è possibile reperire sul Web URI che liidentificano univocamente:Il Signor Napolitano http://www.quirinale.it/vive a http://it.wiktionary.org/wiki/vivereRoma http://www.comune.roma.it/index.aspHa codice fiscale http://it.wikipedia.org/wiki/codice_fiscaleIn questo caso, per Il Signor Napolitano si è scelto di fareriferimento alla relativa biografia disponibile sul sito ufficiale delQuirinale. Per Roma si è scelto di utilizzare il sito istituzionale delComune di Roma . Per vive a si è scelto di referenziare ladefinizione del verbo vivere disponibile su Wikizionario;per ha codice fiscale si è scelta la definizione di codice fiscaledisponibile su Wikipedia
  • 27. 27Gli “agenti” del WEB SEMANTICOl termine Web Semantico, proposto per la prima voltanel 2001 da Tim Berners-Lee, è un Web in cuiagiscono agenti intelligenti (applicazioni)• in grado di comprendere il significato dei testipresenti sulla rete• in grado di guidare lutente direttamente versolinformazione ricercata• in grado di sostituirsi a lui nello svolgimento dioperazioni.
  • 28. 28Verso il web semantico: i metadati• I “metadati” sono linsieme delle informazioni che compongono ilmodello di un oggetto: il nome, il cognome, la data di nascita, etc... sonometadati del set “Carta dIdentità” e sono sufficienti a descrivere unapersona in contesti legali e anagrafici.• Titolo, editore, autore, anno di edizione, etc... sono metadati del set“Libro” e sono sufficienti a descrivere un libro di carta quando non lo sivuole leggere, ma solo cercare.• E importante mettersi daccordo su un unico set di metadatiche descrivono lo stesso oggetto pur in realtà diverse.Un set di metadati standard per un oggetto in uno specificocontesto così da essere riconosciuto, conservato, trovato.
  • 29. 29Concetto di metadati semantici“Annotare semanticamente le risorse”significaassociare ad essedescrizioni semanticheche consentono di collegarle logicamentead un certo numero di classi e proprietà
  • 30. 30I metadati semanticiI metadati semantici sono di tipo “comprensibile dallamacchina” e possono essere utilizzati dalle applicazioniper ottenere una piena interoperabilità ed un retrievalefficace.Nel Web Semanticosi fanno asserzioni (statement in inglese)formate da soggetto, predicato e valore(costituite, quindi, da triple).
  • 31. 31Web semantico: conclusioniDifficilmente il Web diventerà Web Semantico in breve tempo.Il lavoro è lungo e difficile.Questa proposta ha però affascinato molto la comunitàinformatica.Il W3C ha attivato un gruppo di lavoro.Le università hanno aperto numerosi programmi di ricercalegati a questi temi.Si sono imposti subito degli standardLe critiche sulla validità di questo progetto sono legate al fattore tempo(quanto tempo occorre per mappare tutto il Web sulle ontologie?)oppure sulle difficoltà di comunicazione tra ontologie diverse.Molti ritengono che avranno validità solo nel dominio per le quali sonostate progettate. Diverso, infatti, è il discorso se parliamo delluso di schemisemantici allinterno di architetture legate ad un dominio ben definito, quindia servizio di comunità ristrette di utenti, per ottenere uno scopo preciso.
  • 32. Linguaggi e strumenti per gestire leontologieLinguaggi formali per la definizione di ontologie e basidi conoscenza, per supportare il ragionamento su diesse ed interrogarle.RDF produce specifiche di contenuto grazie alle triple(soggetto-predicato-oggetto)RDFS che usa le triple per dichiarare le classi e lerelazioni valide sulla base di conoscenzaOWL (Web Ontology Language) è un linguaggio dimarkup per rappresentare esplicitamente ontologie (semantica formale di termini e relazioni tra itermini).32
  • 33. 33WEB SEMANTICO – link utiliA. Volpon, Web Semantico, il linguaggio del mondoMytech:URL http://www.mytech.it/mytech/internet/art006010046709.jspP. Ceravolo, Che cosè e a cosa serve il Web SemanticoHTML.it: URL: http://pro.html.it/articoli/id_327/id_cat_46/pro.htmlP. Ceravolo, I linguaggi del Web SemanticoHTML.it: URL: http://pro.html.it/articoli/id_334/id_cat_46/pro.htmlP. Ceravolo, Costruiamo le ontologie per il Web SemanticoHTML.it: URL: http://pro.html.it/articoli/id_341/id_cat_46/pro.htmlAA. VV. Semantic WebW3C URL: http://www.w3.org/2001/sw/