La Semantica e il Web dei Dati - Presentation Transcript
La semantica e il Web dei dati: quando uno più uno non fa solo due Irene Celino CEFRIEL – ICT Institute Politecnico di Milano email: [email_address]
Semantica?
In filosofia, la semantica è lo studio del significato
Ogni giorno, in ogni momento, siamo sommersi di dati, informazioni, contenuti e tanti tipi diversi di media
Tutti questi dati però, per essere di qualche utilità, necessitano di essere interpretati dalle persone
La crescita esponenziale della quantità di dati spinge tutti a cercare soluzioni tecnologiche per ovviare a questi problemi
Quali sono le capacità delle macchine
I sistemi informatici che utilizziamo tutti i giorni rappresentano l’informazione attraverso
Il linguaggio naturale (italiano, inglese, cinese, …)
Grafici, multimedia, …
Gli esseri umani elaborano facilmente questa informazione
Possono dedurre fatti da informazione parziale
Possono creare associazioni mentali
Sono abituati a interagire con diversi tipi di media (problemi di accessibilità a parte…)
Invece le macchine sono “ ignoranti ”
L’informazione parziale è inutilizzabile
Difficoltà di estrarre il significato ad es. da un’immagine
Trovare automaticamente analogie è difficile
Difficoltà di combinare automaticamente le informazioni
L’evoluzione del Web 1 – il Web delle origini 2 – il Social Web 3 – il Semantic Web 4 – l’Ubiquitous Web Connette i documenti Connette le persone Connette la conoscenza Connette le intelligenze Concetto rielaborato tratto da: Nova Spivak, John Breslin, Mills Davis (2008)
Perchè il Semantic Web “ The Semantic Web is a vision: the idea of having data on the Web defined and linked in a way that it can be used by machines not just for display purposes, but for automation , integration and reuse of data across applications ” – Tim Berners-Lee (2003) “ The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning , better enabling computers and people to work in cooperation ” – Tim Berners-Lee (2001)
L’integrazione dei dati
Il problema dell’integrazione:
Enormi quantità di dati che crescono ed evolvono in continuazione
problema di scala
Tante diverse tipologie di dato (documenti, media, email, risultati Web, contatti, ecc.)
problema di eteroge- neità dei dati
Tanti diversi sistemi informativi (DB, applica- zioni legacy, ERP, ecc.)
problema di eteroge- neità dei sistemi
Quando 1 + 1 > 2 ?
L’integrazione dei dati dà sempre un valore aggiunto
Visione d’insieme: “e pluribus unum”
Condividere la conoscenza: “l’unione fa la forza”
Opportunità di business
Business Intelligence
Resta il problema tecnologico :
Chi è riuscito a trarre vantaggio dall’integrazione?
Come riconciliare l’eterogeneità dei dati?
La semantica può essere d’aiuto?
La lezione del Web 2.0
La politica della partecipazione e la “saggezza delle folle”
Il grande successo dei mash-up
Mash-up: applicazioni realizzate dall’integrazione “light” di artefatti forniti da altri (spesso API o servizi REST)
Nuovo paradigma di integrazione per la realizzazione di applicazioni
Pubblicazione e accesso via Web
È sempre più semplice “memorizzare” l’informazione sul Web
È sempre più diffuso accedere all’informazione sul Web, facendo affidamento ai motori di ricerca per recuperarla
Per integrare dati provenienti da sorgenti diverse è necessario capire come “incastrare” tra loro i dati
Per fare questo è necessario guardare al significato dei dati e passare “ dalla sintassi alla semantica ”
Bisogna riconciliare dati solo in apparenza diversi, facendo leva su alcuni possibili approcci/metriche:
Distanza semantica : “lontananza” in termini di significato
Similarità semantica : somiglianza in termini di significato e di “ampiezza”
La semantica per l’integrazione
Il Web come piattaforma di integrazione
E se l’ integrazione si facesse sul Web ?
Web come piattaforma
Data prosumer (producer + consumer)
“ Web of Data ”
Passare dall’attuale “Web of Documents” ad un Web dei dati
Non più solo information retrieval, ma anche data retrieval
La concretizzazione del “Web of Data” (e del Semantic Web)
Tim Berners-Lee: http ://www.w3.org/DesignIssues/LinkedData
Linking Open Data Initiative
Una comunità che pubblica e “linka” i dati sul Web
http://linkeddata.org/
Data cloud
Oggi si parla molto di cloud computing
Spesso però non è di sola computazione che si tratta, ma di gestione dei dati e della conoscenza
Linked data e data cloud
I linked data visti dall’inventore del Web www.flickr.com/photos/_-amy-_/3167333250/ “ Stop hugging your data” Tim Berners-Lee, 2009 Non lasciare che considerazioni sulla sicurezza o sulla proprietà dei dati ostacolino opportunità e innovazione
Sfide per i linked data
Distributed querying
Interrogare dati distribuiti su diverse sorgenti sul Web disinteressandosi della “posizione” dei dati e ottenendo i risultati già aggregati
Automatic linkage
Trovare meccanismi per identificare i punti di contatto tra dati provenienti da fonti diverse e creare i “link” che permettono di passare da una fonte all’altra senza soluzione di continuità
Distributed reasoning
Applicare tecniche di inferenza e di ragionamento automatico a dati distri- buiti sul Web, preservando consisten- za e correttezza del ragionamento
LarKC platform Interface Mobile Data Mashup Environment SPARQL query SPARQL result REST request JSON response Request data Data Pipeline Config. PROBLEM : Which Milano monuments or events or friends can I quickly get to from here? Traffic Monuments Events People La ricerca e i linked data: _________ http://www.larkc.eu
Semantics Knowledge Representation & Reasoning Web Services As a basic tool to implement a S ervice O riented A rchitecture Semantic Web Services As a means to realize S ervice O riented A rchitecture Web 2.0 User clustering User-Resource correlation Semantic Search Conceptual Indexing Semantic Matching Automatic Semantic Annotation Combining smart-machine and smart-data Service-Finder aims at developing a platform for service discovery in which Web Services are embedded in a Web 2.0 environment R ealizing W eb S ervice D iscovery at W eb S cale http://www.service-finder.eu La ricerca e i linked data: _____________
Se non vi ho convinto io… http://www.ted.com/index.php/talks/tim_berners_lee_on_the_next_web.html
Grazie dell’attenzione! Irene Celino email: [email_address] web: http://www.cefriel.it , http://swa.cefriel.it Semantic Web Practice CEFRIEL – ICT Institute Politecnico di Milano
0 comments
Post a comment