Carlo Bidoia
Insegnante di scienze matematiche fisiche e naturali
Olgiate Comasco, 19/01/15
Tratto liberamente dal lavoro del Dr Karwan Jacksi
Web semantico
L’evoluzione della rete Internet
Internet
Web 1.0
Web 2.0
Web semantico
22/01/2015Carlo Bidoia
1-Internet
• La rete è un sistema globale di calcolatori interconnessi
che usa lo standard Internet Protocol Suite (TCP/IP) per
servire miliardi di utenti in tutto il mondo.
• È una rete di reti che consiste in milioni di reti pubbliche e
private, accademiche, professionali e del governo di
estensione da locale a globale che sono legate da un ampia
varietà di tecnologie di connessione ottiche ed elettroniche.
22/01/2015Carlo Bidoia
Dal seguente articolo:
How robust is the Internet?
Yuhai Tu
Nature 406, 353-354(27 July 2000)
doi:10.1038/35019222
The map was created
using the skitter tool
(developed by D.
McRobb at CAIDA) which
sends out small packets
of data from a source to
many destinations
through the Internet.
The data collected by
skitter give a snapshot
of the Internet at a
particular moment.
(Graph created by B.
Huffaker using graph
layout code provided by
B. Cheswick and H.
Burch.)
22/01/2015Carlo Bidoia
Memex
Conceived
1945
WWW
Created
1989
Mosaic
Created
1993
A
Mathematical
Theory of
Communication
1948
Packet
Switching
Invented
1964
Silicon
Chip
1958
First Vast
Computer
Network
Envisioned
1962
ARPANET
1969
TCP/IP
Created
1972
Internet
Named
and
Goes
TCP/IP
1984
Hypertext
Invented
1965
Age of
eCommerce
Begins
1995
Un breve sommario dell’evoluzione di internet
1945 1995
22/01/2015Carlo Bidoia
2- Web 1.0
• Il World Wide Web ("WWW" o semplicemente il "Web") è un
sistema di documenti ipertestuali interconnessi in internet
• Con un Web browser, un utente vede pagine Web che
possono contenere testo, immagini, e altri contenuti
multimediali, e naviga tra loro usando hyperlink ovvero
collegamenti.
22/01/2015Carlo Bidoia
2- Principi del Web 1.0
• Il successo del Web 1.0 è basato su tre semplici principi:
1. Uno schema semplice ed uniforme per identificare pezzi di
informazione, cioè l’Uniform Resource Identifiers (URIs) o
Uniform Resource Locator (URL)
2. Un formalismo semplice ed uniforme per strutturare pezzi di
informazione permettendo ai browser di rappresentarli, cioè
l’Hyper Text Markup Language (HTML)
3. Un protocollo semplice ed uniforme per accedere ai pezzi di
informazione, cioè l’Hyper Text Transfer Protocol (HTTP)
22/01/2015Carlo Bidoia
3- Web 2.0
Il termine "Web 2.0" (2004–presente) è comunemente
associato con applicazioni web che facilitano la condivisione
interattiva di informazioni, l’interoperabilità, design centrato
sull’utente, e la collaborazione nel World-Wide Web
22/01/2015Carlo Bidoia
Web 2.0
Un sito Web 2.0 permette agli utenti di interagire e
collaborare tra di loro in un dialogo di social media come
creatori di contenuto generato dagli utenti in una comunità
virtuale, in contrasto con siti web dove l’accesso è limitato alla
visione del contenuto.
commenti
social networks
blogs
wikis
siti di condivisione multimediale
22/01/2015Carlo Bidoia
Web 2.0
Con la tecnologia del Web 1.0,
un ingente investimento in
capacità informatiche e in
software era necessario per
pubblicare informazioni.
Con la tecnologia Web 2.0
tutto è cambiato.
22/01/2015Carlo Bidoia
Rich Site Summary
 Svolte prodotte dal Web 2.0
1. Sfumare la separazione tra consumatore e produttore di
contenuti (Wiki, Blog, Flickr, Twitter, Youtube, …)
2. Spostare l’attenzione dai contenuti per gli individui ai
contenuti per le comunità (Facebook, LinkedIn, …)
3. Sfumare la distinzione tra fruitori e fornitori di servizi
(Amazon, Unilibro, Wordpress, Questbase, Aruba, …)
4. Integrare il lavoro umano e del calcolatore in una maniera
innovativa (mix di lavoro manuale e automatico, come Amazon
Mechanical Turk)
22/01/2015Carlo Bidoia
 Limitazioni del Web 2.0
A. Trovare informazioni rilevanti
B. Estrarre informazioni rilevanti
C. Combinare e riusare informazioni
22/01/2015Carlo Bidoia
A- Trovare informazioni rilevanti
22/01/2015Carlo Bidoia
Trovare informazioni rilevanti
• Il reperimento di informazioni sul web è attualmente
basato sulla ricerca per parole chiave (keyword)
• La ricerca per parola chiave ha limiti nella precisione e
capacità di richiamo a causa di :
– Sinonimia: “macchina” non include “automobile”
– Omonimia: “boa” dà risultati per
Bank of America
Kwon Boa, cantante
Boa constrictor
la boa
22/01/2015Carlo Bidoia
Trovare informazioni rilevanti
• I limiti di precisione e richiamo efficace sono dovuti
anche a:
– Varianti linguistiche (molto più comuni in inglese)
– Lingue differenti
– Errori di digitazione
• I motori di ricerca attualmente non permettono di
specificare la relazione tra una parola chiave e la risorsa
in rete
– Ad esempio: “acquisto” non porta neessariamente a
siti di e-commerce.
22/01/2015Carlo Bidoia
B- Estrarre informazioni rilevanti
• Non esiste una soluzione automatica per estrarre informazioni
da pagine Web a causa di formati differenti e differente
sintassi
• Anche da una singola pagina è difficile estrarre le informazioni
rilevanti:
Quale libro parla
di boa?
Qual è il prezzo
del libro?
22/01/2015Carlo Bidoia
Estrarre informazioni rilevanti
Dati strutturati,
Database,
XML
Structure
estrae
annota
struttura
22/01/2015Carlo Bidoia
Trasformazione XML:
eXtensible Markup
Language
C- Combinare e riusare informazioni
Gli obiettivi che ci si pongono spesso coivolgono la necessità di
combinare i dati raccolti
1. Vogliamo raccogliere informazioni simili su differenti raccolte
digitali (comprendere un argomento di lezione,…)
2. Vogliamo le informazioni che provengono da siti web differenti
perché dobbiamo combinarle insieme (fare una ricerca di
scienze,…)
22/01/2015Carlo Bidoia
Combinare e riusare informazioni
1. Le informazioni simili su differenti raccolte digitali
Esempio: un viaggio da Innsbruck a Roma (FS, OBB, offerte biglietti)
22/01/2015Carlo Bidoia
Combinare e riusare informazioni
2. Le informazioni provengono da siti web differenti e necessitano
di essere combinate
Esempio: un viaggio da Innsbruck a Roma dove devo
pernottare e visitare i musei cittadini
22/01/2015Carlo Bidoia
Come migliorare il Web attuale?
• Aumentando la connessione automatica tra i dati
• Aumentanto precisione e capacità di richiamo nelle ricerche
• Aumentando l’automazione nell’integrazione dei dati e dei
servizi
22/01/2015Carlo Bidoia
Forse la soluzione è
l’attribuzione semantica ai dati e ai servizi
Cos’è il Web semantico?
• “The Semantic Web is an extension of the current web in
which information is given well-defined meaning, better
enabling computers and people to work in cooperation.”
Dall’articolo:
T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”,
Scientific American, May 2001
22/01/2015Carlo Bidoia
well-defined meaning
Bisogna definire utili ontologie
L’ontologia è (per questo scopo):
la formale, esplicita specificazione di
una concettualizzazione condivisa
22/01/2015Carlo Bidoia
Come ad esempio nella mappa concettuale per la scuola:
• Concetti
• Proprietà
• Relazioni
• Assiomi
(per esperti informatici e filosofi)
Persona
Studente Docente
Lezione
Nome email
Matricola nr
disciplina
argomentoLezione nr
segue tiene
Tiene (Docente, Lezione) =>
Lezione.argomento = Docente.disciplina
22/01/2015Carlo Bidoia
Web semantico dei Dati
1. Annotazione semantica dei Dati nel Web
2. Web dei Dati
3. Integrazione dei Dati nel Web
22/01/2015Carlo Bidoia
1. Annotazione semantica dei Dati nel Web
Connettere oggetti Web (sintassi) con il loro significato (semantica)
come in questo esempio:
22/01/2015Carlo Bidoia
2. Web dei Dati
LinkedCT
22/01/2015Carlo Bidoia
http://lod-cloud.net
Esplicitare le connessioni tra i dati
Geospecies
22/01/2015Carlo Bidoia
http://datahub.io/dataset/geospecies
3. Integrazione dei Dati nel Web
• L’integrazione dei dati implica il combinare dati che risiedono
in siti differenti e il fornire l’utente con una visione unificata
di questi dati.
• L’integrazione dei dati nel Web può essere implementata con
modelli specifici per addetti ai lavori.
22/01/2015Carlo Bidoia
Le tre richieste perché funzioni il Web semantico
• Logica unificante
– Mette insieme le varie ontologie e le regole che le dominano
– Inferenze e significati comuni/condivisi
• Prove/evidenze
– Spiegazione dei dati di inferenza, della provenienza dei dati
• Credito/fiducia
– Fiducia che il sistema operi correttamente
– Fiducia che il sistema possa spiegare ciò che sta facendo
– Rete di fiducia per le origini dei dati e dei servizi
22/01/2015Carlo Bidoia
Accatastamento del Web Semantico
22/01/2015Carlo Bidoia
• Evolution Web 1.0, Web 2.0 to Web 3.0
• https://www.youtube.com/watch?v=bsNcjya56v8
• Web today -Web 2.0
• https://www.youtube.com/watch?v=6gmP4nk0EOE
• The Future Internet: Service Web 3.0
• https://www.youtube.com/watch?v=off08As3siM
• Web 3.0 - The Internet of Things!
• https://www.youtube.com/watch?v=F_nbUizGeEY
• Web 3.0
• http://www.sti-innsbruck.at/results/movies/web-30
22/01/2015Carlo Bidoia
Per i più curiosi…
Sitografia e bibliografia
• “A Survey on Tools Essential for Semantic Web Research”,
International Journal of Computer Applications (0975 – 8887)
Volume 62, No.9, January 2013
• “A Review on Semantic-Based Web Mining and its
Applications”, Sivakumar J et al., International Journal of
Engineering and Technology (IJET)
• “How robust is the Internet?”, Yuhai Tu, Nature 406, 353-354
(27 July 2000), doi:10.1038/35019222
• T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”,
Scientific American, May 2001
• KarwanJacksi.net
• lod-cloud.net
• datahub.io/dataset/geospecies
22/01/2015Carlo Bidoia
Sitografia e bibliografia
• Wikipedia
– https://en.wikipedia.org/wiki/Internet
– https://en.wikipedia.org/wiki/World_Wide_Web
– https://en.wikipedia.org/wiki/Web_2.0
– http://en.wikipedia.org/wiki/Semantic_Web
– https://en.wikipedia.org/wiki/Amazon_Mechanical_Turk
– http://en.wikipedia.org/wiki/Linked_Data
• Altro
– http://www.w3.org/TR/xslt
– http://www.ontoprise.de
– http://linkeddata.org
– http://www.w3.org/People/Ivan/CorePresentations/SWTutorial/Slides.pdf
– http://sti-innsbruck.at/sites/default/files/courses/01_SW-Introduction.pdf
– http://facweb.cs.depaul.edu/mobasher/classes/it130/internet-
www/index.html
22/01/2015Carlo Bidoia
22/01/2015Carlo Bidoia

Web semantico

  • 1.
    Carlo Bidoia Insegnante discienze matematiche fisiche e naturali Olgiate Comasco, 19/01/15 Tratto liberamente dal lavoro del Dr Karwan Jacksi Web semantico
  • 2.
    L’evoluzione della reteInternet Internet Web 1.0 Web 2.0 Web semantico 22/01/2015Carlo Bidoia
  • 3.
    1-Internet • La reteè un sistema globale di calcolatori interconnessi che usa lo standard Internet Protocol Suite (TCP/IP) per servire miliardi di utenti in tutto il mondo. • È una rete di reti che consiste in milioni di reti pubbliche e private, accademiche, professionali e del governo di estensione da locale a globale che sono legate da un ampia varietà di tecnologie di connessione ottiche ed elettroniche. 22/01/2015Carlo Bidoia
  • 4.
    Dal seguente articolo: Howrobust is the Internet? Yuhai Tu Nature 406, 353-354(27 July 2000) doi:10.1038/35019222 The map was created using the skitter tool (developed by D. McRobb at CAIDA) which sends out small packets of data from a source to many destinations through the Internet. The data collected by skitter give a snapshot of the Internet at a particular moment. (Graph created by B. Huffaker using graph layout code provided by B. Cheswick and H. Burch.) 22/01/2015Carlo Bidoia
  • 5.
  • 6.
    2- Web 1.0 •Il World Wide Web ("WWW" o semplicemente il "Web") è un sistema di documenti ipertestuali interconnessi in internet • Con un Web browser, un utente vede pagine Web che possono contenere testo, immagini, e altri contenuti multimediali, e naviga tra loro usando hyperlink ovvero collegamenti. 22/01/2015Carlo Bidoia
  • 7.
    2- Principi delWeb 1.0 • Il successo del Web 1.0 è basato su tre semplici principi: 1. Uno schema semplice ed uniforme per identificare pezzi di informazione, cioè l’Uniform Resource Identifiers (URIs) o Uniform Resource Locator (URL) 2. Un formalismo semplice ed uniforme per strutturare pezzi di informazione permettendo ai browser di rappresentarli, cioè l’Hyper Text Markup Language (HTML) 3. Un protocollo semplice ed uniforme per accedere ai pezzi di informazione, cioè l’Hyper Text Transfer Protocol (HTTP) 22/01/2015Carlo Bidoia
  • 8.
    3- Web 2.0 Iltermine "Web 2.0" (2004–presente) è comunemente associato con applicazioni web che facilitano la condivisione interattiva di informazioni, l’interoperabilità, design centrato sull’utente, e la collaborazione nel World-Wide Web 22/01/2015Carlo Bidoia
  • 9.
    Web 2.0 Un sitoWeb 2.0 permette agli utenti di interagire e collaborare tra di loro in un dialogo di social media come creatori di contenuto generato dagli utenti in una comunità virtuale, in contrasto con siti web dove l’accesso è limitato alla visione del contenuto. commenti social networks blogs wikis siti di condivisione multimediale 22/01/2015Carlo Bidoia
  • 10.
    Web 2.0 Con latecnologia del Web 1.0, un ingente investimento in capacità informatiche e in software era necessario per pubblicare informazioni. Con la tecnologia Web 2.0 tutto è cambiato. 22/01/2015Carlo Bidoia Rich Site Summary
  • 11.
     Svolte prodottedal Web 2.0 1. Sfumare la separazione tra consumatore e produttore di contenuti (Wiki, Blog, Flickr, Twitter, Youtube, …) 2. Spostare l’attenzione dai contenuti per gli individui ai contenuti per le comunità (Facebook, LinkedIn, …) 3. Sfumare la distinzione tra fruitori e fornitori di servizi (Amazon, Unilibro, Wordpress, Questbase, Aruba, …) 4. Integrare il lavoro umano e del calcolatore in una maniera innovativa (mix di lavoro manuale e automatico, come Amazon Mechanical Turk) 22/01/2015Carlo Bidoia
  • 12.
     Limitazioni delWeb 2.0 A. Trovare informazioni rilevanti B. Estrarre informazioni rilevanti C. Combinare e riusare informazioni 22/01/2015Carlo Bidoia
  • 13.
    A- Trovare informazionirilevanti 22/01/2015Carlo Bidoia
  • 14.
    Trovare informazioni rilevanti •Il reperimento di informazioni sul web è attualmente basato sulla ricerca per parole chiave (keyword) • La ricerca per parola chiave ha limiti nella precisione e capacità di richiamo a causa di : – Sinonimia: “macchina” non include “automobile” – Omonimia: “boa” dà risultati per Bank of America Kwon Boa, cantante Boa constrictor la boa 22/01/2015Carlo Bidoia
  • 15.
    Trovare informazioni rilevanti •I limiti di precisione e richiamo efficace sono dovuti anche a: – Varianti linguistiche (molto più comuni in inglese) – Lingue differenti – Errori di digitazione • I motori di ricerca attualmente non permettono di specificare la relazione tra una parola chiave e la risorsa in rete – Ad esempio: “acquisto” non porta neessariamente a siti di e-commerce. 22/01/2015Carlo Bidoia
  • 16.
    B- Estrarre informazionirilevanti • Non esiste una soluzione automatica per estrarre informazioni da pagine Web a causa di formati differenti e differente sintassi • Anche da una singola pagina è difficile estrarre le informazioni rilevanti: Quale libro parla di boa? Qual è il prezzo del libro? 22/01/2015Carlo Bidoia
  • 17.
    Estrarre informazioni rilevanti Datistrutturati, Database, XML Structure estrae annota struttura 22/01/2015Carlo Bidoia Trasformazione XML: eXtensible Markup Language
  • 18.
    C- Combinare eriusare informazioni Gli obiettivi che ci si pongono spesso coivolgono la necessità di combinare i dati raccolti 1. Vogliamo raccogliere informazioni simili su differenti raccolte digitali (comprendere un argomento di lezione,…) 2. Vogliamo le informazioni che provengono da siti web differenti perché dobbiamo combinarle insieme (fare una ricerca di scienze,…) 22/01/2015Carlo Bidoia
  • 19.
    Combinare e riusareinformazioni 1. Le informazioni simili su differenti raccolte digitali Esempio: un viaggio da Innsbruck a Roma (FS, OBB, offerte biglietti) 22/01/2015Carlo Bidoia
  • 20.
    Combinare e riusareinformazioni 2. Le informazioni provengono da siti web differenti e necessitano di essere combinate Esempio: un viaggio da Innsbruck a Roma dove devo pernottare e visitare i musei cittadini 22/01/2015Carlo Bidoia
  • 21.
    Come migliorare ilWeb attuale? • Aumentando la connessione automatica tra i dati • Aumentanto precisione e capacità di richiamo nelle ricerche • Aumentando l’automazione nell’integrazione dei dati e dei servizi 22/01/2015Carlo Bidoia Forse la soluzione è l’attribuzione semantica ai dati e ai servizi
  • 22.
    Cos’è il Websemantico? • “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” Dall’articolo: T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001 22/01/2015Carlo Bidoia well-defined meaning
  • 23.
    Bisogna definire utiliontologie L’ontologia è (per questo scopo): la formale, esplicita specificazione di una concettualizzazione condivisa 22/01/2015Carlo Bidoia
  • 24.
    Come ad esempionella mappa concettuale per la scuola: • Concetti • Proprietà • Relazioni • Assiomi (per esperti informatici e filosofi) Persona Studente Docente Lezione Nome email Matricola nr disciplina argomentoLezione nr segue tiene Tiene (Docente, Lezione) => Lezione.argomento = Docente.disciplina 22/01/2015Carlo Bidoia
  • 25.
    Web semantico deiDati 1. Annotazione semantica dei Dati nel Web 2. Web dei Dati 3. Integrazione dei Dati nel Web 22/01/2015Carlo Bidoia
  • 26.
    1. Annotazione semanticadei Dati nel Web Connettere oggetti Web (sintassi) con il loro significato (semantica) come in questo esempio: 22/01/2015Carlo Bidoia
  • 27.
    2. Web deiDati LinkedCT 22/01/2015Carlo Bidoia http://lod-cloud.net Esplicitare le connessioni tra i dati
  • 28.
  • 29.
    3. Integrazione deiDati nel Web • L’integrazione dei dati implica il combinare dati che risiedono in siti differenti e il fornire l’utente con una visione unificata di questi dati. • L’integrazione dei dati nel Web può essere implementata con modelli specifici per addetti ai lavori. 22/01/2015Carlo Bidoia
  • 30.
    Le tre richiesteperché funzioni il Web semantico • Logica unificante – Mette insieme le varie ontologie e le regole che le dominano – Inferenze e significati comuni/condivisi • Prove/evidenze – Spiegazione dei dati di inferenza, della provenienza dei dati • Credito/fiducia – Fiducia che il sistema operi correttamente – Fiducia che il sistema possa spiegare ciò che sta facendo – Rete di fiducia per le origini dei dati e dei servizi 22/01/2015Carlo Bidoia
  • 31.
    Accatastamento del WebSemantico 22/01/2015Carlo Bidoia
  • 32.
    • Evolution Web1.0, Web 2.0 to Web 3.0 • https://www.youtube.com/watch?v=bsNcjya56v8 • Web today -Web 2.0 • https://www.youtube.com/watch?v=6gmP4nk0EOE • The Future Internet: Service Web 3.0 • https://www.youtube.com/watch?v=off08As3siM • Web 3.0 - The Internet of Things! • https://www.youtube.com/watch?v=F_nbUizGeEY • Web 3.0 • http://www.sti-innsbruck.at/results/movies/web-30 22/01/2015Carlo Bidoia Per i più curiosi…
  • 33.
    Sitografia e bibliografia •“A Survey on Tools Essential for Semantic Web Research”, International Journal of Computer Applications (0975 – 8887) Volume 62, No.9, January 2013 • “A Review on Semantic-Based Web Mining and its Applications”, Sivakumar J et al., International Journal of Engineering and Technology (IJET) • “How robust is the Internet?”, Yuhai Tu, Nature 406, 353-354 (27 July 2000), doi:10.1038/35019222 • T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001 • KarwanJacksi.net • lod-cloud.net • datahub.io/dataset/geospecies 22/01/2015Carlo Bidoia
  • 34.
    Sitografia e bibliografia •Wikipedia – https://en.wikipedia.org/wiki/Internet – https://en.wikipedia.org/wiki/World_Wide_Web – https://en.wikipedia.org/wiki/Web_2.0 – http://en.wikipedia.org/wiki/Semantic_Web – https://en.wikipedia.org/wiki/Amazon_Mechanical_Turk – http://en.wikipedia.org/wiki/Linked_Data • Altro – http://www.w3.org/TR/xslt – http://www.ontoprise.de – http://linkeddata.org – http://www.w3.org/People/Ivan/CorePresentations/SWTutorial/Slides.pdf – http://sti-innsbruck.at/sites/default/files/courses/01_SW-Introduction.pdf – http://facweb.cs.depaul.edu/mobasher/classes/it130/internet- www/index.html 22/01/2015Carlo Bidoia
  • 35.