Pancia Asia-La vita di Steve Jobs-Adriano Olivetti-Bill Gates.pptx
Web semantico
1. Carlo Bidoia
Insegnante di scienze matematiche fisiche e naturali
Olgiate Comasco, 19/01/15
Tratto liberamente dal lavoro del Dr Karwan Jacksi
Web semantico
2. L’evoluzione della rete Internet
Internet
Web 1.0
Web 2.0
Web semantico
22/01/2015Carlo Bidoia
3. 1-Internet
• La rete è un sistema globale di calcolatori interconnessi
che usa lo standard Internet Protocol Suite (TCP/IP) per
servire miliardi di utenti in tutto il mondo.
• È una rete di reti che consiste in milioni di reti pubbliche e
private, accademiche, professionali e del governo di
estensione da locale a globale che sono legate da un ampia
varietà di tecnologie di connessione ottiche ed elettroniche.
22/01/2015Carlo Bidoia
4. Dal seguente articolo:
How robust is the Internet?
Yuhai Tu
Nature 406, 353-354(27 July 2000)
doi:10.1038/35019222
The map was created
using the skitter tool
(developed by D.
McRobb at CAIDA) which
sends out small packets
of data from a source to
many destinations
through the Internet.
The data collected by
skitter give a snapshot
of the Internet at a
particular moment.
(Graph created by B.
Huffaker using graph
layout code provided by
B. Cheswick and H.
Burch.)
22/01/2015Carlo Bidoia
6. 2- Web 1.0
• Il World Wide Web ("WWW" o semplicemente il "Web") è un
sistema di documenti ipertestuali interconnessi in internet
• Con un Web browser, un utente vede pagine Web che
possono contenere testo, immagini, e altri contenuti
multimediali, e naviga tra loro usando hyperlink ovvero
collegamenti.
22/01/2015Carlo Bidoia
7. 2- Principi del Web 1.0
• Il successo del Web 1.0 è basato su tre semplici principi:
1. Uno schema semplice ed uniforme per identificare pezzi di
informazione, cioè l’Uniform Resource Identifiers (URIs) o
Uniform Resource Locator (URL)
2. Un formalismo semplice ed uniforme per strutturare pezzi di
informazione permettendo ai browser di rappresentarli, cioè
l’Hyper Text Markup Language (HTML)
3. Un protocollo semplice ed uniforme per accedere ai pezzi di
informazione, cioè l’Hyper Text Transfer Protocol (HTTP)
22/01/2015Carlo Bidoia
8. 3- Web 2.0
Il termine "Web 2.0" (2004–presente) è comunemente
associato con applicazioni web che facilitano la condivisione
interattiva di informazioni, l’interoperabilità, design centrato
sull’utente, e la collaborazione nel World-Wide Web
22/01/2015Carlo Bidoia
9. Web 2.0
Un sito Web 2.0 permette agli utenti di interagire e
collaborare tra di loro in un dialogo di social media come
creatori di contenuto generato dagli utenti in una comunità
virtuale, in contrasto con siti web dove l’accesso è limitato alla
visione del contenuto.
commenti
social networks
blogs
wikis
siti di condivisione multimediale
22/01/2015Carlo Bidoia
10. Web 2.0
Con la tecnologia del Web 1.0,
un ingente investimento in
capacità informatiche e in
software era necessario per
pubblicare informazioni.
Con la tecnologia Web 2.0
tutto è cambiato.
22/01/2015Carlo Bidoia
Rich Site Summary
11. Svolte prodotte dal Web 2.0
1. Sfumare la separazione tra consumatore e produttore di
contenuti (Wiki, Blog, Flickr, Twitter, Youtube, …)
2. Spostare l’attenzione dai contenuti per gli individui ai
contenuti per le comunità (Facebook, LinkedIn, …)
3. Sfumare la distinzione tra fruitori e fornitori di servizi
(Amazon, Unilibro, Wordpress, Questbase, Aruba, …)
4. Integrare il lavoro umano e del calcolatore in una maniera
innovativa (mix di lavoro manuale e automatico, come Amazon
Mechanical Turk)
22/01/2015Carlo Bidoia
12. Limitazioni del Web 2.0
A. Trovare informazioni rilevanti
B. Estrarre informazioni rilevanti
C. Combinare e riusare informazioni
22/01/2015Carlo Bidoia
14. Trovare informazioni rilevanti
• Il reperimento di informazioni sul web è attualmente
basato sulla ricerca per parole chiave (keyword)
• La ricerca per parola chiave ha limiti nella precisione e
capacità di richiamo a causa di :
– Sinonimia: “macchina” non include “automobile”
– Omonimia: “boa” dà risultati per
Bank of America
Kwon Boa, cantante
Boa constrictor
la boa
22/01/2015Carlo Bidoia
15. Trovare informazioni rilevanti
• I limiti di precisione e richiamo efficace sono dovuti
anche a:
– Varianti linguistiche (molto più comuni in inglese)
– Lingue differenti
– Errori di digitazione
• I motori di ricerca attualmente non permettono di
specificare la relazione tra una parola chiave e la risorsa
in rete
– Ad esempio: “acquisto” non porta neessariamente a
siti di e-commerce.
22/01/2015Carlo Bidoia
16. B- Estrarre informazioni rilevanti
• Non esiste una soluzione automatica per estrarre informazioni
da pagine Web a causa di formati differenti e differente
sintassi
• Anche da una singola pagina è difficile estrarre le informazioni
rilevanti:
Quale libro parla
di boa?
Qual è il prezzo
del libro?
22/01/2015Carlo Bidoia
17. Estrarre informazioni rilevanti
Dati strutturati,
Database,
XML
Structure
estrae
annota
struttura
22/01/2015Carlo Bidoia
Trasformazione XML:
eXtensible Markup
Language
18. C- Combinare e riusare informazioni
Gli obiettivi che ci si pongono spesso coivolgono la necessità di
combinare i dati raccolti
1. Vogliamo raccogliere informazioni simili su differenti raccolte
digitali (comprendere un argomento di lezione,…)
2. Vogliamo le informazioni che provengono da siti web differenti
perché dobbiamo combinarle insieme (fare una ricerca di
scienze,…)
22/01/2015Carlo Bidoia
19. Combinare e riusare informazioni
1. Le informazioni simili su differenti raccolte digitali
Esempio: un viaggio da Innsbruck a Roma (FS, OBB, offerte biglietti)
22/01/2015Carlo Bidoia
20. Combinare e riusare informazioni
2. Le informazioni provengono da siti web differenti e necessitano
di essere combinate
Esempio: un viaggio da Innsbruck a Roma dove devo
pernottare e visitare i musei cittadini
22/01/2015Carlo Bidoia
21. Come migliorare il Web attuale?
• Aumentando la connessione automatica tra i dati
• Aumentanto precisione e capacità di richiamo nelle ricerche
• Aumentando l’automazione nell’integrazione dei dati e dei
servizi
22/01/2015Carlo Bidoia
Forse la soluzione è
l’attribuzione semantica ai dati e ai servizi
22. Cos’è il Web semantico?
• “The Semantic Web is an extension of the current web in
which information is given well-defined meaning, better
enabling computers and people to work in cooperation.”
Dall’articolo:
T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”,
Scientific American, May 2001
22/01/2015Carlo Bidoia
well-defined meaning
23. Bisogna definire utili ontologie
L’ontologia è (per questo scopo):
la formale, esplicita specificazione di
una concettualizzazione condivisa
22/01/2015Carlo Bidoia
24. Come ad esempio nella mappa concettuale per la scuola:
• Concetti
• Proprietà
• Relazioni
• Assiomi
(per esperti informatici e filosofi)
Persona
Studente Docente
Lezione
Nome email
Matricola nr
disciplina
argomentoLezione nr
segue tiene
Tiene (Docente, Lezione) =>
Lezione.argomento = Docente.disciplina
22/01/2015Carlo Bidoia
25. Web semantico dei Dati
1. Annotazione semantica dei Dati nel Web
2. Web dei Dati
3. Integrazione dei Dati nel Web
22/01/2015Carlo Bidoia
26. 1. Annotazione semantica dei Dati nel Web
Connettere oggetti Web (sintassi) con il loro significato (semantica)
come in questo esempio:
22/01/2015Carlo Bidoia
27. 2. Web dei Dati
LinkedCT
22/01/2015Carlo Bidoia
http://lod-cloud.net
Esplicitare le connessioni tra i dati
29. 3. Integrazione dei Dati nel Web
• L’integrazione dei dati implica il combinare dati che risiedono
in siti differenti e il fornire l’utente con una visione unificata
di questi dati.
• L’integrazione dei dati nel Web può essere implementata con
modelli specifici per addetti ai lavori.
22/01/2015Carlo Bidoia
30. Le tre richieste perché funzioni il Web semantico
• Logica unificante
– Mette insieme le varie ontologie e le regole che le dominano
– Inferenze e significati comuni/condivisi
• Prove/evidenze
– Spiegazione dei dati di inferenza, della provenienza dei dati
• Credito/fiducia
– Fiducia che il sistema operi correttamente
– Fiducia che il sistema possa spiegare ciò che sta facendo
– Rete di fiducia per le origini dei dati e dei servizi
22/01/2015Carlo Bidoia
32. • Evolution Web 1.0, Web 2.0 to Web 3.0
• https://www.youtube.com/watch?v=bsNcjya56v8
• Web today -Web 2.0
• https://www.youtube.com/watch?v=6gmP4nk0EOE
• The Future Internet: Service Web 3.0
• https://www.youtube.com/watch?v=off08As3siM
• Web 3.0 - The Internet of Things!
• https://www.youtube.com/watch?v=F_nbUizGeEY
• Web 3.0
• http://www.sti-innsbruck.at/results/movies/web-30
22/01/2015Carlo Bidoia
Per i più curiosi…
33. Sitografia e bibliografia
• “A Survey on Tools Essential for Semantic Web Research”,
International Journal of Computer Applications (0975 – 8887)
Volume 62, No.9, January 2013
• “A Review on Semantic-Based Web Mining and its
Applications”, Sivakumar J et al., International Journal of
Engineering and Technology (IJET)
• “How robust is the Internet?”, Yuhai Tu, Nature 406, 353-354
(27 July 2000), doi:10.1038/35019222
• T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”,
Scientific American, May 2001
• KarwanJacksi.net
• lod-cloud.net
• datahub.io/dataset/geospecies
22/01/2015Carlo Bidoia