Siamo un gruppo di Teoria e Tecnologia della Comunicazione dell'università Bicocca e presentiamo i seguenti motori di ricerca semantici:
Wolfram Alpha
DuckDuck Go
Free Base
Bing
DeepDyve
1. CORSO DI STRUMENTI E APPLICAZIONI DEL WEB
2014/15
SEMANTIC SEARCH
ENGINE
The future web 3.0Prof. Roberto Polillo Bernadette
Cama
Valentina Primiceri
Davide
2. Queste slides fanno parte del corso “Strumenti e applicazioni del
Web”. Il sito del corso, con il materiale completo, si trova in
www.corsow.wordpress.com.
Il presente materiale è pubblicato con licenza Creative Commons
“Attribuzione - Non commerciale - Condividi allo stesso modo –
3.0” (http://creativecommons.org/licenses/by-nc-
sa/3.0/it/deed.it):
La licenza non si estende alle immagini provenienti da altre fonti
e alle screen shots, i cui diritti restano in capo ai rispettivi
proprietari, che, ove possibile, sono stati indicati. L'autore si
scusa per eventuali omissioni, e resta a disposizione per
correggerle.
3. • Introduzione
• Web Semantico
• Freebase
• Bing
• DeepDyve
• DuckDuckGo
• Wolfram Alpha
• Conclusioni
{
{
{
PRIMA
PARTE
TERZA
PARTE
SECONDA
PARTE
4. INTRODUZIONE
“il Web semantico è un’estensione del Web corrente in cui le
informazioni hanno un ben preciso significato e in cui i
computer e utenti lavorano in cooperazione.”
Fonte: Semantic Web-Scientific American, Maggio 2001
5. WEB SEMANTICO
Il termine Web semantico è stato proposto nel 2001 da Tim
Berners-Lee.
• trasformazione del World Wide Web in un ambiente dove i
documenti pubblicati sono associati ad informazioni e dati che
ne specificano il contesto semantico
6. WEB 3.0 E INTELLIGENZA SEMANTICA
• indicare quelle tecnologie in grado di trasformare informazioni
non strutturate in un insieme di informazioni strutturate che
può essere interpretato ed elaborato automaticamente sulla
base delle proprietà semantiche dei dati.
• in grado di lavorare con i "concetti": reso possibile dalla
combinazione di analisi semantica e codici di mark-up, che
riescono a tradurre in linguaggio informatico i domini della
conoscenza.
8. METADATI
.raggiungimento dei seguenti obiettivi:
• Ricerca: individuazione dell’esistenza di un determinato documento
• Localizzazione: rintracciare dove si trova una particolare occorrenza di quel
documento
• Selezione: di un determinato documento in base a valutazioni e/o filtri
• Interoperabilità semantica: che permette la ricerca in ambiti disciplinari
diversi, grazie all’uso di descrizioni equivalenti
• Gestione risorse: gestione di raccolte di documenti tramite cataloghi e
banche dati
• Disponibilità: avere informazioni sull’effettiva disponibilità del documento.
9. ONTOLOGIE
“un’ontologia è una collezione di frasi che definiscono le
relazioni tra concetti e specificano le regole logiche”
Fonte: Tim Berners-Lee, 99
10. MOTORI DI RICERCA SEMANTICI
• l’input dell’utente è una frase o una domanda
• il motore guida l’utente direttamente verso l’informazione
ricercata
• è possibile recuperare documenti esprimendo query complesse
12. Freebase
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Multilanguage
• Creative Commons
• Risorsa globale che permette alle persone (e alle
macchine) di accedere all'informazione più
efficacemente
«un database aperto di
conoscenza condivisa
del mondo» (Metaweb)
Global Rark
36,716
Alexa.com
16. ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
17. ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
• Promozione degli utenti
18. ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
• Promozione degli utenti
• Argomenti tradotti in più lingue
19. ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
• Promozione degli utenti
• Argomenti tradotti in più lingue
• Verrà ritirato entro il 30 giugno 2015
20. Bing
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Nato da Live Search
• Terzo motore di ricerca al mondo
• Suggerimenti e ricerche correlate
Fonti: http://www.webmaori.com/blog/bing-il-motore-di-ricerca-semantico-sfida-
Global Rank
24
Alexa.com
"But it's not
Google"
21. • Calcoli matematici
• Ricerche su enciclopedia
• Info mediche
• Risultati sportivi e di
borsa
• Etc..Fonti:http://www.bing.com/?setlang=it
22.
23.
24. DeepDyv
e
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Biblioteca commerciale online
• 30 milioni di articoli
• Diverse opzioni di abbonamento e noleggio
Fonti:https://www.deepdyve.com/
Global Rank
56,794
Alexa.com
25.
26. DuckDuck
Go
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Migliore pertinenza di ricerca
• Non traccia gli utenti
• Filtra pagine con pubblicità eccessiva
Fonti:https://duckduckgo.com/
Global Rank
569
Alexa.com
27.
28. • Tipo: motore di conoscenza computazionale
• Creato da: Wolfram Research
• Registrazione: Opzionale
• Lanciato: 15 maggio 2009
• Modello di business: Freemium
• Slogan: Making the World's Knowledge Computable
INTRODUZIONE
30. Stephan Wolfram, CEO of Wolfram
Research
«Tutto ciò che si deve essere in grado di fare
è quello di rispondere alle domande in
linguaggio naturale che la gente pone, e
rappresentarle in una forma precisa,
rendendo tutta la conoscenza computabile e
accessibile da tutti»
32. PRINCIPALI CARATTERISTICHE:
• In grado di interpretare query sia in linguaggio formale che in
lingua naturale;
• Attualmente incentrato sulle scienze tecniche (matematica,
fisica, chimica,…);
• E’ solo in Inglese;
• La registrazione consente personalizzazioni.
33. COM’E’ STRUTTURATO:
• Scritto in oltre 15 milioni di righe di codice basato sul
linguaggio di Mathematica
• 50.000 algoritmi;
• Eseguito su più di 10.000 CPU;
• l suoi database comprendono centinaia di dataset (es:
«Condizioni meteo»):
• accumulati in diversi anni;
• controllati e certificati da esperti con conoscenze pertinenti
48. CONCLUSIONI
VANTAGGI
• Supporto come strumento educativo
• Capacità di eseguire calcoli complessi
• Creazione di widget intuitivi per il buisness
• Organizzazione della conoscenza
SVANTAGGI
• Tecnologia ancora non completamente sviluppata
• L’utente medio non lo utilizza
• Difficoltà di utilizzo