SlideShare a Scribd company logo
1 of 43
Edizione 2012-13
Università degli Studi di Milano Bicocca
Dipartimento di Informatica, Sistemistica e Comunicazione
Corso di Strumenti e applicazioni del Web
6. Ricercare nel Web
Queste slides
2
Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Il
sito del corso, con il materiale completo, si trova in
www.corsow.wordpress.com . Data la rapida evoluzione della rete, il corso
viene aggiornato ogni anno.
Il presente materiale è pubblicato con licenza Creative Commons
“Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0”
(http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ):
La licenza non si estende alle immagini provenienti da altre fonti e
alle screen shots, i cui diritti restano in capo ai rispettivi proprietari,
che, ove possibile, sono stati indicati. L'autore si scusa per eventuali
omissioni, e resta a disposizione per correggerle.
R.Polillo - Marzo 2013
Una visualizzazione [di una parte] del web
La immagine mostra una porzione di Internet costituita da 535.000 nodi e più di 600.000 links
WALRUS Visualization tool, 2001 http://www.caida.org/tools/visualization/walrus/
R.Polillo - Marzo 2013
3
4
R.Polillo - Marzo 2013
Una visualizzazione [di una parte] del web
R.Polillo - Marzo 2013
5
Una visualizzazione [di una parte] del web
Come trovare l'informazione in rete
 Directories
Indici strutturati di argomenti (gestiti da una redazione)
 Motori di ricerca
Query → Risultati
 Esplorazione
Browsing, serendipity
 Motori semantici
www.wolframalpha.com, …
 Sistemi di Q&A sociale
Yahoo! Answer, …
R.Polillo - Marzo 2013
6
Web directories
7
 Storicamente, il primo strumento di ausilio alle ricerche
nel Web
 Classificazione gerarchica dei siti (e non delle pagine) in
categorie e sottocategorie, a più livelli, effettuata "a
mano" -> varie "tassonomie"
 Directories “generaliste” e directories verticali o di nicchia
 http://en.wikipedia.org/wiki/Web_directory
R.Polillo - Marzo 2013
Tassonomia
8
Emporio celeste dei riconoscimenti benevoli
(Enciclopedia cinese, J.L.Borges, 1973)
Gli animali si dividono in:
a) Appartenenti all’imperatore
b) Imbalsamati
c) Ammaestrati
d) Lattonzoli
e) Sirene
f) Favolosi
g) Cani randagi
h) Inclusi in questa classificazione
i) Che si agitano come pazzi
j) Innumerevoli
k) Disegnati con un pennello finissimo di peli di
cammello
l) Eccetera
m) Che hanno ritto il vaso
n) Che da lontano sembrano mosche.
R.Polillo - Marzo 2013
 Raggruppamento
di oggetti in
classi, secondo
qualche criterio
 taxis=ordine
nomos=regola
 Ogni tassonomia
è arbitraria, e
dipende dagli
obiettivi
Yahoo! (http://dir.yahoo.com)
9
R.Polillo - Marzo 2013
- Nasce come “La guida al
WWW di Jerry e David”,
nel 1994
- Qui la home del 1996, da
www.archive.org
http://en.wikipedia.org/wiki/Interne
The Open Directory Project (ODP)
10
 Nota anche come DMOZ (Directory Mozilla http://www.dmoz.org/
 Directory gratuita, aperta e multilingua
 Posseduta da Netscape (dal 1998) e manutenuta da una comunità di
editor volontari
 http://en.wikipedia.org/wiki/Open_Directory_Project
R.Polillo - Marzo 2013
Domoz vs Yahoo!
R.Polillo - Marzo 2013
11
Dmoz Yahoo!
Wikipedia come strumento di ricerca
12
 Wikipedia è un formidabile strumento di ricerca e accesso
al web
 Ogni voce di Wikipedia è corredata da numerosi link
interni ed esterni, che spesso permettono di raggiungere i
siti più significativi correlati all’argomento esaminato
 Inoltre Wikipedia contiene numerosi indici e directories,
fra cui anche veri e propri portali tematici
(http://en.wikipedia.org/wiki/Portal:List_of_portals )
R.Polillo - Marzo 2013
Serendipità
13
 Cerco una cosa e ne trovo un'altra
 Nome coniato da Horace Walpole, tratto dalla fiaba “I tre principi di
Serendip” (Serendip è l'antico nome di Sri Lanka)
 Serve fortuna (“il caso”) e un atteggiamento di apertura: per
cogliere l'indizio che porterà alla scoperta occorre essere aperti alla
ricerca e riconoscere il valore di esperienze che non corrispondono
alle originarie aspettative
 http://en.wikipedia.org/wiki/Serendipity
 http://serendip.brynmawr.edu/serendip/about.html
R.Polillo - Marzo 2013
14 R.Polillo - Marzo 2013
www.stumbleupon.com
16
 to stumble: inciampare, scoprire per caso
 È una discovery engine di pagine web, fondato in Canada nel 2001
 Premendo il bottone STUMBLE! installato sul browser, viene
proposto un sito, un’immagine o un video scelti sulla base delle
preferenze dell’utente, o delle raccomandazioni dei suoi amici o da
altri utenti che hanno interessi simili
 Il processo di selezione si affina sulla base del gradimento espresso
(opzionalmente) dall’utente:
R.Polillo - Marzo 2013
Motori di ricerca per il Web
 Componente software (utilizzabile come servizio
online) progettato per ricercare informazioni sul
World Wide Web
 Le informazioni (di solito nella forma di link) sono
presentate in una serie di Search Engine Results
Page (SERP)
 La qualità di un motore si valuta sulla base della
pertinenza e rilevanza dei risultati
R.Polillo - Marzo 2013
17
Motori di ricerca
Una storia complessa, iniziata negli anni '90. Oggi, i primi 3:
Google
- Dal 1998
Bing
- Dal 2009
- Prima: MSN Search,
Windows Live Search,
Live Search
Yahoo!
- Con motori esterni
(dal 1999 "Powered by Bing")
R.Polillo - Marzo 2013
18
Market share, Jan 2013,
http://www.statowl.com
Motori di ricerca: struttura
R.Polillo - Marzo 2013
19
Interfaccia
Query
processing
Ranking
dei risultati
Query
Risultat
i
(SERP)
Front-end process
Indici + cached
pages
Crawler
Crawler
IndicizzatoreCrawler
Richiest
e
Pagine
web
Pagine
web
WWW
Back-end process
Web crawling
 I crawler (robot, spider, bot) sono programmi che
navigano il Web, esaminando le diverse pagine e
seguendo i link in esse presenti
 Seguono opportune politiche di navigazione (per
es. per decidere quando riesaminare una pagina già
vista)
 L'interazione con i Web server segue specifici
protocolli (per es. robot exclusion protocol, o
robot.txt)
 Non tutto il Web è accessibile ai crawler
R.Polillo - Marzo 2013
21
robots.txt: esempio
www.domain.com
R.Polillo - Marzo 2013
22
/
robots.t
xt
utenti
foto
about
User-agent: Google
Disallow /utenti/foto
Allow: *
Crawl-delay: 20 sec
Deep vs surface Web
 Non tutto il Web è accessibile ai motori di ricerca
 Il Web invisibile ("deep Web") è parecchi ordini di
grandezza più vasto del Web visibile ("surface
Web")
 Deep Web, esempi:
 Pagine "vietate" dai Web server (robots.txt)
 Pagine generate dinamicamente a fronte di query o di input
forniti attraverso form
 Pagine senza link entranti
 Pagine accessibili tramite registrazione e login
 Ecc.
R.Polillo - Marzo 2013
23
Struttura del web: uno studio
Analisi di 203 milioni di pagine, nel 1999: Broder et al., Graph structure in the web,
WWW Conference 2000, http://www9.org/w9cdrom/160/160.html
17 million nodes
24
R.Polillo - Marzo 2013
Tipi di query
 Informativa
Obiettivo: trovare un'informazione
 Navigazionale
Obiettivo: trovare una pagina web, che conosco già
 Risorsa
Obiettivo: trovare una risorsa (non informativa)
disponibile sul web
 Il risultato è di solito (ma non sempre!) una lista di link a
pagine web
 Dal contenitore al contenuto
R.Polillo - Marzo 2013
25
Search forms (Google)
R.Polillo - Marzo 2013
26
Semplice: Avanzata:
Posso usare una sintassi
complessa
Esempi:
query AND query
query OR query
-query
term site:url
link: x
…. Cfr.
http://www.google.com/insidesearch/
http://bit.ly/13dakJx
Google: evoluzione della home page
Video sulla evoluzione di www.google.com dal 1998 al 2007
http://www.youtube.com/watch?v=1vgprty39og
R.Polillo - Marzo 2013
27
SERP: struttura tipica
R.Polillo - Marzo 2013
28
Search box
Risultati sponsorizzati
Opzioni per la ricerca
Risultati
"organici"
(non influenzati
dalle
sponsorizzazioni)
Google:
AdWords
La coda lunga delle ricerche
R.Polillo - Marzo 2013
29
Search terms
Frequenza
Alto costo, alta frequenza,
bassa probabilità di
conversione
Basso costo, bassa
frequenza, alta probabilità
di conversione
Google Trends (www.google.com/trends)
R.Polillo - Marzo 2013
30
Vedi anche
www.google.com/zeitgeist/2012
Risultati della ricerca: esempio (Google)
R.Polillo - Marzo 2013
31
PreviewCachedFiat
http://www.googleguide.com/cached_page
s.html
Ranking
 I risultati della ricerca dovrebbero essere
presentati sulla SERP in ordine di "rilevanza" (gli
utenti considerano di solito solo i risultati nella
prima pagina)
 Il successo di un motore di ricerca è fortemente
legato al suo algoritmo di ranking
R.Polillo - Marzo 2013
32
Google PageRank
 Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi
di PhD a Stanford (progetto BackRub, 1995-96),
brevettato a nome della Stanford University
 L'idea: la "importanza" di una pagina Web è tanto
maggiore quante più sono le pagine Web (a loro volta
"importanti") che la linkano
 In sostanza, è il meccanismo con cui vengono valutati i
paper accademici
 S.Brin, L.Page, “The anatomy of a large-scale hypertextual
Web search engine”
 1998: Brin e Page fondano Google Inc
R.Polillo - Marzo 2013
33
PageRank: esempio
34
R.Polillo - Marzo 2013
7
1
1
6
1
1
PageRank: esempio
35
http://en.wikipedia.org/wiki/PageRank
R.Polillo - Marzo 2013Per la spiegazione dell'algoritmo: http://www.cs.cornell.edu/home/kleinber/networks-book/networks-
Risultati della ricerca: non solo link
Provate a cercare (su Google e Bing):
- weather Milano
- time San Francisco
- sunrise New York
- 5*9+(sqrt 10)^3=
- Ernest Hemingway
- Population Milan
- define philosophy
- ristoranti 20143
- movies 20143
- AZ637
- mappa 20143
- mappa corso italia 6 milano
- concessionari Fiat
- ….
R.Polillo - Marzo 2013
37
Search engine
→ Answer
engine
Google: quali servizi di ricerca?
R.Polillo - Marzo 2013
38
Marzo
2013
Google: quali servizi di ricerca?
R.Polillo - Marzo 2013
39
Google: quali servizi di ricerca?
R.Polillo - Marzo 2013
40
Google: quali servizi di ricerca?
R.Polillo - Marzo 2013
41
Search history
 La search history di ciascuno viene salvata nella
"cronologia Web" (Google, Bing)
 È possibile cancellare singoli elementi, o tutti
 Cronologia in Google:
entrare nel proprio account, ed entrare nella
"dashboard"
 Google sulla privacy delle ricerche (2007):
http://www.youtube.com/watch?v=iPkvNr2cpqg
42
SEO / SEM
 SEO: Search Engine Optimization
Metodi e tecniche per migliorare il ranking di un
sito Web, per i vari motori di ricerca
http://http://en.wikipedia.org/wiki/Search_engine_optimization
 SEM: Search Engine Marketing
Attività di promozione di un sito Web per
migliorarne il ranking dei motori di ricerca
http://en.wikipedia.org/wiki/Search_engine_marketing
 Page rank checker: esempio:
http://www.whatsmypr.net
R.Polillo - Marzo 2013
43
SEM/SEO
44
 La posizione (rank) in cui un sito viene mostrato dal motore di ricerca è
estremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltre
la prima pagina)
 Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito cliente
acquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search Engine
Optimization)
 Le tecniche usate non sono sempre corrette: per es. vengono creati siti composti
solo da link per far “salire” i siti che pagano
 Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello che
considera spamming da parte degli specialisti SEM/SEO
 http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it
R.Polillo - Marzo 2013
Google search: per saperne di più
 Help di Google:
http://support.google.com/websearch
 Google Guide (indipendente da Google):
http://www.googleguide.com
 Wikipedia:
http://en.wikipedia.org/wiki/Google_Search
R.Polillo - Marzo 2013
45
Lavoro individuale
 Esplorare accuratamente le funzioni del motore di ricerca di
Google, e confrontarle con quelle di Bing
 Esplorare la propria dashboard (nel proprio account Google), e
verificare quali informazioni sulla vostra storia sono memorizzate
 Esplorate www.wolframalpha.com
R.Polillo - Marzo 2013
46

More Related Content

What's hot

13. Content sharing sites (i)
13. Content sharing sites (i)13. Content sharing sites (i)
13. Content sharing sites (i)Roberto Polillo
 
7. Applicazioni web e CMS
7. Applicazioni web e CMS7. Applicazioni web e CMS
7. Applicazioni web e CMSRoberto Polillo
 
9. Come trovare l'informazione (I)
9. Come trovare l'informazione (I)9. Come trovare l'informazione (I)
9. Come trovare l'informazione (I)Roberto Polillo
 
17. Web feed e aggregatori
17. Web feed e aggregatori17. Web feed e aggregatori
17. Web feed e aggregatoriRoberto Polillo
 
Corso Web 2.0: Net economy FAQ
Corso Web 2.0: Net economy FAQCorso Web 2.0: Net economy FAQ
Corso Web 2.0: Net economy FAQRoberto Polillo
 
Corso Web 2.0: Evoluzione del web
Corso Web 2.0: Evoluzione del webCorso Web 2.0: Evoluzione del web
Corso Web 2.0: Evoluzione del webRoberto Polillo
 
Corso Web 2.0: Il Web come piattaforma
Corso Web 2.0: Il Web come piattaformaCorso Web 2.0: Il Web come piattaforma
Corso Web 2.0: Il Web come piattaformaRoberto Polillo
 
4. Introduzione al web (Parte I)
4. Introduzione al web (Parte I)4. Introduzione al web (Parte I)
4. Introduzione al web (Parte I)Roberto Polillo
 
Lezione 3: I blog e la blogosfera
Lezione 3: I blog e la blogosferaLezione 3: I blog e la blogosfera
Lezione 3: I blog e la blogosferaRoberto Polillo
 
18. Siti di condivisione dei contenuti
18. Siti di condivisione dei contenuti18. Siti di condivisione dei contenuti
18. Siti di condivisione dei contenutiRoberto Polillo
 
5. Introduzione al web (Parte II)
5. Introduzione al web (Parte II)5. Introduzione al web (Parte II)
5. Introduzione al web (Parte II)Roberto Polillo
 
24. Conclusioni del corso (e alcune osservazioni globali)
24. Conclusioni del corso (e alcune osservazioni globali)24. Conclusioni del corso (e alcune osservazioni globali)
24. Conclusioni del corso (e alcune osservazioni globali)Roberto Polillo
 
5. Introduzione al web (ii)
5. Introduzione al web (ii)5. Introduzione al web (ii)
5. Introduzione al web (ii)Roberto Polillo
 
15. La forma breve e il microblogging
15. La forma  breve e il microblogging15. La forma  breve e il microblogging
15. La forma breve e il microbloggingRoberto Polillo
 
17.Web feed e aggregatori
17.Web feed e aggregatori17.Web feed e aggregatori
17.Web feed e aggregatoriRoberto Polillo
 

What's hot (20)

13. Content sharing sites (i)
13. Content sharing sites (i)13. Content sharing sites (i)
13. Content sharing sites (i)
 
7. Applicazioni web e CMS
7. Applicazioni web e CMS7. Applicazioni web e CMS
7. Applicazioni web e CMS
 
9. Come trovare l'informazione (I)
9. Come trovare l'informazione (I)9. Come trovare l'informazione (I)
9. Come trovare l'informazione (I)
 
17. Web feed e aggregatori
17. Web feed e aggregatori17. Web feed e aggregatori
17. Web feed e aggregatori
 
Corso Web 2.0: Net economy FAQ
Corso Web 2.0: Net economy FAQCorso Web 2.0: Net economy FAQ
Corso Web 2.0: Net economy FAQ
 
Semantic Search Engine
Semantic Search EngineSemantic Search Engine
Semantic Search Engine
 
Corso Web 2.0: Evoluzione del web
Corso Web 2.0: Evoluzione del webCorso Web 2.0: Evoluzione del web
Corso Web 2.0: Evoluzione del web
 
Corso Web 2.0: Il Web come piattaforma
Corso Web 2.0: Il Web come piattaformaCorso Web 2.0: Il Web come piattaforma
Corso Web 2.0: Il Web come piattaforma
 
4. Introduzione al web (Parte I)
4. Introduzione al web (Parte I)4. Introduzione al web (Parte I)
4. Introduzione al web (Parte I)
 
16. I social media
16. I social media 16. I social media
16. I social media
 
Lezione 3: I blog e la blogosfera
Lezione 3: I blog e la blogosferaLezione 3: I blog e la blogosfera
Lezione 3: I blog e la blogosfera
 
18. Siti di condivisione dei contenuti
18. Siti di condivisione dei contenuti18. Siti di condivisione dei contenuti
18. Siti di condivisione dei contenuti
 
5. Introduzione al web (Parte II)
5. Introduzione al web (Parte II)5. Introduzione al web (Parte II)
5. Introduzione al web (Parte II)
 
24. Conclusioni del corso (e alcune osservazioni globali)
24. Conclusioni del corso (e alcune osservazioni globali)24. Conclusioni del corso (e alcune osservazioni globali)
24. Conclusioni del corso (e alcune osservazioni globali)
 
20. Social networks
20. Social networks20. Social networks
20. Social networks
 
5. Introduzione al web (ii)
5. Introduzione al web (ii)5. Introduzione al web (ii)
5. Introduzione al web (ii)
 
16. Social media
16. Social media16. Social media
16. Social media
 
14. I blog
14. I blog14. I blog
14. I blog
 
15. La forma breve e il microblogging
15. La forma  breve e il microblogging15. La forma  breve e il microblogging
15. La forma breve e il microblogging
 
17.Web feed e aggregatori
17.Web feed e aggregatori17.Web feed e aggregatori
17.Web feed e aggregatori
 

Viewers also liked

Scrivere Post Efficaci
Scrivere Post EfficaciScrivere Post Efficaci
Scrivere Post EfficaciDML Srl
 
Tradurre e scrivere per il web (prima parte)
Tradurre e scrivere per il web (prima parte)Tradurre e scrivere per il web (prima parte)
Tradurre e scrivere per il web (prima parte)Andrea Spila
 
10. Conoscere l'utente (ii)
10. Conoscere l'utente (ii)10. Conoscere l'utente (ii)
10. Conoscere l'utente (ii)Roberto Polillo
 
Back to basics- Scrivere per il web
Back to basics- Scrivere per il webBack to basics- Scrivere per il web
Back to basics- Scrivere per il webBarbara Sgarzi
 
Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...
Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...
Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...vincenzo de simone
 
“Facebook come strumento di promozione turistica eccellente: il caso APT Mar...
“Facebook come strumento di promozione turistica eccellente: il caso  APT Mar...“Facebook come strumento di promozione turistica eccellente: il caso  APT Mar...
“Facebook come strumento di promozione turistica eccellente: il caso APT Mar...Valeria Mascolo
 
Il linguaggio della pubblicità
Il linguaggio della  pubblicità Il linguaggio della  pubblicità
Il linguaggio della pubblicità Veronica Gavioli
 
L'analisi del contenuto di un sito Internet
L'analisi del contenuto di un sito InternetL'analisi del contenuto di un sito Internet
L'analisi del contenuto di un sito InternetAgnese Vardanega
 
Copywriting Per I Motori Di Ricerca
Copywriting Per I Motori Di RicercaCopywriting Per I Motori Di Ricerca
Copywriting Per I Motori Di RicercaSempo Italia
 
4GGD Roma #6 - Gastrolinguistica
4GGD Roma #6 - Gastrolinguistica4GGD Roma #6 - Gastrolinguistica
4GGD Roma #6 - GastrolinguisticaGGD Roma
 
7. Dal web 1.0 al web 2.0
7. Dal web 1.0 al web 2.07. Dal web 1.0 al web 2.0
7. Dal web 1.0 al web 2.0Roberto Polillo
 
Impariamo a documentare un evento sui social media
Impariamo a documentare un evento sui social mediaImpariamo a documentare un evento sui social media
Impariamo a documentare un evento sui social mediaULRICO HOEPLI EDITORE, MILAN
 
DML Guida al Facebook Commerce
DML Guida al Facebook CommerceDML Guida al Facebook Commerce
DML Guida al Facebook CommerceDML Srl
 
Abruzzo montano, delizia per gli occhi e il palato.
Abruzzo montano, delizia per gli occhi  e il palato.Abruzzo montano, delizia per gli occhi  e il palato.
Abruzzo montano, delizia per gli occhi e il palato.creadess
 
Tradurre e scrivere per il web (seconda parte)
Tradurre e scrivere per il web (seconda parte)Tradurre e scrivere per il web (seconda parte)
Tradurre e scrivere per il web (seconda parte)Andrea Spila
 
Analisi di siti: lingerie (Industrial Design Politecnico 2005)
Analisi di siti: lingerie (Industrial Design Politecnico 2005)Analisi di siti: lingerie (Industrial Design Politecnico 2005)
Analisi di siti: lingerie (Industrial Design Politecnico 2005)Roberto Dadda
 

Viewers also liked (20)

Scrivere Post Efficaci
Scrivere Post EfficaciScrivere Post Efficaci
Scrivere Post Efficaci
 
Tradurre e scrivere per il web (prima parte)
Tradurre e scrivere per il web (prima parte)Tradurre e scrivere per il web (prima parte)
Tradurre e scrivere per il web (prima parte)
 
10. Conoscere l'utente (ii)
10. Conoscere l'utente (ii)10. Conoscere l'utente (ii)
10. Conoscere l'utente (ii)
 
13.Progettare il testo
13.Progettare il testo13.Progettare il testo
13.Progettare il testo
 
Back to basics- Scrivere per il web
Back to basics- Scrivere per il webBack to basics- Scrivere per il web
Back to basics- Scrivere per il web
 
Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...
Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...
Analisi usabilità sito web \"Club delle Meraviglie Q8\" - metodologia di Robe...
 
“Facebook come strumento di promozione turistica eccellente: il caso APT Mar...
“Facebook come strumento di promozione turistica eccellente: il caso  APT Mar...“Facebook come strumento di promozione turistica eccellente: il caso  APT Mar...
“Facebook come strumento di promozione turistica eccellente: il caso APT Mar...
 
Il linguaggio della pubblicità
Il linguaggio della  pubblicità Il linguaggio della  pubblicità
Il linguaggio della pubblicità
 
L'analisi del contenuto di un sito Internet
L'analisi del contenuto di un sito InternetL'analisi del contenuto di un sito Internet
L'analisi del contenuto di un sito Internet
 
Webatelier Guida Promozione Online
Webatelier Guida Promozione OnlineWebatelier Guida Promozione Online
Webatelier Guida Promozione Online
 
Copywriting Per I Motori Di Ricerca
Copywriting Per I Motori Di RicercaCopywriting Per I Motori Di Ricerca
Copywriting Per I Motori Di Ricerca
 
4GGD Roma #6 - Gastrolinguistica
4GGD Roma #6 - Gastrolinguistica4GGD Roma #6 - Gastrolinguistica
4GGD Roma #6 - Gastrolinguistica
 
7. Dal web 1.0 al web 2.0
7. Dal web 1.0 al web 2.07. Dal web 1.0 al web 2.0
7. Dal web 1.0 al web 2.0
 
Impariamo a documentare un evento sui social media
Impariamo a documentare un evento sui social mediaImpariamo a documentare un evento sui social media
Impariamo a documentare un evento sui social media
 
DML Guida al Facebook Commerce
DML Guida al Facebook CommerceDML Guida al Facebook Commerce
DML Guida al Facebook Commerce
 
Abruzzo montano, delizia per gli occhi e il palato.
Abruzzo montano, delizia per gli occhi  e il palato.Abruzzo montano, delizia per gli occhi  e il palato.
Abruzzo montano, delizia per gli occhi e il palato.
 
Tradurre e scrivere per il web (seconda parte)
Tradurre e scrivere per il web (seconda parte)Tradurre e scrivere per il web (seconda parte)
Tradurre e scrivere per il web (seconda parte)
 
Albacamp
AlbacampAlbacamp
Albacamp
 
13. Progettare il testo
13. Progettare il testo13. Progettare il testo
13. Progettare il testo
 
Analisi di siti: lingerie (Industrial Design Politecnico 2005)
Analisi di siti: lingerie (Industrial Design Politecnico 2005)Analisi di siti: lingerie (Industrial Design Politecnico 2005)
Analisi di siti: lingerie (Industrial Design Politecnico 2005)
 

Similar to 6. Ricercare nel Web

14. Content sharing (ii)
14. Content sharing (ii)14. Content sharing (ii)
14. Content sharing (ii)Roberto Polillo
 
7 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/187 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/18Giuseppe Vizzari
 
7 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/177 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/17Giuseppe Vizzari
 
10. Ricercare nel web (Parte II)
10. Ricercare nel web (Parte II)10. Ricercare nel web (Parte II)
10. Ricercare nel web (Parte II)Roberto Polillo
 
18. Content sharing sites
18. Content sharing sites18. Content sharing sites
18. Content sharing sitesRoberto Polillo
 
La navigazione di profondità - V2
La navigazione di profondità - V2La navigazione di profondità - V2
La navigazione di profondità - V2guam7
 
12 - I Social Media - 16/17
12 - I Social Media - 16/1712 - I Social Media - 16/17
12 - I Social Media - 16/17Giuseppe Vizzari
 
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...Roberto Polillo
 

Similar to 6. Ricercare nel Web (20)

14. Content sharing (ii)
14. Content sharing (ii)14. Content sharing (ii)
14. Content sharing (ii)
 
9 - Ricercare nel Web
9 - Ricercare nel Web9 - Ricercare nel Web
9 - Ricercare nel Web
 
7 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/187 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/18
 
Ricercare nel web
Ricercare nel webRicercare nel web
Ricercare nel web
 
7 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/177 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/17
 
09 - Ricercare nel Web I
09 - Ricercare nel Web I09 - Ricercare nel Web I
09 - Ricercare nel Web I
 
10. Ricercare nel web (Parte II)
10. Ricercare nel web (Parte II)10. Ricercare nel web (Parte II)
10. Ricercare nel web (Parte II)
 
7. Mashup
7. Mashup7. Mashup
7. Mashup
 
10 - Ricercare nel web II
10 - Ricercare nel web II10 - Ricercare nel web II
10 - Ricercare nel web II
 
Unique file 2
Unique file 2Unique file 2
Unique file 2
 
18. Content sharing sites
18. Content sharing sites18. Content sharing sites
18. Content sharing sites
 
motori di ricerca-20141202
motori di ricerca-20141202motori di ricerca-20141202
motori di ricerca-20141202
 
6. Il browser
6. Il browser6. Il browser
6. Il browser
 
Corso Web 2.0: Mashup
Corso Web 2.0: MashupCorso Web 2.0: Mashup
Corso Web 2.0: Mashup
 
7. Il browser
7. Il browser7. Il browser
7. Il browser
 
La navigazione di profondità - V2
La navigazione di profondità - V2La navigazione di profondità - V2
La navigazione di profondità - V2
 
12 - Social media (19/20)
12 - Social media (19/20)12 - Social media (19/20)
12 - Social media (19/20)
 
12 - Social media
12 - Social media12 - Social media
12 - Social media
 
12 - I Social Media - 16/17
12 - I Social Media - 16/1712 - I Social Media - 16/17
12 - I Social Media - 16/17
 
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
 

More from Roberto Polillo

Future City, Ipotesi sulla città del futuro
Future City, Ipotesi sulla città del futuroFuture City, Ipotesi sulla città del futuro
Future City, Ipotesi sulla città del futuroRoberto Polillo
 
Teaching HCI to computing students: some considerations
Teaching HCI to computing students: some considerationsTeaching HCI to computing students: some considerations
Teaching HCI to computing students: some considerationsRoberto Polillo
 
22. Conclusioni del corso
22. Conclusioni del corso22. Conclusioni del corso
22. Conclusioni del corsoRoberto Polillo
 
ICT e sviluppo sociale: alcune riflessioni
ICT e sviluppo sociale: alcune riflessioniICT e sviluppo sociale: alcune riflessioni
ICT e sviluppo sociale: alcune riflessioniRoberto Polillo
 
Editoria e industria dei media di fronte alla rivoluzione digitale
Editoria e industria dei media di fronte alla rivoluzione digitaleEditoria e industria dei media di fronte alla rivoluzione digitale
Editoria e industria dei media di fronte alla rivoluzione digitaleRoberto Polillo
 
21. Progettare per l'errore
21. Progettare per l'errore21. Progettare per l'errore
21. Progettare per l'erroreRoberto Polillo
 
20. Principi e linee guida (II)
20. Principi e linee guida (II)20. Principi e linee guida (II)
20. Principi e linee guida (II)Roberto Polillo
 
20. Principi e linee guida (I)
20. Principi e linee guida (I)20. Principi e linee guida (I)
20. Principi e linee guida (I)Roberto Polillo
 
18. Paradigmi di interazione uomo macchina (III)
18. Paradigmi di interazione uomo macchina (III)18. Paradigmi di interazione uomo macchina (III)
18. Paradigmi di interazione uomo macchina (III)Roberto Polillo
 
17. Evoluzione dei paradigmi di interazione uomo macchina (I)
17. Evoluzione dei paradigmi di interazione uomo macchina (I)17. Evoluzione dei paradigmi di interazione uomo macchina (I)
17. Evoluzione dei paradigmi di interazione uomo macchina (I)Roberto Polillo
 
16. Evoluzione dei paradigmi di interazione uomo macchina (I)
16. Evoluzione dei paradigmi di interazione uomo macchina (I)16. Evoluzione dei paradigmi di interazione uomo macchina (I)
16. Evoluzione dei paradigmi di interazione uomo macchina (I)Roberto Polillo
 
19. Le organnizzazioni sul web e segg
19. Le organnizzazioni sul web e segg19. Le organnizzazioni sul web e segg
19. Le organnizzazioni sul web e seggRoberto Polillo
 
17. Web feed e aggregatori
17. Web feed e aggregatori17. Web feed e aggregatori
17. Web feed e aggregatoriRoberto Polillo
 
15. Ancora sulla grafica
15. Ancora sulla grafica15. Ancora sulla grafica
15. Ancora sulla graficaRoberto Polillo
 
13. Conoscere l'utente: il sistema motorio
13. Conoscere l'utente: il sistema motorio13. Conoscere l'utente: il sistema motorio
13. Conoscere l'utente: il sistema motorioRoberto Polillo
 
13. Internet business models
13. Internet business models13. Internet business models
13. Internet business modelsRoberto Polillo
 

More from Roberto Polillo (20)

Future City, Ipotesi sulla città del futuro
Future City, Ipotesi sulla città del futuroFuture City, Ipotesi sulla città del futuro
Future City, Ipotesi sulla città del futuro
 
Teaching HCI to computing students: some considerations
Teaching HCI to computing students: some considerationsTeaching HCI to computing students: some considerations
Teaching HCI to computing students: some considerations
 
Conclusioni del corso
Conclusioni del corsoConclusioni del corso
Conclusioni del corso
 
22. Conclusioni del corso
22. Conclusioni del corso22. Conclusioni del corso
22. Conclusioni del corso
 
ICT e sviluppo sociale: alcune riflessioni
ICT e sviluppo sociale: alcune riflessioniICT e sviluppo sociale: alcune riflessioni
ICT e sviluppo sociale: alcune riflessioni
 
Editoria e industria dei media di fronte alla rivoluzione digitale
Editoria e industria dei media di fronte alla rivoluzione digitaleEditoria e industria dei media di fronte alla rivoluzione digitale
Editoria e industria dei media di fronte alla rivoluzione digitale
 
21. Progettare per l'errore
21. Progettare per l'errore21. Progettare per l'errore
21. Progettare per l'errore
 
20. Principi e linee guida (II)
20. Principi e linee guida (II)20. Principi e linee guida (II)
20. Principi e linee guida (II)
 
20. Principi e linee guida (I)
20. Principi e linee guida (I)20. Principi e linee guida (I)
20. Principi e linee guida (I)
 
18. Paradigmi di interazione uomo macchina (III)
18. Paradigmi di interazione uomo macchina (III)18. Paradigmi di interazione uomo macchina (III)
18. Paradigmi di interazione uomo macchina (III)
 
Wikipedia
WikipediaWikipedia
Wikipedia
 
Open internet
Open internetOpen internet
Open internet
 
17. Evoluzione dei paradigmi di interazione uomo macchina (I)
17. Evoluzione dei paradigmi di interazione uomo macchina (I)17. Evoluzione dei paradigmi di interazione uomo macchina (I)
17. Evoluzione dei paradigmi di interazione uomo macchina (I)
 
16. Evoluzione dei paradigmi di interazione uomo macchina (I)
16. Evoluzione dei paradigmi di interazione uomo macchina (I)16. Evoluzione dei paradigmi di interazione uomo macchina (I)
16. Evoluzione dei paradigmi di interazione uomo macchina (I)
 
19. Le organnizzazioni sul web e segg
19. Le organnizzazioni sul web e segg19. Le organnizzazioni sul web e segg
19. Le organnizzazioni sul web e segg
 
17. Web feed e aggregatori
17. Web feed e aggregatori17. Web feed e aggregatori
17. Web feed e aggregatori
 
15. Ancora sulla grafica
15. Ancora sulla grafica15. Ancora sulla grafica
15. Ancora sulla grafica
 
14. Progettare il testo
14. Progettare il testo14. Progettare il testo
14. Progettare il testo
 
13. Conoscere l'utente: il sistema motorio
13. Conoscere l'utente: il sistema motorio13. Conoscere l'utente: il sistema motorio
13. Conoscere l'utente: il sistema motorio
 
13. Internet business models
13. Internet business models13. Internet business models
13. Internet business models
 

Recently uploaded

Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxlorenzodemidio01
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaStefano Lariccia
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaStefano Lariccia
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxlorenzodemidio01
 

Recently uploaded (6)

Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptx
 

6. Ricercare nel Web

  • 1. Edizione 2012-13 Università degli Studi di Milano Bicocca Dipartimento di Informatica, Sistemistica e Comunicazione Corso di Strumenti e applicazioni del Web 6. Ricercare nel Web
  • 2. Queste slides 2 Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Il sito del corso, con il materiale completo, si trova in www.corsow.wordpress.com . Data la rapida evoluzione della rete, il corso viene aggiornato ogni anno. Il presente materiale è pubblicato con licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0” (http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ): La licenza non si estende alle immagini provenienti da altre fonti e alle screen shots, i cui diritti restano in capo ai rispettivi proprietari, che, ove possibile, sono stati indicati. L'autore si scusa per eventuali omissioni, e resta a disposizione per correggerle. R.Polillo - Marzo 2013
  • 3. Una visualizzazione [di una parte] del web La immagine mostra una porzione di Internet costituita da 535.000 nodi e più di 600.000 links WALRUS Visualization tool, 2001 http://www.caida.org/tools/visualization/walrus/ R.Polillo - Marzo 2013 3
  • 4. 4 R.Polillo - Marzo 2013 Una visualizzazione [di una parte] del web
  • 5. R.Polillo - Marzo 2013 5 Una visualizzazione [di una parte] del web
  • 6. Come trovare l'informazione in rete  Directories Indici strutturati di argomenti (gestiti da una redazione)  Motori di ricerca Query → Risultati  Esplorazione Browsing, serendipity  Motori semantici www.wolframalpha.com, …  Sistemi di Q&A sociale Yahoo! Answer, … R.Polillo - Marzo 2013 6
  • 7. Web directories 7  Storicamente, il primo strumento di ausilio alle ricerche nel Web  Classificazione gerarchica dei siti (e non delle pagine) in categorie e sottocategorie, a più livelli, effettuata "a mano" -> varie "tassonomie"  Directories “generaliste” e directories verticali o di nicchia  http://en.wikipedia.org/wiki/Web_directory R.Polillo - Marzo 2013
  • 8. Tassonomia 8 Emporio celeste dei riconoscimenti benevoli (Enciclopedia cinese, J.L.Borges, 1973) Gli animali si dividono in: a) Appartenenti all’imperatore b) Imbalsamati c) Ammaestrati d) Lattonzoli e) Sirene f) Favolosi g) Cani randagi h) Inclusi in questa classificazione i) Che si agitano come pazzi j) Innumerevoli k) Disegnati con un pennello finissimo di peli di cammello l) Eccetera m) Che hanno ritto il vaso n) Che da lontano sembrano mosche. R.Polillo - Marzo 2013  Raggruppamento di oggetti in classi, secondo qualche criterio  taxis=ordine nomos=regola  Ogni tassonomia è arbitraria, e dipende dagli obiettivi
  • 9. Yahoo! (http://dir.yahoo.com) 9 R.Polillo - Marzo 2013 - Nasce come “La guida al WWW di Jerry e David”, nel 1994 - Qui la home del 1996, da www.archive.org http://en.wikipedia.org/wiki/Interne
  • 10. The Open Directory Project (ODP) 10  Nota anche come DMOZ (Directory Mozilla http://www.dmoz.org/  Directory gratuita, aperta e multilingua  Posseduta da Netscape (dal 1998) e manutenuta da una comunità di editor volontari  http://en.wikipedia.org/wiki/Open_Directory_Project R.Polillo - Marzo 2013
  • 11. Domoz vs Yahoo! R.Polillo - Marzo 2013 11 Dmoz Yahoo!
  • 12. Wikipedia come strumento di ricerca 12  Wikipedia è un formidabile strumento di ricerca e accesso al web  Ogni voce di Wikipedia è corredata da numerosi link interni ed esterni, che spesso permettono di raggiungere i siti più significativi correlati all’argomento esaminato  Inoltre Wikipedia contiene numerosi indici e directories, fra cui anche veri e propri portali tematici (http://en.wikipedia.org/wiki/Portal:List_of_portals ) R.Polillo - Marzo 2013
  • 13. Serendipità 13  Cerco una cosa e ne trovo un'altra  Nome coniato da Horace Walpole, tratto dalla fiaba “I tre principi di Serendip” (Serendip è l'antico nome di Sri Lanka)  Serve fortuna (“il caso”) e un atteggiamento di apertura: per cogliere l'indizio che porterà alla scoperta occorre essere aperti alla ricerca e riconoscere il valore di esperienze che non corrispondono alle originarie aspettative  http://en.wikipedia.org/wiki/Serendipity  http://serendip.brynmawr.edu/serendip/about.html R.Polillo - Marzo 2013
  • 14. 14 R.Polillo - Marzo 2013
  • 15. www.stumbleupon.com 16  to stumble: inciampare, scoprire per caso  È una discovery engine di pagine web, fondato in Canada nel 2001  Premendo il bottone STUMBLE! installato sul browser, viene proposto un sito, un’immagine o un video scelti sulla base delle preferenze dell’utente, o delle raccomandazioni dei suoi amici o da altri utenti che hanno interessi simili  Il processo di selezione si affina sulla base del gradimento espresso (opzionalmente) dall’utente: R.Polillo - Marzo 2013
  • 16. Motori di ricerca per il Web  Componente software (utilizzabile come servizio online) progettato per ricercare informazioni sul World Wide Web  Le informazioni (di solito nella forma di link) sono presentate in una serie di Search Engine Results Page (SERP)  La qualità di un motore si valuta sulla base della pertinenza e rilevanza dei risultati R.Polillo - Marzo 2013 17
  • 17. Motori di ricerca Una storia complessa, iniziata negli anni '90. Oggi, i primi 3: Google - Dal 1998 Bing - Dal 2009 - Prima: MSN Search, Windows Live Search, Live Search Yahoo! - Con motori esterni (dal 1999 "Powered by Bing") R.Polillo - Marzo 2013 18 Market share, Jan 2013, http://www.statowl.com
  • 18. Motori di ricerca: struttura R.Polillo - Marzo 2013 19 Interfaccia Query processing Ranking dei risultati Query Risultat i (SERP) Front-end process Indici + cached pages Crawler Crawler IndicizzatoreCrawler Richiest e Pagine web Pagine web WWW Back-end process
  • 19. Web crawling  I crawler (robot, spider, bot) sono programmi che navigano il Web, esaminando le diverse pagine e seguendo i link in esse presenti  Seguono opportune politiche di navigazione (per es. per decidere quando riesaminare una pagina già vista)  L'interazione con i Web server segue specifici protocolli (per es. robot exclusion protocol, o robot.txt)  Non tutto il Web è accessibile ai crawler R.Polillo - Marzo 2013 21
  • 20. robots.txt: esempio www.domain.com R.Polillo - Marzo 2013 22 / robots.t xt utenti foto about User-agent: Google Disallow /utenti/foto Allow: * Crawl-delay: 20 sec
  • 21. Deep vs surface Web  Non tutto il Web è accessibile ai motori di ricerca  Il Web invisibile ("deep Web") è parecchi ordini di grandezza più vasto del Web visibile ("surface Web")  Deep Web, esempi:  Pagine "vietate" dai Web server (robots.txt)  Pagine generate dinamicamente a fronte di query o di input forniti attraverso form  Pagine senza link entranti  Pagine accessibili tramite registrazione e login  Ecc. R.Polillo - Marzo 2013 23
  • 22. Struttura del web: uno studio Analisi di 203 milioni di pagine, nel 1999: Broder et al., Graph structure in the web, WWW Conference 2000, http://www9.org/w9cdrom/160/160.html 17 million nodes 24 R.Polillo - Marzo 2013
  • 23. Tipi di query  Informativa Obiettivo: trovare un'informazione  Navigazionale Obiettivo: trovare una pagina web, che conosco già  Risorsa Obiettivo: trovare una risorsa (non informativa) disponibile sul web  Il risultato è di solito (ma non sempre!) una lista di link a pagine web  Dal contenitore al contenuto R.Polillo - Marzo 2013 25
  • 24. Search forms (Google) R.Polillo - Marzo 2013 26 Semplice: Avanzata: Posso usare una sintassi complessa Esempi: query AND query query OR query -query term site:url link: x …. Cfr. http://www.google.com/insidesearch/ http://bit.ly/13dakJx
  • 25. Google: evoluzione della home page Video sulla evoluzione di www.google.com dal 1998 al 2007 http://www.youtube.com/watch?v=1vgprty39og R.Polillo - Marzo 2013 27
  • 26. SERP: struttura tipica R.Polillo - Marzo 2013 28 Search box Risultati sponsorizzati Opzioni per la ricerca Risultati "organici" (non influenzati dalle sponsorizzazioni) Google: AdWords
  • 27. La coda lunga delle ricerche R.Polillo - Marzo 2013 29 Search terms Frequenza Alto costo, alta frequenza, bassa probabilità di conversione Basso costo, bassa frequenza, alta probabilità di conversione
  • 28. Google Trends (www.google.com/trends) R.Polillo - Marzo 2013 30 Vedi anche www.google.com/zeitgeist/2012
  • 29. Risultati della ricerca: esempio (Google) R.Polillo - Marzo 2013 31 PreviewCachedFiat http://www.googleguide.com/cached_page s.html
  • 30. Ranking  I risultati della ricerca dovrebbero essere presentati sulla SERP in ordine di "rilevanza" (gli utenti considerano di solito solo i risultati nella prima pagina)  Il successo di un motore di ricerca è fortemente legato al suo algoritmo di ranking R.Polillo - Marzo 2013 32
  • 31. Google PageRank  Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi di PhD a Stanford (progetto BackRub, 1995-96), brevettato a nome della Stanford University  L'idea: la "importanza" di una pagina Web è tanto maggiore quante più sono le pagine Web (a loro volta "importanti") che la linkano  In sostanza, è il meccanismo con cui vengono valutati i paper accademici  S.Brin, L.Page, “The anatomy of a large-scale hypertextual Web search engine”  1998: Brin e Page fondano Google Inc R.Polillo - Marzo 2013 33
  • 32. PageRank: esempio 34 R.Polillo - Marzo 2013 7 1 1 6 1 1
  • 33. PageRank: esempio 35 http://en.wikipedia.org/wiki/PageRank R.Polillo - Marzo 2013Per la spiegazione dell'algoritmo: http://www.cs.cornell.edu/home/kleinber/networks-book/networks-
  • 34. Risultati della ricerca: non solo link Provate a cercare (su Google e Bing): - weather Milano - time San Francisco - sunrise New York - 5*9+(sqrt 10)^3= - Ernest Hemingway - Population Milan - define philosophy - ristoranti 20143 - movies 20143 - AZ637 - mappa 20143 - mappa corso italia 6 milano - concessionari Fiat - …. R.Polillo - Marzo 2013 37 Search engine → Answer engine
  • 35. Google: quali servizi di ricerca? R.Polillo - Marzo 2013 38 Marzo 2013
  • 36. Google: quali servizi di ricerca? R.Polillo - Marzo 2013 39
  • 37. Google: quali servizi di ricerca? R.Polillo - Marzo 2013 40
  • 38. Google: quali servizi di ricerca? R.Polillo - Marzo 2013 41
  • 39. Search history  La search history di ciascuno viene salvata nella "cronologia Web" (Google, Bing)  È possibile cancellare singoli elementi, o tutti  Cronologia in Google: entrare nel proprio account, ed entrare nella "dashboard"  Google sulla privacy delle ricerche (2007): http://www.youtube.com/watch?v=iPkvNr2cpqg 42
  • 40. SEO / SEM  SEO: Search Engine Optimization Metodi e tecniche per migliorare il ranking di un sito Web, per i vari motori di ricerca http://http://en.wikipedia.org/wiki/Search_engine_optimization  SEM: Search Engine Marketing Attività di promozione di un sito Web per migliorarne il ranking dei motori di ricerca http://en.wikipedia.org/wiki/Search_engine_marketing  Page rank checker: esempio: http://www.whatsmypr.net R.Polillo - Marzo 2013 43
  • 41. SEM/SEO 44  La posizione (rank) in cui un sito viene mostrato dal motore di ricerca è estremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltre la prima pagina)  Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito cliente acquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search Engine Optimization)  Le tecniche usate non sono sempre corrette: per es. vengono creati siti composti solo da link per far “salire” i siti che pagano  Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello che considera spamming da parte degli specialisti SEM/SEO  http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it R.Polillo - Marzo 2013
  • 42. Google search: per saperne di più  Help di Google: http://support.google.com/websearch  Google Guide (indipendente da Google): http://www.googleguide.com  Wikipedia: http://en.wikipedia.org/wiki/Google_Search R.Polillo - Marzo 2013 45
  • 43. Lavoro individuale  Esplorare accuratamente le funzioni del motore di ricerca di Google, e confrontarle con quelle di Bing  Esplorare la propria dashboard (nel proprio account Google), e verificare quali informazioni sulla vostra storia sono memorizzate  Esplorate www.wolframalpha.com R.Polillo - Marzo 2013 46