SlideShare a Scribd company logo
Università degli Studi di Milano Bicocca
Dipartimento di Informatica, Sistemistica e Comunicazione
Corso di Strumenti e applicazioni del Web
10. Ricercare nel Web (Parte II)
Roberto Polillo
Edizione 2014-15
2
Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Il
sito del corso, con il materiale completo, si trova in
www.corsow.wordpress.com . Data la rapida evoluzione della rete, il corso
viene aggiornato ogni anno.
Il presente materiale è pubblicato con licenza Creative Commons
“Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0”
(http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ):
La licenza non si estende alle immagini provenienti da altre fonti e
alle screen shots, i cui diritti restano in capo ai rispettivi proprietari,
che, ove possibile, sono stati indicati. L'autore si scusa per eventuali
omissioni, e resta a disposizione per correggerle.
R.Polillo - Marzo 2015
Queste slides
Motori di ricerca: struttura
R.Polillo - Marzo 2015
3
Interfaccia
Query
processing
Ranking
dei risultati
Query
Risultati
(SERP)
Front-end process
Indici +
cached pages
Crawler
Crawler
IndicizzatoreCrawler
Richieste
Pagine
web
Pagine
web
WWW
Back-end process
Semplificando al massimo…
R.Polillo - Marzo 2015
4
URL PAGINE
CACHE
Keyword URLs
INDICE
IndicizzatoreCrawler
Query processing
E’ possibile vedere le pagine cashed
(Google search)
R.Polillo - Marzo 2015
5
http://www.digitaltrends.com/computing/directly-access-google-cached-pages/#!BqSUt
Ranking
 Gli utenti considerano di solito solo i risultati nella
prima SERP
  i risultati devono essere presentati in ordine di
rilevanza
 il successo di un motore di ricerca è fortemente
legato al suo algoritmo di ranking
R.Polillo - Marzo 2015
6
Google PageRank
 Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi
di PhD a Stanford (progetto BackRub, 1995-96), brevettato
a nome della Stanford University
 L'idea: la "importanza" di una pagina Web è tanto
maggiore quante più sono numerose e importanti le
pagine Web che la linkano
 S.Brin, L.Page, “The anatomy of a large-scale hypertextual
Web search engine”
 In sostanza, è il meccanismo con cui vengono valutati i
paper accademici
 1998: Brin e Page fondano Google Inc
R.Polillo - Marzo 2015
7
PageRank: esempio
8
R.Polillo - Marzo 2015
PageRank: esempio
9
R.Polillo - Marzo 2015
7
1
1
6
1
1
PageRank: esempio
10
http://en.wikipedia.org/wiki/PageRank
R.Polillo - Marzo 2015
L’algoritmo: altri criteri
 Google utilizza oltre 200 criteri per il ranking delle pagine
 I criteri sono segreti e in continua evoluzione
 Esempi:
 Parole chiave nella pagina (titolo, header, testo …)
 Età del sito
 Qualità dei contenuti
 Ranking fra i siti di analogo argomento
 Numero di accessi via URL della pagina
 Numero di accessi da parte di chi cerca
 Tempo speso sulla pagina dagli utenti
 ….
R.Polillo - Marzo 2015
11
SEO / SEM
 SEO: Search Engine Optimization
Metodi e tecniche per migliorare il ranking di un
sito Web, per i vari motori di ricerca
http://http://en.wikipedia.org/wiki/Search_engine_optimization
 SEM: Search Engine Marketing
Attività di promozione di un sito Web per
migliorarne il ranking dei motori di ricerca
http://en.wikipedia.org/wiki/Search_engine_marketing
 Page rank checker: esempio:
http://www.whatsmypr.net
R.Polillo - Marzo 2015
12
SEM/SEO
13
 La posizione (rank) in cui un sito viene mostrato dal motore di ricerca è
estremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltre
la prima pagina)
 Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito cliente
acquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search Engine
Optimization)
 Le tecniche usate non sono sempre corrette: per es. vengono creati siti composti
solo da link per far “salire” i siti che pagano
 Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello che
considera spamming da parte degli specialisti SEM/SEO
 http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it
R.Polillo - Marzo 2015
Risultati della ricerca: non solo link
Provate a cercare (su Google e Bing):
- weather Milano
- time San Francisco
- sunrise New York
- 5*9+(sqrt 10)^3=
- Ernest Hemingway
- Population Milan
- define philosophy
- ristoranti 20143
- movies 20143
- mappa 20143
- mappa corso italia 6 milano
- concessionari Fiat
- ….
R.Polillo - Marzo 2015
14
Search engine
→ Answer engine
Google: quali servizi di ricerca?
R.Polillo - Marzo 2015
15
Marzo
2013
Google: quali servizi di ricerca?
R.Polillo - Marzo 2015
16
Google: quali servizi di ricerca?
R.Polillo - Marzo 2015
17
Google: quali servizi di ricerca?
R.Polillo - Marzo 2015
18
Search history
 La search history di ciascuno viene salvata nella
”search history" (Google, Bing)
 (Non confonderla con la cronologia Web, che è raccolta dal
browser)
 È possibile cancellare singoli elementi, o tutti
R.Polillo - Marzo 2015
19
Search history in Google:
entrare nel proprio account, ed entrare nella
"dashboard”, e…. guardate quello che Google sa di
voi
La coda lunga delle ricerche
R.Polillo - Marzo 2015
20
Search terms
Frequenza
Alta frequenza, bassa
probabilità di trovare
l’informazione desiderata
Bassa frequenza, alta probabilità di
trovare l’informazione
“negozi scarpe uomo centro milano”
Google Trends (www.google.com/trends)
R.Polillo - Marzo 2015
21
Vedi
http://www.google.com/trends/topcharts?date=2014
SERP: struttura tipica
R.Polillo - Marzo 2015
22
Search box
Risultati sponsorizzati
Opzioni per la ricerca
Risultati
"organici"
(non influenzati
dalle
sponsorizzazioni)
Google:
AdWords
Google search: per saperne di più
 Help di Google:
http://support.google.com/websearch
 Wikipedia:
http://en.wikipedia.org/wiki/Google_Search
R.Polillo - Marzo 2015
23
Lavoro individuale
 Esplorare accuratamente le funzioni del motore di ricerca di Google,
[e confrontarle con quelle di Bing]
 Esplorare la propria dashboard (nel proprio account Google), e
verificare quali informazioni sulla vostra storia sono memorizzate
(importantissimo!)
 Esplorate www.wolframalpha.com
Guardate che cosa Wolfram alpha vi dice della VOSTRA attività su
Facebook  cercare su Google: wolfram personal analytics
R.Polillo - Marzo 2015
24

More Related Content

What's hot

What's hot (20)

15. La forma breve e il microblogging
15. La forma  breve e il microblogging15. La forma  breve e il microblogging
15. La forma breve e il microblogging
 
19. Le organnizzazioni sul web e segg
19. Le organnizzazioni sul web e segg19. Le organnizzazioni sul web e segg
19. Le organnizzazioni sul web e segg
 
1. Introduzione al corso
1. Introduzione al corso1. Introduzione al corso
1. Introduzione al corso
 
24. Conclusioni del corso (e alcune osservazioni globali)
24. Conclusioni del corso (e alcune osservazioni globali)24. Conclusioni del corso (e alcune osservazioni globali)
24. Conclusioni del corso (e alcune osservazioni globali)
 
9. Ricercare nel web (Parte I)
9. Ricercare nel web (Parte I)9. Ricercare nel web (Parte I)
9. Ricercare nel web (Parte I)
 
17. Web feed e aggregatori
17. Web feed e aggregatori17. Web feed e aggregatori
17. Web feed e aggregatori
 
Collaborative Editing
Collaborative EditingCollaborative Editing
Collaborative Editing
 
7. Applicazioni Web e CMS
7. Applicazioni Web e CMS7. Applicazioni Web e CMS
7. Applicazioni Web e CMS
 
Semantic Search Engine
Semantic Search EngineSemantic Search Engine
Semantic Search Engine
 
16. Social media
16. Social media16. Social media
16. Social media
 
14. I blog
14. I blog14. I blog
14. I blog
 
Editoria e industria dei media di fronte alla rivoluzione digitale
Editoria e industria dei media di fronte alla rivoluzione digitaleEditoria e industria dei media di fronte alla rivoluzione digitale
Editoria e industria dei media di fronte alla rivoluzione digitale
 
11. Evoluzione del Web (I)
11. Evoluzione del Web (I)11. Evoluzione del Web (I)
11. Evoluzione del Web (I)
 
Conclusioni del corso
Conclusioni del corsoConclusioni del corso
Conclusioni del corso
 
20. Le organizzazioni sul web
20. Le organizzazioni sul web20. Le organizzazioni sul web
20. Le organizzazioni sul web
 
3. Introduzione a internet (ii)
3. Introduzione a internet (ii)3. Introduzione a internet (ii)
3. Introduzione a internet (ii)
 
18. Content sharing sites
18. Content sharing sites18. Content sharing sites
18. Content sharing sites
 
Open internet
Open internetOpen internet
Open internet
 
13. Content sharing sites (i)
13. Content sharing sites (i)13. Content sharing sites (i)
13. Content sharing sites (i)
 
7. Applicazioni web e CMS
7. Applicazioni web e CMS7. Applicazioni web e CMS
7. Applicazioni web e CMS
 

Viewers also liked

Viewers also liked (9)

Crowdfunding
CrowdfundingCrowdfunding
Crowdfunding
 
Web reputation
Web reputation Web reputation
Web reputation
 
13. Internet business models
13. Internet business models13. Internet business models
13. Internet business models
 
Politiche di moderazione nei social network
Politiche di moderazione nei social networkPolitiche di moderazione nei social network
Politiche di moderazione nei social network
 
Web fakes
Web fakesWeb fakes
Web fakes
 
Realtà Aumentata
Realtà AumentataRealtà Aumentata
Realtà Aumentata
 
TV over the Internet: il video on-demand, Netflix e la concorrenza in Italia
TV over the Internet: il video on-demand, Netflix e la concorrenza in ItaliaTV over the Internet: il video on-demand, Netflix e la concorrenza in Italia
TV over the Internet: il video on-demand, Netflix e la concorrenza in Italia
 
Storytelling 2.0: definizione, tools, casi studio
Storytelling 2.0: definizione, tools, casi studioStorytelling 2.0: definizione, tools, casi studio
Storytelling 2.0: definizione, tools, casi studio
 
2. Introduzione a internet (I)
2. Introduzione a internet (I)2. Introduzione a internet (I)
2. Introduzione a internet (I)
 

Similar to Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015

relazione finale master
relazione finale masterrelazione finale master
relazione finale master
Davide Tiana
 

Similar to Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015 (20)

10. Ricercare nel web (Parte II)
10. Ricercare nel web (Parte II)10. Ricercare nel web (Parte II)
10. Ricercare nel web (Parte II)
 
10 - Ricercare nel web II
10 - Ricercare nel web II10 - Ricercare nel web II
10 - Ricercare nel web II
 
Google Analytics per SEO
Google Analytics per SEOGoogle Analytics per SEO
Google Analytics per SEO
 
18. Siti di condivisione dei contenuti
18. Siti di condivisione dei contenuti18. Siti di condivisione dei contenuti
18. Siti di condivisione dei contenuti
 
6. Il browser
6. Il browser6. Il browser
6. Il browser
 
relazione finale master
relazione finale masterrelazione finale master
relazione finale master
 
14. Content sharing (ii)
14. Content sharing (ii)14. Content sharing (ii)
14. Content sharing (ii)
 
Esercitazione SNID facebook analytics
Esercitazione SNID facebook analyticsEsercitazione SNID facebook analytics
Esercitazione SNID facebook analytics
 
18. La presenza sul web delle aziende (i)
18. La presenza sul web delle aziende (i)18. La presenza sul web delle aziende (i)
18. La presenza sul web delle aziende (i)
 
Lezione sulla SEO presso la Facoltà di Economia di Roma Tre.
Lezione sulla SEO presso la Facoltà di Economia di Roma Tre.Lezione sulla SEO presso la Facoltà di Economia di Roma Tre.
Lezione sulla SEO presso la Facoltà di Economia di Roma Tre.
 
Internazionalizzazione web - SMAU - Milano Ottobre 2013
Internazionalizzazione web - SMAU - Milano Ottobre 2013Internazionalizzazione web - SMAU - Milano Ottobre 2013
Internazionalizzazione web - SMAU - Milano Ottobre 2013
 
Corso Web 2.0: Web feed e aggregatori
Corso Web 2.0: Web feed e aggregatoriCorso Web 2.0: Web feed e aggregatori
Corso Web 2.0: Web feed e aggregatori
 
6. Ricercare nel Web
6. Ricercare nel Web6. Ricercare nel Web
6. Ricercare nel Web
 
17.Web feed e aggregatori
17.Web feed e aggregatori17.Web feed e aggregatori
17.Web feed e aggregatori
 
Unique file 2
Unique file 2Unique file 2
Unique file 2
 
GWT + Google Analytics = SEO Love
GWT + Google Analytics = SEO LoveGWT + Google Analytics = SEO Love
GWT + Google Analytics = SEO Love
 
5. Introduzione al web (Parte II)
5. Introduzione al web (Parte II)5. Introduzione al web (Parte II)
5. Introduzione al web (Parte II)
 
Lezione 4: Web feed e aggregatori
Lezione 4: Web feed e aggregatoriLezione 4: Web feed e aggregatori
Lezione 4: Web feed e aggregatori
 
Ecoproject - Seo Contest
Ecoproject - Seo ContestEcoproject - Seo Contest
Ecoproject - Seo Contest
 
1. Introduzione al corso
1. Introduzione al corso1. Introduzione al corso
1. Introduzione al corso
 

More from Roberto Polillo

More from Roberto Polillo (16)

Future City, Ipotesi sulla città del futuro
Future City, Ipotesi sulla città del futuroFuture City, Ipotesi sulla città del futuro
Future City, Ipotesi sulla città del futuro
 
Teaching HCI to computing students: some considerations
Teaching HCI to computing students: some considerationsTeaching HCI to computing students: some considerations
Teaching HCI to computing students: some considerations
 
22. Conclusioni del corso
22. Conclusioni del corso22. Conclusioni del corso
22. Conclusioni del corso
 
ICT e sviluppo sociale: alcune riflessioni
ICT e sviluppo sociale: alcune riflessioniICT e sviluppo sociale: alcune riflessioni
ICT e sviluppo sociale: alcune riflessioni
 
21. Progettare per l'errore
21. Progettare per l'errore21. Progettare per l'errore
21. Progettare per l'errore
 
20. Principi e linee guida (II)
20. Principi e linee guida (II)20. Principi e linee guida (II)
20. Principi e linee guida (II)
 
20. Principi e linee guida (I)
20. Principi e linee guida (I)20. Principi e linee guida (I)
20. Principi e linee guida (I)
 
18. Paradigmi di interazione uomo macchina (III)
18. Paradigmi di interazione uomo macchina (III)18. Paradigmi di interazione uomo macchina (III)
18. Paradigmi di interazione uomo macchina (III)
 
17. Evoluzione dei paradigmi di interazione uomo macchina (I)
17. Evoluzione dei paradigmi di interazione uomo macchina (I)17. Evoluzione dei paradigmi di interazione uomo macchina (I)
17. Evoluzione dei paradigmi di interazione uomo macchina (I)
 
16. Evoluzione dei paradigmi di interazione uomo macchina (I)
16. Evoluzione dei paradigmi di interazione uomo macchina (I)16. Evoluzione dei paradigmi di interazione uomo macchina (I)
16. Evoluzione dei paradigmi di interazione uomo macchina (I)
 
15. Ancora sulla grafica
15. Ancora sulla grafica15. Ancora sulla grafica
15. Ancora sulla grafica
 
14. Progettare il testo
14. Progettare il testo14. Progettare il testo
14. Progettare il testo
 
13. Conoscere l'utente: il sistema motorio
13. Conoscere l'utente: il sistema motorio13. Conoscere l'utente: il sistema motorio
13. Conoscere l'utente: il sistema motorio
 
Internet and sustainable telemedicine: an introduction
Internet and sustainable telemedicine: an introductionInternet and sustainable telemedicine: an introduction
Internet and sustainable telemedicine: an introduction
 
12.Visione e progettazione grafica (I)
12.Visione e progettazione grafica (I)12.Visione e progettazione grafica (I)
12.Visione e progettazione grafica (I)
 
11. Conoscere l'utente (II)
11. Conoscere l'utente (II)11. Conoscere l'utente (II)
11. Conoscere l'utente (II)
 

Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015

  • 1. Università degli Studi di Milano Bicocca Dipartimento di Informatica, Sistemistica e Comunicazione Corso di Strumenti e applicazioni del Web 10. Ricercare nel Web (Parte II) Roberto Polillo Edizione 2014-15
  • 2. 2 Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Il sito del corso, con il materiale completo, si trova in www.corsow.wordpress.com . Data la rapida evoluzione della rete, il corso viene aggiornato ogni anno. Il presente materiale è pubblicato con licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0” (http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ): La licenza non si estende alle immagini provenienti da altre fonti e alle screen shots, i cui diritti restano in capo ai rispettivi proprietari, che, ove possibile, sono stati indicati. L'autore si scusa per eventuali omissioni, e resta a disposizione per correggerle. R.Polillo - Marzo 2015 Queste slides
  • 3. Motori di ricerca: struttura R.Polillo - Marzo 2015 3 Interfaccia Query processing Ranking dei risultati Query Risultati (SERP) Front-end process Indici + cached pages Crawler Crawler IndicizzatoreCrawler Richieste Pagine web Pagine web WWW Back-end process
  • 4. Semplificando al massimo… R.Polillo - Marzo 2015 4 URL PAGINE CACHE Keyword URLs INDICE IndicizzatoreCrawler Query processing
  • 5. E’ possibile vedere le pagine cashed (Google search) R.Polillo - Marzo 2015 5 http://www.digitaltrends.com/computing/directly-access-google-cached-pages/#!BqSUt
  • 6. Ranking  Gli utenti considerano di solito solo i risultati nella prima SERP   i risultati devono essere presentati in ordine di rilevanza  il successo di un motore di ricerca è fortemente legato al suo algoritmo di ranking R.Polillo - Marzo 2015 6
  • 7. Google PageRank  Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi di PhD a Stanford (progetto BackRub, 1995-96), brevettato a nome della Stanford University  L'idea: la "importanza" di una pagina Web è tanto maggiore quante più sono numerose e importanti le pagine Web che la linkano  S.Brin, L.Page, “The anatomy of a large-scale hypertextual Web search engine”  In sostanza, è il meccanismo con cui vengono valutati i paper accademici  1998: Brin e Page fondano Google Inc R.Polillo - Marzo 2015 7
  • 9. PageRank: esempio 9 R.Polillo - Marzo 2015 7 1 1 6 1 1
  • 11. L’algoritmo: altri criteri  Google utilizza oltre 200 criteri per il ranking delle pagine  I criteri sono segreti e in continua evoluzione  Esempi:  Parole chiave nella pagina (titolo, header, testo …)  Età del sito  Qualità dei contenuti  Ranking fra i siti di analogo argomento  Numero di accessi via URL della pagina  Numero di accessi da parte di chi cerca  Tempo speso sulla pagina dagli utenti  …. R.Polillo - Marzo 2015 11
  • 12. SEO / SEM  SEO: Search Engine Optimization Metodi e tecniche per migliorare il ranking di un sito Web, per i vari motori di ricerca http://http://en.wikipedia.org/wiki/Search_engine_optimization  SEM: Search Engine Marketing Attività di promozione di un sito Web per migliorarne il ranking dei motori di ricerca http://en.wikipedia.org/wiki/Search_engine_marketing  Page rank checker: esempio: http://www.whatsmypr.net R.Polillo - Marzo 2015 12
  • 13. SEM/SEO 13  La posizione (rank) in cui un sito viene mostrato dal motore di ricerca è estremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltre la prima pagina)  Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito cliente acquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search Engine Optimization)  Le tecniche usate non sono sempre corrette: per es. vengono creati siti composti solo da link per far “salire” i siti che pagano  Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello che considera spamming da parte degli specialisti SEM/SEO  http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it R.Polillo - Marzo 2015
  • 14. Risultati della ricerca: non solo link Provate a cercare (su Google e Bing): - weather Milano - time San Francisco - sunrise New York - 5*9+(sqrt 10)^3= - Ernest Hemingway - Population Milan - define philosophy - ristoranti 20143 - movies 20143 - mappa 20143 - mappa corso italia 6 milano - concessionari Fiat - …. R.Polillo - Marzo 2015 14 Search engine → Answer engine
  • 15. Google: quali servizi di ricerca? R.Polillo - Marzo 2015 15 Marzo 2013
  • 16. Google: quali servizi di ricerca? R.Polillo - Marzo 2015 16
  • 17. Google: quali servizi di ricerca? R.Polillo - Marzo 2015 17
  • 18. Google: quali servizi di ricerca? R.Polillo - Marzo 2015 18
  • 19. Search history  La search history di ciascuno viene salvata nella ”search history" (Google, Bing)  (Non confonderla con la cronologia Web, che è raccolta dal browser)  È possibile cancellare singoli elementi, o tutti R.Polillo - Marzo 2015 19 Search history in Google: entrare nel proprio account, ed entrare nella "dashboard”, e…. guardate quello che Google sa di voi
  • 20. La coda lunga delle ricerche R.Polillo - Marzo 2015 20 Search terms Frequenza Alta frequenza, bassa probabilità di trovare l’informazione desiderata Bassa frequenza, alta probabilità di trovare l’informazione “negozi scarpe uomo centro milano”
  • 21. Google Trends (www.google.com/trends) R.Polillo - Marzo 2015 21 Vedi http://www.google.com/trends/topcharts?date=2014
  • 22. SERP: struttura tipica R.Polillo - Marzo 2015 22 Search box Risultati sponsorizzati Opzioni per la ricerca Risultati "organici" (non influenzati dalle sponsorizzazioni) Google: AdWords
  • 23. Google search: per saperne di più  Help di Google: http://support.google.com/websearch  Wikipedia: http://en.wikipedia.org/wiki/Google_Search R.Polillo - Marzo 2015 23
  • 24. Lavoro individuale  Esplorare accuratamente le funzioni del motore di ricerca di Google, [e confrontarle con quelle di Bing]  Esplorare la propria dashboard (nel proprio account Google), e verificare quali informazioni sulla vostra storia sono memorizzate (importantissimo!)  Esplorate www.wolframalpha.com Guardate che cosa Wolfram alpha vi dice della VOSTRA attività su Facebook  cercare su Google: wolfram personal analytics R.Polillo - Marzo 2015 24