Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015
Similar to Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015
Similar to Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015 (20)
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il corso di laurea in Teoria e tecnologia della comunicazione - Università di Milano Bicocca - Prof.R.Polillo (a.a.2014-15) - Lezione del 24 marzo 2015
1. Università degli Studi di Milano Bicocca
Dipartimento di Informatica, Sistemistica e Comunicazione
Corso di Strumenti e applicazioni del Web
10. Ricercare nel Web (Parte II)
Roberto Polillo
Edizione 2014-15
2. 2
Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Il
sito del corso, con il materiale completo, si trova in
www.corsow.wordpress.com . Data la rapida evoluzione della rete, il corso
viene aggiornato ogni anno.
Il presente materiale è pubblicato con licenza Creative Commons
“Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0”
(http://creativecommons.org/licenses/by-nc-sa/3.0/it/deed.it ):
La licenza non si estende alle immagini provenienti da altre fonti e
alle screen shots, i cui diritti restano in capo ai rispettivi proprietari,
che, ove possibile, sono stati indicati. L'autore si scusa per eventuali
omissioni, e resta a disposizione per correggerle.
R.Polillo - Marzo 2015
Queste slides
3. Motori di ricerca: struttura
R.Polillo - Marzo 2015
3
Interfaccia
Query
processing
Ranking
dei risultati
Query
Risultati
(SERP)
Front-end process
Indici +
cached pages
Crawler
Crawler
IndicizzatoreCrawler
Richieste
Pagine
web
Pagine
web
WWW
Back-end process
5. E’ possibile vedere le pagine cashed
(Google search)
R.Polillo - Marzo 2015
5
http://www.digitaltrends.com/computing/directly-access-google-cached-pages/#!BqSUt
6. Ranking
Gli utenti considerano di solito solo i risultati nella
prima SERP
i risultati devono essere presentati in ordine di
rilevanza
il successo di un motore di ricerca è fortemente
legato al suo algoritmo di ranking
R.Polillo - Marzo 2015
6
7. Google PageRank
Algoritmo sviluppato da S.Brin e Larry Page nella loro tesi
di PhD a Stanford (progetto BackRub, 1995-96), brevettato
a nome della Stanford University
L'idea: la "importanza" di una pagina Web è tanto
maggiore quante più sono numerose e importanti le
pagine Web che la linkano
S.Brin, L.Page, “The anatomy of a large-scale hypertextual
Web search engine”
In sostanza, è il meccanismo con cui vengono valutati i
paper accademici
1998: Brin e Page fondano Google Inc
R.Polillo - Marzo 2015
7
11. L’algoritmo: altri criteri
Google utilizza oltre 200 criteri per il ranking delle pagine
I criteri sono segreti e in continua evoluzione
Esempi:
Parole chiave nella pagina (titolo, header, testo …)
Età del sito
Qualità dei contenuti
Ranking fra i siti di analogo argomento
Numero di accessi via URL della pagina
Numero di accessi da parte di chi cerca
Tempo speso sulla pagina dagli utenti
….
R.Polillo - Marzo 2015
11
12. SEO / SEM
SEO: Search Engine Optimization
Metodi e tecniche per migliorare il ranking di un
sito Web, per i vari motori di ricerca
http://http://en.wikipedia.org/wiki/Search_engine_optimization
SEM: Search Engine Marketing
Attività di promozione di un sito Web per
migliorarne il ranking dei motori di ricerca
http://en.wikipedia.org/wiki/Search_engine_marketing
Page rank checker: esempio:
http://www.whatsmypr.net
R.Polillo - Marzo 2015
12
13. SEM/SEO
13
La posizione (rank) in cui un sito viene mostrato dal motore di ricerca è
estremamente importante (chi ricerca utilizza le prime posizioni, e non guarda oltre
la prima pagina)
Molti specialisti indipendenti offrono servizi di consulenza affinchè il sito cliente
acquisisca un buon rank (SEM/SEO: Search Engine Marketing / Search Engine
Optimization)
Le tecniche usate non sono sempre corrette: per es. vengono creati siti composti
solo da link per far “salire” i siti che pagano
Periodicamente Google aggiorna gli algoritmi del motore per penalizzare quello che
considera spamming da parte degli specialisti SEM/SEO
http://www.google.it/support/webmasters/bin/answer.py?answer=35291&hl=it
R.Polillo - Marzo 2015
14. Risultati della ricerca: non solo link
Provate a cercare (su Google e Bing):
- weather Milano
- time San Francisco
- sunrise New York
- 5*9+(sqrt 10)^3=
- Ernest Hemingway
- Population Milan
- define philosophy
- ristoranti 20143
- movies 20143
- mappa 20143
- mappa corso italia 6 milano
- concessionari Fiat
- ….
R.Polillo - Marzo 2015
14
Search engine
→ Answer engine
19. Search history
La search history di ciascuno viene salvata nella
”search history" (Google, Bing)
(Non confonderla con la cronologia Web, che è raccolta dal
browser)
È possibile cancellare singoli elementi, o tutti
R.Polillo - Marzo 2015
19
Search history in Google:
entrare nel proprio account, ed entrare nella
"dashboard”, e…. guardate quello che Google sa di
voi
20. La coda lunga delle ricerche
R.Polillo - Marzo 2015
20
Search terms
Frequenza
Alta frequenza, bassa
probabilità di trovare
l’informazione desiderata
Bassa frequenza, alta probabilità di
trovare l’informazione
“negozi scarpe uomo centro milano”
22. SERP: struttura tipica
R.Polillo - Marzo 2015
22
Search box
Risultati sponsorizzati
Opzioni per la ricerca
Risultati
"organici"
(non influenzati
dalle
sponsorizzazioni)
Google:
AdWords
23. Google search: per saperne di più
Help di Google:
http://support.google.com/websearch
Wikipedia:
http://en.wikipedia.org/wiki/Google_Search
R.Polillo - Marzo 2015
23
24. Lavoro individuale
Esplorare accuratamente le funzioni del motore di ricerca di Google,
[e confrontarle con quelle di Bing]
Esplorare la propria dashboard (nel proprio account Google), e
verificare quali informazioni sulla vostra storia sono memorizzate
(importantissimo!)
Esplorate www.wolframalpha.com
Guardate che cosa Wolfram alpha vi dice della VOSTRA attività su
Facebook cercare su Google: wolfram personal analytics
R.Polillo - Marzo 2015
24