Una panoramica sulla disciplina e le principali tecniche di Search Engine Optimization preceduta da una breve introduzione all’Information Retrieval per permettere una comprensione più ampia e consapevole dell’ambito e delle sue pratiche.
2. Agenda
RICERCA SU WEB
!
1. Web IR Systems!
2. Web IR!
SEO
!
1. SEO e SEM!
2. SEO per le Aziende!
3. Strategia e Ottimizzazione!
4. Tecniche SEO!
a. Black Hat!
b. White Hat!
5. Tools!
3. Abstract
Di seguito è introdotta la Search Engine Optimization: disciplina atta all’aumento del traffico ai siti
web e al miglioramento della loro posizione nei motori di ricerca (ranking).!
Ne verranno descritte le professioni odierne e le principali tecniche, e si evidenzierà la necessità di
strategie SEO per la creazione e il mantenimento di siti web corporate.!
!
Per permettere una comprensione più ampia e consapevole della SEO e delle sue pratiche, parte
dell’elaborato sarà dedicata al funzionamento dei motori di ricerca web con un particolare focus su
PageRank di Google, da cui dipendono fortemente le strategie di ottimizzazione. Inoltre il primo
capitolo sarà dedicato all’Information Retrieval, in quanto area fortemente legata e dipendente
dall’attività di ricerca di informazioni da parte degli individui.!
5. Web IR Systems
Software complessi che permettono l’accesso a grandi quantità di informazioni per mezzo di query,
ovvero stringhe di ricerca effettuate da un utente con necessità informative più o meno precise e
consapevoli. !
!
OBIETTIVO: riportare documenti rilevanti per gli utenti tentando di minimizzare il più possibile la
restituzione di risultati non pertinenti e poco interessanti. !
MOTORI
DI
RICERCA
WEB
1993
Aliweb
Wanderer
2009
Bing
1995
Yahoo
Altavista
Excite
1998
Google
DMOZ
Msn Search
1994
Webcrawler-Lycos-Excite
1996/97
Alexa-Ask.com-Jandex-
Ask Jeeves
2008
DuckDuckGo
2000
Baidu
8. Web IR
Raccolta delle pagine web da indicizzare.!
!
Può avvenire in 2 modi:!
• invio diretto di una risorsa al motore di ricerca;!
• crawler (o bot, o robot, o spider): software propri del motore di ricerca che passano di link in link
raccogliendo documenti web e catalogandoli attraverso l’estrazione delle url, nominandole e
controllando che non ve ne siano di duplicate. A questo punto il crawler spedisce le risorse al
server che si occuperà successivamente di indicizzarle. Il bot scarica le pagine in locale!
GATHERING
9. CRAWLER
!
Visita circa 10 milioni di pagine al giorno.!
!
Processo ricorsivo:!
1. Inizializzazione di una coda di pagine
(seeds) con url inviati o popolari da cui
partire!
2. Selezione di un indirizzo dalla coda!
3. Scelta di una pagina!
4. Navigazione di altri link presenti nella
pagina, ad eccezione di quelli già visitati
o non visitabili (pdf, jpg, e altri file
format). !
5. Inclusione degli indirizzi navigati nella
coda attraverso un approccio breadth-
first o depth-first.!
6. Nel caso in cui il tempo concesso allo
spider non sia scaduto, esso sceglie un
altro indirizzo dalla coda.!
!
10. Web IR
Le parole (in genere solo le prime migliaia in pagina) contenute nei testi delle risorse e che sono in
grado di rappresentarne il contenuto vengono estratte in quanto indici e inserite in un file codice
(file inverted) in cui ad ogni indice corrispondono N pagine che lo contengono e i relativi link. !
Gli indici possono essere:!
!
!
!
L’indicizzazione web può avvenire in 2 modi:!
• Indicizzazione full text con dati ausiliari: in questa modalità, l’indice è arricchito da metadati
come l’autore, la data e la lingua della risorsa, oltre a una breve descrizione del suo contenuto
(snippet).!
• Classificazione dei documenti manuale o automatica: i documenti vengono clusterizzati e
posti gerarchicamente nell’indice.!
INDICIZZAZIONE
SINGOLE PAROLE!
SEQUENZE DI
CARATTERI (N GRAMS)!
RADICI DI PAROLE!
(STEMS)!
FRASI! METADATI!
11. Web IR
In questa fase il motore di ricerca viene interrogato dall’utente, che riceve in risposta una serie di
link stimati rilevanti in base alla query effettuata.!
Tali risultati sono pagine che possono contenere frasi esatte o termini della query, o ad essi
fortemente relati (sinonimi, stem, …), più o meno in prossimità nel contenuto testuale; oppure
possono essere pagine i cui link in entrata contengono i termini presenti nella query.!
!
Per affinare le interrogazioni degli utenti, la maggior parte dei motori di ricerca web mette a
disposizione alcune opzioni di ricerca avanzata, composte da una serie di parametri modificabili
dall’utente come la lingua, la data e il paese relativi alle risorse da restituire. !
!
Il matching, ovvero il confronto, tra la query dell’utente e gli indici ricavati dal motore di ricerca web
avviene solitamente attraverso un modello vettoriale che, basandosi sull’algebra lineare, tiene
conto della gradualità della rilevanza stimata dei documenti.!
!
!
MATCHING
12. Web IR
Fase cruciale e di particolare interesse per le attività SEO, trattandosi dell’ordinamento nella SERP
imposto dai motori di ricerca ai risultati corrispondenti a una data query. !
!
COMPLESSITÀ: algoritmi segreti propri di ogni motore di ricerca, in cui una miriade di variabili
concorrono alla determinazione del punteggio per l’ordinamento.!
!
!
RANKING
13. Il peso assegnato dipende in
particolar modo dalla popolarità
del sito web, che viene calcolata a
sua volta in base alla quantità e
qualità dei link in entrata: ovvero i
link che puntano direttamente alla
pagina P.!
Le query invece non influiscono in
alcun modo sul PR.!
Per raggiungere un buon livello
di PR è necessario coltivare e
alimentare una rete di relazioni
con i siti di maggior rilievo nel
proprio settore !
GOOGLE PAGE RANK
!
Algoritmo di link analysis, che!
stima l’importanza delle pagine
attenendosi alla struttura reticolare !
del web.!
Si tratta di uno dei maggiori criteri che
per Google pesano sulla rilevanza e
l’ordinamento delle pagine web.!
14. Web IRVISUALIZZAZIONE
DEI
RISULTATI
La visualizzazione dei risultati fornita dalla maggior parte dei motori di ricerca web prevede una lista
di N link accompagnati da alcuni metadati come la data, l’autore, lo snippet. !
Nella prima pagina convivono spesso i risultati della ricerca organica e i paid links, posizionati e
identificati diversamente a seconda del motore di ricerca. !
!
!
!
!
!
!
!
NOTA: Un metodo alternativo di visualizzazione era quello utilizzato dal meta-motore di ricerca Kartoo, non più attivo
dal 2011. I suoi risultati infatti provenivano da differenti motori di ricerca web ed erano esposti attraverso una mappa
interattiva di cluster argomentali che aiutavano l’utente ad approfondire la sua ricerca.!
!
17. Web IR L’utente medio è pigro.!
!
Mentre però in passato
alcune ricerche avevano
dimostrato che gli utenti si
limitavano ai primi 4 link
restituiti, di recente il trend
sembra essere stato
superato (almeno per
quanto riguarda Google):!
- Più tempo passato a
scrutare i risultati
- Scanning verticale,
che porta a un
maggior numero di
link visualizzati
USER
BEHAVIORS
2014
2005
19. SEO
Con Search Engine Optimization (SEO) ci si riferisce ad un insieme di tecniche e strategie che
hanno l’obiettivo di aumentare la visibilità e il traffico a un sito web. Per assolvere a questa funzione è
necessario migliorare il posizionamento della risorsa all’interno della SERP (Search Engine Results
Page).!
!
La SEO si occupa dunque della ricerca organica (organic search): l’utente è alla ricerca di
determinati contenuti informativi, quindi effettua una ricerca tramite un apposito motore online che gli
restituisce una lista ordinata di risultati potenzialmente interessanti (SERP).!
!
DEFINIZIONE
22. SEO
SEM
• Area disciplinare della SEM!
• Costi bassi!
• Risultati non immediatamente
misurabili (solo dopo mesi)!
• Benefici nel lungo periodo!
• Efficace sugli utenti!
• Costi alti!
• Risultati rapidi!
• Benefici nel breve periodo!
• Risultati facilmente misurabili!
• Non sempre efficace sugli utenti!
• Necessità di investire anche sulla SEO!
23. SEO
JOB
ROLES
SEO
Analyst
SEO
Copywriter
Aiuta
le
aziende
a
comprendere
appieno
il
valore
delle
manovre
SEO
nelle
strategie
di
comunicazione.!
Si
occupa
dei
contenu=
del
sito
sia
dal
punto
di
vista
informa=vo
per
l’utente
sia
per
i
motori
di
ricerca.!
Figura
completa
che
si
occupa
della
SEO
a
tuBo
tondo!
SEO Consultant / Specialist
25. SEO per le Aziende
Data la necessità di rendersi visibili e raggiungibili da più persone possibili all’interno dell’enorme
oceano del web, la SEO rappresenta un investimento importante per le aziende che vogliono
competere e distinguersi nel loro mercato di riferimento.!
!
I siti corporate sono infatti non più solo una vetrina, ma veri e propri touchpoint con clienti e
prospect.!
!
Attraverso una strategia SEO le aziende hanno l’opportunità di:!
• Attirare traffico di qualità
• Migliorare la lead aquisition aumentando i contatti di prospect e persone alla ricerca della loro
tipologia di prodotto!
• Facilitare un alto ROI aumentando le probabilità di vendita dei loro prodotti/servizi!
• Migliorare la comunicazione online dell’azienda estendendola worldwide!
• Vincere la sfida con i competitors!
!
!
27. Strategia SEO
1. Ricerca e analisi
a. Data gathering: traffic analysis, current ranking, best landing pages!
b. Audit/Analisi del sito (se già esistente): analisi tecnica e contenutistica del sito web; !
c. Analisi dei competitor: prevede l’analisi di taregeted keywords, best performing pages, …!
d. Reporting e setting degli obiettivi!
2. Ottimizzazione
a. Definizione del dominio (se non ancora esistente)!
b. Definizione del keyword set!
c. Ottimizzazione dei fattori on site!
d. Ottimizzazione dei fattori off site: link building!
3. Monitoraggio e reporting!
!
29. Il lato Oscuro della SEO
TECNICHE BLACK HAT
Metodi illeciti per aumentare la visibilità dei siti web sui
motori di ricerca. !
!
Conseguenze: penalità o ban del sito e dei suoi autori. !
!
Miglioramento del ranking temporaneo.!
!
proposta di contenuti differenziati in base al visitatore del
sito!
BLOG PING! CLOACKING! DOORWAY PAGES!
ELEMENTI INVISIBILI! KEYWORD STUFFING!
GUESTBOOK E LINK
SPAMMING!
30. Il lato Chiaro della SEO
TECNICHE WHITE HAT
Tecniche conformi alle linee guida e le policies dei motori di
ricerca. !
!
Miglioramento del ranking permanente.!
!
Human-Focused!
KEYWORDS! BACKLINKING! LINK BUILDING!
CONTENUTO DI QUALITÀ! TITOLI!
META DATI!
32. SEO On page
Il motore di ricerca tiene conto di alcune caratteristiche delle keyword:!
• peso del carattere (bold, italic, …)!
• dimensione del carattere!
• listato!
• posizione (in che tag si trova - <H>, <p>, …)!
• Altre centinaia di criteri segreti!
!
La scelta delle migliori keyword non è un processo semplice, e deve basarsi su come i consumatori
vedono il loro prodotto/servizio, piuttosto che su come lo intendono gli erogatori.!
La keword analysis è un processo necessario di raccolta e selezione delle potenziali migliori
keyword per un sito web.!
!
!
KEYWORDS
33. SEO On page
Il nome di dominio deve rappresentare il contenuto argomentativo del sito, descrivendolo al
meglio.!
!
BEST PRACTICE:!
• Inserire keywords separate da un trattino: per far sì che il motore di ricerca le individui come due
termini separati (es. Google identifica le keyword “viaggi” e “germania” in viaggi-germania.com e
non in viaggigermania.com). Nonostante ciò va considerato che l’utilizzo di keyword nel nome di
dominio non è fondamentale per un buon posizionamento nei risultati.!
• Un dominio corto e semplice da ricordare!
• Inserire il nome del proprio prodotto/servizio!
!
Un buon nome di dominio, esplicativo e facile da ricordare è in grado di favorire sia il traffico
organico, sia quello diretto.!
!
!
!
DOMINI
34. SEO On page
Nel codice html i titoli di pagina vanno posti all’interno del tag <title> contenuto a sua volta nel tag
<head>, in modo tale che esso venga visualizzato nella prima riga del risultato di ricerca
corrispondente. Inoltre il tag <title> viene utilizzato dai bot per determinare il topic delle pagine.!
Se la pagina verrà inclusa tra i risultati della SERP e nel caso in cui le parole ricercate dall’utente
siano contenute nel title, esse saranno visualizzate in bold per evidenziare la possibile relevance
della risorsa web.!
!
!
BEST PRACTICE:!
• Creare titoli di pagina pertinenti e unici, brevi ma descrittivi, per far sì che motori di ricerca e
utenti ne comprendano facilmente il topic. !
• Posizionare le keyword all’inizio del titolo, e far sì che questo on superi i 50/60 caratteri.!
!
!
TITOLO
DI
PAGINA
35. SEO On page
DESCRIPTION: brevi descrizioni del sito lette e
interpretate dal motore di ricerca e dagli utenti.
Anche il metatag <description> si trova nel tag
<head>.!
Se una parte rilevante del testo del sito si lega
alle keyword dell’utente, essa verrà mostrata
nello snippet dei risultati di ricerca. Se così non
fosse verrà visualizzata la description. !
Se le parole ricercate dall’utente sono contenute
nel metatag, esse saranno evidenziate in bold.!
Le descrizioni devono essere specifiche e
condensare efficacemente i contenuti della
pagina. !
!
!
!
BEST PRACTICE
È buona pratica creare descrizioni che non
superino i 250 caratteri e che includano buona
parte di keyword. !
!
ROBOTS: Permette con il comando “noindex” di
bloccare l’accesso ai crawler su determinate
pagine, come quelle in costruzione o quelle
riservate ai gestori del sito. Oppure è in grado di
fermare la loro navigazione delle pagine interne
al sito con il comando ”nofollow”.!
Va considerato però che non sempre i bot
obbediscono a tali comandi. !
!
METATAG
DESCRIPTION
E
ROBOTS
36. <head>
…
<title>Dipartimento di Informatica Sistemistica e Comunicazione - DISCo - Università degli Studi di
Milano-Bicocca</title>
…
<meta name="keywords" content="Informatica Laurea Dottorato Milano Facolta' Lombardia Bicocca
DISCo Dipartimento">
<meta name="description" content="Dipartimento di Informatica Sistemistica e Comunicazione
dell'Universita' degli Studi di Milano Bicocca. Corso di Laurea in Informatica, Laurea Magistrale in
Informatica e Laurea Magistrale in Teoria e tecnologia della Comunicazione”>); ….
</head>
www.disco.unimib.it
37. SEO On page
Una struttura del sito organizzata coerentemente secondo categorie aiuta gli utenti a trovare
facilmente e velocemente le informazioni che vanno cercando, e contemporaneamente facilita la
navigazione delle pagine del sito da parte dei crawler. !
!
BEST PRACTICE:!
• Evitare strutture realizzate in JavaScript, non leggibile dai motori di ricerca!
• Evitare strutture con link ed elementi ridondanti o includere troppi livelli di profondità !
• Utilizzare link testuali (anchor text) per muoversi da una pagina all’altra del sito poiché questo lo
rende più semplice per i crawler da comprendere e navigare !
• Buona pratica: navigazione tramite breadcrumb !
• Progettare una pagine 404 che sia informativa e inciti l’utente a continuare la sua navigazione !
!
STRUTTURA
NAVIGAZIONALE
38. SEO On page
Gli anchor text sono link che portano a pagine interne al sito web, o addirittura possono portare ad
un’altra area della stessa pagina.!
I link presenti nelle pagine di un sito sono importanti per far trovare ai bot le altre pagine del sito
stesso. Inoltre i motori di ricerca, per misurare la rilevanza di una pagina web tengono conto della
qualità (formattazione e semantica del testo del link) e del numero di anchor link che puntano a una
pagina.!
!
BEST PRACTICE:!
• Devono descrivere nel miglior modo possibile il contenuto della pagina (o della sua area) a cui
rimandano, ad esempio inserendo nel loro testo il title della pagina su cui l’utente atterrerà.!
!
!
!
ANCHOR
TEXT
39. SEO On page
BEST PRACTICE:!
I contenuti di un sito web che voglia concorrere per una buona posizione nel ranking, devono essere
aggiornati spesso e con regolarità per favorire un buon posizionamento poiché i motori di ricerca
mostrano un particolare riguardo per i nuovi contenuti e più in generale per i siti web in continuo
aggiornamento.!
Inoltre è importante che i contenuti pubblicati siano il più possibile originali: elementi duplicati o
copiati da altre fonti sono individuati facilmente, e il sito penalizzato.!
CONTENUTI
40. SEO On page
Il contenuto testuale di una pagina rappresenta un fattore di primaria importanza per l’ordinamento
effettuato dai motori di ricerca.!
BIAS: Maggiore è la quantità di contenuto ottimizzato (e dunque pertinente e rilevante), maggiore
sarà la possibilità di comparire tra i primi risultati della SERP.!
!
BEST PRACTICE:!
• Utilizzare nei testi molti sinonimi delle keyword e termini ad esse relati, così da enfatizzare la
relazione con i principali topic della pagina e del sito.!
• La lunghezza e la struttura e formattazione dei contenuti testuali di un sito web devono essere
ottimizzati tenendo conto in primo luogo degli utenti che li leggeranno. Per questo è utile avere
buona conoscenza di nozioni di usabilità e user experience, o meglio, affidarsi a un
professionista del settore.!
!
!
BODY
TEXT
41. SEO On page
“Alt” è un attributo di un tag (ad esempio del tag <img>) e sta ad indicare del testo alternativo. Esso
infatti identifica in un formato testuale descrittivo il contenuto del tag.!
L’alt text riveste un ruolo importante non solo perché il suo contenuto è visibile al mouseover sul
contenuto del tag, ma anche e soprattutto a livello di accessibilità, poiché è leggibile dai reader
dedicati a persone non vedenti.!
L’alt text inoltre viene letto anche dai motori di ricerca, che lo utilizzano come altro indizio per
determinare il topic di una pagina web e per “leggere” i contenuti delle immagini.!
!
!
!
ALT
TEXT
42. SEO On page
I formati immagine non sono leggibili dai motori di ricerca web.!
!
BEST PRACTICE:!
• Inserire qualsiasi testo presente in pagina in html !
• Scrivere Alt Text con contenuti pertinenti ai topic del sito!
• Non utilizzare immagini troppo pesanti, così da ridurre i tempi di caricamento!
• Utilizzare infografiche: in genere esse sono ritenute interessanti dagli utenti, e quindi elementi a
cui puntano molti link !
!
IMMAGINI
43. SEO On page
È un indice completo della struttura del sito e aiuta i bot a navigare e indicizzare le pagine del sito.!
Può essere implementata in due modi:!
• XML: documento destinato alla lettura dei motori di ricerca. Fornisce loro l’elenco di tutte le
pagine web del sito così da facilitare la navigazione dei crawler.!
• HTML: ovvero in forma di pagina web in cui vengono presentati i link a tutte le pagine del sito, in
genere disposti in una struttura gerarchica in modo da permettere all’utente di trovare facilmente
la pagina o la sezione d’interesse.!
!
!
!
SITEMAP
44. SEO Off page
Inbound Link: link ricevuti dal sito che vengono presi in considerazione dai motori di ricerca per
determinare la popolarità dei siti, e nel caso di Google, vanno a influire sul PageRank. !
!
In questo contesto, il link building si riferisce alla costruzione di una rete di link che partono da siti
autorevoli o rilevanti a livello di topic e che quindi sono potenzialmente portatori di traffico di qualità.!
Le attività di link building sono generalmente effettuate in seguito al lancio del sito.!
!
Caratteristiche degli inbound link considerate dei motori di ricerca per l’ordinamento delle risorse
web nella SERP sono:!
• Quantità
• Qualità: criterio che presume naturalezza e contestualità dei link e della loro frequenza, oltre a
una buona reputazione e il numero di link in uscita dalla pagina da cui partono i link.!
!
!
!
LINK
BUILDING
45. SEO Off page
Link al sito provenienti da blog, in particolare quelli che godono di autorevolezza e trattano
argomenti relati a quelli del sito a cui puntano.!
Grazie al loro frequente aggiornamento infatti, i blog sono valutati positivamente dai motori di
ricerca.!
!
BEST PRACTICE:
Due dei metodi per aumentare il numero di link provenienti dai blog:!
• aggiungere collegamenti all’interno dei post tramite commenti che siano il più possibile naturali e
discreti. In caso contrario, l’attività potrebbe essere riconosciuta dai motori di ricerca in quanto
spam.!
• guest-blogging: si realizzano accordi con dei blogger per far ospitare un proprio articolo sui loro
blog, e viceversa ospitare articoli dei blogger sul proprio sito. !
!
!
!
BLOGGING
47. KEYWORD
ANALYSIS
CRAWLING
SIMULATORS
SPEED
TESTS
Strumenti utili per comprendere
e anticipare i comportamenti dei
bots sul proprio sito web in
modo tale da verificarne la
navigabilità.!
!
• Spider Simulator Tool
In genere, oltre a fornire una
stima dei tempi di caricamento
delle pagine, offrono anche dei
consigli per ottimizzare gli
elementi che influiscono sulla
variabile analizzata.!
!
• Google PageSpeed
• SpeedooAggiungono a una lista di keyword
creata in precedenza (preliminary list)
ulteriori termini e aiuta a comprendere
quali sono i più editati dagli utenti.!
!
• Google AdWords Keyword Tool
• Overture
• Wordtracker
48. ANALISI
DEI
BACKLINK
ANALISI
SEO
FRIENDLINESS
MONITORAGGIO
SEO
Strumenti che analizzano gli elementi
on-page in base alle attribuzioni di
valore dei motori di ricerca e degli
utenti, fornendo anche consigli su
come ottimizzarli.!
!
• WooRank
• IIS Search Engine Optimization
Utili per analizzare i contenuti del
sito oppure per monitorare il
posizionamento di un sito e/o
ricevere notifiche relative alla
posizione di determinate keyword!
• Siteliner
• Semalt
Permettono di conoscere più
approfonditamente il profilo e il valore
approssimativo dei backlink di un sito. !
!
• Ahrefs
• Open Site Explorer
• Linktrackr
50. -1-
Non ingannare gli
utenti
-2-
Rendi il tuo sito di
qualità, unico e
coinvolgente
-3-
Agisci nell’interesse
degli utenti, non solo per
i motori di ricerca
-4-
Evita trucchi e pratiche
scorrette