SlideShare a Scribd company logo
#WMF17
@evemilano searcus.ch evemilano.com
Chi sono
Giovanni Sacheli
Papà
Partner @ searcus.ch
Blogger @ evemilano.com
Consulente SEO
Professore in Search Marketing @ Franklin University Switzerland
More info: evemilano.com/about-me
@evemilano searcus.ch evemilano.com
Oggi parliamo di…
Cos’è il log del web server
Limiti?
Tutti i siti web hanno il log?
Come abilitare il log
LogLevel: cosa loggare
Gestire la rotazione
Dove si trova il log?
Unire molti log in un file unico
Come aprire il log con Excel
Gli elementi del log
Excel Pivot
Software alternativi
Implicazioni SEO?
Come migliorare il crawl budget
@evemilano searcus.ch evemilano.com
ANALIZZARE IL LOG DEL WEB SERVER
Il log…
@evemilano searcus.ch evemilano.com
Il log…
@evemilano searcus.ch evemilano.com
Cos’è il log del web server
È il registro delle richieste effettuate da client esterni
(utenti e bot) verso le risorse ospitate (e non), come pagine
web, immagini, Javascript, CSS, ecc.
Prima di abilitare il log (se non è già abilitato) bisogna
decidere:
Cosa loggare? Tutto o solo le criticità?
La rotazione dei file dato che il log cresce all’infinito
@evemilano searcus.ch evemilano.com
Limiti?
Cache e CDN
@evemilano searcus.ch evemilano.com
Dipende dalla macchina
Server dedicati e
virtuali: devi impostare
il web server per loggare
le richieste
Alcuni server condivisi,
non tutti (ad esempio via
cPanel)
Tutti i siti web hanno il log?
@evemilano searcus.ch evemilano.com
Come abilitare il log con Apache – direttiva LogLevel
Modifica il file di configurazione del web server
Aggiungi direttiva LogLevel
LogLevel + dettaglio da loggare
Si sceglie il livello meno importante da loggare, quelli
superiori saranno tracciati automaticamente
@evemilano searcus.ch evemilano.com
Server-Wide Logging
Il file di configurazione di Apache/Ubuntu si trova qui:
/etc/apache2/apache2.conf
Aggiungi questa riga:
. . .
LogLevel warn
. . .
@evemilano searcus.ch evemilano.com
Virtual Host Logging
Il file di configurazione del singolo sito web in
Apache/Ubuntu si trova qui:
/etc/apache2/sites-available/default
Aggiungi la riga evidenziata:
. . .
LogLevel warn
. . .
@evemilano searcus.ch evemilano.com
Come abilitare il log con Nginx
Apri il file di configurazione del server block che trovi in:
/etc/nginx/sites-available/
Aggiungi la riga evidenziata nel blocco server:
http {
…
server {
…
access_log /var/log/nginx/nomesito_access.log warn;
...
}
}
@evemilano searcus.ch evemilano.com
LogLevel disponibili, cosa loggare?
LogLevel disponibili, dal più al meno
importante
emerg: Situazioni di emergenza in cui il
sistema è in uno stato inutilizzabile.
alert: Situazione grave in cui è necessaria
un'azione tempestiva.
crit: Importanti problemi da affrontare.
error: Si è verificato un errore. Qualcosa non
è riuscito.
warn: Qualcosa fuori dall'ordinario è
accaduto, ma non una causa di
preoccupazione (impostazione predefinita)
@evemilano searcus.ch evemilano.com
LogLevel disponibili, dal più al meno importante
notice: Qualcosa di normale, nulla di
strano è accaduto.
info: Un messaggio informativo che
potrebbe essere utile sapere.
debug: informazioni di debug che
possono essere utili per individuare dove
si verifica un problema.
trace[1-8]: Tracciare informazioni di vari
livelli di verbosità che producono una
grande quantità di informazioni.
@evemilano searcus.ch evemilano.com
Gestire la rotazione
In Ubuntu la rotazione dei log è gestita dalla funzione
«logrotate»
Il file di configurazione di logrotate è in:
–/etc/logrotate.d/apache2
–/etc/logrotate.d/nginx
@evemilano searcus.ch evemilano.com
Modifica file /etc/logrotate.d/*
/var/log/nginx/*.log {
daily #frequenza nuovi log
missingok
rotate 14 #archivia max 14 log
Compress #comprimi in gzip vecchi log…
delaycompress #comprimi una volta terminato il
log
Notifempty #non archiviare file vuoti
…
}
@evemilano searcus.ch evemilano.com
Attendi…
Serve una base dati statisticamente interessante per
fare valutazioni sul log.
Il limite è hardware.
@evemilano searcus.ch evemilano.com
Apache
/var/log/apache2/*.log
Nginx
/var/log/nginx/*.log
Dove si trova il log?
@evemilano searcus.ch evemilano.com
Dove si trova il log?
@evemilano searcus.ch evemilano.com
Windows  Prompt dei
comandi
Naviga nella cartella dove hai
scaricato tutti i log successivi
cd c:/temp/log
Inserisci questo commando:
for /R %f in (*.log.*) do
type “%f” >>
c:tempoutput.log
Unire molti log in un file unico
@evemilano searcus.ch evemilano.com
WELCOME EXCEL!
Come aprire il log con Excel
@evemilano searcus.ch evemilano.com
Come aprire il log con Excel
@evemilano searcus.ch evemilano.com
Come aprire il log con Excel
@evemilano searcus.ch evemilano.com
Eccolo, mancano le intestazioni!
IP USER PASSWORD DATA TIME tipo richiesta e risorsa status code bytes referral user-agent
188.114.102.89- - [11/Jun/2017:06:25:40+0000] GET / HTTP/1.1 200 16629 https://www.google.it/Mozilla/5.0 (Macin
188.114.102.89- - [11/Jun/2017:06:25:40+0000] GET / HTTP/1.1 200 16629 https://www.evemilano.comMozilla/5.0 (Macin
188.114.102.89- - [11/Jun/2017:06:25:40+0000] GET /contatti/ HTTP/1.1 200 11252 https://www.evemilano.comMozilla/5.0 (Macin
188.114.102.89- - [11/Jun/2017:06:25:41+0000] GET /servizi-seo/ HTTP/1.1 200 14328 https://www.evemilano.comMozilla/5.0 (Macin
141.101.104.48- - [11/Jun/2017:06:26:10+0000] GET /sitemap-pt-page-2011-09.xml HTTP/1.1 200 340 - Mozilla/5.0 (comp
141.101.105.169- - [11/Jun/2017:06:26:39+0000] GET /guide-seo/strumenti-seo/ HTTP/1.1 200 23321 - Mozilla/5.0 (comp
141.101.76.155- - [11/Jun/2017:06:27:42+0000] GET /blog/?q=user/register HTTP/1.1 200 22062 https://www.evemilano.comMozilla/5.0 (Wind
141.101.76.155- - [11/Jun/2017:06:27:43+0000] GET /blog/?q=user/register HTTP/1.1 200 22061 https://www.evemilano.comMozilla/5.0 (Wind
141.101.76.155- - [11/Jun/2017:06:27:43+0000] GET /2016/12/rimuovere-spazi-excel/ HTTP/1.1 200 16160 https://www.evemilano.comMozilla/5.0 (Wind
141.101.76.155- - [11/Jun/2017:06:27:43+0000] GET /blog/?q=user/register HTTP/1.1 200 22062 https://www.evemilano.comMozilla/5.0 (Wind
5.101.102.108- - [11/Jun/2017:06:28:16+0000] GET / HTTP/1.0 200 67951 - check_http/v1.4.1
141.101.105.43- - [11/Jun/2017:06:29:31+0000] GET /sitemap-pt-page-2010-04.xml HTTP/1.1 200 338 - Mozilla/5.0 (comp
141.101.104.48- - [11/Jun/2017:06:29:41+0000] GET /sitemap-pt-post-2014-07.xml HTTP/1.1 200 504 - Mozilla/5.0 (comp
172.68.58.120- - [11/Jun/2017:06:29:48+0000] GET /2013/07/velocizzare-indicizzazione-wordpress-servizi-aggiornamento/feed/ HTTP/1.1200 5036 - Mozilla/5.0 (Linux
141.101.76.239- - [11/Jun/2017:06:29:57+0000] GET /feed/ HTTP/1.1 304 0 - Feedly/1.0 (+http:
141.101.104.48- - [11/Jun/2017:06:30:32+0000] GET /sitemap-pt-page-2011-08.xml HTTP/1.1 200 340 - Mozilla/5.0 (comp
172.68.132.162- - [11/Jun/2017:06:31:17+0000] GET /robots.txt HTTP/1.1 304 0 - BUbiNG (+http://l
141.101.76.239- - [11/Jun/2017:06:31:17+0000] GET /2011/10/how-to-seo-your-wordpress-website-part-1-tweaks-and-plugins/ HTTP/1.1301 5 - BUbiNG (+http://l
141.101.104.48- - [11/Jun/2017:06:31:27+0000] GET /sitemap-pt-page-2016-02.xml HTTP/1.1 200 493 - Mozilla/5.0 (comp
162.158.74.172- - [11/Jun/2017:06:34:14+0000] GET /?feed=rss2 HTTP/1.1 301 5 - Mozilla/5.0 (comp
162.158.111.32- - [11/Jun/2017:06:34:15+0000] GET /feed/ HTTP/1.1 304 0 - Mozilla/5.0 (comp
141.101.76.191- - [11/Jun/2017:06:34:33+0000] GET /feed/ HTTP/1.1 304 0 - Digg Feed Fetcher
@evemilano searcus.ch evemilano.com
Una riga di log
141.101.76.239 - - [02/Jun/2017:06:25:44 +0000]
"GET /feed/ HTTP/1.1" 304 0
"https://www.evemilano.com/servizi-seo/" "Feedly/1.0
(+http://www.feedly.com/fetcher.html; like
FeedFetcher-Google)“
@evemilano searcus.ch evemilano.com
Gli elementi del log
Dato Elemento
141.101.76.239 IP
- User
- Password
02/Jun/2017:06:25:44 +0000 Data e ora
GET HTTP GET o POST
/feed/ Risorsa richiesta
@evemilano searcus.ch evemilano.com
Gli elementi del log
Dato Elemento
HTTP/1.1 Protocollo
304 Status Code
0 Byte trasferiti
https://www.evemilano.com/servizi-seo/ Referral
Feedly/1.0 (+http://www.feedly.com/fetcher.html;
like FeedFetcher-Google)
User-agent
@evemilano searcus.ch evemilano.com
Sfrutta Excel, prepara i dati
Iprange 1/4 Iprange 2/4 REAL URL WHAT anno mese giorno
108 108162 /2014/05/la-struttura-del-sito-ideale-per-la-seo/GET 2016 Feb 08
188 188.11 / GET 2016 Feb 08
188 188.11 /servizi-seo/ GET 2016 Feb 08
188 188.11 /wp-content/plugins/si-contact-form/captcha/securimage_shoGET 2016 Feb 08
188 188.11 /blog/ GET 2016 Feb 08
188 188.11 / GET 2016 Feb 08
108 108162 /2013/07/velocizzare-indicizzazione-wordpress-servizi-aggiornGET 2016 Feb 08
188 188114 /2011/04/ripristinare-url-in-wordpress-phpmyadmin/GET 2016 Feb 08
188 188114 /2011/04/ripristinare-url-in-wordpress-phpmyadmin/GET 2016 Feb 08
188 188114 /2011/04/ripristinare-url-in-wordpress-phpmyadmin/GET 2016 Feb 08
199 199.27 /feed/ GET 2016 Feb 08
108 108162 /feed/ GET 2016 Feb 08
108 108162 /2014/12/pagerankGET 2016 Feb 08
173 173.24 /2014/12/pagerank/GET 2016 Feb 08
108 108162 /2013/04/ottimizzare-immagini-per-google/GET 2016 Feb 08
@evemilano searcus.ch evemilano.com
f(x) funzioni dei campi calcolati
Iprange ¼: =+SINISTRA(A2;3)
Iprange 2/4: =+SINISTRA(A2;6)
REAL URL:
=+SOSTITUISCI(SOSTITUISCI(+SOSTITUISCI(F2;"P
OST ";"");"GET ";"");"HTTP/1.1";"")
WHAT: =+SINISTRA(F2;3)
Anno: =+DESTRA(SINISTRA(D2;12);4)
Mese: =+DESTRA(SINISTRA(D2;7);3)
Giorno: =+DESTRA(SINISTRA(D2;3);2)
@evemilano searcus.ch evemilano.com
Chi è il vero Googlebot?
Strumenti: una tabella pivot. Una tabella pivot è uno
strumento analitico e di reporting necessario alla
creazione di tabelle riassuntive. Uno dei fini principali
di queste tabelle è l'organizzazione di dati complessi
tramite una scelta opportuna dei campi e degli
elementi che devono comporla.
Metodologia: identificare gli IP più frequenti che si
presentano come user-agent “Googlebot”
Risultato: IP da filtrare per Iprange di Googlebot
@evemilano searcus.ch evemilano.com
Excel Pivot: Trovare IP Googlebot
@evemilano searcus.ch evemilano.com
Excel Pivot: Visualizzare il Crawl Budget
@evemilano searcus.ch evemilano.com
Excel Pivot: Visualizzare il Crawl Budget
@evemilano searcus.ch evemilano.com
Ti ricorda qualcosa?
@evemilano searcus.ch evemilano.com
Excel Pivot: Top pages
@evemilano searcus.ch evemilano.com
Excel Pivot: Analisi errori Googlebot
@evemilano searcus.ch evemilano.com
Excel Pivot: Status code Googlebot
@evemilano searcus.ch evemilano.com
Excel Pivot: Identificare spambot
@evemilano searcus.ch evemilano.com
Lavora sul Robots.txt…
@evemilano searcus.ch evemilano.com
Excel Pivot: Identificare spambot
Analizza le richieste POST, sono tue? Hanno senso?
Sono tentativi di hacking?
Usi WordPress? "POST /xmlrpc.php HTTP/1.0” ti
ricorda qualcosa?
Magari disattiva XML-RPC e JSON REST API
@evemilano searcus.ch evemilano.com
ALTERNATIVE AD EXCEL?
Software alternativi gratuiti
goaccess.io
Guida:
https://goo.gl/g
d0WRE
@evemilano searcus.ch evemilano.com
Software alternativi a pagamento
screamingfrog
.co.uk/log-file-
analyser/
Gratis fino a
1.000 righe
Prezzo: 99 £/Y
@evemilano searcus.ch evemilano.com
Software alternativi a pagamento
apacheviewer.
com
Gratuito con
funzionalità
limitate
Prezzo: 15/60
€
@evemilano searcus.ch evemilano.com
IMPLICAZIONI SEO
Implicazioni SEO?
Frequenza di scansione delle pagine: la frequenza
indica quante volte una risorsa viene richiesta dallo spider.
Le pagine più scansionate sono anche le più importanti
commercialmente parlando? No? Aggiornale e linkale più
spesso!
Le pagine più scansionate sono le più visitate dagli
utenti? Controlla con Analytics
Le pagine più scansionate sono quelle che ricevono più
link interni? Verifica con Screaming Frog
@evemilano searcus.ch evemilano.com
Implicazioni SEO?
Volume di scansione o crawl budget
Il volume rappresenta il numero di pagine del sito
web richieste dallo spider.
In rapporto alle pagine del tuo sito, quante ne
scansiona Googlebot? Tante? Poche? Reagisci di
conseguenza.
Male < 80% < Bene
@evemilano searcus.ch evemilano.com
Implicazioni SEO?
Profondità di scansione
Il numero di livelli del sito web navigati dallo spider. Il
sito web ha troppi livelli di navigazione?
Il tuo sito usa più di 4 livelli? Verifica con Screaming
Frog
Ci sono livelli che non vengono scansionati? Riduci i
livelli o migliora la struttura dei link interni
@evemilano searcus.ch evemilano.com
Implicazioni SEO?
Errori di scansione
Errori incontrati da Googlebot. Da dove arrivano gli status
code 4xx e 5xx?
Sono pagine che esistevano o sono pagine che non sono
mai esistite?
Sono errori linkati da fonti interne o esterne?
–Interne: correggi il link
–Esterne: redireziona 301 se necessario
@evemilano searcus.ch evemilano.com
OTTIMIZZARE IL CRAWL BUDGET
Come migliorare il crawl budget
Aumenta il PageRank
Crea backlink di qualità e fatti linkare da siti a tema
ed autorevoli
Maggiore è il PageRank e maggiori saranno le
scansioni
@evemilano searcus.ch evemilano.com
Riduci il tempo di
risposta del web server
Ottimizza il tempo di
crawling
Googlebot si auto-regola
Come migliorare il crawl budget
@evemilano searcus.ch evemilano.com
Come migliorare il crawl budget
Aggiorna i
contenuti
Guida:
https://goo.gl
/SE6kvO
@evemilano searcus.ch evemilano.com
Come migliorare il crawl budget
Inserisci nuovi
contenuti con
costanza
@evemilano searcus.ch evemilano.com
Come migliorare il crawl budget
Condividi le
pagine (su
Google+)
@evemilano searcus.ch evemilano.com
Enjoy log analysis
@evemilano searcus.ch evemilano.com

More Related Content

What's hot

Seo Audit Demo
Seo Audit DemoSeo Audit Demo
Seo Audit Demo
Giovanni Sacheli
 
Analisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleAnalisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search Console
Giovanni Sacheli
 
WebSphere Portal e WCM #dd12
WebSphere Portal e WCM #dd12WebSphere Portal e WCM #dd12
WebSphere Portal e WCM #dd12
Dominopoint - Italian Lotus User Group
 
5. Applicazioni Web e CMS
5. Applicazioni Web e CMS5. Applicazioni Web e CMS
5. Applicazioni Web e CMS
Roberto Polillo
 
SEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenuti
SEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenutiSEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenuti
SEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenuti
semrush_webinars
 
SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol
SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion ProtocolSEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol
SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol
semrush_webinars
 
Guida seo joomla
Guida seo joomlaGuida seo joomla
Guida seo joomla
Luca Mengoni
 
Php: riconoscere il dispositivo del client
Php: riconoscere il dispositivo del clientPhp: riconoscere il dispositivo del client
Php: riconoscere il dispositivo del client
High Secondary School
 
Giovambattista Fazioli, 10 more things
Giovambattista Fazioli, 10 more thingsGiovambattista Fazioli, 10 more things
Giovambattista Fazioli, 10 more things
KnowCamp
 
Presentazione Blog Università la Sapienza
Presentazione Blog Università la SapienzaPresentazione Blog Università la Sapienza
Presentazione Blog Università la Sapienzafabio73
 
6.01 php ajax_json_mysql
6.01 php ajax_json_mysql6.01 php ajax_json_mysql
6.01 php ajax_json_mysql
High Secondary School
 
Bach Per Chi Non C Era Parte I
Bach Per Chi Non C Era Parte IBach Per Chi Non C Era Parte I
Bach Per Chi Non C Era Parte I
Dominopoint - Italian Lotus User Group
 
Guida introduttiva al codice HTML
Guida introduttiva al codice HTMLGuida introduttiva al codice HTML
Guida introduttiva al codice HTML
Enrico Mainero
 
WordPress LD07
WordPress LD07WordPress LD07
WordPress LD07
Giacomo
 
HTML e CSS
HTML e CSSHTML e CSS
HTML e CSS
Manuel Scapolan
 
WPO: Ottimizzazione step-by-step del front-end di un e-commerce
WPO: Ottimizzazione step-by-step del front-end di un e-commerceWPO: Ottimizzazione step-by-step del front-end di un e-commerce
WPO: Ottimizzazione step-by-step del front-end di un e-commerce
Francesco Terenzani
 
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyChecklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Meta Line
 
Html 5: una breve guida!
Html 5: una breve guida!Html 5: una breve guida!
Html 5: una breve guida!
Enrico Mainero
 

What's hot (20)

Seo Audit Demo
Seo Audit DemoSeo Audit Demo
Seo Audit Demo
 
Dal Click Al Web Server
Dal Click Al Web ServerDal Click Al Web Server
Dal Click Al Web Server
 
Analisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleAnalisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search Console
 
WebSphere Portal e WCM #dd12
WebSphere Portal e WCM #dd12WebSphere Portal e WCM #dd12
WebSphere Portal e WCM #dd12
 
IBM WCM e SEO
IBM WCM e SEOIBM WCM e SEO
IBM WCM e SEO
 
5. Applicazioni Web e CMS
5. Applicazioni Web e CMS5. Applicazioni Web e CMS
5. Applicazioni Web e CMS
 
SEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenuti
SEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenutiSEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenuti
SEMrush WebStudy Marathon - SEO Tecnico - CMS in ottica SEO per i contenuti
 
SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol
SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion ProtocolSEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol
SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol
 
Guida seo joomla
Guida seo joomlaGuida seo joomla
Guida seo joomla
 
Php: riconoscere il dispositivo del client
Php: riconoscere il dispositivo del clientPhp: riconoscere il dispositivo del client
Php: riconoscere il dispositivo del client
 
Giovambattista Fazioli, 10 more things
Giovambattista Fazioli, 10 more thingsGiovambattista Fazioli, 10 more things
Giovambattista Fazioli, 10 more things
 
Presentazione Blog Università la Sapienza
Presentazione Blog Università la SapienzaPresentazione Blog Università la Sapienza
Presentazione Blog Università la Sapienza
 
6.01 php ajax_json_mysql
6.01 php ajax_json_mysql6.01 php ajax_json_mysql
6.01 php ajax_json_mysql
 
Bach Per Chi Non C Era Parte I
Bach Per Chi Non C Era Parte IBach Per Chi Non C Era Parte I
Bach Per Chi Non C Era Parte I
 
Guida introduttiva al codice HTML
Guida introduttiva al codice HTMLGuida introduttiva al codice HTML
Guida introduttiva al codice HTML
 
WordPress LD07
WordPress LD07WordPress LD07
WordPress LD07
 
HTML e CSS
HTML e CSSHTML e CSS
HTML e CSS
 
WPO: Ottimizzazione step-by-step del front-end di un e-commerce
WPO: Ottimizzazione step-by-step del front-end di un e-commerceWPO: Ottimizzazione step-by-step del front-end di un e-commerce
WPO: Ottimizzazione step-by-step del front-end di un e-commerce
 
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyChecklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
 
Html 5: una breve guida!
Html 5: una breve guida!Html 5: una breve guida!
Html 5: una breve guida!
 

Similar to Come analizzare il log del web server

Elk - Elasticsearch Logstash Kibana stack explained
Elk - Elasticsearch Logstash Kibana stack explainedElk - Elasticsearch Logstash Kibana stack explained
Elk - Elasticsearch Logstash Kibana stack explained
Federico Panini
 
Web Application Insecurity Uncensored
Web Application Insecurity UncensoredWeb Application Insecurity Uncensored
Web Application Insecurity Uncensored
jekil
 
Azure Application Insights
Azure Application InsightsAzure Application Insights
Azure Application Insights
Klab
 
Liferay Web Services - Come importare utenti da un foglio Excel
Liferay Web Services - Come importare utenti da un foglio ExcelLiferay Web Services - Come importare utenti da un foglio Excel
Liferay Web Services - Come importare utenti da un foglio Excel
Antonio Musarra
 
Applicazione tecnica dei feed
Applicazione tecnica dei feedApplicazione tecnica dei feed
Applicazione tecnica dei feedSimone Carletti
 
Aspetti di sicurezza in azienda: gestione dei log aziendali
Aspetti di sicurezza in azienda: gestione dei log aziendaliAspetti di sicurezza in azienda: gestione dei log aziendali
Aspetti di sicurezza in azienda: gestione dei log aziendali
Francesco Cossettini
 
ASP.NET performance optimization
ASP.NET performance optimizationASP.NET performance optimization
ASP.NET performance optimization
Andrea Dottor
 
Aumentiamo la sicurezza in TYPO3
Aumentiamo la sicurezza in TYPO3Aumentiamo la sicurezza in TYPO3
Aumentiamo la sicurezza in TYPO3
Mauro Lorenzutti
 
Working between the clouds (versione completa)
Working between the clouds (versione completa)Working between the clouds (versione completa)
Working between the clouds (versione completa)
Davide Cerbo
 
Migrazione Sito (2011)
Migrazione Sito (2011)Migrazione Sito (2011)
Migrazione Sito (2011)
Dottor Seo
 
Back to Basics, webinar 6: Messa in esercizio
Back to Basics, webinar 6: Messa in esercizioBack to Basics, webinar 6: Messa in esercizio
Back to Basics, webinar 6: Messa in esercizio
MongoDB
 
Working between the clouds
Working between the cloudsWorking between the clouds
Working between the clouds
Davide Cerbo
 
Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015
Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015
Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015
Enthous Agenzia Web
 
SQL Server Workload Profiling
SQL Server Workload ProfilingSQL Server Workload Profiling
SQL Server Workload Profiling
Gianluca Hotz
 
Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...
Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...
Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...
Simone Onofri
 
Meetup milano #4 Come esternalizzare i log di mule
Meetup milano #4   Come esternalizzare i log di muleMeetup milano #4   Come esternalizzare i log di mule
Meetup milano #4 Come esternalizzare i log di mule
Gonzalo Marcos Ansoain
 
Quickr , utilizzarlo "ovunque"!
Quickr , utilizzarlo "ovunque"!Quickr , utilizzarlo "ovunque"!
Quickr , utilizzarlo "ovunque"!
Vittorio Foschi
 
Abusing HTML 5 Client-side Storage
Abusing HTML 5 Client-side StorageAbusing HTML 5 Client-side Storage
Abusing HTML 5 Client-side Storageameft
 

Similar to Come analizzare il log del web server (20)

Elk - Elasticsearch Logstash Kibana stack explained
Elk - Elasticsearch Logstash Kibana stack explainedElk - Elasticsearch Logstash Kibana stack explained
Elk - Elasticsearch Logstash Kibana stack explained
 
Web Application Insecurity Uncensored
Web Application Insecurity UncensoredWeb Application Insecurity Uncensored
Web Application Insecurity Uncensored
 
Azure Application Insights
Azure Application InsightsAzure Application Insights
Azure Application Insights
 
Liferay Web Services - Come importare utenti da un foglio Excel
Liferay Web Services - Come importare utenti da un foglio ExcelLiferay Web Services - Come importare utenti da un foglio Excel
Liferay Web Services - Come importare utenti da un foglio Excel
 
Applicazione tecnica dei feed
Applicazione tecnica dei feedApplicazione tecnica dei feed
Applicazione tecnica dei feed
 
Presentazione
PresentazionePresentazione
Presentazione
 
Aspetti di sicurezza in azienda: gestione dei log aziendali
Aspetti di sicurezza in azienda: gestione dei log aziendaliAspetti di sicurezza in azienda: gestione dei log aziendali
Aspetti di sicurezza in azienda: gestione dei log aziendali
 
ASP.NET performance optimization
ASP.NET performance optimizationASP.NET performance optimization
ASP.NET performance optimization
 
Aumentiamo la sicurezza in TYPO3
Aumentiamo la sicurezza in TYPO3Aumentiamo la sicurezza in TYPO3
Aumentiamo la sicurezza in TYPO3
 
Working between the clouds (versione completa)
Working between the clouds (versione completa)Working between the clouds (versione completa)
Working between the clouds (versione completa)
 
Migrazione Sito (2011)
Migrazione Sito (2011)Migrazione Sito (2011)
Migrazione Sito (2011)
 
Back to Basics, webinar 6: Messa in esercizio
Back to Basics, webinar 6: Messa in esercizioBack to Basics, webinar 6: Messa in esercizio
Back to Basics, webinar 6: Messa in esercizio
 
Working between the clouds
Working between the cloudsWorking between the clouds
Working between the clouds
 
Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015
Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015
Joomla e SEO accoppiata perfetta: intervento di Stefano Rigazio al Seocamp 2015
 
SQL Server Workload Profiling
SQL Server Workload ProfilingSQL Server Workload Profiling
SQL Server Workload Profiling
 
Wpo extended
Wpo extendedWpo extended
Wpo extended
 
Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...
Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...
Gli HTTP Security Header e altri elementi da sapere su HTTP in un Web Applica...
 
Meetup milano #4 Come esternalizzare i log di mule
Meetup milano #4   Come esternalizzare i log di muleMeetup milano #4   Come esternalizzare i log di mule
Meetup milano #4 Come esternalizzare i log di mule
 
Quickr , utilizzarlo "ovunque"!
Quickr , utilizzarlo "ovunque"!Quickr , utilizzarlo "ovunque"!
Quickr , utilizzarlo "ovunque"!
 
Abusing HTML 5 Client-side Storage
Abusing HTML 5 Client-side StorageAbusing HTML 5 Client-side Storage
Abusing HTML 5 Client-side Storage
 

More from Giovanni Sacheli

202211 SMXL Sacheli: PageRank, cos'è e come funzionava
202211 SMXL Sacheli: PageRank, cos'è e come funzionava202211 SMXL Sacheli: PageRank, cos'è e come funzionava
202211 SMXL Sacheli: PageRank, cos'è e come funzionava
Giovanni Sacheli
 
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Giovanni Sacheli
 
Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...
Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...
Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...
Giovanni Sacheli
 
Come trovare nuovi clienti con Facebook
Come trovare nuovi clienti con FacebookCome trovare nuovi clienti con Facebook
Come trovare nuovi clienti con Facebook
Giovanni Sacheli
 
Come scrivere un contenuto che piace a Google
Come scrivere un contenuto che piace a GoogleCome scrivere un contenuto che piace a Google
Come scrivere un contenuto che piace a Google
Giovanni Sacheli
 
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Giovanni Sacheli
 
Come creare una PWA Progressive Web App @ Inbound Strategies 2018
Come creare una PWA Progressive Web App @ Inbound Strategies 2018Come creare una PWA Progressive Web App @ Inbound Strategies 2018
Come creare una PWA Progressive Web App @ Inbound Strategies 2018
Giovanni Sacheli
 
Slide corso SEO Copy Marzo 2017
Slide corso SEO Copy Marzo 2017Slide corso SEO Copy Marzo 2017
Slide corso SEO Copy Marzo 2017
Giovanni Sacheli
 
Slide corso SEO Copy Novembre 2015
Slide corso SEO Copy Novembre 2015Slide corso SEO Copy Novembre 2015
Slide corso SEO Copy Novembre 2015
Giovanni Sacheli
 
Deep Linking delle immagini
Deep Linking delle immaginiDeep Linking delle immagini
Deep Linking delle immagini
Giovanni Sacheli
 
Seo e prestashop
Seo e prestashopSeo e prestashop
Seo e prestashop
Giovanni Sacheli
 
Slide Corso SEO Copywriting Milano 10-2014
Slide Corso SEO Copywriting Milano 10-2014Slide Corso SEO Copywriting Milano 10-2014
Slide Corso SEO Copywriting Milano 10-2014
Giovanni Sacheli
 
English google webmaster central: Internationalization
English google webmaster central: InternationalizationEnglish google webmaster central: Internationalization
English google webmaster central: Internationalization
Giovanni Sacheli
 

More from Giovanni Sacheli (13)

202211 SMXL Sacheli: PageRank, cos'è e come funzionava
202211 SMXL Sacheli: PageRank, cos'è e come funzionava202211 SMXL Sacheli: PageRank, cos'è e come funzionava
202211 SMXL Sacheli: PageRank, cos'è e come funzionava
 
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
 
Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...
Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...
Come eseguire un'analisi dei competitor online - Giovanni Sacheli Seriousmonk...
 
Come trovare nuovi clienti con Facebook
Come trovare nuovi clienti con FacebookCome trovare nuovi clienti con Facebook
Come trovare nuovi clienti con Facebook
 
Come scrivere un contenuto che piace a Google
Come scrivere un contenuto che piace a GoogleCome scrivere un contenuto che piace a Google
Come scrivere un contenuto che piace a Google
 
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
 
Come creare una PWA Progressive Web App @ Inbound Strategies 2018
Come creare una PWA Progressive Web App @ Inbound Strategies 2018Come creare una PWA Progressive Web App @ Inbound Strategies 2018
Come creare una PWA Progressive Web App @ Inbound Strategies 2018
 
Slide corso SEO Copy Marzo 2017
Slide corso SEO Copy Marzo 2017Slide corso SEO Copy Marzo 2017
Slide corso SEO Copy Marzo 2017
 
Slide corso SEO Copy Novembre 2015
Slide corso SEO Copy Novembre 2015Slide corso SEO Copy Novembre 2015
Slide corso SEO Copy Novembre 2015
 
Deep Linking delle immagini
Deep Linking delle immaginiDeep Linking delle immagini
Deep Linking delle immagini
 
Seo e prestashop
Seo e prestashopSeo e prestashop
Seo e prestashop
 
Slide Corso SEO Copywriting Milano 10-2014
Slide Corso SEO Copywriting Milano 10-2014Slide Corso SEO Copywriting Milano 10-2014
Slide Corso SEO Copywriting Milano 10-2014
 
English google webmaster central: Internationalization
English google webmaster central: InternationalizationEnglish google webmaster central: Internationalization
English google webmaster central: Internationalization
 

Come analizzare il log del web server

  • 2. Chi sono Giovanni Sacheli Papà Partner @ searcus.ch Blogger @ evemilano.com Consulente SEO Professore in Search Marketing @ Franklin University Switzerland More info: evemilano.com/about-me @evemilano searcus.ch evemilano.com
  • 3. Oggi parliamo di… Cos’è il log del web server Limiti? Tutti i siti web hanno il log? Come abilitare il log LogLevel: cosa loggare Gestire la rotazione Dove si trova il log? Unire molti log in un file unico Come aprire il log con Excel Gli elementi del log Excel Pivot Software alternativi Implicazioni SEO? Come migliorare il crawl budget @evemilano searcus.ch evemilano.com
  • 4. ANALIZZARE IL LOG DEL WEB SERVER
  • 7. Cos’è il log del web server È il registro delle richieste effettuate da client esterni (utenti e bot) verso le risorse ospitate (e non), come pagine web, immagini, Javascript, CSS, ecc. Prima di abilitare il log (se non è già abilitato) bisogna decidere: Cosa loggare? Tutto o solo le criticità? La rotazione dei file dato che il log cresce all’infinito @evemilano searcus.ch evemilano.com
  • 8. Limiti? Cache e CDN @evemilano searcus.ch evemilano.com
  • 9. Dipende dalla macchina Server dedicati e virtuali: devi impostare il web server per loggare le richieste Alcuni server condivisi, non tutti (ad esempio via cPanel) Tutti i siti web hanno il log? @evemilano searcus.ch evemilano.com
  • 10. Come abilitare il log con Apache – direttiva LogLevel Modifica il file di configurazione del web server Aggiungi direttiva LogLevel LogLevel + dettaglio da loggare Si sceglie il livello meno importante da loggare, quelli superiori saranno tracciati automaticamente @evemilano searcus.ch evemilano.com
  • 11. Server-Wide Logging Il file di configurazione di Apache/Ubuntu si trova qui: /etc/apache2/apache2.conf Aggiungi questa riga: . . . LogLevel warn . . . @evemilano searcus.ch evemilano.com
  • 12. Virtual Host Logging Il file di configurazione del singolo sito web in Apache/Ubuntu si trova qui: /etc/apache2/sites-available/default Aggiungi la riga evidenziata: . . . LogLevel warn . . . @evemilano searcus.ch evemilano.com
  • 13. Come abilitare il log con Nginx Apri il file di configurazione del server block che trovi in: /etc/nginx/sites-available/ Aggiungi la riga evidenziata nel blocco server: http { … server { … access_log /var/log/nginx/nomesito_access.log warn; ... } } @evemilano searcus.ch evemilano.com
  • 14. LogLevel disponibili, cosa loggare? LogLevel disponibili, dal più al meno importante emerg: Situazioni di emergenza in cui il sistema è in uno stato inutilizzabile. alert: Situazione grave in cui è necessaria un'azione tempestiva. crit: Importanti problemi da affrontare. error: Si è verificato un errore. Qualcosa non è riuscito. warn: Qualcosa fuori dall'ordinario è accaduto, ma non una causa di preoccupazione (impostazione predefinita) @evemilano searcus.ch evemilano.com
  • 15. LogLevel disponibili, dal più al meno importante notice: Qualcosa di normale, nulla di strano è accaduto. info: Un messaggio informativo che potrebbe essere utile sapere. debug: informazioni di debug che possono essere utili per individuare dove si verifica un problema. trace[1-8]: Tracciare informazioni di vari livelli di verbosità che producono una grande quantità di informazioni. @evemilano searcus.ch evemilano.com
  • 16. Gestire la rotazione In Ubuntu la rotazione dei log è gestita dalla funzione «logrotate» Il file di configurazione di logrotate è in: –/etc/logrotate.d/apache2 –/etc/logrotate.d/nginx @evemilano searcus.ch evemilano.com
  • 17. Modifica file /etc/logrotate.d/* /var/log/nginx/*.log { daily #frequenza nuovi log missingok rotate 14 #archivia max 14 log Compress #comprimi in gzip vecchi log… delaycompress #comprimi una volta terminato il log Notifempty #non archiviare file vuoti … } @evemilano searcus.ch evemilano.com
  • 18. Attendi… Serve una base dati statisticamente interessante per fare valutazioni sul log. Il limite è hardware. @evemilano searcus.ch evemilano.com
  • 20. Dove si trova il log? @evemilano searcus.ch evemilano.com
  • 21. Windows  Prompt dei comandi Naviga nella cartella dove hai scaricato tutti i log successivi cd c:/temp/log Inserisci questo commando: for /R %f in (*.log.*) do type “%f” >> c:tempoutput.log Unire molti log in un file unico @evemilano searcus.ch evemilano.com
  • 23. Come aprire il log con Excel @evemilano searcus.ch evemilano.com
  • 24. Come aprire il log con Excel @evemilano searcus.ch evemilano.com
  • 25. Come aprire il log con Excel @evemilano searcus.ch evemilano.com
  • 26. Eccolo, mancano le intestazioni! IP USER PASSWORD DATA TIME tipo richiesta e risorsa status code bytes referral user-agent 188.114.102.89- - [11/Jun/2017:06:25:40+0000] GET / HTTP/1.1 200 16629 https://www.google.it/Mozilla/5.0 (Macin 188.114.102.89- - [11/Jun/2017:06:25:40+0000] GET / HTTP/1.1 200 16629 https://www.evemilano.comMozilla/5.0 (Macin 188.114.102.89- - [11/Jun/2017:06:25:40+0000] GET /contatti/ HTTP/1.1 200 11252 https://www.evemilano.comMozilla/5.0 (Macin 188.114.102.89- - [11/Jun/2017:06:25:41+0000] GET /servizi-seo/ HTTP/1.1 200 14328 https://www.evemilano.comMozilla/5.0 (Macin 141.101.104.48- - [11/Jun/2017:06:26:10+0000] GET /sitemap-pt-page-2011-09.xml HTTP/1.1 200 340 - Mozilla/5.0 (comp 141.101.105.169- - [11/Jun/2017:06:26:39+0000] GET /guide-seo/strumenti-seo/ HTTP/1.1 200 23321 - Mozilla/5.0 (comp 141.101.76.155- - [11/Jun/2017:06:27:42+0000] GET /blog/?q=user/register HTTP/1.1 200 22062 https://www.evemilano.comMozilla/5.0 (Wind 141.101.76.155- - [11/Jun/2017:06:27:43+0000] GET /blog/?q=user/register HTTP/1.1 200 22061 https://www.evemilano.comMozilla/5.0 (Wind 141.101.76.155- - [11/Jun/2017:06:27:43+0000] GET /2016/12/rimuovere-spazi-excel/ HTTP/1.1 200 16160 https://www.evemilano.comMozilla/5.0 (Wind 141.101.76.155- - [11/Jun/2017:06:27:43+0000] GET /blog/?q=user/register HTTP/1.1 200 22062 https://www.evemilano.comMozilla/5.0 (Wind 5.101.102.108- - [11/Jun/2017:06:28:16+0000] GET / HTTP/1.0 200 67951 - check_http/v1.4.1 141.101.105.43- - [11/Jun/2017:06:29:31+0000] GET /sitemap-pt-page-2010-04.xml HTTP/1.1 200 338 - Mozilla/5.0 (comp 141.101.104.48- - [11/Jun/2017:06:29:41+0000] GET /sitemap-pt-post-2014-07.xml HTTP/1.1 200 504 - Mozilla/5.0 (comp 172.68.58.120- - [11/Jun/2017:06:29:48+0000] GET /2013/07/velocizzare-indicizzazione-wordpress-servizi-aggiornamento/feed/ HTTP/1.1200 5036 - Mozilla/5.0 (Linux 141.101.76.239- - [11/Jun/2017:06:29:57+0000] GET /feed/ HTTP/1.1 304 0 - Feedly/1.0 (+http: 141.101.104.48- - [11/Jun/2017:06:30:32+0000] GET /sitemap-pt-page-2011-08.xml HTTP/1.1 200 340 - Mozilla/5.0 (comp 172.68.132.162- - [11/Jun/2017:06:31:17+0000] GET /robots.txt HTTP/1.1 304 0 - BUbiNG (+http://l 141.101.76.239- - [11/Jun/2017:06:31:17+0000] GET /2011/10/how-to-seo-your-wordpress-website-part-1-tweaks-and-plugins/ HTTP/1.1301 5 - BUbiNG (+http://l 141.101.104.48- - [11/Jun/2017:06:31:27+0000] GET /sitemap-pt-page-2016-02.xml HTTP/1.1 200 493 - Mozilla/5.0 (comp 162.158.74.172- - [11/Jun/2017:06:34:14+0000] GET /?feed=rss2 HTTP/1.1 301 5 - Mozilla/5.0 (comp 162.158.111.32- - [11/Jun/2017:06:34:15+0000] GET /feed/ HTTP/1.1 304 0 - Mozilla/5.0 (comp 141.101.76.191- - [11/Jun/2017:06:34:33+0000] GET /feed/ HTTP/1.1 304 0 - Digg Feed Fetcher @evemilano searcus.ch evemilano.com
  • 27. Una riga di log 141.101.76.239 - - [02/Jun/2017:06:25:44 +0000] "GET /feed/ HTTP/1.1" 304 0 "https://www.evemilano.com/servizi-seo/" "Feedly/1.0 (+http://www.feedly.com/fetcher.html; like FeedFetcher-Google)“ @evemilano searcus.ch evemilano.com
  • 28. Gli elementi del log Dato Elemento 141.101.76.239 IP - User - Password 02/Jun/2017:06:25:44 +0000 Data e ora GET HTTP GET o POST /feed/ Risorsa richiesta @evemilano searcus.ch evemilano.com
  • 29. Gli elementi del log Dato Elemento HTTP/1.1 Protocollo 304 Status Code 0 Byte trasferiti https://www.evemilano.com/servizi-seo/ Referral Feedly/1.0 (+http://www.feedly.com/fetcher.html; like FeedFetcher-Google) User-agent @evemilano searcus.ch evemilano.com
  • 30. Sfrutta Excel, prepara i dati Iprange 1/4 Iprange 2/4 REAL URL WHAT anno mese giorno 108 108162 /2014/05/la-struttura-del-sito-ideale-per-la-seo/GET 2016 Feb 08 188 188.11 / GET 2016 Feb 08 188 188.11 /servizi-seo/ GET 2016 Feb 08 188 188.11 /wp-content/plugins/si-contact-form/captcha/securimage_shoGET 2016 Feb 08 188 188.11 /blog/ GET 2016 Feb 08 188 188.11 / GET 2016 Feb 08 108 108162 /2013/07/velocizzare-indicizzazione-wordpress-servizi-aggiornGET 2016 Feb 08 188 188114 /2011/04/ripristinare-url-in-wordpress-phpmyadmin/GET 2016 Feb 08 188 188114 /2011/04/ripristinare-url-in-wordpress-phpmyadmin/GET 2016 Feb 08 188 188114 /2011/04/ripristinare-url-in-wordpress-phpmyadmin/GET 2016 Feb 08 199 199.27 /feed/ GET 2016 Feb 08 108 108162 /feed/ GET 2016 Feb 08 108 108162 /2014/12/pagerankGET 2016 Feb 08 173 173.24 /2014/12/pagerank/GET 2016 Feb 08 108 108162 /2013/04/ottimizzare-immagini-per-google/GET 2016 Feb 08 @evemilano searcus.ch evemilano.com
  • 31. f(x) funzioni dei campi calcolati Iprange ¼: =+SINISTRA(A2;3) Iprange 2/4: =+SINISTRA(A2;6) REAL URL: =+SOSTITUISCI(SOSTITUISCI(+SOSTITUISCI(F2;"P OST ";"");"GET ";"");"HTTP/1.1";"") WHAT: =+SINISTRA(F2;3) Anno: =+DESTRA(SINISTRA(D2;12);4) Mese: =+DESTRA(SINISTRA(D2;7);3) Giorno: =+DESTRA(SINISTRA(D2;3);2) @evemilano searcus.ch evemilano.com
  • 32. Chi è il vero Googlebot? Strumenti: una tabella pivot. Una tabella pivot è uno strumento analitico e di reporting necessario alla creazione di tabelle riassuntive. Uno dei fini principali di queste tabelle è l'organizzazione di dati complessi tramite una scelta opportuna dei campi e degli elementi che devono comporla. Metodologia: identificare gli IP più frequenti che si presentano come user-agent “Googlebot” Risultato: IP da filtrare per Iprange di Googlebot @evemilano searcus.ch evemilano.com
  • 33. Excel Pivot: Trovare IP Googlebot @evemilano searcus.ch evemilano.com
  • 34. Excel Pivot: Visualizzare il Crawl Budget @evemilano searcus.ch evemilano.com
  • 35. Excel Pivot: Visualizzare il Crawl Budget @evemilano searcus.ch evemilano.com
  • 36. Ti ricorda qualcosa? @evemilano searcus.ch evemilano.com
  • 37. Excel Pivot: Top pages @evemilano searcus.ch evemilano.com
  • 38. Excel Pivot: Analisi errori Googlebot @evemilano searcus.ch evemilano.com
  • 39. Excel Pivot: Status code Googlebot @evemilano searcus.ch evemilano.com
  • 40. Excel Pivot: Identificare spambot @evemilano searcus.ch evemilano.com
  • 41. Lavora sul Robots.txt… @evemilano searcus.ch evemilano.com
  • 42. Excel Pivot: Identificare spambot Analizza le richieste POST, sono tue? Hanno senso? Sono tentativi di hacking? Usi WordPress? "POST /xmlrpc.php HTTP/1.0” ti ricorda qualcosa? Magari disattiva XML-RPC e JSON REST API @evemilano searcus.ch evemilano.com
  • 45. Software alternativi a pagamento screamingfrog .co.uk/log-file- analyser/ Gratis fino a 1.000 righe Prezzo: 99 £/Y @evemilano searcus.ch evemilano.com
  • 46. Software alternativi a pagamento apacheviewer. com Gratuito con funzionalità limitate Prezzo: 15/60 € @evemilano searcus.ch evemilano.com
  • 48. Implicazioni SEO? Frequenza di scansione delle pagine: la frequenza indica quante volte una risorsa viene richiesta dallo spider. Le pagine più scansionate sono anche le più importanti commercialmente parlando? No? Aggiornale e linkale più spesso! Le pagine più scansionate sono le più visitate dagli utenti? Controlla con Analytics Le pagine più scansionate sono quelle che ricevono più link interni? Verifica con Screaming Frog @evemilano searcus.ch evemilano.com
  • 49. Implicazioni SEO? Volume di scansione o crawl budget Il volume rappresenta il numero di pagine del sito web richieste dallo spider. In rapporto alle pagine del tuo sito, quante ne scansiona Googlebot? Tante? Poche? Reagisci di conseguenza. Male < 80% < Bene @evemilano searcus.ch evemilano.com
  • 50. Implicazioni SEO? Profondità di scansione Il numero di livelli del sito web navigati dallo spider. Il sito web ha troppi livelli di navigazione? Il tuo sito usa più di 4 livelli? Verifica con Screaming Frog Ci sono livelli che non vengono scansionati? Riduci i livelli o migliora la struttura dei link interni @evemilano searcus.ch evemilano.com
  • 51. Implicazioni SEO? Errori di scansione Errori incontrati da Googlebot. Da dove arrivano gli status code 4xx e 5xx? Sono pagine che esistevano o sono pagine che non sono mai esistite? Sono errori linkati da fonti interne o esterne? –Interne: correggi il link –Esterne: redireziona 301 se necessario @evemilano searcus.ch evemilano.com
  • 53. Come migliorare il crawl budget Aumenta il PageRank Crea backlink di qualità e fatti linkare da siti a tema ed autorevoli Maggiore è il PageRank e maggiori saranno le scansioni @evemilano searcus.ch evemilano.com
  • 54. Riduci il tempo di risposta del web server Ottimizza il tempo di crawling Googlebot si auto-regola Come migliorare il crawl budget @evemilano searcus.ch evemilano.com
  • 55. Come migliorare il crawl budget Aggiorna i contenuti Guida: https://goo.gl /SE6kvO @evemilano searcus.ch evemilano.com
  • 56. Come migliorare il crawl budget Inserisci nuovi contenuti con costanza @evemilano searcus.ch evemilano.com
  • 57. Come migliorare il crawl budget Condividi le pagine (su Google+) @evemilano searcus.ch evemilano.com
  • 58. Enjoy log analysis @evemilano searcus.ch evemilano.com