3. 1. Gestione della RAM
2. Valutare Indicizzazione e
Crawl Budget
3. Controllo PageSpeed
4. Verifica Hreflang
5. Estrazioni custom da HTML
6. Struttura dei link interni
7. Calcolo Non Bouncer e
pageview generate
8. Livelli di navigazione
9. Verifica Mobile User-Agent
redirection
10. Analisi backlink GSC
11. Analisi errori di scansione
GSC
12. Controllo sitemap.xml
13. Verifica migrazione sito web
14. Verifica landing page PPC
15. Interrogazione Google
Cache
Oltre la solita Scansione…
4. 1. Gestione RAM - Win
32-bit 4 GB RAM - installa Java a 32-bit
64-bit 512 GB RAM - installa Java a 64-bit
Apri file “ScreamingFrogSEOSpider.l4j.ini” con editor di testo
Modifica “-Xmx512M” che rappresenta il massimo di memoria
assegnata allo spider, ovvero “512Mb”.
Controlla gestione risorse / attività per RAM libera. Se assegni
più memoria di quella disponibile nel tuo computer lo spider
non si avvierà.
Per verificare riavvia Screaming Frog, clicca su “Help” e
successivamente su “Debug” e osserva il valore “Max”. Il valore
è sempre leggermente inferiore a quanto allocato, è normale e
dipende da JVM management.
5. 1. Gestione RAM - Mac
Da terminale digita:
uk.co.screamingfrog.seo.spider Memory 2048m
Verifica digitando nel terminale:
defaults read uk.co.screamingfrog.seo.spider
Memory
Guida EN: https://goo.gl/K4PBg0
Guida IT: https://goo.gl/Zt1REj
6. Poca RAM? Se il sito ha una
struttura a cartelle logiche
scansiona il sito in sezioni.
Minimizza i dati di crawling,
evitando quindi immagini,
CSS e JS.
1. Alternative
7. Perché serve:
Per sapere quante
pagine sono indicizzate
e quanto Googlebot sia
«goloso» dei nostri
contenuti.
Processo:
Scansiona HTML
Scarica Crawl Report
Confronta con GSC
2. Indicizzazione e Crawl Budget
8. Sorgente Dati # URL
HTML Crawl – Origine SF Crawl Report 326
Noindex – Origine SF Crawl Report 61
Pagine passate a Google 265
Index status – Origine GSC 264 99,6%
Crawl Budget – Origine GSC 663 250%
Attenzione a valori di indicizzazione <80% e >120%
Attenzione a valori di Crawl Budget <80% Cosa fare?
2. Indicizzazione e Crawl Budget
9. Il PageRank di ciascuna pagina
influisce sulla sua singola
frequenza di scansione.
Il tempo di risposta e il carico del
web server influiscono sul crawl
budget.
La frequenza di aggiornamento
dei contenuti influisce sulle
statistiche di scansione.
Googlebot viene “invitato” a
visitare una in base ai +1 ricevuti
su Google Plus.
2. Come aumentare il Crawl Budget
10. Perché serve:
Per verificare il tempo di
caricamento delle pagine.
Processo:
1. Collega Analytics API
2. Lancia la scansione
3. Confronta i dati
3. Verifica PageSpeed
11.
12. Perché serve:
Per verificare la correttezza
della tag Hreflang
Processo:
1. Custom Extraction
(//*[@hreflang])[1]
(//*[@hreflang])[2]
(//*[@hreflang])[n]
2. Scansiona il sito web
3. Verifica errori
4. Verifica Hreflang
13. Processo:
1. Imposta Custom Extraction
2. Scansiona il sito web
3. Esempio Copia xPath da Google Chrome
4. Maggiori info sulla guida ufficiale
5. Estrazioni Custom
Elemento da estrarre Stringa Regex/xPath
Analytics ["'](UA-.*?)["']
Heading H3 1° elemento //h3[1]
Heading H4 1° elemento //h4[1]
Open Graph Title //meta[starts-with(@property, 'og:title')][1]/@content
Open Graph Description //meta[starts-with(@property, 'og:description')][1]/@content
Open Graph Image //meta[starts-with(@property, 'og:image')][1]/@content
Schema.org 1° elemento (//*[@itemtype])[1]/@itemtype
Schema.org 2° elemento (//*[@itemtype])[2]/@itemtype
Schema.org 3° elemento (//*[@itemtype])[3]/@itemtype
Email //a[starts-with(@href, 'mailto')][1]
14. Perché serve:
Per visualizzare la
distribuzione dei link
interni
Processo:
1. Scansiona il sito web
2. Scarica Internal HTML
3. Tieni colonne link
4. Crea Grafico
0
200
400
600
800
1000
1200
https://www.evemilano.com/
https://www.evemilano.com/blog/
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/ser…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/pub…
https://www.evemilano.com/pub…
https://www.evemilano.com/blo…
https://www.evemilano.com/gui…
https://www.evemilano.com/201…
https://www.evemilano.com/201…
https://www.evemilano.com/abo…
https://www.evemilano.com/abo…
Inlinks Outlinks External Outlinks
6. Struttura dei link interni
15. Perché serve:
Analisi engagement e
per arricchire i dati di
Analytics
Processo:
1. Collega Analytics API,
12 mesi, dati
usabilità
2. Scansiona solo
pagine HTML
3. Calcola non Bouncer
4. Calcola minime
pageview generate
7. Non Bouncer e pageview generate
16. Perché serve:
Navigazione compatta o
troppo profonda?
Processo:
Confronta con siti simili
Nota: nella scansione
inserire il vero URL della
homepage!
8. Livelli di navigazione
18. Perché serve:
Estrarre più dati di quelli
forniti da GSC
Processo:
1. Scarica backlink da GSC
2. Imposta Custom Search
3. Lancia scansione
4. Verifica
1. Pagine in 404
2. Dominio di destinazione
10. Verifica backlink GSC
19. Perché serve:
Per avere dati
aggiornati
Processo:
1. Scarica errori di
scansione
2. Scansiona la lista
3. Verifica status code
11. Verifica Errori Scansione GSC
20. Perché serve:
Per verificare che la
sitemap.xml sia
completa e corretta
Processo:
1. Scansiona sito web
2. Scansiona sitemap
1. Verifica Status Code
3. Confronta dati
12. Controllo Sitemap.xml
21. Perché serve:
Per non perdere
traffico dopo una
migrazione!
Processo:
4 Possibilità
Vecchio file scansione
(respider)
Vecchia sitemap
Report Google
Analytics
Pagine più linkate
Verifica Status Code
13. Verifica migrazione SEO
22. Perché serve:
Per monitorare lo stato
delle landing page in
grosse campagne PPC
Processo:
1. Scarica report Annunci
2. Scansiona URL finali
3. Verifica status code
14. Verifica landing page AdWords
23. Perché serve:
Esiste la cache? Se una pagina
è in cache presumibilmente è
anche indicizzata, tranne se le
pagine sono taggate
Noarchive (Google)
Nocache (Bing)
Processo:
Scansiona il sito
Solo pagine HTML
Imposta spider speed 1 URL / sec
Crea URL della cache
Webcache in Excel
Scansiona URL della cache
Analizza status code
15. Verifica Cache di Google