SlideShare a Scribd company logo
1 of 20
Download to read offline
CRAWL
BUDGET
VLADIMÍR SAUR
saur@dedouch.cz
@dedouch
JAKÝ JE CRAWL BUDGET
VAŠEHO WEBU?
JAKÝ JE CRAWL BUDGET
VAŠEHO WEBU?
JE TO MOC?
CO OVLIVŇUJE PŘIDĚLENÝ
CRAWL BUDGET?
CO OVLIVŇUJE PŘIDĚLENÝ
CRAWL BUDGET?
• Počet stránek webu
• Rank/popularita
• Častost aktualizace
• Rychlost webu/odezvy serveru
SEZNAM VS. GOOGLE
SEZNAMBOT
robots.txt 552x
homepage 10x
sitemap 16x
URL GET
Vše 20 700 27 600
HTML 11 400 15 200
Obrázky 9 300 11 700
<lastmod>
Stahuje se i se starším
datem
GOOGLEBOT
URL GET POST OPTIONS
Vše 85 700 304 700 14 400 130
HTML 52 500 103 100 14 400 130
Obrázky 32 700 79 900
Fonty 5 32 000
CSS 1 2 000
Javascript 15 86 700
<lastmod>
Stahuje jen poslední
datum (aktuální
den), starší ne
robots.txt 68x
homepage 196x
sitemap 11x
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
Velký počet URL
s nízkou
hodnotou
• Duplicity
• Podobnosti
• Soft errors
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
Další linkované
soubory
• Javascripty
• CSS
• Fonty
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
Technické
nedostatky
• Redirect chains
• URL bez obsahu
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
SPA
(Single-Page
Applications)
Indexace pomocí hashbang:
1. www.example.com/#!klic1=hod
nota1&klic2=hodnota2
2. <meta name="fragment"
content="!">
3. www.example.com/?
_escaped_fragment_=klic1=hod
nota1%26klic2=hodnota2
ŘÍZENÍ CRAWLINGU – CO
(TÉMĚŘ) NEFUNGUJE?
• Meta robots
• X-Robots-Tag
• Javascriptové odkazy
• Kanonizace
ŘÍZENÍ CRAWLINGU – CO
MŮŽE FUNGOVAT?
• Sitemaps
• Google Search Console – parametry
• Robots.txt
• If-Modified-Since v HTTP hlavičce
SITEMAPS
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
GOOGLE SEARCH CONSOLE
– PARAMETRY
ROBOTS.TXT
User-agent: *
Disallow: /
User-agent: SeznamBot
Disallow:
User-agent: googlebot
Disallow: /cat*.php
Disallow: /cat*.php3$
ROBOTS.TXT 2.0
User-agent: *
Robot-version: 2.0
Disallow: /test*
Disallow: /ko??
Disallow: /file?
Disallow: /[0-9][^0-9]*
?
VLADIMÍR SAUR
saur@dedouch.cz
@dedouch

More Related Content

Viewers also liked

SEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie MeyraSEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie MeyraSun Marketing
 
Přestaňme dělat analýzy, začněme dělat SEO!
Přestaňme dělat analýzy, začněme dělat SEO!Přestaňme dělat analýzy, začněme dělat SEO!
Přestaňme dělat analýzy, začněme dělat SEO!Pavel Ungr
 
Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017RobertNemec.com
 
Rychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPCRychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPCRobertNemec.com
 
HTTPS vs. Heureka (Martin Humpál)
HTTPS vs. Heureka (Martin Humpál)HTTPS vs. Heureka (Martin Humpál)
HTTPS vs. Heureka (Martin Humpál)Taste Medio
 
Deutsche seo (Milan Fiala)
Deutsche seo (Milan Fiala)Deutsche seo (Milan Fiala)
Deutsche seo (Milan Fiala)Taste Medio
 
Lokalizace webu z pohledu SEO (SEO restart 2017)
Lokalizace webu z pohledu SEO (SEO restart 2017)Lokalizace webu z pohledu SEO (SEO restart 2017)
Lokalizace webu z pohledu SEO (SEO restart 2017)Martin Kůra
 
Marketing Festival 2017 By Istropolitana Ogilvy
Marketing Festival 2017 By Istropolitana OgilvyMarketing Festival 2017 By Istropolitana Ogilvy
Marketing Festival 2017 By Istropolitana OgilvyIstropolitana Ogilvy
 

Viewers also liked (8)

SEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie MeyraSEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie Meyra
 
Přestaňme dělat analýzy, začněme dělat SEO!
Přestaňme dělat analýzy, začněme dělat SEO!Přestaňme dělat analýzy, začněme dělat SEO!
Přestaňme dělat analýzy, začněme dělat SEO!
 
Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017
 
Rychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPCRychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPC
 
HTTPS vs. Heureka (Martin Humpál)
HTTPS vs. Heureka (Martin Humpál)HTTPS vs. Heureka (Martin Humpál)
HTTPS vs. Heureka (Martin Humpál)
 
Deutsche seo (Milan Fiala)
Deutsche seo (Milan Fiala)Deutsche seo (Milan Fiala)
Deutsche seo (Milan Fiala)
 
Lokalizace webu z pohledu SEO (SEO restart 2017)
Lokalizace webu z pohledu SEO (SEO restart 2017)Lokalizace webu z pohledu SEO (SEO restart 2017)
Lokalizace webu z pohledu SEO (SEO restart 2017)
 
Marketing Festival 2017 By Istropolitana Ogilvy
Marketing Festival 2017 By Istropolitana OgilvyMarketing Festival 2017 By Istropolitana Ogilvy
Marketing Festival 2017 By Istropolitana Ogilvy
 

Similar to Crawl budget (Vladimír Saur)

SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)Pavel Ungr
 
Vyhledávače a JavaScript
Vyhledávače a JavaScriptVyhledávače a JavaScript
Vyhledávače a JavaScriptTaste Medio
 
Expertia Digital SEO Best practices při redesignu webu
Expertia Digital SEO Best practices při redesignu webuExpertia Digital SEO Best practices při redesignu webu
Expertia Digital SEO Best practices při redesignu webuPetra Ondráčková
 
Workshop Analýza klíčových slov
Workshop Analýza klíčových slovWorkshop Analýza klíčových slov
Workshop Analýza klíčových slovLukáš Pítra
 
Oxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPressOxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPressAleš Sýkora
 
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojářeRychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojářeMartin Michálek
 
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)Shopcamp 2014
 
Optimalizace webových aplikací
Optimalizace webových aplikacíOptimalizace webových aplikací
Optimalizace webových aplikacíVašek Purchart
 
SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytikaTaste Medio
 
PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018Brilo Team
 
Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webTomáš Muchka
 
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptČtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptCtvrtkoncz
 

Similar to Crawl budget (Vladimír Saur) (14)

SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
 
Vyhledávače a JavaScript
Vyhledávače a JavaScriptVyhledávače a JavaScript
Vyhledávače a JavaScript
 
Expertia Digital SEO Best practices při redesignu webu
Expertia Digital SEO Best practices při redesignu webuExpertia Digital SEO Best practices při redesignu webu
Expertia Digital SEO Best practices při redesignu webu
 
Workshop Analýza klíčových slov
Workshop Analýza klíčových slovWorkshop Analýza klíčových slov
Workshop Analýza klíčových slov
 
Oxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPressOxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPress
 
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojářeRychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
 
Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)
 
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
 
Optimalizace webových aplikací
Optimalizace webových aplikacíOptimalizace webových aplikací
Optimalizace webových aplikací
 
Základy internetu
Základy internetuZáklady internetu
Základy internetu
 
SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytika
 
PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018
 
Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro web
 
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptČtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
 

More from Taste Medio

Zodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účetZodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účetTaste Medio
 
Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4Taste Medio
 
Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?Taste Medio
 
Vyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumůVyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumůTaste Medio
 
Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?Taste Medio
 
Retenční analýza - krok za krokem
 Retenční analýza - krok za krokem Retenční analýza - krok za krokem
Retenční analýza - krok za krokemTaste Medio
 
Dejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondiceDejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondiceTaste Medio
 
Impresní remarketing RTB a FB
Impresní remarketing RTB a FBImpresní remarketing RTB a FB
Impresní remarketing RTB a FBTaste Medio
 
Symboly značky prakticky
Symboly značky praktickySymboly značky prakticky
Symboly značky praktickyTaste Medio
 
Marketingový framework PAVRD
Marketingový framework PAVRDMarketingový framework PAVRD
Marketingový framework PAVRDTaste Medio
 
Pozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizíPozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizíTaste Medio
 
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?Taste Medio
 
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...Taste Medio
 
Bageta plná hejtu
Bageta plná hejtuBageta plná hejtu
Bageta plná hejtuTaste Medio
 
Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)Taste Medio
 
"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkamiTaste Medio
 
Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?Taste Medio
 
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuciPříběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuciTaste Medio
 
Kde jsou limity zákaznické 360°?
 Kde jsou limity zákaznické 360°? Kde jsou limity zákaznické 360°?
Kde jsou limity zákaznické 360°?Taste Medio
 
Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Taste Medio
 

More from Taste Medio (20)

Zodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účetZodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účet
 
Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4
 
Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?
 
Vyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumůVyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumů
 
Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?
 
Retenční analýza - krok za krokem
 Retenční analýza - krok za krokem Retenční analýza - krok za krokem
Retenční analýza - krok za krokem
 
Dejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondiceDejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondice
 
Impresní remarketing RTB a FB
Impresní remarketing RTB a FBImpresní remarketing RTB a FB
Impresní remarketing RTB a FB
 
Symboly značky prakticky
Symboly značky praktickySymboly značky prakticky
Symboly značky prakticky
 
Marketingový framework PAVRD
Marketingový framework PAVRDMarketingový framework PAVRD
Marketingový framework PAVRD
 
Pozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizíPozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizí
 
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
 
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
 
Bageta plná hejtu
Bageta plná hejtuBageta plná hejtu
Bageta plná hejtu
 
Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)
 
"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami
 
Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?
 
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuciPříběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
 
Kde jsou limity zákaznické 360°?
 Kde jsou limity zákaznické 360°? Kde jsou limity zákaznické 360°?
Kde jsou limity zákaznické 360°?
 
Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?
 

Crawl budget (Vladimír Saur)