SlideShare a Scribd company logo
1 of 92
Download to read offline
Screaming Frog
Martin Žatkovič
Normální PC
*16 GB RAM
Martin Žatkovič - @zatkoma
Dva rekordy
🏎 1 395 URL/s 🏎
📦 4 317 847 URL 📦
* s 16 GB ram
Martin Žatkovič - @zatkoma
• Zejména technické SEO, data a automatizace
• Skripty, API a další zábava
• SEO konzultant pro zbozi.cz
• Zakladatel Marketingové Plzně
Martin Žatkovič
SEO konzultant v Seznam.cz
Jak často crawlujete?
Martin Žatkovič - @zatkoma
Co nás čeká
• Tipy na nastavení a vyzkoušení
• Screaming Frog vs Sitebulb
• Efektivní workflow
• Netradiční využití
Martin Žatkovič - @zatkoma
Neomezujte se
Martin Žatkovič - @zatkoma
Co nás čeká
• Tipy na nastavení a vyzkoušení
• Screaming Frog vs Sitebulb
• Efektivní workflow
• Netradiční využití
Tipy na nastavení
Martin Žatkovič - @zatkoma
Nastavení
Martin Žatkovič - @zatkoma
Rychlost
• Můžete si nastavit vlastní placebo.
• Fyzická vlákna nebo virtuální?
• Maximální počet URL pro případ omezení.
• 💽 Někteří vývojáři se bojí o servery.
Martin Žatkovič - @zatkoma
User Agent
• Buďte féroví k ostatním.
• Buďte pozorní k sobě.
• $ “Bot” a Německo.
• Co zkusit nějaký custom user-agent.
• Bude se vám hodit při analýze accesslogů.
Martin Žatkovič - @zatkoma
Memory
• Důležité zejména v případě ukládání crawlu do RAM.
• Doporučuji zvýšit na 1/2 z kapacity zařízení nebo 75%.
• Pozor, občas chcete dělat i něco jiného, než crawlovat.
• Automaticky rovnou zvýšit!
Martin Žatkovič - @zatkoma
Storage
• RAM je pouze dočasná.
• Database toho zvládne víc.
• Zvykněte si používat Google Disk, Dropbox, iCloud,…
• Nejenom při crawlování!
• 🏹 Migrace na nové řešení.
Martin Žatkovič - @zatkoma
Robots.txt
• Tato sekce je vaším největším přítelem.
• Většinou chcete jen nějakou část webu.
• Instantní zrychlení crawlování a nepřetěžování serveru.
• Disallow: /
• Allow: /…
• 📦 4 317 847 URL
Martin Žatkovič - @zatkoma
Rendrování JavaScriptu
• Kdo z vás tu má web s Angularem nebo Reactem?
• Jak hlídáte, že se robotovi zobrazí to samé co uživateli?
• Jak zjistit, že dynamic rendering funguje správně?
Martin Žatkovič - @zatkoma
Extrakce
• Ohromná výhoda proti nástroji Sitebulb.
• Potřebujete něco získat z webovky a použít jinde.

• Kontrola analytiky, ID produktů, Autoři,…
• XPath / CSSPath
• 🔪 Rozšíření Scraper
Martin Žatkovič - @zatkoma
List
• Nemusíte používat Screaming Frog jen v “discovery” módu.
• Lze jej poslat pouze na určité URL, které chcete zkontrolovat.
• Kontrola externích odkazů, přesměrování,…
Martin Žatkovič - @zatkoma
Automatická nastavení
Martin Žatkovič - @zatkoma
Sitemapy
Martin Žatkovič - @zatkoma
Omezení
Martin Žatkovič - @zatkoma
Canonicals / Redirect chain
Martin Žatkovič - @zatkoma
Strukturovaná data
Martin Žatkovič - @zatkoma
Pracujte s konfigurací
Martin Žatkovič - @zatkoma
Pracovat s API?
Martin Žatkovič - @zatkoma
Pravidla pro úspěch
• ' Nikdy nechcete sestřelit cílový web.
• ( Zanechejte po sobě stopu.
• ) Robots.txt je svaté.
• * Používejte Scraper / OpenRefine
• + Extrakcí si ušetříte práci.
SF 11
Martin Žatkovič - @zatkoma
Page Speed API
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
SF vs SB
Martin Žatkovič - @zatkoma
Sitebulb je super!
Martin Žatkovič - @zatkoma
…ale…
• Stále SB nedokáže SF nahradit ve 100%.
• Nedělejme z toho další souboj!
• Udělej si sám versus vše na podnose.
• Agentura versus in-house.
Martin Žatkovič - @zatkoma
V čem je lepší?
• Vše si musíte vyřešit sami.
• Vytáhnete si co potřebujete.
• Musíte myslet.
• Vše máte na zlatém podnose.
• Krásné interface.
• Problémy a priority.
Martin Žatkovič - @zatkoma
Sledujte i další nástroje
Martin Žatkovič - @zatkoma
…ala…
Martin Žatkovič - @zatkoma
Interpretace
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Google Data Studio
Martin Žatkovič - @zatkoma
Přehled crawlu
Martin Žatkovič - @zatkoma
Přehled stavových kódů
Martin Žatkovič - @zatkoma
Parametry v URL
Martin Žatkovič - @zatkoma
Přehled nad sitemap.xml
Martin Žatkovič - @zatkoma
Google Data Studio
Martin Žatkovič - @zatkoma
Data blending je zlo!
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Případ co nastal
• “Líbil by se nám reporting na základě kategorií”
• “Rozhodně není problém - to dává smysl”
• Kombinace dat: Google Sheet + GSC + GA + Colllabim
• “V GDS to nedělejte, nedává to smysl”
Martin Žatkovič - @zatkoma
Power BI
Martin Žatkovič - @zatkoma
1:N, 1:1, N:N vazby
Martin Žatkovič - @zatkoma
Robin Rozhon
• https://rozhon.com/blog/blending-log-files-with-other-data-
sources-for-seo-in-power-bi/
• https://www.youtube.com/watch?v=gaREGSztXAY
Martin Žatkovič - @zatkoma
Výsledné spojení
Martin Žatkovič - @zatkoma
Power BI
Efektivní workflow
Martin Žatkovič - @zatkoma
Správné ukládání
Martin Žatkovič - @zatkoma
Jak ukládat a kde?
• Vše si pečlivě třiďte a ukládejte.
• Optimálně využívejte jeden disk a roztřídit pěkně po klientech.
• Je dobré si pamatovat, co jste chtěli nacrawlovat a proč.
• Špatné / nekopletní crawly rovnou mažte.
Martin Žatkovič - @zatkoma
Ukládejte na síti
Martin Žatkovič - @zatkoma
Disk může kdykoliv odejít
• Cloud vám pofičí neustále.
• Chcete-li mít přístup k projektům a starým crawlům.
• Neukládejte jenom .seospider soubory ale i výsledky.
• Používáte-li nějakou transformaci, tak ukládejte před i po.
• Google Drive - 1 TB = 299 Kč / měsíc
• iCloud - 2 TB = 249 Kč / měsíc
Martin Žatkovič - @zatkoma
Crawlování na serveru
Martin Žatkovič - @zatkoma
Server je váš přítel
• Optimálně AWS / Google Cloud.
• Lze jednoduše škálovat a brát si větší výkon.
• V případě větších firem interní server, kde to budete ovládat.
• Má to smysl?
Martin Žatkovič - @zatkoma
Opravdu interní server?
• Opravdu potřebujete provést kompletní crawl celého webu?
• Opravdu má smysl crawlovat weby s 5 000 000 stránek a víc?
• Opravdu má smysl udržovat v provozu server?
• Vyzkoušíte a uvidíte.
• SF jede i na linuxu.
• Hledejte spot instance.
Martin Žatkovič - @zatkoma
AWS, Google Cloud
• Buď používáte Windows Server, kde máte okno a můžete klikat.
• Předpřipravený balíček v Dockeru.
• Po spuštění provede instalaci a nastavení.
• Spustí crawl webu.
• Data pošle do Big Querry / FTP.
• Zabije se jakmile je hotovo.
Martin Žatkovič - @zatkoma
Práce s CLI
Martin Žatkovič - @zatkoma
Naučte se s CLI
• Máte-li stejné případy využití (technický audit, analýza,…).
• Můžete si vytvořit jednoduché spouštění pomocí .bat / .sh skriptů.
• Vše (/ exporty) si připravíte jednou a následně máte vyřešeno.
• Po dokončení crawlu se vám vše nahraje do složek a zazálohuje se.
• Výsledné složky můžete “odposlouchávat” a výstupy obohacovat.
Martin Žatkovič - @zatkoma
Jak to může fungovat?
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Martin Žatkovič - @zatkoma
Netradiční využití
Martin Žatkovič - @zatkoma
Vizualizace interního
prolinkování
Martin Žatkovič - @zatkoma
Analýza klíčových slov
• Použil někdo už Screaming Frog při analýze klíčových slov?
• V jakém segmentu? Jaké jste dopadli?
• Většinou jde o extrakci konkrétních částí webu na míru projektu.
Martin Žatkovič - @zatkoma
Dva případy
• 💂 Vykradení obsahu
• Obsah konkurence.
• Používaná klíčová slova.
• N-Gramy
• Frekvenční analýza
• 📚 Knihy, filmy a další díla
• Názvy děl a autoři.
• Případně herci a další…
• Unikátní seznam
Martin Žatkovič - @zatkoma
Generování XML feedu
• Potřebujete-li si něco rychle otestovat.
• Nechcete ubírat kapacitu programátorům.
• Podpora pro jiné týmy.

• Podpora pro DSA kampaně.
• Podpora pro akce / e-mailing.
• Otestování datových zdrojů.
Martin Žatkovič - @zatkoma
Reálný výsledek
Martin Žatkovič - @zatkoma
Generování sitemap
• Chcete-li si vytvořit obrázkovou sitemapu.
• Stačí vám využít jedno tlačítko na export.
• Screaming Frog ohlídá základní pravidla.
Martin Žatkovič - @zatkoma
Rozdíly na webu
• Jak poznat, že se něco na nové verzi webu něco změnilo?
• Jak jednoduše srovnat dva crawly webu?
• Lze to vůbec srovnat nějak jednoduše?
Martin Žatkovič - @zatkoma
Jak to udělat jednoduše?
• Pomocí “SQL” 1:1
• Stavové kódy, titulky, H1,…

• Export všech odkazů
• Navázat pomocí URL
• Push nových souborů.
• Můžete srovnat celé HTML.

• git add —all
• git commit -m "crawl 1"
• git push
Martin Žatkovič - @zatkoma
Případ Muziker
• “Večer budeme spouštět novou verzi webu”
• Jednoduché srovnání crawlů by odhalilo většinu problémů.
Závěr
Martin Žatkovič - @zatkoma
Co si odnést / udělat?
1.Proklikejte (ale opravdu) si zítra ráno Screaming Frog.

2.Projděte si nastavení vašeho workflow a aktualizujte jej.

3.Propojte spojený crawl s daty z GSC a něco určitě vymyslíte.
Martin Žatkovič - @zatkoma
Všechno jde 🙃
Martin Žatkovič - @zatkoma
Děkuji za pozornost

Otázky nad rámec prezentace?
📧 ➡ martin@zatkovic.cz ⬅ 📧

More Related Content

What's hot

SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
seznamVyvojari
 
SEO pro manažery
SEO pro manažerySEO pro manažery
SEO pro manažery
vaclav.lohr
 

What's hot (20)

Kontinualni testovani a monitoring SEO - SEO robot
Kontinualni testovani a monitoring SEO - SEO robotKontinualni testovani a monitoring SEO - SEO robot
Kontinualni testovani a monitoring SEO - SEO robot
 
URL Profiler - víc, než OpenRefine pro lamy:)
URL Profiler - víc, než OpenRefine pro lamy:)URL Profiler - víc, než OpenRefine pro lamy:)
URL Profiler - víc, než OpenRefine pro lamy:)
 
Entitní SEO pro eshopy | RobertNemec.com
Entitní SEO pro eshopy | RobertNemec.comEntitní SEO pro eshopy | RobertNemec.com
Entitní SEO pro eshopy | RobertNemec.com
 
SeznamBot a Kanonizace pro SEOloger 18.4.2018
SeznamBot a Kanonizace pro SEOloger 18.4.2018SeznamBot a Kanonizace pro SEOloger 18.4.2018
SeznamBot a Kanonizace pro SEOloger 18.4.2018
 
Seologer novinky v nástroji
Seologer novinky v nástrojiSeologer novinky v nástroji
Seologer novinky v nástroji
 
SEO ve světě JavaScriptu
SEO ve světě JavaScriptuSEO ve světě JavaScriptu
SEO ve světě JavaScriptu
 
Vše co potřebuje markeťák vědět o rychlostní optimalizaci webů
Vše co potřebuje markeťák vědět o rychlostní optimalizaci webůVše co potřebuje markeťák vědět o rychlostní optimalizaci webů
Vše co potřebuje markeťák vědět o rychlostní optimalizaci webů
 
SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
 
Vyhledávače a JavaScript
Vyhledávače a JavaScriptVyhledávače a JavaScript
Vyhledávače a JavaScript
 
Analýza klíčových slov
Analýza klíčových slovAnalýza klíčových slov
Analýza klíčových slov
 
Vojtěch Foukal - SEO 3x jinak
Vojtěch Foukal - SEO 3x jinakVojtěch Foukal - SEO 3x jinak
Vojtěch Foukal - SEO 3x jinak
 
Collabim jede! SEOloger 17.10.2018
Collabim jede! SEOloger 17.10.2018Collabim jede! SEOloger 17.10.2018
Collabim jede! SEOloger 17.10.2018
 
SEO analytika
SEO analytikaSEO analytika
SEO analytika
 
Rychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPCRychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPC
 
Konec intuicím - začněte konečně tvořit obsah na základě dat! - Shopcamp 2017
Konec intuicím - začněte konečně tvořit obsah na základě dat! - Shopcamp 2017Konec intuicím - začněte konečně tvořit obsah na základě dat! - Shopcamp 2017
Konec intuicím - začněte konečně tvořit obsah na základě dat! - Shopcamp 2017
 
SEO pro manažery
SEO pro manažerySEO pro manažery
SEO pro manažery
 
Optimalizace cílení, skóre kvality a novinky v Adwords API v201601
Optimalizace cílení, skóre kvality a novinky v Adwords API v201601Optimalizace cílení, skóre kvality a novinky v Adwords API v201601
Optimalizace cílení, skóre kvality a novinky v Adwords API v201601
 
SEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie MeyraSEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie Meyra
 
Jak se dostat do Featured Snippets - SEOloger naživo 2017
Jak se dostat do Featured Snippets - SEOloger naživo 2017Jak se dostat do Featured Snippets - SEOloger naživo 2017
Jak se dostat do Featured Snippets - SEOloger naživo 2017
 
Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017
 

Similar to Říjnový SEOloger 2019 - Screaming Frog a crawlování webů

Javascript na steroidech
Javascript na steroidechJavascript na steroidech
Javascript na steroidech
seznamVyvojari
 

Similar to Říjnový SEOloger 2019 - Screaming Frog a crawlování webů (20)

SEO jako Brno - workshop k rychlosti webu
SEO jako Brno - workshop k rychlosti webuSEO jako Brno - workshop k rychlosti webu
SEO jako Brno - workshop k rychlosti webu
 
Google Tag Manager a analytika ve WordPress
Google Tag Manager a analytika ve WordPressGoogle Tag Manager a analytika ve WordPress
Google Tag Manager a analytika ve WordPress
 
WP Weekend 2018
WP Weekend 2018WP Weekend 2018
WP Weekend 2018
 
Data Restart 2021: Roman Appeltauer - Server-side GTM je skutečně víc než jen...
Data Restart 2021: Roman Appeltauer - Server-side GTM je skutečně víc než jen...Data Restart 2021: Roman Appeltauer - Server-side GTM je skutečně víc než jen...
Data Restart 2021: Roman Appeltauer - Server-side GTM je skutečně víc než jen...
 
Workshop - Petr Pavelek - Rychlejší práce v Skliku pro e-shopy (ShopCamp 2015)
Workshop - Petr Pavelek - Rychlejší práce v Skliku pro e-shopy (ShopCamp 2015)Workshop - Petr Pavelek - Rychlejší práce v Skliku pro e-shopy (ShopCamp 2015)
Workshop - Petr Pavelek - Rychlejší práce v Skliku pro e-shopy (ShopCamp 2015)
 
Rychlejší práce v Skliku pro e-shopy
Rychlejší práce v Skliku pro e-shopyRychlejší práce v Skliku pro e-shopy
Rychlejší práce v Skliku pro e-shopy
 
Web rychlý jako blesk (s důrazem na AMP)
Web rychlý jako blesk (s důrazem na AMP)Web rychlý jako blesk (s důrazem na AMP)
Web rychlý jako blesk (s důrazem na AMP)
 
Jak funguje prohlížeč
Jak funguje prohlížečJak funguje prohlížeč
Jak funguje prohlížeč
 
Rychlost webu: Co pro ni mohou udělat UXáci, marketéři a majitelé webů?
Rychlost webu: Co pro ni mohou udělat UXáci, marketéři a majitelé webů?Rychlost webu: Co pro ni mohou udělat UXáci, marketéři a majitelé webů?
Rychlost webu: Co pro ni mohou udělat UXáci, marketéři a majitelé webů?
 
Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro web
 
Data Restart 2022: Roman Appeltauer - Aktivace first-party dat pomocí SGTM
Data Restart 2022: Roman Appeltauer - Aktivace first-party dat pomocí SGTMData Restart 2022: Roman Appeltauer - Aktivace first-party dat pomocí SGTM
Data Restart 2022: Roman Appeltauer - Aktivace first-party dat pomocí SGTM
 
Javascript na steroidech
Javascript na steroidechJavascript na steroidech
Javascript na steroidech
 
WordPress šablony a rychlost načítání (WordCamp Praha 2017)
WordPress šablony a  rychlost načítání (WordCamp Praha 2017)WordPress šablony a  rychlost načítání (WordCamp Praha 2017)
WordPress šablony a rychlost načítání (WordCamp Praha 2017)
 
Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)
 
Webmeetup #3
Webmeetup #3Webmeetup #3
Webmeetup #3
 
Cheat sheet python_vlaxa
Cheat sheet python_vlaxaCheat sheet python_vlaxa
Cheat sheet python_vlaxa
 
Blbosti kolem webové rychlosti
Blbosti kolem webové rychlostiBlbosti kolem webové rychlosti
Blbosti kolem webové rychlosti
 
Poslední středa - SEO / UX na javascriptových a jiných moderních webech - Pav...
Poslední středa - SEO / UX na javascriptových a jiných moderních webech - Pav...Poslední středa - SEO / UX na javascriptových a jiných moderních webech - Pav...
Poslední středa - SEO / UX na javascriptových a jiných moderních webech - Pav...
 
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPressTomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
 
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
 

Říjnový SEOloger 2019 - Screaming Frog a crawlování webů

  • 2.
  • 4. Martin Žatkovič - @zatkoma Dva rekordy 🏎 1 395 URL/s 🏎 📦 4 317 847 URL 📦 * s 16 GB ram
  • 5.
  • 6. Martin Žatkovič - @zatkoma • Zejména technické SEO, data a automatizace • Skripty, API a další zábava • SEO konzultant pro zbozi.cz • Zakladatel Marketingové Plzně Martin Žatkovič SEO konzultant v Seznam.cz
  • 8. Martin Žatkovič - @zatkoma Co nás čeká • Tipy na nastavení a vyzkoušení • Screaming Frog vs Sitebulb • Efektivní workflow • Netradiční využití
  • 9. Martin Žatkovič - @zatkoma Neomezujte se
  • 10. Martin Žatkovič - @zatkoma Co nás čeká • Tipy na nastavení a vyzkoušení • Screaming Frog vs Sitebulb • Efektivní workflow • Netradiční využití
  • 12. Martin Žatkovič - @zatkoma Nastavení
  • 13. Martin Žatkovič - @zatkoma Rychlost • Můžete si nastavit vlastní placebo. • Fyzická vlákna nebo virtuální? • Maximální počet URL pro případ omezení. • 💽 Někteří vývojáři se bojí o servery.
  • 14. Martin Žatkovič - @zatkoma User Agent • Buďte féroví k ostatním. • Buďte pozorní k sobě. • $ “Bot” a Německo. • Co zkusit nějaký custom user-agent. • Bude se vám hodit při analýze accesslogů.
  • 15. Martin Žatkovič - @zatkoma Memory • Důležité zejména v případě ukládání crawlu do RAM. • Doporučuji zvýšit na 1/2 z kapacity zařízení nebo 75%. • Pozor, občas chcete dělat i něco jiného, než crawlovat. • Automaticky rovnou zvýšit!
  • 16. Martin Žatkovič - @zatkoma Storage • RAM je pouze dočasná. • Database toho zvládne víc. • Zvykněte si používat Google Disk, Dropbox, iCloud,… • Nejenom při crawlování! • 🏹 Migrace na nové řešení.
  • 17. Martin Žatkovič - @zatkoma Robots.txt • Tato sekce je vaším největším přítelem. • Většinou chcete jen nějakou část webu. • Instantní zrychlení crawlování a nepřetěžování serveru. • Disallow: / • Allow: /… • 📦 4 317 847 URL
  • 18. Martin Žatkovič - @zatkoma Rendrování JavaScriptu • Kdo z vás tu má web s Angularem nebo Reactem? • Jak hlídáte, že se robotovi zobrazí to samé co uživateli? • Jak zjistit, že dynamic rendering funguje správně?
  • 19. Martin Žatkovič - @zatkoma Extrakce • Ohromná výhoda proti nástroji Sitebulb. • Potřebujete něco získat z webovky a použít jinde.
 • Kontrola analytiky, ID produktů, Autoři,… • XPath / CSSPath • 🔪 Rozšíření Scraper
  • 20. Martin Žatkovič - @zatkoma List • Nemusíte používat Screaming Frog jen v “discovery” módu. • Lze jej poslat pouze na určité URL, které chcete zkontrolovat. • Kontrola externích odkazů, přesměrování,…
  • 21. Martin Žatkovič - @zatkoma Automatická nastavení
  • 22. Martin Žatkovič - @zatkoma Sitemapy
  • 23. Martin Žatkovič - @zatkoma Omezení
  • 24. Martin Žatkovič - @zatkoma Canonicals / Redirect chain
  • 25. Martin Žatkovič - @zatkoma Strukturovaná data
  • 26. Martin Žatkovič - @zatkoma Pracujte s konfigurací
  • 27. Martin Žatkovič - @zatkoma Pracovat s API?
  • 28. Martin Žatkovič - @zatkoma Pravidla pro úspěch • ' Nikdy nechcete sestřelit cílový web. • ( Zanechejte po sobě stopu. • ) Robots.txt je svaté. • * Používejte Scraper / OpenRefine • + Extrakcí si ušetříte práci.
  • 29. SF 11
  • 30. Martin Žatkovič - @zatkoma Page Speed API
  • 32.
  • 33.
  • 36.
  • 37.
  • 38.
  • 40. Martin Žatkovič - @zatkoma Sitebulb je super!
  • 41. Martin Žatkovič - @zatkoma …ale… • Stále SB nedokáže SF nahradit ve 100%. • Nedělejme z toho další souboj! • Udělej si sám versus vše na podnose. • Agentura versus in-house.
  • 42. Martin Žatkovič - @zatkoma V čem je lepší? • Vše si musíte vyřešit sami. • Vytáhnete si co potřebujete. • Musíte myslet. • Vše máte na zlatém podnose. • Krásné interface. • Problémy a priority.
  • 43. Martin Žatkovič - @zatkoma Sledujte i další nástroje
  • 44. Martin Žatkovič - @zatkoma …ala…
  • 45. Martin Žatkovič - @zatkoma Interpretace
  • 48. Martin Žatkovič - @zatkoma Google Data Studio
  • 49. Martin Žatkovič - @zatkoma Přehled crawlu
  • 50. Martin Žatkovič - @zatkoma Přehled stavových kódů
  • 51. Martin Žatkovič - @zatkoma Parametry v URL
  • 52. Martin Žatkovič - @zatkoma Přehled nad sitemap.xml
  • 53. Martin Žatkovič - @zatkoma Google Data Studio
  • 54. Martin Žatkovič - @zatkoma Data blending je zlo!
  • 55.
  • 57. Martin Žatkovič - @zatkoma Případ co nastal • “Líbil by se nám reporting na základě kategorií” • “Rozhodně není problém - to dává smysl” • Kombinace dat: Google Sheet + GSC + GA + Colllabim • “V GDS to nedělejte, nedává to smysl”
  • 58. Martin Žatkovič - @zatkoma Power BI
  • 59. Martin Žatkovič - @zatkoma 1:N, 1:1, N:N vazby
  • 60. Martin Žatkovič - @zatkoma Robin Rozhon • https://rozhon.com/blog/blending-log-files-with-other-data- sources-for-seo-in-power-bi/ • https://www.youtube.com/watch?v=gaREGSztXAY
  • 61. Martin Žatkovič - @zatkoma Výsledné spojení
  • 62. Martin Žatkovič - @zatkoma Power BI
  • 64. Martin Žatkovič - @zatkoma Správné ukládání
  • 65. Martin Žatkovič - @zatkoma Jak ukládat a kde? • Vše si pečlivě třiďte a ukládejte. • Optimálně využívejte jeden disk a roztřídit pěkně po klientech. • Je dobré si pamatovat, co jste chtěli nacrawlovat a proč. • Špatné / nekopletní crawly rovnou mažte.
  • 66. Martin Žatkovič - @zatkoma Ukládejte na síti
  • 67. Martin Žatkovič - @zatkoma Disk může kdykoliv odejít • Cloud vám pofičí neustále. • Chcete-li mít přístup k projektům a starým crawlům. • Neukládejte jenom .seospider soubory ale i výsledky. • Používáte-li nějakou transformaci, tak ukládejte před i po. • Google Drive - 1 TB = 299 Kč / měsíc • iCloud - 2 TB = 249 Kč / měsíc
  • 68. Martin Žatkovič - @zatkoma Crawlování na serveru
  • 69. Martin Žatkovič - @zatkoma Server je váš přítel • Optimálně AWS / Google Cloud. • Lze jednoduše škálovat a brát si větší výkon. • V případě větších firem interní server, kde to budete ovládat. • Má to smysl?
  • 70. Martin Žatkovič - @zatkoma Opravdu interní server? • Opravdu potřebujete provést kompletní crawl celého webu? • Opravdu má smysl crawlovat weby s 5 000 000 stránek a víc? • Opravdu má smysl udržovat v provozu server? • Vyzkoušíte a uvidíte. • SF jede i na linuxu. • Hledejte spot instance.
  • 71. Martin Žatkovič - @zatkoma AWS, Google Cloud • Buď používáte Windows Server, kde máte okno a můžete klikat. • Předpřipravený balíček v Dockeru. • Po spuštění provede instalaci a nastavení. • Spustí crawl webu. • Data pošle do Big Querry / FTP. • Zabije se jakmile je hotovo.
  • 72. Martin Žatkovič - @zatkoma Práce s CLI
  • 73. Martin Žatkovič - @zatkoma Naučte se s CLI • Máte-li stejné případy využití (technický audit, analýza,…). • Můžete si vytvořit jednoduché spouštění pomocí .bat / .sh skriptů. • Vše (/ exporty) si připravíte jednou a následně máte vyřešeno. • Po dokončení crawlu se vám vše nahraje do složek a zazálohuje se. • Výsledné složky můžete “odposlouchávat” a výstupy obohacovat.
  • 74. Martin Žatkovič - @zatkoma Jak to může fungovat?
  • 80. Martin Žatkovič - @zatkoma Vizualizace interního prolinkování
  • 81. Martin Žatkovič - @zatkoma Analýza klíčových slov • Použil někdo už Screaming Frog při analýze klíčových slov? • V jakém segmentu? Jaké jste dopadli? • Většinou jde o extrakci konkrétních částí webu na míru projektu.
  • 82. Martin Žatkovič - @zatkoma Dva případy • 💂 Vykradení obsahu • Obsah konkurence. • Používaná klíčová slova. • N-Gramy • Frekvenční analýza • 📚 Knihy, filmy a další díla • Názvy děl a autoři. • Případně herci a další… • Unikátní seznam
  • 83. Martin Žatkovič - @zatkoma Generování XML feedu • Potřebujete-li si něco rychle otestovat. • Nechcete ubírat kapacitu programátorům. • Podpora pro jiné týmy.
 • Podpora pro DSA kampaně. • Podpora pro akce / e-mailing. • Otestování datových zdrojů.
  • 84. Martin Žatkovič - @zatkoma Reálný výsledek
  • 85. Martin Žatkovič - @zatkoma Generování sitemap • Chcete-li si vytvořit obrázkovou sitemapu. • Stačí vám využít jedno tlačítko na export. • Screaming Frog ohlídá základní pravidla.
  • 86. Martin Žatkovič - @zatkoma Rozdíly na webu • Jak poznat, že se něco na nové verzi webu něco změnilo? • Jak jednoduše srovnat dva crawly webu? • Lze to vůbec srovnat nějak jednoduše?
  • 87. Martin Žatkovič - @zatkoma Jak to udělat jednoduše? • Pomocí “SQL” 1:1 • Stavové kódy, titulky, H1,…
 • Export všech odkazů • Navázat pomocí URL • Push nových souborů. • Můžete srovnat celé HTML.
 • git add —all • git commit -m "crawl 1" • git push
  • 88. Martin Žatkovič - @zatkoma Případ Muziker • “Večer budeme spouštět novou verzi webu” • Jednoduché srovnání crawlů by odhalilo většinu problémů.
  • 90. Martin Žatkovič - @zatkoma Co si odnést / udělat? 1.Proklikejte (ale opravdu) si zítra ráno Screaming Frog.
 2.Projděte si nastavení vašeho workflow a aktualizujte jej.
 3.Propojte spojený crawl s daty z GSC a něco určitě vymyslíte.
  • 91. Martin Žatkovič - @zatkoma Všechno jde 🙃
  • 92. Martin Žatkovič - @zatkoma Děkuji za pozornost
 Otázky nad rámec prezentace? 📧 ➡ martin@zatkovic.cz ⬅ 📧