Intro – SEO restart 2018 - Story of Redirection - Hororový příběh, který si SEO konzultanti vykládají před spaním
Image credit: https://www.pexels.com/photo/creepy-dark-fear-grave-534590/ (CC0)
Tento příběh asi všichni dobře známe. Proběhl redesing. Změnily se URL a nedošlo k přesměrování starých. (Graf poklesu organicu.)
Client nechápe.
Zákazník si trhá vlasy a nechápe.
Cizí SEO specialista se baví.
Google fuck off.
Dny ubíhají. A stále se nic nemění.
Klient se začne pídit po informacích, jak vyřešit problémy. Na scénu přichází vymýtač 404.
Tři části prezentace. Jak archivovat web. Kde vzít zdroje pro přesměrování a jak je na sebe vrstvit. A jak připravit redirectovací tabulku. Nástroje a tipy jsou vhodné především pro malé a střední weby.
Neexistuje žádná záloha webu. Neexistují žádné zdroje dat.
Prioritizace URL.
Automatizace. Datamining.
Kde brát data pro přesměrování. Jak přesměrovat.
Image credit: https://www.flaticon.com/free-icon/cloud-backup-up-arrow_60956 (CC 3.0 BY)
Image credit: http://www.iconarchive.com/show/ios7-icons-by-icons8/Data-Database-icon.html (Linkware)
Jak archivovat web. Prevence je důležitá.
Před redesignem si udělejte důkladný a kompletní crawl webu. Archivujte veškerá data a soubor s crawlem. Je to nedocenitelný zdroj. Crawlerů existují desítky.
Nástroj umožní zkopírovat a stáhnout jakýkoliv web. Se vším všudy. Texty, obrázky, scripty, css. Prostě všechno co je přímo dostupné a odkázané na webu. Databázi nevydoluje. Ale to nevadí. Dají se z toho rekonstuovat I URL.
Kdyby si lidi archivovali weby, tak tahle přednáška vůbec nevznikla. A mohla by teď končit.
Odkud tahat data o starých URL?
Pozdě. 404 jsou vyblité všude kolem. A je nutné sbírat informační střípky rozbitého webu.
Analytics jsou důležitým zdrojem. Odhalí chybové URL na, které uživatelé chodí nebo chodili. Stáhněte si report všech stránek webu alespoň za poslední rok.
Stáhněte si report obsahující URL, na které vedou zpětné odkazy. Je to jednoduché a efektivní. Je super mít backlinky, ale pokud vedou na 404, tak jsou vám k ničemu.
Využijte reporty 404. Jsou to URL, které vyhledávač zná a existuje důvod, proč vám je hlásí.
URL na které skutečně chodí roboti a uživatelé.
Nástroje neznám. Stejně tam visí většinou blbosti. SERP se špatně scrapuje. Něco se dá získat manuálně pomocí pluginů jako je linkclump a podobně. Ale vhodné jen na opravdu malé weby.
Crawl webu - archivní. Pokud máte, tak je to další díl do skládačky. URL, které byly nějakým zpsůobem na webu dostupné.
Historická data, krásný archiv webu. Jak to dostat ven?
Nástroj IAWM Extractor, který vytáhne první 10k URL z webu webarchivu.
Co dál dělat s daty.
Soubor s datovým démonem.
Nyní je potřeba všechny data protáhnout nástrojem, který nám vrátí status kódy. Zajímají nás hlavně ty, které vrací status kód 404.
Jak jsou důležité jednotlivé zdroje je trochu relativní.
Taková tabulka vznikne pro každý jednotlivý datový zdroj. Ale v URL je bordel, takže co s tím?
Vzoreček na odmazání HTTP, HTTPS, WWW a lomítek na konci.
Pro menší počet URL poslouží URL Builder.
Vznikne pro každý jednotlivý datový zdroj. A nyní se očistí o duplicity.
Nejvíce užitečné je používat SQL. Nasypat zdroje, přepisovat na importu a postupně zůstanou jen unikátní URL dle priority.
Představte si to jako sadu sítek, kterými postupně propadávají URL od těch nejdůležitějších až po nejméně důležité. Nebo sklenici do které se přidávají předměty podle velikosti.
Nejvíce užitečné je používat SQL. Excel je slabší.
Každopádně vznikl výsledek se kterým se bude dál pracovat.
Jak na přípravu redir tabulky.
Budete potřebovat dva tooly. Refine což je klasika. A službu reconcile-csv, která je v podstatě doplňkem refinu.
Reconcile-csv stáhenete zde.
Setu historických URL se přiřadí unikátní IDčka.
Trochu si pohrajete s příkazovým řádek, pomocí, které se spouští reconcile-csv a nahraje se tam set historických URL s IDčky.
Nyní je potřeba získat set aktuálních URL.
Spustíte refine. Nahrajete tam soubor s URL z nového webu. Spustíte rekonciliaci a přidáte službu reconcile-csv.
A pak už jen klikáte. Nástroj ke každé URL přiřadí 5 top kandidátů. Hodně URL se ale dá velice rychle napárovat pomocí skóre, které je automaticky vytvořeno.
Z refine stáhnete data. A předáte na vývoj s instrukcemi.
Přesměrování je pak ideální asi pomocí RewriteMap v .htaccess.
Nikdy ještě nevymyslel nic lepšího než 301 redirect.
Pokud si nechcete zlomit vaz, tak nikdy nepoužívejte 302 redirect. Je to smrtící. Staré URL zůstanou v SERPu a bude to děsivý bordel. A také nevytvářet redirectovací řetězce.
Shrnutí tří částí prezentace a uzavření tématu.
Image credit: https://www.flaticon.com/free-icon/cloud-backup-up-arrow_60956 (CC 3.0 BY)
Image credit: http://www.iconarchive.com/show/ios7-icons-by-icons8/Data-Database-icon.html (Linkware)
(Technické) SEO není magie, náboženství ani nic podobného. Jsou to přesně daná pravidla a stačí je dodržovat.
A občas stačí jen jiný pohled na data. Např. rozdíl v GSC pro HTTP a HTTPS. V jednom profilu graf klesá a ve druhém stoupá.