Successfully reported this slideshow.
Your SlideShare is downloading. ×

3xx - SEO restart 2018

Ad

WTF

Ad

Datové
zdroje
Archivace
webu
Automatizace
přesměrování

Ad

ARCHIVACE WEBU

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Loading in …3
×

Check these out next

1 of 52 Ad
1 of 52 Ad
Advertisement

3xx - SEO restart 2018

  1. 1. WTF
  2. 2. Datové zdroje Archivace webu Automatizace přesměrování
  3. 3. ARCHIVACE WEBU
  4. 4. Crawler
  5. 5. Archivace
  6. 6. DATOVÉ ZDROJE
  7. 7. 404 404 404
  8. 8. Analytics
  9. 9. Zpětné odkazy
  10. 10. Webmaster Tools
  11. 11. Access logy
  12. 12. SERP +operátor SITE:
  13. 13. Crawler
  14. 14. Web Archive
  15. 15. HTTPS://LINK-BRAIN.CZ/NASTROJE/IAWM-EXTRACTOR/
  16. 16. ZPRACOVÁNÍ A VRSTVENÍ DATOVÝCH ZDROJŮ
  17. 17. DATA DEMON
  18. 18. Hledání 404
  19. 19. 1. Analytics 2. Zpětné odkazy 3. Webmaster Tools 4. Access logy 5. SERP 6. Crawler 7. Web Archive Prioritizace
  20. 20. Základní tabulka URL PRIORITA https://priklad.cz 1 http://www.priklad.cz/merrin 1 http://www.priklad.cz/regan?surname=macneil 1 http://demon.priklad.cz/pazuzu/ 1
  21. 21. Standardizace URL v Excelu =SUBSTITUTE(SUBSTITUTE(SUBSTIT UTE (IF(RIGHT(A1;1)="/";LEFT(A1;LEN(A1) -1);A1);"https://";;1);"http://";;1);"www.";;1)
  22. 22. HTTPS://LINK-BRAIN.CZ/NASTROJE/URL-BUILDER/
  23. 23. Výsledek standardizace URL MOD URL https://priklad.cz priklad.cz http://www.priklad.cz/merrin priklad.cz/merrin http://www.priklad.cz/regan?surname=macneil priklad.cz/regan?surname=macneil http://demon.priklad.cz/pazuzu/ demon.priklad.cz/pazuzu
  24. 24. Vrstvení standardizovaných URL 7 6 5 4 3 2 1
  25. 25. Vrstvení standardizovaných URL
  26. 26. Nástroje pro zpracování URL Valentina Studio
  27. 27. VÝSTUP Dataset unikátních historických URL
  28. 28. REDIRECTOVACÍ TABULKA
  29. 29. NÁSTROJE RECONCILE-CSV
  30. 30. RECONCILE-CSV http://okfnlabs.org/reconcile-csv/
  31. 31. DATASET HISTORICKÝCH URL URL URL_ID priklad.cz ID_1 priklad.cz/merrin ID_2 priklad.cz/regan?surname=macneil ID_3 demon.priklad.cz/pazuzu ID_4
  32. 32. java -Xmx2g -jar reconcile-csv-0.1.2.jar <CSV-Soubor> <Sloupec-hodnot> <Sloupec-s-ID>
  33. 33. DATASET AKTUÁLNÍCH URL Unikátní standardizované aktuální URL z webu novy.cz novy.cz/father-merrin novy.cz/macneil-regan novy.cz/demonopedia/pazuzu
  34. 34. PODKLADY PRO REDIRECT PŮVODNÍ URL (ZDROJ) REDIR URL (CÍL) priklad.cz novy.cz priklad.cz/merrin novy.cz/father-merrin priklad.cz/regan?surname=macneil novy.cz/macneil-regan demon.priklad.cz/pazuzu novy.cz/demonopedia/pazuzu
  35. 35. .htaccess RewriteMap https://httpd.apache.org/docs/2.4/rewrite/rewritemap.html
  36. 36. 301 Permanent Redirect
  37. 37. ZÁVĚR
  38. 38. Datové zdroje Archivace webu Automatizace přesměrování
  39. 39. ZDENEK@LINK-BRAIN.COM @LINKBRAINSEO @CHAOTICUM
  40. 40. OTÁZKY

Editor's Notes

  • Intro – SEO restart 2018 - Story of Redirection - Hororový příběh, který si SEO konzultanti vykládají před spaním

    Image credit: https://www.pexels.com/photo/creepy-dark-fear-grave-534590/ (CC0)
  • Tento příběh asi všichni dobře známe. Proběhl redesing. Změnily se URL a nedošlo k přesměrování starých. (Graf poklesu organicu.)
  • Client nechápe.
  • Zákazník si trhá vlasy a nechápe.
  • Cizí SEO specialista se baví.
  • Google fuck off.
  • Dny ubíhají. A stále se nic nemění. 
  • Klient se začne pídit po informacích, jak vyřešit problémy. Na scénu přichází vymýtač 404.
  • Tři části prezentace. Jak archivovat web. Kde vzít zdroje pro přesměrování a jak je na sebe vrstvit. A jak připravit redirectovací tabulku. Nástroje a tipy jsou vhodné především pro malé a střední weby. 

    Neexistuje žádná záloha webu. Neexistují žádné zdroje dat.
    Prioritizace URL.
    Automatizace. Datamining. 
    Kde brát data pro přesměrování. Jak přesměrovat.

    Image credit: https://www.flaticon.com/free-icon/cloud-backup-up-arrow_60956 (CC 3.0 BY)
    Image credit: http://www.iconarchive.com/show/ios7-icons-by-icons8/Data-Database-icon.html (Linkware)
  • Jak archivovat web. Prevence je důležitá. 
  • Před redesignem si udělejte důkladný a kompletní crawl webu. Archivujte veškerá data a soubor s crawlem. Je to nedocenitelný zdroj. Crawlerů existují desítky. 
  • Nástroj umožní zkopírovat a stáhnout jakýkoliv web. Se vším všudy. Texty, obrázky, scripty, css. Prostě všechno co je přímo dostupné a odkázané na webu. Databázi nevydoluje. Ale to nevadí. Dají se z toho rekonstuovat I URL. 
  • Kdyby si lidi archivovali weby, tak tahle přednáška vůbec nevznikla. A mohla by teď končit. 
  • Odkud tahat data o starých URL? 
  • Pozdě. 404 jsou vyblité všude kolem. A je nutné sbírat informační střípky rozbitého webu.
  • Analytics jsou důležitým zdrojem. Odhalí chybové URL na, které uživatelé chodí nebo chodili. Stáhněte si report všech stránek webu alespoň za poslední rok. 
  • Stáhněte si report obsahující URL, na které vedou zpětné odkazy. Je to jednoduché a efektivní. Je super mít backlinky, ale pokud vedou na 404, tak jsou vám k ničemu. 
  • Využijte reporty 404. Jsou to URL, které vyhledávač zná a existuje důvod, proč vám je hlásí.
  • URL na které skutečně chodí roboti a uživatelé. 
  • Nástroje neznám. Stejně tam visí většinou blbosti. SERP se špatně scrapuje. Něco se dá získat manuálně pomocí pluginů jako je linkclump a podobně. Ale vhodné jen na opravdu malé weby.
  • Crawl webu - archivní. Pokud máte, tak je to další díl do skládačky. URL, které byly nějakým zpsůobem na webu dostupné. 
  • Historická data, krásný archiv webu. Jak to dostat ven?
  • Nástroj IAWM Extractor, který vytáhne první 10k URL z webu webarchivu. 
  • Co dál dělat s daty. 
  • Soubor s datovým démonem. 
  • Nyní je potřeba všechny data protáhnout nástrojem, který nám vrátí status kódy. Zajímají nás hlavně ty, které vrací status kód 404.
  • Jak jsou důležité jednotlivé zdroje je trochu relativní. 
  • Taková tabulka vznikne pro každý jednotlivý datový zdroj. Ale v URL je bordel, takže co s tím? 
  • Vzoreček na odmazání HTTP, HTTPS, WWW a lomítek na konci. 
  • Pro menší počet URL poslouží URL Builder. 
  • Vznikne pro každý jednotlivý datový zdroj. A nyní se očistí o duplicity. 
  • Nejvíce užitečné je používat SQL. Nasypat zdroje, přepisovat na importu a postupně zůstanou jen unikátní URL dle priority. 
  • Představte si to jako sadu sítek, kterými postupně propadávají URL od těch nejdůležitějších až po nejméně důležité. Nebo sklenici do které se přidávají předměty podle velikosti.  
  • Nejvíce užitečné je používat SQL. Excel je slabší.
  • Každopádně vznikl výsledek se kterým se bude dál pracovat. 
  • Jak na přípravu redir tabulky. 
  • Budete potřebovat dva tooly. Refine což je klasika. A službu reconcile-csv, která je v podstatě doplňkem refinu.
  • Reconcile-csv stáhenete zde. 
  • Setu historických URL se přiřadí unikátní IDčka.
  • Trochu si pohrajete s příkazovým řádek, pomocí, které se spouští reconcile-csv a nahraje se tam set historických URL s IDčky. 
  • Nyní je potřeba získat set aktuálních URL. 
  • Spustíte refine. Nahrajete tam soubor s URL z nového webu. Spustíte rekonciliaci a přidáte službu reconcile-csv.
  • A pak už jen klikáte. Nástroj ke každé URL přiřadí 5 top kandidátů. Hodně URL se ale dá velice rychle napárovat pomocí skóre, které je automaticky vytvořeno. 
  • Z refine stáhnete data. A předáte na vývoj s instrukcemi. 
  • Přesměrování je pak ideální asi pomocí RewriteMap v .htaccess. 
  • Nikdy ještě nevymyslel nic lepšího než 301 redirect. 
  • Pokud si nechcete zlomit vaz, tak nikdy nepoužívejte 302 redirect. Je to smrtící. Staré URL zůstanou v SERPu a bude to děsivý bordel. A také nevytvářet redirectovací řetězce.
  • Shrnutí tří částí prezentace a uzavření tématu. 

    Image credit: https://www.flaticon.com/free-icon/cloud-backup-up-arrow_60956 (CC 3.0 BY)
    Image credit: http://www.iconarchive.com/show/ios7-icons-by-icons8/Data-Database-icon.html (Linkware)
  • (Technické) SEO není magie, náboženství ani nic podobného. Jsou to přesně daná pravidla a stačí je dodržovat. 

    A občas stačí jen jiný pohled na data. Např. rozdíl v GSC pro HTTP a HTTPS. V jednom profilu graf klesá a ve druhém stoupá. 
  • Image credit: https://commons.wikimedia.org/wiki/File:PazuzuDemonAssyria1stMil_2.jpg (GNU Free)
  • Image credit: https://commons.wikimedia.org/wiki/File:PazuzuDemonAssyria1stMil_2.jpg (GNU Free)

×