Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Lukáš Koprivňanský: Ako postupovať pri optimalizácii crawl budgetu

56 views

Published on

Ako postupovať pri optimalizácii crawl budgetu e-shopu, ktorý má niekoľko miliónov URL adries? Postup krok po kroku a problémy, na ktoré môžete naraziť. Prednáška odznela na SEO zraze 2019: https://seo.zraz.sk

Published in: Marketing
  • Be the first to comment

  • Be the first to like this

Lukáš Koprivňanský: Ako postupovať pri optimalizácii crawl budgetu

  1. 1. OPTIMALIZÁCIA CRAWL BUDGETU Lukáš Koprivňanský UI42 Digital
  2. 2. Meno: Lukáš Koprivňanský Agentúra: UI42 digital Pozícia: Senior SEO špecialista Prax: 5 rokov Obľúbená časť SEO: technická + analytická Iné skills: Front-end kóder
  3. 3. UI42 digital ● Ústav informatiky, číslo dverí 42 ● Zameranie na performance marketing ● SEO, PPC, FB, Content a komplexný návrh stratégie ● Zameranie na akceleráciu klientov s veľkým potenciálom ● Špecializácia na export do zahraničia
  4. 4. Čo je to crawl budget - teória ● Crawl budget neexistuje ● Recently, we've heard a number of definitions for "crawl budget", however we don't have a single term that would describe everything that "crawl budget" stands for externally. - Garry Illyes ● Pod zaužívaným termínom crawl budget chápe viacero pojmov
  5. 5. Čo je to crawl budget - prax ● Rozpočet Google bota vyhradený pre náš web ● Rozpočet je individuálny pre jednotlivé weby ● Rozpočet je individuálny pre jednotlivé dni aj hodiny ● Neexistuje konštanta
  6. 6. Prečo crawl budget riešiť? ● Jednoducho matematika - ak mám e-shop s 100 000 URL adresami a Google bot prejde denne cca 5000, prejdenie celého webu bude trvať minimálne 20 dní ● Obsah pridávaný na dennej báze sa môže do SERP dostať s veľkým oneskorením ● Nutná propagácia obsahu cez iné, platené kanály (často platené)
  7. 7. Čo je to crawler? ● Netreba mať arachnofóbiu :) ● Program na serveroch Google ● Hlavná úloha - zber vybraných dát z webov ● Google bot sa zameriava na sťahovanie celého obsahu z URL ● Pri menej sofistikovaných botoch je problém dostať sa k obsahu, ak nie je generovaný na strane servera, ale napríklad cez JS
  8. 8. Ako funguje crawlovanie? ● Bot potrebuje URL adresy ● Google sám od seba nevie o všetkom čo dáme na internet ● Nie provider hostingu nedá o Vás vedieť Google :) ● A neexistuje ani žiadny centrálny register obsahu na internet ● Google nás nájde cez externé odkazy alebo Search console ● Sitemapa je najlepší kamarát Google bota ● Bez sitemapy využíva interné prelinkovanie ● Žiadna sitemapa + nelogické interné prelinkovanie = zmätený bot a nenájdený obsah ● Kvalitný externý linkbuilding je pre správne crawlovanie dôležitý
  9. 9. Crawl rate limit ● Google bot patrí medzi slušných botov ● Limit určujúci počet aktívnych pripojení v jednom momente ● Stanovenie časového rozostupu medzi jednotlivými pripojeniami ● Tento limit pre Google bota môžeme nastaviť v GSC ● Pre niektoré ďalšie boty je to možné nastaviť príkazom v robots.txt ● Rýchly server + odozva = vyšší crawl rate limit ● Pomalý server + odozva = nižší crawl rate limit ● Môže sa meniť v priebehu hodín alebo dní
  10. 10. Crawl demand ● Vysoký crawl rate != vyšší crawl budget ● Dôležitý je základ každého trhu a to dopyt ● Čím vyššia popularita, tým sa zvýši frekvencia návštev Google bota ● Cieľom je častejšia aktualizácia, aby výsledky boli čo najaktuálnejšie ● Čím je dopyt zo strany užívateľov vyšší, tým Google viac aktualizuje ponuku ● Nevyhľadáva len nový obsah, ale kontroluje a aktualizuje aj ten starší
  11. 11. Ďalšie spúšťače ● Veľké zmeny na webe môžu byť taktiež spúšťačom navýšenia crawl budgetu ● Google sa zmeny na jednotlivých weboch snaží spracovať čo najrýchlejšie ● Cieľom je samozrejme poskytnúť čo najpresnejší a najaktualnejší výsledok užívateľovi ● Navýšenie crawl budgetu je však v tomto prípade len dočasné
  12. 12. Crawl budget v kocke Crawl budget je teda vo výsledku počet URL adries na jednej doméne, ktoré Google bot môže, ale aj chce preliezť za vybraný časový interval.
  13. 13. Faktory vplývajúce na crawl budget Crawl budget môžeme našim konaním ovplyvniť aj negatívne: ● Duplicitný obsah ● Soft error stránky ● Hacknuté stránky ● Nekonečné podstránky ● Obsah s nízkou kvalitou / spam ● Faceted navigácia
  14. 14. Kedy sa začať venovať crawl budgetu na webe ● Ak máte pocit, že Google nedostatočne rýchlo aktualizuje Vaše výsledky v SERP :) ● Nie je presný body kedy začať riešiť tento problém ● Zvyčajne na túto potrebu narazíte pri veľkých e-commerce projektoch, kde sa počet produktov pohybuje v desať tisíckach ● Crawl budget nepotrebujete riešiť pri statických stránkach ● Crawl budget nepotrebujete riešiť pri blogoch
  15. 15. Kde začať pri optimalizácii crawl budgetu Základom bude analýza dát z 2 základných zdrojov: ● Google Search Console ● Analýza kľúčových slov (Bez týchto zdrojov by ste v SEO nemali spraviť ani krok.)
  16. 16. Google Search console ● Môžeme tu násjť informácie o frekvencii crawlovania ● Informáciu nájdete v starej GSC v záložke /Crawl/CrawlStats ● Crawl budget sa v priebehu dňa mení, môže byť trochu kostrbatý ● Veľmi veľké výkyvy môžu indikovať vrchol sezóny, ale aj prípadné technické problémy na e-shope ● Je potrebná komunikácia s programátormi ● Nová GSC Vám pomocou performance reportu napovie, na aké kľúčové slová sa zobrazujete a aké podstránky a ktoré majú najviac klikov
  17. 17. Príklad z praxe: pred a povianočné obdobie
  18. 18. Analýza kľúčových slov ● Najznámejšia analýza v digitálnom marketingu ● Dáta z tejto analýzy sú základný kameň pri plánovaní optimalizácie crawlovania ● Pomoc hlavne pri redukcii indexácie filtrov a ich kombináciách ● Filtre využívané na e-shope != hľadané frázy
  19. 19. Crawl budget ako ranking faktor Podľa informácii od Garyho, crawl budget a ani jeho jednotlivé časti (crawl demand a crawl rate limit) nie sú ranking faktor. Nemá teda vplyv na samotné pozície. Crawl budget, je však nevyhnutný, aby ste sa objavili v SERP-e a má priamy vplyv na to, aké veľké množstvo Vášho obsahu sa v SERP zobrazí a ako často bude aktualizované.
  20. 20. Optimalizujem crawl budget správne? ● Nie je jediný smerodajný signál, ktorý by odpovedal na túto otázku. ● Ak budete postupovať správne, prejaví sa to na viac miestach: ○ Postupné navyšovanie počtu precrawlovaných stránok ○ V logoch zo servera uvidíte zmeny v rámci návštevnosti na povolených stránkach v robots.txt ○ V logoch by sa takmer nemali nachádzať URL adresy, ktorú sú blokované v robots.txt (v ojedinelých prípadoch sa tam objaviť môžu, no v minimálnych množstvách) ● Nárast organického trafficu a lepšie pozície. Ak budete poskytovať obsah, po ktorom je dopyt a budete indexovať len naozaj relevantný obsah ( a nepôjdete nato štýlom čím viac, tým lepšie), robíte to správne.
  21. 21. Ako sa vyhnúť prípadným problémom? Postupujte podobným spôsobom ako pri iných SEO úlohách: ● Testujte a vyhodnocujte dáta, ktoré ste získali z GSC a Analýzy kľúčových slov ● Ak budete meniť robots.txt, testujte a vyhodnocujte v malom. Nesprávnym nastavením robots.txt by ste si obzvlášť pri veľkých e-commerce projektoch mohli zablokovať veľkú časť webu. ● Dodržujte správne poradie krokov: vyhodnotím dáta z GSC a AKW => na nerelevantné URL nastavím noindex => po vyradení zo SERP zablokujem v robots.txt => skontrolujem logy zo servera a vyhodnotím.
  22. 22. Zhrnutie na záver Crawl budget sa skladá z Crawl rate limitu a Crawl demand. Crawl budget je počet URL adries, ktoré Google Bot môže, ale aj chce preliezť za určitý čas. Crawl budget je dynamický a môže sa meniť v priebehu dní a hodín. Dôležité je tvoriť obsah po ktorom je dopyt a indexovať podstránky, ktoré sú pre užívateľov relevantné. Čím viac zaindexovaných stránok != Tým lepšie.
  23. 23. Nudil si sa? Uičko hľadá SEO seniora! Pracuj na veľkých e-commerce projektoch ako eyerim, EXIsport, theRake, Bubulakovo, MobilOnline a mnohé ďalšie. Pracuj z Bratislavy, z Trenčína alebo odkiaľ aktuálne potrebuješ. Kontakt: lukas.banos@ui42.com alebo matej.karaba@ui42.com ALEBO PRÍDI NA KÁVU :)
  24. 24. ĎAKUJEM ZA POZORNOSŤ! KONTAKT: lukas.koprivnansky@ui42.com alebo koplukas@gmail.com

×