SlideShare a Scribd company logo
1 of 39
Ловец ботов:
рост индексации и поиск
плохих страниц
Дмитрий Шахов
Директор ГК РЕМАРКА
Докладчик на конференциях
• AllInTop (Москва, 2012, 2014-2016гг.),
• SeoConference (Казань, 2014-2015гг.),
• Кибермаркетинг (Москва, 2015г.),
• РИФ-Воронеж (2014-2015гг.),
• Онлайн: SmartFox, Megaindex.
Организатор конференции
• BalticDigitalDays (2013-2016гг.)
Курсы по поисковому продвижению
• 200+ выпускников за три года
www.remarka.info www.seohowto.ru www.balticdigitaldays.ru
Проблематика
• Очень много посадочных страниц
• Постоянно мониторить факт
индексации ручками муторно и дорого
• Непонятно, за что поперли страницу из
индекса
Актуально для любых многостраничных сайтов!
Ловец Шестаковых (Rush Agency)
Стек: все посадочные страницы
Стек: не в индексе
Стек: посещен ботом
Стек:
проблемы
с индексом
Ждем текстового
апдейта
Ловец ботов:
показ боту ссылок на страницы
не в индексе
Ловец ботов:
фиксация визита бота на странице
не в индексе
Какой раз проверяли?
<N
N
Чекинг страниц
на индекс
Нет
Да
Имеют траффик
с поиска?
Нет
Да
Посадочная нужна?
Как давно не имеет?
>Х мес.
<Х мес.
Стек:
проблемы
с поиском
ДаНет
Ловец ботов, ver2.0
Схема отрабатывается для
каждой поисковой системы
Х = 6
N = 3
Позиции по ключам
нормальные?
Да
Нет
Контент-план:
переписать,
дооптимизировать
Trashbox:
удаляем,
disallow
Trash:
Бота
нет!
Формируем стек страниц
• На самом деле непринципиально как
это делать
• Можно карту сайта
• Можно просто пул страница/анкор
• С этим справится любой программер
Проверка на индекс
• Срежем часть на проверке заходов с
поиска пользователей – если траффик
есть, то страница в индексе и в топе
• Оставшиеся чекаем
– url:site.com/page.html в Яндексе
– info:site.com/page.html в Google
Чекинг: решения
• Пока не забанят, свои IP
• Xml.yandex.com в рамках
предоставленных лимитов
• API rushanalytics.ru
• Antigate, Rucapcha
• Или не чекать – гонять все подряд
Ловец, шаг первый
• Инфоблок «Рейтинг», «Посмотрите
еще», «Лучшие товары сегодня» или
как-то так
• Смотрим по user-agent (или IP) бота
• Подменяем для бота ссылки в
инфоблоке на страницы не в индексе
• Когда не бот – показываем другие
ссылки
• Число ссылок: от 1 до 100 (3-5 обычно)
Это не клоака!
• Просто как бы так получается, что бот видит
только страницы не в индексе, а
пользователь – в индексе, но всегда рандом!
Ловец, шаг второй
• Проверяем бота на странице не в
индексе
• Если пришел – снимаем страницу из
стека на показ, переносим в стек на
проверку индекса
• Если не пришел – продолжаем
показывать
TRASHBOX #1
• На некоторые страницы бот не придет
никогда (в обозримом будущем)
• Месяц не пришел после показов –
переносим в трэшбокс и разбираемся
что не так ручками
Проверка индекса
• Текстовые апы могут идти непрерывно,
могут – дискретно. Нам это неудобно.
• Ставим страницу на паузу после визита
бота на две недели
• Проверяем на индекс. Если да – ОК!
Если нет – отправляем на новые
показы в ловца
Цикл проверки
• Запускать страницы в ловца только
после текстовых апов – неавтоматично
• Строим цикл: отправили-проверили
• Если страница за Х циклов не попала в
индекс – это трэшбокс
Чекинг Чекинг Чекинг
АП!
2 недели 2 недели
TRASHBOX #2
• Страницы, которые не заходят в индекс
спустя 3-5 циклов
• Страницы, которые выпадают из
индекса после вгона ловцом
Тут как бы и все. Но!
Идем дальше
• Страница в индексе без трафика –
фуфел
• Надо выявить страницы в индексе но
без трафика!
• Используем проверку на визит с поиска
пользователями
Нет трафика с поиска
• Нет трафика полгода или более
• Есть в индексе
• Это трэшбокс по качеству контента:
либо очень далеко от топа, либо нет
оптимизации даже по НЧ
TRASHBOX #3
• Список страниц без трафика с поиска
• Интерфейс для работы редактору сайта
Обычно это
- Страницы без контента: в 404 или 301
- Сервисные страницы: в disallow
- Неочевидные: работа с контентом
Итого
• TRASHBOX #1 – баговые страницы
• TRASHBOX #2 – низкое качество,
битые
• TRASHBOX #3 – проблемы с контентом
• Полный автомат на выявление трэша
• Индексация около 100% на автомате
Ресурсы
• 2 месяца одного программиста
• Авторский надзор со стороны сеошника
• Дальше все на автомате, только
смотри, что валится в трэшбоксы
Как выглядит, доска
Как выглядит, доска
Как выглядит, инфосайт
Как выглядит, магазин
Как выглядит, агрегатор
Боты, агрегатор, Яндекс
Боты, агрегатор, Google
Боты, доска, Яндекс
Боты, доска, Google
Индексация, агрегатор
Google, агрегатор
нет проблем с индексом
Индексация, доска
Контрольная группа
Посещаемость, агрегатор
Обвал индекса за копипаст
Посещаемость, доска
Не сезонность, проверили
Число точек входа, агрегатор
Число точек входа, доска
Число точек входа, доска
Хотите узнать больше?
Заявки сюда
• 8-800-333-06-80
• s@remarka.info
Общение со мной
• https://www.facebook.com/bablorub
• skype: remarka.reklama

More Related Content

What's hot

Продвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий ШаховПродвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий Шахов
Дмитрий Шахов
 
О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)
О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)
О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)
Aweb
 
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов
 

What's hot (20)

Link-building стратегии для сайтов услуг. Кейс: только ссылки - no content
Link-building стратегии для сайтов услуг. Кейс: только ссылки - no contentLink-building стратегии для сайтов услуг. Кейс: только ссылки - no content
Link-building стратегии для сайтов услуг. Кейс: только ссылки - no content
 
Роман рыбальченко - веб аналитика при посещаемости от 100 000 до 2 млн в сутки
Роман рыбальченко - веб аналитика при посещаемости от 100 000 до 2 млн в суткиРоман рыбальченко - веб аналитика при посещаемости от 100 000 до 2 млн в сутки
Роман рыбальченко - веб аналитика при посещаемости от 100 000 до 2 млн в сутки
 
Управление сетками сайтов
Управление сетками сайтовУправление сетками сайтов
Управление сетками сайтов
 
Использование дроп-доменов для построения сетки сайтов
Использование дроп-доменов для построения сетки сайтовИспользование дроп-доменов для построения сетки сайтов
Использование дроп-доменов для построения сетки сайтов
 
Строим сетки сайтов (PBN) системно
Строим сетки сайтов (PBN) системноСтроим сетки сайтов (PBN) системно
Строим сетки сайтов (PBN) системно
 
Презентация Константин Луценко (SeoProfy) для NaZapad 3
Презентация Константин Луценко (SeoProfy) для NaZapad 3Презентация Константин Луценко (SeoProfy) для NaZapad 3
Презентация Константин Луценко (SeoProfy) для NaZapad 3
 
франшизы в россии
франшизы в россиифраншизы в россии
франшизы в россии
 
Быстровыдача: что это и как с ней работать
Быстровыдача: что это и как с ней работатьБыстровыдача: что это и как с ней работать
Быстровыдача: что это и как с ней работать
 
Продвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий ШаховПродвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий Шахов
 
Lviv iCamp 2013. Олексій Щеглюк “Просування в нікуди: причини невдач та кейси...
Lviv iCamp 2013. Олексій Щеглюк “Просування в нікуди: причини невдач та кейси...Lviv iCamp 2013. Олексій Щеглюк “Просування в нікуди: причини невдач та кейси...
Lviv iCamp 2013. Олексій Щеглюк “Просування в нікуди: причини невдач та кейси...
 
О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)
О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)
О. Бойко: Пошаговое руководство по увеличению целевого трафика (iCamp)
 
fg
fgfg
fg
 
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваРутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
 
Создание сетки сайтов нового поколения – нюансы, про которые никто не говорит
Создание сетки сайтов нового поколения – нюансы, про которые никто не говоритСоздание сетки сайтов нового поколения – нюансы, про которые никто не говорит
Создание сетки сайтов нового поколения – нюансы, про которые никто не говорит
 
Анализ сеток сайтов на основе графов перелинковки
Анализ сеток сайтов на основе графов перелинковкиАнализ сеток сайтов на основе графов перелинковки
Анализ сеток сайтов на основе графов перелинковки
 
Качественный ссылочный профиль на примере сайта linevichgroup.com.ua. Вебинар...
Качественный ссылочный профиль на примере сайта linevichgroup.com.ua. Вебинар...Качественный ссылочный профиль на примере сайта linevichgroup.com.ua. Вебинар...
Качественный ссылочный профиль на примере сайта linevichgroup.com.ua. Вебинар...
 
Александр Корнилов. Про SEO в бурже
Александр Корнилов. Про SEO в буржеАлександр Корнилов. Про SEO в бурже
Александр Корнилов. Про SEO в бурже
 
Продвижение магазинов через сбор семантики
Продвижение магазинов через сбор семантикиПродвижение магазинов через сбор семантики
Продвижение магазинов через сбор семантики
 
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
 
Суровые уроки продвижения
Суровые уроки продвиженияСуровые уроки продвижения
Суровые уроки продвижения
 

Viewers also liked

13 грехов разработчиков чат-ботов: взгляд со стороны Product Design
13 грехов разработчиков чат-ботов: взгляд со стороны Product Design13 грехов разработчиков чат-ботов: взгляд со стороны Product Design
13 грехов разработчиков чат-ботов: взгляд со стороны Product Design
Voximplant
 

Viewers also liked (15)

13 грехов разработчиков чат-ботов: взгляд со стороны Product Design
13 грехов разработчиков чат-ботов: взгляд со стороны Product Design13 грехов разработчиков чат-ботов: взгляд со стороны Product Design
13 грехов разработчиков чат-ботов: взгляд со стороны Product Design
 
Jobs Market
Jobs MarketJobs Market
Jobs Market
 
2
22
2
 
pcv (1)
pcv (1)pcv (1)
pcv (1)
 
Untitled Presentation
Untitled PresentationUntitled Presentation
Untitled Presentation
 
Kwl chart block 2
Kwl chart block 2Kwl chart block 2
Kwl chart block 2
 
Do mingo
Do mingoDo mingo
Do mingo
 
Risk manajemen-intro
Risk manajemen-introRisk manajemen-intro
Risk manajemen-intro
 
Noc help desk services
Noc help desk servicesNoc help desk services
Noc help desk services
 
Soporte a la gestión de datos de investigación: aproximación cooperativa de l...
Soporte a la gestión de datos de investigación: aproximación cooperativa de l...Soporte a la gestión de datos de investigación: aproximación cooperativa de l...
Soporte a la gestión de datos de investigación: aproximación cooperativa de l...
 
Aditya communications
Aditya communicationsAditya communications
Aditya communications
 
Next Level Why & How To Outsource Hr
Next Level   Why & How To Outsource HrNext Level   Why & How To Outsource Hr
Next Level Why & How To Outsource Hr
 
EPC Corporate Propositions for Public Policies for a Low-Carbon Economy in Br...
EPC Corporate Propositions for Public Policies for a Low-Carbon Economy in Br...EPC Corporate Propositions for Public Policies for a Low-Carbon Economy in Br...
EPC Corporate Propositions for Public Policies for a Low-Carbon Economy in Br...
 
WIPRO
WIPROWIPRO
WIPRO
 
Facebook Local tips & tricks - Web Marketing Festival '15
Facebook Local tips & tricks - Web Marketing Festival '15Facebook Local tips & tricks - Web Marketing Festival '15
Facebook Local tips & tricks - Web Marketing Festival '15
 

Similar to ТЗ на Ловца Ботов

презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабан
zaharec
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабан
zaharec
 
Базовый курс SEO
Базовый курс SEOБазовый курс SEO
Базовый курс SEO
Cybermarketing, Moscow
 
Ruslaz rzaev
Ruslaz rzaevRuslaz rzaev
Ruslaz rzaev
master_pr
 
Алексей Рылко, iProspect — «SEO-инсайды, которые вы можете достать из логов ...
Алексей Рылко, iProspect  — «SEO-инсайды, которые вы можете достать из логов ...Алексей Рылко, iProspect  — «SEO-инсайды, которые вы можете достать из логов ...
Алексей Рылко, iProspect — «SEO-инсайды, которые вы можете достать из логов ...
shevchuk_conf
 

Similar to ТЗ на Ловца Ботов (20)

Юрий Софин, Sape: "Контекст и SEO. Повышаем эффективность совместной работы"
Юрий Софин, Sape: "Контекст и SEO. Повышаем эффективность совместной работы"Юрий Софин, Sape: "Контекст и SEO. Повышаем эффективность совместной работы"
Юрий Софин, Sape: "Контекст и SEO. Повышаем эффективность совместной работы"
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабан
 
10errors seo
10errors seo10errors seo
10errors seo
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабан
 
Базовый курс SEO
Базовый курс SEOБазовый курс SEO
Базовый курс SEO
 
Seo barcamp
Seo barcampSeo barcamp
Seo barcamp
 
О работе входящих ссылок после смены алгоритма Яндекса
О работе входящих ссылок после смены алгоритма ЯндексаО работе входящих ссылок после смены алгоритма Яндекса
О работе входящих ссылок после смены алгоритма Яндекса
 
Голованов Дмитрий - тренды поискового продвижения сайтов 2012
Голованов Дмитрий - тренды поискового продвижения сайтов 2012Голованов Дмитрий - тренды поискового продвижения сайтов 2012
Голованов Дмитрий - тренды поискового продвижения сайтов 2012
 
Продвижение в интернете, ч. 1 (семантическое ядро)
Продвижение в интернете, ч. 1 (семантическое ядро)Продвижение в интернете, ч. 1 (семантическое ядро)
Продвижение в интернете, ч. 1 (семантическое ядро)
 
Robots.txt - что это такое, для чего нужен, как использовать
Robots.txt - что это такое, для чего нужен, как использоватьRobots.txt - что это такое, для чего нужен, как использовать
Robots.txt - что это такое, для чего нужен, как использовать
 
Кирилл Вайханский, movebo.ru: "Поведенческие факторы ранжирования"
Кирилл Вайханский, movebo.ru: "Поведенческие факторы ранжирования"Кирилл Вайханский, movebo.ru: "Поведенческие факторы ранжирования"
Кирилл Вайханский, movebo.ru: "Поведенческие факторы ранжирования"
 
Collaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptx
Collaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptxCollaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptx
Collaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptx
 
Collaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptx
Collaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptxCollaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptx
Collaborator_ Бесплатные ссылки через аутрич. Александра Хилова.pptx
 
Ruslaz rzaev
Ruslaz rzaevRuslaz rzaev
Ruslaz rzaev
 
Базовый курс по SEO
Базовый курс по SEOБазовый курс по SEO
Базовый курс по SEO
 
Маркетинг в поисковых системах - секреты, фишки, подводные камни
Маркетинг в поисковых системах - секреты, фишки, подводные камниМаркетинг в поисковых системах - секреты, фишки, подводные камни
Маркетинг в поисковых системах - секреты, фишки, подводные камни
 
Введение в SEO
Введение в SEOВведение в SEO
Введение в SEO
 
Секреты SEO: Сбалансированные показатели сайтов
Секреты SEO: Сбалансированные показатели сайтовСекреты SEO: Сбалансированные показатели сайтов
Секреты SEO: Сбалансированные показатели сайтов
 
Как понравится яндексу в 2016 году
Как понравится яндексу в 2016 годуКак понравится яндексу в 2016 году
Как понравится яндексу в 2016 году
 
Алексей Рылко, iProspect — «SEO-инсайды, которые вы можете достать из логов ...
Алексей Рылко, iProspect  — «SEO-инсайды, которые вы можете достать из логов ...Алексей Рылко, iProspect  — «SEO-инсайды, которые вы можете достать из логов ...
Алексей Рылко, iProspect — «SEO-инсайды, которые вы можете достать из логов ...
 

ТЗ на Ловца Ботов

  • 1. Ловец ботов: рост индексации и поиск плохих страниц Дмитрий Шахов Директор ГК РЕМАРКА Докладчик на конференциях • AllInTop (Москва, 2012, 2014-2016гг.), • SeoConference (Казань, 2014-2015гг.), • Кибермаркетинг (Москва, 2015г.), • РИФ-Воронеж (2014-2015гг.), • Онлайн: SmartFox, Megaindex. Организатор конференции • BalticDigitalDays (2013-2016гг.) Курсы по поисковому продвижению • 200+ выпускников за три года www.remarka.info www.seohowto.ru www.balticdigitaldays.ru
  • 2. Проблематика • Очень много посадочных страниц • Постоянно мониторить факт индексации ручками муторно и дорого • Непонятно, за что поперли страницу из индекса Актуально для любых многостраничных сайтов!
  • 4. Стек: все посадочные страницы Стек: не в индексе Стек: посещен ботом Стек: проблемы с индексом Ждем текстового апдейта Ловец ботов: показ боту ссылок на страницы не в индексе Ловец ботов: фиксация визита бота на странице не в индексе Какой раз проверяли? <N N Чекинг страниц на индекс Нет Да Имеют траффик с поиска? Нет Да Посадочная нужна? Как давно не имеет? >Х мес. <Х мес. Стек: проблемы с поиском ДаНет Ловец ботов, ver2.0 Схема отрабатывается для каждой поисковой системы Х = 6 N = 3 Позиции по ключам нормальные? Да Нет Контент-план: переписать, дооптимизировать Trashbox: удаляем, disallow Trash: Бота нет!
  • 5. Формируем стек страниц • На самом деле непринципиально как это делать • Можно карту сайта • Можно просто пул страница/анкор • С этим справится любой программер
  • 6. Проверка на индекс • Срежем часть на проверке заходов с поиска пользователей – если траффик есть, то страница в индексе и в топе • Оставшиеся чекаем – url:site.com/page.html в Яндексе – info:site.com/page.html в Google
  • 7. Чекинг: решения • Пока не забанят, свои IP • Xml.yandex.com в рамках предоставленных лимитов • API rushanalytics.ru • Antigate, Rucapcha • Или не чекать – гонять все подряд
  • 8. Ловец, шаг первый • Инфоблок «Рейтинг», «Посмотрите еще», «Лучшие товары сегодня» или как-то так • Смотрим по user-agent (или IP) бота • Подменяем для бота ссылки в инфоблоке на страницы не в индексе • Когда не бот – показываем другие ссылки • Число ссылок: от 1 до 100 (3-5 обычно)
  • 9. Это не клоака! • Просто как бы так получается, что бот видит только страницы не в индексе, а пользователь – в индексе, но всегда рандом!
  • 10. Ловец, шаг второй • Проверяем бота на странице не в индексе • Если пришел – снимаем страницу из стека на показ, переносим в стек на проверку индекса • Если не пришел – продолжаем показывать
  • 11. TRASHBOX #1 • На некоторые страницы бот не придет никогда (в обозримом будущем) • Месяц не пришел после показов – переносим в трэшбокс и разбираемся что не так ручками
  • 12. Проверка индекса • Текстовые апы могут идти непрерывно, могут – дискретно. Нам это неудобно. • Ставим страницу на паузу после визита бота на две недели • Проверяем на индекс. Если да – ОК! Если нет – отправляем на новые показы в ловца
  • 13. Цикл проверки • Запускать страницы в ловца только после текстовых апов – неавтоматично • Строим цикл: отправили-проверили • Если страница за Х циклов не попала в индекс – это трэшбокс Чекинг Чекинг Чекинг АП! 2 недели 2 недели
  • 14. TRASHBOX #2 • Страницы, которые не заходят в индекс спустя 3-5 циклов • Страницы, которые выпадают из индекса после вгона ловцом
  • 15. Тут как бы и все. Но!
  • 16. Идем дальше • Страница в индексе без трафика – фуфел • Надо выявить страницы в индексе но без трафика! • Используем проверку на визит с поиска пользователями
  • 17. Нет трафика с поиска • Нет трафика полгода или более • Есть в индексе • Это трэшбокс по качеству контента: либо очень далеко от топа, либо нет оптимизации даже по НЧ
  • 18. TRASHBOX #3 • Список страниц без трафика с поиска • Интерфейс для работы редактору сайта Обычно это - Страницы без контента: в 404 или 301 - Сервисные страницы: в disallow - Неочевидные: работа с контентом
  • 19. Итого • TRASHBOX #1 – баговые страницы • TRASHBOX #2 – низкое качество, битые • TRASHBOX #3 – проблемы с контентом • Полный автомат на выявление трэша • Индексация около 100% на автомате
  • 20. Ресурсы • 2 месяца одного программиста • Авторский надзор со стороны сеошника • Дальше все на автомате, только смотри, что валится в трэшбоксы
  • 36. Число точек входа, агрегатор
  • 39. Хотите узнать больше? Заявки сюда • 8-800-333-06-80 • s@remarka.info Общение со мной • https://www.facebook.com/bablorub • skype: remarka.reklama