Кластеризация по ТОПам – от теории к практике
Олег ШестаковData Driven SEO Москва 2016
Рекламно-консалтинговое агентство RushRush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
- В SEO с 2008 года
- Участвовал более чем в 100 SEO-проектах
- Автор стратегий для 20 крупных интернет-магазинов, 3 из
ТОП20 в России
- Специализация: E-commerce, проекты с большой
семантикой, автоматизация в SEO
- Основатель и CTO в Rush Analytics & Founder Rush Agency
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Теория и практика кластеризации по ТОПам
2. Источники сбора семантики для качественной семантики
3. Маркеры: как готовить, «раскрытие» маркеров, кластеризация маркеров
4. Кластеризация облака запросов для построения структуры
5. Финализация структуры сайта
О чем сегодня поговорим?
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Кластеризация по ТОПам – как это работает?
Rush Analytics – сервис поисковой аналитики
Таким образом строим матрицы по всему ядру.
Точность кластеризации - количество общих URL (!) в ТОПе по двум запросам,
необходимое для создания кластера.
Рекламно-консалтинговое агентство Rush
Кластеризация по ТОПам – как это работает?
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Ускорение группировки ключевых слов (в 10-30 раз)
2. Выделение мусорных слов в «сложной семантике»
3. Разбивка ядра на коммерцию и некоммерцию
4. Увеличение релевантности и % вывода ключевых
слов в сложных тематиках
Какие задачи решает кластеризация по
ТОПам?
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Лингвистическая группировка не охватывает
синонимы и переформулировки  доп. время на
обработку ядра
2. Временные затраты на разборы ядра более 10к
растут нелинейно
3. Ошибки семантиков могут «похоронить» до 15%
запросов
Ускорение группировки ключевых слов
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Фактически используем готовые данные Яндекса
о коммерческости 
2. При удовлетворительном качестве выдачи и
правильном подборе точности кластеризации –
кластера отлично разделяются под листинги и
статьи
Разбивка ядра на коммерцию/некоммерцию
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Во многих конкурентных тематиках даже запросы
«цена» и «стоимость» могут не продвигаться на
одну страницу 
2. Hard – кластеризация отлично показывает как
устроено ранжирование в тематике, указывает на
нужные типы страниц.
Работа над ВЧ запросами
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Soft-кластеризация 2. Hard-кластеризация
Какие виды кластеризации по ТОПам
существуют?
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Назначение: трафиковые проекты
Работаем с большим пулом СЧ – НЧ нет возможности
следить за 100% совместимостью запросов
Soft-кластеризация
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Назначение: конкурентная позиционка
Крайне важна совместимость запросов
Hard-кластеризация
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Алгоритм построения семантики для трафиковых проектов
Rush Analytics – сервис поисковой аналитики
Создание списка маркерных запросов – «скелет спроса»
(Ручные гипотезы + Wordstat)
+
Сбор расширений базового спроса – «облака запросов»
(Поисковые подсказки)
Создание финальной структуры сайта
(Кластеризация)
Рекламно-консалтинговое агентство Rush
Какие источники необходимы и достаточны для
построения качественной трафиковой семантики?
Источники сбора семантики
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Что важно:
1. Используем в большинстве своем для маркеров
2. Правильно парсим маркеры
3. Верифицируем словоформы по частотке
(вернемся к этому в разделе про маркеры)
Yandex Worstat (старый добрый  )
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Почему?
1. Только реальные запросы пользователей
2. Только правильные словоформы (при
правильном парсинге)
3. Всегда свежие и трендовые запросы
Поисковые подсказки
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
А что еще можно использовать?
1. Метрика – ДА, можно – но нужно чистить мусор
2. Базы данных типа Букварикса и MOAB –
предлагают откровенный треш с 30-87%
поддельных (генерированных запросов)
Все? – Да!
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Наше исследование качества баз данных
ключевых слов
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Наше исследование качества баз данных
ключевых слов
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Наше исследование качества баз данных
ключевых слов
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Наше исследование качества баз данных
ключевых слов
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Wordstat и подсказки дают 70-80% того, что нужно
для качественной семантики.
Итого:
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Маркерные запросы - это запросы, которые четко
отвечают продвигаемой странице. Такие запросы
обычно имеют значимую частотность по Wordstat и
являются средне-частотными (СЧ), или "жирными"
низкочастотниками (НЧ), и могут породить "хвост"
запросов, например при добавлении слов "купить",
"цена", "отзывы".
Маркерые запросы
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Одежда - плохой маркерный запрос т.к. слишком
широкий
Купить коричневые ботинки – хороший маркерный
запрос – четко отвечает продвигаемой странице
Купить коричневые броги недорого в спб -
слишком узкий запрос и не может породить
дочерние
Примеры маркерных запросов
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Чтобы собрать максимум подсказок - нам нужно
«раскрыть» маркеры:
1. Просклонять
2. Переставить слова
3. Добавить транзакционные добавки
«Раскрытие» маркеров (подготовка к парсингу)
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Базовое слово – бетон М300. Раскрывая маркер
получаем:
1. Бетон М300, Бетон М300
2. Купить бетон М300, купить бетон м 300, бетон
М300 купить…..
3. Бетон М300 цена, цена бетон М300
Для чего?
Пример раскрытия маркера
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Подсказки по запросу «купить бетон М300»
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Подсказки по запросу «бетон М300 купить»
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Если учесть только главную словоформу – мы
потеряем до 50% семантики. Факт 
Подсказочная выдача совершенно разная
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Запрос: стиральные
(машины|машинки)
(samsung|самсунг) -ремонт
-ошибки -отзыв -коды -
видео -запчасти –
неисправности
Лайфхак по сбору маркеров №1
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Запрос: получаем самый
частотный порядок слов,
«закавычивая запрос» –
смотрим на первое слово в
левой колонке
Лайфхак по сбору маркеров №2
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Подсказки гео-зависимы – совершенно разная
выдача в МСК и СПБ
2. Подсказки КРАЙНЕ чувствительны к лингвистике
(достаточно смены окончания или пробела для
получения на 80% другого списка)
3. В Яндексе до 30% фантомных подсказок при
«тупом переборе»
Нюансы парсинга поисковых подсказок
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
1. Подсказки гео-зависимы – совершенно разная
выдача в МСК и СПБ
2. Подсказки КРАЙНЕ чувствительны к лингвистике
(достаточно смены окончания или пробела для
получения на 80% другого списка)
3. В Яндексе до 30% фантомных подсказок при
«тупом переборе»
Нюансы парсинга поисковых подсказок
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Что есть оптимальная семантика:
По аналогии с информационным поиском:
Полнота vs/* точность
1. Если спарсим мало – потеряем трафик
2. Если спарсим слишком много – «закопаемся» в
разборе облака нерелевантных НЧ ключей
Как парсить подсказки для получения оптимальной
семантики
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Есть несколько вариантов перебора лингвистики:
1. Базовое слово, базовое слово + пробел
2. Пробел + перебор алфавита [а-я], [a-z], [0-9]
3. Комбинации методов
Как парсить подсказки для получения
оптимальной семантики
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Хардкорный парсинг подсказок для
получения всех ключей
Rush Analytics – сервис поисковой аналитики
Усложним перебор лингвистики:
1. ключевое слово +[а-я]_ +[a-z]_ +[0-9]_
2. ключевое слово +[аа-ая, ба-бя] +[aa-az,
ba-bz] +[00-09, 10-19]
Рекламно-консалтинговое агентство Rush
Какие фишки еще есть при парсинге подсказок?
Rush Analytics – сервис поисковой аналитики
1. Важно фильтровать подсказки на лету по стоп
словам
2. Если зацепить «вк», «вконтакте»,
«одноклассники» - разобрать это будет
невозможно
3. Для оптимизации нагрузки на парсер – нужно
фильтровать дубликаты «на лету»
Рекламно-консалтинговое агентство Rush
«Боевая» методология сбора подсказок
Rush Analytics – сервис поисковой аналитики
1. Берем базовые или «раскрытые» маркеры
2. Собираем подсказки Яндекс по словам, словам
+ пробел
3. Смотрим на результат и формируем список стоп-
слов
4. «На лету» вырезаем стоп-слова, «убивая»
паразитые ветки подсказок
Рекламно-консалтинговое агентство Rush
«Боевая» методология сбора подсказок.
Часть 2
Rush Analytics – сервис поисковой аналитики
1. Запускаем парсинг подсказок с переборами
алфавита [а-я], [a-z], [0-9] в зависимости от
тематики
2. Обязательно метчим стоп-слова и дубликаты
3. Получаем конечный список целевых подсказок
4. NB: Без предварительного составления списка
стоп-слов не получится чистой семантики
Рекламно-консалтинговое агентство Rush
Реализация списков стоп-слов в Rush Analytics
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Пост-обработка подсказок и треш-холды
Rush Analytics – сервис поисковой аналитики
1. Все зависит от тематики. В тематиках «кредиты»
и «казино» около 50% спроса – это 6 и боле
словные запросы – нужно парсить глубже
2. В тематиках «окна» и «мебель» можно спарсить
базовые переборы на 2 уроверь и получить все
расширения
3. Зная частотность в тематике можно резать по
количеству слов.
Рекламно-консалтинговое агентство Rush
1. Кластеризация по частотности Wordstat
2. Кластеризация с фиксированными маркерами
3. Комбинированный метод 1 + 2
Какие типы кластеризации мы используем?
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
На самом деле метод не использует Wordstat для связей
внутри кластеров 
1. На вход подается ключевое слово | Частотность
2. Ключевые слова сортируются по убыванию
частотности
3. Первое слово признается маркером,
привязываем к нему все что возможно.
Итерация повторяется
Кластеризация по Wordstat
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Когда используется этот метод?
1. Когда структура сайта еще не ясна/проектируется
2. Статейные проекты
3. Для оценки интентов в тематике
Кластеризация по Wordstat
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Кластеризация по Wordstat - Результат
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Используем когда уже есть скелет структуры. Точно знаем
что хотим куда вести
1. На вход подается ключевое слово | 1/0 –
маркер/не маркер
2. Берется первый маркер, к нему привязается все
что возможно из облака. Итерация повторяется
Кластеризация с фиксированными
маркерами
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Кластеризация с фиксированными
маркерами – входной файл
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Как решить проблему, что «купить» и «цена»
в Ecommerce кластеризуются на разные
страницы из-за плохой выдачи?
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Кластеризация маркеров
Rush Analytics – сервис поисковой аналитики
1. Сначала кластеризуем маркеры по WS между
собой
2. Получаем группы маркеров, которые могут
продвигаться на 1 страницу
3. Привязанное к кластеризованным маркерам
облако ведем на 1 страницу
Рекламно-консалтинговое агентство Rush
Кластеризация маркеров
Rush Analytics – сервис поисковой аналитики
Рекламно-консалтинговое агентство Rush
Комбинированная кластеризация
Rush Analytics – сервис поисковой аналитики
1. Сначала запросы из облака привязываются к
маркерам
2. Оставшиеся запросы кластеризуются между
собой
На выходе получаем:
- Семантику для структуры, которую уже знаем
- Гипотеза для расширения структуры
Рекламно-консалтинговое агентство Rush
Построение структуры на основе кластеризации
Rush Analytics – сервис поисковой аналитики
Подробнее на: http://www.rush-analytics.ru/faq/kak-sozdat-strukturu-sayta-na-osnove-semanticheskogo-yadra
Рекламно-консалтинговое агентство Rush
Какие фишки есть в Rush Analytics?
Rush Analytics – сервис поисковой аналитики
1. 3 метода кластеризации, описанные выше (Soft)
2. Автоматическое определение релевантных URL для
кластера + определение кластеров в ТОПе
3. Подсветки выдачи для каждого кластера автоматом
4. Показываем самый мощный URL конкурента по
кластеру – идем и забираем оптимизацию 
5. Скорость – 100к ключевых слов 1-2 часа.
Сами используем в работе каждый день
Рекламно-консалтинговое агентство Rush
oleg@rush-agency.ru
www.facebook.com/shestakov.oleg
www.rush-analytics.ru
Ваши вопросы
Data Driven SEO Москва 2016

Data Driven SEO - Кластеризация по топам - от теории к практике

  • 1.
    Кластеризация по ТОПам– от теории к практике Олег ШестаковData Driven SEO Москва 2016 Рекламно-консалтинговое агентство RushRush Analytics – сервис поисковой аналитики
  • 2.
    Рекламно-консалтинговое агентство Rush -В SEO с 2008 года - Участвовал более чем в 100 SEO-проектах - Автор стратегий для 20 крупных интернет-магазинов, 3 из ТОП20 в России - Специализация: E-commerce, проекты с большой семантикой, автоматизация в SEO - Основатель и CTO в Rush Analytics & Founder Rush Agency Rush Analytics – сервис поисковой аналитики
  • 3.
    Рекламно-консалтинговое агентство Rush 1.Теория и практика кластеризации по ТОПам 2. Источники сбора семантики для качественной семантики 3. Маркеры: как готовить, «раскрытие» маркеров, кластеризация маркеров 4. Кластеризация облака запросов для построения структуры 5. Финализация структуры сайта О чем сегодня поговорим? Rush Analytics – сервис поисковой аналитики
  • 4.
    Рекламно-консалтинговое агентство Rush Кластеризацияпо ТОПам – как это работает? Rush Analytics – сервис поисковой аналитики Таким образом строим матрицы по всему ядру. Точность кластеризации - количество общих URL (!) в ТОПе по двум запросам, необходимое для создания кластера.
  • 5.
    Рекламно-консалтинговое агентство Rush Кластеризацияпо ТОПам – как это работает? Rush Analytics – сервис поисковой аналитики
  • 6.
    Рекламно-консалтинговое агентство Rush 1.Ускорение группировки ключевых слов (в 10-30 раз) 2. Выделение мусорных слов в «сложной семантике» 3. Разбивка ядра на коммерцию и некоммерцию 4. Увеличение релевантности и % вывода ключевых слов в сложных тематиках Какие задачи решает кластеризация по ТОПам? Rush Analytics – сервис поисковой аналитики
  • 7.
    Рекламно-консалтинговое агентство Rush 1.Лингвистическая группировка не охватывает синонимы и переформулировки  доп. время на обработку ядра 2. Временные затраты на разборы ядра более 10к растут нелинейно 3. Ошибки семантиков могут «похоронить» до 15% запросов Ускорение группировки ключевых слов Rush Analytics – сервис поисковой аналитики
  • 8.
    Рекламно-консалтинговое агентство Rush 1.Фактически используем готовые данные Яндекса о коммерческости  2. При удовлетворительном качестве выдачи и правильном подборе точности кластеризации – кластера отлично разделяются под листинги и статьи Разбивка ядра на коммерцию/некоммерцию Rush Analytics – сервис поисковой аналитики
  • 9.
    Рекламно-консалтинговое агентство Rush 1.Во многих конкурентных тематиках даже запросы «цена» и «стоимость» могут не продвигаться на одну страницу  2. Hard – кластеризация отлично показывает как устроено ранжирование в тематике, указывает на нужные типы страниц. Работа над ВЧ запросами Rush Analytics – сервис поисковой аналитики
  • 10.
    Рекламно-консалтинговое агентство Rush 1.Soft-кластеризация 2. Hard-кластеризация Какие виды кластеризации по ТОПам существуют? Rush Analytics – сервис поисковой аналитики
  • 11.
    Рекламно-консалтинговое агентство Rush Назначение:трафиковые проекты Работаем с большим пулом СЧ – НЧ нет возможности следить за 100% совместимостью запросов Soft-кластеризация Rush Analytics – сервис поисковой аналитики
  • 12.
    Рекламно-консалтинговое агентство Rush Назначение:конкурентная позиционка Крайне важна совместимость запросов Hard-кластеризация Rush Analytics – сервис поисковой аналитики
  • 13.
    Рекламно-консалтинговое агентство Rush Алгоритмпостроения семантики для трафиковых проектов Rush Analytics – сервис поисковой аналитики Создание списка маркерных запросов – «скелет спроса» (Ручные гипотезы + Wordstat) + Сбор расширений базового спроса – «облака запросов» (Поисковые подсказки) Создание финальной структуры сайта (Кластеризация)
  • 14.
    Рекламно-консалтинговое агентство Rush Какиеисточники необходимы и достаточны для построения качественной трафиковой семантики? Источники сбора семантики Rush Analytics – сервис поисковой аналитики
  • 15.
    Рекламно-консалтинговое агентство Rush Чтоважно: 1. Используем в большинстве своем для маркеров 2. Правильно парсим маркеры 3. Верифицируем словоформы по частотке (вернемся к этому в разделе про маркеры) Yandex Worstat (старый добрый  ) Rush Analytics – сервис поисковой аналитики
  • 16.
    Рекламно-консалтинговое агентство Rush Почему? 1.Только реальные запросы пользователей 2. Только правильные словоформы (при правильном парсинге) 3. Всегда свежие и трендовые запросы Поисковые подсказки Rush Analytics – сервис поисковой аналитики
  • 17.
    Рекламно-консалтинговое агентство Rush Ачто еще можно использовать? 1. Метрика – ДА, можно – но нужно чистить мусор 2. Базы данных типа Букварикса и MOAB – предлагают откровенный треш с 30-87% поддельных (генерированных запросов) Все? – Да! Rush Analytics – сервис поисковой аналитики
  • 18.
    Рекламно-консалтинговое агентство Rush Нашеисследование качества баз данных ключевых слов Rush Analytics – сервис поисковой аналитики
  • 19.
    Рекламно-консалтинговое агентство Rush Нашеисследование качества баз данных ключевых слов Rush Analytics – сервис поисковой аналитики
  • 20.
    Рекламно-консалтинговое агентство Rush Нашеисследование качества баз данных ключевых слов Rush Analytics – сервис поисковой аналитики
  • 21.
    Рекламно-консалтинговое агентство Rush Нашеисследование качества баз данных ключевых слов Rush Analytics – сервис поисковой аналитики
  • 22.
    Рекламно-консалтинговое агентство Rush Wordstatи подсказки дают 70-80% того, что нужно для качественной семантики. Итого: Rush Analytics – сервис поисковой аналитики
  • 23.
    Рекламно-консалтинговое агентство Rush Маркерныезапросы - это запросы, которые четко отвечают продвигаемой странице. Такие запросы обычно имеют значимую частотность по Wordstat и являются средне-частотными (СЧ), или "жирными" низкочастотниками (НЧ), и могут породить "хвост" запросов, например при добавлении слов "купить", "цена", "отзывы". Маркерые запросы Rush Analytics – сервис поисковой аналитики
  • 24.
    Рекламно-консалтинговое агентство Rush Одежда- плохой маркерный запрос т.к. слишком широкий Купить коричневые ботинки – хороший маркерный запрос – четко отвечает продвигаемой странице Купить коричневые броги недорого в спб - слишком узкий запрос и не может породить дочерние Примеры маркерных запросов Rush Analytics – сервис поисковой аналитики
  • 25.
    Рекламно-консалтинговое агентство Rush Чтобысобрать максимум подсказок - нам нужно «раскрыть» маркеры: 1. Просклонять 2. Переставить слова 3. Добавить транзакционные добавки «Раскрытие» маркеров (подготовка к парсингу) Rush Analytics – сервис поисковой аналитики
  • 26.
    Рекламно-консалтинговое агентство Rush Базовоеслово – бетон М300. Раскрывая маркер получаем: 1. Бетон М300, Бетон М300 2. Купить бетон М300, купить бетон м 300, бетон М300 купить….. 3. Бетон М300 цена, цена бетон М300 Для чего? Пример раскрытия маркера Rush Analytics – сервис поисковой аналитики
  • 27.
    Рекламно-консалтинговое агентство Rush Подсказкипо запросу «купить бетон М300» Rush Analytics – сервис поисковой аналитики
  • 28.
    Рекламно-консалтинговое агентство Rush Подсказкипо запросу «бетон М300 купить» Rush Analytics – сервис поисковой аналитики
  • 29.
    Рекламно-консалтинговое агентство Rush Еслиучесть только главную словоформу – мы потеряем до 50% семантики. Факт  Подсказочная выдача совершенно разная Rush Analytics – сервис поисковой аналитики
  • 30.
    Рекламно-консалтинговое агентство Rush Запрос:стиральные (машины|машинки) (samsung|самсунг) -ремонт -ошибки -отзыв -коды - видео -запчасти – неисправности Лайфхак по сбору маркеров №1 Rush Analytics – сервис поисковой аналитики
  • 31.
    Рекламно-консалтинговое агентство Rush Запрос:получаем самый частотный порядок слов, «закавычивая запрос» – смотрим на первое слово в левой колонке Лайфхак по сбору маркеров №2 Rush Analytics – сервис поисковой аналитики
  • 32.
    Рекламно-консалтинговое агентство Rush 1.Подсказки гео-зависимы – совершенно разная выдача в МСК и СПБ 2. Подсказки КРАЙНЕ чувствительны к лингвистике (достаточно смены окончания или пробела для получения на 80% другого списка) 3. В Яндексе до 30% фантомных подсказок при «тупом переборе» Нюансы парсинга поисковых подсказок Rush Analytics – сервис поисковой аналитики
  • 33.
    Рекламно-консалтинговое агентство Rush 1.Подсказки гео-зависимы – совершенно разная выдача в МСК и СПБ 2. Подсказки КРАЙНЕ чувствительны к лингвистике (достаточно смены окончания или пробела для получения на 80% другого списка) 3. В Яндексе до 30% фантомных подсказок при «тупом переборе» Нюансы парсинга поисковых подсказок Rush Analytics – сервис поисковой аналитики
  • 34.
    Рекламно-консалтинговое агентство Rush Чтоесть оптимальная семантика: По аналогии с информационным поиском: Полнота vs/* точность 1. Если спарсим мало – потеряем трафик 2. Если спарсим слишком много – «закопаемся» в разборе облака нерелевантных НЧ ключей Как парсить подсказки для получения оптимальной семантики Rush Analytics – сервис поисковой аналитики
  • 35.
    Рекламно-консалтинговое агентство Rush Естьнесколько вариантов перебора лингвистики: 1. Базовое слово, базовое слово + пробел 2. Пробел + перебор алфавита [а-я], [a-z], [0-9] 3. Комбинации методов Как парсить подсказки для получения оптимальной семантики Rush Analytics – сервис поисковой аналитики
  • 36.
    Рекламно-консалтинговое агентство Rush Хардкорныйпарсинг подсказок для получения всех ключей Rush Analytics – сервис поисковой аналитики Усложним перебор лингвистики: 1. ключевое слово +[а-я]_ +[a-z]_ +[0-9]_ 2. ключевое слово +[аа-ая, ба-бя] +[aa-az, ba-bz] +[00-09, 10-19]
  • 37.
    Рекламно-консалтинговое агентство Rush Какиефишки еще есть при парсинге подсказок? Rush Analytics – сервис поисковой аналитики 1. Важно фильтровать подсказки на лету по стоп словам 2. Если зацепить «вк», «вконтакте», «одноклассники» - разобрать это будет невозможно 3. Для оптимизации нагрузки на парсер – нужно фильтровать дубликаты «на лету»
  • 38.
    Рекламно-консалтинговое агентство Rush «Боевая»методология сбора подсказок Rush Analytics – сервис поисковой аналитики 1. Берем базовые или «раскрытые» маркеры 2. Собираем подсказки Яндекс по словам, словам + пробел 3. Смотрим на результат и формируем список стоп- слов 4. «На лету» вырезаем стоп-слова, «убивая» паразитые ветки подсказок
  • 39.
    Рекламно-консалтинговое агентство Rush «Боевая»методология сбора подсказок. Часть 2 Rush Analytics – сервис поисковой аналитики 1. Запускаем парсинг подсказок с переборами алфавита [а-я], [a-z], [0-9] в зависимости от тематики 2. Обязательно метчим стоп-слова и дубликаты 3. Получаем конечный список целевых подсказок 4. NB: Без предварительного составления списка стоп-слов не получится чистой семантики
  • 40.
    Рекламно-консалтинговое агентство Rush Реализациясписков стоп-слов в Rush Analytics Rush Analytics – сервис поисковой аналитики
  • 41.
    Рекламно-консалтинговое агентство Rush Пост-обработкаподсказок и треш-холды Rush Analytics – сервис поисковой аналитики 1. Все зависит от тематики. В тематиках «кредиты» и «казино» около 50% спроса – это 6 и боле словные запросы – нужно парсить глубже 2. В тематиках «окна» и «мебель» можно спарсить базовые переборы на 2 уроверь и получить все расширения 3. Зная частотность в тематике можно резать по количеству слов.
  • 42.
    Рекламно-консалтинговое агентство Rush 1.Кластеризация по частотности Wordstat 2. Кластеризация с фиксированными маркерами 3. Комбинированный метод 1 + 2 Какие типы кластеризации мы используем? Rush Analytics – сервис поисковой аналитики
  • 43.
    Рекламно-консалтинговое агентство Rush Насамом деле метод не использует Wordstat для связей внутри кластеров  1. На вход подается ключевое слово | Частотность 2. Ключевые слова сортируются по убыванию частотности 3. Первое слово признается маркером, привязываем к нему все что возможно. Итерация повторяется Кластеризация по Wordstat Rush Analytics – сервис поисковой аналитики
  • 44.
    Рекламно-консалтинговое агентство Rush Когдаиспользуется этот метод? 1. Когда структура сайта еще не ясна/проектируется 2. Статейные проекты 3. Для оценки интентов в тематике Кластеризация по Wordstat Rush Analytics – сервис поисковой аналитики
  • 45.
    Рекламно-консалтинговое агентство Rush Кластеризацияпо Wordstat - Результат Rush Analytics – сервис поисковой аналитики
  • 46.
    Рекламно-консалтинговое агентство Rush Используемкогда уже есть скелет структуры. Точно знаем что хотим куда вести 1. На вход подается ключевое слово | 1/0 – маркер/не маркер 2. Берется первый маркер, к нему привязается все что возможно из облака. Итерация повторяется Кластеризация с фиксированными маркерами Rush Analytics – сервис поисковой аналитики
  • 47.
    Рекламно-консалтинговое агентство Rush Кластеризацияс фиксированными маркерами – входной файл Rush Analytics – сервис поисковой аналитики
  • 48.
    Рекламно-консалтинговое агентство Rush Какрешить проблему, что «купить» и «цена» в Ecommerce кластеризуются на разные страницы из-за плохой выдачи? Rush Analytics – сервис поисковой аналитики
  • 49.
    Рекламно-консалтинговое агентство Rush Кластеризациямаркеров Rush Analytics – сервис поисковой аналитики 1. Сначала кластеризуем маркеры по WS между собой 2. Получаем группы маркеров, которые могут продвигаться на 1 страницу 3. Привязанное к кластеризованным маркерам облако ведем на 1 страницу
  • 50.
    Рекламно-консалтинговое агентство Rush Кластеризациямаркеров Rush Analytics – сервис поисковой аналитики
  • 51.
    Рекламно-консалтинговое агентство Rush Комбинированнаякластеризация Rush Analytics – сервис поисковой аналитики 1. Сначала запросы из облака привязываются к маркерам 2. Оставшиеся запросы кластеризуются между собой На выходе получаем: - Семантику для структуры, которую уже знаем - Гипотеза для расширения структуры
  • 52.
    Рекламно-консалтинговое агентство Rush Построениеструктуры на основе кластеризации Rush Analytics – сервис поисковой аналитики Подробнее на: http://www.rush-analytics.ru/faq/kak-sozdat-strukturu-sayta-na-osnove-semanticheskogo-yadra
  • 53.
    Рекламно-консалтинговое агентство Rush Какиефишки есть в Rush Analytics? Rush Analytics – сервис поисковой аналитики 1. 3 метода кластеризации, описанные выше (Soft) 2. Автоматическое определение релевантных URL для кластера + определение кластеров в ТОПе 3. Подсветки выдачи для каждого кластера автоматом 4. Показываем самый мощный URL конкурента по кластеру – идем и забираем оптимизацию  5. Скорость – 100к ключевых слов 1-2 часа. Сами используем в работе каждый день
  • 54.