Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex 2014]

4,965 views

Published on

=План доклада=

1. Аналитика
- переколдовка запроса
- веса слов и контекстные ограничения
- отсечение СПЕКТРА и новостной примеси в выдаче Яндекса
- поиск синонимов
- отслеживание изменений словаря синонимов

2. Практика
- учёт синонимов в текстовой оптимизации сайта
- расширение семантического ядра
- объединение запросов в группы

Published in: Internet

Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex 2014]

  1. 1. SEO-конференция MegaIndex.tv 2014 Анализ механизма обработки запроса в поисковых системах 2 июля 2014 «Пиксель Плюс»
  2. 2. Сайт семинара: www.semkursy.ru Запись на бесплатный семинар 10 июля 2014 • +7 (967) 219-78-82 • seminar@semkursy.ru • www.semkursy.ru
  3. 3. По ссылке: pixelplus.ru/samostoyatelno/
  4. 4. План доклада 2 1. Аналитика • переколдовка запроса • веса слов и контекстные ограничения • отсечение СПЕКТРА и новостной примеси в выдаче Яндекса • поиск синонимов • отслеживание изменений словаря синонимов 2. Практика • учёт синонимов в текстовой оптимизации сайта • расширение семантического ядра • объединение запросов в группы
  5. 5. SEO-оптимизация начинается здесь… 5 Подсветка слов в выдаче БЫВАЕТ РАЗНАЯ
  6. 6. Переколдовка поискового запроса 6 При обработке запроса задаются 1. Синонимы 2. Веса слов 3. Контекстные ограничения Пример • МГУ = мгу • МГУ = московский (Weight_1) /1 государственный (Weight_2) /1 университет (Weight_3)
  7. 7. Синонимы 7 Выделение слов в выдаче поисковой системы Внимание! • подсветка ≠ полная база синонимов • существуют и другие причины подсветки слов в выдаче (СПЕКТР)
  8. 8. Веса слов 8 Оценка веса слова с помощью поиска Важно • чем в большем числе документов встречается слово, тем меньше его вес • максимальный вес — у самых редких слов • вес слова зависит от базы поисковой системы (меняется со временем)
  9. 9. Расчёт весов и национальный корпус 9 В ряду случаев, можно привлечь национальный корпус русского языка: www.ruscorpora.ru Стоп-слова = словоформы Самые частотные биграммы = 2- граммы и т.д.
  10. 10. Контекстные ограничения 10 Расположение слов в документе имеет значение
  11. 11. Примеси в выдаче 11 Ряд результатов в выдаче могут быть не органическими, а «подмешиваться» Основные типы • СПЕКТР (дополнительные интенты) • Новостная примесь • Колдунщики o сервисы o мобильные приложения
  12. 12. Отсечение СПЕКТРа 12 Для отсечения СПЕКТР’а (подсветки доп.слов)
  13. 13. Отсечение новостных результатов 13 Быстроробот • срок жизни базы около 3 суток, далее документы выпадают из индекса
  14. 14. Поиск синонимов без СПЕКТРа 14 Запросы для SEO • [стяжка кнауф] • [сухая стяжка пола кнауф купить] • [элементы пола кнауф] Слова в подсветке • стяжка, кнауф, knauf, москва, сухой, пол, купить, продажа, элемент Дополнительно выделяем • транслит • слова по СПЕКТРу (может быть несколько интентов и несколько групп дополнительных слов)
  15. 15. Отслеживание изменений 15 Для конкурентных запросов 1. Регулярный сбор слов из подсветки 2. Обновление базы синонимов в крупные апдейты и переобучение алгоритма 3. Работа с синонимами по словарю Можно использовать — engine.seointellect.ru
  16. 16. План доклада 2 1. Аналитика • переколдовка запроса • веса слов и контекстные ограничения • отсечение СПЕКТРА и новостной примеси в выдаче Яндекса • поиск синонимов • отслеживание изменений словаря синонимов 2. Практика • учёт синонимов в текстовой оптимизации сайта • расширение семантического ядра • объединение запросов в группы
  17. 17. Учёт синонимов на сайте 17 Подготовка 1. Сбор полной базы синонимов из подсветки 2. Сбор доп. слов в рамках вашего интента 3. Добавление общих синонимов (словари) Реализация 1. Добавление в текст синонимов (от 2 раз каждое слово) и доп. слов вашего интента (СПЕКТР) 2. Добавление в Title доп. cлов для увеличения CTR 3. Задание геопривязки (региона продвижения для коммерческих запросов)
  18. 18. Формирование ТЗ копирайтеру 18 «Универсальное» решение для 70% запросов  Объем текста  Процент вхождений  Морфология  Специализированные термины  Синонимы  Структура: списки, картинки Обычно: от 1 200 до 3 000 символов По дефолту: 2% Надо: 1 чистое + 1 морфологическое Добавляем: тематические слова Обязательно: слова из подсветки 1 список и 1 картинка на 1 000 знаков
  19. 19. Расширение семантического ядра 19 Подготовка • Сбор полной базы синонимов из подсветки и дополнительных слов в рамках вашего интента Реализация 1. Сбор запросов (WordStat + подсказки + … ?) 2. Сбор запросов с добавлением доп. слов, синонимы Можно использовать — KeyCollector, Megaindex.ru Помощь: pixelplus.ru/samostoyatelno/otvety-na- voprosy/semanticheskoe-yadro/261292.html
  20. 20. Расширение семантического ядра 20 Сбор «веером» • Находим слово из подсветки • Добавляем в запрос • Несколько итераций
  21. 21. Объединение запросов в группы 21 Общая концепция • Запросы объединяют в группу, если в выдаче по ним есть общие документы (можно ввести порог числа документов, более 2-3 одинаковых документов) • Группа запросов ведет на один документ на сайте Полезно использовать • Лингвистику • Взаимную подсветку слов из запросов (при задании одного запроса, подсвечиваются слова из другого поискового запроса)
  22. 22. Объединение запросов в группы 22 Парсинг выдачи: [пицца], [колбаса и сыр на тесте] Есть общие результаты или нет?
  23. 23. Вспомогательные материалы 23 Полезные материалы 1. Помощь по SEO: pixelplus.ru/samostoyatelno/ 2. Бесплатный семинар: semkursy.ru 3. О KeyCollector: pixelplus.ru/samostoyatelno/seo-servisy/key- collector.html 4. Группировка запросов: engine.seointellect.ru 5. Переформулировки: tools.promosite.ru/old/perekoldovki.php 6. Веса слов: en.wikipedia.org/wiki/Tf%E2%80%93idf 7. Корпус русского языка: http://www.ruscorpora.ru/ 8. Язык запросов Яндекса: help.yandex.ru/search/query- language/crib-sheet.xml
  24. 24. По ссылке: pixelplus.ru/samostoyatelno/
  25. 25. Конференция MegaIndex.tv 2014 Анализ механизма обработки запроса в поисковых системах 2 июля 2014 «Пиксель Плюс»

×