SlideShare a Scribd company logo
1 of 22
SEO без границ. 
Осенняя практика от MegaIndex.tv 
«Практические примеры 
фильтрации семантики» 
23.09.2014
Игорь Бакалов 
• В клиентском SEO с 2010 года 
• Опыт продвижения: более 60 проектов 
• Автор блога http://bakalov.info/
Для кого этот доклад 
Данный доклад будет полезен, если: 
• Вам часто приходится подбирать СЯ в 
коммерческих нишах; 
• Объем составляемых СЯ в среднем от 
нескольких сотен, до нескольких тысяч 
запросов; 
• Вы стараетесь минимизировать объем 
ручного труда;
План доклада 
1. Фильтрация навигационных запросов 
2. Фильтрация омонимов 
3. Фильтрация не явных adult запросов 
4. Хаки при фильтрации семантики
Фильтрация навигационных запросов 
Навигационный запрос – это запрос, по которому 
пользователь ищет конкретную фирму или сайт. 
Чаще встречаются в тематиках: стоматология, 
недвижимость, фаст-фуд, финансы, и т.д. 
Примеры запросов: «агентство недвижимости этажи», 
«стоматология мастер дент», «суши терра»… 
Какие существуют способы фильтрации?
Фильтрация навигационных запросов 
Способ №1: Проверить все запросы руками 
Плюсы: 
• Это просто 
Минусы: 
• Очень долго и не рационально – в ряде тематик до 50% 
запросов могут быть навигационными, например «агентство 
недвижимости»; 
• Большая вероятность ошибки, например: «отель премиум 
санкт петербург», «гостиница у фонтана санкт петербург» 
- это все навигационные запросы;
Фильтрация навигационных запросов 
Способ №2: Проверить запросы через Яндекс.XML 
Плюсы: 
• Высокая скорость обработки; 
• Высокая точность – если Яндекс определил запрос как навигационный 
и по данному запросу есть витальный сайт, то это видно в XML: 
Минусы: 
• Нужны XML лимиты; 
• Нужен скрипт для проверки;
Фильтрация навигационных запросов 
Способ №3: Проверить запросы через выдачу Google 
Плюсы: 
• Можно определить навигационные запросы, по которым в Яндексе нет витальных 
сайтов. Пример выдачи по запросу «отель премиум санкт петербург» : 
Минусы: 
• Нужно писать скрипт для парсинга результатов поиска; 
• Сопутствующие расходы на каптчу и прокси; 
• Иногда бывают «ложные» срабатывания;
Фильтрация навигационных запросов 
Способ №4: Проверить запросы через выдачу Яндекса 
По многим навигационным запросам Яндекс отображает в топ-10 больше 
1 страницы витального сайта. 
Плюсы: 
• Это просто! Нужно лишь собрать топ-10 и выгрузить в Excel. 
• Это можно делать при помощи KeyCollector!  
Минусы: 
• Выявляются не все навигационные запросы – не редки случаи, когда 
витальный сайт занимает только одну позицию. 
Подробное описание метода: 
http://bakalov.info/filtraciya-navigacionnyx-zaprosov-v-keycollector.html
Фильтрация омонимов 
Омонимы - разные по значению, но одинаковые по звучанию и написанию слова © 
Википедия 
Задача: собрать СЯ для магазина по продаже ковров. 
Что делаем? Парсим вордстат по запросам «магазин ковров», «продажа ковров»… 
И кроме целевых, получаем еще пачку вот таких запросов: 
магазины в коврове 
город ковров магазины 
ковров недвижимость продажа 
продажа недвижимости в коврове 
продажа квартир г ковров 
интернет магазин в коврове 
мото продажа в коврове 
город ковров продажа квартир 
продажа машин в коврове 
продажа собак в коврове 
Как быть?
Фильтрация омонимов 
1. Фильтруем руками 
Это же не наш метод 
Фильтрация омонимов 
Шаг первый: при помощи Regex выделяем запросы с топонимом. В KeyCollector в 
«Быстрый фильтр» вставляем: 
(^гs|sгs|sг$|^городs|sгородs|sгород$|^городеs|sгородеs|sгороде$) 
Получаем: 
г ковров магазины 
город ковров магазины 
продажа квартир г ковров 
город ковров продажа квартир 
продажа квартир в городе коврове 
продажа домов в городе коврове 
продажа квартир в г коврове 
авито продажа квартиры г ковров 
интернет магазин город ковров 
мебельные магазины г ковров 
эльдорадо интернет магазин город ковров 
Удаляем такие запросы и переходим к шагу №2.
Фильтрация омонимов 
Шаг второй: в случае частичной омонимии разбираем омоформы. Мы 
имеем: 
• ковров – в случае города это: ед. число, им. падеж; 
• ковров – в случае «плотное тканое изделие» это: мн. число, родит. 
падеж от слова «ковер». 
Предложный падеж для города «Ковров» будет «Коврове», а для 
«Ковры» это будет «Коврах». Фильтруем по «Коврове» и получаем: 
магазины в коврове 
интернет магазин в коврове 
продажа квартир в коврове 
продажа домов в коврове 
продажа авто в коврове 
авито продажа квартир в коврове 
продажа недвижимости в коврове 
Удаляем подобные запросы и переходим к шагу №3.
Фильтрация омонимов 
Шаг третий: фильтрация омонимов по сниппетам. Поисковые системы 
весьма не плохо умеют «понимать» значение омонима по контексту 
поискового запроса. Как это использовать? 
Берем запросы с «ковров», собираем топ-10 по каждому ключу, проверяем 
сниппеты на наличие словоформы «коврове», делаем выборку и получаем: 
продажа авто на авито ковров 
ковров продажа квартир 
продажа ковров на авито 
ковров недвижимость продажа 
продажа авто ковров 
продажа машин ковров 
ковров продажа квартир объявления 
ковров продажа домов 
ковров мебельные магазины 
Перед удалением на всякий случай проверяем нет ли косяков 
Фильтрация не явных adult запросов 
Явный adult запрос – это запрос, в котором в явном виде 
указано, что пользователю нужен контент «18+». 
Фильтруются подобные запросы весьма просто - при помощи 
словаря стоп слов: 
порно, порнуха, проститутки, секс, ххх, грудастой, изнасиловал, 
лесбиянки, лесби, малолетки, маструбация, минет... (всего около 
250 слов) 
НЕ явный adult запрос – это запрос, который не содержит 
порно лексики, но подразумевает соответствующий 
пользовательский интент. Чаще всего такие запросы 
встречаются в тематиках: «массаж», «нижнее женское 
белье» и др…
Фильтрация не явных adult запросов 
Как это выглядит на практике. Например, вы спарсили вордстат для 
салона красоты по запросу «массаж», почистили от явной порно лексики, 
глянули, а там: 
пришла на массаж русское 
скрытая камера массаж 
мужик делает массаж мужику 
массаж зрелой женщине 
массаж а потом 
русская на массаже 
брат делает массаж 
во время массажа 
муж делает жене массаж 
брат и сестра массаж 
Хотят ли эти пользователи стать клиентом массажного салона? 
Фильтрация не явных adult запросов 
Смотрим выдачу Яндекса по запросу «пришла на массаж 
русское»: 
Принцип фильтрации – собираем топ-10 по каждому запросу и 
проверяем на наличие «взрослых» слов (делается в KeyCollector).
Хаки при фильтрации семантики 
Хак первый: выделяем запросы с «мусорными» предлогами. Для 
быстрого фильтра в KeyCollector используем Regex: 
(^(о|об)s|s(без|в|где|для|до|за|из|или|и|к|над|на|не|но|ну|об|от|о|п 
од|по|при|про|со|с|те|чем|что)$) 
Получаем: 
акция пластиковые окна двухкомнатная квартира за 
арочные пластиковые окна и 
пластиковые окна профили в 
застекление балкона или пластиковые окна под 
благодаря этому пластиковые окна и 
Очень актуально, если вы не только парсите вордстат/подсказки, но и 
работаете с базами ключевых слов.
Хаки при фильтрации семантики 
Хак второй: хитрая фильтрация запросов с латиницей. 
Входные данные: ~700 запросов про «видеорегистратор 
dvr». 
Задача: оставить общие запросы («видеорегистратор dvr 
купить», «dvr видеорегистратор отзывы», «автомобильный 
видеорегистратор dvr» и т.п.), исключить запросы про 
конкретные бренды/модели («видеорегистратор eplutus 
dvr», «видеорегистратор vehicle dvr» и и т.п.). Для решения 
используем Regex: 
([a-z]s.*dvr|dvrs.*[a-z]) 
На выходе получаем ~ 150 «чистых» запросов: 
видеорегистратор dvr, dvr видеорегистратор отзывы, инструкция видеорегистратор dvr, 
автомобильный видеорегистратор dvr, dvr видеорегистратор купить...
Хаки при фильтрации семантики 
Хак от КО: если вы постоянно работаете с семантикой, 
то у вас просто обязательно должны быть свои списки 
стоп-слов. 
Наглядный пример: собранно ~3700 запросов про 
«доставку пиццы» для сайта из Нижнего Новгорода. 
Список-стоп слов по городам позволяет сразу отсеять 
~2500 запросов, т.е. 67%! 
В идеале делить стоп-слова на группы: 
информационные, adult, навигационные, 
образовательные, развлекательные…
Хаки при фильтрации семантики 
А вот так список стоп-слов может выглядеть на практике:
Спасибо за внимание! 
Игорь Бакалов 
Подписывайтесь на мой блог: 
http://bakalov.info/ 
И добавляйтесь в соц сетях: 
https://www.facebook.com/bakalov.igor 
https://twitter.com/Bakalov_Igor

More Related Content

What's hot

SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылкиSEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
Дмитрий Севальнев
 

What's hot (20)

Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
 
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
 
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
 
Seo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пфSeo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пф
 
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизациюSeo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
 
ТОП-18 SEO-событий уходящего 2014 года
ТОП-18 SEO-событий уходящего 2014 годаТОП-18 SEO-событий уходящего 2014 года
ТОП-18 SEO-событий уходящего 2014 года
 
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев ДмитрийСанкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
 
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 годуАналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
 
Как выйти из-под Google Panda. Симптомы, причины, кейсы.
Как выйти из-под Google Panda. Симптомы, причины, кейсы.Как выйти из-под Google Panda. Симптомы, причины, кейсы.
Как выйти из-под Google Panda. Симптомы, причины, кейсы.
 
SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылкиSEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядро
 
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
 
Анализ просадки трафика в Google - Аралов Евгений на IBCRussia
Анализ просадки трафика в Google - Аралов Евгений на IBCRussiaАнализ просадки трафика в Google - Аралов Евгений на IBCRussia
Анализ просадки трафика в Google - Аралов Евгений на IBCRussia
 
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
 
Особенности поисковой оптимизации Медиапроектов Mail.Ru Group
Особенности поисковой оптимизации Медиапроектов Mail.Ru GroupОсобенности поисковой оптимизации Медиапроектов Mail.Ru Group
Особенности поисковой оптимизации Медиапроектов Mail.Ru Group
 
Как почистить сайт от переоптимизации?
Как почистить сайт от переоптимизации?Как почистить сайт от переоптимизации?
Как почистить сайт от переоптимизации?
 
Почему просел трафик? Мастер-класс по диагностике сайта
Почему просел трафик? Мастер-класс по диагностике сайтаПочему просел трафик? Мастер-класс по диагностике сайта
Почему просел трафик? Мастер-класс по диагностике сайта
 
Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)
 
Николай Хиврин влияние переходов по ссылкам на поисковое ранжирование
Николай Хиврин влияние переходов по ссылкам на поисковое ранжированиеНиколай Хиврин влияние переходов по ссылкам на поисковое ранжирование
Николай Хиврин влияние переходов по ссылкам на поисковое ранжирование
 
Влияние переходов по ссылкам на поисковое ранжирование, Николай Хиврин
Влияние переходов по ссылкам на поисковое ранжирование, Николай ХивринВлияние переходов по ссылкам на поисковое ранжирование, Николай Хиврин
Влияние переходов по ссылкам на поисковое ранжирование, Николай Хиврин
 

Similar to Seo без границ осенняя практика от mega index.tv

Продвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOX
Продвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOXПродвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOX
Продвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOX
OWOX
 
SEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOX
SEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOXSEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOX
SEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOX
OWOX
 
SEO твиты - просто, понятно, коротко
SEO твиты - просто, понятно, короткоSEO твиты - просто, понятно, коротко
SEO твиты - просто, понятно, коротко
Netpeak
 
Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....
Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....
Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....
Promodo
 
Все что нужно знать о SEO
Все что нужно знать о SEOВсе что нужно знать о SEO
Все что нужно знать о SEO
Dimaslennikov
 
Сергей Вепренцев. Ваш сайт глазами клиента
Сергей Вепренцев. Ваш сайт глазами клиентаСергей Вепренцев. Ваш сайт глазами клиента
Сергей Вепренцев. Ваш сайт глазами клиента
Egor Stremousov
 
Project Robotester
Project RobotesterProject Robotester
Project Robotester
bromozel
 
Доклад Николаева на Кибермаркетинг 2011
Доклад Николаева на Кибермаркетинг 2011Доклад Николаева на Кибермаркетинг 2011
Доклад Николаева на Кибермаркетинг 2011
maxtreem
 

Similar to Seo без границ осенняя практика от mega index.tv (20)

[Seo 2.0] – простые инструменты для увеличения продаж на сайте
[Seo 2.0] – простые инструменты для увеличения продаж на сайте[Seo 2.0] – простые инструменты для увеличения продаж на сайте
[Seo 2.0] – простые инструменты для увеличения продаж на сайте
 
Контекстная реклама, презентация
Контекстная реклама, презентацияКонтекстная реклама, презентация
Контекстная реклама, презентация
 
#OWOX Продвижение по траффику. Есть ли будущее?
#OWOX Продвижение по траффику. Есть ли будущее?#OWOX Продвижение по траффику. Есть ли будущее?
#OWOX Продвижение по траффику. Есть ли будущее?
 
Продвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOX
Продвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOXПродвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOX
Продвижение по траффику – есть ли будущее? Роман Рыбальченко, конференция OWOX
 
poznay top 2
poznay top 2poznay top 2
poznay top 2
 
SEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOX
SEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOXSEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOX
SEO-твиты:просто, понятно, коротко. Артем Бородатюк, конференция OWOX
 
SEO твиты - просто, понятно, коротко
SEO твиты - просто, понятно, короткоSEO твиты - просто, понятно, коротко
SEO твиты - просто, понятно, коротко
 
Анна Караулова: хитрости в продвижении сайта через контекстную рекламу
Анна Караулова: хитрости в продвижении сайта через контекстную рекламуАнна Караулова: хитрости в продвижении сайта через контекстную рекламу
Анна Караулова: хитрости в продвижении сайта через контекстную рекламу
 
Внутренняя оптимизация: ответы на «острые» вопросы
Внутренняя оптимизация: ответы на «острые» вопросыВнутренняя оптимизация: ответы на «острые» вопросы
Внутренняя оптимизация: ответы на «острые» вопросы
 
О общих подходах к отображению данных на сайте
О общих подходах к отображению данных на сайтеО общих подходах к отображению данных на сайте
О общих подходах к отображению данных на сайте
 
Построение рекламной кампании в интернете и веб-аналитика
Построение рекламной кампании в интернете и веб-аналитикаПостроение рекламной кампании в интернете и веб-аналитика
Построение рекламной кампании в интернете и веб-аналитика
 
«Особенности продвижения региональных сайтов в 2015 году», Юрий Софин
«Особенности продвижения региональных сайтов в 2015 году», Юрий Софин«Особенности продвижения региональных сайтов в 2015 году», Юрий Софин
«Особенности продвижения региональных сайтов в 2015 году», Юрий Софин
 
Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....
Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....
Как увеличить трафик интернет-магазина без внешних ссылок - Optimization.com....
 
Dobronovskyi
DobronovskyiDobronovskyi
Dobronovskyi
 
Все что нужно знать о SEO
Все что нужно знать о SEOВсе что нужно знать о SEO
Все что нужно знать о SEO
 
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантика
 
Вывод в ТОП по брендовым запросам.
Вывод в ТОП по брендовым запросам. Вывод в ТОП по брендовым запросам.
Вывод в ТОП по брендовым запросам.
 
Сергей Вепренцев. Ваш сайт глазами клиента
Сергей Вепренцев. Ваш сайт глазами клиентаСергей Вепренцев. Ваш сайт глазами клиента
Сергей Вепренцев. Ваш сайт глазами клиента
 
Project Robotester
Project RobotesterProject Robotester
Project Robotester
 
Доклад Николаева на Кибермаркетинг 2011
Доклад Николаева на Кибермаркетинг 2011Доклад Николаева на Кибермаркетинг 2011
Доклад Николаева на Кибермаркетинг 2011
 

Seo без границ осенняя практика от mega index.tv

  • 1. SEO без границ. Осенняя практика от MegaIndex.tv «Практические примеры фильтрации семантики» 23.09.2014
  • 2. Игорь Бакалов • В клиентском SEO с 2010 года • Опыт продвижения: более 60 проектов • Автор блога http://bakalov.info/
  • 3. Для кого этот доклад Данный доклад будет полезен, если: • Вам часто приходится подбирать СЯ в коммерческих нишах; • Объем составляемых СЯ в среднем от нескольких сотен, до нескольких тысяч запросов; • Вы стараетесь минимизировать объем ручного труда;
  • 4. План доклада 1. Фильтрация навигационных запросов 2. Фильтрация омонимов 3. Фильтрация не явных adult запросов 4. Хаки при фильтрации семантики
  • 5. Фильтрация навигационных запросов Навигационный запрос – это запрос, по которому пользователь ищет конкретную фирму или сайт. Чаще встречаются в тематиках: стоматология, недвижимость, фаст-фуд, финансы, и т.д. Примеры запросов: «агентство недвижимости этажи», «стоматология мастер дент», «суши терра»… Какие существуют способы фильтрации?
  • 6. Фильтрация навигационных запросов Способ №1: Проверить все запросы руками Плюсы: • Это просто Минусы: • Очень долго и не рационально – в ряде тематик до 50% запросов могут быть навигационными, например «агентство недвижимости»; • Большая вероятность ошибки, например: «отель премиум санкт петербург», «гостиница у фонтана санкт петербург» - это все навигационные запросы;
  • 7. Фильтрация навигационных запросов Способ №2: Проверить запросы через Яндекс.XML Плюсы: • Высокая скорость обработки; • Высокая точность – если Яндекс определил запрос как навигационный и по данному запросу есть витальный сайт, то это видно в XML: Минусы: • Нужны XML лимиты; • Нужен скрипт для проверки;
  • 8. Фильтрация навигационных запросов Способ №3: Проверить запросы через выдачу Google Плюсы: • Можно определить навигационные запросы, по которым в Яндексе нет витальных сайтов. Пример выдачи по запросу «отель премиум санкт петербург» : Минусы: • Нужно писать скрипт для парсинга результатов поиска; • Сопутствующие расходы на каптчу и прокси; • Иногда бывают «ложные» срабатывания;
  • 9. Фильтрация навигационных запросов Способ №4: Проверить запросы через выдачу Яндекса По многим навигационным запросам Яндекс отображает в топ-10 больше 1 страницы витального сайта. Плюсы: • Это просто! Нужно лишь собрать топ-10 и выгрузить в Excel. • Это можно делать при помощи KeyCollector!  Минусы: • Выявляются не все навигационные запросы – не редки случаи, когда витальный сайт занимает только одну позицию. Подробное описание метода: http://bakalov.info/filtraciya-navigacionnyx-zaprosov-v-keycollector.html
  • 10. Фильтрация омонимов Омонимы - разные по значению, но одинаковые по звучанию и написанию слова © Википедия Задача: собрать СЯ для магазина по продаже ковров. Что делаем? Парсим вордстат по запросам «магазин ковров», «продажа ковров»… И кроме целевых, получаем еще пачку вот таких запросов: магазины в коврове город ковров магазины ковров недвижимость продажа продажа недвижимости в коврове продажа квартир г ковров интернет магазин в коврове мото продажа в коврове город ковров продажа квартир продажа машин в коврове продажа собак в коврове Как быть?
  • 11. Фильтрация омонимов 1. Фильтруем руками Это же не наш метод 
  • 12. Фильтрация омонимов Шаг первый: при помощи Regex выделяем запросы с топонимом. В KeyCollector в «Быстрый фильтр» вставляем: (^гs|sгs|sг$|^городs|sгородs|sгород$|^городеs|sгородеs|sгороде$) Получаем: г ковров магазины город ковров магазины продажа квартир г ковров город ковров продажа квартир продажа квартир в городе коврове продажа домов в городе коврове продажа квартир в г коврове авито продажа квартиры г ковров интернет магазин город ковров мебельные магазины г ковров эльдорадо интернет магазин город ковров Удаляем такие запросы и переходим к шагу №2.
  • 13. Фильтрация омонимов Шаг второй: в случае частичной омонимии разбираем омоформы. Мы имеем: • ковров – в случае города это: ед. число, им. падеж; • ковров – в случае «плотное тканое изделие» это: мн. число, родит. падеж от слова «ковер». Предложный падеж для города «Ковров» будет «Коврове», а для «Ковры» это будет «Коврах». Фильтруем по «Коврове» и получаем: магазины в коврове интернет магазин в коврове продажа квартир в коврове продажа домов в коврове продажа авто в коврове авито продажа квартир в коврове продажа недвижимости в коврове Удаляем подобные запросы и переходим к шагу №3.
  • 14. Фильтрация омонимов Шаг третий: фильтрация омонимов по сниппетам. Поисковые системы весьма не плохо умеют «понимать» значение омонима по контексту поискового запроса. Как это использовать? Берем запросы с «ковров», собираем топ-10 по каждому ключу, проверяем сниппеты на наличие словоформы «коврове», делаем выборку и получаем: продажа авто на авито ковров ковров продажа квартир продажа ковров на авито ковров недвижимость продажа продажа авто ковров продажа машин ковров ковров продажа квартир объявления ковров продажа домов ковров мебельные магазины Перед удалением на всякий случай проверяем нет ли косяков 
  • 15. Фильтрация не явных adult запросов Явный adult запрос – это запрос, в котором в явном виде указано, что пользователю нужен контент «18+». Фильтруются подобные запросы весьма просто - при помощи словаря стоп слов: порно, порнуха, проститутки, секс, ххх, грудастой, изнасиловал, лесбиянки, лесби, малолетки, маструбация, минет... (всего около 250 слов) НЕ явный adult запрос – это запрос, который не содержит порно лексики, но подразумевает соответствующий пользовательский интент. Чаще всего такие запросы встречаются в тематиках: «массаж», «нижнее женское белье» и др…
  • 16. Фильтрация не явных adult запросов Как это выглядит на практике. Например, вы спарсили вордстат для салона красоты по запросу «массаж», почистили от явной порно лексики, глянули, а там: пришла на массаж русское скрытая камера массаж мужик делает массаж мужику массаж зрелой женщине массаж а потом русская на массаже брат делает массаж во время массажа муж делает жене массаж брат и сестра массаж Хотят ли эти пользователи стать клиентом массажного салона? 
  • 17. Фильтрация не явных adult запросов Смотрим выдачу Яндекса по запросу «пришла на массаж русское»: Принцип фильтрации – собираем топ-10 по каждому запросу и проверяем на наличие «взрослых» слов (делается в KeyCollector).
  • 18. Хаки при фильтрации семантики Хак первый: выделяем запросы с «мусорными» предлогами. Для быстрого фильтра в KeyCollector используем Regex: (^(о|об)s|s(без|в|где|для|до|за|из|или|и|к|над|на|не|но|ну|об|от|о|п од|по|при|про|со|с|те|чем|что)$) Получаем: акция пластиковые окна двухкомнатная квартира за арочные пластиковые окна и пластиковые окна профили в застекление балкона или пластиковые окна под благодаря этому пластиковые окна и Очень актуально, если вы не только парсите вордстат/подсказки, но и работаете с базами ключевых слов.
  • 19. Хаки при фильтрации семантики Хак второй: хитрая фильтрация запросов с латиницей. Входные данные: ~700 запросов про «видеорегистратор dvr». Задача: оставить общие запросы («видеорегистратор dvr купить», «dvr видеорегистратор отзывы», «автомобильный видеорегистратор dvr» и т.п.), исключить запросы про конкретные бренды/модели («видеорегистратор eplutus dvr», «видеорегистратор vehicle dvr» и и т.п.). Для решения используем Regex: ([a-z]s.*dvr|dvrs.*[a-z]) На выходе получаем ~ 150 «чистых» запросов: видеорегистратор dvr, dvr видеорегистратор отзывы, инструкция видеорегистратор dvr, автомобильный видеорегистратор dvr, dvr видеорегистратор купить...
  • 20. Хаки при фильтрации семантики Хак от КО: если вы постоянно работаете с семантикой, то у вас просто обязательно должны быть свои списки стоп-слов. Наглядный пример: собранно ~3700 запросов про «доставку пиццы» для сайта из Нижнего Новгорода. Список-стоп слов по городам позволяет сразу отсеять ~2500 запросов, т.е. 67%! В идеале делить стоп-слова на группы: информационные, adult, навигационные, образовательные, развлекательные…
  • 21. Хаки при фильтрации семантики А вот так список стоп-слов может выглядеть на практике:
  • 22. Спасибо за внимание! Игорь Бакалов Подписывайтесь на мой блог: http://bakalov.info/ И добавляйтесь в соц сетях: https://www.facebook.com/bakalov.igor https://twitter.com/Bakalov_Igor