SlideShare a Scribd company logo
1 of 15
Сбор связанных фраз для
текстов под ключевую
фразу на странице
Дмитрий Шахов Директор ГК РЕМАРКА
Докладчик на конференциях
• AllInTop (Москва, 2012, 2014гг.),
• SeoConference (Казань, 2014г.),
• Кинза (Москва, 2014г.),
• РИФ-Воронеж (2014г.),
• MAD (Санкт-Петербург, 2014г.).
Организатор конференции
• BalticDigitalDays (2013, 2014гг.)
www.remarka.info www.seohowto.ru/ny2015/ www.seokaliningrad.ru
Базовые правила к тексту
• Ключ в заголовке статьи
• Вхождение ключа в первом
предложении
• Точное вхождение ключа в текст
• Частичное вхождение ключа в текст
• Вхождение синонимов к ключу в текст
• Вхождение топонимов (названий
региона, города, местности)
Работа с подсветкой
Связанные фразы
• Фотоаппарат -> Объектив, Кофр
• Генератор -> Мощность, Амперы
• Салон красоты -> Ногти, Волосы, SPA
И т.д.
Логика: поиск частоупотребительных
фраз, входящих в тексты сайтов в
топ10
Методика сбора связанных фраз
1. Собираем URL сайтов топ-10 по ключу
2. Выявляем релевантную страницу
3. Парсим текст
4. Лемматизируем слова в тексте
5. Группируем
6. И…
Собираем URL сайтов
Выявляем релевантные
(не всегда совпадают с выдачей)
Парсим текст
• Копируем текст
• Заменяем знаки препинания на пробел
• Заменяем пробел на спуск строки
• Приводим к единому регистру
• Сохраняем в файле
Лемматизируем
Лемматизируем
• Сохраняем фразы в in.txt
• Запускаем mystem
• Открываем out.txt в Excel
• Выполняем группировку
• Откидываем слова до 3 букв
• Получаем коллекцию слов
Считать IDF?
ЧислоДок(Запрос) + ЧислоДок(Слово)
IDF = -------------------------------------------------
ЧислоДок(Запрос + Слово)
Да ну, нафиг!
• Тратим вместо кучи капч всего одну на
парсинг выдачи по запросу
• Парсим тексты с других сайтов в топ10
• Получаем 10 коллекций слов
• Считаем совпадения
• Выбираем интересное для нас
Итог работы
Что дальше?
• Биграммы и триграммы
• Вычитание связанных фраз из текста
копирайтера на предмет проверки на
водность
• Для ленивых программистов: парсим
сниппет, а не текст
Дмитрий Шахов
www.remarka.info
bablorub.blogspot.ru
Skype: remarka.reklama
E-mail: masterxbablorub@gmail.com
https://www.facebook.com/bablorub

More Related Content

Viewers also liked

Ловец ботов, версия 2.0, Дмитрий Шахов
Ловец ботов, версия 2.0, Дмитрий ШаховЛовец ботов, версия 2.0, Дмитрий Шахов
Ловец ботов, версия 2.0, Дмитрий ШаховДмитрий Шахов
 
Иван Ямщиков, Яндекс
Иван Ямщиков, ЯндексИван Ямщиков, Яндекс
Иван Ямщиков, ЯндексYandex
 
живые сайты
живые сайтыживые сайты
живые сайтыzexzex
 
Dima maksimov
Dima maksimovDima maksimov
Dima maksimovyarulet
 
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Yandex
 
20131210прохоренков
20131210прохоренков20131210прохоренков
20131210прохоренковYandex
 
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Yandex
 
Морфологический анализатор PC-KIMMO
Морфологический анализатор PC-KIMMOМорфологический анализатор PC-KIMMO
Морфологический анализатор PC-KIMMOArtem Lukanin
 
Внутреняя оптимизация
Внутреняя оптимизацияВнутреняя оптимизация
Внутреняя оптимизацияprmegaindex
 
Кейс от Studio f1: интернет-магазин антикварной мебели
Кейс от Studio f1: интернет-магазин антикварной мебелиКейс от Studio f1: интернет-магазин антикварной мебели
Кейс от Studio f1: интернет-магазин антикварной мебелиНарижный Денис
 
повышение продаж
повышение продажповышение продаж
повышение продажprmegaindex
 
Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...
Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...
Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...Yandex
 
Instrukcija
InstrukcijaInstrukcija
Instrukcijaaivenkov
 
методические рекомендации_2_часть
методические рекомендации_2_частьметодические рекомендации_2_часть
методические рекомендации_2_частьAlexander Shapovalov
 

Viewers also liked (20)

Ловец ботов, версия 2.0, Дмитрий Шахов
Ловец ботов, версия 2.0, Дмитрий ШаховЛовец ботов, версия 2.0, Дмитрий Шахов
Ловец ботов, версия 2.0, Дмитрий Шахов
 
112
112112
112
 
Иван Ямщиков, Яндекс
Иван Ямщиков, ЯндексИван Ямщиков, Яндекс
Иван Ямщиков, Яндекс
 
живые сайты
живые сайтыживые сайты
живые сайты
 
Dima maksimov
Dima maksimovDima maksimov
Dima maksimov
 
usereto
useretousereto
usereto
 
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
 
20131210прохоренков
20131210прохоренков20131210прохоренков
20131210прохоренков
 
up
upup
up
 
cjdk
cjdkcjdk
cjdk
 
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
 
-
--
-
 
1
11
1
 
Морфологический анализатор PC-KIMMO
Морфологический анализатор PC-KIMMOМорфологический анализатор PC-KIMMO
Морфологический анализатор PC-KIMMO
 
Внутреняя оптимизация
Внутреняя оптимизацияВнутреняя оптимизация
Внутреняя оптимизация
 
Кейс от Studio f1: интернет-магазин антикварной мебели
Кейс от Studio f1: интернет-магазин антикварной мебелиКейс от Studio f1: интернет-магазин антикварной мебели
Кейс от Studio f1: интернет-магазин антикварной мебели
 
повышение продаж
повышение продажповышение продаж
повышение продаж
 
Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...
Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...
Иван Ямщиков — Социальная экономика. Как_дружба_с_графами_может_помочь_вашему...
 
Instrukcija
InstrukcijaInstrukcija
Instrukcija
 
методические рекомендации_2_часть
методические рекомендации_2_частьметодические рекомендации_2_часть
методические рекомендации_2_часть
 

Similar to fg

Принцип Парето в SEO - Как продавать в кризис 2016
Принцип Парето в SEO - Как продавать в кризис 2016Принцип Парето в SEO - Как продавать в кризис 2016
Принцип Парето в SEO - Как продавать в кризис 2016Yuriy Khait
 
минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевичositnikova
 
15 06-portfolio-Galina-Ivannikova
15 06-portfolio-Galina-Ivannikova15 06-portfolio-Galina-Ivannikova
15 06-portfolio-Galina-IvannikovaGalina Ivannikova
 
Нюансы в подготовке специалистов по поисковому продвижению
Нюансы в подготовке специалистов по поисковому продвижениюНюансы в подготовке специалистов по поисковому продвижению
Нюансы в подготовке специалистов по поисковому продвижениюДмитрий Шахов
 
Работают ли SEO-ссылки. Исследование.
Работают ли SEO-ссылки. Исследование.Работают ли SEO-ссылки. Исследование.
Работают ли SEO-ссылки. Исследование.Дмитрий Шахов
 
Расследование Шахова по ссылкам
Расследование Шахова по ссылкамРасследование Шахова по ссылкам
Расследование Шахова по ссылкамBoris Lim
 
Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...
Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...
Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...Webcom Group
 
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...Semantist.ru
 
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииНарижный Денис
 
работа с блогом 2
работа с блогом 2работа с блогом 2
работа с блогом 2Nata Koinova
 
работа с блогом 2
работа с блогом 2работа с блогом 2
работа с блогом 2Natalia Odegova
 
Сергей Мезенцев — Семантический винегрет
Сергей Мезенцев — Семантический винегрет Сергей Мезенцев — Семантический винегрет
Сергей Мезенцев — Семантический винегрет Yandex
 
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаSEO-Интеллект
 
Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...
Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...
Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...SEORU
 
Эффективные методы и инструменты работы с проблемными проектами
Эффективные методы и инструменты работы с проблемными проектамиЭффективные методы и инструменты работы с проблемными проектами
Эффективные методы и инструменты работы с проблемными проектамиSergey Yurkov
 
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе ОнлайнерЕ.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнерborovoystudio
 

Similar to fg (20)

Принцип Парето в SEO - Как продавать в кризис 2016
Принцип Парето в SEO - Как продавать в кризис 2016Принцип Парето в SEO - Как продавать в кризис 2016
Принцип Парето в SEO - Как продавать в кризис 2016
 
Какое SEO у Яндекса
Какое SEO у ЯндексаКакое SEO у Яндекса
Какое SEO у Яндекса
 
минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевич
 
15 06-portfolio-Galina-Ivannikova
15 06-portfolio-Galina-Ivannikova15 06-portfolio-Galina-Ivannikova
15 06-portfolio-Galina-Ivannikova
 
Нюансы в подготовке специалистов по поисковому продвижению
Нюансы в подготовке специалистов по поисковому продвижениюНюансы в подготовке специалистов по поисковому продвижению
Нюансы в подготовке специалистов по поисковому продвижению
 
Key Collector 2
Key Collector 2Key Collector 2
Key Collector 2
 
Работают ли SEO-ссылки. Исследование.
Работают ли SEO-ссылки. Исследование.Работают ли SEO-ссылки. Исследование.
Работают ли SEO-ссылки. Исследование.
 
Расследование Шахова по ссылкам
Расследование Шахова по ссылкамРасследование Шахова по ссылкам
Расследование Шахова по ссылкам
 
Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...
Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...
Неделя Байнета 2016. Дмитрий Шахов: «Исследование по влиянию ссылочного на ра...
 
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
 
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
 
работа с блогом 2
работа с блогом 2работа с блогом 2
работа с блогом 2
 
работа с блогом 2
работа с блогом 2работа с блогом 2
работа с блогом 2
 
Сергей Мезенцев — Семантический винегрет
Сергей Мезенцев — Семантический винегрет Сергей Мезенцев — Семантический винегрет
Сергей Мезенцев — Семантический винегрет
 
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
 
Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...
Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...
Эффективные методы и инструменты работы с проблемными проектами, Сергей Юрков...
 
Эффективные методы и инструменты работы с проблемными проектами
Эффективные методы и инструменты работы с проблемными проектамиЭффективные методы и инструменты работы с проблемными проектами
Эффективные методы и инструменты работы с проблемными проектами
 
Алёна Мельон «E-mail-маркетинг. Кому это нужно»
Алёна Мельон «E-mail-маркетинг. Кому это нужно»Алёна Мельон «E-mail-маркетинг. Кому это нужно»
Алёна Мельон «E-mail-маркетинг. Кому это нужно»
 
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе ОнлайнерЕ.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
 
Seo 2016
Seo 2016Seo 2016
Seo 2016
 

More from prmegaindex

More from prmegaindex (20)

1
11
1
 
kd
kdkd
kd
 
Terehoff\
Terehoff\Terehoff\
Terehoff\
 
vxfкластер сайтов
vxfкластер сайтовvxfкластер сайтов
vxfкластер сайтов
 
99999999999999999999999
9999999999999999999999999999999999999999999999
99999999999999999999999
 
0000000000000000000
00000000000000000000000000000000000000
0000000000000000000
 
morozov
morozovmorozov
morozov
 
вподсказке
вподсказкевподсказке
вподсказке
 
hiv
hivhiv
hiv
 
megaindex
megaindex megaindex
megaindex
 
megainex 2015
megainex 2015megainex 2015
megainex 2015
 
novogodnuy
novogodnuy novogodnuy
novogodnuy
 
seo
seo seo
seo
 
top 3
top 3top 3
top 3
 
seo
seoseo
seo
 
poznay top 2
poznay top 2poznay top 2
poznay top 2
 
17
1717
17
 
hivrin
hivrinhivrin
hivrin
 
мегаиндекс где спрятан трафик для E commerce
мегаиндекс где спрятан трафик для E commerceмегаиндекс где спрятан трафик для E commerce
мегаиндекс где спрятан трафик для E commerce
 
f ye
f yef ye
f ye
 

fg

  • 1. Сбор связанных фраз для текстов под ключевую фразу на странице Дмитрий Шахов Директор ГК РЕМАРКА Докладчик на конференциях • AllInTop (Москва, 2012, 2014гг.), • SeoConference (Казань, 2014г.), • Кинза (Москва, 2014г.), • РИФ-Воронеж (2014г.), • MAD (Санкт-Петербург, 2014г.). Организатор конференции • BalticDigitalDays (2013, 2014гг.) www.remarka.info www.seohowto.ru/ny2015/ www.seokaliningrad.ru
  • 2. Базовые правила к тексту • Ключ в заголовке статьи • Вхождение ключа в первом предложении • Точное вхождение ключа в текст • Частичное вхождение ключа в текст • Вхождение синонимов к ключу в текст • Вхождение топонимов (названий региона, города, местности)
  • 4. Связанные фразы • Фотоаппарат -> Объектив, Кофр • Генератор -> Мощность, Амперы • Салон красоты -> Ногти, Волосы, SPA И т.д. Логика: поиск частоупотребительных фраз, входящих в тексты сайтов в топ10
  • 5. Методика сбора связанных фраз 1. Собираем URL сайтов топ-10 по ключу 2. Выявляем релевантную страницу 3. Парсим текст 4. Лемматизируем слова в тексте 5. Группируем 6. И…
  • 7. Выявляем релевантные (не всегда совпадают с выдачей)
  • 8. Парсим текст • Копируем текст • Заменяем знаки препинания на пробел • Заменяем пробел на спуск строки • Приводим к единому регистру • Сохраняем в файле
  • 10. Лемматизируем • Сохраняем фразы в in.txt • Запускаем mystem • Открываем out.txt в Excel • Выполняем группировку • Откидываем слова до 3 букв • Получаем коллекцию слов
  • 11. Считать IDF? ЧислоДок(Запрос) + ЧислоДок(Слово) IDF = ------------------------------------------------- ЧислоДок(Запрос + Слово)
  • 12. Да ну, нафиг! • Тратим вместо кучи капч всего одну на парсинг выдачи по запросу • Парсим тексты с других сайтов в топ10 • Получаем 10 коллекций слов • Считаем совпадения • Выбираем интересное для нас
  • 14. Что дальше? • Биграммы и триграммы • Вычитание связанных фраз из текста копирайтера на предмет проверки на водность • Для ленивых программистов: парсим сниппет, а не текст
  • 15. Дмитрий Шахов www.remarka.info bablorub.blogspot.ru Skype: remarka.reklama E-mail: masterxbablorub@gmail.com https://www.facebook.com/bablorub