SlideShare a Scribd company logo
Региональное ранжирование в эпоху
MatrixNet
СЕРГЕЙ ЛЮДКЕВИЧ
ЖИВАЯ ЛЕГЕНДА SEO.
EX-TECHART, EX-BDBD, EX-WEBEFFECTOR.
Supermoderator форума searchengines.ru
Образование:Тульский государственный университет,
кафедра "Прикладная математика", аспирантура, к.т.н.
Опыт поискового продвижения: с 2000 года.
Постоянный докладчик и участник круглых столов отраслевых конференций
по продвижению сайтов в России, Украине и Белоруссии.
Сфера профессиональных интересов – исследование алгоритмов ранжирования
поисковых машин, разработка методик поискового продвижения сайтов.
ОБУЧАЮЩАЯ ВЫБОРКА
Набор запросов q(i)
Набор документов dj(i) для каждого запроса q(i)
Rel(q(i), dj(i)) - ручная оценка соответствия документа
запросу (выполняется асессорами)
Конкурс «Интернет-математика – 2009»:
Rel(q, d) - значения из диапазона [0, 4]
(4 – «высокая релевантность»,…, 0 – «нерелевантно»)
ФАКТОРЫ РАНЖИРОВАНИЯ
Набор факторов ранжирования
F = (f1(q,d) , …, fN(q,d))
Базовые факторы – 420 (апрель 2010)
Производные факторы (произведения базовых
факторов) – несколько тысяч
ФУНКЦИЯ РЕЛЕВАНТНОСТИ
Числовое соответствие документа запросу
Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d))
Метод построения функции релевантности в релизе
«Снежинск»:
Жадный (greedy) алгоритм MatrixNet
Подробнее о MatrixNet:
http://company.yandex.ru/technology/matrixnet/
РЕГИОНАЛЬНЫЕ ФОРМУЛЫ
•Отдельные функции релевантности:
•Москва
•Санкт-Петербург + Екатеринбург + 16 городов России
релиза «Арзамас+16»: Новосибирск, Самара, Воронеж
и др.
•Украина
•Белоруссия
•Казахстан
•Общероссийская + все остальные города России +
остальные зарубежные страны + выдача без учета
региона (Земля)
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Запросные
длина запроса в словах;
коммерциолизированность запроса.
Текстовые
наличие точного вхождения запроса в тексте
документа;
наличие точного вхождения запроса в заголовке
документа;
tf*idf;
различные модификации формулы Okapi_BM25.
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Ссылочные статические
•PageRank;
•ТИЦ;
•количество ссылок на документ.
Ссылочные динамические
•процент ссылок на документ, содержащих точное
вхождение запроса;
•tf*idf по текстам ссылок.
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Свойства документа и сайта
•это важный сайт (Wikipedia);
•это главная страница сайта;
•порнографичность контента.
Антиспамовые
•содержит ли попандеры или кликандеры;
•естественность текста;
•уникальность контента.
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Поведенческие
•посещаемость сайта;
•кликабельность документа в выдаче.
Региональные
•совпадение региона запроса и документа;
•региональность ссылок на документ;
•употребление названия региона в тексте документа и в
тексте ссылок на документ.
УЛУЧШЕНИЕ
РЕГИОНАЛЬНЫХ ФАКТОРОВ
РАНЖИРОВАНИЯ
•Присвоение сайту данного региона
•http://help.yandex.ru/webmaster/?id=1074582
•Получение входящих ссылок с сайтов данного региона
•Употребление названия данного региона в тексте
документа
•Употребление названия данного региона в текстах
входящих ссылок на документ

More Related Content

Similar to спик 2010-людкевич

людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013ositnikova
 
людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013ositnikova
 
Cybermarketing 2012-людкевич
Cybermarketing 2012-людкевичCybermarketing 2012-людкевич
Cybermarketing 2012-людкевичositnikova
 
Хиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылокХиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылок
SEO Conference
 
Optimization 2012-людкевич
Optimization 2012-людкевичOptimization 2012-людкевич
Optimization 2012-людкевичositnikova
 
Факторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринФакторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринNikolay Khivrin
 
20131105 романенко
20131105 романенко20131105 романенко
20131105 романенко
Yandex
 
Новые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииНовые технологии в поисковом ранжировании
Новые технологии в поисковом ранжировании
Nikolay Khivrin
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснетаyaevents
 
Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014
mikeslivinsky
 
Константин Ткаченко
Константин ТкаченкоКонстантин Ткаченко
Константин Ткаченко
elenae00
 

Similar to спик 2010-людкевич (11)

людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013
 
людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013
 
Cybermarketing 2012-людкевич
Cybermarketing 2012-людкевичCybermarketing 2012-людкевич
Cybermarketing 2012-людкевич
 
Хиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылокХиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылок
 
Optimization 2012-людкевич
Optimization 2012-людкевичOptimization 2012-людкевич
Optimization 2012-людкевич
 
Факторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринФакторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай Хиврин
 
20131105 романенко
20131105 романенко20131105 романенко
20131105 романенко
 
Новые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииНовые технологии в поисковом ранжировании
Новые технологии в поисковом ранжировании
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснета
 
Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014
 
Константин Ткаченко
Константин ТкаченкоКонстантин Ткаченко
Константин Ткаченко
 

More from ositnikova

минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевичositnikova
 
казань 2011-людкевич
казань 2011-людкевичказань 2011-людкевич
казань 2011-людкевичositnikova
 
екб 2012-людкевич
екб 2012-людкевичекб 2012-людкевич
екб 2012-людкевичositnikova
 
Optimization 2011-людкевич
Optimization 2011-людкевичOptimization 2011-людкевич
Optimization 2011-людкевичositnikova
 
Minsk 2012-людкевич
Minsk 2012-людкевичMinsk 2012-людкевич
Minsk 2012-людкевичositnikova
 
Lyudkevich kazan-2012
Lyudkevich kazan-2012Lyudkevich kazan-2012
Lyudkevich kazan-2012ositnikova
 

More from ositnikova (8)

Doklad
DokladDoklad
Doklad
 
минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевич
 
казань 2011-людкевич
казань 2011-людкевичказань 2011-людкевич
казань 2011-людкевич
 
екб 2012-людкевич
екб 2012-людкевичекб 2012-людкевич
екб 2012-людкевич
 
Optimization 2011-людкевич
Optimization 2011-людкевичOptimization 2011-людкевич
Optimization 2011-людкевич
 
Minsk 2012-людкевич
Minsk 2012-людкевичMinsk 2012-людкевич
Minsk 2012-людкевич
 
Lyudkevich kazan-2012
Lyudkevich kazan-2012Lyudkevich kazan-2012
Lyudkevich kazan-2012
 
Ludkiewicz
LudkiewiczLudkiewicz
Ludkiewicz
 

спик 2010-людкевич

  • 1. Региональное ранжирование в эпоху MatrixNet СЕРГЕЙ ЛЮДКЕВИЧ ЖИВАЯ ЛЕГЕНДА SEO. EX-TECHART, EX-BDBD, EX-WEBEFFECTOR. Supermoderator форума searchengines.ru Образование:Тульский государственный университет, кафедра "Прикладная математика", аспирантура, к.т.н. Опыт поискового продвижения: с 2000 года. Постоянный докладчик и участник круглых столов отраслевых конференций по продвижению сайтов в России, Украине и Белоруссии. Сфера профессиональных интересов – исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.
  • 2. ОБУЧАЮЩАЯ ВЫБОРКА Набор запросов q(i) Набор документов dj(i) для каждого запроса q(i) Rel(q(i), dj(i)) - ручная оценка соответствия документа запросу (выполняется асессорами) Конкурс «Интернет-математика – 2009»: Rel(q, d) - значения из диапазона [0, 4] (4 – «высокая релевантность»,…, 0 – «нерелевантно»)
  • 3. ФАКТОРЫ РАНЖИРОВАНИЯ Набор факторов ранжирования F = (f1(q,d) , …, fN(q,d)) Базовые факторы – 420 (апрель 2010) Производные факторы (произведения базовых факторов) – несколько тысяч
  • 4. ФУНКЦИЯ РЕЛЕВАНТНОСТИ Числовое соответствие документа запросу Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d)) Метод построения функции релевантности в релизе «Снежинск»: Жадный (greedy) алгоритм MatrixNet Подробнее о MatrixNet: http://company.yandex.ru/technology/matrixnet/
  • 5.
  • 6. РЕГИОНАЛЬНЫЕ ФОРМУЛЫ •Отдельные функции релевантности: •Москва •Санкт-Петербург + Екатеринбург + 16 городов России релиза «Арзамас+16»: Новосибирск, Самара, Воронеж и др. •Украина •Белоруссия •Казахстан •Общероссийская + все остальные города России + остальные зарубежные страны + выдача без учета региона (Земля)
  • 7. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Запросные длина запроса в словах; коммерциолизированность запроса. Текстовые наличие точного вхождения запроса в тексте документа; наличие точного вхождения запроса в заголовке документа; tf*idf; различные модификации формулы Okapi_BM25.
  • 8. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Ссылочные статические •PageRank; •ТИЦ; •количество ссылок на документ. Ссылочные динамические •процент ссылок на документ, содержащих точное вхождение запроса; •tf*idf по текстам ссылок.
  • 9. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Свойства документа и сайта •это важный сайт (Wikipedia); •это главная страница сайта; •порнографичность контента. Антиспамовые •содержит ли попандеры или кликандеры; •естественность текста; •уникальность контента.
  • 10. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Поведенческие •посещаемость сайта; •кликабельность документа в выдаче. Региональные •совпадение региона запроса и документа; •региональность ссылок на документ; •употребление названия региона в тексте документа и в тексте ссылок на документ.
  • 11. УЛУЧШЕНИЕ РЕГИОНАЛЬНЫХ ФАКТОРОВ РАНЖИРОВАНИЯ •Присвоение сайту данного региона •http://help.yandex.ru/webmaster/?id=1074582 •Получение входящих ссылок с сайтов данного региона •Употребление названия данного региона в тексте документа •Употребление названия данного региона в текстах входящих ссылок на документ