SlideShare a Scribd company logo
1 of 11
Региональное ранжирование в эпоху
MatrixNet
СЕРГЕЙ ЛЮДКЕВИЧ
ЖИВАЯ ЛЕГЕНДА SEO.
EX-TECHART, EX-BDBD, EX-WEBEFFECTOR.
Supermoderator форума searchengines.ru
Образование:Тульский государственный университет,
кафедра "Прикладная математика", аспирантура, к.т.н.
Опыт поискового продвижения: с 2000 года.
Постоянный докладчик и участник круглых столов отраслевых конференций
по продвижению сайтов в России, Украине и Белоруссии.
Сфера профессиональных интересов – исследование алгоритмов ранжирования
поисковых машин, разработка методик поискового продвижения сайтов.
ОБУЧАЮЩАЯ ВЫБОРКА
Набор запросов q(i)
Набор документов dj(i) для каждого запроса q(i)
Rel(q(i), dj(i)) - ручная оценка соответствия документа
запросу (выполняется асессорами)
Конкурс «Интернет-математика – 2009»:
Rel(q, d) - значения из диапазона [0, 4]
(4 – «высокая релевантность»,…, 0 – «нерелевантно»)
ФАКТОРЫ РАНЖИРОВАНИЯ
Набор факторов ранжирования
F = (f1(q,d) , …, fN(q,d))
Базовые факторы – 420 (апрель 2010)
Производные факторы (произведения базовых
факторов) – несколько тысяч
ФУНКЦИЯ РЕЛЕВАНТНОСТИ
Числовое соответствие документа запросу
Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d))
Метод построения функции релевантности в релизе
«Снежинск»:
Жадный (greedy) алгоритм MatrixNet
Подробнее о MatrixNet:
http://company.yandex.ru/technology/matrixnet/
РЕГИОНАЛЬНЫЕ ФОРМУЛЫ
•Отдельные функции релевантности:
•Москва
•Санкт-Петербург + Екатеринбург + 16 городов России
релиза «Арзамас+16»: Новосибирск, Самара, Воронеж
и др.
•Украина
•Белоруссия
•Казахстан
•Общероссийская + все остальные города России +
остальные зарубежные страны + выдача без учета
региона (Земля)
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Запросные
длина запроса в словах;
коммерциолизированность запроса.
Текстовые
наличие точного вхождения запроса в тексте
документа;
наличие точного вхождения запроса в заголовке
документа;
tf*idf;
различные модификации формулы Okapi_BM25.
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Ссылочные статические
•PageRank;
•ТИЦ;
•количество ссылок на документ.
Ссылочные динамические
•процент ссылок на документ, содержащих точное
вхождение запроса;
•tf*idf по текстам ссылок.
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Свойства документа и сайта
•это важный сайт (Wikipedia);
•это главная страница сайта;
•порнографичность контента.
Антиспамовые
•содержит ли попандеры или кликандеры;
•естественность текста;
•уникальность контента.
ПРИМЕРЫ ФАКТОРОВ
РАНЖИРОВАНИЯ
Поведенческие
•посещаемость сайта;
•кликабельность документа в выдаче.
Региональные
•совпадение региона запроса и документа;
•региональность ссылок на документ;
•употребление названия региона в тексте документа и в
тексте ссылок на документ.
УЛУЧШЕНИЕ
РЕГИОНАЛЬНЫХ ФАКТОРОВ
РАНЖИРОВАНИЯ
•Присвоение сайту данного региона
•http://help.yandex.ru/webmaster/?id=1074582
•Получение входящих ссылок с сайтов данного региона
•Употребление названия данного региона в тексте
документа
•Употребление названия данного региона в текстах
входящих ссылок на документ

More Related Content

Similar to спик 2010-людкевич

людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013ositnikova
 
людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013ositnikova
 
Cybermarketing 2012-людкевич
Cybermarketing 2012-людкевичCybermarketing 2012-людкевич
Cybermarketing 2012-людкевичositnikova
 
Хиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылокХиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылокSEO Conference
 
Optimization 2012-людкевич
Optimization 2012-людкевичOptimization 2012-людкевич
Optimization 2012-людкевичositnikova
 
Факторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринФакторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринNikolay Khivrin
 
20131105 романенко
20131105 романенко20131105 романенко
20131105 романенкоYandex
 
Новые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииНовые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииNikolay Khivrin
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснетаyaevents
 
Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014mikeslivinsky
 
Константин Ткаченко
Константин ТкаченкоКонстантин Ткаченко
Константин Ткаченкоelenae00
 

Similar to спик 2010-людкевич (11)

людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013
 
людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013
 
Cybermarketing 2012-людкевич
Cybermarketing 2012-людкевичCybermarketing 2012-людкевич
Cybermarketing 2012-людкевич
 
Хиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылокХиврин - Алгоритмы выявления Seo ссылок
Хиврин - Алгоритмы выявления Seo ссылок
 
Optimization 2012-людкевич
Optimization 2012-людкевичOptimization 2012-людкевич
Optimization 2012-людкевич
 
Факторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринФакторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай Хиврин
 
20131105 романенко
20131105 романенко20131105 романенко
20131105 романенко
 
Новые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииНовые технологии в поисковом ранжировании
Новые технологии в поисковом ранжировании
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснета
 
Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014
 
Константин Ткаченко
Константин ТкаченкоКонстантин Ткаченко
Константин Ткаченко
 

More from ositnikova

минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевичositnikova
 
казань 2011-людкевич
казань 2011-людкевичказань 2011-людкевич
казань 2011-людкевичositnikova
 
екб 2012-людкевич
екб 2012-людкевичекб 2012-людкевич
екб 2012-людкевичositnikova
 
Optimization 2011-людкевич
Optimization 2011-людкевичOptimization 2011-людкевич
Optimization 2011-людкевичositnikova
 
Minsk 2012-людкевич
Minsk 2012-людкевичMinsk 2012-людкевич
Minsk 2012-людкевичositnikova
 
Lyudkevich kazan-2012
Lyudkevich kazan-2012Lyudkevich kazan-2012
Lyudkevich kazan-2012ositnikova
 

More from ositnikova (8)

Doklad
DokladDoklad
Doklad
 
минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевич
 
казань 2011-людкевич
казань 2011-людкевичказань 2011-людкевич
казань 2011-людкевич
 
екб 2012-людкевич
екб 2012-людкевичекб 2012-людкевич
екб 2012-людкевич
 
Optimization 2011-людкевич
Optimization 2011-людкевичOptimization 2011-людкевич
Optimization 2011-людкевич
 
Minsk 2012-людкевич
Minsk 2012-людкевичMinsk 2012-людкевич
Minsk 2012-людкевич
 
Lyudkevich kazan-2012
Lyudkevich kazan-2012Lyudkevich kazan-2012
Lyudkevich kazan-2012
 
Ludkiewicz
LudkiewiczLudkiewicz
Ludkiewicz
 

спик 2010-людкевич

  • 1. Региональное ранжирование в эпоху MatrixNet СЕРГЕЙ ЛЮДКЕВИЧ ЖИВАЯ ЛЕГЕНДА SEO. EX-TECHART, EX-BDBD, EX-WEBEFFECTOR. Supermoderator форума searchengines.ru Образование:Тульский государственный университет, кафедра "Прикладная математика", аспирантура, к.т.н. Опыт поискового продвижения: с 2000 года. Постоянный докладчик и участник круглых столов отраслевых конференций по продвижению сайтов в России, Украине и Белоруссии. Сфера профессиональных интересов – исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.
  • 2. ОБУЧАЮЩАЯ ВЫБОРКА Набор запросов q(i) Набор документов dj(i) для каждого запроса q(i) Rel(q(i), dj(i)) - ручная оценка соответствия документа запросу (выполняется асессорами) Конкурс «Интернет-математика – 2009»: Rel(q, d) - значения из диапазона [0, 4] (4 – «высокая релевантность»,…, 0 – «нерелевантно»)
  • 3. ФАКТОРЫ РАНЖИРОВАНИЯ Набор факторов ранжирования F = (f1(q,d) , …, fN(q,d)) Базовые факторы – 420 (апрель 2010) Производные факторы (произведения базовых факторов) – несколько тысяч
  • 4. ФУНКЦИЯ РЕЛЕВАНТНОСТИ Числовое соответствие документа запросу Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d)) Метод построения функции релевантности в релизе «Снежинск»: Жадный (greedy) алгоритм MatrixNet Подробнее о MatrixNet: http://company.yandex.ru/technology/matrixnet/
  • 5.
  • 6. РЕГИОНАЛЬНЫЕ ФОРМУЛЫ •Отдельные функции релевантности: •Москва •Санкт-Петербург + Екатеринбург + 16 городов России релиза «Арзамас+16»: Новосибирск, Самара, Воронеж и др. •Украина •Белоруссия •Казахстан •Общероссийская + все остальные города России + остальные зарубежные страны + выдача без учета региона (Земля)
  • 7. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Запросные длина запроса в словах; коммерциолизированность запроса. Текстовые наличие точного вхождения запроса в тексте документа; наличие точного вхождения запроса в заголовке документа; tf*idf; различные модификации формулы Okapi_BM25.
  • 8. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Ссылочные статические •PageRank; •ТИЦ; •количество ссылок на документ. Ссылочные динамические •процент ссылок на документ, содержащих точное вхождение запроса; •tf*idf по текстам ссылок.
  • 9. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Свойства документа и сайта •это важный сайт (Wikipedia); •это главная страница сайта; •порнографичность контента. Антиспамовые •содержит ли попандеры или кликандеры; •естественность текста; •уникальность контента.
  • 10. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Поведенческие •посещаемость сайта; •кликабельность документа в выдаче. Региональные •совпадение региона запроса и документа; •региональность ссылок на документ; •употребление названия региона в тексте документа и в тексте ссылок на документ.
  • 11. УЛУЧШЕНИЕ РЕГИОНАЛЬНЫХ ФАКТОРОВ РАНЖИРОВАНИЯ •Присвоение сайту данного региона •http://help.yandex.ru/webmaster/?id=1074582 •Получение входящих ссылок с сайтов данного региона •Употребление названия данного региона в тексте документа •Употребление названия данного региона в текстах входящих ссылок на документ