SlideShare a Scribd company logo
1 of 12
•Особенности регионального ранжирования
Яндекса. Белорусская формула
•Сергей ЛЮДКЕВИЧ, начальник отдела исследований и аналитики
Особенности регионального
ранжирования Яндекса.
Белорусская формула
СЕРГЕЙ ЛЮДКЕВИЧ
ЖИВАЯ ЛЕГЕНДА SEO.
EX-TECHART, EX-BDBD, EX-WEBEFFECTOR.
Supermoderator форума searchengines.ru
Образование:Тульский государственный университет,
кафедра "Прикладная математика", аспирантура, к.т.н.
Опыт поискового продвижения: с 2000 года.
Постоянный докладчик и участник круглых столов отраслевых конференций
по продвижению сайтов в России, Украине и Белоруссии.
Сфера профессиональных интересов – исследование алгоритмов ранжирования
поисковых машин, разработка методик поискового продвижения сайтов.
ТЕКУЩИЙ АЛГОРИТМ. МАШИННОЕ
ОБУЧЕНИЕ
Обучающие данные
Набор запросов q(i)
Набор документов dj(i) для каждого запроса q(i)
Rel(q(i), dj(i)) - ручная оценка соответствия документа
запросу
Конкурс «Интернет-математика – 2009»:
Rel(q, d) - значения из диапазона [0, 4]
(4 – «высокая релевантность»,…, 0 – «нерелевантно»)
ФАКТОРЫ РАНЖИРОВАНИЯ
Набор факторов ранжирования
F = (f1(q,d) , …, fN(q,d))
Конкурс «Интернет-математика – 2009»:
N=245
«Яндекс на РОМИП’2009»:
N=163 (коллекция BY.WEB);
N=69 (коллекция KM.RU, без ссылочных факторов)
Алгоритм «Снежинск»:
N – несколько тысяч
ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ
Запросные
длина запроса в словах;
язык запроса.
Текстовые
наличие точного вхождения запроса в тексте
документа;
наличие точного вхождения запроса в заголовке
документа;
tf*idf;
различные модификации формулы Okapi_BM25.
ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ
Ссылочные
•PageRank;
•логарифм количества ссылок на документ;
•процент ссылок на документ, содержащих точное
вхождение запроса.
Географические
•регион сайта;
•язык документа.
ФУНКЦИЯ РЕЛЕВАНТНОСТИ
Числовое соответствие документа запросу
Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d))
Методы построения функции релевантности:
«Яндекс на РОМИП’2009»: генетический алгоритм
«Снежинск»: жадный (greedy) алгоритм
ПОСТРОЕНИЕ ФУНКЦИИ
РЕЛЕВАНТНОСТИ
1. Выбор метрики
(«Яндекс на РОМИП’2009»: pfound – максимизация
вероятности найти релевантный результат;
«Снежинск»: минимизация невязок между измеренными
и вычисленными значениями релевантности)
3. Подбор вида функции
(«Яндекс на РОМИП’2009»: полином)
4. Подбор коэффициентов
СХЕМА ОБУЧАЮЩЕГО АЛГОРИТМА
Обучающи
е данные
(q(i), dj(i)
),
i=1,…,n;
j=1,…m(n).
Определение
значений
факторов
Асессоры
Обучающий
алгоритм
Ранжирующий
алгоритм
F(q(i), dj(i
))
Rel(q(i), dj(i
))
Fr(F(q,d))
Тестовые
данные
(q, dj),
j=1,…,m
Fr(F(q, dj))
Определение
значений
факторов
F(q, dj)
РЕГИОНАЛЬНЫЕ ФОРМУЛЫ
Отдельные функции релевантности:
•19 городов России: Москва, Санкт-Петербург,
Екатеринбург, Новосибирск и др.
•Общероссийская
•Украина
•Белоруссия
•Казахстан
Отличаться могут не только коэффициенты, но и сам
вид функций!
ИССЛЕДОВАНИЕ ФУНКЦИИ
РЕЛЕВАНТНОСТИ
Постановка эксперимента
Выбор исследуемого фактора
Генерация тестовых коллекций
Варьирование исследуемого фактора
Фиксация остальных факторов
Индексация тестовых коллекций
Анализ результатов
Принятие решения о характере влияния исследуемого
фактора на функцию релевантности
БЕЛОРУССКАЯ ФОРМУЛА
Фактор: Количество употреблений термина запроса (tf)
Характер зависимости: Прямая
Фактор: Длина документа в словах
Характер зависимости:
Однословные запросы – прямая
Двухсловные запросы – обратная
Трехсловные запросы – не установлена
БЕЛОРУССКАЯ ФОРМУЛА
Фактор: Количество употреблений самого частотного
термина
Характер зависимости:
Однословные запросы – обратная
Двухсловные и трехсловные запросы – прямая

More Related Content

Viewers also liked

план подготовки защитного слова к дипломной работе теоретического
план подготовки защитного слова к дипломной работе теоретическогоплан подготовки защитного слова к дипломной работе теоретического
план подготовки защитного слова к дипломной работе теоретическогоElvina Amineva
 
Интеграция электронных образовательных и научных информационных ресурсов БНТУ...
Интеграция электронных образовательных и научных информационных ресурсов БНТУ...Интеграция электронных образовательных и научных информационных ресурсов БНТУ...
Интеграция электронных образовательных и научных информационных ресурсов БНТУ...Alexey Skalaban
 
Технологии создания, описания и хранения образовательных ресурсов
Технологии создания, описания и хранения образовательных ресурсовТехнологии создания, описания и хранения образовательных ресурсов
Технологии создания, описания и хранения образовательных ресурсовDmitry Zolotov
 
Основы разработки электронных образовательных ресурсов
Основы разработки электронных образовательных ресурсовОсновы разработки электронных образовательных ресурсов
Основы разработки электронных образовательных ресурсовAleksander Zharikov
 
Каталог мультимедийных образовательных ресурсов
Каталог мультимедийных образовательных ресурсовКаталог мультимедийных образовательных ресурсов
Каталог мультимедийных образовательных ресурсовobstinate
 
Сравнение методов оценки качества поиска — Роман Поборчий, Яндекс
Сравнение методов оценки качества поиска — Роман Поборчий, ЯндексСравнение методов оценки качества поиска — Роман Поборчий, Яндекс
Сравнение методов оценки качества поиска — Роман Поборчий, ЯндексYandex
 
электронная среда образовательного учреждения
электронная среда образовательного учрежденияэлектронная среда образовательного учреждения
электронная среда образовательного учрежденияNightChildBarbie
 
ЭБС в системе электронных образовательных ресурсов. Понятия и определения.
ЭБС в системе электронных образовательных ресурсов. Понятия и определения. ЭБС в системе электронных образовательных ресурсов. Понятия и определения.
ЭБС в системе электронных образовательных ресурсов. Понятия и определения. Pavel Kallinikov
 
Презентация к дипломной работе
Презентация к дипломной работеПрезентация к дипломной работе
Презентация к дипломной работеBekshanskiy
 
презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)
презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)
презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)TalkaKvasova
 

Viewers also liked (13)

Chernyak_defense
Chernyak_defenseChernyak_defense
Chernyak_defense
 
вводное занятие
вводное занятиевводное занятие
вводное занятие
 
план подготовки защитного слова к дипломной работе теоретического
план подготовки защитного слова к дипломной работе теоретическогоплан подготовки защитного слова к дипломной работе теоретического
план подготовки защитного слова к дипломной работе теоретического
 
ито троицк-2014 1презентация-pptx
ито троицк-2014 1презентация-pptxито троицк-2014 1презентация-pptx
ито троицк-2014 1презентация-pptx
 
Интеграция электронных образовательных и научных информационных ресурсов БНТУ...
Интеграция электронных образовательных и научных информационных ресурсов БНТУ...Интеграция электронных образовательных и научных информационных ресурсов БНТУ...
Интеграция электронных образовательных и научных информационных ресурсов БНТУ...
 
Технологии создания, описания и хранения образовательных ресурсов
Технологии создания, описания и хранения образовательных ресурсовТехнологии создания, описания и хранения образовательных ресурсов
Технологии создания, описания и хранения образовательных ресурсов
 
Основы разработки электронных образовательных ресурсов
Основы разработки электронных образовательных ресурсовОсновы разработки электронных образовательных ресурсов
Основы разработки электронных образовательных ресурсов
 
Каталог мультимедийных образовательных ресурсов
Каталог мультимедийных образовательных ресурсовКаталог мультимедийных образовательных ресурсов
Каталог мультимедийных образовательных ресурсов
 
Сравнение методов оценки качества поиска — Роман Поборчий, Яндекс
Сравнение методов оценки качества поиска — Роман Поборчий, ЯндексСравнение методов оценки качества поиска — Роман Поборчий, Яндекс
Сравнение методов оценки качества поиска — Роман Поборчий, Яндекс
 
электронная среда образовательного учреждения
электронная среда образовательного учрежденияэлектронная среда образовательного учреждения
электронная среда образовательного учреждения
 
ЭБС в системе электронных образовательных ресурсов. Понятия и определения.
ЭБС в системе электронных образовательных ресурсов. Понятия и определения. ЭБС в системе электронных образовательных ресурсов. Понятия и определения.
ЭБС в системе электронных образовательных ресурсов. Понятия и определения.
 
Презентация к дипломной работе
Презентация к дипломной работеПрезентация к дипломной работе
Презентация к дипломной работе
 
презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)
презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)
презентация на предзащиту и защиту вкр (пишем диплом-сами.рф)
 

Similar to Optimisation by людкевич

людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013ositnikova
 
людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013ositnikova
 
20131105 романенко
20131105 романенко20131105 романенко
20131105 романенкоYandex
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 finalyaevents
 
Факторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринФакторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринNikolay Khivrin
 
20131112федорроманенко
20131112федорроманенко20131112федорроманенко
20131112федорроманенкоYandex
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснетаyaevents
 
минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевичositnikova
 
Webmaster tools in Yandex 2011 (Kazan, Kharkov), Mikhail Senin, Alex Shubin
Webmaster tools in Yandex 2011 (Kazan, Kharkov),  Mikhail Senin, Alex ShubinWebmaster tools in Yandex 2011 (Kazan, Kharkov),  Mikhail Senin, Alex Shubin
Webmaster tools in Yandex 2011 (Kazan, Kharkov), Mikhail Senin, Alex ShubinAlex Shubin
 
казань 2011-людкевич
казань 2011-людкевичказань 2011-людкевич
казань 2011-людкевичositnikova
 
Владимир Лучанинов. Сделай сам анализатор SERP
Владимир Лучанинов. Сделай сам анализатор SERPВладимир Лучанинов. Сделай сам анализатор SERP
Владимир Лучанинов. Сделай сам анализатор SERPOctopus Events
 
20120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-0420120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-04Computer Science Club
 
Инструменты для технического анализа сайта
Инструменты для технического анализа сайтаИнструменты для технического анализа сайта
Инструменты для технического анализа сайтаNetpeak
 
IT-рекрутинг: в поисках лучших
IT-рекрутинг: в поисках лучших IT-рекрутинг: в поисках лучших
IT-рекрутинг: в поисках лучших IT-Доминанта
 
екб 2012-людкевич
екб 2012-людкевичекб 2012-людкевич
екб 2012-людкевичositnikova
 
SEO плагины - Антон Иванов
SEO плагины - Антон ИвановSEO плагины - Антон Иванов
SEO плагины - Антон ИвановAnton Ivanov
 

Similar to Optimisation by людкевич (20)

людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013
 
людкевич кибориф-2013
людкевич кибориф-2013людкевич кибориф-2013
людкевич кибориф-2013
 
20131105 романенко
20131105 романенко20131105 романенко
20131105 романенко
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
 
Факторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай ХивринФакторы ранжирования Яндекс, Николай Хиврин
Факторы ранжирования Яндекс, Николай Хиврин
 
20131112федорроманенко
20131112федорроманенко20131112федорроманенко
20131112федорроманенко
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснета
 
минск 2011-людкевич
минск 2011-людкевичминск 2011-людкевич
минск 2011-людкевич
 
Webmaster tools in Yandex 2011 (Kazan, Kharkov), Mikhail Senin, Alex Shubin
Webmaster tools in Yandex 2011 (Kazan, Kharkov),  Mikhail Senin, Alex ShubinWebmaster tools in Yandex 2011 (Kazan, Kharkov),  Mikhail Senin, Alex Shubin
Webmaster tools in Yandex 2011 (Kazan, Kharkov), Mikhail Senin, Alex Shubin
 
казань 2011-людкевич
казань 2011-людкевичказань 2011-людкевич
казань 2011-людкевич
 
Владимир Лучанинов. Сделай сам анализатор SERP
Владимир Лучанинов. Сделай сам анализатор SERPВладимир Лучанинов. Сделай сам анализатор SERP
Владимир Лучанинов. Сделай сам анализатор SERP
 
Информационный поиск. Методы оценки качества поиска. Эволюция результатов
Информационный поиск. Методы оценки качества поиска. Эволюция результатовИнформационный поиск. Методы оценки качества поиска. Эволюция результатов
Информационный поиск. Методы оценки качества поиска. Эволюция результатов
 
20120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-0420120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-04
 
Инструменты для технического анализа сайта
Инструменты для технического анализа сайтаИнструменты для технического анализа сайта
Инструменты для технического анализа сайта
 
Ruwikt
RuwiktRuwikt
Ruwikt
 
code4russia
code4russiacode4russia
code4russia
 
IT-рекрутинг: в поисках лучших
IT-рекрутинг: в поисках лучших IT-рекрутинг: в поисках лучших
IT-рекрутинг: в поисках лучших
 
екб 2012-людкевич
екб 2012-людкевичекб 2012-людкевич
екб 2012-людкевич
 
SEO плагины - Антон Иванов
SEO плагины - Антон ИвановSEO плагины - Антон Иванов
SEO плагины - Антон Иванов
 
в вики Netpromoter2010 ludkevich
в вики Netpromoter2010 ludkevichв вики Netpromoter2010 ludkevich
в вики Netpromoter2010 ludkevich
 

More from ositnikova

Optimization 2012-людкевич
Optimization 2012-людкевичOptimization 2012-людкевич
Optimization 2012-людкевичositnikova
 
Optimization 2011-людкевич
Optimization 2011-людкевичOptimization 2011-людкевич
Optimization 2011-людкевичositnikova
 
Minsk 2012-людкевич
Minsk 2012-людкевичMinsk 2012-людкевич
Minsk 2012-людкевичositnikova
 
Lyudkevich kazan-2012
Lyudkevich kazan-2012Lyudkevich kazan-2012
Lyudkevich kazan-2012ositnikova
 

More from ositnikova (6)

Doklad
DokladDoklad
Doklad
 
Optimization 2012-людкевич
Optimization 2012-людкевичOptimization 2012-людкевич
Optimization 2012-людкевич
 
Optimization 2011-людкевич
Optimization 2011-людкевичOptimization 2011-людкевич
Optimization 2011-людкевич
 
Minsk 2012-людкевич
Minsk 2012-людкевичMinsk 2012-людкевич
Minsk 2012-людкевич
 
Lyudkevich kazan-2012
Lyudkevich kazan-2012Lyudkevich kazan-2012
Lyudkevich kazan-2012
 
Ludkiewicz
LudkiewiczLudkiewicz
Ludkiewicz
 

Optimisation by людкевич

  • 1. •Особенности регионального ранжирования Яндекса. Белорусская формула •Сергей ЛЮДКЕВИЧ, начальник отдела исследований и аналитики Особенности регионального ранжирования Яндекса. Белорусская формула СЕРГЕЙ ЛЮДКЕВИЧ ЖИВАЯ ЛЕГЕНДА SEO. EX-TECHART, EX-BDBD, EX-WEBEFFECTOR. Supermoderator форума searchengines.ru Образование:Тульский государственный университет, кафедра "Прикладная математика", аспирантура, к.т.н. Опыт поискового продвижения: с 2000 года. Постоянный докладчик и участник круглых столов отраслевых конференций по продвижению сайтов в России, Украине и Белоруссии. Сфера профессиональных интересов – исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.
  • 2. ТЕКУЩИЙ АЛГОРИТМ. МАШИННОЕ ОБУЧЕНИЕ Обучающие данные Набор запросов q(i) Набор документов dj(i) для каждого запроса q(i) Rel(q(i), dj(i)) - ручная оценка соответствия документа запросу Конкурс «Интернет-математика – 2009»: Rel(q, d) - значения из диапазона [0, 4] (4 – «высокая релевантность»,…, 0 – «нерелевантно»)
  • 3. ФАКТОРЫ РАНЖИРОВАНИЯ Набор факторов ранжирования F = (f1(q,d) , …, fN(q,d)) Конкурс «Интернет-математика – 2009»: N=245 «Яндекс на РОМИП’2009»: N=163 (коллекция BY.WEB); N=69 (коллекция KM.RU, без ссылочных факторов) Алгоритм «Снежинск»: N – несколько тысяч
  • 4. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Запросные длина запроса в словах; язык запроса. Текстовые наличие точного вхождения запроса в тексте документа; наличие точного вхождения запроса в заголовке документа; tf*idf; различные модификации формулы Okapi_BM25.
  • 5. ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Ссылочные •PageRank; •логарифм количества ссылок на документ; •процент ссылок на документ, содержащих точное вхождение запроса. Географические •регион сайта; •язык документа.
  • 6. ФУНКЦИЯ РЕЛЕВАНТНОСТИ Числовое соответствие документа запросу Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d)) Методы построения функции релевантности: «Яндекс на РОМИП’2009»: генетический алгоритм «Снежинск»: жадный (greedy) алгоритм
  • 7. ПОСТРОЕНИЕ ФУНКЦИИ РЕЛЕВАНТНОСТИ 1. Выбор метрики («Яндекс на РОМИП’2009»: pfound – максимизация вероятности найти релевантный результат; «Снежинск»: минимизация невязок между измеренными и вычисленными значениями релевантности) 3. Подбор вида функции («Яндекс на РОМИП’2009»: полином) 4. Подбор коэффициентов
  • 8. СХЕМА ОБУЧАЮЩЕГО АЛГОРИТМА Обучающи е данные (q(i), dj(i) ), i=1,…,n; j=1,…m(n). Определение значений факторов Асессоры Обучающий алгоритм Ранжирующий алгоритм F(q(i), dj(i )) Rel(q(i), dj(i )) Fr(F(q,d)) Тестовые данные (q, dj), j=1,…,m Fr(F(q, dj)) Определение значений факторов F(q, dj)
  • 9. РЕГИОНАЛЬНЫЕ ФОРМУЛЫ Отдельные функции релевантности: •19 городов России: Москва, Санкт-Петербург, Екатеринбург, Новосибирск и др. •Общероссийская •Украина •Белоруссия •Казахстан Отличаться могут не только коэффициенты, но и сам вид функций!
  • 10. ИССЛЕДОВАНИЕ ФУНКЦИИ РЕЛЕВАНТНОСТИ Постановка эксперимента Выбор исследуемого фактора Генерация тестовых коллекций Варьирование исследуемого фактора Фиксация остальных факторов Индексация тестовых коллекций Анализ результатов Принятие решения о характере влияния исследуемого фактора на функцию релевантности
  • 11. БЕЛОРУССКАЯ ФОРМУЛА Фактор: Количество употреблений термина запроса (tf) Характер зависимости: Прямая Фактор: Длина документа в словах Характер зависимости: Однословные запросы – прямая Двухсловные запросы – обратная Трехсловные запросы – не установлена
  • 12. БЕЛОРУССКАЯ ФОРМУЛА Фактор: Количество употреблений самого частотного термина Характер зависимости: Однословные запросы – обратная Двухсловные и трехсловные запросы – прямая