Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Качество поиска: экспертные
оценки и исследование
пользовательского поведения
Ольга Мегорская
Руководитель группы асессоров

Я.Субботник, Алматы, 15 октября 2011 года

Оценка качества поиска

2

Зачем это нужно?

• Как наши внедрения влияют на качество?

• Улучшили по одному классу: не испортили ли по
другому?

• Где есть «проблемные точки»?

3

Что для этого нужно?

• «Человеческие» оценки качества выдачи

• Формальные метрики качества поиска

• Понимание пользователя

4

Экспертные оценки:
асессоры

5

Кто такие асессоры?

• Обычные пользователи

• Есть в каждом регионе присутствия Яндекса

• В Казахстане у нас тоже есть команда

6

Как работают асессоры?

• Случайные запросы из потока

• Документы, нашедшиеся по этим запросам

• Оценки

7

Как работают асессоры?

8

Шкала релевантности

Vital однозначно на первом месте

Useful дает авторитетный, очень полный и полезный
ответ на запрос

Relevant+ отвечает на запрос

Relevant- имеет отношение к запросу, но в полной мере
на запрос не отвечает

Irrelevant не отвечает на запрос
9

Для чего используются оценки
асессоров?

• Настройка поисковых алгоритмов

• Оценка качества поиска

10

Настройка поиска

11

Обучаем робота отличать
хорошие документы от плохих
1. У нас есть набор для обучения – N яблок и M груш.

2. У Робота есть факторы: форма; цвет; вкус

12

Определяем признаки для набора

13

Аналогично с релевантностью
документов:
1. У робота – факторы

2. У нас - оценки асессоров

3. Робот ищет закономерности

4. Для любого неоцененного документа из Веба робот знает
факторы:

Документ Х: Есть слова запроса; на документ кликают; на
документ ссылаются.

Вероятно, Документ Х Релевантен запросу
15

Оценка: метрики качества
поиска

16

Пример метрики: Pfound
• Гипотеза:
• Пользователь идет
сверху вниз
• Останавливается,
если:
Нашел
Устал.
Правильно, левый!

17

Исторический график Pfound
Показывает, как внедрения влияют на качество поиска

Опечаточная
врезка

18

Что не улавливает Pfound?

• Проблему разнообразия выдачи

19

Разнообразие объектов: [Наполеон]

20 artclassic.edu.ru

Разнообразие потребностей:
[Название фильма]

100%
90%
Другое
80%
70% Отзывы/рецензии
60% Кадры/фото
50% Трейлер
40% Общая информация
30%
Смотреть онлайн
20%
Скачать
10%
0%

Старые Фильмы в Будущие
фильмы прокате фильмы

21

Понимание пользователей

22

Исследование
пользовательского поведения:
• Пользовательские сессии

• Переформулировки и клики

• Эксперименты на выдаче

• Классификация запросов

23

Анализ сессий:
Что хотел этот пользователь?

24

Эксперименты на выдаче:

• Выкатываем экспериментальный алгоритм на n%
пользователей

• Смотрим на несколько метрик:
— Доля некликнутых
— Средняя позиция первого клика
— Еще 100500 других

26

Выделение тематик запросов:

• Выбираем интересующие нас группы пользователей

• Составляем автоматический классификатор запросов

• Смотрим на распределение разных тематик запросов
для разных групп пользователей

27

Выделение тематик запросов:
Пользователи Android VS пользователи IPhone

Android

IPhone

28

Битва титанов: Android vs. iPhone :

29

Битва титанов: iPhone vs. Android :

30

Ольга Мегорская
Руководитель группы асессоров

omegorskaya@yandex-team.ru

Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (6)

Similar to Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Similar to Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения" (20)

More from Yandex

More from Yandex (20)

Recently uploaded

Recently uploaded (9)

Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"