15 октября 2011, Я.Субботник в Алматы
Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"
О докладе:
Что такое хороший поиск? Как измерить качество поиска? Как понять, что именно хотел пользователь? Мы постоянно ищем ответы на эти вопросы, придумываем новые метрики, отражающие различные аспекты качества поиска. Огромную роль в этой работе играют экспертные оценки асессоров – обычных людей, которые с точки зрения пользователя оценивают, насколько хорошо найденные документы отвечают на потребность, выраженную в поисковом запросе. Этот доклад призван рассказать, кто такие асессоры Яндекса, как они работают и как используются их оценки. Кроме того, мы постараемся рассказать, как мы пытаемся понять, что на самом деле имел в виду пользователь, задавая тот или иной запрос, и какие методы анализа пользовательского поведения мы используем.
ИСТОЧНИКИ ИННОВАЦИОННОСТИ КИТАЯ (ПО ВЕРСИИ DGAP) | The Sources of China’s Inn...
Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"
1. Качество поиска: экспертные
оценки и исследование
пользовательского поведения
Ольга Мегорская
Руководитель группы асессоров
Я.Субботник, Алматы, 15 октября 2011 года
9. Шкала релевантности
Vital однозначно на первом месте
Useful дает авторитетный, очень полный и полезный
ответ на запрос
Relevant+ отвечает на запрос
Relevant- имеет отношение к запросу, но в полной мере
на запрос не отвечает
Irrelevant не отвечает на запрос
9
10. Для чего используются оценки
асессоров?
• Настройка поисковых алгоритмов
• Оценка качества поиска
10
12. Обучаем робота отличать
хорошие документы от плохих
1. У нас есть набор для обучения – N яблок и M груш.
2. У Робота есть факторы: форма; цвет; вкус
12
15. Аналогично с релевантностью
документов:
1. У робота – факторы
2. У нас - оценки асессоров
3. Робот ищет закономерности
4. Для любого неоцененного документа из Веба робот знает
факторы:
Документ Х: Есть слова запроса; на документ кликают; на
документ ссылаются.
Вероятно, Документ Х Релевантен запросу
15
21. Разнообразие потребностей:
[Название фильма]
100%
90%
Другое
80%
70% Отзывы/рецензии
60% Кадры/фото
50% Трейлер
40% Общая информация
30%
Смотреть онлайн
20%
Скачать
10%
0%
Старые Фильмы в Будущие
фильмы прокате фильмы
21
26. Эксперименты на выдаче:
• Выкатываем экспериментальный алгоритм на n%
пользователей
• Смотрим на несколько метрик:
— Доля некликнутых
— Средняя позиция первого клика
— Еще 100500 других
26
27. Выделение тематик запросов:
• Выбираем интересующие нас группы пользователей
• Составляем автоматический классификатор запросов
• Смотрим на распределение разных тематик запросов
для разных групп пользователей
27