SlideShare a Scribd company logo
1 of 35
Download to read offline
Российский семинар по
оценке методов
информационного поиска
Четвёркин Илья
ВМК МГУ
РОМИП
• Целью семинара является создание плацдарма
для проведения независимой оценки методов
информационного поиска, ориентированных на
работу с русскоязычной информацией, а также
консолидация сообщества российских
исследователей и разработчиков, занимающихся
информационным поиском.
Аналогичные конференции на западе – TREC, CLEF
РОМИП проводится с 2003г.
План
• Задачи связанные с текстом
– Текстовый поиск
– Текстовая классификация
– Контекстно-зависимое аннотирование
• Задачи связанные с изображением
– Поиск изображений по образцу
– Выявление нечетких дубликатов изображений
– Построение текстовых меток для изображений
• Тестирование простой ранжирующей
формулы
РОМИП 2010 в фактах
• Объявлено 15 дорожек, состоялось 9;
• 22 участника, 12 финишировало и сдало 63
прогона;
• 2+ оценки для всех заданий;
• 1800 человеко-часов, 24 асессора;
Задачи на РОМИП
Текстовый поиск
Текстовая классификация
Контекстно-зависимое аннотирование
Текстовый поиск
• Задача поиска по запросу
• Две коллекции: By.Web и KM.RU
• By.Web
– 550 запросов
– Глубина пула 20 документов
• KM.RU
– 100 запросов
– Глубина пула 50 документов
Текстовый поиск
• Описание запроса – понимание того, что
искал пользователь и какие ответы ему
полезны
• Типы ответов
– Идеальный ( дальше можно не искать)
– Релевантный+ ( полезная но не
исчерпывающая информация, один из многих)
– Релевантный- ( кусочки полезной информации,
не авторитетный источник)
Текстовый поиск
Запрос: мультик падал прошлогодний снег
Описание: Цель – найти мультик или детальную
информацию о нем. Идеальный ответ –
подробная информация о мультике или
страница с видео.
Релевантный+ - ссылка на страницу с видео.
Релевантный- - картинки/фотографии или музыка
из мультика, отдельные факты о мультике.
Задачи на РОМИП
Текстовый поиск
Текстовая классификация
Контекстно-зависимое аннотирование
Текстовая классификация
• Веб сайты
– Коллекция DMOZ
– Оценка методом общего котла
– 20 категорий, 4000 пар сайт-категория для
оценки
• Веб страницы
Контекстно-зависимое
аннотирование
• Составление аннотации документа по запросу
– Запрос: когда состоялась Куликовская битва
Аннотация1: ... на поле Куликовской битвы осталось...
Аннотация2: ... Куликовской битвы, которая состоялась в
1380...
Аннотация 3..... Куликовском ... битва ... месяц ...
• Для оценки отобраны только релевантные
документы
• Оценивается информативность, читабельность
Задачи на РОМИП
Поиск изображений по образцу
Выявление нечетких дубликатов
изображений
Построение текстовых меток для
изображений
Поиск изображений по образцу
• Необходимо отобрать изображения,
похожие на образец визуально и
семантически.
• Коллекция изображений Flickr, 250
изображений образцов.
• Оценка тремя асессорами (and, or, vote)
– Очень похожи
– Отдаленно близки
– Непохожи
Виды изображений
• Картинки с доминирующим объектом
Виды изображений
• Картинки с небольшим числом объектов
образующих композицию
Виды изображений
• Пейзажи
Задачи на РОМИП
Поиск изображений по образцу
Выявление нечетких дубликатов
изображений
Построение текстовых меток для
изображений
Выявление нечетких дубликатов
• Коллекция состоит из случайных кадров
нарезанных из 15 часов видеоматериала.
• Дубликаты это такие изображения как:
– Сделанные в разных условиях или разного
качества
– Снятые в разном масштабе или с разных точек
Задачи на РОМИП
Поиск изображений по образцу
Выявление нечетких дубликатов
изображений
Построение текстовых меток для
изображений
Построение текстовых меток по
изображению
• Необходимо сопоставить каждому
изображению набор меток
• Высокая согласованность асессоров и
точность прогона участника
Тестирование простой
ранжирующей формулы
Яндекс
Сафронов Александр
Алгоритм ранжирования
𝑆𝑐𝑜𝑟𝑒 (𝑑,𝑞) = ∑𝑘𝑖∗𝐹𝑖 (𝑑,𝑞)
Где:
𝑆𝑐𝑜𝑟𝑒(𝑑,𝑞) – итоговый вес документа 𝑑 по
запросу 𝑞;
𝐹𝑖(𝑑,𝑞) – i-й фактор;
𝑘𝑖 – вес i-го фактора.
Факторы
1. BM25 для полного текста документа ;
2. BM25 заголовка документа;
3. BM25 начальной части документа;
4. Вес самой длинной непрерывной цепочки слов запроса в
документе;
5. «Кучность» слов запроса в тексте документа на основе
фактора, описанного в работе ;
6. YMW. Фактор на основе размера минимального окна,
включающего максимальное количество встречающихся
в документе слов запроса.
BM25
freqD(l) – частота леммы l в
документе
dlD – мера длинны
документа
avg_dl – средняя длина
документа
|c| - количество
документов в коллекции
df(l) – количество
документов, где
встретилась l
«Кучность»
Пример вычисления
• Запрос: Русская православная церковь
• Найденный документ: … Московская Патриархия
была признана как единственная законная
православная Церковь в СССР (без Грузии) всеми
прочими поместными православными
Церквами…
tc(d, православная, pos) = idf(церковь)1 * 1 +
idf(православными)  9^1.75 * 0.25
Суммарная кучность
Общая оценка взаимной близости слов
Фактор YMW
Пример вычисления
• Запрос: Сююмбике Казань
• Документ в выдаче: … Башня Сююмбике
является признанным архитектурным
символом Казани…
YMV(d,q) = log(a)log( 6 – 2 + a)
Результаты
• На РОМИП-2009 в результате тестирования
метода без YMW, показатели при оценке с
сильными требованиями к релевантности
по average precision дали второй результат,
отстав от лидера на 1,8%.
• Со слабыми требованиями к релевантности
метод продемонстрировал самый высокий
результат по average precision, превысив
результат следующего участника на 13%.
Результаты
Заключение
• Уменьшение количества участников
(временное?)
• Тем не менее:
– Появляются новые команды
– Появляются новые дорожки
– Обновились инструменты и методология оценки,
выросло качество
Заключение
• Большое количество работы в будущем
– Создание и разметка новых коллекций
– Привлечение и популяризация РОМИПа
– Автоматизация процесса
• РОМИП – это реальный шанс проверить
свои идеи на реальных данных!
Вопросы?

More Related Content

Viewers also liked

Viewers also liked (20)

Автоматическое составление обзорного реферата на основе кластеризации предлож...
Автоматическое составление обзорного реферата на основе кластеризации предлож...Автоматическое составление обзорного реферата на основе кластеризации предлож...
Автоматическое составление обзорного реферата на основе кластеризации предлож...
 
Быстрое вычисление булевских выражений. Алгоритм Unison
Быстрое вычисление булевских выражений. Алгоритм UnisonБыстрое вычисление булевских выражений. Алгоритм Unison
Быстрое вычисление булевских выражений. Алгоритм Unison
 
Объектная модель многофункциональных словарей
Объектная модель многофункциональных словарейОбъектная модель многофункциональных словарей
Объектная модель многофункциональных словарей
 
Модули автоматической обработки текстов в проекте aot.ru
Модули автоматической обработки текстов в проекте aot.ruМодули автоматической обработки текстов в проекте aot.ru
Модули автоматической обработки текстов в проекте aot.ru
 
Механизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстовМеханизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстов
 
Автоматический анализ текста для аннотирования изображения
Автоматический анализ текста для аннотирования изображенияАвтоматический анализ текста для аннотирования изображения
Автоматический анализ текста для аннотирования изображения
 
Фвтоматическая кластеризация значений многозначных слов
Фвтоматическая кластеризация значений многозначных словФвтоматическая кластеризация значений многозначных слов
Фвтоматическая кластеризация значений многозначных слов
 
Экспертная система по конструированию и моделированию швейных изделий
Экспертная система по конструированию и моделированию швейных изделийЭкспертная система по конструированию и моделированию швейных изделий
Экспертная система по конструированию и моделированию швейных изделий
 
Основные научные направления ИИ
Основные научные направления ИИОсновные научные направления ИИ
Основные научные направления ИИ
 
нс2
нс2нс2
нс2
 
Программная поддержка морфемного словаря
Программная поддержка морфемного словаряПрограммная поддержка морфемного словаря
Программная поддержка морфемного словаря
 
Системы автоматического составления обзорных рефератов
Системы автоматического составления обзорных рефератовСистемы автоматического составления обзорных рефератов
Системы автоматического составления обзорных рефератов
 
KEOD-2010
KEOD-2010KEOD-2010
KEOD-2010
 
Система поддержки исследований семантики паремий
Система поддержки исследований семантики паремийСистема поддержки исследований семантики паремий
Система поддержки исследований семантики паремий
 
Программные средства поддержки словаря буквенных и морфемных паронимов
Программные средства поддержки словаря буквенных и морфемных паронимовПрограммные средства поддержки словаря буквенных и морфемных паронимов
Программные средства поддержки словаря буквенных и морфемных паронимов
 
Средства автоматической интеграции разнородных онтологий
Средства автоматической интеграции разнородных онтологийСредства автоматической интеграции разнородных онтологий
Средства автоматической интеграции разнородных онтологий
 
Проблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстовПроблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстов
 
Вопросно-ответный поиск
Вопросно-ответный поискВопросно-ответный поиск
Вопросно-ответный поиск
 
Реализация метода автоматического разрешения лексической многозначности
Реализация метода автоматического разрешения лексической многозначностиРеализация метода автоматического разрешения лексической многозначности
Реализация метода автоматического разрешения лексической многозначности
 
Интегрированная среда разработки для функционального языка Refal
Интегрированная среда разработки для функционального языка RefalИнтегрированная среда разработки для функционального языка Refal
Интегрированная среда разработки для функционального языка Refal
 

Similar to РОМИП

Генерация вопросов к тексту
Генерация вопросов к текстуГенерация вопросов к тексту
Генерация вопросов к текстуIdris Yusupov
 
Конкурентная Разведка в Интернете
Конкурентная Разведка в ИнтернетеКонкурентная Разведка в Интернете
Конкурентная Разведка в ИнтернетеPositive Hack Days
 
для отчета
для отчетадля отчета
для отчетаlibraryMSU
 
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...Max Kornev
 

Similar to РОМИП (6)

Информационный поиск. Методы оценки качества поиска. Эволюция результатов
Информационный поиск. Методы оценки качества поиска. Эволюция результатовИнформационный поиск. Методы оценки качества поиска. Эволюция результатов
Информационный поиск. Методы оценки качества поиска. Эволюция результатов
 
Генерация вопросов к тексту
Генерация вопросов к текстуГенерация вопросов к тексту
Генерация вопросов к тексту
 
Конкурентная Разведка в Интернете
Конкурентная Разведка в ИнтернетеКонкурентная Разведка в Интернете
Конкурентная Разведка в Интернете
 
для отчета
для отчетадля отчета
для отчета
 
Методы обработки длинных запросов поисковыми системами
Методы обработки длинных запросов поисковыми системамиМетоды обработки длинных запросов поисковыми системами
Методы обработки длинных запросов поисковыми системами
 
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
 

More from Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ

More from Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ (20)

Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
 
Муромцев. Методы анализа социальных графов и поиска сообществ
Муромцев. Методы анализа социальных графов и поиска сообществМуромцев. Методы анализа социальных графов и поиска сообществ
Муромцев. Методы анализа социальных графов и поиска сообществ
 
Рой. Аспектный анализ тональности отзывов
Рой. Аспектный анализ тональности отзывов Рой. Аспектный анализ тональности отзывов
Рой. Аспектный анализ тональности отзывов
 
Котиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератовКотиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератов
 
Лукьяненко. Извлечение коллокаций из текста
Лукьяненко. Извлечение коллокаций из текстаЛукьяненко. Извлечение коллокаций из текста
Лукьяненко. Извлечение коллокаций из текста
 
Иванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателейИванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателей
 
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
 
Сапин. Интеллектуальные агенты и обучение с подкреплением
Сапин. Интеллектуальные агенты и обучение с подкреплениемСапин. Интеллектуальные агенты и обучение с подкреплением
Сапин. Интеллектуальные агенты и обучение с подкреплением
 
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстовСмолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
 
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
 
Тодуа. Сериализация и язык YAML
Тодуа. Сериализация и язык YAMLТодуа. Сериализация и язык YAML
Тодуа. Сериализация и язык YAML
 
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
 
Савостин. Системы и методы научного поиска и мониторинга
Савостин. Системы и методы научного поиска и мониторингаСавостин. Системы и методы научного поиска и мониторинга
Савостин. Системы и методы научного поиска и мониторинга
 
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.
 
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
 
Панфилов. Корпусы текстов и принципы их создания
Панфилов. Корпусы текстов и принципы их созданияПанфилов. Корпусы текстов и принципы их создания
Панфилов. Корпусы текстов и принципы их создания
 
Муромцев. Обзор библиографических менеджеров
Муромцев. Обзор библиографических менеджеровМуромцев. Обзор библиографических менеджеров
Муромцев. Обзор библиографических менеджеров
 
Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.
 
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
 
Баев Системы для обучения программированию
Баев Системы для обучения программированиюБаев Системы для обучения программированию
Баев Системы для обучения программированию
 

РОМИП

  • 1. Российский семинар по оценке методов информационного поиска Четвёркин Илья ВМК МГУ
  • 2. РОМИП • Целью семинара является создание плацдарма для проведения независимой оценки методов информационного поиска, ориентированных на работу с русскоязычной информацией, а также консолидация сообщества российских исследователей и разработчиков, занимающихся информационным поиском. Аналогичные конференции на западе – TREC, CLEF РОМИП проводится с 2003г.
  • 3. План • Задачи связанные с текстом – Текстовый поиск – Текстовая классификация – Контекстно-зависимое аннотирование • Задачи связанные с изображением – Поиск изображений по образцу – Выявление нечетких дубликатов изображений – Построение текстовых меток для изображений • Тестирование простой ранжирующей формулы
  • 4. РОМИП 2010 в фактах • Объявлено 15 дорожек, состоялось 9; • 22 участника, 12 финишировало и сдало 63 прогона; • 2+ оценки для всех заданий; • 1800 человеко-часов, 24 асессора;
  • 5. Задачи на РОМИП Текстовый поиск Текстовая классификация Контекстно-зависимое аннотирование
  • 6. Текстовый поиск • Задача поиска по запросу • Две коллекции: By.Web и KM.RU • By.Web – 550 запросов – Глубина пула 20 документов • KM.RU – 100 запросов – Глубина пула 50 документов
  • 7. Текстовый поиск • Описание запроса – понимание того, что искал пользователь и какие ответы ему полезны • Типы ответов – Идеальный ( дальше можно не искать) – Релевантный+ ( полезная но не исчерпывающая информация, один из многих) – Релевантный- ( кусочки полезной информации, не авторитетный источник)
  • 8. Текстовый поиск Запрос: мультик падал прошлогодний снег Описание: Цель – найти мультик или детальную информацию о нем. Идеальный ответ – подробная информация о мультике или страница с видео. Релевантный+ - ссылка на страницу с видео. Релевантный- - картинки/фотографии или музыка из мультика, отдельные факты о мультике.
  • 9. Задачи на РОМИП Текстовый поиск Текстовая классификация Контекстно-зависимое аннотирование
  • 10. Текстовая классификация • Веб сайты – Коллекция DMOZ – Оценка методом общего котла – 20 категорий, 4000 пар сайт-категория для оценки • Веб страницы
  • 11. Контекстно-зависимое аннотирование • Составление аннотации документа по запросу – Запрос: когда состоялась Куликовская битва Аннотация1: ... на поле Куликовской битвы осталось... Аннотация2: ... Куликовской битвы, которая состоялась в 1380... Аннотация 3..... Куликовском ... битва ... месяц ... • Для оценки отобраны только релевантные документы • Оценивается информативность, читабельность
  • 12. Задачи на РОМИП Поиск изображений по образцу Выявление нечетких дубликатов изображений Построение текстовых меток для изображений
  • 13. Поиск изображений по образцу • Необходимо отобрать изображения, похожие на образец визуально и семантически. • Коллекция изображений Flickr, 250 изображений образцов. • Оценка тремя асессорами (and, or, vote) – Очень похожи – Отдаленно близки – Непохожи
  • 14. Виды изображений • Картинки с доминирующим объектом
  • 15. Виды изображений • Картинки с небольшим числом объектов образующих композицию
  • 17.
  • 18. Задачи на РОМИП Поиск изображений по образцу Выявление нечетких дубликатов изображений Построение текстовых меток для изображений
  • 19. Выявление нечетких дубликатов • Коллекция состоит из случайных кадров нарезанных из 15 часов видеоматериала. • Дубликаты это такие изображения как: – Сделанные в разных условиях или разного качества – Снятые в разном масштабе или с разных точек
  • 20. Задачи на РОМИП Поиск изображений по образцу Выявление нечетких дубликатов изображений Построение текстовых меток для изображений
  • 21. Построение текстовых меток по изображению • Необходимо сопоставить каждому изображению набор меток • Высокая согласованность асессоров и точность прогона участника
  • 23. Алгоритм ранжирования 𝑆𝑐𝑜𝑟𝑒 (𝑑,𝑞) = ∑𝑘𝑖∗𝐹𝑖 (𝑑,𝑞) Где: 𝑆𝑐𝑜𝑟𝑒(𝑑,𝑞) – итоговый вес документа 𝑑 по запросу 𝑞; 𝐹𝑖(𝑑,𝑞) – i-й фактор; 𝑘𝑖 – вес i-го фактора.
  • 24. Факторы 1. BM25 для полного текста документа ; 2. BM25 заголовка документа; 3. BM25 начальной части документа; 4. Вес самой длинной непрерывной цепочки слов запроса в документе; 5. «Кучность» слов запроса в тексте документа на основе фактора, описанного в работе ; 6. YMW. Фактор на основе размера минимального окна, включающего максимальное количество встречающихся в документе слов запроса.
  • 25. BM25 freqD(l) – частота леммы l в документе dlD – мера длинны документа avg_dl – средняя длина документа |c| - количество документов в коллекции df(l) – количество документов, где встретилась l
  • 27. Пример вычисления • Запрос: Русская православная церковь • Найденный документ: … Московская Патриархия была признана как единственная законная православная Церковь в СССР (без Грузии) всеми прочими поместными православными Церквами… tc(d, православная, pos) = idf(церковь)1 * 1 + idf(православными) 9^1.75 * 0.25
  • 28. Суммарная кучность Общая оценка взаимной близости слов
  • 30. Пример вычисления • Запрос: Сююмбике Казань • Документ в выдаче: … Башня Сююмбике является признанным архитектурным символом Казани… YMV(d,q) = log(a)log( 6 – 2 + a)
  • 31. Результаты • На РОМИП-2009 в результате тестирования метода без YMW, показатели при оценке с сильными требованиями к релевантности по average precision дали второй результат, отстав от лидера на 1,8%. • Со слабыми требованиями к релевантности метод продемонстрировал самый высокий результат по average precision, превысив результат следующего участника на 13%.
  • 33. Заключение • Уменьшение количества участников (временное?) • Тем не менее: – Появляются новые команды – Появляются новые дорожки – Обновились инструменты и методология оценки, выросло качество
  • 34. Заключение • Большое количество работы в будущем – Создание и разметка новых коллекций – Привлечение и популяризация РОМИПа – Автоматизация процесса • РОМИП – это реальный шанс проверить свои идеи на реальных данных!