Learning to rank: construction of training set.

358 views

Published on

Slides from conference ai-conf.ru (2012).

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
358
On SlideShare
0
From Embeds
0
Number of Embeds
10
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Learning to rank: construction of training set.

  1. 1. Обучение ранжированию:специфика построения обучающегомножестваАлексей Воропаев, Дмитрий Соловьев,Дмитрий Азаренков, Сергей Протасов
  2. 2. Вечный вопрос:Как улучшить ранжирование?Компоненты ранжирования: 1. Факторы 2. Алгоритм построения формулы 3. Обучающее множество 2
  3. 3. Алгоритмы Лидер 0.2% MatrixNet09 0.15% J. Friedman99 Интернет - математика 2009 3
  4. 4. Алгоритмы Lambda-gradient 0.15% Additive Groves 4
  5. 5. Обучающее множество – Система оценок – Качество оценок – Какие запросы/документы брать – Как искать проблемы 5
  6. 6. Система оценок 4 — Обязательная страница 3 — Точный ответ 2 — Полезный 1 — Малополезный 0 — Не по темеОтдельно: порнографичность, географичность, спамовитость и т.д. 6
  7. 7. Система оценок: проблемы [сколько лет Жанне Фриске?] http://vorum.ru/questions/8834
  8. 8. Система оценок: проблемы [сколько лет Жанне Фриске?] Точный? http://vorum.ru/questions/8834
  9. 9. Система оценок: проблемы [сколько лет Жанне Фриске?] Полезная? Точный? http://vorum.ru/questions/8834
  10. 10. Система оценок: проблемы [сколько лет Жанне Фриске?] Полезная? Точный? Малополезная? http://vorum.ru/questions/8834
  11. 11. Система оценок: проблемы [опустынивание в мире] Оптимист Пессимист 11
  12. 12. Система оценок: проблемы Асессор устал
  13. 13. Система оценок: проблемы [cтреляющая боль в голове] Точный ответ
  14. 14. Качество оценок - Наличие кросс-валидации - Стоимость оценки - Регулярные тренировки - Детектор ошибок
  15. 15. Кластеризация: SOM Self Organized Map Самоорганизующиеся карты Кохонена
  16. 16. Первая оценка Переоценка 16
  17. 17. 5% перепроверок 17
  18. 18. Какие документы оценивать? – Минимум оценок – Оптимальное разделение классов – Репрезентативность Burr Settles, Active Learning Literature Survey, 2010
  19. 19. Кто выпадаетиз кластера?- Скорость?!- Границы?- Кого выкинуть?
  20. 20. Active learning - QBag Burr Settles, Active Learning Literature Survey, 2010
  21. 21. Active learning - QBag K.Dwyer, R.Holte, Decision Tree Instability and Active Learning, 2007
  22. 22. Active learning - QBag K.Dwyer, R.Holte, Decision Tree Instability and Active Learning, 2007
  23. 23. Спасибо!Бета версия поиска: http://O.GO.mail.ru/

×