10. Как получаем выдачу?
• Релевантность документа.
• Сравнение двух
Фактор-2
документов.
• Всю десятку сразу.
Если бы факторов было мало,
то можно было бы делать так:
Фактор-1
14. Бэггинг
Обучающее множество: 1 2 3 4 5 6 7 8 9 10
Создаём случайные подмножества:
Подмножество #1 1 3 5 7 9 10
Подмножество #2 2 3 6 7 8 9
Подмножество #3 1 2 3 8 9 10
Каждый раз обучаемся на одном из подмножеств.
15. Что в итоге
И не только ранжирование:
• Разбиение на предложения.
• Детектор порнографии.
Поиск • Антиспам.
Машинное
Инструкция Асессоры Алгоритмы
обучение
16. СПАСИБО! ВОПРОСЫ?
Андрей Калинин
руководитель разработки поиска
kalinin@corp.mail.ru