002умнов

. . . . . .
Машинное обучение в Поиске и
других задачах
Умнов Алексей

. . . . . .
Поиск в интернете

. . . . . .
Поиск в интернете
..........
мама
.
рама
.
мыть
.
мыть

. . . . . .
Ранжирование
.........

. . . . . .
Примеры задач машинного
обучения

. . . . . .
Фильтрация спама

. . . . . .
Дано:
Электронное письмо

. . . . . .
Дано:
Адрес отправителя
Тема письма
Текст письма
Файлы письма

. . . . . .
Дано:
Адрес отправителя
Тема письма
Текст письма
Файлы письма
Необходимо:
Определить, является ли данное письмо спамом.

. . . . . .
Медицинская диагностика

. . . . . .
Дано:
Пациент

. . . . . .
Дано:
Пациент
Общие данные
пол, возраст
Результаты обследований
температура, пульс
Симптомы
наличие головной боли

. . . . . .
Дано:
Пациент
Общие данные
пол, возраст
Результаты обследований
температура, пульс
Симптомы
наличие головной боли
Определить, болен ли пациент болезнью X.

. . . . . .
Особенности задач
Что общего у этих задач?
Существует «скрытый» алгоритм их решения.

. . . . . .
Человека можно научить их решать

. . . . . .
Человека можно научить их решать
Алгоритм решения невозможно строго
сформулировать

. . . . . .
Необходимо решать задачу в больших
объемах

. . . . . .
объемах
Человек решает задачу медленно

. . . . . .
объемах
Нужно использовать машины

. . . . . .
объемах
Алгоритма решения нет

. . . . . .
объемах
Есть примеры решения

. . . . . .
объемах
Есть примеры решения
Машинное обучение — «обучение» программ на
примерах.

. . . . . .
Задача машинного обучения

. . . . . .
Математическая формулировка
X — множество объектов, Y — множество
ответов.

. . . . . .
ответов.
a∗
: X → Y — неизвестный алгоритм.

. . . . . .
ответов.
a∗
Обучающая выборка T = {xi, yi}l
i=1, где
yi = a∗
(xi) — множество объектов и известных
на них ответов

. . . . . .
ответов.
a∗
Обучающая выборка T = {xi, yi}l
i=1, где
yi = a∗
(xi) — множество объектов и известных
на них ответов
Задача обучения — по выборке T построить
алгоритм a : X → Y, который бы как можно
лучше приближал a∗

. . . . . .
Признаки объектов
Признак — численная характеристика объекта
Отображение f : X → Df.
Df — пространство значений.

. . . . . .
Признаки объектов
Признак — численная характеристика объекта
Отображение f : X → Df.
Df — пространство значений.
Примеры Df:
Df = {0, 1} — бинарный признак.
«есть ли в тексте письма слово “банк”»,
«наблюдается ли у пациента жар».
Df = R — количественный признак.
Длина письма, возраст пациента.

. . . . . .
Построение признаков не входит в задачу
машинного обучения.

. . . . . .
Машинное обучение: построение алгоритма a по
обучающей выборке T и признакам объектов
f1, . . . , fn.

. . . . . .
Машинное обучение: построение алгоритма a по
обучающей выборке T и признакам объектов
f1, . . . , fn.
Матрица признаков обучающей выборки
F = fi(xj) i=1,...,n
j=1,...,l
=


f1(x1) . . . fn(x1)
. . . . . . . . .
f1(xl) . . . fn(xl)


(
f1(x), . . . , fn(x)
)
— вектор признаков объекта

. . . . . .
Стадии машинного обучения
Обучение
Построение алгоритма a по обучающей выборке.
Применение
Использование алгоритма a для получения
ответов на неизвестных объектах.

. . . . . .
Примеры методов машинного
обучения

. . . . . .
Для простоты будем считать, что
Y = R
Dfi
= R для всех i

. . . . . .
Линейная регрессия
Рассматриваем линейные комбинации признаков
a(α, x) =
n∑
i=1
αifi(x),
α = (α1, . . . , αn) — неизвестные коэффициенты.

. . . . . .
Рассматриваем линейные комбинации признаков
a(α, x) =
n∑
i=1
αifi(x),
α = (α1, . . . , αn) — неизвестные коэффициенты.
Минимизация квадратичной ошибки
Q(α) =
l∑
j=1
a(α, xj) − yj
2
Q(α) → min
α

. . . . . .
В матричной форме
F =


f1(x1) . . . fn(x1)
. . . . . . . . .
f1(xl) . . . fn(xl)


Q(α) = Fα − y 2

. . . . . .
В матричной форме
F =


f1(x1) . . . fn(x1)
. . . . . . . . .
f1(xl) . . . fn(xl)


Q(α) = Fα − y 2
Минимизируем
∂Q
∂α
= 2FT
(Fα − y) = 0
ˆα =
(
FT
F
)−1
FT
y

. . . . . .
X
Y

. . . . . .
Общая схема
Обучение
Вычисление коэффициентов
ˆα =
(
FT
F
)−1
FT
y
a(ˆα, x) =
n∑
i=1
αifi(x)

. . . . . .
Метод ближайшего соседа
Метрика на объектах
ρ : X × X → R
Например евклидово расстояние между
векторами признаков
ρ(x, y) =


n∑
i=1
(
fi(x) − fi(y)
)2


1
2

. . . . . .
a(x) = yk, где k = argmin
j=1,...,l
ρ(xj, x)
xk — «ближайший сосед», yk — известный ответ
на нем.

. . . . . .
f1
f2

. . . . . .
Общая схема
Обучение
Запомнить всю обучающую выборку.
Для данного x найти ближайшего соседа xk в
обучающей выборке и выдать в качестве ответа
yk.

. . . . . .
Машинное обучение и
ранжирование

. . . . . .
Ранжирование страниц
Дано:
Запрос пользователя
Список результатов

. . . . . .
Дано:
Упорядочить страницы

. . . . . .
Дано:
…в соответствии с их релевантностью

. . . . . .
Дано:
…в соответствии с их релевантностью
релевантность (запрос, результат)

. . . . . .
Оценка релевантности
Численные методы — Большая
Советская Энциклопедия Отлично
Математический анализ —
Википедия Плохо
Реферат: Численные методы
линейной алгебры Нормально

. . . . . .
Объекты — пары (запрос, страница)
Обучающая выборка — оценка релевантности
с помощью ассессоров

. . . . . .
Признаки
Текстовые
Пользовательские
Статические

. . . . . .
Признаки
Текстовые
Пользовательские
Статические
Предсказание релевантности.

. . . . . .
Конец
Вопросы?
Дополнительные материалы
1. Сайт www.MachineLearning.ru
К. В. Воронцов. Машинное обучение, курс
лекций.
2. К. Маннинг, П. Рагван, Х. Шютце.
Введение в информационный поиск.

002умнов

Recommended

Recommended

More Related Content

What's hot

What's hot (19)

Viewers also liked

Viewers also liked (8)

Similar to 002умнов

Similar to 002умнов (20)

002умнов