SlideShare a Scribd company logo
1 of 59
Download to read offline
. . . . . .
Машинное обучение в Поиске и
других задачах
Умнов Алексей
. . . . . .
Введение
. . . . . .
Поиск в интернете
. . . . . .
Поиск в интернете
..........
мама
.
рама
.
мыть
.
мыть
. . . . . .
Ранжирование
.........
. . . . . .
Примеры задач машинного
обучения
. . . . . .
Фильтрация спама
. . . . . .
Фильтрация спама
Дано:
Электронное письмо
. . . . . .
Фильтрация спама
Дано:
Электронное письмо
Адрес отправителя
Тема письма
Текст письма
Файлы письма
. . . . . .
Фильтрация спама
Дано:
Электронное письмо
Адрес отправителя
Тема письма
Текст письма
Файлы письма
Необходимо:
Определить, является ли данное письмо спамом.
. . . . . .
Медицинская диагностика
. . . . . .
Медицинская диагностика
Дано:
Пациент
. . . . . .
Медицинская диагностика
Дано:
Пациент
Общие данные
пол, возраст
Результаты обследований
температура, пульс
Симптомы
наличие головной боли
. . . . . .
Медицинская диагностика
Дано:
Пациент
Общие данные
пол, возраст
Результаты обследований
температура, пульс
Симптомы
наличие головной боли
Необходимо:
Определить, болен ли пациент болезнью X.
. . . . . .
Особенности задач
Что общего у этих задач?
Существует «скрытый» алгоритм их решения.
. . . . . .
Особенности задач
Что общего у этих задач?
Существует «скрытый» алгоритм их решения.
Человека можно научить их решать
. . . . . .
Особенности задач
Что общего у этих задач?
Существует «скрытый» алгоритм их решения.
Человека можно научить их решать
Алгоритм решения невозможно строго
сформулировать
. . . . . .
Особенности задач
Необходимо решать задачу в больших
объемах
. . . . . .
Особенности задач
Необходимо решать задачу в больших
объемах
Человек решает задачу медленно
. . . . . .
Особенности задач
Необходимо решать задачу в больших
объемах
Человек решает задачу медленно
Нужно использовать машины
. . . . . .
Особенности задач
Необходимо решать задачу в больших
объемах
Человек решает задачу медленно
Нужно использовать машины
Алгоритма решения нет
. . . . . .
Особенности задач
Необходимо решать задачу в больших
объемах
Человек решает задачу медленно
Нужно использовать машины
Алгоритма решения нет
Есть примеры решения
. . . . . .
Особенности задач
Необходимо решать задачу в больших
объемах
Человек решает задачу медленно
Нужно использовать машины
Алгоритма решения нет
Есть примеры решения
Машинное обучение — «обучение» программ на
примерах.
. . . . . .
Задача машинного обучения
. . . . . .
Математическая формулировка
X — множество объектов, Y — множество
ответов.
. . . . . .
Математическая формулировка
X — множество объектов, Y — множество
ответов.
a∗
: X → Y — неизвестный алгоритм.
. . . . . .
Математическая формулировка
X — множество объектов, Y — множество
ответов.
a∗
: X → Y — неизвестный алгоритм.
Обучающая выборка T = {xi, yi}l
i=1, где
yi = a∗
(xi) — множество объектов и известных
на них ответов
. . . . . .
Математическая формулировка
X — множество объектов, Y — множество
ответов.
a∗
: X → Y — неизвестный алгоритм.
Обучающая выборка T = {xi, yi}l
i=1, где
yi = a∗
(xi) — множество объектов и известных
на них ответов
Задача обучения — по выборке T построить
алгоритм a : X → Y, который бы как можно
лучше приближал a∗
. . . . . .
Математическая формулировка
Признаки объектов
Признак — численная характеристика объекта
Отображение f : X → Df.
Df — пространство значений.
. . . . . .
Математическая формулировка
Признаки объектов
Признак — численная характеристика объекта
Отображение f : X → Df.
Df — пространство значений.
Примеры Df:
Df = {0, 1} — бинарный признак.
«есть ли в тексте письма слово “банк”»,
«наблюдается ли у пациента жар».
Df = R — количественный признак.
Длина письма, возраст пациента.
. . . . . .
Математическая формулировка
Построение признаков не входит в задачу
машинного обучения.
. . . . . .
Математическая формулировка
Построение признаков не входит в задачу
машинного обучения.
Машинное обучение: построение алгоритма a по
обучающей выборке T и признакам объектов
f1, . . . , fn.
. . . . . .
Математическая формулировка
Построение признаков не входит в задачу
машинного обучения.
Машинное обучение: построение алгоритма a по
обучающей выборке T и признакам объектов
f1, . . . , fn.
Матрица признаков обучающей выборки
F = fi(xj) i=1,...,n
j=1,...,l
=


f1(x1) . . . fn(x1)
. . . . . . . . .
f1(xl) . . . fn(xl)


(
f1(x), . . . , fn(x)
)
— вектор признаков объекта
. . . . . .
Стадии машинного обучения
Обучение
Построение алгоритма a по обучающей выборке.
Применение
Использование алгоритма a для получения
ответов на неизвестных объектах.
. . . . . .
Примеры методов машинного
обучения
. . . . . .
Для простоты будем считать, что
Y = R
Dfi
= R для всех i
. . . . . .
Линейная регрессия
Рассматриваем линейные комбинации признаков
a(α, x) =
n∑
i=1
αifi(x),
α = (α1, . . . , αn) — неизвестные коэффициенты.
. . . . . .
Линейная регрессия
Рассматриваем линейные комбинации признаков
a(α, x) =
n∑
i=1
αifi(x),
α = (α1, . . . , αn) — неизвестные коэффициенты.
Минимизация квадратичной ошибки
Q(α) =
l∑
j=1
a(α, xj) − yj
2
Q(α) → min
α
. . . . . .
Линейная регрессия
В матричной форме
F =


f1(x1) . . . fn(x1)
. . . . . . . . .
f1(xl) . . . fn(xl)


Q(α) = Fα − y 2
. . . . . .
Линейная регрессия
В матричной форме
F =


f1(x1) . . . fn(x1)
. . . . . . . . .
f1(xl) . . . fn(xl)


Q(α) = Fα − y 2
Минимизируем
∂Q
∂α
= 2FT
(Fα − y) = 0
ˆα =
(
FT
F
)−1
FT
y
. . . . . .
Линейная регрессия
X
Y
. . . . . .
Линейная регрессия
X
Y
. . . . . .
Линейная регрессия
Общая схема
Обучение
Вычисление коэффициентов
ˆα =
(
FT
F
)−1
FT
y
Применение
a(ˆα, x) =
n∑
i=1
αifi(x)
. . . . . .
Метод ближайшего соседа
Метрика на объектах
ρ : X × X → R
Например евклидово расстояние между
векторами признаков
ρ(x, y) =


n∑
i=1
(
fi(x) − fi(y)
)2


1
2
. . . . . .
Метод ближайшего соседа
a(x) = yk, где k = argmin
j=1,...,l
ρ(xj, x)
xk — «ближайший сосед», yk — известный ответ
на нем.
. . . . . .
Метод ближайшего соседа
f1
f2
. . . . . .
Метод ближайшего соседа
f1
f2
. . . . . .
Метод ближайшего соседа
f1
f2
. . . . . .
Метод ближайшего соседа
Общая схема
Обучение
Запомнить всю обучающую выборку.
Применение
Для данного x найти ближайшего соседа xk в
обучающей выборке и выдать в качестве ответа
yk.
. . . . . .
Машинное обучение и
ранжирование
. . . . . .
Ранжирование страниц
Дано:
Запрос пользователя
Список результатов
. . . . . .
Ранжирование страниц
Дано:
Запрос пользователя
Список результатов
Необходимо:
Упорядочить страницы
. . . . . .
Ранжирование страниц
Дано:
Запрос пользователя
Список результатов
Необходимо:
Упорядочить страницы
…в соответствии с их релевантностью
. . . . . .
Ранжирование страниц
Дано:
Запрос пользователя
Список результатов
Необходимо:
Упорядочить страницы
…в соответствии с их релевантностью
релевантность (запрос, результат)
. . . . . .
Оценка релевантности
Численные методы — Большая
Советская Энциклопедия Отлично
Математический анализ —
Википедия Плохо
Реферат: Численные методы
линейной алгебры Нормально
. . . . . .
Ранжирование страниц
Объекты — пары (запрос, страница)
Обучающая выборка — оценка релевантности
с помощью ассессоров
. . . . . .
Ранжирование страниц
Объекты — пары (запрос, страница)
Обучающая выборка — оценка релевантности
с помощью ассессоров
Признаки
Текстовые
Пользовательские
Статические
. . . . . .
Ранжирование страниц
Объекты — пары (запрос, страница)
Обучающая выборка — оценка релевантности
с помощью ассессоров
Признаки
Текстовые
Пользовательские
Статические
Предсказание релевантности.
. . . . . .
Конец
Вопросы?
Дополнительные материалы
1. Сайт www.MachineLearning.ru
К. В. Воронцов. Машинное обучение, курс
лекций.
2. К. Маннинг, П. Рагван, Х. Шютце.
Введение в информационный поиск.

More Related Content

What's hot

Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)
Pavel Egorov
 
функциональный метод решения иррациональных уравнений
функциональный метод решения иррациональных уравненийфункциональный метод решения иррациональных уравнений
функциональный метод решения иррациональных уравнений
ludmilka88888
 
Использование GNU OCTAVE для инженерных и математических расчетов
Использование GNU OCTAVE для инженерных и математических расчетовИспользование GNU OCTAVE для инженерных и математических расчетов
Использование GNU OCTAVE для инженерных и математических расчетов
Транслируем.бел
 
Решение краевых задач методом конечных элементов
Решение краевых задач методом конечных элементовРешение краевых задач методом конечных элементов
Решение краевых задач методом конечных элементов
Theoretical mechanics department
 

What's hot (19)

Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)
 
десант презентация
десант презентациядесант презентация
десант презентация
 
555
555555
555
 
Дополнительные возможности Javascript
Дополнительные возможности JavascriptДополнительные возможности Javascript
Дополнительные возможности Javascript
 
Лекция №4 "Задача классификации"
Лекция №4 "Задача классификации"Лекция №4 "Задача классификации"
Лекция №4 "Задача классификации"
 
Николай Паламарчук "Functional Programming basics for PHP developers"
Николай Паламарчук "Functional Programming basics for PHP developers"Николай Паламарчук "Functional Programming basics for PHP developers"
Николай Паламарчук "Functional Programming basics for PHP developers"
 
вычислительная практика
вычислительная практикавычислительная практика
вычислительная практика
 
Программирование разветвляющихся алгоритмов
Программирование разветвляющихся алгоритмовПрограммирование разветвляющихся алгоритмов
Программирование разветвляющихся алгоритмов
 
Лекция 4 Обработка бинарных изображений
Лекция 4 Обработка бинарных изображенийЛекция 4 Обработка бинарных изображений
Лекция 4 Обработка бинарных изображений
 
функциональный метод решения иррациональных уравнений
функциональный метод решения иррациональных уравненийфункциональный метод решения иррациональных уравнений
функциональный метод решения иррациональных уравнений
 
Программирование линейных алгоритмов
Программирование линейных алгоритмовПрограммирование линейных алгоритмов
Программирование линейных алгоритмов
 
Использование GNU OCTAVE для инженерных и математических расчетов
Использование GNU OCTAVE для инженерных и математических расчетовИспользование GNU OCTAVE для инженерных и математических расчетов
Использование GNU OCTAVE для инженерных и математических расчетов
 
87
8787
87
 
Matematicheskie trenazhery
Matematicheskie trenazheryMatematicheskie trenazhery
Matematicheskie trenazhery
 
лекция 16
лекция 16лекция 16
лекция 16
 
Системы счисления
Системы счисленияСистемы счисления
Системы счисления
 
Rust: абстракции и безопасность, совершенно бесплатно
Rust: абстракции и безопасность, совершенно бесплатноRust: абстракции и безопасность, совершенно бесплатно
Rust: абстракции и безопасность, совершенно бесплатно
 
Решение краевых задач методом конечных элементов
Решение краевых задач методом конечных элементовРешение краевых задач методом конечных элементов
Решение краевых задач методом конечных элементов
 
Одномерные массивы целых чисел
Одномерные массивы целых чиселОдномерные массивы целых чисел
Одномерные массивы целых чисел
 

Viewers also liked

001 каминская ромашкова
001 каминская ромашкова001 каминская ромашкова
001 каминская ромашкова
Alexandra Kaminskaya
 
Presentation probki-extended-math-ed2
Presentation probki-extended-math-ed2Presentation probki-extended-math-ed2
Presentation probki-extended-math-ed2
Alexandra Kaminskaya
 

Viewers also liked (8)

Академические программы Яндекса
Академические программы ЯндексаАкадемические программы Яндекса
Академические программы Яндекса
 
001 каминская ромашкова
001 каминская ромашкова001 каминская ромашкова
001 каминская ромашкова
 
Recsys.hse
Recsys.hseRecsys.hse
Recsys.hse
 
Машинное обучение в Яндексе
Машинное обучение в ЯндексеМашинное обучение в Яндексе
Машинное обучение в Яндексе
 
Presentation probki-extended-math-ed2
Presentation probki-extended-math-ed2Presentation probki-extended-math-ed2
Presentation probki-extended-math-ed2
 
Кто такой фронтендер
Кто такой фронтендер Кто такой фронтендер
Кто такой фронтендер
 
техпис
техпистехпис
техпис
 
Сергей Мезенцев — Семантический винегрет
Сергей Мезенцев — Семантический винегрет Сергей Мезенцев — Семантический винегрет
Сергей Мезенцев — Семантический винегрет
 

Similar to 002умнов

Михаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеМихаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделирование
Lidia Pivovarova
 
CSEDays. Александр Семенов
CSEDays. Александр СеменовCSEDays. Александр Семенов
CSEDays. Александр Семенов
LiloSEA
 
Predel funk
Predel funkPredel funk
Predel funk
Alex_Tam
 

Similar to 002умнов (20)

Machine Learning. Курс лекций
Machine Learning. Курс лекцийMachine Learning. Курс лекций
Machine Learning. Курс лекций
 
20131006 h10 lecture2_matiyasevich
20131006 h10 lecture2_matiyasevich20131006 h10 lecture2_matiyasevich
20131006 h10 lecture2_matiyasevich
 
L11: Метод ансамблей
L11: Метод ансамблейL11: Метод ансамблей
L11: Метод ансамблей
 
8
88
8
 
Vychislenie proizvodnoj
Vychislenie proizvodnojVychislenie proizvodnoj
Vychislenie proizvodnoj
 
Михаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеМихаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделирование
 
Pril2
Pril2Pril2
Pril2
 
Haskell Type System with Dzmitry Ivashnev.
Haskell Type System with Dzmitry Ivashnev.Haskell Type System with Dzmitry Ivashnev.
Haskell Type System with Dzmitry Ivashnev.
 
Основы комбинаторики - I
Основы комбинаторики - IОсновы комбинаторики - I
Основы комбинаторики - I
 
L3: Линейная и логистическая регрессия
L3: Линейная и логистическая регрессияL3: Линейная и логистическая регрессия
L3: Линейная и логистическая регрессия
 
Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.
 
Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.
 
CSEDays. Александр Семенов
CSEDays. Александр СеменовCSEDays. Александр Семенов
CSEDays. Александр Семенов
 
урок 1
урок 1урок 1
урок 1
 
Лекция №5 "Обработка текстов, Naive Bayes"
Лекция №5 "Обработка текстов, Naive Bayes" Лекция №5 "Обработка текстов, Naive Bayes"
Лекция №5 "Обработка текстов, Naive Bayes"
 
Predel funk
Predel funkPredel funk
Predel funk
 
Python и его тормоза
Python и его тормозаPython и его тормоза
Python и его тормоза
 
Евгений Котельников. Зависимые типы в Haskell
Евгений Котельников. Зависимые типы в HaskellЕвгений Котельников. Зависимые типы в Haskell
Евгений Котельников. Зависимые типы в Haskell
 
M
MM
M
 
Интерпретирование языков с помощью Free-монад
Интерпретирование языков с помощью Free-монадИнтерпретирование языков с помощью Free-монад
Интерпретирование языков с помощью Free-монад
 

002умнов

  • 1. . . . . . . Машинное обучение в Поиске и других задачах Умнов Алексей
  • 2. . . . . . . Введение
  • 3. . . . . . . Поиск в интернете
  • 4. . . . . . . Поиск в интернете .......... мама . рама . мыть . мыть
  • 5. . . . . . . Ранжирование .........
  • 6. . . . . . . Примеры задач машинного обучения
  • 7. . . . . . . Фильтрация спама
  • 8. . . . . . . Фильтрация спама Дано: Электронное письмо
  • 9. . . . . . . Фильтрация спама Дано: Электронное письмо Адрес отправителя Тема письма Текст письма Файлы письма
  • 10. . . . . . . Фильтрация спама Дано: Электронное письмо Адрес отправителя Тема письма Текст письма Файлы письма Необходимо: Определить, является ли данное письмо спамом.
  • 11. . . . . . . Медицинская диагностика
  • 12. . . . . . . Медицинская диагностика Дано: Пациент
  • 13. . . . . . . Медицинская диагностика Дано: Пациент Общие данные пол, возраст Результаты обследований температура, пульс Симптомы наличие головной боли
  • 14. . . . . . . Медицинская диагностика Дано: Пациент Общие данные пол, возраст Результаты обследований температура, пульс Симптомы наличие головной боли Необходимо: Определить, болен ли пациент болезнью X.
  • 15. . . . . . . Особенности задач Что общего у этих задач? Существует «скрытый» алгоритм их решения.
  • 16. . . . . . . Особенности задач Что общего у этих задач? Существует «скрытый» алгоритм их решения. Человека можно научить их решать
  • 17. . . . . . . Особенности задач Что общего у этих задач? Существует «скрытый» алгоритм их решения. Человека можно научить их решать Алгоритм решения невозможно строго сформулировать
  • 18. . . . . . . Особенности задач Необходимо решать задачу в больших объемах
  • 19. . . . . . . Особенности задач Необходимо решать задачу в больших объемах Человек решает задачу медленно
  • 20. . . . . . . Особенности задач Необходимо решать задачу в больших объемах Человек решает задачу медленно Нужно использовать машины
  • 21. . . . . . . Особенности задач Необходимо решать задачу в больших объемах Человек решает задачу медленно Нужно использовать машины Алгоритма решения нет
  • 22. . . . . . . Особенности задач Необходимо решать задачу в больших объемах Человек решает задачу медленно Нужно использовать машины Алгоритма решения нет Есть примеры решения
  • 23. . . . . . . Особенности задач Необходимо решать задачу в больших объемах Человек решает задачу медленно Нужно использовать машины Алгоритма решения нет Есть примеры решения Машинное обучение — «обучение» программ на примерах.
  • 24. . . . . . . Задача машинного обучения
  • 25. . . . . . . Математическая формулировка X — множество объектов, Y — множество ответов.
  • 26. . . . . . . Математическая формулировка X — множество объектов, Y — множество ответов. a∗ : X → Y — неизвестный алгоритм.
  • 27. . . . . . . Математическая формулировка X — множество объектов, Y — множество ответов. a∗ : X → Y — неизвестный алгоритм. Обучающая выборка T = {xi, yi}l i=1, где yi = a∗ (xi) — множество объектов и известных на них ответов
  • 28. . . . . . . Математическая формулировка X — множество объектов, Y — множество ответов. a∗ : X → Y — неизвестный алгоритм. Обучающая выборка T = {xi, yi}l i=1, где yi = a∗ (xi) — множество объектов и известных на них ответов Задача обучения — по выборке T построить алгоритм a : X → Y, который бы как можно лучше приближал a∗
  • 29. . . . . . . Математическая формулировка Признаки объектов Признак — численная характеристика объекта Отображение f : X → Df. Df — пространство значений.
  • 30. . . . . . . Математическая формулировка Признаки объектов Признак — численная характеристика объекта Отображение f : X → Df. Df — пространство значений. Примеры Df: Df = {0, 1} — бинарный признак. «есть ли в тексте письма слово “банк”», «наблюдается ли у пациента жар». Df = R — количественный признак. Длина письма, возраст пациента.
  • 31. . . . . . . Математическая формулировка Построение признаков не входит в задачу машинного обучения.
  • 32. . . . . . . Математическая формулировка Построение признаков не входит в задачу машинного обучения. Машинное обучение: построение алгоритма a по обучающей выборке T и признакам объектов f1, . . . , fn.
  • 33. . . . . . . Математическая формулировка Построение признаков не входит в задачу машинного обучения. Машинное обучение: построение алгоритма a по обучающей выборке T и признакам объектов f1, . . . , fn. Матрица признаков обучающей выборки F = fi(xj) i=1,...,n j=1,...,l =   f1(x1) . . . fn(x1) . . . . . . . . . f1(xl) . . . fn(xl)   ( f1(x), . . . , fn(x) ) — вектор признаков объекта
  • 34. . . . . . . Стадии машинного обучения Обучение Построение алгоритма a по обучающей выборке. Применение Использование алгоритма a для получения ответов на неизвестных объектах.
  • 35. . . . . . . Примеры методов машинного обучения
  • 36. . . . . . . Для простоты будем считать, что Y = R Dfi = R для всех i
  • 37. . . . . . . Линейная регрессия Рассматриваем линейные комбинации признаков a(α, x) = n∑ i=1 αifi(x), α = (α1, . . . , αn) — неизвестные коэффициенты.
  • 38. . . . . . . Линейная регрессия Рассматриваем линейные комбинации признаков a(α, x) = n∑ i=1 αifi(x), α = (α1, . . . , αn) — неизвестные коэффициенты. Минимизация квадратичной ошибки Q(α) = l∑ j=1 a(α, xj) − yj 2 Q(α) → min α
  • 39. . . . . . . Линейная регрессия В матричной форме F =   f1(x1) . . . fn(x1) . . . . . . . . . f1(xl) . . . fn(xl)   Q(α) = Fα − y 2
  • 40. . . . . . . Линейная регрессия В матричной форме F =   f1(x1) . . . fn(x1) . . . . . . . . . f1(xl) . . . fn(xl)   Q(α) = Fα − y 2 Минимизируем ∂Q ∂α = 2FT (Fα − y) = 0 ˆα = ( FT F )−1 FT y
  • 41. . . . . . . Линейная регрессия X Y
  • 42. . . . . . . Линейная регрессия X Y
  • 43. . . . . . . Линейная регрессия Общая схема Обучение Вычисление коэффициентов ˆα = ( FT F )−1 FT y Применение a(ˆα, x) = n∑ i=1 αifi(x)
  • 44. . . . . . . Метод ближайшего соседа Метрика на объектах ρ : X × X → R Например евклидово расстояние между векторами признаков ρ(x, y) =   n∑ i=1 ( fi(x) − fi(y) )2   1 2
  • 45. . . . . . . Метод ближайшего соседа a(x) = yk, где k = argmin j=1,...,l ρ(xj, x) xk — «ближайший сосед», yk — известный ответ на нем.
  • 46. . . . . . . Метод ближайшего соседа f1 f2
  • 47. . . . . . . Метод ближайшего соседа f1 f2
  • 48. . . . . . . Метод ближайшего соседа f1 f2
  • 49. . . . . . . Метод ближайшего соседа Общая схема Обучение Запомнить всю обучающую выборку. Применение Для данного x найти ближайшего соседа xk в обучающей выборке и выдать в качестве ответа yk.
  • 50. . . . . . . Машинное обучение и ранжирование
  • 51. . . . . . . Ранжирование страниц Дано: Запрос пользователя Список результатов
  • 52. . . . . . . Ранжирование страниц Дано: Запрос пользователя Список результатов Необходимо: Упорядочить страницы
  • 53. . . . . . . Ранжирование страниц Дано: Запрос пользователя Список результатов Необходимо: Упорядочить страницы …в соответствии с их релевантностью
  • 54. . . . . . . Ранжирование страниц Дано: Запрос пользователя Список результатов Необходимо: Упорядочить страницы …в соответствии с их релевантностью релевантность (запрос, результат)
  • 55. . . . . . . Оценка релевантности Численные методы — Большая Советская Энциклопедия Отлично Математический анализ — Википедия Плохо Реферат: Численные методы линейной алгебры Нормально
  • 56. . . . . . . Ранжирование страниц Объекты — пары (запрос, страница) Обучающая выборка — оценка релевантности с помощью ассессоров
  • 57. . . . . . . Ранжирование страниц Объекты — пары (запрос, страница) Обучающая выборка — оценка релевантности с помощью ассессоров Признаки Текстовые Пользовательские Статические
  • 58. . . . . . . Ранжирование страниц Объекты — пары (запрос, страница) Обучающая выборка — оценка релевантности с помощью ассессоров Признаки Текстовые Пользовательские Статические Предсказание релевантности.
  • 59. . . . . . . Конец Вопросы? Дополнительные материалы 1. Сайт www.MachineLearning.ru К. В. Воронцов. Машинное обучение, курс лекций. 2. К. Маннинг, П. Рагван, Х. Шютце. Введение в информационный поиск.