Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова. Курс "Алгоритмы интеллектуальной обработки больших объемов данных", Лекция №4 "Задача классификации"
Лектор - Николай Анохин
Постановка задач классификации и регрессии. Теория принятия решений. Виды моделей. Примеры функций потерь. Переобучение. Метрики качества классификации. MDL. Решающие деревья. Алгоритм CART.
Видео лекции курса https://www.youtube.com/playlist?list=PLrCZzMib1e9pyyrqknouMZbIPf4l3CwUP
This report describes tutoring systems, which offer students to enter full solutions of the problems instead of completing tests with multiple-choice questions. Students solve problems by entering steps, after the student enters a step, he/she can ask if the step is correct or not. Also students are able to get hints (what to do as a next step) and get marks for their solutions. This report describes experience of construction of this sort of systems fulfilled by our research group, as well as known results and possible future research directions.
2. Измерение показателей (модель
обучаемого)
Событие
действие студента контекст
«значимых» событий в процессе решения задачи может быть
очень много,
появление одного «значимого» события должно лишь приводить
к небольшому увеличению или уменьшению значения
соответствующего показателя (или показателей),
сигнализировать о необходимости выбора воздействия на
студента должно достижение показателями критических уровней.
4. Измерение показателей (модель
обучаемого)
Событие
действие студента контекст
Различным типам ситуаций с учетом их значимости приписываются разные весовые
коэффициенты
Каждый показатель вычисляется по формуле:
n
E f wi
i 1
В качестве функции, которая берется от суммы весовых коэффициентов, была взята
f ( x) ax
1 (ax)2
E[0, 1]
низ выс
0 a ср b 1
5. Задача классификации
X - множество описаний объектов,
Y - множество номеров (наименований классов)
Существует неизвестная зависимость: y*: X Y
Дано: обучающая выборка X {( x(1), y(1)),...,( x(m), y(m))}
m
Требуется построить алгоритм : X Y ,
способный классифицировать x X
5
6. Логит-модель-1
Логит-модель:
эл. сообщение: спам/не спам,
цена дома: дорогой/нет
y{0, 1} 0: не принадлежит классу («не спам»)
1: принадлежит классу («спам»)
Неизвестная зависимость, которую должны найти:
h ( x) P( y 1| x; )
Если h ( x) 0.5, то считаем, что y 1
Иначе считаем, что y 0
6
7. Логит-модель-2
h ( x) P( y 1| x, ) f ( z)
f ( z) 1 z
1e
z 0 1x1 ...n xn
f ( z)
z
8. Логит-модель-3. Пример
использования
Вероятность смерти в результате болезни сердца:
f ( z) 1 z , z 0 1x1 2 x2 3x3
1e
Факторы:
x1 - превышение 50-летия в десятках лет,
x2 - пол (0-муж, 1-жен),
x3 - уровень холестерина, уменьшенный на 5 (ммоль/л),
Пусть z 5.0 2.0x1 1.0x2 1.2 x3
Пусть пациент – мужчина 50 лет с холестерином 7.0
z 5.0 2.00 1.00 1.2(7.0 5.0), f ( z) 0.07
9. Логит-модель-4
Событие
действие студента контекст
0,1,...,n - весовые коэффициенты событий
xi - количество событий вида i
f ( z) - значение показателя, где z 0 1x1 ...n xn
f ( z)[0,1]
Интерпретация:
f ( z) 0.5 уровень показателя высокий
Нужно различать: высокий, средний, низкий уровни
10. Логит-модель-5. Модель обучаемого
Можно каждый показатель характеризовать с
помощью вектора (h ( x),h ( x),h ( x)),
1 2 3
где h ( x) P( y i | x, ) f ( z), i 1,3
i
3
h i ( x) 1
i 1
Выбирать i нужно на основе max h ( x)
i i
# (0.1,0.6,0.3) - уровень показателя средний,
(0.8,0.1,0.1) - уровень показателя низкий
11. Логит-модель-6
Как найти h ( x)? Т.е. как найти 1,...,n ?
Дана обучающая выборка: X {( x(1), y(1)),...,( x(m), y(m))}
m
Составляем:
m
J ( ) m
1 1(h ( x(i)) y(i))2
2
i 1
Параметры 1,...,n находим так: