логистическая регрессия

Логистическая регрессия в задаче
моделирования обучаемого.

Смирнова Н.В.

ИПУ РАН, 2011 1

Измерение показателей (модель
обучаемого)
Событие
действие студента контекст

 «значимых» событий в процессе решения задачи может быть
очень много,

 появление одного «значимого» события должно лишь приводить
к небольшому увеличению или уменьшению значения
соответствующего показателя (или показателей),

 сигнализировать о необходимости выбора воздействия на
студента должно достижение показателями критических уровней.

Использование показателей (модель
Эвристическому алгоритму управления требуются
качественные оценки:

Измерение показателей (модель
Событие

 Различным типам ситуаций с учетом их значимости приписываются разные весовые
коэффициенты
 Каждый показатель вычисляется по формуле:
 n 
E f   wi 
 
 i 1 

 В качестве функции, которая берется от суммы весовых коэффициентов, была взята
f ( x)  ax
1  (ax)2
E[0, 1]
низ выс

0 a ср b 1

Задача классификации
X - множество описаний объектов,
Y - множество номеров (наименований классов)
Существует неизвестная зависимость: y*: X Y

Дано: обучающая выборка X {( x(1), y(1)),...,( x(m), y(m))}
m

Требуется построить алгоритм  : X Y ,
способный классифицировать x X

5

Логит-модель-1
Логит-модель:
эл. сообщение: спам/не спам,
цена дома: дорогой/нет

y{0, 1} 0: не принадлежит классу («не спам»)
1: принадлежит классу («спам»)

Неизвестная зависимость, которую должны найти:
h ( x)  P( y 1| x; )

Если h ( x)  0.5, то считаем, что y 1
Иначе считаем, что y  0
6

h ( x)  P( y 1| x, )  f ( z)

f ( z)  1  z
1e
z 0 1x1 ...n xn

f ( z)

z

Логит-модель-3. Пример
использования
Вероятность смерти в результате болезни сердца:
f ( z)  1  z , z 0 1x1 2 x2 3x3
1e
Факторы:
x1 - превышение 50-летия в десятках лет,
x2 - пол (0-муж, 1-жен),
x3 - уровень холестерина, уменьшенный на 5 (ммоль/л),
Пусть z 5.0  2.0x1 1.0x2 1.2 x3
Пусть пациент – мужчина 50 лет с холестерином 7.0
z 5.0  2.00 1.00 1.2(7.0 5.0), f ( z)  0.07

Событие

0,1,...,n - весовые коэффициенты событий
xi - количество событий вида i
f ( z) - значение показателя, где z 0 1x1 ...n xn
f ( z)[0,1]
Интерпретация:
f ( z)  0.5 уровень показателя высокий

Нужно различать: высокий, средний, низкий уровни

Логит-модель-5. Модель обучаемого
Можно каждый показатель характеризовать с
помощью вектора (h ( x),h ( x),h ( x)),
1 2 3

где h ( x)  P( y  i | x, )  f ( z), i 1,3
 i
3
 h i ( x) 1
i 1

Выбирать i нужно на основе max h ( x)
i i

# (0.1,0.6,0.3) - уровень показателя средний,
(0.8,0.1,0.1) - уровень показателя низкий

Как найти h ( x)? Т.е. как найти 1,...,n ?
Дана обучающая выборка: X {( x(1), y(1)),...,( x(m), y(m))}
m

Составляем:
m
J ( )  m
1  1(h ( x(i))  y(i))2
2 
i 1

Параметры 1,...,n находим так:

Спасибо за внимание!

Инф. источники:
Слайды 1-3 /
статья Смирнова Н.В., Шварц А.Ю. (в печати)

Слайд 4 /
http://ru.wikipedia.org/wiki/Задача_классификации

Слайды 5-7/
http://ru.wikipedia.org/wiki/Логистическая_регрессия

Слайды 9-10/
ml-class.com

логистическая регрессия

Recommended

Recommended

More Related Content

What's hot

What's hot (9)

Viewers also liked

Viewers also liked (14)

Similar to логистическая регрессия

Similar to логистическая регрессия (20)

More from Natalia Smirnova

More from Natalia Smirnova (9)

логистическая регрессия