SlideShare a Scribd company logo
1 of 19
9.2. ОБЩИЕ ЛИНЕЙНЫЕ МОДЕЛИ
Как мы уже ранее отмечали, в классическом регрессионном анализе предполагается,
что отклик и предикторы – это непрерывные случайные величины, имеющие нормальное
распределение. Однако в некоторых задачах в качестве предикторов целесообразно
рассматривать качественные переменные, измеренные в номинальной или порядковой
шкале. Если в качестве предикторов используются непрерывные и категориальные
переменные, то для построения регрессионной модели следует использовать метод Общие
линейные модели, который реализован в пакете STATISTICA с одноименным модулем
(GLM).
В §9.1. было показано, что степень снижения тяжести депрессии dBDI за курс
комбинированной терапии (гКПТ + ФТ), зависит от качественных предикторов Группа,
Социальный статус, Нозологический диагноз.
Здесь:
– гКПТ – это групповоая когнитивно-поведенческая терапия, ФТ –
психофармакотерапия;
– предиктор Группа разбивает выборку больных на подгруппы основная
(экспериментальная) и контрольная. В основной группе больных лечили
комбинированным методом гКПТ + ФТ, в контрольной – только ФТ;
– Социальный статус принимает два текстовых значения: Работает и Не работает;
– Нозологический диагноз принимает четыре текстовых значения: реактивная
депрессия, депрессивный невроз, эндогенная депрессия монополярный тип,
эндореактивная дистимия.
Построим для больных основной группы общую линейную модель зависимости
отклика Post BDI – показателя выраженности тяжести депрессии по шкале Бека в баллах
после лечения, от качественных предикторов Социальный статус, Нозологический
диагноз и количественных – Возраст, Длительность заболевания, Pre BDI – показателя
выраженности тяжести депрессии по шкале депрессии Бека в баллах до лечения. Объем
выборки (48 больных) недостаточен для проверки соответствия непрерывных переменных
Возраст, Длительность заболевания нормальному распределению, поэтому
гипотетически предположим, что такое соответствие присутствует.
Одним из условий применимости метода Общие линейные модели, является отсутствие
в таблице кростабуляции ячеек с нулевым элементом. На рис.9.2.1 показано, что в
последней ячейке первой строки количество больных с социальным статусом Работает,
имеющих нозологический диагноз эндореактивная дистимия равно 0. Поэтому исключим
двух больных с этим диагнозом из анализа. Фрагмент файла данных, состоящий из первых
25 больных, представлен на рис.9.2.2.
Итоговая таблица частот
Частоты выделенных ячеек > 10
(Маргинальные суммы не отмечены)
Условие включения: v1=1
Условие исключения: v1=4
Социальный
статус (раб/не
раб)
Нозолог.
диагноз
реакт. деп
Нозолог.
диагноз
деп. невр
Нозолог.
диагноз
моноп. тип
Нозолог.
диагноз
эндор. дист.
Всего
по стр.
Работает 6 18 2 0 26
Не работ 6 12 2 2 22
Всего 12 30 4 2 48
Рис.9.2.1
1
Возраст
2
Соц стат
3
Ноз. диаг.
4
Длит. заб.
5
Pre BDI
6
Post BDI
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
24 Работает реакт. деп 5 22 5
41 Работает деп. невр 730 19 8
53 Не работ реакт. деп 60 37 10
42 Работает деп. невр 180 32 20
32 Работает моноп. тип 1095 15 9
63 Не работ деп. невр 1095 19 7
19 Работает деп. невр 730 32 6
19 Работает деп. невр 180 27 6
49 Не работ деп. невр 1095 14 5
43 Не работ деп. невр 365 39 8
19 Работает деп. невр 365 20 13
45 Не работ деп. невр 730 32 7
52 Не работ реакт. деп 120 26 10
47 Работает деп. невр 2555 21 12
31 Работает деп. невр 60 42 16
45 Работает деп. невр 730 44 15
44 Работает реакт. деп 60 16 5
29 Работает реакт. деп 14 18 12
46 Не работ моноп. тип 5110 38 31
33 Работает деп. невр 180 13 2
47 Не работ деп. невр 365 22 7
26 Не работ реакт. деп 90 23 5
51 Работает деп. невр 5110 13 3
24 Работает реакт. деп 10 22 5
41 Работает деп. невр 730 19 8
53 Не работ реакт. деп 60 37 10
42 Работает деп. невр 180 32 20
Рис.9.2.2
Для начала работы с модулем Общие линейные модели следует в меню Анализ
высветить Углубленные методы анализа (рис.9.2.3).
Рис.9.2.3
Далее, в открывшемся меню надо щелкнуть по процедуре Общие линейные модели,
откроется стартовое окно модуля (рис.9.2.4).
Рис.9.2.4
Если в появившемся окне щелкнуть пол кнопке ОК, то откроется одноименное окно
(рис.9.2.5), в котором надо щелкнуть по кнопке Переменные и в появившемся окне
(рис.9.2.6) выделить зависимую переменную, категориальные и непрерывные предикторы.
Рис.9.2.5
Рис.9.2.6
После проведенных манипуляций стартовое окно программы примет вид,
представленный на рис.9.2.7. Если нажать на ОК, то откроется окно Результаты анализа,
в котором следует перейти на вкладку Итоги (рис.9.2.8).
Рис.9.2.7
Если нажать на кнопку Одномерные результаты, то откроется таблица, в которой
приведены одномерные результаты для оценки степени и характера взаимосвязи отклика
Post BDI и эффектов в регрессионной модели (рис.9.2.9). Из таблицы видно, что
статистически значимы все эффекты за исключением Длит. заб., так как уровни
значимости р критерия Фишера меньше, чем 0,05. Но и для переменной Длит. заб.
уровень значимости р равный 0,07, незначительно превосходит 0,05. Другими словами
факторы Соц.стат., Нозолог. диагноз влияют на отклик, но они также взаимодействуют в
своем влиянии на него. Наибольший вклад в общую линейную модель вносит эффект
Ноз.диаг, так как статистика SS, равная 410,091, принимает наибольшее значение. Далее
идут эффекты Соц.стат.*Ноз.диаг., Pre BDI, Возраст, Соц.стат., Длит.заб.
Рис.9.2.8
Одномерные результаты для каждой Зав. Пер.
Сигма-ограниченная параметризация
Декомпозиция гипотезы
Эффект
Степени
Свободы
Post BDI
SS
Post BDI
MS
Post BDI
F
Post BDI
p
Св. член
Возраст
Длит. заб.
Pre BDI
Соц. стат.
Ноз. диаг.
Соц. стат.*Ноз. диаг.
Ошибка
Всего
1 10,021 10,0214 0,86409 0,358621
1 60,571 60,5705 5,22270 0,028121
1 38,699 38,6992 3,33684 0,075821
1 173,965 173,965115,00016 0,000423
1 50,216 50,2161 4,32989 0,044427
2 410,091 205,045317,68005 0,000004
2 263,400 131,700211,35587 0,000143
37 429,109 11,5975
45 1794,435
Рис.9.2.9
Для того, чтобы определить, как закодированы категориальные переменные в общей
линейной модели, надо нажать на кнопку Члены плана (рис.9.2.8) и воспользоваться
таблицей Метки столбцов на рис.9.2.10. Для кодирования категориальных предикторов в
модуле использована сигма-ограниченная параметризация.
Метки столбцов
Метки для столбцов матрицы плана X
Метка
Столбец Перемен. Уровень
Перемен.
от
Уровень
Перемен. Уровень
Перемен.
от
Уровень
Св. член
Возраст
Длит. заб.
Pre BDI
Соц. стат.
Ноз. диаг.
Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
1
2 Возраст
3 Длит. заб.
4 Pre BDI
5 Соц. стат. Работает Не работ
6 Ноз. диаг. реакт. деп моноп. тип
7 Ноз. диаг. деп. невр моноп. тип
8 Соц. стат. Работает Не работ Ноз. диаг. реакт. деп моноп. тип
9 Соц. стат. Работает Не работ Ноз. диаг. деп. невр моноп. тип
Рис.9.2.10
При такой параметризации каждый эффект (фактор) представляется в виде
совокупности одноименных двухуровневых эффектов. Например, так как переменная
Соц.стат. имеет два уровня, то она и представляется с двумя уровнями: Работает, Не
работает. Предиктор Ноз.диаг. состоит из 3 уровней, поэтому представляется в виде 2
одноименных двухуровневых переменных: Ноз.диаг. (реакт.деп., моноп.тип); Ноз.диаг.
(деп.невр, моноп.тип). При этом уровню 1 присваивается числовое значение 1, а уровню 2
– числовое значение 0, или –1. Например, если рассматривается предиктор Соц.стат., то
альтернативным значениям предиктора Работает, Не работает будут присвоены
соответственно значения 1 и 0, которые будут представлять количественные различия
между группами наблюдений (больных) Работает, Не работает. Предиктор Ноз. диаг. в
строке 6 таблицы имеет 2 значения реакт.деп., моноп.тип, которые соответственно будут
закодированы как 1 и 0. Этот же предиктор в строке 7 имеет 2 значения деп.невр,
моноп.тип, которые также будут закодированы как 1 и 0. При этом, если больной имеет
диагноз реакт.деп., то Ноз. диаг. в строке 6 примет значение 1, а Ноз. диаг. в строке 7
примет значение 0; если больной имеет диагноз деп.невр, то Ноз. диаг. в строке 6 примет
значение 0, а Ноз. диаг. в строке 7 примет значение 1. Но если больной имеет диагноз
моноп.тип, то Ноз. диаг. в строках 6 и 7 примет значение –1.
Значения, обозначающие членство в одной из двух групп, выбираются с учетом
облегчения последующей интерпретации регрессионного коэффициента,
соответствующего этому предиктору. Поэтому, если регрессионный коэффициент для
этой переменной является положительным, то группа, закодированная с помощью
значения 1, будет иметь большее предсказанное значение отклика. Если получен
отрицательный регрессионный коэффициент, то группа, закодированная значением 1,
будет иметь меньшее предсказанное значение отклика.
Значения сложных эффектов Соц.стат.*Ноз.диаг. в строках 8 и 9 также кодируются
числами 1 и 0, которые являются результатами умножения соответствующих числовых
значений предикторов Соц.стат., Ноз.диаг. Так, для Соц.стат.*Ноз.диаг. в строке 8
возможны следующие 4 комбинации Работает*реакт. деп., Работает*моноп. тип, Не
работает*реакт. деп., Не работает*моноп. Тип, которые в регрессионных моделях
принимают следующие значения:1·1 =1, 1·0 = 0, 0·1 = 0, 0·0 = 0. Для Соц.стат.*Ноз.диаг.
в строке 9 возможны другие 4 комбинации Работает*деп.невр, Работает*моноп. тип,
Не работает*деп.невр., Не работает*моноп. Тип, которые принимают следующие
значения:1·1 =1, 1·0 = 0, 0·1 = 0, 0·0 = 0. Обратите внимание, что сумма всех значений
каждого простого и сложного эффекта равна 1.
Если нажать на кнопку Коэффициенты, то откроется таблица Оценки параметров
(рис.9.2.11), в третьем столбце которой (Post BDI Парам.) отображены коэффициенты
регрессионного уравнения. В первом столбце (Уровень Эффект) приведены уровни
эффектов Работает, реакт. деп., деп. невр, которые кодируются программой как 1. В
четвертом столбце таблицы приведены стандартные ошибки параметров, которые
определяются как стандартное отклонение параметра, деленное на объем выборки.
Характеризуют точность вычисления параметров. Для всех эффектов, за исключением
свободного члена, стандартные ошибки значительно меньше оцениваемых параметров. В
столбцах 5 и 6 приведены значения t-критерия (критерия Стьюдента) и соответствующие
им уровни значимости р для оценки значимости коэффициентов регрессионного
уравнения. Так как р эффектов Св. член и Длит. заб. больше, чем 0,05, то
соответствующие им параметры статистически не значимы и из общей линейной модели
могут быть удалены.
Оценки параметров (Таблица псих1)
Сигма-ограниченная параметризация
Эффект
Уровень
Эффект
Столбец Post BDI
Парам.
Post BDI
Ст.Ош.
Post BDI
t
Post BDI
p
-95,00%
Дов.Пр.
Св. член
Возраст
Длит. заб.
Pre BDI
Соц. стат.
Ноз. диаг.
Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
1 2,50478 2,694565 0,92957 0,358621 -2,95493
2 0,12713 0,055629 2,28532 0,028121 0,01442
3 -0,00137 0,000753 -1,82670 0,075821 -0,00290
4 0,25056 0,064694 3,87300 0,000423 0,11948
Работает 5 -1,85635 0,892116 -2,08084 0,044427 -3,66395
реакт. деп 6 -5,35170 1,256505 -4,25920 0,000135 -7,89763
деп. невр 7 -4,30875 0,841715 -5,11901 0,000010 -6,01422
1 8 3,28649 0,954883 3,44177 0,001449 1,35171
2 9 4,34371 1,076842 4,03375 0,000264 2,16182
Рис.9.2.11
Если нажать на кнопку Общая R модели, то справедливым будет вывод, что в целом,
построенная модель взаимосвязи отклика с предикторами достаточно адекватная, так
коэффициент множественной корреляции R = 0,87 и близок к 1, а R2
= 0, 76 значительно
больше, чем 0,5 и описывает более 76% изменчивости отклика (рис.9.2.12).
SS модели и SS остатков (Таблица псих)
Условие включения: v1=1
Условие исключения: v5=4
Зависим.
Перемен.
Множеств
R
Множеств
R2
Скоррект
R2
SS
Модель
сс
Модель
MS
Модель
SS
Остаток
сс
Остаток
MS
Остаток
Post BDI 0,872277 0,760867 0,7091621365,326 8 170,6657429,1093 37 11,59755
Рис.9.2.12
Категориальные переменные Социальный статус, Нозологические болезни делят всю
совокупность больных на подгруппы. Значимость категориальных факторов в модели
определяется различием средних в подгруппах. Если воспользоваться кнопкой
Статистики ячеек, то появится таблица, в которой будут отображены значения средних
отклика Post BDI во всех 11 подгруппах, также приведены стандартные отклонения,
стандартные ошибки и доверительные интервалы вычисленных оценок (рис.9.2.13).
Описательные статистики для зависимых переменных (Таблица псих1)
Эффект
Уровень
Фактор
Уровень
Фактор
N Post BDI
Среднее
Post BDI
Ст.Откл.
Post BDI
Ст.Ош.
Post BDI
-95,00%
Post BDI
+95,00%
Всего
Соц. стат.
Соц. стат.
Ноз. диаг.
Ноз. диаг.
Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
Соц. стат.*Ноз. диаг.
46 9,65217 6,31477 0,931062 7,77692 11,52743
Работает 26 9,46154 5,09298 0,998816 7,40444 11,51864
Не работ 20 9,90000 7,75887 1,734935 6,26874 13,53126
реакт. деп 12 7,83333 3,04014 0,877612 5,90172 9,76494
деп. невр 30 9,00000 5,01033 0,914758 7,12911 10,87089
моноп. тип 4 20,00000 12,70171 6,350853 -0,21125 40,21125
Работает реакт. деп 6 7,33333 3,61478 1,475730 3,53985 11,12682
Работает деп. невр 18 10,22222 5,66263 1,334694 7,40626 13,03818
Работаетмоноп. тип 2 9,00000 0,00000 0,000000 9,00000 9,00000
Не работ реакт. деп 6 8,33333 2,58199 1,054093 5,62370 11,04296
Не работ деп. невр 12 7,16667 3,24271 0,936089 5,10635 9,22698
Не работ моноп. тип 2 31,00000 0,00000 0,000000 31,00000 31,00000
Рис.9.2.13
К сожалению по данной таблице невозможно оценить статистическую значимость
отличия средних в подгруппах больных. Статистическую значимость отличия средних в
подгруппах больных отклика Post BDI можно оценить при помощи критерия наименьшей
значимой разности (НЗР). Для этого надо воспользовавшись кнопкой Больше (рис.9.2.7),
перейти в диалог, окно которого представлено на рис.9.2. 14.
Рис.9.2.14
Далее перейти на вкладку Апостер. и нажать на кнопку Фишера НЗР, предварительно
установив при помощи выпадающего меню в поле Эффект «Соц.стат» «Ноз.диаг». Из
открывшейся таблицы (рис.9.2.15) видно, что наиболее эффективно лечение
комбинированным методом в подгруппе 5 – неработающих больных с диагнозом
депрессивный невроз, так как отклик Post BDI принимает наименьшее значение, равное
7,1667. Но при этом отличие статистически значимо лишь с подгруппами 2 и 6,
работающих с депрессивным неврозом (10,222) и неработающих больных с диагнозом
монополярный тип (31). Среднее значения отклика в подгруппе 6 принимает достаточно
большое значение, равное 31, что свидетельствует о низкой эффективности лечения для
этих больных. Среднее значение отклика в этой подгруппе значительно и статистически
значимо отличается от средних во всех остальных 5 подгруппах.
В группах больных по диагнозу наиболее эффективно лечение больных с диагнозом
реактивная депрессия (7,8333) и наименее эффективно в группе монополярный тип (20,0).
Причем среднее отклика в этой группе статистически значимо отличается от средних в
группах 1 (7,8333) и 2 (9,0).
В группах больных по социальному статусу отличие средних отклика не является
статистически значимым.
НЗР крит.; перем.Post BDI (Т аблица псих1)
Вероятности для апостер. критериев
Ошибка: Межгр. MS = 11,598, сс = 37,000
N ячейки
Соц. стат. Ноз. диаг. {1}
7,3333
{2}
10,222
{3}
9,0000
{4}
8,3333
{5}
7,1667
{6}
31,000
1
2
3
4
5
6
Работает реакт. деп 0,0800980,5525640,6140510,9225560,000000
Работает деп. невр 0,080098 0,6329910,2468690,0211630,000000
Работаетмоноп. тип0,5525640,632991 0,8118420,4853140,000000
Не работ реакт. деп 0,6140510,2468690,811842 0,4975120,000000
Не работ деп. невр 0,9225560,0211630,4853140,497512 0,000000
Не работ моноп. тип0,0000000,0000000,0000000,0000000,000000
Рис.9.2.15
НЗР крит.; перем.Post BDI
Вероятности для апостер. критериев
Ошибка: Межгр. MS = 11,598, сс = 37,000
N ячейки
Ноз. диаг. {1}
7,8333
{2}
9,0000
{3}
20,000
1
2
3
реакт. деп 0,322387 0,000000
деп. невр 0,322387 0,000001
моноп. тип0,0000000,000001
НЗР крит.; перем.Post BDI
Вероятности для апостер. крит
Ошибка: Межгр. MS = 11,598,
N ячейки
Соц. стат. {1}
9,4615
{2}
9,9
1
2
Работает 0,67
Не работ0,667612
Рис.9.2.16
В программе предусмотрена возможность сравнения значений отклика, вычисленных
программой по составленной модели Post BDI Предск., с исходными значениями Post BDI
Наблюд. из таблицы исходных данных. Для этого надо перейти на вкладку Остатки 1
(рис.9.2.17) и нажать на кнопку Предсказ. и остатки.
Рис.9.2.17
На рис.9.2.18 приведен фрагмент таблицы для первых 25 больных. Из таблицы видно,
что уравнение достаточно «хорошо» предсказывает значение отклика Post BDI – тяжесть
состояния больных по шкале Бека после лечения комбинированным методом.
Существенные отличия у больных под номерами 4, 11, 18, 20, что в принципе можно
объяснить также и высокими погрешностями бальной оценки состояния больных.
Наблюдаемые, предсказанные значения и остатки (Т аблица псих1)
Сигма-ограниченная параметризация
(Анализируемая выборка)
Номер набл.
Post BDI
Наблюд.
Post BDI
Предск.
Post BDI
Остатки
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
5,00000 7,13982 -2,13982
8,00000 9,65289 -1,65289
10,0000011,64914 -1,64914
20,0000013,79339 6,20661
9,00000 9,00000 -0,00000
7,00000 6,97327 0,02673
6,00000 10,11331 -4,11331
6,00000 9,61658 -3,61658
5,00000 3,94064 1,05936
8,00000 10,44541 -2,44541
13,00000 7,60834 5,39166
7,00000 8,44398 -1,44398
10,00000 8,68335 1,31665
12,00000 8,40800 3,59200
16,0000015,06553 0,93447
15,0000016,42544 -1,42544
5,00000 8,10345 -3,10345
12,00000 6,76085 5,23915
31,0000029,99648 1,00352
2,00000 7,88855 -5,88855
7,00000 6,69439 0,30561
5,00000 4,66751 0,33249
3,00000 3,39972 -0,39972
5,00000 7,13294 -2,13294
8,00000 9,65289 -1,65289
10,0000011,64914 -1,64914
20,0000013,79339 6,20661
Рис.9.2.18
Если нажать на кнопку Набл. и предск., то программа отобразаит диаграмму рассеяния
наблюдаемых (по оси ОХ) и предсказанных (по оси ОY) значений отклика (рис.9.2.19). Чем
ближе расположены точки на плоскости к линии регрессии, тем адекватнее модель
описывает взаимосвязь предикторов и отклика. График подтверждает высокую
адекватность модели.
Еще одним показателем адекватности модели является соответствие закона
распределения остатков (разности между прогнозными значениями отклика и
наблюдаемыми) нормальному закону с математическим ожиданием, равным 0 (белый
шум). Для построения гистограммы надо щелкнуть по кнопке Остатки. По рис.9.2.20
можно сделать вывод, что гистограмма остатков действительно имеет визуальное
сходство с нормальным распределением со средним значением, равным 0 (ось
симметрии). Это еще раз подчеркивает адекватность модели.
Наблюдаемые и предсказанные значения
Зависимая переменная: Post BDI
(Анализируемая выборка)
-5 0 5 10 15 20 25 30 35
Наблюдаемые значения
0
5
10
15
20
25
30
35
Предсказанныезначения
Рис.9.2.19
Гистограмма исходных остатков
Зависимая переменная: Post BDI
(Анализируемая выборка)
-10 -8 -6 -4 -2 0 2 4 6 8
X <= Граница категории
0
2
4
6
8
10
12
14
16
Кол-вонабл.
Рис.9.2.20
В соответствии с параметрами общей линейной модели (коэффициентами регрессии,
рис.9.2.11) легко выписать уравнение регрессии:
Post BDI = 2,504 + 0,127Возраст – 0,001Длит. заб. + 0 ,250Pre BDI – 1,856Соц
стат/(Работает) – 5,351Ноз. диаг.(реакт. деп) – 4,308Ноз. диаг.(деп. невр) + 3,286 Соц
стат*Ноз. диаг.(1) + 4,343Соц стат*Ноз. диаг.(2)
Так как количество предикторов не велико, то можно воспользоваться общей линейной
моделью для прогнозирования тяжести состояния больного по шкале Бека после лечения
для произвольного больного. Применим ручной счет при помощи обычного калькулятора.
Для этого надо в уравнение подставить значения предикторов и произвести несложные
арифметические действия. С количественными предикторами здесь все предельно
понятно, а с категориальными, с учетом принципов сигма-ограниченной параметризации
следует поступить так:
– если больной из подгруппы Работает, то эффект Соц стат/(Работает) следует
заменить на 1, если из подгруппы Не работает, то Соц стат/(Работает) следует
заменить на 0;
– если диагноз больного реакт. деп., то Ноз. диаг.(реакт. деп) следует заменить на
1, а Ноз. диаг.(деп. невр) на 0;
– если диагноз больного деп. невр., то Ноз. диаг.(деп. невр) следует заменить на 1, а
Ноз. диаг.(реакт. деп) на 0;
– если диагноз больного моноп. тип, то Ноз. диаг.(реакт. деп) и Ноз. диаг.(деп.
невр) следует заменить на –1.
– если эффект Соц стат*Ноз. диаг.(1) соответствует комбинации
Работает*реакт. деп., то его следует заменить на 1, в любом другом случае – на 0.
– если эффект Соц стат*Ноз. диаг.(2) соответствует комбинации Работает* деп.
невр., то его следует заменить на 1, в любом другом случае – на 0.
В качестве иллюстрации вычислим, например прогнозное значение отклика Post BDI
для больного М. (№ 2, см. рис.9.2.2), если возраст 41 год, работает, диагноз –
депрессивный невроз, длительность заболевания 730 дней, показатель выраженности
тяжести депрессии по шкале депрессии Бека в баллах до лечения Pre BDI = 19.
Подставим данные больного в уравнение, исключив свободный член, получим:
Post BDI = 0,12713· 41 – 0,00137·730 + 0 ,25056·19 – 1,85635·1 – 5,3517·0 – 4,30874·1 –
3,28648·0 + 4,34371 = 7,15149.
Это означает, что прогнозируемая тяжесть состояния больного по шкале Бека после
лечения комбинированной терапией составит 7 баллов. Реальное значение тяжести
состояния для больного М. после лечения составило 8 баллов. Ошибка в прогнозе равна 8
– 7,2 = 0,8 балла (10%). Учитывая, что балльная шкала сама по себе достаточно грубая
измерительная шкала, погрешность в 0,8 балла является незначительной.
Если к вычисленному значению добавить удаленный нами свободный член, то получим
7,15149 + 2,50477 = 9,65625.
Если на вкладке Отчет (рис.9.2.21) щелкнуть по кнопке Уравнение предсказания, то
программа сама выпишет уравнение регрессии:
"Post BDI" = 2,50477626 + 0,127130542 * Возраст - 0,00137468 * "Длит. заб." +
0,250561207*"Pre BDI" - 1,8563479*"Соц стат"(Работает) - 5,3517041*"Ноз. диаг."("реакт.
деп") - 4,3087480 * "Ноз. диаг."("деп. невр") + 3,28648701 * "Соц стат" * "Ноз. диаг."(1) +
4,34371226 * "Соц стат" * "Ноз. диаг."(2)
В модуле Общие линейные модели программы STATISTICA предусмотрена возможность
сгенерировать код (автоматически составить текст процедуры) на одном из языков
программирования − STATISTICA Visual Basic (SVB), C/C++, PMML код. Если выбрать
SVB, то программа напишет текст процедуры и создаст макрос, который потом можно
будет сохранить и использовать для автоматического вычисления величины отклика при
заданных пользователем значениях предикторов.
Можно воспользоваться сохраненным кодом программы для вычисления прогнозного
значения тяжести состояния по шкале Бека произвольного больного после лечения
комбинированной терапией. Для этого достаточно последовательно в соответствии с
запросами программы ввести в окно (рис.9.2.22) данные больного. В качестве примера
введены данные больного М. (№ 2, рис.9.2.10). После ввода значения последнего
предиктора – длительности заболевания (Dlit. zab), равного 730 и нажатия на Enter,
программа в последней строке запишет результат автоматически произведенных
вычислений – 9,65289.
Рис.9.2.21
Рис.9.2.22
Обратите внимание, что вычисленное программой значение примерно равно значению
9,65625, вычисленному нами вручную по построенному уравнению. Незначительное
расхождение вызвано погрешностью округления до пятого знака после запятой.
Таким образом, построена вполне адекватная общая линейная модель, которая
позволяет с достаточно высокой точностью прогнозировать тяжесть состояния по шкале
Бека больного после лечения комбинированной терапией, если известны возраст больного,
длительность заболевания, тяжесть состояния больного по шкале Бека до лечения,
нозологический диагноз и его социальный статус.
Если перейти на вкладку Профили, то откроется диалог (рис.9.2.23), в котором можно
просмотреть предсказанные отклики и профили для предсказанных значений и
желательности. Профили – это графики зависимостей отклика и функции желательности
от равноотстоящих значений предикторов при фиксированных на определенном уровне
текущих значений других предикторов. Для построения профилей интервалы изменения
предикторов разбиваются на диапазоны и, для вычисления отклика в соответствии с
построенным уравнением регрессии рассматриваются границы диапазонов, которые
называются уровнями факторов. Число уровней фактора равно количеству диапазонов
плюс 1.
Рис.9.2.23
Установить параметры анализа можно, воспользовавшись кнопкой Опции. Если в поле
Параметры профилей отклика открывшегося диалога установить флажок Показывать
таблицы с графиками (рис.9.2.24), то будут построены таблицы и графики, в противном
случае – только графики. В нижней рамке окна Метод подгонки можно выбрать метод
подгонки поверхности к значениям желательности.
В рамке Значения факторов окна на рис.9.2.23 можно задать фиксированные текущие
значения предикторов. Опция Среднее означает, что текущие значения предикторов будут
равны их средним значениям. Опция Пользователя предполагает, что текущие значения
предикторов могут быть заданы пользователем, опция Оптимальные означает, что
текущий уровень каждого предиктора равен значению, оптимизирующему желательность
отклика. При выборе опции Оптимальные активной станет рамка Параметры функции
желательности и появится галочка перед строкой Показать функцию желательности.
Выберем опцию Среднее и установим флажок на опцию Показать функцию
желательности.
Рис.9.2.24
Для того чтобы задать количество уровней факторов надо нажать на кнопку Сетка. В
появившемся окне (рис.9.2.25) в рамке Фактор при помощи кнопок Назад, Далее и
выпадающего меню можно просмотреть диапазоны изменения факторов (предикторов) от
минимального до максимального значений.
Рис.9.2.25
Минимум и максимум количественных предикторов на сетке не совпадают с
минимальным и максимальным значением показателя, так как они определяются как
среднее ± 2сигма, в предположении, что предикторы имеют нормальное распределение.
По желанию пользователя границы диапазонов можно изменить. В рамке Число шагов
можно для каждого фактора задать количество диапазонов. Для категориальных
предикторов число шагов будет соответствовать числу значений предикторов минус 1,
причем настройки в этом диалоге можно задать, только так, чтобы уровни совпадали с
наблюдаемыми значениями категориальных предикторов. В этом диалоге уровни
категориальных предикторов всегда обозначаются соответствующими целыми числами
(например, для предиктора Нозологический диагноз – числами 1, 2, 3), независимо от
используемых в программе кодов. При использовании опции Сетка не рекомендуется
выбирать большое количество шагов, чтобы сократить длительные вычисления. Оставим
по умолчанию число шагов, равное 4 и щелкнем по ОК, программа вернется в диалог на
рис.9.2.23.
Если установлен флажок на опции Показать функцию желательности, то активной
станет рамка Функция желательности, в которой задаются параметры функции
желательности для отклика, название которого указано в верхней части рамки в
выпадающем списке. Если строятся линейные модели сразу для нескольких зависимых
переменных, то при нажатии на кнопку Переменная, в выпадающем списке будут
чередоваться имена откликов. После выбора имени отклика в поле Значение
высвечиваются уровни отклика – нижнее, среднее и верхнее значение в соответствии с
границами 2сигма. В поле Желательность высвечиваются значения желательности,
соответствующие уровням отклика, которые пользователь может изменить по своему
усмотрению. Функция желательности характеризует соответствие предсказанных
значений отклика, вычисленных по уровням предикторов, желательности значений
отклика. Например, в нашем случае отклик Post BDI характеризует выраженность тяжести
депрессии по шкале Бека в баллах после лечения, поэтому, естественно, нас интересуют те
значения предикторов, при которых отклик принимает минимальные значения, т.е., чем
Post BDI выше, тем желательность меньше, и наоборот, чем Post BDI ниже, тем
желательность больше. Поэтому нижнему значению отклика –2,977 поставим в
соответствие желательность 1,00, среднему значению 9,65 – желательность 0,5, верхнему
значению 22, 28 – желательность 0.00.
Если после проведенных манипуляций нажать на кнопку Вид, программа построит
таблицы с параметрами функции желательности (рис.9.2.26) и текущими (средними)
значениями факторов (рис.9.2.27), уровнями факторов и предсказанными откликами
(рис.9.2.28), а также соответствующий график профилей (рис.9.2.29).
Параметры функции желательности (Т аблица псих1)
Опции ф-ции желательности
для каждой завис. переменной
Перемен.
Нижн.
Знач.
Желат.
Знач.
Средний
Знач.
Желат.
Знач.
Верхн.
Знач.
Желат.
Знач.
s
Парам.
t
Парам.
Post BDI -2,97740 1,000000 9,6521700,50000022,28170 0,00 1,0000001,000000
Рис.9.2.26
Параметры текущего фактора и предсказанные отклики (Таблица псих1)
Предсказанные отклики на текущем уровне
каждого фактора в модели ной
Уровень
Pre BDI
Уровень
Возраст
Уровень
Длит. заб.
Уровень
Соц стат
Уровень
Ноз. диаг.
Предск.
Post BDI
Желат.
Знач.
-95%CI
Post BDI
+95%CI
Post BDI
Знач. 25,3913039,13043 834,8696Не работ деп. невр 5,8977330,6486373,6590918,136375
Рис.9.2.27
В таблице на рис.9.2.27 отображены средние значения предикторов, предсказанные в
соответствии с построенной линейной моделью значения отклика и вычисленные
значения желательности. В соответствии с установками параметров желательности
(рис.9.2.23), вычисленная желательность оценивает степень нашего предпочтения данного
предсказанного значения отклика. В строках таблицы на рис.9.2.28 представлены пять
уровней каждого количественного предиктора и все уровни категориальных предикторов
при средних значениях остальных предикторов, предсказанные отклики и значения
желательности для каждой комбинации предикторов.
Уровни факторов и предсказанные отклики (Таблица псих1)
Предск. отклики на каждом уровне каждого фактора
удерживать остальные факторы на текущем уровне
Фактор
Фактор
Уровень
Предск.
Post BDI
Желат.
Знач.
-95%CI
Post BDI
+95%CI
Post BDI
Pre BDI
Pre BDI
Pre BDI
Pre BDI
Pre BDI
Возраст
Возраст
Возраст
Возраст
Возраст
Длит. заб.
Длит. заб.
Длит. заб.
Длит. заб.
Длит. заб.
Соц стат
Соц стат
Ноз. диаг.
Ноз. диаг.
Ноз. диаг.
6,154870 1,07783 0,839455 -2,16787 4,32352
15,77308 3,48778 0,744046 1,00112 5,97443
25,39129 5,89773 0,648637 3,65909 8,13637
35,00949 8,30768 0,553228 5,65839 10,95697
44,6277010,717630,457819 7,22405 14,21121
14,79716 2,80423 0,771107 -1,43238 7,04084
26,96380 4,35098 0,709872 1,25267 7,44929
39,13043 5,89773 0,648637 3,65909 8,13638
51,29707 7,44448 0,587401 5,39881 9,49016
63,46371 8,99124 0,526166 6,32302 11,65945
-1591,89 9,23375 0,516565 5,58041 12,88708
-378,508 7,56574 0,582601 5,16656 9,96492
834,8696 5,89773 0,648637 3,65909 8,13638
2048,247 4,22973 0,714673 0,89608 7,56337
3261,624 2,56172 0,780708 -2,34349 7,46693
Работает10,872460,451689 9,08381 12,66112
Не работ 5,89773 0,648637 3,65909 8,13638
реакт. деп 5,91200 0,648072 2,77336 9,05065
деп. невр 5,89773 0,648637 3,65909 8,13638
моноп. тип31,840840,00000024,18290 39,49879
Рис.9.2.28
Красным цветом выделены уровни, которым соответствует максимальное значение
желательности. Так как почти все значения желательности близки к 1, то рассмотренные в
таблице комбинации значений предикторов соответствуют желательному для нас –
низкому уровню тяжести депрессии. Обратите внимание, что 2 уровня показателя
Длительность заболевания приняли значительные отрицательные значения, не
соответствующие наблюдаемому диапазону изменения длительности заболевания (5;
5110). Это вызвано большим разбросом значений показателя и существенным
отклонением от нормального распределения. Также примечательным является то, что
наибольшее значение желательности достигается при минимальных уровнях предикторов.
Это легко объяснить положительной, статистически значимой корреляцией отклика Post
BDI с предикторами Pre BDI и Длительность заболевания (рис.9.2.30).
Профили для предсказанных значений и желательности
Pre BDI
-15,00
5,8977
45,000
Возраст Длит. заб. Соц стат Ноз. диаг. Желательн.
1,
,5
0,
-2,977
9,6522
22,282
PostBDI
1,
,5
0,
6,1549
25,391
44,628
,64864
14,797
39,13
63,464 -1592,
834,87
3261,6 Работает
Не работ
реакт.деп
деп.невр
моноп.тип
Желательн.
Рис.9.2.29
Корреляции (Таблица псих1)
Отмеченные корреляции значимы на уровне p <,05000
N=46 (Построчное удаление ПД)
Переменная Pre BDI Длит. заб. Возраст
Post BDI 0,567205 0,368855 0,096053
Рис.9.2.30
На графиках (профилях), представленных на рис.9.2.29, изображены предсказанные
значения отклика, соответствующие различным уровням как непрерывных, так и
категориальных предикторов. Графики в верхней части рисунка соответствуют столбцу 2
(Предск. Post BDI) таблицы на рис.9.2.28, графики во 2-й строке – столбцу 3 (Желат. Знач.).
Красная вертикальная линия соответствует фиксированному уровню предикторов (в данном
случае – среднему). Последний график в верхней части рисунка соответствует значениям
желательности трех уровней отклика (–2,977; 9,65; 22, 28).

More Related Content

More from Alexan Khalafyan

Позиционный анализ для магистров
Позиционный анализ для магистровПозиционный анализ для магистров
Позиционный анализ для магистровAlexan Khalafyan
 
Общие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистровОбщие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистровAlexan Khalafyan
 
логилинейный анализ для магистров
логилинейный анализ для магистровлогилинейный анализ для магистров
логилинейный анализ для магистровAlexan Khalafyan
 
Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)Alexan Khalafyan
 
Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Alexan Khalafyan
 
Логлинейный анализ (главная)
Логлинейный анализ (главная)Логлинейный анализ (главная)
Логлинейный анализ (главная)Alexan Khalafyan
 
ответы к задачам по тв и мс
ответы к задачам по тв и мсответы к задачам по тв и мс
ответы к задачам по тв и мсAlexan Khalafyan
 
задачи для студентов по тв и мс
задачи для студентов по тв и мсзадачи для студентов по тв и мс
задачи для студентов по тв и мсAlexan Khalafyan
 
Mathematical statistic in sport of football
Mathematical statistic in sport of footballMathematical statistic in sport of football
Mathematical statistic in sport of footballAlexan Khalafyan
 
Современный статистический анализ данных. Второе издание.
Современный статистический анализ данных. Второе издание.Современный статистический анализ данных. Второе издание.
Современный статистический анализ данных. Второе издание.Alexan Khalafyan
 

More from Alexan Khalafyan (12)

Позиционный анализ для магистров
Позиционный анализ для магистровПозиционный анализ для магистров
Позиционный анализ для магистров
 
Общие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистровОбщие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистров
 
логилинейный анализ для магистров
логилинейный анализ для магистровлогилинейный анализ для магистров
логилинейный анализ для магистров
 
Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)
 
Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)
 
Логлинейный анализ (главная)
Логлинейный анализ (главная)Логлинейный анализ (главная)
Логлинейный анализ (главная)
 
ответы к задачам по тв и мс
ответы к задачам по тв и мсответы к задачам по тв и мс
ответы к задачам по тв и мс
 
задачи для студентов по тв и мс
задачи для студентов по тв и мсзадачи для студентов по тв и мс
задачи для студентов по тв и мс
 
Mathematical statistic in sport of football
Mathematical statistic in sport of footballMathematical statistic in sport of football
Mathematical statistic in sport of football
 
Современный статистический анализ данных. Второе издание.
Современный статистический анализ данных. Второе издание.Современный статистический анализ данных. Второе издание.
Современный статистический анализ данных. Второе издание.
 
монография
монографиямонография
монография
 
Aist
AistAist
Aist
 

Общие линейные модели (главн)

  • 1. 9.2. ОБЩИЕ ЛИНЕЙНЫЕ МОДЕЛИ Как мы уже ранее отмечали, в классическом регрессионном анализе предполагается, что отклик и предикторы – это непрерывные случайные величины, имеющие нормальное распределение. Однако в некоторых задачах в качестве предикторов целесообразно рассматривать качественные переменные, измеренные в номинальной или порядковой шкале. Если в качестве предикторов используются непрерывные и категориальные переменные, то для построения регрессионной модели следует использовать метод Общие линейные модели, который реализован в пакете STATISTICA с одноименным модулем (GLM). В §9.1. было показано, что степень снижения тяжести депрессии dBDI за курс комбинированной терапии (гКПТ + ФТ), зависит от качественных предикторов Группа, Социальный статус, Нозологический диагноз. Здесь: – гКПТ – это групповоая когнитивно-поведенческая терапия, ФТ – психофармакотерапия; – предиктор Группа разбивает выборку больных на подгруппы основная (экспериментальная) и контрольная. В основной группе больных лечили комбинированным методом гКПТ + ФТ, в контрольной – только ФТ; – Социальный статус принимает два текстовых значения: Работает и Не работает; – Нозологический диагноз принимает четыре текстовых значения: реактивная депрессия, депрессивный невроз, эндогенная депрессия монополярный тип, эндореактивная дистимия. Построим для больных основной группы общую линейную модель зависимости отклика Post BDI – показателя выраженности тяжести депрессии по шкале Бека в баллах после лечения, от качественных предикторов Социальный статус, Нозологический диагноз и количественных – Возраст, Длительность заболевания, Pre BDI – показателя выраженности тяжести депрессии по шкале депрессии Бека в баллах до лечения. Объем выборки (48 больных) недостаточен для проверки соответствия непрерывных переменных Возраст, Длительность заболевания нормальному распределению, поэтому гипотетически предположим, что такое соответствие присутствует. Одним из условий применимости метода Общие линейные модели, является отсутствие в таблице кростабуляции ячеек с нулевым элементом. На рис.9.2.1 показано, что в последней ячейке первой строки количество больных с социальным статусом Работает, имеющих нозологический диагноз эндореактивная дистимия равно 0. Поэтому исключим двух больных с этим диагнозом из анализа. Фрагмент файла данных, состоящий из первых 25 больных, представлен на рис.9.2.2. Итоговая таблица частот Частоты выделенных ячеек > 10 (Маргинальные суммы не отмечены) Условие включения: v1=1 Условие исключения: v1=4 Социальный статус (раб/не раб) Нозолог. диагноз реакт. деп Нозолог. диагноз деп. невр Нозолог. диагноз моноп. тип Нозолог. диагноз эндор. дист. Всего по стр. Работает 6 18 2 0 26 Не работ 6 12 2 2 22 Всего 12 30 4 2 48 Рис.9.2.1
  • 2. 1 Возраст 2 Соц стат 3 Ноз. диаг. 4 Длит. заб. 5 Pre BDI 6 Post BDI 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 24 Работает реакт. деп 5 22 5 41 Работает деп. невр 730 19 8 53 Не работ реакт. деп 60 37 10 42 Работает деп. невр 180 32 20 32 Работает моноп. тип 1095 15 9 63 Не работ деп. невр 1095 19 7 19 Работает деп. невр 730 32 6 19 Работает деп. невр 180 27 6 49 Не работ деп. невр 1095 14 5 43 Не работ деп. невр 365 39 8 19 Работает деп. невр 365 20 13 45 Не работ деп. невр 730 32 7 52 Не работ реакт. деп 120 26 10 47 Работает деп. невр 2555 21 12 31 Работает деп. невр 60 42 16 45 Работает деп. невр 730 44 15 44 Работает реакт. деп 60 16 5 29 Работает реакт. деп 14 18 12 46 Не работ моноп. тип 5110 38 31 33 Работает деп. невр 180 13 2 47 Не работ деп. невр 365 22 7 26 Не работ реакт. деп 90 23 5 51 Работает деп. невр 5110 13 3 24 Работает реакт. деп 10 22 5 41 Работает деп. невр 730 19 8 53 Не работ реакт. деп 60 37 10 42 Работает деп. невр 180 32 20 Рис.9.2.2 Для начала работы с модулем Общие линейные модели следует в меню Анализ высветить Углубленные методы анализа (рис.9.2.3). Рис.9.2.3
  • 3. Далее, в открывшемся меню надо щелкнуть по процедуре Общие линейные модели, откроется стартовое окно модуля (рис.9.2.4). Рис.9.2.4 Если в появившемся окне щелкнуть пол кнопке ОК, то откроется одноименное окно (рис.9.2.5), в котором надо щелкнуть по кнопке Переменные и в появившемся окне (рис.9.2.6) выделить зависимую переменную, категориальные и непрерывные предикторы. Рис.9.2.5
  • 4. Рис.9.2.6 После проведенных манипуляций стартовое окно программы примет вид, представленный на рис.9.2.7. Если нажать на ОК, то откроется окно Результаты анализа, в котором следует перейти на вкладку Итоги (рис.9.2.8). Рис.9.2.7 Если нажать на кнопку Одномерные результаты, то откроется таблица, в которой приведены одномерные результаты для оценки степени и характера взаимосвязи отклика Post BDI и эффектов в регрессионной модели (рис.9.2.9). Из таблицы видно, что статистически значимы все эффекты за исключением Длит. заб., так как уровни значимости р критерия Фишера меньше, чем 0,05. Но и для переменной Длит. заб. уровень значимости р равный 0,07, незначительно превосходит 0,05. Другими словами факторы Соц.стат., Нозолог. диагноз влияют на отклик, но они также взаимодействуют в своем влиянии на него. Наибольший вклад в общую линейную модель вносит эффект Ноз.диаг, так как статистика SS, равная 410,091, принимает наибольшее значение. Далее идут эффекты Соц.стат.*Ноз.диаг., Pre BDI, Возраст, Соц.стат., Длит.заб.
  • 5. Рис.9.2.8 Одномерные результаты для каждой Зав. Пер. Сигма-ограниченная параметризация Декомпозиция гипотезы Эффект Степени Свободы Post BDI SS Post BDI MS Post BDI F Post BDI p Св. член Возраст Длит. заб. Pre BDI Соц. стат. Ноз. диаг. Соц. стат.*Ноз. диаг. Ошибка Всего 1 10,021 10,0214 0,86409 0,358621 1 60,571 60,5705 5,22270 0,028121 1 38,699 38,6992 3,33684 0,075821 1 173,965 173,965115,00016 0,000423 1 50,216 50,2161 4,32989 0,044427 2 410,091 205,045317,68005 0,000004 2 263,400 131,700211,35587 0,000143 37 429,109 11,5975 45 1794,435 Рис.9.2.9 Для того, чтобы определить, как закодированы категориальные переменные в общей линейной модели, надо нажать на кнопку Члены плана (рис.9.2.8) и воспользоваться таблицей Метки столбцов на рис.9.2.10. Для кодирования категориальных предикторов в модуле использована сигма-ограниченная параметризация.
  • 6. Метки столбцов Метки для столбцов матрицы плана X Метка Столбец Перемен. Уровень Перемен. от Уровень Перемен. Уровень Перемен. от Уровень Св. член Возраст Длит. заб. Pre BDI Соц. стат. Ноз. диаг. Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. 1 2 Возраст 3 Длит. заб. 4 Pre BDI 5 Соц. стат. Работает Не работ 6 Ноз. диаг. реакт. деп моноп. тип 7 Ноз. диаг. деп. невр моноп. тип 8 Соц. стат. Работает Не работ Ноз. диаг. реакт. деп моноп. тип 9 Соц. стат. Работает Не работ Ноз. диаг. деп. невр моноп. тип Рис.9.2.10 При такой параметризации каждый эффект (фактор) представляется в виде совокупности одноименных двухуровневых эффектов. Например, так как переменная Соц.стат. имеет два уровня, то она и представляется с двумя уровнями: Работает, Не работает. Предиктор Ноз.диаг. состоит из 3 уровней, поэтому представляется в виде 2 одноименных двухуровневых переменных: Ноз.диаг. (реакт.деп., моноп.тип); Ноз.диаг. (деп.невр, моноп.тип). При этом уровню 1 присваивается числовое значение 1, а уровню 2 – числовое значение 0, или –1. Например, если рассматривается предиктор Соц.стат., то альтернативным значениям предиктора Работает, Не работает будут присвоены соответственно значения 1 и 0, которые будут представлять количественные различия между группами наблюдений (больных) Работает, Не работает. Предиктор Ноз. диаг. в строке 6 таблицы имеет 2 значения реакт.деп., моноп.тип, которые соответственно будут закодированы как 1 и 0. Этот же предиктор в строке 7 имеет 2 значения деп.невр, моноп.тип, которые также будут закодированы как 1 и 0. При этом, если больной имеет диагноз реакт.деп., то Ноз. диаг. в строке 6 примет значение 1, а Ноз. диаг. в строке 7 примет значение 0; если больной имеет диагноз деп.невр, то Ноз. диаг. в строке 6 примет значение 0, а Ноз. диаг. в строке 7 примет значение 1. Но если больной имеет диагноз моноп.тип, то Ноз. диаг. в строках 6 и 7 примет значение –1. Значения, обозначающие членство в одной из двух групп, выбираются с учетом облегчения последующей интерпретации регрессионного коэффициента, соответствующего этому предиктору. Поэтому, если регрессионный коэффициент для этой переменной является положительным, то группа, закодированная с помощью значения 1, будет иметь большее предсказанное значение отклика. Если получен отрицательный регрессионный коэффициент, то группа, закодированная значением 1, будет иметь меньшее предсказанное значение отклика. Значения сложных эффектов Соц.стат.*Ноз.диаг. в строках 8 и 9 также кодируются числами 1 и 0, которые являются результатами умножения соответствующих числовых значений предикторов Соц.стат., Ноз.диаг. Так, для Соц.стат.*Ноз.диаг. в строке 8 возможны следующие 4 комбинации Работает*реакт. деп., Работает*моноп. тип, Не работает*реакт. деп., Не работает*моноп. Тип, которые в регрессионных моделях принимают следующие значения:1·1 =1, 1·0 = 0, 0·1 = 0, 0·0 = 0. Для Соц.стат.*Ноз.диаг. в строке 9 возможны другие 4 комбинации Работает*деп.невр, Работает*моноп. тип, Не работает*деп.невр., Не работает*моноп. Тип, которые принимают следующие значения:1·1 =1, 1·0 = 0, 0·1 = 0, 0·0 = 0. Обратите внимание, что сумма всех значений каждого простого и сложного эффекта равна 1. Если нажать на кнопку Коэффициенты, то откроется таблица Оценки параметров (рис.9.2.11), в третьем столбце которой (Post BDI Парам.) отображены коэффициенты регрессионного уравнения. В первом столбце (Уровень Эффект) приведены уровни
  • 7. эффектов Работает, реакт. деп., деп. невр, которые кодируются программой как 1. В четвертом столбце таблицы приведены стандартные ошибки параметров, которые определяются как стандартное отклонение параметра, деленное на объем выборки. Характеризуют точность вычисления параметров. Для всех эффектов, за исключением свободного члена, стандартные ошибки значительно меньше оцениваемых параметров. В столбцах 5 и 6 приведены значения t-критерия (критерия Стьюдента) и соответствующие им уровни значимости р для оценки значимости коэффициентов регрессионного уравнения. Так как р эффектов Св. член и Длит. заб. больше, чем 0,05, то соответствующие им параметры статистически не значимы и из общей линейной модели могут быть удалены. Оценки параметров (Таблица псих1) Сигма-ограниченная параметризация Эффект Уровень Эффект Столбец Post BDI Парам. Post BDI Ст.Ош. Post BDI t Post BDI p -95,00% Дов.Пр. Св. член Возраст Длит. заб. Pre BDI Соц. стат. Ноз. диаг. Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. 1 2,50478 2,694565 0,92957 0,358621 -2,95493 2 0,12713 0,055629 2,28532 0,028121 0,01442 3 -0,00137 0,000753 -1,82670 0,075821 -0,00290 4 0,25056 0,064694 3,87300 0,000423 0,11948 Работает 5 -1,85635 0,892116 -2,08084 0,044427 -3,66395 реакт. деп 6 -5,35170 1,256505 -4,25920 0,000135 -7,89763 деп. невр 7 -4,30875 0,841715 -5,11901 0,000010 -6,01422 1 8 3,28649 0,954883 3,44177 0,001449 1,35171 2 9 4,34371 1,076842 4,03375 0,000264 2,16182 Рис.9.2.11 Если нажать на кнопку Общая R модели, то справедливым будет вывод, что в целом, построенная модель взаимосвязи отклика с предикторами достаточно адекватная, так коэффициент множественной корреляции R = 0,87 и близок к 1, а R2 = 0, 76 значительно больше, чем 0,5 и описывает более 76% изменчивости отклика (рис.9.2.12). SS модели и SS остатков (Таблица псих) Условие включения: v1=1 Условие исключения: v5=4 Зависим. Перемен. Множеств R Множеств R2 Скоррект R2 SS Модель сс Модель MS Модель SS Остаток сс Остаток MS Остаток Post BDI 0,872277 0,760867 0,7091621365,326 8 170,6657429,1093 37 11,59755 Рис.9.2.12 Категориальные переменные Социальный статус, Нозологические болезни делят всю совокупность больных на подгруппы. Значимость категориальных факторов в модели определяется различием средних в подгруппах. Если воспользоваться кнопкой Статистики ячеек, то появится таблица, в которой будут отображены значения средних отклика Post BDI во всех 11 подгруппах, также приведены стандартные отклонения, стандартные ошибки и доверительные интервалы вычисленных оценок (рис.9.2.13).
  • 8. Описательные статистики для зависимых переменных (Таблица псих1) Эффект Уровень Фактор Уровень Фактор N Post BDI Среднее Post BDI Ст.Откл. Post BDI Ст.Ош. Post BDI -95,00% Post BDI +95,00% Всего Соц. стат. Соц. стат. Ноз. диаг. Ноз. диаг. Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. Соц. стат.*Ноз. диаг. 46 9,65217 6,31477 0,931062 7,77692 11,52743 Работает 26 9,46154 5,09298 0,998816 7,40444 11,51864 Не работ 20 9,90000 7,75887 1,734935 6,26874 13,53126 реакт. деп 12 7,83333 3,04014 0,877612 5,90172 9,76494 деп. невр 30 9,00000 5,01033 0,914758 7,12911 10,87089 моноп. тип 4 20,00000 12,70171 6,350853 -0,21125 40,21125 Работает реакт. деп 6 7,33333 3,61478 1,475730 3,53985 11,12682 Работает деп. невр 18 10,22222 5,66263 1,334694 7,40626 13,03818 Работаетмоноп. тип 2 9,00000 0,00000 0,000000 9,00000 9,00000 Не работ реакт. деп 6 8,33333 2,58199 1,054093 5,62370 11,04296 Не работ деп. невр 12 7,16667 3,24271 0,936089 5,10635 9,22698 Не работ моноп. тип 2 31,00000 0,00000 0,000000 31,00000 31,00000 Рис.9.2.13 К сожалению по данной таблице невозможно оценить статистическую значимость отличия средних в подгруппах больных. Статистическую значимость отличия средних в подгруппах больных отклика Post BDI можно оценить при помощи критерия наименьшей значимой разности (НЗР). Для этого надо воспользовавшись кнопкой Больше (рис.9.2.7), перейти в диалог, окно которого представлено на рис.9.2. 14. Рис.9.2.14 Далее перейти на вкладку Апостер. и нажать на кнопку Фишера НЗР, предварительно установив при помощи выпадающего меню в поле Эффект «Соц.стат» «Ноз.диаг». Из открывшейся таблицы (рис.9.2.15) видно, что наиболее эффективно лечение комбинированным методом в подгруппе 5 – неработающих больных с диагнозом депрессивный невроз, так как отклик Post BDI принимает наименьшее значение, равное 7,1667. Но при этом отличие статистически значимо лишь с подгруппами 2 и 6, работающих с депрессивным неврозом (10,222) и неработающих больных с диагнозом
  • 9. монополярный тип (31). Среднее значения отклика в подгруппе 6 принимает достаточно большое значение, равное 31, что свидетельствует о низкой эффективности лечения для этих больных. Среднее значение отклика в этой подгруппе значительно и статистически значимо отличается от средних во всех остальных 5 подгруппах. В группах больных по диагнозу наиболее эффективно лечение больных с диагнозом реактивная депрессия (7,8333) и наименее эффективно в группе монополярный тип (20,0). Причем среднее отклика в этой группе статистически значимо отличается от средних в группах 1 (7,8333) и 2 (9,0). В группах больных по социальному статусу отличие средних отклика не является статистически значимым. НЗР крит.; перем.Post BDI (Т аблица псих1) Вероятности для апостер. критериев Ошибка: Межгр. MS = 11,598, сс = 37,000 N ячейки Соц. стат. Ноз. диаг. {1} 7,3333 {2} 10,222 {3} 9,0000 {4} 8,3333 {5} 7,1667 {6} 31,000 1 2 3 4 5 6 Работает реакт. деп 0,0800980,5525640,6140510,9225560,000000 Работает деп. невр 0,080098 0,6329910,2468690,0211630,000000 Работаетмоноп. тип0,5525640,632991 0,8118420,4853140,000000 Не работ реакт. деп 0,6140510,2468690,811842 0,4975120,000000 Не работ деп. невр 0,9225560,0211630,4853140,497512 0,000000 Не работ моноп. тип0,0000000,0000000,0000000,0000000,000000 Рис.9.2.15 НЗР крит.; перем.Post BDI Вероятности для апостер. критериев Ошибка: Межгр. MS = 11,598, сс = 37,000 N ячейки Ноз. диаг. {1} 7,8333 {2} 9,0000 {3} 20,000 1 2 3 реакт. деп 0,322387 0,000000 деп. невр 0,322387 0,000001 моноп. тип0,0000000,000001 НЗР крит.; перем.Post BDI Вероятности для апостер. крит Ошибка: Межгр. MS = 11,598, N ячейки Соц. стат. {1} 9,4615 {2} 9,9 1 2 Работает 0,67 Не работ0,667612 Рис.9.2.16 В программе предусмотрена возможность сравнения значений отклика, вычисленных программой по составленной модели Post BDI Предск., с исходными значениями Post BDI Наблюд. из таблицы исходных данных. Для этого надо перейти на вкладку Остатки 1 (рис.9.2.17) и нажать на кнопку Предсказ. и остатки.
  • 10. Рис.9.2.17 На рис.9.2.18 приведен фрагмент таблицы для первых 25 больных. Из таблицы видно, что уравнение достаточно «хорошо» предсказывает значение отклика Post BDI – тяжесть состояния больных по шкале Бека после лечения комбинированным методом. Существенные отличия у больных под номерами 4, 11, 18, 20, что в принципе можно объяснить также и высокими погрешностями бальной оценки состояния больных.
  • 11. Наблюдаемые, предсказанные значения и остатки (Т аблица псих1) Сигма-ограниченная параметризация (Анализируемая выборка) Номер набл. Post BDI Наблюд. Post BDI Предск. Post BDI Остатки 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 5,00000 7,13982 -2,13982 8,00000 9,65289 -1,65289 10,0000011,64914 -1,64914 20,0000013,79339 6,20661 9,00000 9,00000 -0,00000 7,00000 6,97327 0,02673 6,00000 10,11331 -4,11331 6,00000 9,61658 -3,61658 5,00000 3,94064 1,05936 8,00000 10,44541 -2,44541 13,00000 7,60834 5,39166 7,00000 8,44398 -1,44398 10,00000 8,68335 1,31665 12,00000 8,40800 3,59200 16,0000015,06553 0,93447 15,0000016,42544 -1,42544 5,00000 8,10345 -3,10345 12,00000 6,76085 5,23915 31,0000029,99648 1,00352 2,00000 7,88855 -5,88855 7,00000 6,69439 0,30561 5,00000 4,66751 0,33249 3,00000 3,39972 -0,39972 5,00000 7,13294 -2,13294 8,00000 9,65289 -1,65289 10,0000011,64914 -1,64914 20,0000013,79339 6,20661 Рис.9.2.18 Если нажать на кнопку Набл. и предск., то программа отобразаит диаграмму рассеяния наблюдаемых (по оси ОХ) и предсказанных (по оси ОY) значений отклика (рис.9.2.19). Чем ближе расположены точки на плоскости к линии регрессии, тем адекватнее модель описывает взаимосвязь предикторов и отклика. График подтверждает высокую адекватность модели. Еще одним показателем адекватности модели является соответствие закона распределения остатков (разности между прогнозными значениями отклика и наблюдаемыми) нормальному закону с математическим ожиданием, равным 0 (белый шум). Для построения гистограммы надо щелкнуть по кнопке Остатки. По рис.9.2.20 можно сделать вывод, что гистограмма остатков действительно имеет визуальное сходство с нормальным распределением со средним значением, равным 0 (ось симметрии). Это еще раз подчеркивает адекватность модели.
  • 12. Наблюдаемые и предсказанные значения Зависимая переменная: Post BDI (Анализируемая выборка) -5 0 5 10 15 20 25 30 35 Наблюдаемые значения 0 5 10 15 20 25 30 35 Предсказанныезначения Рис.9.2.19 Гистограмма исходных остатков Зависимая переменная: Post BDI (Анализируемая выборка) -10 -8 -6 -4 -2 0 2 4 6 8 X <= Граница категории 0 2 4 6 8 10 12 14 16 Кол-вонабл. Рис.9.2.20 В соответствии с параметрами общей линейной модели (коэффициентами регрессии, рис.9.2.11) легко выписать уравнение регрессии: Post BDI = 2,504 + 0,127Возраст – 0,001Длит. заб. + 0 ,250Pre BDI – 1,856Соц стат/(Работает) – 5,351Ноз. диаг.(реакт. деп) – 4,308Ноз. диаг.(деп. невр) + 3,286 Соц стат*Ноз. диаг.(1) + 4,343Соц стат*Ноз. диаг.(2) Так как количество предикторов не велико, то можно воспользоваться общей линейной моделью для прогнозирования тяжести состояния больного по шкале Бека после лечения для произвольного больного. Применим ручной счет при помощи обычного калькулятора. Для этого надо в уравнение подставить значения предикторов и произвести несложные арифметические действия. С количественными предикторами здесь все предельно
  • 13. понятно, а с категориальными, с учетом принципов сигма-ограниченной параметризации следует поступить так: – если больной из подгруппы Работает, то эффект Соц стат/(Работает) следует заменить на 1, если из подгруппы Не работает, то Соц стат/(Работает) следует заменить на 0; – если диагноз больного реакт. деп., то Ноз. диаг.(реакт. деп) следует заменить на 1, а Ноз. диаг.(деп. невр) на 0; – если диагноз больного деп. невр., то Ноз. диаг.(деп. невр) следует заменить на 1, а Ноз. диаг.(реакт. деп) на 0; – если диагноз больного моноп. тип, то Ноз. диаг.(реакт. деп) и Ноз. диаг.(деп. невр) следует заменить на –1. – если эффект Соц стат*Ноз. диаг.(1) соответствует комбинации Работает*реакт. деп., то его следует заменить на 1, в любом другом случае – на 0. – если эффект Соц стат*Ноз. диаг.(2) соответствует комбинации Работает* деп. невр., то его следует заменить на 1, в любом другом случае – на 0. В качестве иллюстрации вычислим, например прогнозное значение отклика Post BDI для больного М. (№ 2, см. рис.9.2.2), если возраст 41 год, работает, диагноз – депрессивный невроз, длительность заболевания 730 дней, показатель выраженности тяжести депрессии по шкале депрессии Бека в баллах до лечения Pre BDI = 19. Подставим данные больного в уравнение, исключив свободный член, получим: Post BDI = 0,12713· 41 – 0,00137·730 + 0 ,25056·19 – 1,85635·1 – 5,3517·0 – 4,30874·1 – 3,28648·0 + 4,34371 = 7,15149. Это означает, что прогнозируемая тяжесть состояния больного по шкале Бека после лечения комбинированной терапией составит 7 баллов. Реальное значение тяжести состояния для больного М. после лечения составило 8 баллов. Ошибка в прогнозе равна 8 – 7,2 = 0,8 балла (10%). Учитывая, что балльная шкала сама по себе достаточно грубая измерительная шкала, погрешность в 0,8 балла является незначительной. Если к вычисленному значению добавить удаленный нами свободный член, то получим 7,15149 + 2,50477 = 9,65625. Если на вкладке Отчет (рис.9.2.21) щелкнуть по кнопке Уравнение предсказания, то программа сама выпишет уравнение регрессии: "Post BDI" = 2,50477626 + 0,127130542 * Возраст - 0,00137468 * "Длит. заб." + 0,250561207*"Pre BDI" - 1,8563479*"Соц стат"(Работает) - 5,3517041*"Ноз. диаг."("реакт. деп") - 4,3087480 * "Ноз. диаг."("деп. невр") + 3,28648701 * "Соц стат" * "Ноз. диаг."(1) + 4,34371226 * "Соц стат" * "Ноз. диаг."(2) В модуле Общие линейные модели программы STATISTICA предусмотрена возможность сгенерировать код (автоматически составить текст процедуры) на одном из языков программирования − STATISTICA Visual Basic (SVB), C/C++, PMML код. Если выбрать SVB, то программа напишет текст процедуры и создаст макрос, который потом можно будет сохранить и использовать для автоматического вычисления величины отклика при заданных пользователем значениях предикторов. Можно воспользоваться сохраненным кодом программы для вычисления прогнозного значения тяжести состояния по шкале Бека произвольного больного после лечения комбинированной терапией. Для этого достаточно последовательно в соответствии с запросами программы ввести в окно (рис.9.2.22) данные больного. В качестве примера введены данные больного М. (№ 2, рис.9.2.10). После ввода значения последнего
  • 14. предиктора – длительности заболевания (Dlit. zab), равного 730 и нажатия на Enter, программа в последней строке запишет результат автоматически произведенных вычислений – 9,65289. Рис.9.2.21 Рис.9.2.22 Обратите внимание, что вычисленное программой значение примерно равно значению 9,65625, вычисленному нами вручную по построенному уравнению. Незначительное расхождение вызвано погрешностью округления до пятого знака после запятой.
  • 15. Таким образом, построена вполне адекватная общая линейная модель, которая позволяет с достаточно высокой точностью прогнозировать тяжесть состояния по шкале Бека больного после лечения комбинированной терапией, если известны возраст больного, длительность заболевания, тяжесть состояния больного по шкале Бека до лечения, нозологический диагноз и его социальный статус. Если перейти на вкладку Профили, то откроется диалог (рис.9.2.23), в котором можно просмотреть предсказанные отклики и профили для предсказанных значений и желательности. Профили – это графики зависимостей отклика и функции желательности от равноотстоящих значений предикторов при фиксированных на определенном уровне текущих значений других предикторов. Для построения профилей интервалы изменения предикторов разбиваются на диапазоны и, для вычисления отклика в соответствии с построенным уравнением регрессии рассматриваются границы диапазонов, которые называются уровнями факторов. Число уровней фактора равно количеству диапазонов плюс 1. Рис.9.2.23 Установить параметры анализа можно, воспользовавшись кнопкой Опции. Если в поле Параметры профилей отклика открывшегося диалога установить флажок Показывать таблицы с графиками (рис.9.2.24), то будут построены таблицы и графики, в противном случае – только графики. В нижней рамке окна Метод подгонки можно выбрать метод подгонки поверхности к значениям желательности. В рамке Значения факторов окна на рис.9.2.23 можно задать фиксированные текущие значения предикторов. Опция Среднее означает, что текущие значения предикторов будут равны их средним значениям. Опция Пользователя предполагает, что текущие значения предикторов могут быть заданы пользователем, опция Оптимальные означает, что текущий уровень каждого предиктора равен значению, оптимизирующему желательность отклика. При выборе опции Оптимальные активной станет рамка Параметры функции желательности и появится галочка перед строкой Показать функцию желательности.
  • 16. Выберем опцию Среднее и установим флажок на опцию Показать функцию желательности. Рис.9.2.24 Для того чтобы задать количество уровней факторов надо нажать на кнопку Сетка. В появившемся окне (рис.9.2.25) в рамке Фактор при помощи кнопок Назад, Далее и выпадающего меню можно просмотреть диапазоны изменения факторов (предикторов) от минимального до максимального значений. Рис.9.2.25 Минимум и максимум количественных предикторов на сетке не совпадают с минимальным и максимальным значением показателя, так как они определяются как среднее ± 2сигма, в предположении, что предикторы имеют нормальное распределение. По желанию пользователя границы диапазонов можно изменить. В рамке Число шагов можно для каждого фактора задать количество диапазонов. Для категориальных предикторов число шагов будет соответствовать числу значений предикторов минус 1, причем настройки в этом диалоге можно задать, только так, чтобы уровни совпадали с наблюдаемыми значениями категориальных предикторов. В этом диалоге уровни категориальных предикторов всегда обозначаются соответствующими целыми числами
  • 17. (например, для предиктора Нозологический диагноз – числами 1, 2, 3), независимо от используемых в программе кодов. При использовании опции Сетка не рекомендуется выбирать большое количество шагов, чтобы сократить длительные вычисления. Оставим по умолчанию число шагов, равное 4 и щелкнем по ОК, программа вернется в диалог на рис.9.2.23. Если установлен флажок на опции Показать функцию желательности, то активной станет рамка Функция желательности, в которой задаются параметры функции желательности для отклика, название которого указано в верхней части рамки в выпадающем списке. Если строятся линейные модели сразу для нескольких зависимых переменных, то при нажатии на кнопку Переменная, в выпадающем списке будут чередоваться имена откликов. После выбора имени отклика в поле Значение высвечиваются уровни отклика – нижнее, среднее и верхнее значение в соответствии с границами 2сигма. В поле Желательность высвечиваются значения желательности, соответствующие уровням отклика, которые пользователь может изменить по своему усмотрению. Функция желательности характеризует соответствие предсказанных значений отклика, вычисленных по уровням предикторов, желательности значений отклика. Например, в нашем случае отклик Post BDI характеризует выраженность тяжести депрессии по шкале Бека в баллах после лечения, поэтому, естественно, нас интересуют те значения предикторов, при которых отклик принимает минимальные значения, т.е., чем Post BDI выше, тем желательность меньше, и наоборот, чем Post BDI ниже, тем желательность больше. Поэтому нижнему значению отклика –2,977 поставим в соответствие желательность 1,00, среднему значению 9,65 – желательность 0,5, верхнему значению 22, 28 – желательность 0.00. Если после проведенных манипуляций нажать на кнопку Вид, программа построит таблицы с параметрами функции желательности (рис.9.2.26) и текущими (средними) значениями факторов (рис.9.2.27), уровнями факторов и предсказанными откликами (рис.9.2.28), а также соответствующий график профилей (рис.9.2.29). Параметры функции желательности (Т аблица псих1) Опции ф-ции желательности для каждой завис. переменной Перемен. Нижн. Знач. Желат. Знач. Средний Знач. Желат. Знач. Верхн. Знач. Желат. Знач. s Парам. t Парам. Post BDI -2,97740 1,000000 9,6521700,50000022,28170 0,00 1,0000001,000000 Рис.9.2.26 Параметры текущего фактора и предсказанные отклики (Таблица псих1) Предсказанные отклики на текущем уровне каждого фактора в модели ной Уровень Pre BDI Уровень Возраст Уровень Длит. заб. Уровень Соц стат Уровень Ноз. диаг. Предск. Post BDI Желат. Знач. -95%CI Post BDI +95%CI Post BDI Знач. 25,3913039,13043 834,8696Не работ деп. невр 5,8977330,6486373,6590918,136375 Рис.9.2.27 В таблице на рис.9.2.27 отображены средние значения предикторов, предсказанные в соответствии с построенной линейной моделью значения отклика и вычисленные значения желательности. В соответствии с установками параметров желательности (рис.9.2.23), вычисленная желательность оценивает степень нашего предпочтения данного предсказанного значения отклика. В строках таблицы на рис.9.2.28 представлены пять уровней каждого количественного предиктора и все уровни категориальных предикторов при средних значениях остальных предикторов, предсказанные отклики и значения желательности для каждой комбинации предикторов.
  • 18. Уровни факторов и предсказанные отклики (Таблица псих1) Предск. отклики на каждом уровне каждого фактора удерживать остальные факторы на текущем уровне Фактор Фактор Уровень Предск. Post BDI Желат. Знач. -95%CI Post BDI +95%CI Post BDI Pre BDI Pre BDI Pre BDI Pre BDI Pre BDI Возраст Возраст Возраст Возраст Возраст Длит. заб. Длит. заб. Длит. заб. Длит. заб. Длит. заб. Соц стат Соц стат Ноз. диаг. Ноз. диаг. Ноз. диаг. 6,154870 1,07783 0,839455 -2,16787 4,32352 15,77308 3,48778 0,744046 1,00112 5,97443 25,39129 5,89773 0,648637 3,65909 8,13637 35,00949 8,30768 0,553228 5,65839 10,95697 44,6277010,717630,457819 7,22405 14,21121 14,79716 2,80423 0,771107 -1,43238 7,04084 26,96380 4,35098 0,709872 1,25267 7,44929 39,13043 5,89773 0,648637 3,65909 8,13638 51,29707 7,44448 0,587401 5,39881 9,49016 63,46371 8,99124 0,526166 6,32302 11,65945 -1591,89 9,23375 0,516565 5,58041 12,88708 -378,508 7,56574 0,582601 5,16656 9,96492 834,8696 5,89773 0,648637 3,65909 8,13638 2048,247 4,22973 0,714673 0,89608 7,56337 3261,624 2,56172 0,780708 -2,34349 7,46693 Работает10,872460,451689 9,08381 12,66112 Не работ 5,89773 0,648637 3,65909 8,13638 реакт. деп 5,91200 0,648072 2,77336 9,05065 деп. невр 5,89773 0,648637 3,65909 8,13638 моноп. тип31,840840,00000024,18290 39,49879 Рис.9.2.28 Красным цветом выделены уровни, которым соответствует максимальное значение желательности. Так как почти все значения желательности близки к 1, то рассмотренные в таблице комбинации значений предикторов соответствуют желательному для нас – низкому уровню тяжести депрессии. Обратите внимание, что 2 уровня показателя Длительность заболевания приняли значительные отрицательные значения, не соответствующие наблюдаемому диапазону изменения длительности заболевания (5; 5110). Это вызвано большим разбросом значений показателя и существенным отклонением от нормального распределения. Также примечательным является то, что наибольшее значение желательности достигается при минимальных уровнях предикторов. Это легко объяснить положительной, статистически значимой корреляцией отклика Post BDI с предикторами Pre BDI и Длительность заболевания (рис.9.2.30).
  • 19. Профили для предсказанных значений и желательности Pre BDI -15,00 5,8977 45,000 Возраст Длит. заб. Соц стат Ноз. диаг. Желательн. 1, ,5 0, -2,977 9,6522 22,282 PostBDI 1, ,5 0, 6,1549 25,391 44,628 ,64864 14,797 39,13 63,464 -1592, 834,87 3261,6 Работает Не работ реакт.деп деп.невр моноп.тип Желательн. Рис.9.2.29 Корреляции (Таблица псих1) Отмеченные корреляции значимы на уровне p <,05000 N=46 (Построчное удаление ПД) Переменная Pre BDI Длит. заб. Возраст Post BDI 0,567205 0,368855 0,096053 Рис.9.2.30 На графиках (профилях), представленных на рис.9.2.29, изображены предсказанные значения отклика, соответствующие различным уровням как непрерывных, так и категориальных предикторов. Графики в верхней части рисунка соответствуют столбцу 2 (Предск. Post BDI) таблицы на рис.9.2.28, графики во 2-й строке – столбцу 3 (Желат. Знач.). Красная вертикальная линия соответствует фиксированному уровню предикторов (в данном случае – среднему). Последний график в верхней части рисунка соответствует значениям желательности трех уровней отклика (–2,977; 9,65; 22, 28).