2. Проблема
l Медицина состоит как из закономерных, так и
случайных явлений
l Пример:
l Курение связано с раком легкого
l Однако не у всех курильщиков развивается рак
легкого, и не все больные раком легкого курят
(влияние случайности)
l Однако мы знаем, что связь существует
(закономерность)
l Проблема состоит в том, чтобы
идентифицировать закономерность,
отличить ее от случайности и оценить.
4. l Статистика – это факты и цифры
l Статистика - набор методов и правил
организации, обобщения и интерпретации
информации.
l Включает набор стандартизованных
процедур, используемых научным
сообществом.
5. “Стоя одной ногой в ледяной воде, а другой -
в кипящей, вы чувствуете себя вполне
комфортно … в среднем”
“В среднем наш класс учится хорошо.
Половина учеников считает, что 2+2=3, а
вторая половина - что 2+2=5.”
Какова вероятность встретить на улице
слона: (1) крайне низкая (2) 50%
In God we trust. All others must bring data.
Что такое статистика?
6. l Н.И.Пирогов, 1849:
"... приложение статистики для
определения диагностической важности
симптомов и достоинства операций
можно ... рассматривать как важное
приобретение новейшей хирургии"
7. Зачем нам статистика?
l Описательная статистика
1. обобщение данных
l Индуктивная статистика
2. определение по выборке популяционных значений
3. выявление взаимосвязи между воздействием и
заболеванием
4. оценка достоверности различий между группами
l анализ связи нескольких переменных с заданным
исходом
l определить эффективность диагностического теста
l объединить результаты нескольких исследований
l оценить эффективность затрат в медицине
l анализ принятия решений в медицине
8. Типы данных
l Количественные (АД, рост,
концентрация инсулина)
l Качественные (раса, пол)
l Порядковые (стадия заболевания)
9. Исследование
антиэпилептического препарата
l Цель – оценка эффективности лекарственного
препарата прогабида в уменьшении частоты
эпилептических приступов.
l С момента начала исследования пациенты
активной и контрольной групп посещали врача 2
раза в неделю.
l Представлены данные о числе приступов за 2
недели до 4 визита.
l Другие переменные: возраст пациента, число
приступов за 8 недель до начала исследования.
10. Анализ результатов
l Исход (Зависимая переменная)
l Число приступов
l Количественные дискретные данные
l Предикторы (Независимые переменные)
l Лечение
l Качественные, номинальные данные
l Возраст
l Количественные порядковые данные
l Число приступов до начала лечения
l Количественные данные
11. Сбор данных - таблица
# ФИО Возраст Курс Факультет Пол …
1 Фио1 17 1 Лечебный муж
2 Фио2 20 4 ФПНПК жен
3 Фио3 21 5 МПФ муж
4 …
12. Трансформация данных
l Пол: жен – 1, муж – 0
l Возраст: (20-29) – 1, (30-39) – 2, (30-39) – 3, …
l Факультет: ФПНПК – 1, ЛФ – 2, МПФ – 3, …
17. 1. Обобщение данных
l Измерение центральной тенденции
l Среднее (арифметическое)
l Медиана (центральное значение ряда величин)
l Измерение дисперсии (вариабельности)
l Стандартное отклонение (отражает
распределение значений вокруг среднего)
l Диапазон (разность крайних значений)
19. 050100150050100150
20 30 40 50 60 20 30 40 50 60
African-American Caucasian, Non-Hispanic
Hispanic Other
Frequency
BMI
Graphs by RaceEthDesc
Body Mass Index (BMI) distributions - SABOR participants
21. 2. Определение по выборке
популяционных значений
Результаты, полученные на выборке, могут
отличаться от популяционных вследствие
влияния случайности
Доверительный интервал (confidence interval)
l Среднее ± 2 стандартных отклонения (95%
ДИ)
l Позволяет оценить в каких пределах может
находиться истинное значение параметра в
популяции.
l Отражает степень достоверности данных
22. Пример оценки доверительного
интервала
l 50 людей попробовали препараты А и Б.
35 из них (70%) предпочли препарат А.
l 95% доверительный интервал = [0,57; 0,83]
l Интерпретация: мы на 95% уверены, что от
57 до 83% общей популяции предпочтет
препарат А
l Условие: большая, репрезентативная,
случайная выборка
( )83,.57.
50
)3(.7.
96.17.
)1(
2/ =±=
-
±
n
pp
zp a
23. Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
24. Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
«Казнить нельзя помиловать»
25. Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
«Казнить, нельзя помиловать»
26. Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
«Казнить, нельзя помиловать»
Нет! Необходимо сопоставление с
данными других отделений,
выполняющих аналогичные операции.
28. Пример (2)
Средняя летальность при данном типе
операций в данной возрастной группе
составляет 16/123 = 13%
«Казнить, нельзя помиловать» - ?
29. Пример (2)
Средняя летальность при данном типе
операций в данной возрастной группе
составляет 16/123 = 13%
«Казнить, нельзя помиловать» - ?
Нет!
В отделение А поступают более тяжелые
пациенты.
Отделение А имеет недостаточный опыт:
например, 2/3 = 66%.
30. Пример (3)
l Тяжесть патологии не отличается.
l Всего 15 операций, 9 из них – с
летальным исходом (60%).
l Нижняя граница доверительного
интервала для данной выборки – 36%
l Верхняя граница доверительного
интервала для других отделений – 19%
31. Пример (3)
l Тяжесть патологии не отличается.
l Всего 15 операций, 9 из них – с
летальным исходом (60%).
l Нижняя граница доверительного
интервала для данной выборки – 36%
l Верхняя граница доверительного
интервала для других отделений – 19%
l «Казнить, нельзя помиловать»
33. Риск
ПРОПОРЦИЯ
Соотношение числа заболевших
субъектов и общей численности группы.
ОТНОСИТЕЛЬНЫЙ РИСК,
СООТНОШЕНИЕ РИСКОВ (СР, RR)
Соотношение заболеваемости среди
лиц, подвергавшихся и не
повергавшихся воздействию факторов
риска (R1/R2) в когортном исследовании
35. Пример (Swinscow, 1996)
Тип вакцины Грипп + Грипп - Всего
I 43 237 280
II (контроль) 52 198 250
Риск в основной группе = 43/280 = 0,154
Риск в контрольной группе = 52/250 = 0,208
Относительный риск (СР) = 0,154/0,208 = 0,74
36. Число больных, которых
необходимо пролечить
ЧБНЛ (NNT) = 1/(R1- R2) =
=1/(0,208-0,154)=18.5
Следовательно, в среднем необходимо
вакцинировать 19 пациентов вакциной I,
чтобы защитить 1 пациента от гриппа (по
сравнению с вакциной II).
38. Шансы
ШАНСЫ
Соотношение вероятности заболеть и
вероятности не заболеть.
Вероятность заболевания 20% - шансы 1/4
СООТНОШЕНИЕ ШАНСОВ (СШ, ODDS RATIO,
OR)
Используется для оценки относительного
риска в исследованиях случай-контроль.
40. Оценка взаимосвязи.
Исследование случай-контроль.
Doll and Hill (BMJ 1950; 2:739-748)
Случаи – госпитализированные пациенты (мужчины) с
раком легкого
Фактор риска – курение (в анамнезе или текущее)
1. Рак легкого 1. Контроль
2. Курение Да 647 622
Нет 2 27
Всего 649 649
Соотношение шансов (odds ratio)
СШ = (647/622)/(2/27) = 647*27/622*2 = 14
41. 4. Оценка достоверности
различий между группами
l Значение р - вероятность того, что
полученный результат абсолютно
случаен
l р = 1 (абсолютно случайный)
l р = 0 (абсолютно неслучайный)
Величина р меньше заданной альфа-ошибки
свидетельствует о статистической достоверности
полученного различия
42. Типы ошибок
l Ошибка I типа (альфа)
l Выявление различий там, где их в
действительности нет (вероятность
наказания невиновного). Обычно α=0,05
l Ошибка II типа (бета)
l Не выявление различий там, где они есть
(вероятность оправдания виновного,
например, за недостаточностью улик)
43. t тест Стьюдента
Сравнение количественных данных в 2
группах (сравнение средних значений)
Пример: сравнить уровень холестерина
крови натощак у 10 пациентов до и
после лечения новым препаратом.
44. t тест Стьюдента
№ Уровень холестерина натощак Разность
до лечения после
01 6.7 4.4 2.3
02 7.8 7.0 0.8
03 8.1 6.0 2.1
04 5.5 5.8 -0.3
05 8.6 9.0 -0.4
06 6.7 6.1 0.6
07 7.1 7.3 -0.2
08 9.9 9.9 0
09 8.2 6.3 1.9
10 6.5 7.1 -0.6
45. t тест Стьюдента
l Расчет по формуле (с помощью
компьютера) – р = 0,15
l α=0,05
l Правило: р меньше заданной альфа-
ошибки свидетельствует о статистической
достоверности полученного различия
l В данном случае р > α (0,15 > 0,05) –
различия статистически не достоверны
46. Сравнение 2 групп
качественных данных
l В исследование влияния курения на
риск развития ишемической болезни
сердца были включены 250 мужчин с
ИБС и 250 здоровых мужчин
(контрольная группа, подобранная по
возрасту). Проводился опрос о курении.
47. Результаты
l 70 из 250 пациентов курили
l 30 из 250 здоровых мужчин курили
ИБС Контроль
Курение + 70 30
Курение - 180 220
Всего 250 250
48. Тест хи-квадрат
l Расчет по формуле (с помощью компьютера)
– р < 0,001
l α=0,05
l Правило: р меньше заданной альфа-ошибки
свидетельствует о статистической
достоверности полученного различия
l В данном случае р < α (0,001 < 0,05) –
различия статистически достоверны
49. Критерии выбора
статистического теста
l Тип анализируемых данных
l Характер распределения данных в
выборке
Статистический анализ не может
компенсировать ошибки дизайна
исследования
51. Статистическая мощность
l Статистическая мощность исследования для
выявления эффекта зависит от:
l Степени выраженности эффекта
l Объема выборки
l Ошибка II типа (b) - вероятность не выявления
эффекта там, где он есть
l Мощность исследования 100(1-b)%
l Широкий доверительный интервал
свидетельствует о низкой статистической
мощности
l Расчет объема выборки, необходимого для
выявления эффекта, проводится перед началом
исследования
52. Статистическая мощность -
пример
l 30% популяции является носителями гена Х.
Цель – определить связь между геном Х и
риском развития болезни Альцгеймера
l Для P < 0.05 и 80% статистической мощности
потребуется:
Контроль Случай Объем выборки
(носители Х) (носители Х с
болезнью Альцгеймера)
30% 50% 100
30% 40% 350
30% 35% 1400
53. Клиническая и статистическая
достоверность
l Статистика
l Выводы, полученные на группе испытуемых
l Ответы являются вероятностными
l Медицина
l Относится к конкретным пациентам
l Решения в значительной степени интуитивны
l Статистическая достоверность ≠ клиническая
достоверность
54. Клиническая и статистическая
достоверность
l Препарат А + диета = снижение массы
тела на 12%
l Диета = снижение массы тела на 10%
l Различия достоверны статистически,
но не клинически