Биостатистика для врачей

Анализ результатов
научных исследований
Цикл «Основы научно-исследовательской работы»
Д.м.н. С.П.Морозов

Проблема
l Медицина состоит как из закономерных, так и
случайных явлений
l Пример:
l Курение связано с раком легкого
l Однако не у всех курильщиков развивается рак
легкого, и не все больные раком легкого курят
(влияние случайности)
l Однако мы знаем, что связь существует
(закономерность)
l Проблема состоит в том, чтобы
идентифицировать закономерность,
отличить ее от случайности и оценить.

Популяция и выборка
Выборка
Достоверность
Популяция
Обобщаемость

l Статистика – это факты и цифры
l Статистика - набор методов и правил
организации, обобщения и интерпретации
информации.
l Включает набор стандартизованных
процедур, используемых научным
сообществом.

“Стоя одной ногой в ледяной воде, а другой -
в кипящей, вы чувствуете себя вполне
комфортно … в среднем”
“В среднем наш класс учится хорошо.
Половина учеников считает, что 2+2=3, а
вторая половина - что 2+2=5.”
Какова вероятность встретить на улице
слона: (1) крайне низкая (2) 50%
In God we trust. All others must bring data.
Что такое статистика?

l Н.И.Пирогов, 1849:
"... приложение статистики для
определения диагностической важности
симптомов и достоинства операций
можно ... рассматривать как важное
приобретение новейшей хирургии"

Зачем нам статистика?
l Описательная статистика
1. обобщение данных
l Индуктивная статистика
2. определение по выборке популяционных значений
3. выявление взаимосвязи между воздействием и
заболеванием
4. оценка достоверности различий между группами
l анализ связи нескольких переменных с заданным
исходом
l определить эффективность диагностического теста
l объединить результаты нескольких исследований
l оценить эффективность затрат в медицине
l анализ принятия решений в медицине

Типы данных
l Количественные (АД, рост,
концентрация инсулина)
l Качественные (раса, пол)
l Порядковые (стадия заболевания)

Исследование
антиэпилептического препарата
l Цель – оценка эффективности лекарственного
препарата прогабида в уменьшении частоты
эпилептических приступов.
l С момента начала исследования пациенты
активной и контрольной групп посещали врача 2
раза в неделю.
l Представлены данные о числе приступов за 2
недели до 4 визита.
l Другие переменные: возраст пациента, число
приступов за 8 недель до начала исследования.

Анализ результатов
l Исход (Зависимая переменная)
l Число приступов
l Количественные дискретные данные
l Предикторы (Независимые переменные)
l Лечение
l Качественные, номинальные данные
l Возраст
l Количественные порядковые данные
l Число приступов до начала лечения
l Количественные данные

Сбор данных - таблица
# ФИО Возраст Курс Факультет Пол …
1 Фио1 17 1 Лечебный муж
2 Фио2 20 4 ФПНПК жен
3 Фио3 21 5 МПФ муж
4 …

Трансформация данных
l Пол: жен – 1, муж – 0
l Возраст: (20-29) – 1, (30-39) – 2, (30-39) – 3, …
l Факультет: ФПНПК – 1, ЛФ – 2, МПФ – 3, …

№ Пол: г.р. Возр. Кур. АГ ИМ СД
1 1 1931 74 0 1 0 0
2 1 1930 75 1 1 0 0
3 1 1949 56 1 0 0 0
4 0 1935 70 0 0 0 0
5 1 1936 69 1 1 1 1
6 1 1955 50 1 0 0 0
7 1 1940 65 0 0 0 0
8 1 1953 52 1 1 0 0
9 0 1930 75 1 0 0 0
10 0 1926 79 0 1 0 0
11 1 1952 53 1 0 1 0
12 1 1922 83 0 0 0 0
13 0 1930 75 0 1 0 0
14 0 1942 63 0 0 0 0

Графическое представление
данных
l столбиковая диаграмма
l гистограмма
l box-plots
l график рассеяния
l др.

качественных данных
§ Частотное распределение: абсолютное,
относительное

количественных данных
l Гистограммы используются для
представления количественных данных

1. Обобщение данных
l Измерение центральной тенденции
l Среднее (арифметическое)
l Медиана (центральное значение ряда величин)
l Измерение дисперсии (вариабельности)
l Стандартное отклонение (отражает
распределение значений вокруг среднего)
l Диапазон (разность крайних значений)

Maternal age
42.5
40.0
37.5
35.0
32.5
30.0
27.5
25.0
22.5
20.0
17.5
15.0
60
50
40
30
20
10
0
Std. Dev = 4.84
Mean = 28.0
N = 223.00
Нормальное (Гауссово) распределение
Возраст 68% рожениц составляет от 23,16 до 32,84 лет
Возраст 95% рожениц составляет от 18,32 до 37,68 лет

050100150050100150
20 30 40 50 60 20 30 40 50 60
African-American Caucasian, Non-Hispanic
Hispanic Other
Frequency
BMI
Graphs by RaceEthDesc
Body Mass Index (BMI) distributions - SABOR participants

2030405060
BMI
African-Am
erican
C
aucasian,N
on-H
ispanic
H
ispanic
O
ther
SABOR participants
Body Mass Index (BMI) distributions

2. Определение по выборке
популяционных значений
Результаты, полученные на выборке, могут
отличаться от популяционных вследствие
влияния случайности
Доверительный интервал (confidence interval)
l Среднее ± 2 стандартных отклонения (95%
ДИ)
l Позволяет оценить в каких пределах может
находиться истинное значение параметра в
популяции.
l Отражает степень достоверности данных

Пример оценки доверительного
интервала
l 50 людей попробовали препараты А и Б.
35 из них (70%) предпочли препарат А.
l 95% доверительный интервал = [0,57; 0,83]
l Интерпретация: мы на 95% уверены, что от
57 до 83% общей популяции предпочтет
препарат А
l Условие: большая, репрезентативная,
случайная выборка
( )83,.57.
50
)3(.7.
96.17.
)1(
2/ =±=
-
±
n
pp
zp a

Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%

Пример (1)
«Казнить нельзя помиловать»

Пример (1)
«Казнить, нельзя помиловать»

Пример (1)
«Казнить, нельзя помиловать»
Нет! Необходимо сопоставление с
данными других отделений,
выполняющих аналогичные операции.

Пример (2)
Средняя летальность при данном типе
операций в данной возрастной группе
составляет 16/123 = 13%

Пример (2)
«Казнить, нельзя помиловать» - ?

Пример (2)
«Казнить, нельзя помиловать» - ?
Нет!
В отделение А поступают более тяжелые
пациенты.
Отделение А имеет недостаточный опыт:
например, 2/3 = 66%.

Пример (3)
l Тяжесть патологии не отличается.
l Всего 15 операций, 9 из них – с
летальным исходом (60%).
l Нижняя граница доверительного
интервала для данной выборки – 36%
l Верхняя граница доверительного
интервала для других отделений – 19%

Пример (3)
l Тяжесть патологии не отличается.
l Всего 15 операций, 9 из них – с
летальным исходом (60%).
l Нижняя граница доверительного
интервала для данной выборки – 36%
l Верхняя граница доверительного
интервала для других отделений – 19%
l «Казнить, нельзя помиловать»

3. Выявление взаимосвязи
между воздействием и заболеванием
l РИСК (соотношение рисков)
l ШАНСЫ (соотношение шансов)

Риск
ПРОПОРЦИЯ
Соотношение числа заболевших
субъектов и общей численности группы.
ОТНОСИТЕЛЬНЫЙ РИСК,
СООТНОШЕНИЕ РИСКОВ (СР, RR)
Соотношение заболеваемости среди
лиц, подвергавшихся и не
повергавшихся воздействию факторов
риска (R1/R2) в когортном исследовании

Оценка взаимосвязи.
Когортное исследование.
Соотношение рисков
(risk ratio)
СР = (a/N1)/(c/N0)
2. Болезнь Всего
+ -
1. Фактор
риска
+ a b N1=a+b
- c d N0=c+d

Пример (Swinscow, 1996)
Тип вакцины Грипп + Грипп - Всего
I 43 237 280
II (контроль) 52 198 250
Риск в основной группе = 43/280 = 0,154
Риск в контрольной группе = 52/250 = 0,208
Относительный риск (СР) = 0,154/0,208 = 0,74

Число больных, которых
необходимо пролечить
ЧБНЛ (NNT) = 1/(R1- R2) =
=1/(0,208-0,154)=18.5
Следовательно, в среднем необходимо
вакцинировать 19 пациентов вакциной I,
чтобы защитить 1 пациента от гриппа (по
сравнению с вакциной II).

Фрэмингемское исследование

Шансы
ШАНСЫ
Соотношение вероятности заболеть и
вероятности не заболеть.
Вероятность заболевания 20% - шансы 1/4
СООТНОШЕНИЕ ШАНСОВ (СШ, ODDS RATIO,
OR)
Используется для оценки относительного
риска в исследованиях случай-контроль.

Исследование случай-контроль.
db
-
ca+Воздействие
(фактор риска)
-+
Состояние
(болезнь)Соотношение шансов
(odds ratio)
СШ = (a/c) / (b/d)
= ad / cb

Исследование случай-контроль.
Doll and Hill (BMJ 1950; 2:739-748)
Случаи – госпитализированные пациенты (мужчины) с
раком легкого
Фактор риска – курение (в анамнезе или текущее)
1. Рак легкого 1. Контроль
2. Курение Да 647 622
Нет 2 27
Всего 649 649
Соотношение шансов (odds ratio)
СШ = (647/622)/(2/27) = 647*27/622*2 = 14

4. Оценка достоверности
различий между группами
l Значение р - вероятность того, что
полученный результат абсолютно
случаен
l р = 1 (абсолютно случайный)
l р = 0 (абсолютно неслучайный)
Величина р меньше заданной альфа-ошибки
свидетельствует о статистической достоверности
полученного различия

Типы ошибок
l Ошибка I типа (альфа)
l Выявление различий там, где их в
действительности нет (вероятность
наказания невиновного). Обычно α=0,05
l Ошибка II типа (бета)
l Не выявление различий там, где они есть
(вероятность оправдания виновного,
например, за недостаточностью улик)

t тест Стьюдента
Сравнение количественных данных в 2
группах (сравнение средних значений)
Пример: сравнить уровень холестерина
крови натощак у 10 пациентов до и
после лечения новым препаратом.

№ Уровень холестерина натощак Разность
до лечения после
01 6.7 4.4 2.3
02 7.8 7.0 0.8
03 8.1 6.0 2.1
04 5.5 5.8 -0.3
05 8.6 9.0 -0.4
06 6.7 6.1 0.6
07 7.1 7.3 -0.2
08 9.9 9.9 0
09 8.2 6.3 1.9
10 6.5 7.1 -0.6

l Расчет по формуле (с помощью
компьютера) – р = 0,15
l α=0,05
l Правило: р меньше заданной альфа-
ошибки свидетельствует о статистической
достоверности полученного различия
l В данном случае р > α (0,15 > 0,05) –
различия статистически не достоверны

Сравнение 2 групп
качественных данных
l В исследование влияния курения на
риск развития ишемической болезни
сердца были включены 250 мужчин с
ИБС и 250 здоровых мужчин
(контрольная группа, подобранная по
возрасту). Проводился опрос о курении.

Результаты
l 70 из 250 пациентов курили
l 30 из 250 здоровых мужчин курили
ИБС Контроль
Курение + 70 30
Курение - 180 220
Всего 250 250

Тест хи-квадрат
l Расчет по формуле (с помощью компьютера)
– р < 0,001
l α=0,05
l Правило: р меньше заданной альфа-ошибки
свидетельствует о статистической
достоверности полученного различия
l В данном случае р < α (0,001 < 0,05) –
различия статистически достоверны

Критерии выбора
статистического теста
l Тип анализируемых данных
l Характер распределения данных в
выборке
Статистический анализ не может
компенсировать ошибки дизайна
исследования

Количество
групп
n≥30
t-тест
1 группа
Независимые
группы2 группы
Да
Нет
n≥30
t-тест
Тест Вилкоксона
Нормальное
распределение
Да
Нет
Да
Нет
Нормальное
распределение
Парный t-тест
Да
Нет
Тест Вилкоксона
Да
Нет
Сравнение средних значений или медиан
(порядковые или количественные данные)
B.Dawson, R.G.Trapp, 2004

Статистическая мощность
l Статистическая мощность исследования для
выявления эффекта зависит от:
l Степени выраженности эффекта
l Объема выборки
l Ошибка II типа (b) - вероятность не выявления
эффекта там, где он есть
l Мощность исследования 100(1-b)%
l Широкий доверительный интервал
свидетельствует о низкой статистической
мощности
l Расчет объема выборки, необходимого для
выявления эффекта, проводится перед началом
исследования

Статистическая мощность -
пример
l 30% популяции является носителями гена Х.
Цель – определить связь между геном Х и
риском развития болезни Альцгеймера
l Для P < 0.05 и 80% статистической мощности
потребуется:
Контроль Случай Объем выборки
(носители Х) (носители Х с
болезнью Альцгеймера)
30% 50% 100
30% 40% 350
30% 35% 1400

Клиническая и статистическая
достоверность
l Статистика
l Выводы, полученные на группе испытуемых
l Ответы являются вероятностными
l Медицина
l Относится к конкретным пациентам
l Решения в значительной степени интуитивны
l Статистическая достоверность ≠ клиническая

Клиническая и статистическая
l Препарат А + диета = снижение массы
тела на 12%
l Диета = снижение массы тела на 10%
l Различия достоверны статистически,
но не клинически

Рождение статистики
Необходимость оценки и прогнозирования
вероятностных событий
Вильям Госсетт, 1927, тест Стьюдента (t-тест)

Author - Winston Churchill (1874-1965)
«the only statistics you can trust are those you
falsified yourself»

Планирование исследования
l Дизайн исследования
l Контрольная группа
l Макет базы данных
l План статистического анализа
результатов

Биостатистика для врачей

Recommended

Recommended

More Related Content

Similar to Биостатистика для врачей

Similar to Биостатистика для врачей (20)

More from Sergey Morozov, MD, PhD, MPH

More from Sergey Morozov, MD, PhD, MPH (9)

Биостатистика для врачей