SlideShare a Scribd company logo
1 of 57
Download to read offline
Анализ результатов
научных исследований
Цикл «Основы научно-исследовательской работы»
Д.м.н. С.П.Морозов
Проблема
l Медицина состоит как из закономерных, так и
случайных явлений
l Пример:
l Курение связано с раком легкого
l Однако не у всех курильщиков развивается рак
легкого, и не все больные раком легкого курят
(влияние случайности)
l Однако мы знаем, что связь существует
(закономерность)
l Проблема состоит в том, чтобы
идентифицировать закономерность,
отличить ее от случайности и оценить.
Популяция и выборка
Выборка
Достоверность
Популяция
Обобщаемость
l Статистика – это факты и цифры
l Статистика - набор методов и правил
организации, обобщения и интерпретации
информации.
l Включает набор стандартизованных
процедур, используемых научным
сообществом.
“Стоя одной ногой в ледяной воде, а другой -
в кипящей, вы чувствуете себя вполне
комфортно … в среднем”
“В среднем наш класс учится хорошо.
Половина учеников считает, что 2+2=3, а
вторая половина - что 2+2=5.”
Какова вероятность встретить на улице
слона: (1) крайне низкая (2) 50%
In God we trust. All others must bring data.
Что такое статистика?
l Н.И.Пирогов, 1849:
"... приложение статистики для
определения диагностической важности
симптомов и достоинства операций
можно ... рассматривать как важное
приобретение новейшей хирургии"
Зачем нам статистика?
l Описательная статистика
1. обобщение данных
l Индуктивная статистика
2. определение по выборке популяционных значений
3. выявление взаимосвязи между воздействием и
заболеванием
4. оценка достоверности различий между группами
l анализ связи нескольких переменных с заданным
исходом
l определить эффективность диагностического теста
l объединить результаты нескольких исследований
l оценить эффективность затрат в медицине
l анализ принятия решений в медицине
Типы данных
l Количественные (АД, рост,
концентрация инсулина)
l Качественные (раса, пол)
l Порядковые (стадия заболевания)
Исследование
антиэпилептического препарата
l Цель – оценка эффективности лекарственного
препарата прогабида в уменьшении частоты
эпилептических приступов.
l С момента начала исследования пациенты
активной и контрольной групп посещали врача 2
раза в неделю.
l Представлены данные о числе приступов за 2
недели до 4 визита.
l Другие переменные: возраст пациента, число
приступов за 8 недель до начала исследования.
Анализ результатов
l Исход (Зависимая переменная)
l Число приступов
l Количественные дискретные данные
l Предикторы (Независимые переменные)
l Лечение
l Качественные, номинальные данные
l Возраст
l Количественные порядковые данные
l Число приступов до начала лечения
l Количественные данные
Сбор данных - таблица
# ФИО Возраст Курс Факультет Пол …
1 Фио1 17 1 Лечебный муж
2 Фио2 20 4 ФПНПК жен
3 Фио3 21 5 МПФ муж
4 …
Трансформация данных
l Пол: жен – 1, муж – 0
l Возраст: (20-29) – 1, (30-39) – 2, (30-39) – 3, …
l Факультет: ФПНПК – 1, ЛФ – 2, МПФ – 3, …
№ Пол: г.р. Возр. Кур. АГ ИМ СД
1 1 1931 74 0 1 0 0
2 1 1930 75 1 1 0 0
3 1 1949 56 1 0 0 0
4 0 1935 70 0 0 0 0
5 1 1936 69 1 1 1 1
6 1 1955 50 1 0 0 0
7 1 1940 65 0 0 0 0
8 1 1953 52 1 1 0 0
9 0 1930 75 1 0 0 0
10 0 1926 79 0 1 0 0
11 1 1952 53 1 0 1 0
12 1 1922 83 0 0 0 0
13 0 1930 75 0 1 0 0
14 0 1942 63 0 0 0 0
Графическое представление
данных
l столбиковая диаграмма
l гистограмма
l box-plots
l график рассеяния
l др.
Графическое представление
качественных данных
§ Частотное распределение: абсолютное,
относительное
Графическое представление
количественных данных
l Гистограммы используются для
представления количественных данных
1. Обобщение данных
l Измерение центральной тенденции
l Среднее (арифметическое)
l Медиана (центральное значение ряда величин)
l Измерение дисперсии (вариабельности)
l Стандартное отклонение (отражает
распределение значений вокруг среднего)
l Диапазон (разность крайних значений)
Maternal age
42.5
40.0
37.5
35.0
32.5
30.0
27.5
25.0
22.5
20.0
17.5
15.0
60
50
40
30
20
10
0
Std. Dev = 4.84
Mean = 28.0
N = 223.00
Нормальное (Гауссово) распределение
Возраст 68% рожениц составляет от 23,16 до 32,84 лет
Возраст 95% рожениц составляет от 18,32 до 37,68 лет
050100150050100150
20 30 40 50 60 20 30 40 50 60
African-American Caucasian, Non-Hispanic
Hispanic Other
Frequency
BMI
Graphs by RaceEthDesc
Body Mass Index (BMI) distributions - SABOR participants
2030405060
BMI
African-Am
erican
C
aucasian,N
on-H
ispanic
H
ispanic
O
ther
SABOR participants
Body Mass Index (BMI) distributions
2. Определение по выборке
популяционных значений
Результаты, полученные на выборке, могут
отличаться от популяционных вследствие
влияния случайности
Доверительный интервал (confidence interval)
l Среднее ± 2 стандартных отклонения (95%
ДИ)
l Позволяет оценить в каких пределах может
находиться истинное значение параметра в
популяции.
l Отражает степень достоверности данных
Пример оценки доверительного
интервала
l 50 людей попробовали препараты А и Б.
35 из них (70%) предпочли препарат А.
l 95% доверительный интервал = [0,57; 0,83]
l Интерпретация: мы на 95% уверены, что от
57 до 83% общей популяции предпочтет
препарат А
l Условие: большая, репрезентативная,
случайная выборка
( )83,.57.
50
)3(.7.
96.17.
)1(
2/ =±=
-
±
n
pp
zp a
Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
«Казнить нельзя помиловать»
Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
«Казнить, нельзя помиловать»
Пример (1)
В отделении А операционная
летальность при пороках сердца у
детей до 1 года составляет 60%
«Казнить, нельзя помиловать»
Нет! Необходимо сопоставление с
данными других отделений,
выполняющих аналогичные операции.
Пример (2)
Средняя летальность при данном типе
операций в данной возрастной группе
составляет 16/123 = 13%
Пример (2)
Средняя летальность при данном типе
операций в данной возрастной группе
составляет 16/123 = 13%
«Казнить, нельзя помиловать» - ?
Пример (2)
Средняя летальность при данном типе
операций в данной возрастной группе
составляет 16/123 = 13%
«Казнить, нельзя помиловать» - ?
Нет!
В отделение А поступают более тяжелые
пациенты.
Отделение А имеет недостаточный опыт:
например, 2/3 = 66%.
Пример (3)
l Тяжесть патологии не отличается.
l Всего 15 операций, 9 из них – с
летальным исходом (60%).
l Нижняя граница доверительного
интервала для данной выборки – 36%
l Верхняя граница доверительного
интервала для других отделений – 19%
Пример (3)
l Тяжесть патологии не отличается.
l Всего 15 операций, 9 из них – с
летальным исходом (60%).
l Нижняя граница доверительного
интервала для данной выборки – 36%
l Верхняя граница доверительного
интервала для других отделений – 19%
l «Казнить, нельзя помиловать»
3. Выявление взаимосвязи
между воздействием и заболеванием
l РИСК (соотношение рисков)
l ШАНСЫ (соотношение шансов)
Риск
ПРОПОРЦИЯ
Соотношение числа заболевших
субъектов и общей численности группы.
ОТНОСИТЕЛЬНЫЙ РИСК,
СООТНОШЕНИЕ РИСКОВ (СР, RR)
Соотношение заболеваемости среди
лиц, подвергавшихся и не
повергавшихся воздействию факторов
риска (R1/R2) в когортном исследовании
Оценка взаимосвязи.
Когортное исследование.
Соотношение рисков
(risk ratio)
СР = (a/N1)/(c/N0)
2. Болезнь Всего
+ -
1. Фактор
риска
+ a b N1=a+b
- c d N0=c+d
Пример (Swinscow, 1996)
Тип вакцины Грипп + Грипп - Всего
I 43 237 280
II (контроль) 52 198 250
Риск в основной группе = 43/280 = 0,154
Риск в контрольной группе = 52/250 = 0,208
Относительный риск (СР) = 0,154/0,208 = 0,74
Число больных, которых
необходимо пролечить
ЧБНЛ (NNT) = 1/(R1- R2) =
=1/(0,208-0,154)=18.5
Следовательно, в среднем необходимо
вакцинировать 19 пациентов вакциной I,
чтобы защитить 1 пациента от гриппа (по
сравнению с вакциной II).
Фрэмингемское исследование
Шансы
ШАНСЫ
Соотношение вероятности заболеть и
вероятности не заболеть.
Вероятность заболевания 20% - шансы 1/4
СООТНОШЕНИЕ ШАНСОВ (СШ, ODDS RATIO,
OR)
Используется для оценки относительного
риска в исследованиях случай-контроль.
Оценка взаимосвязи.
Исследование случай-контроль.
db
-
ca+Воздействие
(фактор риска)
-+
Состояние
(болезнь)Соотношение шансов
(odds ratio)
СШ = (a/c) / (b/d)
= ad / cb
Оценка взаимосвязи.
Исследование случай-контроль.
Doll and Hill (BMJ 1950; 2:739-748)
Случаи – госпитализированные пациенты (мужчины) с
раком легкого
Фактор риска – курение (в анамнезе или текущее)
1. Рак легкого 1. Контроль
2. Курение Да 647 622
Нет 2 27
Всего 649 649
Соотношение шансов (odds ratio)
СШ = (647/622)/(2/27) = 647*27/622*2 = 14
4. Оценка достоверности
различий между группами
l Значение р - вероятность того, что
полученный результат абсолютно
случаен
l р = 1 (абсолютно случайный)
l р = 0 (абсолютно неслучайный)
Величина р меньше заданной альфа-ошибки
свидетельствует о статистической достоверности
полученного различия
Типы ошибок
l Ошибка I типа (альфа)
l Выявление различий там, где их в
действительности нет (вероятность
наказания невиновного). Обычно α=0,05
l Ошибка II типа (бета)
l Не выявление различий там, где они есть
(вероятность оправдания виновного,
например, за недостаточностью улик)
t тест Стьюдента
Сравнение количественных данных в 2
группах (сравнение средних значений)
Пример: сравнить уровень холестерина
крови натощак у 10 пациентов до и
после лечения новым препаратом.
t тест Стьюдента
№ Уровень холестерина натощак Разность
до лечения после
01 6.7 4.4 2.3
02 7.8 7.0 0.8
03 8.1 6.0 2.1
04 5.5 5.8 -0.3
05 8.6 9.0 -0.4
06 6.7 6.1 0.6
07 7.1 7.3 -0.2
08 9.9 9.9 0
09 8.2 6.3 1.9
10 6.5 7.1 -0.6
t тест Стьюдента
l Расчет по формуле (с помощью
компьютера) – р = 0,15
l α=0,05
l Правило: р меньше заданной альфа-
ошибки свидетельствует о статистической
достоверности полученного различия
l В данном случае р > α (0,15 > 0,05) –
различия статистически не достоверны
Сравнение 2 групп
качественных данных
l В исследование влияния курения на
риск развития ишемической болезни
сердца были включены 250 мужчин с
ИБС и 250 здоровых мужчин
(контрольная группа, подобранная по
возрасту). Проводился опрос о курении.
Результаты
l 70 из 250 пациентов курили
l 30 из 250 здоровых мужчин курили
ИБС Контроль
Курение + 70 30
Курение - 180 220
Всего 250 250
Тест хи-квадрат
l Расчет по формуле (с помощью компьютера)
– р < 0,001
l α=0,05
l Правило: р меньше заданной альфа-ошибки
свидетельствует о статистической
достоверности полученного различия
l В данном случае р < α (0,001 < 0,05) –
различия статистически достоверны
Критерии выбора
статистического теста
l Тип анализируемых данных
l Характер распределения данных в
выборке
Статистический анализ не может
компенсировать ошибки дизайна
исследования
Количество
групп
n≥30
t-тест
1 группа
Независимые
группы2 группы
Да
Нет
n≥30
t-тест
Тест Вилкоксона
Нормальное
распределение
Да
Нет
Да
Нет
Нормальное
распределение
Парный t-тест
Да
Нет
Тест Вилкоксона
Да
Нет
Сравнение средних значений или медиан
(порядковые или количественные данные)
B.Dawson, R.G.Trapp, 2004
Статистическая мощность
l Статистическая мощность исследования для
выявления эффекта зависит от:
l Степени выраженности эффекта
l Объема выборки
l Ошибка II типа (b) - вероятность не выявления
эффекта там, где он есть
l Мощность исследования 100(1-b)%
l Широкий доверительный интервал
свидетельствует о низкой статистической
мощности
l Расчет объема выборки, необходимого для
выявления эффекта, проводится перед началом
исследования
Статистическая мощность -
пример
l 30% популяции является носителями гена Х.
Цель – определить связь между геном Х и
риском развития болезни Альцгеймера
l Для P < 0.05 и 80% статистической мощности
потребуется:
Контроль Случай Объем выборки
(носители Х) (носители Х с
болезнью Альцгеймера)
30% 50% 100
30% 40% 350
30% 35% 1400
Клиническая и статистическая
достоверность
l Статистика
l Выводы, полученные на группе испытуемых
l Ответы являются вероятностными
l Медицина
l Относится к конкретным пациентам
l Решения в значительной степени интуитивны
l Статистическая достоверность ≠ клиническая
достоверность
Клиническая и статистическая
достоверность
l Препарат А + диета = снижение массы
тела на 12%
l Диета = снижение массы тела на 10%
l Различия достоверны статистически,
но не клинически
Рождение статистики
Необходимость оценки и прогнозирования
вероятностных событий
Вильям Госсетт, 1927, тест Стьюдента (t-тест)
Author - Winston Churchill (1874-1965)
«the only statistics you can trust are those you
falsified yourself»
Планирование исследования
l Дизайн исследования
l Контрольная группа
l Макет базы данных
l План статистического анализа
результатов

More Related Content

Similar to Биостатистика для врачей

Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...
Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...
Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...Pavel Fedotov
 
Aslanov ebm biostat_basic
Aslanov ebm biostat_basicAslanov ebm biostat_basic
Aslanov ebm biostat_basicElena Lvova
 
Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013Nikita Khromov-Borisov
 
БИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКА
БИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКАБИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКА
БИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКАKirrrr123
 
оценка риска возникновения фатальный аритмий у больных в в условиях общей а...
оценка риска возникновения фатальный аритмий  у больных в  в условиях общей а...оценка риска возникновения фатальный аритмий  у больных в  в условиях общей а...
оценка риска возникновения фатальный аритмий у больных в в условиях общей а...Georgy Atanasov
 
стадник еа хлл коморбидность и выбор оптимального лечения
стадник еа хлл коморбидность и выбор оптимального лечениястадник еа хлл коморбидность и выбор оптимального лечения
стадник еа хлл коморбидность и выбор оптимального леченияnizhgma.ru
 
5 егоров
5 егоров5 егоров
5 егоровZCORPION
 
зурочка2
зурочка2зурочка2
зурочка2pasteurorg
 
Скрининг методами лучевой диагностики
Скрининг методами лучевой диагностикиСкрининг методами лучевой диагностики
Скрининг методами лучевой диагностикиSergey Morozov, MD, PhD, MPH
 
Возможности молекулярно-биологического типирования хламидий
Возможности молекулярно-биологического типирования хламидийВозможности молекулярно-биологического типирования хламидий
Возможности молекулярно-биологического типирования хламидийИгорь Шадеркин
 
Преждевременность генетического тестирования предрасположенностей
Преждевременность генетического тестирования предрасположенностейПреждевременность генетического тестирования предрасположенностей
Преждевременность генетического тестирования предрасположенностейФатима Эркенова
 
Современный подход к проблеме рака предстательной железы
Современный подход к проблеме рака предстательной железыСовременный подход к проблеме рака предстательной железы
Современный подход к проблеме рака предстательной железыИгорь Шадеркин
 
качество жизни при рп
качество жизни при рпкачество жизни при рп
качество жизни при рпYervand Harutyunyan
 

Similar to Биостатистика для врачей (20)

1
11
1
 
Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...
Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...
Мусаев — Интервенционное лечение стеноза аортального клапана у детей раннего ...
 
Aslanov ebm biostat_basic
Aslanov ebm biostat_basicAslanov ebm biostat_basic
Aslanov ebm biostat_basic
 
генетика человека
генетика человекагенетика человека
генетика человека
 
Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013
 
ВИЧ - инфекция
ВИЧ - инфекцияВИЧ - инфекция
ВИЧ - инфекция
 
БИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКА
БИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКАБИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКА
БИОЛОГИЧЕСКОЕ ДЕЙСТВИЕ РАДИАЦИИ НА ЧЕЛОВЕКА
 
оценка риска возникновения фатальный аритмий у больных в в условиях общей а...
оценка риска возникновения фатальный аритмий  у больных в  в условиях общей а...оценка риска возникновения фатальный аритмий  у больных в  в условиях общей а...
оценка риска возникновения фатальный аритмий у больных в в условиях общей а...
 
rus
rusrus
rus
 
стадник еа хлл коморбидность и выбор оптимального лечения
стадник еа хлл коморбидность и выбор оптимального лечениястадник еа хлл коморбидность и выбор оптимального лечения
стадник еа хлл коморбидность и выбор оптимального лечения
 
5 егоров
5 егоров5 егоров
5 егоров
 
Khaikyn lymphomas aug2011
Khaikyn lymphomas aug2011Khaikyn lymphomas aug2011
Khaikyn lymphomas aug2011
 
зурочка2
зурочка2зурочка2
зурочка2
 
Скрининг методами лучевой диагностики
Скрининг методами лучевой диагностикиСкрининг методами лучевой диагностики
Скрининг методами лучевой диагностики
 
Genetics of predispositions ppt
Genetics of predispositions pptGenetics of predispositions ppt
Genetics of predispositions ppt
 
Возможности молекулярно-биологического типирования хламидий
Возможности молекулярно-биологического типирования хламидийВозможности молекулярно-биологического типирования хламидий
Возможности молекулярно-биологического типирования хламидий
 
Преждевременность генетического тестирования предрасположенностей
Преждевременность генетического тестирования предрасположенностейПреждевременность генетического тестирования предрасположенностей
Преждевременность генетического тестирования предрасположенностей
 
Современный подход к проблеме рака предстательной железы
Современный подход к проблеме рака предстательной железыСовременный подход к проблеме рака предстательной железы
Современный подход к проблеме рака предстательной железы
 
качество жизни при рп
качество жизни при рпкачество жизни при рп
качество жизни при рп
 
TIRADS - TBSRTC 2017
TIRADS - TBSRTC 2017TIRADS - TBSRTC 2017
TIRADS - TBSRTC 2017
 

More from Sergey Morozov, MD, PhD, MPH

More from Sergey Morozov, MD, PhD, MPH (9)

Big data and AI in a radiologist's reading room
Big data and AI in a radiologist's reading roomBig data and AI in a radiologist's reading room
Big data and AI in a radiologist's reading room
 
Основные принципы обеспечения работоспособности диагностического оборудования
Основные принципы обеспечения работоспособности диагностического оборудованияОсновные принципы обеспечения работоспособности диагностического оборудования
Основные принципы обеспечения работоспособности диагностического оборудования
 
Как выступать с докладом на European Congress of Radiology?
Как выступать с докладом на European Congress of Radiology?Как выступать с докладом на European Congress of Radiology?
Как выступать с докладом на European Congress of Radiology?
 
Moscow Radiology 2015-2016
Moscow Radiology 2015-2016Moscow Radiology 2015-2016
Moscow Radiology 2015-2016
 
How to identify radiology productivity bottlenecks?
How to identify radiology productivity bottlenecks?How to identify radiology productivity bottlenecks?
How to identify radiology productivity bottlenecks?
 
prostate cancer
prostate cancerprostate cancer
prostate cancer
 
neuroimaging
neuroimagingneuroimaging
neuroimaging
 
Knee MRI pitfalls
Knee MRI pitfallsKnee MRI pitfalls
Knee MRI pitfalls
 
Philips presentation
Philips presentationPhilips presentation
Philips presentation
 

Биостатистика для врачей

  • 1. Анализ результатов научных исследований Цикл «Основы научно-исследовательской работы» Д.м.н. С.П.Морозов
  • 2. Проблема l Медицина состоит как из закономерных, так и случайных явлений l Пример: l Курение связано с раком легкого l Однако не у всех курильщиков развивается рак легкого, и не все больные раком легкого курят (влияние случайности) l Однако мы знаем, что связь существует (закономерность) l Проблема состоит в том, чтобы идентифицировать закономерность, отличить ее от случайности и оценить.
  • 4. l Статистика – это факты и цифры l Статистика - набор методов и правил организации, обобщения и интерпретации информации. l Включает набор стандартизованных процедур, используемых научным сообществом.
  • 5. “Стоя одной ногой в ледяной воде, а другой - в кипящей, вы чувствуете себя вполне комфортно … в среднем” “В среднем наш класс учится хорошо. Половина учеников считает, что 2+2=3, а вторая половина - что 2+2=5.” Какова вероятность встретить на улице слона: (1) крайне низкая (2) 50% In God we trust. All others must bring data. Что такое статистика?
  • 6. l Н.И.Пирогов, 1849: "... приложение статистики для определения диагностической важности симптомов и достоинства операций можно ... рассматривать как важное приобретение новейшей хирургии"
  • 7. Зачем нам статистика? l Описательная статистика 1. обобщение данных l Индуктивная статистика 2. определение по выборке популяционных значений 3. выявление взаимосвязи между воздействием и заболеванием 4. оценка достоверности различий между группами l анализ связи нескольких переменных с заданным исходом l определить эффективность диагностического теста l объединить результаты нескольких исследований l оценить эффективность затрат в медицине l анализ принятия решений в медицине
  • 8. Типы данных l Количественные (АД, рост, концентрация инсулина) l Качественные (раса, пол) l Порядковые (стадия заболевания)
  • 9. Исследование антиэпилептического препарата l Цель – оценка эффективности лекарственного препарата прогабида в уменьшении частоты эпилептических приступов. l С момента начала исследования пациенты активной и контрольной групп посещали врача 2 раза в неделю. l Представлены данные о числе приступов за 2 недели до 4 визита. l Другие переменные: возраст пациента, число приступов за 8 недель до начала исследования.
  • 10. Анализ результатов l Исход (Зависимая переменная) l Число приступов l Количественные дискретные данные l Предикторы (Независимые переменные) l Лечение l Качественные, номинальные данные l Возраст l Количественные порядковые данные l Число приступов до начала лечения l Количественные данные
  • 11. Сбор данных - таблица # ФИО Возраст Курс Факультет Пол … 1 Фио1 17 1 Лечебный муж 2 Фио2 20 4 ФПНПК жен 3 Фио3 21 5 МПФ муж 4 …
  • 12. Трансформация данных l Пол: жен – 1, муж – 0 l Возраст: (20-29) – 1, (30-39) – 2, (30-39) – 3, … l Факультет: ФПНПК – 1, ЛФ – 2, МПФ – 3, …
  • 13. № Пол: г.р. Возр. Кур. АГ ИМ СД 1 1 1931 74 0 1 0 0 2 1 1930 75 1 1 0 0 3 1 1949 56 1 0 0 0 4 0 1935 70 0 0 0 0 5 1 1936 69 1 1 1 1 6 1 1955 50 1 0 0 0 7 1 1940 65 0 0 0 0 8 1 1953 52 1 1 0 0 9 0 1930 75 1 0 0 0 10 0 1926 79 0 1 0 0 11 1 1952 53 1 0 1 0 12 1 1922 83 0 0 0 0 13 0 1930 75 0 1 0 0 14 0 1942 63 0 0 0 0
  • 14. Графическое представление данных l столбиковая диаграмма l гистограмма l box-plots l график рассеяния l др.
  • 15. Графическое представление качественных данных § Частотное распределение: абсолютное, относительное
  • 16. Графическое представление количественных данных l Гистограммы используются для представления количественных данных
  • 17. 1. Обобщение данных l Измерение центральной тенденции l Среднее (арифметическое) l Медиана (центральное значение ряда величин) l Измерение дисперсии (вариабельности) l Стандартное отклонение (отражает распределение значений вокруг среднего) l Диапазон (разность крайних значений)
  • 18. Maternal age 42.5 40.0 37.5 35.0 32.5 30.0 27.5 25.0 22.5 20.0 17.5 15.0 60 50 40 30 20 10 0 Std. Dev = 4.84 Mean = 28.0 N = 223.00 Нормальное (Гауссово) распределение Возраст 68% рожениц составляет от 23,16 до 32,84 лет Возраст 95% рожениц составляет от 18,32 до 37,68 лет
  • 19. 050100150050100150 20 30 40 50 60 20 30 40 50 60 African-American Caucasian, Non-Hispanic Hispanic Other Frequency BMI Graphs by RaceEthDesc Body Mass Index (BMI) distributions - SABOR participants
  • 21. 2. Определение по выборке популяционных значений Результаты, полученные на выборке, могут отличаться от популяционных вследствие влияния случайности Доверительный интервал (confidence interval) l Среднее ± 2 стандартных отклонения (95% ДИ) l Позволяет оценить в каких пределах может находиться истинное значение параметра в популяции. l Отражает степень достоверности данных
  • 22. Пример оценки доверительного интервала l 50 людей попробовали препараты А и Б. 35 из них (70%) предпочли препарат А. l 95% доверительный интервал = [0,57; 0,83] l Интерпретация: мы на 95% уверены, что от 57 до 83% общей популяции предпочтет препарат А l Условие: большая, репрезентативная, случайная выборка ( )83,.57. 50 )3(.7. 96.17. )1( 2/ =±= - ± n pp zp a
  • 23. Пример (1) В отделении А операционная летальность при пороках сердца у детей до 1 года составляет 60%
  • 24. Пример (1) В отделении А операционная летальность при пороках сердца у детей до 1 года составляет 60% «Казнить нельзя помиловать»
  • 25. Пример (1) В отделении А операционная летальность при пороках сердца у детей до 1 года составляет 60% «Казнить, нельзя помиловать»
  • 26. Пример (1) В отделении А операционная летальность при пороках сердца у детей до 1 года составляет 60% «Казнить, нельзя помиловать» Нет! Необходимо сопоставление с данными других отделений, выполняющих аналогичные операции.
  • 27. Пример (2) Средняя летальность при данном типе операций в данной возрастной группе составляет 16/123 = 13%
  • 28. Пример (2) Средняя летальность при данном типе операций в данной возрастной группе составляет 16/123 = 13% «Казнить, нельзя помиловать» - ?
  • 29. Пример (2) Средняя летальность при данном типе операций в данной возрастной группе составляет 16/123 = 13% «Казнить, нельзя помиловать» - ? Нет! В отделение А поступают более тяжелые пациенты. Отделение А имеет недостаточный опыт: например, 2/3 = 66%.
  • 30. Пример (3) l Тяжесть патологии не отличается. l Всего 15 операций, 9 из них – с летальным исходом (60%). l Нижняя граница доверительного интервала для данной выборки – 36% l Верхняя граница доверительного интервала для других отделений – 19%
  • 31. Пример (3) l Тяжесть патологии не отличается. l Всего 15 операций, 9 из них – с летальным исходом (60%). l Нижняя граница доверительного интервала для данной выборки – 36% l Верхняя граница доверительного интервала для других отделений – 19% l «Казнить, нельзя помиловать»
  • 32. 3. Выявление взаимосвязи между воздействием и заболеванием l РИСК (соотношение рисков) l ШАНСЫ (соотношение шансов)
  • 33. Риск ПРОПОРЦИЯ Соотношение числа заболевших субъектов и общей численности группы. ОТНОСИТЕЛЬНЫЙ РИСК, СООТНОШЕНИЕ РИСКОВ (СР, RR) Соотношение заболеваемости среди лиц, подвергавшихся и не повергавшихся воздействию факторов риска (R1/R2) в когортном исследовании
  • 34. Оценка взаимосвязи. Когортное исследование. Соотношение рисков (risk ratio) СР = (a/N1)/(c/N0) 2. Болезнь Всего + - 1. Фактор риска + a b N1=a+b - c d N0=c+d
  • 35. Пример (Swinscow, 1996) Тип вакцины Грипп + Грипп - Всего I 43 237 280 II (контроль) 52 198 250 Риск в основной группе = 43/280 = 0,154 Риск в контрольной группе = 52/250 = 0,208 Относительный риск (СР) = 0,154/0,208 = 0,74
  • 36. Число больных, которых необходимо пролечить ЧБНЛ (NNT) = 1/(R1- R2) = =1/(0,208-0,154)=18.5 Следовательно, в среднем необходимо вакцинировать 19 пациентов вакциной I, чтобы защитить 1 пациента от гриппа (по сравнению с вакциной II).
  • 38. Шансы ШАНСЫ Соотношение вероятности заболеть и вероятности не заболеть. Вероятность заболевания 20% - шансы 1/4 СООТНОШЕНИЕ ШАНСОВ (СШ, ODDS RATIO, OR) Используется для оценки относительного риска в исследованиях случай-контроль.
  • 39. Оценка взаимосвязи. Исследование случай-контроль. db - ca+Воздействие (фактор риска) -+ Состояние (болезнь)Соотношение шансов (odds ratio) СШ = (a/c) / (b/d) = ad / cb
  • 40. Оценка взаимосвязи. Исследование случай-контроль. Doll and Hill (BMJ 1950; 2:739-748) Случаи – госпитализированные пациенты (мужчины) с раком легкого Фактор риска – курение (в анамнезе или текущее) 1. Рак легкого 1. Контроль 2. Курение Да 647 622 Нет 2 27 Всего 649 649 Соотношение шансов (odds ratio) СШ = (647/622)/(2/27) = 647*27/622*2 = 14
  • 41. 4. Оценка достоверности различий между группами l Значение р - вероятность того, что полученный результат абсолютно случаен l р = 1 (абсолютно случайный) l р = 0 (абсолютно неслучайный) Величина р меньше заданной альфа-ошибки свидетельствует о статистической достоверности полученного различия
  • 42. Типы ошибок l Ошибка I типа (альфа) l Выявление различий там, где их в действительности нет (вероятность наказания невиновного). Обычно α=0,05 l Ошибка II типа (бета) l Не выявление различий там, где они есть (вероятность оправдания виновного, например, за недостаточностью улик)
  • 43. t тест Стьюдента Сравнение количественных данных в 2 группах (сравнение средних значений) Пример: сравнить уровень холестерина крови натощак у 10 пациентов до и после лечения новым препаратом.
  • 44. t тест Стьюдента № Уровень холестерина натощак Разность до лечения после 01 6.7 4.4 2.3 02 7.8 7.0 0.8 03 8.1 6.0 2.1 04 5.5 5.8 -0.3 05 8.6 9.0 -0.4 06 6.7 6.1 0.6 07 7.1 7.3 -0.2 08 9.9 9.9 0 09 8.2 6.3 1.9 10 6.5 7.1 -0.6
  • 45. t тест Стьюдента l Расчет по формуле (с помощью компьютера) – р = 0,15 l α=0,05 l Правило: р меньше заданной альфа- ошибки свидетельствует о статистической достоверности полученного различия l В данном случае р > α (0,15 > 0,05) – различия статистически не достоверны
  • 46. Сравнение 2 групп качественных данных l В исследование влияния курения на риск развития ишемической болезни сердца были включены 250 мужчин с ИБС и 250 здоровых мужчин (контрольная группа, подобранная по возрасту). Проводился опрос о курении.
  • 47. Результаты l 70 из 250 пациентов курили l 30 из 250 здоровых мужчин курили ИБС Контроль Курение + 70 30 Курение - 180 220 Всего 250 250
  • 48. Тест хи-квадрат l Расчет по формуле (с помощью компьютера) – р < 0,001 l α=0,05 l Правило: р меньше заданной альфа-ошибки свидетельствует о статистической достоверности полученного различия l В данном случае р < α (0,001 < 0,05) – различия статистически достоверны
  • 49. Критерии выбора статистического теста l Тип анализируемых данных l Характер распределения данных в выборке Статистический анализ не может компенсировать ошибки дизайна исследования
  • 50. Количество групп n≥30 t-тест 1 группа Независимые группы2 группы Да Нет n≥30 t-тест Тест Вилкоксона Нормальное распределение Да Нет Да Нет Нормальное распределение Парный t-тест Да Нет Тест Вилкоксона Да Нет Сравнение средних значений или медиан (порядковые или количественные данные) B.Dawson, R.G.Trapp, 2004
  • 51. Статистическая мощность l Статистическая мощность исследования для выявления эффекта зависит от: l Степени выраженности эффекта l Объема выборки l Ошибка II типа (b) - вероятность не выявления эффекта там, где он есть l Мощность исследования 100(1-b)% l Широкий доверительный интервал свидетельствует о низкой статистической мощности l Расчет объема выборки, необходимого для выявления эффекта, проводится перед началом исследования
  • 52. Статистическая мощность - пример l 30% популяции является носителями гена Х. Цель – определить связь между геном Х и риском развития болезни Альцгеймера l Для P < 0.05 и 80% статистической мощности потребуется: Контроль Случай Объем выборки (носители Х) (носители Х с болезнью Альцгеймера) 30% 50% 100 30% 40% 350 30% 35% 1400
  • 53. Клиническая и статистическая достоверность l Статистика l Выводы, полученные на группе испытуемых l Ответы являются вероятностными l Медицина l Относится к конкретным пациентам l Решения в значительной степени интуитивны l Статистическая достоверность ≠ клиническая достоверность
  • 54. Клиническая и статистическая достоверность l Препарат А + диета = снижение массы тела на 12% l Диета = снижение массы тела на 10% l Различия достоверны статистически, но не клинически
  • 55. Рождение статистики Необходимость оценки и прогнозирования вероятностных событий Вильям Госсетт, 1927, тест Стьюдента (t-тест)
  • 56. Author - Winston Churchill (1874-1965) «the only statistics you can trust are those you falsified yourself»
  • 57. Планирование исследования l Дизайн исследования l Контрольная группа l Макет базы данных l План статистического анализа результатов