Доклад на 4-м практическом семинаре "Hadoop на практике: проекты и инструменты" журнала "Открытые системы" 22 апреля, отель Мандарин, Москва
http://www.ospcon.ru/node/763.html
Использование Big Data в области персональной медицины. Кейс "Система мониторинга пациентов"
1. Персональная медицина
Александр Прозоров
Лаборатория специальной медицинской техники и технологий, МФТИ
Медицинская диагностика на основе технологий BigData
Кейс «Система мониторинга пациентов»
1
ЦЖС МФТИ
ИМБП РАН
22 апреля 2015
3. Что такое персональная медицина (ПМ)?
Первая эра - БОРЬБА С ИНФЕКЦИЯМИ, ТРАВМАМИ И ИХ ПОСЛЕДСТВИЯМИ
Античная медицина - настоящее время
• Развитие хирургии и терапии, контроль инфекционных заболеваний (вакцинация)
Вторая эра - БОРЬБА С ХРОНИЧЕСКИМИ ЗАБОЛЕВАНИЯМИ
50 гг. ХХ века - настоящее время
• Успешное лечение сердечно-сосудистых, онкологических и социально-значимых
заболеваний, расширение фокуса на лечение психосоциальных и психиатрических
заболеваний (ожирение, алкоголизм, наркомания, курение и пр.)
Третья эра - СОХРАНЕНИЕ И ПОДДЕРЖАНИЕ ЗДОРОВЬЯ
Настоящее время
• Технологически, персональная (персонализированная) медицина (ПМ) – это новая
модель организации медпомощи, основанная на выборе диагностических, лечебных и
профилактических средств, которые являются оптимальными для конкретного пациента,
с учётом его генетических, физиологических, биохимических, поведенческих и других
особенностей
• Теоретически, ПМ – это новая парадигма оказания медпомощи, предполагающая
тесное объединение информационных технологий, науки и клинической терапии
для достижения наилучших клинических или профилактических результатов
• Организационно, ПМ предполагает тесное взаимодействие врача и пациента не
только в клинике, но и в обычной жизни
3
#mHealthLab
Персональная медицина – новая эпоха
взаимоотношений клиники и пациента!
4. За что готов платить пациент*?
#mHealthLab
4
Предотвратимые осложнения
Ненужные процедуры
Неэффективность
Ошибки
Положительный
исход
40%
потери
60%
польза
Положительный
исход100%
польза
2020
2015
*
По
данным
американской
компании
HealthCatalyst
на
основе
североамериканской
статистики
5. Чем определяется качество медпомощи?
#mHealthLab
Согласно определению Американской медицинской ассоциации, медицинская помощь высокого
качества – это помощь, которая приводит к улучшению качества жизни или увеличению её
продолжительности
Согласно концепции ВОЗ, различают три взаимосвязанных аспекта качества медицинской помощи:
1. Качество структуры медпомощи (оснащенность, обеспеченность ресурсами)
2. Качество процесса медпомощи
3. Качество результатов (исходов) медпомощи (по оценкам компетентных специалистов)
Результат медицинской помощи формируется в рамках контакта клиники и пациента и её качество
определяется многими факторами. Однако допустимо выделить основные факторы, влияющие на
качество медпомощи:
1. Качество структуры медпомощи в клинике определяется обеспечением медтехникой и архитектурой
Единой госпитальной информационной системы (ЕГИС)
2. Качество процесса медпомощи в клинике определяется практиками управления и работы, а также
степенью автоматизации производственных процессов
3. Качество результатов медпомощи в клинике определяется уровнем подготовки врачей и среднего
медперсонала, а также долей работы, выполненной без участия человека
5
6. Диагноз
Процедура
Препарат
Пациент
Врач
Регулятор
Клиника
ЕГИС
Клинико-‐
статистичес-‐
кие
группы
(DRG)
Категории
диагнозов
(MDC)
Географич.
иерархия
Временная
иерархия
Орг.
структура
Участник
Плательщик
Заявка
• Медицинские ошибки
• Смертность
• Соблюдение требований
• Диагностика/
Госпитализация/
Выписка/ Эпизод
• Оказание услуг, Коды
диагнозов, Коды
процедур, Коды
препаратов
• Продолжительность
лечения
Какой процент возникновения
побочных эффектов после
лечения?
(Плательщик и регулятор)
Каков уровень смертности в
медицинской организации?
(Регулятор)
Каков процент медицинских ошибок
в медицинской организации?
(Регулятор)
Каков уровень соблюдения
требований к оказанию услуг?
(Плательщик и регулятор)
Функциональные
области
Измерения
Каково соотношение
ошибок к количеству
пациентов?
(Плательщик)
Современная ГИС едина и многомерна – 16 измерений
Измерения современной ГИС
#mHealthLab
6
7. Эти данные
необходимы для
точных
предписывающих
моделей по
каждому пациенту
Предписывающее
моделирование
позволит
улучшить
качество лечения
и снизить его
себестоимость
Медицинские
записи и
данные
исследований
Данные
биометричес-
кого монито-
ринга 24х7
Выписки и
заключения из
разных МО
Геномные и
семейные
данные
Данные о
покупках и
потреблении
Данные
социальных
сетей
Система значимых данных о здоровье человека
#mHealthLab
7
8. Источники данных и точность аналитики
#mHealthLab
Точность прогноза растёт вместе
с ростом размерности данных,
доступных для анализа!
Прогнознаяточностьматематическихмоделей
Размерность системы персональных данных
Данные из
истории болезни
Данные об уровне
потребления
Выписки и заключения
из других клиник
Данные биометри-
ческого мониторинга 24х7
Геномные и
семейные данные
Данные из социальных
сетей и коммуникаций
Клиника
Магазины
Тело пациента
Провайдер данных
генома
Другие клиники
Провайдер
социальной сети
8
9. Потенциально
собираемые
значимые
данные
Данные
ЭМК
Все
значимые
данные
о
здоровье
пациента
100МБ
в
год
на
пациента
100ТБ
в
год
на
пациента
Размерность значимых данных о здоровье
1 млн. раз – разница между объёмом ЭМК и
остальными значимыми данными!
#mHealthLab
9
10. Шкала зрелости медицинских аналитических систем
#mHealthLab
Искусственный интеллект – инструмент для
преодоления колоссальной сложности, скрытой
в огромном объёме данных о здоровье!
Сложностьаналитическойсистемы
Время
Взгляд в прошлое
Понимание происходящего
Предвидение
Описательная
аналитика
Диагностическая
аналитика
Предиктивная
аналитика
Предписывающая
аналитика
Что случилось?
Почему это
произошло?
Что случится?
Что необходимо сделать,
чтобы это не произошло?
Совет
10
11. Влияние архитектуры ГИС на возможности клиники
Модель зрелости клиники иллюстрирует качество медицинской помощи. Оно является результатом совершенствования
архитектуры Единой госпитальной информационной системы, автоматизации и оптимизации процессов медпомощи,
совершенствовании практик управления и лечения, подготовки врачей и среднего медперсонала*
№ Название уровня Возможности клиники
9 Персональная медицина и
предписывающая аналитика
Индивидуализация медпомощи каждому пациенту на основе метрик контингента, к которому принадлежит пациент и его генетических данных. Плата за качество – награда за
поддержание здоровья. Аналитика носит предписывающий характер. Вне клиники её фокус смещается на поддержание здорового образа жизни, физического и
поведенческого здоровья, массовой настройки индивидуальной помощи, включая медицинскую. Клиники трансформируются в организации оптимизации здоровья с
прямыми контактами между пациентами и медработниками. Фиксированный подушевой платеж за оптимизацию здоровья предпочтительнее, чем возмещение за
понесенные расходы. ГИС позволяет обрабатывать тексты на естественном языке, имеет предписывающую аналитику и значительную поддержку принятия решений.
Данные о пациенте пополняются за счет биометрического мониторинга в режиме 24х7, данных о геноме и о семье
8 Активный контроль рисков и
прогнозная аналитика
Организационные процессы по нивелированию рисков поддерживаются прогностическими моделями рисков. Плата за качество входит в нормативно-подушевой платеж.
Фокус аналитики смещается с управления конкретными операциями в сторону сотрудничества врачей с плательщиками по управлению эпизодами оказания медпомощи,
включая прогностические модели и прогнозирование рисков
7 Управление здоровьем
контингентов и причинно-
следственная аналитика
Индивидуализация медпомощи каждому пациенту, на основе метрик контингента, к которому принадлежит пациент. Плата за качество входит в платеж по оплате лечения.
Фокус аналитики направлен на понимание хода лечения каждого пациента. Для мониторинга пациента используются прикроватные мониторы, данные домашнего
мониторинга, данные фармацевтических компаний. Для выставления счетов используется биллинг и детальные тарифные планы
6 Повышение устойчивости
качества оказания медпомощи
Подготовка и осуществление ухода от утилитарной внутренней и внешней отчетности к единообразной, основанной на принципах и механизмах workflow. Фокус аналитики
направлен на измерение строгого соблюдения лучших клинических практик, минимизации отходов и снижения вариабельности качества оказания медпомощи
5 Автоматизированная внешняя
отчетность
Эффективное производство согласованной отчетности, адаптированное под изменяющиеся требования вышестоящих инстанций. Фокус аналитики направлен на быстрое и
согласованное создание отчетности для внешних нужд: ТФОМС, Минздрав, ОИВ, специальных баз данных (например, национальный раковый регистр) и т.п.
4 Автоматизированная
внутренняя отчетность
Эффективное производство согласованной отчетности, широко распространенная доступность актуальных данных в виде самостоятельно конфигурируемых панелей
управления и отчетов
3 Стандартизированные НСИ,
нозологии и реестр пациентов
Связывание и организация основных данных клиники. Появление «единой версии правды». Существенное снижение противоречивости данных и количества ошибок в
отчетности
2 Построение единого
хранилища данных
Сбор и интеграция основных данных организации. Облегчение процесса подготовки внешней и внутренней отчетности. Снижение количества ошибок в отчетности
1 Отдельные интегрированные
ИТ-решения
Неполные, противоречивые данные, обрабатываемые в разных ИТ-системах. Тяжелая, обременительная и длительная подготовка внешних и внутренних отчетов. Большое
количество ошибок в отчетности
*
На
основе
модели
зрелости
клиники
американской
компании
HealthCatalyst
#mHealthLab
11
13. Какую архитектуру выбрать? Взгляд в историюКоличествоисточниковданных
Время
Универ-
сальные ЭВМ
ПК
Клиент
сервер
SOA BigData
(1970-1980) (1980-1990) (1990-2000) (2000-2010) (2010-2020)
1 млн 10 млн 100 млн 1,4 млрд
50 млрд?
2010 Internet of
Things
(2020-...)
Мейнфреймы
(1960-1970)
I II III IV VI VIIV
100 тыс
Системы,
скомпоно-‐
ванные
из
разных
под-‐
программ
(JCL,
Cobol,
Fortran)
Моно-‐
литные
системы
с
термина-‐
льным
доступом
Клиент-‐
сервер
с
«толстым»
клиентом
Клиент-‐
сервер
с
Web-‐
клиентом
Линейно
масшта-‐
бируемые
системы
Динами-‐
ческие
системы,
компонуе-‐
мые
из
отдельных
модулей
под
определен-‐
ные
задачи
Одноранго-‐
вые
сети
из
персональ-‐
ных
приложе-‐
ний
#mHealthLab
Смена парадигмы по причине взрывного роста
количества источников данных
14. Потребители
медицинской информации Много
потребителей
Какие ИТ-решения необходимы для ПМ?
Устройства, генерирующие
биометрические данные Много
устройств
ХРАНЕНИЕ
Долговременное хранение и пере-
дача данных для использования
ВТОРИЧНАЯ
ОБРАБОТКА
Формирование рабочих наборов и обра-
ботка данных в зависимости от запросов
ВИЗУАЛИЗАЦИЯВзаимодействие с пользователем и
визуализация информации
#mHealthLab
<−
узкое место
ПЛАТФОРМАМАССИВНО-
ПАРАЛЛЕЛЬНОЙ
ОБРАБОТКИДАННЫХ
«Традиционные» ИТ-системы Динамические ИТ-системы
У платформ массивно-параллельных
вычислений нет узкого места! 14
ЗАХВАТ ДАННЫХПриём, фильтрация и передача
данных на первичную обработку
ПЕРВИЧНАЯ
ОБРАБОТКА
Приём, трансформация, очистка
и передача данных на хранение
15. Пример MPP-платформы BigData Warehouse
Перспективный проект МНТК «Микрохирургии глаза» им. Акад. Федорова
#mHealthLab
Управление данными
1 2 3 4 5 6 7 8 ... N9 10 11 12
... 2 3 4 5 6 7 8 ... N9 10 11 12
M 2 3 4 5 6 7 8 ... N9 10 11 12
Линейно масштабируемая вычислительная сеть и хранение данных
(Data + Name + Standby Nodes & HDFS)
Операционная система управления кластером
(YARN)
Интерфейсы доступа к данным (коннекторы)
Управление метаданными
(HCatalog)
Batch Script SQL noSQL Real-Time In-Memory Search
Кластер Hadoop высокой готовности
Map Reduce Pig Hive HBase Storm Spark
Мониторинг операций
(Ambari, Zookeeper)
Витрины
данных
Сложный
анализ
Клиническая
информация
Качество
лечения
Диагнозы
Операции
ЕХД
Импорт
бумажных
документов
Связывание
Загрузка
Стандарти
зация
Обработка
ошибок
Распознавание
Сканирование
Solr
Управление жизненным
циклом данных
(Falcon, Sqoop, Flume)
Планирование
ресурсов
(Oozie)
Управление
доступом
(Knox)
15
Импорт
бумажного
архива:
10 млн.
документов
Пациентопоток:
350 тыс. в год
Кластер из 480
узлов, с учетом
3-х летнего
прироста ХД
Прирост
хранилища:
1 млн.
документов в год
17. Краткая характеристика системы
#mHealthLab
Назначение:
• Отслеживание состояния пациентов при помощи сенсоров, лежащих
под матрасом больничной койки
• Прием и архивирование данных с традиционных прикроватных
мониторов отделений реанимации и интенсивной терапии, а также
других устройств мониторинга
Возможности:
• Хронометраж нахождения пациента на больничной койке, времени его
переворотов медсестрой
• Генерация тревожных событий при выходе пульса, дыхания, двигательной
активности и других параметров мониторинга за пределы определенного
коридора
• Информирование ответственной медсестры или врача о наступлении
тревожных событий и т.п.
• Визуализация динамики хода лечения
• Длительное хранение данных для последующего использования
• Исследования и сложный анализ данных
18. Логическая схема работы
#mHealthLab
18
Поток
сырых
данных
Поток чистых
данных
Выполнение
команд,
актуализация
настроек
Сложный
анализ
данных,
актуализация
настроек в
сложных
случаях
Анализ данных
пациентов,
актуализация
настроек
Архивирование
Интеграция с ГИС
Сложный анализ данных
Терминальная часть
Серверная часть
АРМ аналитика
АРМ медработника
Администрирование
системы
Диагностические
устройства
Концентратор
данных
ЧССАД
Сеть диагностических
устройств
АРМ Центральный пульт
мониторинга
Поток данных для
визуализации
АРМ Администратора
Ведение НСИ,
ограничение
доступа к данным
19. Схема потоков данных
#mHealthLab
19
SENSOR DATAHUB
BDW
CACHEDB
"Cырые"
данные
N 1
1
N
N
1
1
N
1
N
1
1
Биометрические
показатели
Настройки +
биометрические
показатели
WEBUI
ANDROID
N
N
APPSERVER
1
1
SIUD-запрсы
SELECT-
запросы
Данные для
визуализации
RSTUDIO
1 N
MP-запросы
20. Работа с центральным хранилищем данных (BDW)
#mHealthLab
20
BIG DATA WAREHOUSE (BDW)
CACHEDB
События
N
AVRO
HDFS
HIVE
HBASE
RHDFS
APPSERVER
RSTUDIO
SOLR
N
Данные о пациентах
и клинике (не
биометрические)
Биометрические данные
Результаты
поиска
Запуск программ и
передача результатов
вычислений
Данные для
визуализации
N
Линейно масштабируемое хранилище с параллельным доступом к данным
Исполнение R-скриптов ETL + правила Поиск данных
1
1
1
1
N
21. Практические результаты для пользователей
#mHealthLab
В зависимости от типа пользователей, система
позволяет получить различные практические
результаты:
• Пациент получает медицинскую помощь более высокого качества
• Медсестра получает уведомления о событиях пациентов, которые
требуют её вмешательства
• Врач получает информацию о ходе лечения пациентов, отклике
организма пациента на воздействие препаратов, процедур и
манипуляций
• Исследователь получает возможность доступа к реальным
данным высочайшего качества для подготовки и защиты
диссертаций, повышения уровня своей подготовки, проведения
научных изысканий
• Администрация клиники улучшает свои показатели по качеству
лечения, жалобам пациентов, уровню подготовки врачей,
внедрению сберегающих здоровье технологий
22. 22
Прозоров Александр Александрович
Образование:
• В 1998 году закончил МИРЭА, факультет Вычислительных машин и систем,
специальность «Вычислительные машины, комплексы, системы и сети» (220100)
• Базовые предприятия: Институт системного программирования РАН,
Межведомственный суперкомпьютерный центр РАН
Место работы:
• Научный сотрудник Лаборатории специальной медицинской техники, технологий и
фармакологии ЦЖС МФТИ
• Научный сотрудник Инновационного центра космической медицины ИМБП РАН
• Генеральный директор ООО «Информационные системы реального времени»
Последние значимые результаты работ:
• Руководил проектом разработки Регионального Сегмента ЕГИСЗ в АТ Консалтинг
(2011-12гг). Система введена в пром. эксплуатацию
• Руководил проектом разработки Национальной облачной платформы Ростелекома
(www.o7.com) в АТ Консалтинг (2011-12гг). Система введена в пром. эксплуатацию
• Практический опыт работы в области стратегического маркетинга (направления: SaaS,
разработка ПАК, системная интеграция) – 7 лет
Контакты:
• Email: ap@rtlab.ru, тел: 8 916 9989619
Есть вопросы? Задавайте!
#mHealthLab