Краткий доклад на Практической конференции по Hadoop 25.11.2015 об организации R&D среды проекта по созданию системы мониторинга пациентов реанимации на основе подхода "data lake" и Hadoop. Доклад иллюстрирует способ использования связки Hadoop и R для научных работ по математическому моделированию в области реанимации и интенсивной терапии. Проект в активной фазе по этому о содержании проводимых научных исследований не упоминается.
Hadoop and R guards The Health of Critically ill Patients
1. Hadoop Hortonworks и R на страже здоровья
реанимационных больных
Александр Прозоров, #mHealthLab
Лаборатория спецмедтехники и технологий, МФТИ
Практическая конференция «Технологии больших данных»
1
ЦЖС МФТИ
ИМБП РАН
25.11.2015 г.
2. Современные ИТ – неотъемлемая часть
технологического обеспечения реанимации
Постановка и подходы к решению задач
2
ЦЖС МФТИ
ИМБП РАН
#mHealthLab
3. Что такое реанимация?
3
#mHealthLab
Реанимация
–
это
комплекс
мероприятий,
направленных
на
оживление
организма
Задачей
реаниматолога
является
восстановление
и
поддержание
витальных
функций
организма
–
сердечной
деятельности,
дыхания
и
обмена
веществ
Обеспечение
палат
реанимации
• Мониторирование
витальных
функций
• Оборудование
для
инфузионной
терапии,
оксигенации
крови,
коррекции
работы
сердца
• Средства
для
обеспечения
питания
и
отвода
продуктов
жизнедеятельности
4. Постановка задачи
#mHealthLab
2.
На
основе
мат.
модели
разработать
алгоритмы
расчета
индикаторов
• «Количество
жизни»
–
качественно
отражающий
текущее
состояние
больного
• «Динамика
жизни»
–
качественно
отражающий
изменение
состояния
больного
4
3.
Разработать
программное
обеспечение
• Отображающее
значение
показателей
и
данных
монитора
жизненных
функций
больного
в
реальном
времени
• Позволяющее
регистрировать
манипуляции
с
больным
1.
Разработать
математическую
модель,
позволяющую
на
основе
наблюдаемых
гемодинамических
показателей
больного
оценить
вероятность
наступление
летального
исхода
и
время
его
наступления
5. Подход к решению задачи
#mHealthLab
1. Получить
первичные
статистические
данные,
позволяющие
сформулировать
начальные
гипотезы
реализации
мат.
модели
и
индикаторов
2. Построить
математическую
модель
на
основе
начальных
гипотез
3. Построить
систему
сбора
фактических
данных
пациентов
для
верификации
мат.
модели
4. Разработать
прикладное
программное
обеспечение
5. Провести
клинические
испытания,
внести
необходимые
уточнения
в
мат.
модель
и
программное
обеспечение
5
6. Требования к R&D среде
Фотоотчет реализации среды разработки в условиях
непрерывного лечебного процесса
6
ЦЖС МФТИ
ИМБП РАН
#mHealthLab
7. Требования к размещению R&D среды
#mHealthLab
1. Отсутствие
помех
(сложностей)
непрерывному
лечебному
процессу
2. Соответствие
требованиям
эпидемиологического
контроля
3. Подключение
к
существующей
системе
витальных
мониторов
4. Удаленный
доступ
ученых
к
R&D
среде
в
любое
время
5. Репликация
данных
на
сервера
лаборатории
7
Тестовое
подключение
PROXY
8. Реализация основных узлов (1)
#mHealthLab
8
Нет
изменений
в
рабочем
процессе
Центральная
станция
на
посту
Подключение
витальных
мониторов
9. Реализация основных узлов (2)
#mHealthLab
9
Узел
обработки
данных
LTE
роутер
Funless
server
Proxy
-‐
Raspberry
Pi
2
10. Hadoop – «озеро данных» для R&D
Архитектура среды разработки, подключение к
мониторам витальных функций, репликация данных,
организация доступа к данным из RStudio
10
ЦЖС МФТИ
ИМБП РАН
#mHealthLab
11. Архитектура среды разработки (схематично)
#mHealthLab
11
PROXY
Центральная
станция
мониторинга
Пациент
Монитор
витальных
функций
CACHEDB HADOOP
Медработник
В лабораторииЛокально в реанимации
UI-сервер
Медработник
Ученый
12. Подключение к сети мониторов витальных функций (было)
#mHealthLab
12
12 port
router
+
BOOTP
Монитор
витальных
функций
eth0
Центральная
станция
мониторинга
eth0
Монитор
витальных
функций
eth0
Монитор
витальных
функций
eth0
Монитор
витальных
функций
eth0
BED 1
...
MAC xx:xx:xx:xx:0A
MAC xx:xx:xx:xx:0B
MAC xx:xx:xx:xx:0C
MAC xx:xx:xx:xx:0F
BED 2
BED 1
BED 3
BED 6
13. Подключение к сети мониторов витальных функций (стало)
#mHealthLab
13
PROXY
Центральная
станция
мониторинга
Монитор
витальных
функций
CACHEDB
UI-сервер
eth0
eth1
12 port
switch
eth0 eth0
eth0
MAC xx:xx:xx:xx:0A
MAC xx:xx:xx:xx:0A
Philips
Intellivue
MP70
Raspberry Pi 2
Intel i3, Core
Duo, 4G RAM,
128G SSD
(fanless!)
Postgres 7.4
bokeh + flask
Windows XP
BED 1
14. Наполнение «озера данных» в Hadoop
#mHealthLab
14
CACHEDB
(MASTER)
CACHEDB
(SLAVE)
Export
script
AVRO
HDFS
HIVE
RHadoop
packages
SOLR
Исполнение R-скриптов ETL + правила Поиск данных
Линейно масштабируемое хранилище с параллельным доступом к данным
В лабораторииВ реанимации
Репликация
данных
Python скрипт
по выборке,
конвертации и
выгрузке
данных
Сериализация данныхЭкспорт данных
15. Организация доступа к данным из RStudio
#mHealthLab
15
HDFS
rhdfs
Basic file access
rhbase + ravro
HBase access
HBaseMR Job Tracker
RStudio
Ученый
Рабочая станция
Hadoop cluster
R
rmr2
rmr2
Statistical analysis
plyrmr + rmr
plyrmr + rmr
plyr + reshape2
Thrift
16. 16
Прозоров Александр Александрович
Научный сотрудник Лаборатории специальной
медицинской техники и технологий МФТИ
Научный сотрудник Инновационного центра
космической медицины ИМБП РАН
Генеральный директор ООО «Лаборатория
информационных систем реального времени»
Email: ap@rtlab.ru
Mobi: +7 916 9989619
Есть вопросы? Задавайте!
#mHealthLab