SlideShare a Scribd company logo
1 of 29
Download to read offline
Сергей Добриднюк,
«Диасофт Системы»
резидент ИЦ «Сколково»
Big Data и BI в медицине
«5-я волна»
Медицинские технологии – одна из самых
динамично развивающихся практик
2
Здравоохранение и ЗОЖ напрямую
влияет на человеческий капитал !
Риски для РФ (со стартового доклада МФФ 2016, 23.09.2016 г)
3
Видение будущего
В медицинском центре сложнейшую операцию на сердце делает робот. Человек
только контролирует его действия на экране компьютера (Roboarts Japan, 1969)
1-я Волна (1960-1980 годы)
Экспертные модели
Принцип
Эксперты конструируют матрицу входов-
выходов и перекладывают ее в ЭВМ.
Эксперты, параметры, веса и точность –
крайне субъективны
Данная модель легко разрабатывается в
продуктах класса Excel или вручную по
результатам «мозгового штурма»
Низкая точность. «Улучшение» или
«ухудшение» общего целевого балла,
если рассматриваемые входные
параметры коррелируют между собой
Достоинства
Недостатки
Внедрение в СССР. Дорого и бессмысленно
Примеры ИС, использующих экспертные
модели. Настоящее время
WebMD Checker – диагностика по симптомам
PROTEGE – набор инструментов для построения баз знаний
DXPlain - системы поддержки клинических решений, используется для
ассистирования в процессе диагностики
CASNET предназначена для диагностики и выбора стратегии лечения
глаукомы
MYCIN, EMYCIN - диагностика и лечение инфекционных заболеваний
крови
Germwatcher - помощь больничному эпидемиологу. Включает базу
знаний, основанную на правилах, используется для генерации гипотез о
возможных инфекциях
PEIRS интерпретирует и комментирует отчеты по химическим патологиям
Puff - предназначена для интерпретации результатов
функционального пульмонологического теста на основе прецедентной
информации
HELP –госпитальная ИС с функциями поддержки принятия решений
2-я волна. (1980-2000 годы)
Кибернетические системы
Искусственный интеллект
(artificial intelligence, AI) –
свойство автоматических
систем брать на себя
отдельные функции человека,
в том числе когнитивные и
творческие
Кибернетика – наука об общих
закономерностях процессов
управления и передачи
информации в технических,
живых и социальных системах
Регрессионные модели на оцифрованных
клинических данных
Принцип
Строятся на «полевых данных».
Построение полинома (чаще лог-регрессия)
на основе обучающей выборки
• Не искажает результат в случае
корреляции входных параметров между
собой, автоматически обнуляя веса
зависимых параметров
• Модель можно перепроверить, т.к у
целевой функции существует обратная
функция
• Нечувствительность к резкому
изменению диапазона значений
входных параметров
Достоинства
Деревья решений, Леса решений и пр.
Принцип
Построение дерева (обычно С4.5) на основе
обучающей выборки
• Также как и модель лог-регрессии –
модель автоматически ранжирует
входные параметры по степени влияния
на результат, рассчитывая коэффициенты
влияния
• Результат представляется в виде «дерева»
- которое можно использовать даже в
ручном режиме обработки данных
• Модель автоматически убирает ненужные
сравнения и расчеты, обеспечивая очень
высокую скорость расчета целевого
предложения
Достоинства
Точность статистических моделей выше
точности экспертных моделей
Перем
енная
Параметр
Коэффиц
иент
1 Число случаев беременности 0.1232
2 Концентрация глюкозы 0.0352
3
Артериальное диастолическое
давление, мм. рт. ст.
-0.0133
4
Толщина кожной складки
трехглавой мышцы, мм.
0.0006
5
2-х часовой сывороточный
инсулин
-0.0012
6 Индекс массы тела 0.0897
7
Числовой параметр
наследственности диабета
0.9452
8 Возраст, лет 0.0149
AUC=83,9%
*) Из UCI machine learning repository
www.basegroup.ru
confusion
matrix
Фактически
Модель Положит. Отрицат.
Положит. TP FP
Отрицат. FN TN
Примеры статистических модулей,
подключаемых к МИС
• Bayesia
• Deductor Studio
• IBM SPSS Statistics
• IBM SPSS Modeler
• Matlab
• MS Excel
• Oracle Data Miner
• Orange
• Statsoft Statistica
• SAS Etnerprise
Miner
• Stata
• Statsoft Statistica
• TIBCO Spotfire
3-я волна. (1958-н.в.)
Однослойные нейронные сети
Принцип
Модель самообучающихся сетей,
имитирующих работу человеческого мозга
• Высокие показатели точности
• Позволяет найти закономерности даже
в случае «серой зоны» - когда ни по
одному из входных параметров
невозможно сделать точный вывод о
клиенте и его проблемах
• Очень высокие требования к
вычислительным средствам
• Нет обратной функции – «непонятно как
объяснить вывод врачу»
• Из-за нелинейности – всплески в
необученных и нетиповых ситуациях
Достоинства
Недостатки
Эксперимент «Китайская комната»
«Сильный и Слабый искусственный интеллект»
Searle, John. R. (1980) «Minds, brains, and programs. Behavioral and Brain Sciences»
Нужны системы,
распознающие
контекст и смысл
сказанного,
умеющие
исполнять
творческие
функции человека
Когнитивные
системы,
Искусственный
интеллект
Можно ли
эффективно
отвечать на
вопросы, если
действуешь
механически, не
понимая смысл
вопроса ?
Нейронные сети («Слабый» ИИ)
San-Diego Univ. – разпознавание инфаркта у больных с острой болью
MYCIN–ECD – расшифровка ЭКГ
RES Informatica – кардиодиагностика по спектрам тахограмм
Toronto Univ. – прогноз пребывания в интенсивной терапии
Mayo Clinic – распознавание маммограм
ТРИНИТИ – выбор метода лечения базалиомы
Multineuron – диагностика меланомы
NCI – предсказание механизма действия химиотерапии
НИИЯФ МГУ – анализ заболеваний органов слуха
Sindey Univ – прогноз внезапной смерти новорожденных
Papnet – скрининг и интерпретация пап-мазков
Vienna Univ. – анализ биопсии простаты и урологических анализов
Aizenberg – фильтрация и сегментация томограмм мозга
Rajapakse – анализ рентгенограмм вн. органов: печень, почки
Dokur – анализ 4 специфичных волн ЭКГ при аритмии
KBANN – классификация МРТ (фосфор и пр) в онкологии
Kaiser Hospital – автоматическое назначение анализов (свыше 250)
ACR – анализ васкулитных поражений
4-я волна. (2007-н.в.)
Deep Learning
Принцип
Многослойные нейронные сети с
нелинейными преобразованиями,
Сверточные сети, Рекуррентные сети
• Очень высокие показатели точности
• При объеме выборки точность растет
• Возможно восстановление онтологии и
базы знаний без участия человека
• Нужен очень большой объем данных
для обучения (миллионы записей)
• Нет обратной функции – невозможно
объяснить вывод в терминах врача
• Очень Высокие требования к
компьютерам
Достоинства
Недостатки
17
Россия накопила порядка 2% мировых данных. Китай, для сравнения, 15%
(McKinsey & Company, 2016)
Big Data уже в национальных хранилищах
2,500,000,000,000,000,000 байт в день (2,5 экзабайта)
История термина BI – «переоткрытие»
Впервые термин Business Intelligence
предложил американский ученый Ханс
Петер Лун (Hans Peter Luhn) в статье "A
Business Intelligence System" для IBM
Journal of Research and Development в
1958 году.
18
В 1989 году его заново открыл известный
аналитик из Gartner Ховард Дреснер
(Howard Dresner) и дал BI расширенную
трактовку, предложив использовать BI в
качестве зонтичного термина для
различных технологий, предназначенных
для поддержки принятия решений
Точность Нейронные сетей нового поколения
( MNN и Deep Learning = «Средний» ИИ )
Обработка радиологических изображений, МРТ, маммограм
https://www.unitedhealthcareonline.com
Раннее обнаружение рака
http://www.ijera.com
Обработка пренатальных УЗИ
http://www.researchgate.net
Обработка эхокардиографических изображений
http://ijcsi.org/papers/IJCSI-10-5-1-83-90.pdf
Диагностика сложной аритмии по ЭКГ
http://www.academia.edu
Диагностика туберкулеза (специальная модель)
http://www.acsu.buffalo.edu/~grant/47.pdf
Расшифровка ЭКГ - (с методом вейвлетных преобразований)
http://www.globalcis.org/jcit/ppl/JCIT3851PPL.pdf
Предсказание язвенных инцидентов
http://www.ehob.com/img/documents/document_123.pdf
Предсказание кардиологических инцидентов
http://www.ijaiem.org/Volume4Issue5/IJAIEM-2015-05-30-81.pdf
93%
95%
93,3%
93,7%
99,5%
94,7%
99%
96,9%
94%
5-я волна. (2015-н.в.)
«Платформизация», «Цифровая экономика»
«Цифровой бизнес» – новая модель бизнеса, охватывающая
людей/бизнес/вещи , масштабируемая глобально для всего мира за
счет широкого использования информационных технологий,
Интернета и всех их свойств, предполагающая эффективное
персональное обслуживание всех, везде, всегда . Gartner, 2014 год
«Диджитализация» - трансформация текущего и создание нового
бизнеса с размыванием границ между реальным и виртуальным
миром , устранением «цифровых разрывов» между людьми,
процессами и вещами, присущих традиционному бизнесу, на основе
возможностей, предоставляемых информационными технологиями.
IDC, 2015 год
Ключевые свойства «Цифровых Платформ»
(прогноз Gartner)
• «Капитализация» данных
• Парадигма IT+DT+AI (см Alibaba)
• ИТ продукты c ИИ (роботы, алгоритмы) как новый субьект права
• «Ресурсогенерация», Виртуальная валюта
• «Заражение» смежных отраслей
• Принципиально новые объекты, субьекты, отношения, технологии,
финансы, ценности, мотивация, организация
• Новые профессии, виды образования и Система разделения труда
21
ИСЧЕЗАЮЩИЕ: 50 ПРОФЕССИЙ / 25 ИНДУСТРИЙ
Прогноз – к 2020 году исчезнут 30% услуг и
появится 20% абсолютно пока неизвестных
«Дата-центричные» архитектуры, а не
системо- и даже клиенто-центричные
«Озеро
данных»
Отечественные разработчики и университеты
быстро наращивают экспертизу
DIASOFT FLEXTERA BI
«Цифровая Платформа» будет знать о Вас все
И о стране тоже…
(из доклада Е.Паперного, портал «Здоровье»)
Триггер BI,
анализирующий
вопросы посетителей о
симптомах болезней в
Интернет, распознал
появление эпидемии
гриппа в регионах на 1
месяц раньше, чем НИИ
Гриппа
Проблемы защиты личных данных возрастут,
но будет непонятно от кого защищаться
Вопросы, которые чаще всего задают
Кто должен создавать такие системы – Математик или Врач ?
Только Врач (но знающий математику). Только он способен задавать
«правильные» вопросы и делать содержательные глубокие выводы.
Но этому не учат ни в одном медицинском ВУЗе – ни математике, ни
ИТ. Частично спасет Deep Learning или трансфер специалистов из
более развитых отраслей (банки и финтех, web, e-commerce, ритейл)
Откуда взять данные ?
Это самая драматичная часть в России. Мало оцифрованных данных,
а те что есть – имеют низкое качество и консистентность. ЕГИСЗ и
ЭМК в этом не помогают, они «мозаичны» и «лоскутны».
Можно ли стать успешным разработчиком Аналитической Модели ?
Да, но нужна не модель, а законченное решение (Сервис). Это
командный проект для ученых, практиков, разработчиков, чиновников
Спасибо за внимание !

More Related Content

Similar to Big data и bi в медицине 5 волна

11.хранитель public-rus
11.хранитель public-rus11.хранитель public-rus
11.хранитель public-rusSkolkovoMD
 
Нейронные сети. Pureso
Нейронные сети. PuresoНейронные сети. Pureso
Нейронные сети. PuresoAlexey Dmitriev
 
7.астмедком public-rus
7.астмедком public-rus7.астмедком public-rus
7.астмедком public-rusSkolkovoMD
 
Plakhov urfu 2013
Plakhov urfu 2013Plakhov urfu 2013
Plakhov urfu 2013Yandex
 
MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...
MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...
MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...Alexey Soshnin
 
Институт медицинской информатики.
Институт медицинской информатики. Институт медицинской информатики.
Институт медицинской информатики. Skolkovo Robotics Center
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
когнитивные технологии, Ibm
когнитивные технологии, Ibmкогнитивные технологии, Ibm
когнитивные технологии, IbmSkolkovo Robotics Center
 
Когнитивные технологии
Когнитивные технологииКогнитивные технологии
Когнитивные технологииSkolkovo Robotics Center
 
Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыEvgeniy Pavlovskiy
 
FRUCT presentation on Skolkovo M.D.
FRUCT presentation on Skolkovo M.D.FRUCT presentation on Skolkovo M.D.
FRUCT presentation on Skolkovo M.D.fructmd
 
ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA
ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA
ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA mir4sveta
 
ИТ решения GE Healthcare: инновации и экономический эффект
ИТ решения GE Healthcare: инновации и экономический эффектИТ решения GE Healthcare: инновации и экономический эффект
ИТ решения GE Healthcare: инновации и экономический эффектmir4sveta
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full versionDmitry Guzenko
 
Big Data: вызовы и возможности
Big Data: вызовы и возможностиBig Data: вызовы и возможности
Big Data: вызовы и возможностиStanislav Makarov
 
Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данныхDEVTYPE
 
василевич иван I direction
василевич иван I directionвасилевич иван I direction
василевич иван I directionYNIQ
 
!Predictive analyticbasics part1
!Predictive analyticbasics part1!Predictive analyticbasics part1
!Predictive analyticbasics part1Vladimir Krylov
 
Основы концептуального проектирования
Основы концептуального проектированияОсновы концептуального проектирования
Основы концептуального проектированияAnton Tyukov
 
Novel Software Systems priorities 2019
Novel Software Systems priorities 2019Novel Software Systems priorities 2019
Novel Software Systems priorities 2019Novel Software Systems
 

Similar to Big data и bi в медицине 5 волна (20)

11.хранитель public-rus
11.хранитель public-rus11.хранитель public-rus
11.хранитель public-rus
 
Нейронные сети. Pureso
Нейронные сети. PuresoНейронные сети. Pureso
Нейронные сети. Pureso
 
7.астмедком public-rus
7.астмедком public-rus7.астмедком public-rus
7.астмедком public-rus
 
Plakhov urfu 2013
Plakhov urfu 2013Plakhov urfu 2013
Plakhov urfu 2013
 
MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...
MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...
MIRC, TFS, VNA, DICOM, HL7, IHE, RadLex, openEHR, Khresmoi… ИТ-шные штучки, о...
 
Институт медицинской информатики.
Институт медицинской информатики. Институт медицинской информатики.
Институт медицинской информатики.
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
когнитивные технологии, Ibm
когнитивные технологии, Ibmкогнитивные технологии, Ibm
когнитивные технологии, Ibm
 
Когнитивные технологии
Когнитивные технологииКогнитивные технологии
Когнитивные технологии
 
Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспекты
 
FRUCT presentation on Skolkovo M.D.
FRUCT presentation on Skolkovo M.D.FRUCT presentation on Skolkovo M.D.
FRUCT presentation on Skolkovo M.D.
 
ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA
ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA
ИТ решения GE Healthcare для радиологии - Centricity RIS/PACS/CCA
 
ИТ решения GE Healthcare: инновации и экономический эффект
ИТ решения GE Healthcare: инновации и экономический эффектИТ решения GE Healthcare: инновации и экономический эффект
ИТ решения GE Healthcare: инновации и экономический эффект
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
Big Data: вызовы и возможности
Big Data: вызовы и возможностиBig Data: вызовы и возможности
Big Data: вызовы и возможности
 
Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
 
василевич иван I direction
василевич иван I directionвасилевич иван I direction
василевич иван I direction
 
!Predictive analyticbasics part1
!Predictive analyticbasics part1!Predictive analyticbasics part1
!Predictive analyticbasics part1
 
Основы концептуального проектирования
Основы концептуального проектированияОсновы концептуального проектирования
Основы концептуального проектирования
 
Novel Software Systems priorities 2019
Novel Software Systems priorities 2019Novel Software Systems priorities 2019
Novel Software Systems priorities 2019
 

More from Serge Dobridnjuk

Архитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdfАрхитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdfSerge Dobridnjuk
 
Квантовые эффекты в Архитектуре предприятия.pdf
Квантовые эффекты в Архитектуре предприятия.pdfКвантовые эффекты в Архитектуре предприятия.pdf
Квантовые эффекты в Архитектуре предприятия.pdfSerge Dobridnjuk
 
Banking after covid transformation
Banking after covid transformationBanking after covid transformation
Banking after covid transformationSerge Dobridnjuk
 
Lecture. IT in the Government sector of Russia
Lecture. IT in the Government sector of Russia Lecture. IT in the Government sector of Russia
Lecture. IT in the Government sector of Russia Serge Dobridnjuk
 
From Russia with love / Опыт вывода ИТ решения зарубеж
From Russia with love / Опыт вывода ИТ решения зарубежFrom Russia with love / Опыт вывода ИТ решения зарубеж
From Russia with love / Опыт вывода ИТ решения зарубежSerge Dobridnjuk
 
добриднюк. Цифровые платформы научных исследований
добриднюк. Цифровые платформы научных исследованийдобриднюк. Цифровые платформы научных исследований
добриднюк. Цифровые платформы научных исследованийSerge Dobridnjuk
 
Медицинская информатика - кто, что, зачем
Медицинская информатика - кто, что, зачемМедицинская информатика - кто, что, зачем
Медицинская информатика - кто, что, зачемSerge Dobridnjuk
 
Финтех и "диджитализация" банковской сферы
Финтех и "диджитализация" банковской сферыФинтех и "диджитализация" банковской сферы
Финтех и "диджитализация" банковской сферыSerge Dobridnjuk
 
Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...
Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...
Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...Serge Dobridnjuk
 
Реализация требований современных информационно-насыщенных бизнес-архитектур ...
Реализация требований современных информационно-насыщенных бизнес-архитектур ...Реализация требований современных информационно-насыщенных бизнес-архитектур ...
Реализация требований современных информационно-насыщенных бизнес-архитектур ...Serge Dobridnjuk
 
Цифровой госпиталь Сколково.. за 100 часов
Цифровой госпиталь Сколково.. за 100 часовЦифровой госпиталь Сколково.. за 100 часов
Цифровой госпиталь Сколково.. за 100 часовSerge Dobridnjuk
 
СМЭВ, осень 2014 , ситуация и преспективы
СМЭВ, осень 2014 , ситуация и преспективыСМЭВ, осень 2014 , ситуация и преспективы
СМЭВ, осень 2014 , ситуация и преспективыSerge Dobridnjuk
 
Avantyurist. izbrannoe-2007-20
Avantyurist. izbrannoe-2007-20 Avantyurist. izbrannoe-2007-20
Avantyurist. izbrannoe-2007-20 Serge Dobridnjuk
 
Survey on Merchants' Costs of Processing Cash and Card Payments in EU
Survey on Merchants' Costs of Processing Cash and Card Payments in EUSurvey on Merchants' Costs of Processing Cash and Card Payments in EU
Survey on Merchants' Costs of Processing Cash and Card Payments in EUSerge Dobridnjuk
 
European Standards on Confidentiality and Privacy in Healthcare
European Standards on Confidentiality and Privacy in HealthcareEuropean Standards on Confidentiality and Privacy in Healthcare
European Standards on Confidentiality and Privacy in HealthcareSerge Dobridnjuk
 

More from Serge Dobridnjuk (16)

Архитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdfАрхитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdf
 
Квантовые эффекты в Архитектуре предприятия.pdf
Квантовые эффекты в Архитектуре предприятия.pdfКвантовые эффекты в Архитектуре предприятия.pdf
Квантовые эффекты в Архитектуре предприятия.pdf
 
Banking after covid transformation
Banking after covid transformationBanking after covid transformation
Banking after covid transformation
 
Lecture. IT in the Government sector of Russia
Lecture. IT in the Government sector of Russia Lecture. IT in the Government sector of Russia
Lecture. IT in the Government sector of Russia
 
From Russia with love / Опыт вывода ИТ решения зарубеж
From Russia with love / Опыт вывода ИТ решения зарубежFrom Russia with love / Опыт вывода ИТ решения зарубеж
From Russia with love / Опыт вывода ИТ решения зарубеж
 
добриднюк. Цифровые платформы научных исследований
добриднюк. Цифровые платформы научных исследованийдобриднюк. Цифровые платформы научных исследований
добриднюк. Цифровые платформы научных исследований
 
Медицинская информатика - кто, что, зачем
Медицинская информатика - кто, что, зачемМедицинская информатика - кто, что, зачем
Медицинская информатика - кто, что, зачем
 
Финтех и "диджитализация" банковской сферы
Финтех и "диджитализация" банковской сферыФинтех и "диджитализация" банковской сферы
Финтех и "диджитализация" банковской сферы
 
Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...
Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...
Доклад "Реализация требований современных информационно-насыщенных бизнес-арх...
 
Реализация требований современных информационно-насыщенных бизнес-архитектур ...
Реализация требований современных информационно-насыщенных бизнес-архитектур ...Реализация требований современных информационно-насыщенных бизнес-архитектур ...
Реализация требований современных информационно-насыщенных бизнес-архитектур ...
 
Цифровой госпиталь Сколково.. за 100 часов
Цифровой госпиталь Сколково.. за 100 часовЦифровой госпиталь Сколково.. за 100 часов
Цифровой госпиталь Сколково.. за 100 часов
 
СМЭВ, осень 2014 , ситуация и преспективы
СМЭВ, осень 2014 , ситуация и преспективыСМЭВ, осень 2014 , ситуация и преспективы
СМЭВ, осень 2014 , ситуация и преспективы
 
Avantyurist. izbrannoe-2007-20
Avantyurist. izbrannoe-2007-20 Avantyurist. izbrannoe-2007-20
Avantyurist. izbrannoe-2007-20
 
Ibm business trends
Ibm business trendsIbm business trends
Ibm business trends
 
Survey on Merchants' Costs of Processing Cash and Card Payments in EU
Survey on Merchants' Costs of Processing Cash and Card Payments in EUSurvey on Merchants' Costs of Processing Cash and Card Payments in EU
Survey on Merchants' Costs of Processing Cash and Card Payments in EU
 
European Standards on Confidentiality and Privacy in Healthcare
European Standards on Confidentiality and Privacy in HealthcareEuropean Standards on Confidentiality and Privacy in Healthcare
European Standards on Confidentiality and Privacy in Healthcare
 

Big data и bi в медицине 5 волна

  • 1. Сергей Добриднюк, «Диасофт Системы» резидент ИЦ «Сколково» Big Data и BI в медицине «5-я волна»
  • 2. Медицинские технологии – одна из самых динамично развивающихся практик 2
  • 3. Здравоохранение и ЗОЖ напрямую влияет на человеческий капитал ! Риски для РФ (со стартового доклада МФФ 2016, 23.09.2016 г) 3
  • 4. Видение будущего В медицинском центре сложнейшую операцию на сердце делает робот. Человек только контролирует его действия на экране компьютера (Roboarts Japan, 1969)
  • 5. 1-я Волна (1960-1980 годы) Экспертные модели Принцип Эксперты конструируют матрицу входов- выходов и перекладывают ее в ЭВМ. Эксперты, параметры, веса и точность – крайне субъективны Данная модель легко разрабатывается в продуктах класса Excel или вручную по результатам «мозгового штурма» Низкая точность. «Улучшение» или «ухудшение» общего целевого балла, если рассматриваемые входные параметры коррелируют между собой Достоинства Недостатки
  • 6. Внедрение в СССР. Дорого и бессмысленно
  • 7. Примеры ИС, использующих экспертные модели. Настоящее время WebMD Checker – диагностика по симптомам PROTEGE – набор инструментов для построения баз знаний DXPlain - системы поддержки клинических решений, используется для ассистирования в процессе диагностики CASNET предназначена для диагностики и выбора стратегии лечения глаукомы MYCIN, EMYCIN - диагностика и лечение инфекционных заболеваний крови Germwatcher - помощь больничному эпидемиологу. Включает базу знаний, основанную на правилах, используется для генерации гипотез о возможных инфекциях PEIRS интерпретирует и комментирует отчеты по химическим патологиям Puff - предназначена для интерпретации результатов функционального пульмонологического теста на основе прецедентной информации HELP –госпитальная ИС с функциями поддержки принятия решений
  • 8. 2-я волна. (1980-2000 годы) Кибернетические системы Искусственный интеллект (artificial intelligence, AI) – свойство автоматических систем брать на себя отдельные функции человека, в том числе когнитивные и творческие Кибернетика – наука об общих закономерностях процессов управления и передачи информации в технических, живых и социальных системах
  • 9. Регрессионные модели на оцифрованных клинических данных Принцип Строятся на «полевых данных». Построение полинома (чаще лог-регрессия) на основе обучающей выборки • Не искажает результат в случае корреляции входных параметров между собой, автоматически обнуляя веса зависимых параметров • Модель можно перепроверить, т.к у целевой функции существует обратная функция • Нечувствительность к резкому изменению диапазона значений входных параметров Достоинства
  • 10. Деревья решений, Леса решений и пр. Принцип Построение дерева (обычно С4.5) на основе обучающей выборки • Также как и модель лог-регрессии – модель автоматически ранжирует входные параметры по степени влияния на результат, рассчитывая коэффициенты влияния • Результат представляется в виде «дерева» - которое можно использовать даже в ручном режиме обработки данных • Модель автоматически убирает ненужные сравнения и расчеты, обеспечивая очень высокую скорость расчета целевого предложения Достоинства
  • 11. Точность статистических моделей выше точности экспертных моделей Перем енная Параметр Коэффиц иент 1 Число случаев беременности 0.1232 2 Концентрация глюкозы 0.0352 3 Артериальное диастолическое давление, мм. рт. ст. -0.0133 4 Толщина кожной складки трехглавой мышцы, мм. 0.0006 5 2-х часовой сывороточный инсулин -0.0012 6 Индекс массы тела 0.0897 7 Числовой параметр наследственности диабета 0.9452 8 Возраст, лет 0.0149 AUC=83,9% *) Из UCI machine learning repository www.basegroup.ru confusion matrix Фактически Модель Положит. Отрицат. Положит. TP FP Отрицат. FN TN
  • 12. Примеры статистических модулей, подключаемых к МИС • Bayesia • Deductor Studio • IBM SPSS Statistics • IBM SPSS Modeler • Matlab • MS Excel • Oracle Data Miner • Orange • Statsoft Statistica • SAS Etnerprise Miner • Stata • Statsoft Statistica • TIBCO Spotfire
  • 13. 3-я волна. (1958-н.в.) Однослойные нейронные сети Принцип Модель самообучающихся сетей, имитирующих работу человеческого мозга • Высокие показатели точности • Позволяет найти закономерности даже в случае «серой зоны» - когда ни по одному из входных параметров невозможно сделать точный вывод о клиенте и его проблемах • Очень высокие требования к вычислительным средствам • Нет обратной функции – «непонятно как объяснить вывод врачу» • Из-за нелинейности – всплески в необученных и нетиповых ситуациях Достоинства Недостатки
  • 14. Эксперимент «Китайская комната» «Сильный и Слабый искусственный интеллект» Searle, John. R. (1980) «Minds, brains, and programs. Behavioral and Brain Sciences» Нужны системы, распознающие контекст и смысл сказанного, умеющие исполнять творческие функции человека Когнитивные системы, Искусственный интеллект Можно ли эффективно отвечать на вопросы, если действуешь механически, не понимая смысл вопроса ?
  • 15. Нейронные сети («Слабый» ИИ) San-Diego Univ. – разпознавание инфаркта у больных с острой болью MYCIN–ECD – расшифровка ЭКГ RES Informatica – кардиодиагностика по спектрам тахограмм Toronto Univ. – прогноз пребывания в интенсивной терапии Mayo Clinic – распознавание маммограм ТРИНИТИ – выбор метода лечения базалиомы Multineuron – диагностика меланомы NCI – предсказание механизма действия химиотерапии НИИЯФ МГУ – анализ заболеваний органов слуха Sindey Univ – прогноз внезапной смерти новорожденных Papnet – скрининг и интерпретация пап-мазков Vienna Univ. – анализ биопсии простаты и урологических анализов Aizenberg – фильтрация и сегментация томограмм мозга Rajapakse – анализ рентгенограмм вн. органов: печень, почки Dokur – анализ 4 специфичных волн ЭКГ при аритмии KBANN – классификация МРТ (фосфор и пр) в онкологии Kaiser Hospital – автоматическое назначение анализов (свыше 250) ACR – анализ васкулитных поражений
  • 16. 4-я волна. (2007-н.в.) Deep Learning Принцип Многослойные нейронные сети с нелинейными преобразованиями, Сверточные сети, Рекуррентные сети • Очень высокие показатели точности • При объеме выборки точность растет • Возможно восстановление онтологии и базы знаний без участия человека • Нужен очень большой объем данных для обучения (миллионы записей) • Нет обратной функции – невозможно объяснить вывод в терминах врача • Очень Высокие требования к компьютерам Достоинства Недостатки
  • 17. 17 Россия накопила порядка 2% мировых данных. Китай, для сравнения, 15% (McKinsey & Company, 2016) Big Data уже в национальных хранилищах 2,500,000,000,000,000,000 байт в день (2,5 экзабайта)
  • 18. История термина BI – «переоткрытие» Впервые термин Business Intelligence предложил американский ученый Ханс Петер Лун (Hans Peter Luhn) в статье "A Business Intelligence System" для IBM Journal of Research and Development в 1958 году. 18 В 1989 году его заново открыл известный аналитик из Gartner Ховард Дреснер (Howard Dresner) и дал BI расширенную трактовку, предложив использовать BI в качестве зонтичного термина для различных технологий, предназначенных для поддержки принятия решений
  • 19. Точность Нейронные сетей нового поколения ( MNN и Deep Learning = «Средний» ИИ ) Обработка радиологических изображений, МРТ, маммограм https://www.unitedhealthcareonline.com Раннее обнаружение рака http://www.ijera.com Обработка пренатальных УЗИ http://www.researchgate.net Обработка эхокардиографических изображений http://ijcsi.org/papers/IJCSI-10-5-1-83-90.pdf Диагностика сложной аритмии по ЭКГ http://www.academia.edu Диагностика туберкулеза (специальная модель) http://www.acsu.buffalo.edu/~grant/47.pdf Расшифровка ЭКГ - (с методом вейвлетных преобразований) http://www.globalcis.org/jcit/ppl/JCIT3851PPL.pdf Предсказание язвенных инцидентов http://www.ehob.com/img/documents/document_123.pdf Предсказание кардиологических инцидентов http://www.ijaiem.org/Volume4Issue5/IJAIEM-2015-05-30-81.pdf 93% 95% 93,3% 93,7% 99,5% 94,7% 99% 96,9% 94%
  • 20. 5-я волна. (2015-н.в.) «Платформизация», «Цифровая экономика» «Цифровой бизнес» – новая модель бизнеса, охватывающая людей/бизнес/вещи , масштабируемая глобально для всего мира за счет широкого использования информационных технологий, Интернета и всех их свойств, предполагающая эффективное персональное обслуживание всех, везде, всегда . Gartner, 2014 год «Диджитализация» - трансформация текущего и создание нового бизнеса с размыванием границ между реальным и виртуальным миром , устранением «цифровых разрывов» между людьми, процессами и вещами, присущих традиционному бизнесу, на основе возможностей, предоставляемых информационными технологиями. IDC, 2015 год
  • 21. Ключевые свойства «Цифровых Платформ» (прогноз Gartner) • «Капитализация» данных • Парадигма IT+DT+AI (см Alibaba) • ИТ продукты c ИИ (роботы, алгоритмы) как новый субьект права • «Ресурсогенерация», Виртуальная валюта • «Заражение» смежных отраслей • Принципиально новые объекты, субьекты, отношения, технологии, финансы, ценности, мотивация, организация • Новые профессии, виды образования и Система разделения труда 21
  • 22. ИСЧЕЗАЮЩИЕ: 50 ПРОФЕССИЙ / 25 ИНДУСТРИЙ Прогноз – к 2020 году исчезнут 30% услуг и появится 20% абсолютно пока неизвестных
  • 23. «Дата-центричные» архитектуры, а не системо- и даже клиенто-центричные «Озеро данных»
  • 24. Отечественные разработчики и университеты быстро наращивают экспертизу DIASOFT FLEXTERA BI
  • 26. И о стране тоже… (из доклада Е.Паперного, портал «Здоровье») Триггер BI, анализирующий вопросы посетителей о симптомах болезней в Интернет, распознал появление эпидемии гриппа в регионах на 1 месяц раньше, чем НИИ Гриппа
  • 27. Проблемы защиты личных данных возрастут, но будет непонятно от кого защищаться
  • 28. Вопросы, которые чаще всего задают Кто должен создавать такие системы – Математик или Врач ? Только Врач (но знающий математику). Только он способен задавать «правильные» вопросы и делать содержательные глубокие выводы. Но этому не учат ни в одном медицинском ВУЗе – ни математике, ни ИТ. Частично спасет Deep Learning или трансфер специалистов из более развитых отраслей (банки и финтех, web, e-commerce, ритейл) Откуда взять данные ? Это самая драматичная часть в России. Мало оцифрованных данных, а те что есть – имеют низкое качество и консистентность. ЕГИСЗ и ЭМК в этом не помогают, они «мозаичны» и «лоскутны». Можно ли стать успешным разработчиком Аналитической Модели ? Да, но нужна не модель, а законченное решение (Сервис). Это командный проект для ученых, практиков, разработчиков, чиновников