2. InterSystems – успешная компания с 1978 года
– InterSystems - международная компания
• 36 офисов в 24 странах мира
• Представительство в Москве с 1997 года
• Более 80 партнеров в России и в странах
СНГ и Балтии
– Линейка продуктов InterSystems:
• HealthShare - стратегическое решение
для сбора, анализа и обмена медицинской
информацией на уровне региона или сети ЛПУ
• Платформа для интеграции Ensemble
• NoSQL СУБД Caché
• МИС TrakCare и ЛИС TrakCare Lab
3. InterSystems HealthShare – это…
– Платформа обмена медицинскими
данными и документами
– Инструмент для быстрой
интеграции медицинских
систем с применением
международных стандартов
– Сервер приложений,
промышленная СУБД
– Аналитическая технология
– Среда разработки и
исполнения бизнес-процессов
– Набор библиотек компонентов,
включая Linkage Engine
Мобильные
пользова-
тели
Лаборатории
Страховщики
Сети ЛПУ
АРМы
работы с
ЭМК
HealthShare
МИС в ЛПУ
5. Что дает внедрение мастер-индекса пациентов?
• Решение проблемы разрозненности медицинской
информации в региональных информационных системах,
аккумулирующих данные из разнородных источников
– Экономия средств ОМС за счет сокращения количества
повторных исследований, уже проведенных данному пациенту в
других медицинских организациях
– Повышение качества оказания медицинской помощи благодаря
снижению числа ошибочных назначений
• Доступ к информации о хронических заболеваниях и аллергиях
пациента, ранее диагностированных в других организациях
– Уменьшение количества повторных госпитализаций
• Доступ врачей СМП к данным о назначениях пациенту и о результатах
анализов во время недавно проведенной госпитализации
6. Проблемы идентификации пациентов
• Неполные данные
• Ошибки ввода
– Орфография, опечатки, латинские буквы
– Специфические ошибки при вводе номеров документов
– Перестановки полей, например, имени и фамилии
• Использование фиктивных значений в обязательных полях
– СНИЛСы: 123-456-789 00,111-111-111 45, …
• Ввод чужих данных
– Номер паспорта матери в данных новорожденного ребенка
• Смена фамилии, имени, паспорта, полиса, …
• Варианты написания отчеств
– Равшанович / Равшан-оглы
• Использование сокращений и аббревиатур
7. Способы идентификации пациентов
• Детерминированные алгоритмы
– Идентификация пациентов путем применения правил вида
• «Идентифицировать пациента по первому непустому значению
реквизита из списка [СНИЛС, номер полиса ОМС, номер паспорта, …]»
– Требуется абсолютная уверенность в полноте и «чистоте»
заполнения ключевых реквизитов
• Вероятностные модели
– Идентификация пациентов с применением вероятностных
моделей, фонетических алгоритмов, алгоритмов нестрогого
сопоставления
– Корректная идентификация даже при наличии ошибок и
пробелов в данных
– Низкая производительность по сравнению с
детерминированными алгоритмами
8. Региональный мастер-индекс пациентов (РМП)
• РМП на платформе InterSystems HealthShare – это…
– Единый регистр демографической
информации
– Сервисы идентификации пациентов,
в том числе по неточным или неполным
демографическим данным
– Интерфейс предметного
администратора: список задач на
принятие решений о связывании
записей
– Интеграция с внешними системами
• Возможность использования для
вычистки дублей из унаследованных
массивов демографических данных
9. Вероятностная модель
• В рамках РМП используется модель, впервые описанная в
статье Fellegi и Sunter “The Theory for Record Linkage” в 1969 г
• Наивный байесовский классификатор (Naїve Bayes) - простой
вероятностный классификатор, основанный на применении
теоремы Байеса со строгими (наивными) предположениями о
независимости
– Пример: если фрукт красный, круглый и размером около 7см, то
есть вероятность, что это яблоко. Применяя наивный
байесовский классификатор, мы предполагаем, что эти три
свойства фрукта не зависят друг от друга, и наличие каждого из
них вносит независимый вклад в вероятность того, что фрукт
является яблоком.
• http://en.wikipedia.org/wiki/Naive_Bayes_classifier
• http://en.wikipedia.org/wiki/Record_linkage
10. Этапы работы мастер-индекса
– Нормализация
– Индексирование: быстрый отбор пар потенциально совпадающих
записей при помощи набора индексов
– Классифицирование: вычисление весов пар потенциальных
совпадений + применение правил для особых случаев
– Валидация
Вес “A”: +10
Вес “D”: -5
Вес “A”: +8
Вес “D”: -8
Вес “A”: +15
Вес “D”: -9
Вес “A”: +10
Вес “D”: -8
Вес “A”: +14
Вес “D”: -9
ФИО ДР СНИЛС Паспорт Полис ОМС
Источник A Иванов
Дмитрий
Иванович
10/12/1956 123-456-789
64
4501 821001 6175512171
234567
Источник В Иванов Д.И. нет данных 123-456-789
64
4501 821010 2343552356
213232
+8 0 +15 +8.5 -9
Вес пары: 22.5
12. Опыт внедрения РМП
• Итерационный процесс настройки параметров РМП:
весов, порогов, алгоритмов, словарей, …
– Тонкая настройка для каждого из источников демографической
информации
– Интеграция с внешними информационными системами для
проверки потенциальных совпадений
• Обработка унаследованных массивов данных
– Зачастую такие данные содержат большой процент дублей
• Возможность в короткие сроки получить эффект от запуска
региональной ЭМК – дать врачам доступ к истории оказания
пациенту медицинских услуг