国⽴病院機構における診療情報分析国⽴病院機構における診療情報分析
川島 直美
1
⾃⼰紹介⾃⼰紹介
川島直美です• 川島直美です
– (独)国⽴病院機構 本部 総合研究センター
診療情報分析部 システム開発専⾨職診療情報分析部 システム開発専⾨職
– GitHUB: imoan1983
• 情報処理学会誌 デジタルプラクティス情報処理学会誌 デジタルプラクティス
特集「ヘルスケアの現場を⽀えるIT」
『国⽴病院機構における診療情報分析システム
について―構築と運⽤に関する現状と課題―』
2
今⽇のお話今⽇のお話
1 診療情報分析部について1. 診療情報分析部について
2. 収集データの処理
3. 処理によって得られた効果3. 処理によって得られた効果
3
1. 診療情報分析部
4
診療情報分析部
since 2010
機構143病院の診療デ タを収集 分析• 機構143病院の診療データを収集・分析
– 医療の可視化・⽐較
– 医療の質の向上・均てん化への貢献
5
MIA
Medical Information Analysis databank
デ タ収集基盤• データ収集基盤
– テキストファイル収集・RDB化
– SQLで⾃由分析
OracleOracle
6
MIA収集データMIA収集デ タ
業務で作成するデ タを⼆次利⽤• 業務で作成するデータを⼆次利⽤
1. DPC調査データ
Diagnosis Procedure Combinationg
2. レセプトデータ2. レセプトデ タ
7
MIA収集データ
1.DPC調査データ
の前に DPC/PDPSについて• の前に、DPC/PDPSについて
Diagnosis Procedure Combination/Per-Diem Payment System
– 包括的な診療報酬⽀払い制度
• 従来:出来⾼算定• 従来:出来⾼算定
⼊院患者を2000種 のDPCに分類– ⼊院患者を2000種+のDPCに分類
• 病名、⼿術、処置
– 急性期病院を中⼼に参加
8
MIA収集データ
1.DPC調査データ
DPC/PDPS参加病院に作成 提出義務• DPC/PDPS参加病院に作成・提出義務
– ⼊院サマリ+⽇々の診療⾏為– ⼊院サマリ+⽇々の診療⾏為
– タブ区切り⾏列
体系的なコードの記載– 体系的なコードの記載
– 曖昧なデータにはペナルティ
\リッチで正確、分析しやすいデータ/
でも参加病院が少ない 機構67/全国1700+
9
2.レセプトデータ
の前に⽇本の健康保険制度のおさらい
(診療報酬明細書)
• の前に⽇本の健康保険制度のおさらい
治療治療
被保険者 治療治療
⼀部⽀払い⼀部⽀払い
被保険者
(みなさんのこと)
医療機関
治療明細提出治療明細提出 審査・残額⽀払審査・残額⽀払保険料納付保険料納付
審査⽀払機関
保険者 請求請求
審査⽀払機関
保険者
(健康保険組合等) 残額⽀払残額⽀払
10
MIA収集データ
2.レセプトデータ(診療報酬明細書)
保険診療をする全医療機関が⽉ 作成• 保険診療をする全医療機関が⽉⼀作成
○○という病名でした、××をしました、□□円です
⼆次利⽤は念頭にない仕様 orz...
– 請求⽤の⼀意なだけのコード
– ⾏列ではないCSV⾏列ではないCSV
– 審査の都合で…
でも作成病院が多い 機構143/全国9万
11
2. 収集データの処理
レセプトデ タとの戦いレセプトデータとの戦い
12
レセプトデータとの戦いレセプトデ タとの戦い
1 請求⽤コ ド1. 請求⽤コード
– 体系的なコードに変換しよう!
2 ⾏列ではないCSV2. ⾏列ではないCSV
– 成形しよう!
3 審査の都合で病名多すぎ3. 審査の都合で病名多すぎ
– どうしよう!
13
レセプトデータとの戦いレセプトデ タとの戦い
1 請求⽤コ ド1. 請求⽤コード
– 体系的なコードに変換しよう!
2. ⾏列ではないCSV2. ⾏列ではないCSV
– 成形しよう!
3. 審査の都合で病名多すぎ
– どうしよう!
14
レセプトデータって
2011年度から原則電⼦運⽤
IR,1,13,1,9999905,,サンプル医科病院,42405,00,03-9999-9999
RE,61,1119,42404,サンプル 6
1,1,3160927,,4240124,,,,,sample-ika-
061,,,,,,,,14,,,,,,,,,,,,,,
HO,06132013,1234567,61,7,16794,,20,13150,,,44400,,,, , , , , ,, , ,,, ,,,
SY,4319018,4240124,1,,,01,
SY,8839792,4240124,1,,,,
SY,8120005,4240124,1,8002,,,
…
IY,21,1,613330003,3,,3,,,,,,,,,,1,1,1,,,,,,,,,,,,,,,,,,,,,,,,,
IY,,1,620002332,1,4,3,,,,,,,,,,1,1,1,,,,,,,,,,,,,,,,,,,,,,,…
CO,90,1,840000013,240407
SI 90 1 190118610 7 1 1 1 1 1 1 1
社会保険診療報酬⽀払基⾦WEBサイトより抜粋
SI,90,1,190118610,,,7,,,,,,,1,1,1,1,1,1,1,,,,,,,,,,,,,,,,,,…
こころの⽬で⾒ると…
15
レセプトデータとの戦い
請求⽤コード
請求⽤マスタで⽇本語に翻訳• 請求⽤マスタで⽇本語に翻訳
請求⽤マスタ請求⽤マスタ レセプト電算処理コードレセプト電算処理コード//印字例印字例請求⽤マスタ請求⽤マスタ レセプト電算処理コ ドレセプト電算処理コ ド//印字例印字例
診療⾏為 160020910 中性脂肪(検査)
特定器材 700080000 四ツ切(レントゲンフィルム)
医薬品 610444041 ガスターD錠10mg
傷病名 0703025 C型慢性肝炎
修飾 疑修飾語 8002 の疑い
コメント 840000013 退 院 年 ⽉ ⽇
体系的な体系的な
コードへコードへ
16
コ ドへコ ドへ
体系的なコードに変換しよう!
薬剤(約20,000種)
様々な薬品のためのコ ド• 様々な薬品のためのコード
– 薬価基準収載医薬品コード
– HOTコード
– JANコード– JANコード
• 何をもって1種類の薬?
– 薬効(解熱鎮静剤/⾎圧降下剤…)
– 剤形(飲み薬/注射/塗り薬…)剤形(飲み薬/注射/塗り薬 )
– 製造元(先発メーカー/後発メーカー…)
17
体系的なコードに変換しよう!
例えば薬価基準収載医薬品コード
IY 21 1 610444041 3 3 2IY,21,1,610444041,3,3,2,,,,,…
ガスターガスターDD錠錠10mg10mg
2 3 2 5 0 0 3 F 3 0 3 5
• 2*:個々の器官系医薬品2 :個々の器官系医薬品
• 23*:消化器官⽤薬
• 232*:消化性潰瘍剤
• 2325*:H2遮断剤
• 2325003*:ファモチジン
• 2325003F*:の 飲み薬• 2325003F*:の、飲み薬
• 2325003F3035:アステラス製薬のガスターD錠10mg
18
任意の粒度で集計・分析任意の粒度で集計・分析
体系的なコードに変換しよう
傷病名コード(約25,000種)
世界的な傷病統計⽤コ ド• 世界的な傷病統計⽤コード
– ICDコード
International Statistical Classification of
Diseases and Related Health Problems
疾病及び関連保健問題の国際統計分類
19
体系的なコードに変換しよう
ICDコード
SY,1513002,4240124,1,8002,,,
胃底部癌胃底部癌胃底部癌胃底部癌
C161
任意の粒度で任意の粒度で
• C*:新⽣物
• C16*:胃の悪性新⽣物
集計・分析集計・分析
• C16*:胃の悪性新⽣物
• C161:胃の悪性新⽣物, 胃底部
20
体系的なコードに変換したいのに
未コード化傷病名
マスタは全病名を網羅してはいない• マスタは全病名を網羅してはいない
– 新種の病気
何とも診断が かな 状態– 何とも診断がつかない状態
不明コード+テキスト病名不明 キ
SY,0000999,4240124,1,,二型糖尿病,,
『『25000152500015 22型糖尿病型糖尿病』』では?では?
⼊⼒時に検索できてない
21
体系的なコードに変換しよう!
テキスト病名で集計はしたくない
DPC調査デ タの病名欄• DPC調査データの病名欄
– 診断病名 + ICDコード
DPCDPC調査データ調査データ
ICDICD 病名病名
レセプトデータレセプトデータ
病名病名 ICDICDICDICD 病名病名
E119 2型糖尿病
E119 II型糖尿病
病名病名 ICDICD
2型糖尿病 NULL
⼆型糖尿病 NULL
E119
E119
E119 ⼆型糖尿病
E119 糖尿病(2型)
イ リ ⾮依存性糖尿病
2型糖尿病合併症なし NULL
E119 インスリン⾮依存性糖尿病
医師の知⾒を医師の知⾒を
利⽤利⽤
22
レセプトデータとの戦いレセプトデ タとの戦い
1 請求⽤コ ド1. 請求⽤コード
– 体系的なコードに変換しよう!
2. ⾏列ではないCSV2. ⾏列ではないCSV
– 成形しよう!
3. 審査の都合で病名多すぎ
– どうしよう!
23
成形しよう!
記載の省略 -最低限記載主義-
IY,21,1,620004915,1,,…
IY, ,1,620003619,1,,…
IY 1 620000167 1
21
21埋める! IY, ,1,620000167,1,,…
IY, ,1,610443053,1,,…
IY 1 620002429 1 15 …
21
21
21
24
IY, ,1,620002429,1,15,…21
成形しよう!
⾏ごとに異なる種類の情報
RE,61,1119,42404,サンプル 61,1,3160927…
HO,06132013,1234567,61,7,16794,,20,…
SY,4319018,4240124,1,,,01,
SY 8839792 4240124 1 …SY,8839792,4240124,1,,,, …
SI,13,1,180016110,,250,1,,,,,,,,,,,,,1,,,,,,,,,,,…
IY,21,1,613330003,3,3,2,,,,,,,,1,1,,,,,,,,,,,,,,,…
分割!
医療⾏為医療⾏為プロフィールプロフィール 病名病名 医療⾏為医療⾏為
病院ID
患者ID
プロフィールプロフィール
病院ID
患者ID
病名病名
病院ID
患者ID
診療⽉
医療⾏為
診療⽉
⽣年⽉⽇
診療⽉
病名
25
性別
成形しよう!
1⽇の情報、2⽇の情報、3⽇の情報…31⽇の情報
22⽇の情報⽇の情報
11⽇の情報⽇の情報
22⽇の情報⽇の情報
33⽇の情報⽇の情報
IY,21,1,620004915,1,,11,,,,,,,1,1,1,1,1,1,5…
IY 1 620003619 1 11 1 1 1 1 1 1 5…IY,,1,620003619,1,,11,,,,,,,1,1,1,1,1,1,5
IY,,1,620000167,1,,11,,,,,,,1,1,1,1,1,1,5…
実施⽇実施⽇ 医療⾏為医療⾏為 数数実施⽇実施⽇ 医療⾏為医療⾏為 数数
2014/04/01 620004915 1
2014/04/02 620004915 1
縦積み!縦積み!
2014/04/02 620004915 1
2014/04/03 620004915 1
… 620004915 …
縦積み!縦積み!
26
2014/04/07 620004915 5
成形しよう!
だんだん集計できそうになってきたけど…
集計の単位は何?• 集計の単位は何?
– のべ⼈⽉?
– ユニーク患者数?
• 医療者が知りたいのは症例数
– 発症/治療開始〜治癒/治療終了
– 便宜上、⼊院〜退院便宜上、⼊院 退院
27
成形しよう!
1⼊院1レコード化
RE 1 1115 42604 国病太郎 1 358311 4260225RE,1,1115,42604,国病太郎,1,358311,,4260225,…
…
CO 90 1 840000013 260301CO,90,1,840000013,260301
CO,,1,840000014,260305
⼊退院⽇を抽出してソート
病院病院IDID 患者患者IDID ⼊院⽇⼊院⽇ 退院⽇退院⽇
123456789 000000123 2014/02/25 2014/03/01
123456789 000000123 2014/03/05 NULL123456789 000000123 2014/03/05 NULL
123456789 000000246 2014/03/01 2014/03/04
123456789 000000482 2014/03/05 2014/03/07
28
/ / / /
和暦和暦→→⻄暦へ⻄暦へ
レセプトデータとの戦いレセプトデ タとの戦い
1 請求⽤コ ド1. 請求⽤コード
– 体系的なコードに変換しよう!
2. ⾏列ではないCSV2. ⾏列ではないCSV
– 成形しよう!
3. 審査の都合で病名多すぎ
– どうしよう!
29
どうしよう!
病名の記載多すぎ
病名/医療⾏為の整合性審査• 病名/医療⾏為の整合性審査
– その病名の患者にそれをすべきだったか?
• 病名別 ⼊院患者数 上位病名別 ⼊院患者数 上位
– ⾼⾎圧症
– ⾼脂⾎症
れら 治療 ためれら 治療 ため
⾼脂⾎症
– 糖尿病
便秘症
これらの治療のためのこれらの治療のための
⼊院ではないはず!⼊院ではないはず!
– 便秘症
– 不眠症
30
どうしよう!
主傷病欄は助けてくれない
あることにはある『主傷病』欄• あることにはある『主傷病』欄
オンライン⼜は光ディスク等による請求に係る記録条件仕様(医科⽤)より抜粋
1つも主傷病を持たない患者
オンライン⼜は光ディスク等による請求に係る記録条件仕様(医科⽤)より抜粋
– 1つも主傷病を持たない患者
– 何⼗個も主傷病を持つ患者
別に重みづけは審査に関係ないし…
31
どうしよう!
どうしよう
お医者さんに聞きましたお医者さんに聞きました
『メインの病名から順に書くよ』『メインの病名から順に書くよ』
番上 病名を暫定主病名とす• ⼀番上の病名を暫定主病名とする
#発症順に書いてる⼈もいるよなー
機械学習する?• 機械学習する?
– 医療⾏為+記載病名
32
どうしよう!
主病名が選べても…
様々な患者状態像• 様々な患者状態像
– 重症/軽症/
– 初期/末期
– 急性期/慢性期– 急性期/慢性期
– ⼀時的/永続的
初発 発
混ぜたら混ぜたら
– 初発/再発
– ⼿術あり/なし
たらたら
⽐較出来ない⽐較出来ない
– 合併症あり/なし
33
どうしよう!
解決策1 丁寧な患者抽出ロジックで集団を捕捉
学会の治療ガイドライン• 学会の治療ガイドライン
• 専⾨医の知⾒専⾨医の知⾒
重症/軽症– 重症/軽症
• この病気の重症者に投与される注射薬は?
– 急性期/慢性期
• この病気で⼿術ありということは急性期?
34
どうしよう!
解決策2 DPCでグループ化
DPC• DPC
– メインの病名、⼿術、処置
処置なし
合併症なし
胃がん
⼿術なし 合併症あり
処置あり
⼿術あり 処置なし
⼊院患者を重複なく2000種+に分類
35
3. 処理によって得られた効果
戦いの果てに戦いの果てに…
36
コード変換、成形による効果
各種統計との⽐較
DPC導⼊の影響評価に関する調査• DPC導⼊の影響評価に関する調査
– 国病以外の病院との⽐較
• 国勢調査/患者調査/
– 地域の推計患者数
• 将来推計⼈⼝
将来推計患者数– 将来推計患者数
平成24年度 診療機能分析レポートより抜粋
37
推計患者数におけるシェア
丁寧な抽出ロジックによる効果
病院横断的⽐較
臨床評価指標• 臨床評価指標
– 医療の質を定量的に評価
平成24年度医療の質の評価・公表推進事業に
おける臨床評価指標より抜粋
38
終わりに
データとの戦いは続く
デ タの⼆次利⽤ ゴミ箱あさり• データの⼆次利⽤ = ゴミ箱あさり
– 綺麗なゴミを捨てて下さいとは⾔えず…
• ゴミの⼭ = 宝の⼭ゴミの⼭ 宝の⼭
– 磨けば光ると信じて
• JSON化+Riak実験中
b– GitHub kuenishi/meddatum/src/rezept_parser.erl
39
ありがとうございましたありがとうございました
40

医療ビッグデータ勉強会 第2回 国立病院機構における診療情報分析について