1. Real-MedNLP - REAL document-based MEDical Natural Language Processing -
NTCIR-16 Real-MedNLP
タスク紹介
2021/7/1版
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
https://sociocom.naist.jp/real-mednlp/
1
2. Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Real-MedNLP
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
実際の医療文書(症例報告,読影所見)を用いた医療言語処理のシェアード・タスク
本タスクを通して,様々な医療サービスを支援する実用システムの開発に資すること
を目指す
主催:
荒牧 英治, Ph.D.(NAIST)
若宮 翔子, Ph.D.(NAIST)
矢田 竣太郎, Ph.D.(NAIST)
中村 優太, M.D.(東京大学医学部附属病院)
協力:
株式会社ワイズ・リーディング
NAIST ソーシャル・コンピューティング研究室 学生スタッフ一同
2
3. 症例報告コーパス MedTxt−CR
MedTxtCR sample
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
詳しくはこちら https://sociocom.naist.jp/medtxt/cr/
症例報告 (Case Report) は,個々の患者の診断・治療・その後の経過を観察した結果と考察
を詳しく報告した医学論文の一種
MedTxt-CRは,CiNii で公開されているオープンアクセスの日本語症例報告200文書にタグ
を付与したデータセット (Ja ) とこれを英語に翻訳したデータセット (En ) から構成
トレーニングセット:100文書,テストセット:100文書
タグ(MedTxt-RRと共通)
・病名・症状 <d>
・臓器・部位 <a>
・特徴・尺度 <f>
・変化 <c>
・時間表現 <TIMEX3>
・検査(検査名,検査項目,検査値) <t-test/key/val>
・薬品 (薬品名,薬品値)<m-key/val>
・処置 Remedy <r>
・クリニカルコンテキスト <cc>
・保留 <p>
3
4. 読影所見コーパス MedTxt−RR
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
詳しくはこちら https://sociocom.naist.jp/medtxt/rr/
読影所見 (Radiology Report) は,放射線科医がCT画像から予想される所見(潜在的な疾患
を含む)を記載した臨床文書の一種
MedTxt-RRは,Radiopaedia
で無料公開されている15症例の肺がんCT画像について9名の
放射線科医が作成した日本語読影所見135文書にタグを付与したデータセット (Ja ) と
これを英語に翻訳したデータセット (En ) から構成
トレーニングセット:72文書,テストセット:63文書
タグ(MedTxt-CRと共通)
・病名・症状 <d>
・臓器・部位 <a>
・特徴・尺度 <f>
・変化 <c>
・時間表現 <TIMEX3>
・検査(検査名,検査項目,検査値)<t-test/key/val>
・薬品(薬品名,薬品値)<m-key/val>
・処置 Remedy <r>
・クリニカルコンテキスト <cc>
・保留 <p>
MedTxtRR sample
4
5. タスク概要
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
症例報告コーパス
MedTxt-CR Track
読影所見コーパス
MedTxt-RR Track
サブタスク1: 100サンプルを用いたNER
Ja En Ja En
サブタスク2: ガイドラインラーニング
によるNER
Ja En Ja En
サブタスク3: 応用 (ADE* or CI**)
ADE-Ja ADE-En CI-Ja CI-En
少ないリソースでの
固有表現抽出
Few-resource Named
Entity Recognition (NER)
応用
Application
* Adverse Drug Event detection 薬物有害事象情報の検出
** Case Identification 同一症例についての所見の特定
Real-MedNLP タスクには,2種類のコーパスに基づくトラック(MedTxt-CR Track と
MedTxt-RR Track)があり,それぞれ3つのサブタスク(サブタスク1-3)から構成される
5
6. 少ないリソースでの固有表現抽出 Few-resource Named Entity Recognition (NER)
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
医療言語処理においてデファクトスタンダードなサイズとなっている100∼200文書程度の
コーパスを用いた,医療言語処理の最も基本的な情報抽出であるNERに関するサブタスク
サブタスク1:100サンプルを用いたNER
100文書からなるトレーニングセットを用いたNER
標準的な少ないリソースでの教師付き学習に相当
サブタスク2:ガイドラインラーニングによるNER
アノテーションガイドラインにおける各タグについての
例文を用いたNER
アノテーションガイドラインから学ぶことが多い人間の
アノテーターのトレーニングを模擬
Note: 他の外部リソースを利用することも可能
頻度の高いタグセットについて評価
・病名・症状 <d>
・臓器・部位 <a>
・時間表現 <TIMEX3>
・検査(検査名,検査項目,検査値)
<t-test/key/val>
・薬品 (薬品名,薬品値)<m-key/val>
6
7. 応用 Application
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
実用的な観点からコーパストラックごとに設計
された応用サブタスク
サブタスク3:応用
[MedTxt-CR Track]
Adverse Drug Event detection (ADE)
症例報告から薬物有害事象 (ADE) 情報を抽出
してテーブルを作成
<d> テーブル:病名・症状の一般名と ADE情報 (ADE-POSITIVE/NEGATIVE/SUSPICIOUS)
<m-key> テーブル:薬品名の一般名と ADE情報 (TRIGGER-POSITIVE/NEGATIVE/SUSPICIOUS)
[MedTxt-RR Track] Case Identi
fi
cation (CI)
同一症例について記載された読影所見を同定
Example of [MedTxt-CR Track] ADE
7
8. スケジュール
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
2021年9月: データセット配布開始
2021年12月1日: タスク参加申込締切
2022年1月: 本テスト (Formal Run)
2022年2月1日: 評価結果の返送
2022年2月1日: タスク概要論文一部公開
2022年3月1日: タスク参加者論文(ドラフト) 提出締切
2022年5月1日: タスク参加者論文・タスク概要論文 提出最終締切
2022年6月14-17日: NTCIR-16 カンファレンス(NII, 東京)
8
※本タスクはパイロットタスクのため
予備テスト (Dry Run) は実施しません
9. タスク参加者募集中
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e
http://research.nii.ac.jp/ntcir/ntcir-16/
NTCIR-16 のホームページからお申し込みください
https://research.nii.ac.jp/ntcir/ntcir-16/howto-ja.html#intro
不明な点がございましたら下記アドレスまでご連絡ください
real-mednlp@is.naist.jp
9