SlideShare a Scribd company logo
1 of 9
Download to read offline
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
NTCIR-16 Real-MedNLP
タスク紹介


2021/7/1版
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
https://sociocom.naist.jp/real-mednlp/
1
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Real-MedNLP
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
実際の医療文書(症例報告,読影所見)を用いた医療言語処理のシェアード・タスク
本タスクを通して,様々な医療サービスを支援する実用システムの開発に資すること
を目指す
主催:
荒牧 英治, Ph.D.(NAIST)
若宮 翔子, Ph.D.(NAIST)
矢田 竣太郎, Ph.D.(NAIST)
中村 優太, M.D.(東京大学医学部附属病院)
協力:


株式会社ワイズ・リーディング


NAIST ソーシャル・コンピューティング研究室 学生スタッフ一同
2
症例報告コーパス MedTxt−CR
MedTxt­CR sample
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
詳しくはこちら https://sociocom.naist.jp/medtxt/cr/
症例報告 (Case Report) は,個々の患者の診断・治療・その後の経過を観察した結果と考察
を詳しく報告した医学論文の一種
MedTxt-CRは,CiNii で公開されているオープンアクセスの日本語症例報告200文書にタグ
を付与したデータセット (Ja  ) とこれを英語に翻訳したデータセット (En  ) から構成
トレーニングセット:100文書,テストセット:100文書
タグ(MedTxt-RRと共通)
・病名・症状 <d>
・臓器・部位 <a>
・特徴・尺度 <f>
・変化 <c>
・時間表現 <TIMEX3>
・検査(検査名,検査項目,検査値) <t-test/key/val>
・薬品 (薬品名,薬品値)<m-key/val>
・処置 Remedy <r>
・クリニカルコンテキスト <cc>
・保留 <p>
3
読影所見コーパス MedTxt−RR
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
詳しくはこちら https://sociocom.naist.jp/medtxt/rr/
読影所見 (Radiology Report) は,放射線科医がCT画像から予想される所見(潜在的な疾患
を含む)を記載した臨床文書の一種
MedTxt-RRは,Radiopaedia
 
で無料公開されている15症例の肺がんCT画像について9名の


放射線科医が作成した日本語読影所見135文書にタグを付与したデータセット (Ja ) と


これを英語に翻訳したデータセット (En ) から構成
トレーニングセット:72文書,テストセット:63文書
タグ(MedTxt-CRと共通)
・病名・症状 <d>
・臓器・部位 <a>
・特徴・尺度 <f>
・変化 <c>
・時間表現 <TIMEX3>
・検査(検査名,検査項目,検査値)<t-test/key/val>
・薬品(薬品名,薬品値)<m-key/val>
・処置 Remedy <r>
・クリニカルコンテキスト <cc>
・保留 <p>
MedTxt­RR sample
4
タスク概要
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
症例報告コーパス


MedTxt-CR Track
読影所見コーパス


MedTxt-RR Track
サブタスク1: 100サンプルを用いたNER
Ja En Ja En
サブタスク2: ガイドラインラーニング
によるNER
Ja En Ja En
サブタスク3: 応用 (ADE* or CI**)
ADE-Ja ADE-En CI-Ja CI-En
少ないリソースでの


固有表現抽出


Few-resource Named
Entity Recognition (NER)
応用
Application
* Adverse Drug Event detection 薬物有害事象情報の検出
** Case Identification 同一症例についての所見の特定
Real-MedNLP タスクには,2種類のコーパスに基づくトラック(MedTxt-CR Track と
MedTxt-RR Track)があり,それぞれ3つのサブタスク(サブタスク1-3)から構成される
5
少ないリソースでの固有表現抽出 Few-resource Named Entity Recognition (NER)
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
医療言語処理においてデファクトスタンダードなサイズとなっている100∼200文書程度の
コーパスを用いた,医療言語処理の最も基本的な情報抽出であるNERに関するサブタスク
サブタスク1:100サンプルを用いたNER
100文書からなるトレーニングセットを用いたNER
標準的な少ないリソースでの教師付き学習に相当
サブタスク2:ガイドラインラーニングによるNER
アノテーションガイドラインにおける各タグについての


例文を用いたNER
アノテーションガイドラインから学ぶことが多い人間の


アノテーターのトレーニングを模擬
Note: 他の外部リソースを利用することも可能
頻度の高いタグセットについて評価
・病名・症状 <d>
・臓器・部位 <a>
・時間表現 <TIMEX3>
・検査(検査名,検査項目,検査値)


<t-test/key/val>
・薬品 (薬品名,薬品値)<m-key/val>
6
応用 Application
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
実用的な観点からコーパストラックごとに設計


された応用サブタスク
サブタスク3:応用
[MedTxt-CR Track]


Adverse Drug Event detection (ADE)
症例報告から薬物有害事象 (ADE) 情報を抽出


してテーブルを作成
<d> テーブル:病名・症状の一般名と ADE情報 (ADE-POSITIVE/NEGATIVE/SUSPICIOUS)
<m-key> テーブル:薬品名の一般名と ADE情報 (TRIGGER-POSITIVE/NEGATIVE/SUSPICIOUS)
[MedTxt-RR Track] Case Identi
fi
cation (CI)
同一症例について記載された読影所見を同定
Example of [MedTxt-CR Track] ADE
7
スケジュール
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
2021年9月: データセット配布開始
2021年12月1日: タスク参加申込締切
2022年1月: 本テスト (Formal Run)
2022年2月1日: 評価結果の返送
2022年2月1日: タスク概要論文一部公開
2022年3月1日: タスク参加者論文(ドラフト) 提出締切
2022年5月1日: タスク参加者論文・タスク概要論文 提出最終締切
2022年6月14-17日: NTCIR-16 カンファレンス(NII, 東京)
8
※本タスクはパイロットタスクのため


予備テスト (Dry Run) は実施しません
タスク参加者募集中
Real-MedNLP - REAL document-based MEDical Natural Language Processing -
Organization Sit
e

http://research.nii.ac.jp/ntcir/ntcir-16/
NTCIR-16 のホームページからお申し込みください
https://research.nii.ac.jp/ntcir/ntcir-16/howto-ja.html#intro
不明な点がございましたら下記アドレスまでご連絡ください
real-mednlp@is.naist.jp
9

More Related Content

What's hot

【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)Deep Learning JP
 
Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )cvpaper. challenge
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...joisino
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?Deep Learning JP
 
[DL輪読会]Attentive neural processes
[DL輪読会]Attentive neural processes[DL輪読会]Attentive neural processes
[DL輪読会]Attentive neural processesDeep Learning JP
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?Kazuyuki Miyazawa
 
[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networks[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networksDeep Learning JP
 
Generating Diverse High-Fidelity Images with VQ-VAE-2
Generating Diverse High-Fidelity Images with VQ-VAE-2Generating Diverse High-Fidelity Images with VQ-VAE-2
Generating Diverse High-Fidelity Images with VQ-VAE-2harmonylab
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
Crfと素性テンプレート
Crfと素性テンプレートCrfと素性テンプレート
Crfと素性テンプレートKei Uchiumi
 
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...Deep Learning JP
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised LearningまとめDeep Learning JP
 
データでみる機械学習と制御理論の類似点と相違点
データでみる機械学習と制御理論の類似点と相違点データでみる機械学習と制御理論の類似点と相違点
データでみる機械学習と制御理論の類似点と相違点Ichiro Maruta
 
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View SynthesisKento Doi
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...Deep Learning JP
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピTakahiro Kubo
 
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文cvpaper. challenge
 
Machine learning CI/CD with OSS
Machine learning CI/CD with OSSMachine learning CI/CD with OSS
Machine learning CI/CD with OSSyusuke shibui
 

What's hot (20)

【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)
 
Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
 
[DL輪読会]Attentive neural processes
[DL輪読会]Attentive neural processes[DL輪読会]Attentive neural processes
[DL輪読会]Attentive neural processes
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?
 
[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networks[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Relational inductive biases, deep learning, and graph networks
 
Generating Diverse High-Fidelity Images with VQ-VAE-2
Generating Diverse High-Fidelity Images with VQ-VAE-2Generating Diverse High-Fidelity Images with VQ-VAE-2
Generating Diverse High-Fidelity Images with VQ-VAE-2
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
Crfと素性テンプレート
Crfと素性テンプレートCrfと素性テンプレート
Crfと素性テンプレート
 
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
データでみる機械学習と制御理論の類似点と相違点
データでみる機械学習と制御理論の類似点と相違点データでみる機械学習と制御理論の類似点と相違点
データでみる機械学習と制御理論の類似点と相違点
 
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
 
BERT入門
BERT入門BERT入門
BERT入門
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
 
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
 
Machine learning CI/CD with OSS
Machine learning CI/CD with OSSMachine learning CI/CD with OSS
Machine learning CI/CD with OSS
 

Similar to NTCIR-16 Real-MedNLP タスク紹介(2021年7月1日版)

RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発Toshiaki Katayama
 
オープンサイエンス〜情報と公共図書館の接点
オープンサイエンス〜情報と公共図書館の接点オープンサイエンス〜情報と公共図書館の接点
オープンサイエンス〜情報と公共図書館の接点Ui Ikeuchi
 
日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)
日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)
日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)アガサ株式会社 (Agatha Inc.)
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状Takeru Nakazato
 
デザイン学会2106
デザイン学会2106デザイン学会2106
デザイン学会2106shujiisotani
 
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012Hiroyuki Mishima
 
植物の画像解析の実例
植物の画像解析の実例植物の画像解析の実例
植物の画像解析の実例LPIXEL
 
System engineers recruitment
System engineers recruitmentSystem engineers recruitment
System engineers recruitmentTechDoctor
 
RuleWatcher_intro_JP
RuleWatcher_intro_JPRuleWatcher_intro_JP
RuleWatcher_intro_JPMasato Oda
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)Yuya Unno
 
【産業技術総合研究所】平成21年慣用報告書2009
【産業技術総合研究所】平成21年慣用報告書2009【産業技術総合研究所】平成21年慣用報告書2009
【産業技術総合研究所】平成21年慣用報告書2009env11
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理Preferred Networks
 
シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳奨 山崎
 
企業向け社内「医療啓発」セミナー提案110220
企業向け社内「医療啓発」セミナー提案110220企業向け社内「医療啓発」セミナー提案110220
企業向け社内「医療啓発」セミナー提案110220Daisuke Hachimura
 
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料Yasuhisa Kondo
 
「健康寿命延伸都市・松本」の創造をめざして
「健康寿命延伸都市・松本」の創造をめざして「健康寿命延伸都市・松本」の創造をめざして
「健康寿命延伸都市・松本」の創造をめざしてplatinumhandbook
 
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -National Institute of Informatics
 
Hcopイノベーション
HcopイノベーションHcopイノベーション
HcopイノベーションYasuji Suda
 

Similar to NTCIR-16 Real-MedNLP タスク紹介(2021年7月1日版) (20)

RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発
 
オープンサイエンス〜情報と公共図書館の接点
オープンサイエンス〜情報と公共図書館の接点オープンサイエンス〜情報と公共図書館の接点
オープンサイエンス〜情報と公共図書館の接点
 
bigdata2012nlp okanohara
bigdata2012nlp okanoharabigdata2012nlp okanohara
bigdata2012nlp okanohara
 
日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)
日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)
日本臨床試験学会 第8回学術集会総会 アガサ共催セミナー「臨床研究をITで効率化する」(東京⼥⼦医科⼤学 生田聡子先生)
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
デザイン学会2106
デザイン学会2106デザイン学会2106
デザイン学会2106
 
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
 
植物の画像解析の実例
植物の画像解析の実例植物の画像解析の実例
植物の画像解析の実例
 
System engineers recruitment
System engineers recruitmentSystem engineers recruitment
System engineers recruitment
 
RuleWatcher_intro_JP
RuleWatcher_intro_JPRuleWatcher_intro_JP
RuleWatcher_intro_JP
 
Regenerative medicine20190718
Regenerative medicine20190718Regenerative medicine20190718
Regenerative medicine20190718
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
【産業技術総合研究所】平成21年慣用報告書2009
【産業技術総合研究所】平成21年慣用報告書2009【産業技術総合研究所】平成21年慣用報告書2009
【産業技術総合研究所】平成21年慣用報告書2009
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
 
シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳シリコンバレー比較20171030小柳
シリコンバレー比較20171030小柳
 
企業向け社内「医療啓発」セミナー提案110220
企業向け社内「医療啓発」セミナー提案110220企業向け社内「医療啓発」セミナー提案110220
企業向け社内「医療啓発」セミナー提案110220
 
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料
 
「健康寿命延伸都市・松本」の創造をめざして
「健康寿命延伸都市・松本」の創造をめざして「健康寿命延伸都市・松本」の創造をめざして
「健康寿命延伸都市・松本」の創造をめざして
 
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
 
Hcopイノベーション
HcopイノベーションHcopイノベーション
Hcopイノベーション
 

NTCIR-16 Real-MedNLP タスク紹介(2021年7月1日版)

  • 1. Real-MedNLP - REAL document-based MEDical Natural Language Processing - NTCIR-16 Real-MedNLP タスク紹介 
 2021/7/1版 Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ https://sociocom.naist.jp/real-mednlp/ 1
  • 2. Real-MedNLP - REAL document-based MEDical Natural Language Processing - Real-MedNLP Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 実際の医療文書(症例報告,読影所見)を用いた医療言語処理のシェアード・タスク 本タスクを通して,様々な医療サービスを支援する実用システムの開発に資すること を目指す 主催: 荒牧 英治, Ph.D.(NAIST) 若宮 翔子, Ph.D.(NAIST) 矢田 竣太郎, Ph.D.(NAIST) 中村 優太, M.D.(東京大学医学部附属病院) 協力: 
 株式会社ワイズ・リーディング 
 NAIST ソーシャル・コンピューティング研究室 学生スタッフ一同 2
  • 3. 症例報告コーパス MedTxt−CR MedTxt­CR sample Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 詳しくはこちら https://sociocom.naist.jp/medtxt/cr/ 症例報告 (Case Report) は,個々の患者の診断・治療・その後の経過を観察した結果と考察 を詳しく報告した医学論文の一種 MedTxt-CRは,CiNii で公開されているオープンアクセスの日本語症例報告200文書にタグ を付与したデータセット (Ja  ) とこれを英語に翻訳したデータセット (En  ) から構成 トレーニングセット:100文書,テストセット:100文書 タグ(MedTxt-RRと共通) ・病名・症状 <d> ・臓器・部位 <a> ・特徴・尺度 <f> ・変化 <c> ・時間表現 <TIMEX3> ・検査(検査名,検査項目,検査値) <t-test/key/val> ・薬品 (薬品名,薬品値)<m-key/val> ・処置 Remedy <r> ・クリニカルコンテキスト <cc> ・保留 <p> 3
  • 4. 読影所見コーパス MedTxt−RR Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 詳しくはこちら https://sociocom.naist.jp/medtxt/rr/ 読影所見 (Radiology Report) は,放射線科医がCT画像から予想される所見(潜在的な疾患 を含む)を記載した臨床文書の一種 MedTxt-RRは,Radiopaedia   で無料公開されている15症例の肺がんCT画像について9名の 
 放射線科医が作成した日本語読影所見135文書にタグを付与したデータセット (Ja ) と 
 これを英語に翻訳したデータセット (En ) から構成 トレーニングセット:72文書,テストセット:63文書 タグ(MedTxt-CRと共通) ・病名・症状 <d> ・臓器・部位 <a> ・特徴・尺度 <f> ・変化 <c> ・時間表現 <TIMEX3> ・検査(検査名,検査項目,検査値)<t-test/key/val> ・薬品(薬品名,薬品値)<m-key/val> ・処置 Remedy <r> ・クリニカルコンテキスト <cc> ・保留 <p> MedTxt­RR sample 4
  • 5. タスク概要 Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 症例報告コーパス 
 MedTxt-CR Track 読影所見コーパス 
 MedTxt-RR Track サブタスク1: 100サンプルを用いたNER Ja En Ja En サブタスク2: ガイドラインラーニング によるNER Ja En Ja En サブタスク3: 応用 (ADE* or CI**) ADE-Ja ADE-En CI-Ja CI-En 少ないリソースでの 
 固有表現抽出 
 Few-resource Named Entity Recognition (NER) 応用 Application * Adverse Drug Event detection 薬物有害事象情報の検出 ** Case Identification 同一症例についての所見の特定 Real-MedNLP タスクには,2種類のコーパスに基づくトラック(MedTxt-CR Track と MedTxt-RR Track)があり,それぞれ3つのサブタスク(サブタスク1-3)から構成される 5
  • 6. 少ないリソースでの固有表現抽出 Few-resource Named Entity Recognition (NER) Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 医療言語処理においてデファクトスタンダードなサイズとなっている100∼200文書程度の コーパスを用いた,医療言語処理の最も基本的な情報抽出であるNERに関するサブタスク サブタスク1:100サンプルを用いたNER 100文書からなるトレーニングセットを用いたNER 標準的な少ないリソースでの教師付き学習に相当 サブタスク2:ガイドラインラーニングによるNER アノテーションガイドラインにおける各タグについての 
 例文を用いたNER アノテーションガイドラインから学ぶことが多い人間の 
 アノテーターのトレーニングを模擬 Note: 他の外部リソースを利用することも可能 頻度の高いタグセットについて評価 ・病名・症状 <d> ・臓器・部位 <a> ・時間表現 <TIMEX3> ・検査(検査名,検査項目,検査値) 
 <t-test/key/val> ・薬品 (薬品名,薬品値)<m-key/val> 6
  • 7. 応用 Application Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 実用的な観点からコーパストラックごとに設計 
 された応用サブタスク サブタスク3:応用 [MedTxt-CR Track] 
 Adverse Drug Event detection (ADE) 症例報告から薬物有害事象 (ADE) 情報を抽出 
 してテーブルを作成 <d> テーブル:病名・症状の一般名と ADE情報 (ADE-POSITIVE/NEGATIVE/SUSPICIOUS) <m-key> テーブル:薬品名の一般名と ADE情報 (TRIGGER-POSITIVE/NEGATIVE/SUSPICIOUS) [MedTxt-RR Track] Case Identi fi cation (CI) 同一症例について記載された読影所見を同定 Example of [MedTxt-CR Track] ADE 7
  • 8. スケジュール Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ 2021年9月: データセット配布開始 2021年12月1日: タスク参加申込締切 2022年1月: 本テスト (Formal Run) 2022年2月1日: 評価結果の返送 2022年2月1日: タスク概要論文一部公開 2022年3月1日: タスク参加者論文(ドラフト) 提出締切 2022年5月1日: タスク参加者論文・タスク概要論文 提出最終締切 2022年6月14-17日: NTCIR-16 カンファレンス(NII, 東京) 8 ※本タスクはパイロットタスクのため 
 予備テスト (Dry Run) は実施しません
  • 9. タスク参加者募集中 Real-MedNLP - REAL document-based MEDical Natural Language Processing - Organization Sit e http://research.nii.ac.jp/ntcir/ntcir-16/ NTCIR-16 のホームページからお申し込みください https://research.nii.ac.jp/ntcir/ntcir-16/howto-ja.html#intro 不明な点がございましたら下記アドレスまでご連絡ください real-mednlp@is.naist.jp 9