SlideShare a Scribd company logo
1 of 12
Efficient chemical-disease
identification and
relationship extraction
using Wikipedia to improve
recall
総合科学技術研究科 情報学専攻1年
中野裕介
2019/12/10 1
論文概要
タイトル
Efficient chemical-disease identification and
relationship extraction using Wikipedia to
improve recall
著者
Daniel M. Lowe, Noel M. O’Boyle, Roger A.
Sayle
掲載誌
Database, Volume 2016, 2016, baw039
2019/12/10 2
論文概要
テキストマイニングによって、病気の症例に
関する文書から原因化学物質とそれが誘発す
る疾患の関係(CIDs)を特定する研究。
Wikipedia等を利用した辞書ベースの手法
によって、高精度での分析を可能とした。
2019/12/10 3
問題背景
化学物質と病気の関係を特定することには、
医療研究において多数の用途がある。
生医学文献からこれらをテキストマイニン
グで抽出する手法についてはワークショッ
プなどが行われている。
2019/12/10 4
問題背景
BioCreative V CDR
テキストからのCID抽出精度を評価する
ワークショップ。
MEDLINE(医薬文献検索)記事をベースとし
た1500セットのコーパスを提供。
化学物質や病気、その因果関係が事前に設
定されている
2019/12/10 5
アプローチ(LeadMine)
コーパスからCIDとMeshIDを抽出する
精度を評価する
※MeshID…医療情報シソーラスの参照用ID
1. LeadMine/品詞解析で化学物質と病気を 抽
出する。
2. パターンマッチングによって化学物質と
病気の文書内での関係を推定
3. 上記で取得した情報をCIDとして出力
4. 精度評価
2019/12/10 6
LeadMine
LeadMine
生化学用語のためのテキストマイニング手法
辞書ベースで同音異義語などを解釈し、特定用
語への注釈付けを行う。
2019/12/10 7
学習のために3つのソースを用いる
LeadMineのための辞書の作成
化学物質及び病名とMeshIDのペアを作成する。
Wikipediaの病名ページ(MeshID含)のタイトル及
びリダイレクトを全て収集
2019/12/10 8
Meshから直接用語を
収集する。
疾病オントロジーから
同義語を収集
用語抽出精度評価
2019/12/10 9
提案したアプローチを全て組み合わせる
ことで、MeSH IDの取得で最大のF値を取得
パターンマッチング
2019/12/10 10
文章に基づくパターンを用意
病気の原因となる~,病気と関係する~,
などの語を関連として取得
評価
2019/12/10 11
MeSH ID取得精度
下2つはパターンマッチング
のオプション
CID取得率において以下の値となった。
他の同じ目的の手法と比較してDNERは
高精度であった(文のみの説明)
感想
Wikipediaを扱ったテキストマイニングの
研究を探した。
リダイレクトの利用については
参考になった。
2019/12/10 12

More Related Content

More from ymmt3-lab

研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」ymmt3-lab
 
Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218ymmt3-lab
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murataymmt3-lab
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ymmt3-lab
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031ymmt3-lab
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習ymmt3-lab
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 itoymmt3-lab
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 naganoymmt3-lab
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murataymmt3-lab
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)ymmt3-lab
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchiymmt3-lab
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」ymmt3-lab
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」ymmt3-lab
 
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」ymmt3-lab
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」ymmt3-lab
 
Bookreading7
Bookreading7Bookreading7
Bookreading7ymmt3-lab
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章ymmt3-lab
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章ymmt3-lab
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章ymmt3-lab
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4ymmt3-lab
 

More from ymmt3-lab (20)

研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」
 
Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murata
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 ito
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 nagano
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murata
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchi
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
 
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
 
Bookreading7
Bookreading7Bookreading7
Bookreading7
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4
 

Journal_club_1120