SlideShare a Scribd company logo
1 of 14
Can Language Models be
Biomedical Knowledge Bases?
Mujeen Sung, Jinhyuk Lee, Sean S. Yi, Minji Jeon, Sungdong Kim, Jaewoo Kang
EMNLP 2021, @論文読み会, 紹介者: Yoshiaki Kitagawa
Summary
 Task
 Knowledge Base の Fact を Language
Model から抽出する
 具体的には Object 部分を穴埋め問題とし
て LM で predict する
 先行研究と比べてどこがすごいか?
 医療ドメインで KB を LM から抽出
 Prompt と Synonym Variance による分析
 技術や手法のキモ
 domain に合わせて、LM を変える
 BioBERT
 Bio- LM
 Knowledge Base の Fact を Language
Model から抽出タスクにおける分析
 Prompt Bias
 Synonym Variance
 どうやって有効だと検証したか?
 穴埋め問題で top k 個出したときその中に正解が含ま
れていたら正解とする Acc@k を図る
 Acc@1, Acc@5
 議論はあるか?
 既存手法の domain を変えたのみなので新規性は薄
め?
 次に読むべき論文
 Language Models as Knowledge Bases?
[Petroni et al., 2019]
Introduction
 LM から Knowledge を抽出する先行研究として LAMA がある
 本研究はBiomedical domain の BioLAMA を作成
Task
 Object 部分が隠された穴埋め問題
 Prompt は subject, object を含む fact を表すテンプレートのようなもののことを指す
Knowledge Sources
 CTD
 病気、化学物質、遺伝子などの生物医学的実体間の関係と相互作用に関する公開生物医
学 database(Davis et al.,2020)
 UMLS
 生物医学分野のさまざまな概念と語彙に関する情報を提供する大規模な database
(Bodenreider, 2004).
 Wikidata
 さまざまな domain にわたる fact を含む public KB
 -> 上記データから triple を抽出
Data Pre-processing
 entity の length が 10 subwords 以下の entity のみを対象とする
 これでも 90% カバーできる
 (医療ドメインだと長い名前の entity が多い?)
 object が subject の部分文字列になっているようなものを省く
 例: “iron deficiency”-“iron”
 Training:dev:test = 40:10:50
Evaluation Metric
 top-k Accuracy:(Acc@k)
 上位k個の object entity のいずれかがアノテーションされた object entity のリストに含
まれている場合は1、それ以外の場合は0
Language Model
 3つの LM
 BERT
 BioBERT
 Bio-LM
 BioBERT と Bio- LM は PubMedという医療ドメインのデータセットで pre-training
 Bio-LM は PubMed の vocabulary
 BioBERT は BERTで初期化
Experimental Result
 OptiPrompt: Zhong et al. (2021) による機械的に集めた prompt
 Manual prompt: 専門家による人手 prompt
Experimental Result
´ OptiPrompt: Zhong et al. (2021) による機械的に集めた prompt
´ Manual prompt: 専⾨家による⼈⼿ prompt
Examples of Bio-LM
Prompt bias
 Subject の変化にどれくらいセ
ンシティブかを測る
 1つの relation から 100 sample
とった時、top prediction
の”pain” が20回出てきた
ら、”pain“ は 20%
 一方で、Subject を Mask した
時に LM の distribution を確認
する
 上記2つ distribution のピアソ
ンの順位相関係数を出す
 これが低ければ prompt の bias
は低い
Synonym Variance
 Subject を同義語に置き換えた場合
でも同じ Object を出して欲しい
 10 個同義語を持ってきたときに
Acc@5 の標準偏差を測る
 低ければ変わらないということな
ので良い
Summary
 Task
 Knowledge Base の Fact を Language
Model から抽出する
 具体的には Object 部分を穴埋め問題とし
て LM で predict する
 先行研究と比べてどこがすごいか?
 医療ドメインで KB を LM から抽出
 Prompt と Synonym Variance による分析
 技術や手法のキモ
 domain に合わせて、LM を変える
 BioBERT
 Bio- LM
 Knowledge Base の Fact を Language
Model から抽出タスクにおける分析
 Prompt Bias
 Synonym Variance
 どうやって有効だと検証したか?
 穴埋め問題で top k 個出したときその中に正解が含ま
れていたら正解とする Acc@k を図る
 Acc@1, Acc@5
 議論はあるか?
 既存手法の domain を変えたのみなので新規性は薄
め?
 次に読むべき論文
 Language Models as Knowledge Bases?
[Petroni et al., 2019]

More Related Content

More from Ace12358

Dual tkb a-dual_learning_bridge_between_text_and_knowledge_base
Dual tkb  a-dual_learning_bridge_between_text_and_knowledge_baseDual tkb  a-dual_learning_bridge_between_text_and_knowledge_base
Dual tkb a-dual_learning_bridge_between_text_and_knowledge_baseAce12358
 
Knowledge_graph_alignment_with_entity-pair_embedding
Knowledge_graph_alignment_with_entity-pair_embeddingKnowledge_graph_alignment_with_entity-pair_embedding
Knowledge_graph_alignment_with_entity-pair_embeddingAce12358
 
Low-dimensional hyperbolic knowledge graph embeddings
Low-dimensional hyperbolic knowledge graph embeddingsLow-dimensional hyperbolic knowledge graph embeddings
Low-dimensional hyperbolic knowledge graph embeddingsAce12358
 
Neural relation extraction for knowledge base enrichment introduced by Yoshia...
Neural relation extraction for knowledge base enrichment introduced by Yoshia...Neural relation extraction for knowledge base enrichment introduced by Yoshia...
Neural relation extraction for knowledge base enrichment introduced by Yoshia...Ace12358
 
Emnl preading2016
Emnl preading2016Emnl preading2016
Emnl preading2016Ace12358
 
Chainer meetup lt
Chainer meetup ltChainer meetup lt
Chainer meetup ltAce12358
 
Emnlp2015 reading festival_lstm_cws
Emnlp2015 reading festival_lstm_cwsEmnlp2015 reading festival_lstm_cws
Emnlp2015 reading festival_lstm_cwsAce12358
 
Acl reading 2nd
Acl reading 2ndAcl reading 2nd
Acl reading 2ndAce12358
 
Naacl2015unsupervised morph
Naacl2015unsupervised morphNaacl2015unsupervised morph
Naacl2015unsupervised morphAce12358
 
DeepLearning論文紹介@Ace12358
DeepLearning論文紹介@Ace12358DeepLearning論文紹介@Ace12358
DeepLearning論文紹介@Ace12358Ace12358
 
DeepLearning3@Ace12358
DeepLearning3@Ace12358DeepLearning3@Ace12358
DeepLearning3@Ace12358Ace12358
 
EMNLPreading@Ace12358
EMNLPreading@Ace12358 EMNLPreading@Ace12358
EMNLPreading@Ace12358 Ace12358
 
ACLreading2014@Ace12358
ACLreading2014@Ace12358ACLreading2014@Ace12358
ACLreading2014@Ace12358Ace12358
 

More from Ace12358 (13)

Dual tkb a-dual_learning_bridge_between_text_and_knowledge_base
Dual tkb  a-dual_learning_bridge_between_text_and_knowledge_baseDual tkb  a-dual_learning_bridge_between_text_and_knowledge_base
Dual tkb a-dual_learning_bridge_between_text_and_knowledge_base
 
Knowledge_graph_alignment_with_entity-pair_embedding
Knowledge_graph_alignment_with_entity-pair_embeddingKnowledge_graph_alignment_with_entity-pair_embedding
Knowledge_graph_alignment_with_entity-pair_embedding
 
Low-dimensional hyperbolic knowledge graph embeddings
Low-dimensional hyperbolic knowledge graph embeddingsLow-dimensional hyperbolic knowledge graph embeddings
Low-dimensional hyperbolic knowledge graph embeddings
 
Neural relation extraction for knowledge base enrichment introduced by Yoshia...
Neural relation extraction for knowledge base enrichment introduced by Yoshia...Neural relation extraction for knowledge base enrichment introduced by Yoshia...
Neural relation extraction for knowledge base enrichment introduced by Yoshia...
 
Emnl preading2016
Emnl preading2016Emnl preading2016
Emnl preading2016
 
Chainer meetup lt
Chainer meetup ltChainer meetup lt
Chainer meetup lt
 
Emnlp2015 reading festival_lstm_cws
Emnlp2015 reading festival_lstm_cwsEmnlp2015 reading festival_lstm_cws
Emnlp2015 reading festival_lstm_cws
 
Acl reading 2nd
Acl reading 2ndAcl reading 2nd
Acl reading 2nd
 
Naacl2015unsupervised morph
Naacl2015unsupervised morphNaacl2015unsupervised morph
Naacl2015unsupervised morph
 
DeepLearning論文紹介@Ace12358
DeepLearning論文紹介@Ace12358DeepLearning論文紹介@Ace12358
DeepLearning論文紹介@Ace12358
 
DeepLearning3@Ace12358
DeepLearning3@Ace12358DeepLearning3@Ace12358
DeepLearning3@Ace12358
 
EMNLPreading@Ace12358
EMNLPreading@Ace12358 EMNLPreading@Ace12358
EMNLPreading@Ace12358
 
ACLreading2014@Ace12358
ACLreading2014@Ace12358ACLreading2014@Ace12358
ACLreading2014@Ace12358
 

Recently uploaded

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 

Recently uploaded (12)

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 

Can language models be biomedical knowledge bases

  • 1. Can Language Models be Biomedical Knowledge Bases? Mujeen Sung, Jinhyuk Lee, Sean S. Yi, Minji Jeon, Sungdong Kim, Jaewoo Kang EMNLP 2021, @論文読み会, 紹介者: Yoshiaki Kitagawa
  • 2. Summary  Task  Knowledge Base の Fact を Language Model から抽出する  具体的には Object 部分を穴埋め問題とし て LM で predict する  先行研究と比べてどこがすごいか?  医療ドメインで KB を LM から抽出  Prompt と Synonym Variance による分析  技術や手法のキモ  domain に合わせて、LM を変える  BioBERT  Bio- LM  Knowledge Base の Fact を Language Model から抽出タスクにおける分析  Prompt Bias  Synonym Variance  どうやって有効だと検証したか?  穴埋め問題で top k 個出したときその中に正解が含ま れていたら正解とする Acc@k を図る  Acc@1, Acc@5  議論はあるか?  既存手法の domain を変えたのみなので新規性は薄 め?  次に読むべき論文  Language Models as Knowledge Bases? [Petroni et al., 2019]
  • 3. Introduction  LM から Knowledge を抽出する先行研究として LAMA がある  本研究はBiomedical domain の BioLAMA を作成
  • 4. Task  Object 部分が隠された穴埋め問題  Prompt は subject, object を含む fact を表すテンプレートのようなもののことを指す
  • 5. Knowledge Sources  CTD  病気、化学物質、遺伝子などの生物医学的実体間の関係と相互作用に関する公開生物医 学 database(Davis et al.,2020)  UMLS  生物医学分野のさまざまな概念と語彙に関する情報を提供する大規模な database (Bodenreider, 2004).  Wikidata  さまざまな domain にわたる fact を含む public KB  -> 上記データから triple を抽出
  • 6. Data Pre-processing  entity の length が 10 subwords 以下の entity のみを対象とする  これでも 90% カバーできる  (医療ドメインだと長い名前の entity が多い?)  object が subject の部分文字列になっているようなものを省く  例: “iron deficiency”-“iron”  Training:dev:test = 40:10:50
  • 7. Evaluation Metric  top-k Accuracy:(Acc@k)  上位k個の object entity のいずれかがアノテーションされた object entity のリストに含 まれている場合は1、それ以外の場合は0
  • 8. Language Model  3つの LM  BERT  BioBERT  Bio-LM  BioBERT と Bio- LM は PubMedという医療ドメインのデータセットで pre-training  Bio-LM は PubMed の vocabulary  BioBERT は BERTで初期化
  • 9. Experimental Result  OptiPrompt: Zhong et al. (2021) による機械的に集めた prompt  Manual prompt: 専門家による人手 prompt Experimental Result ´ OptiPrompt: Zhong et al. (2021) による機械的に集めた prompt ´ Manual prompt: 専⾨家による⼈⼿ prompt
  • 11. Prompt bias  Subject の変化にどれくらいセ ンシティブかを測る  1つの relation から 100 sample とった時、top prediction の”pain” が20回出てきた ら、”pain“ は 20%  一方で、Subject を Mask した 時に LM の distribution を確認 する  上記2つ distribution のピアソ ンの順位相関係数を出す  これが低ければ prompt の bias は低い
  • 12. Synonym Variance  Subject を同義語に置き換えた場合 でも同じ Object を出して欲しい  10 個同義語を持ってきたときに Acc@5 の標準偏差を測る  低ければ変わらないということな ので良い
  • 13.
  • 14. Summary  Task  Knowledge Base の Fact を Language Model から抽出する  具体的には Object 部分を穴埋め問題とし て LM で predict する  先行研究と比べてどこがすごいか?  医療ドメインで KB を LM から抽出  Prompt と Synonym Variance による分析  技術や手法のキモ  domain に合わせて、LM を変える  BioBERT  Bio- LM  Knowledge Base の Fact を Language Model から抽出タスクにおける分析  Prompt Bias  Synonym Variance  どうやって有効だと検証したか?  穴埋め問題で top k 個出したときその中に正解が含ま れていたら正解とする Acc@k を図る  Acc@1, Acc@5  議論はあるか?  既存手法の domain を変えたのみなので新規性は薄 め?  次に読むべき論文  Language Models as Knowledge Bases? [Petroni et al., 2019]