SlideShare a Scribd company logo
1 of 18
Download to read offline
EMNLP読み会2014 
Combining Distant and Partial Supervision for 
Relation Extraction (Angeli et al.) 
※このスライド中の図はこの論文及びプレゼンスライド中のものです 
Komachi Lab 
12/03 
B4 宮崎亮輔
Komachi Lab 
Relation Extraction 
2 
これ 
入力: [Barack Obama] was born in [Hawaii] 
出力: Born in 
Relation Extraction用語! 
entity: 対象とする名詞! 
mention: 名詞がマークされた入力! 
pair: entityのペア
Komachi Lab 
Agenda 
✤ Distant Supervision! 
✤ MIML-RE! 
✤ Active Learning! 
✤ Experiments! 
✤ Conclusion 
3
Komachi Lab 
Distant Supervision 
4
Komachi Lab 
Distant Supervision 
✤ 知識ベースに大量に関係のタプルを持っている(e1, y, e2)! 
- (Obama, Born in, Hawaii), (Obama, Live in , Hawaii), …! 
✤ e1, e2を含むmentionの関係はyだとしてトレーニングする! 
- Obama was born in Hawaii → Born in ! 
- Obama was born in Hawaii → Live in! 
- Obama is living in Hawaii → Born in! 
- Obama is living in Hawaii → Live in! 
✤ 間違いも含むけど、関係を表すリッチな素性ができる! 
✤ 教師データを作るコストがない、大量のデータを使える 
5
Komachi Lab 
MIML-RE 
6
Multi-Instance Multi-Label Learning for Relation Extraction 
✤ 同じpairが複数の関係ラベルを指す問題を 
解決するためのモデル! 
✤ entityのpairは真には1つのラベルしか持たないという 
仮定(実際にはmention毎に違う)! 
✤ x:同じpairをもつmention! 
✤ yは2値分類、zは多値分類 
Komachi Lab 
7
Komachi Lab 
Active Learning 
8
Komachi Lab 
Active Learning 
✤ アノテーションをするときに、クリティカルに 
効きそうな事例を選んでアノテーションできると嬉しい! 
✤ 基本的には最も曖昧なデータを選びたい 
9
Komachi Lab 
Query-By-Committee 
✤ 複数分類器の多数決で票が割れた分類器の入力を選ぶ! 
✤ 分類器の予測分布それぞれと 
それらを平均した分布とのJSダイバージェンスが 
一番大きい分類器! 
➡ 平均的な分類器の出力分布と一番似ていない分類器の 
入力を選ぶ 
10
Komachi Lab 
Sampling 
✤ ほんとに一番似ていないものを選ぶ?! 
✤ 3つで比較! 
- 一様分布でサンプリング! 
- 一番遠い! 
- 遠いところからサンプリング(提案手法)! 
✤ 一番遠いものを選ぶのは一番右の分類器を選ぶ! 
✤ 平均に近い分類器はたくさんある! 
✤ 一様分布だと簡単なものを選びやすい 
一番遠いのだとレアなケースを選ぶ(一般的な表現を学習できない) 
遠いところからサンプリングすると、難しくてかつ表現力のある(レアじゃない)ものを選べる 
11 
←平均に近い 
平均から遠い分布 
↓ 
分類器の分布
Komachi Lab 
Learning 
✤ どこで使うか! 
✤ EMで学習してる, 7 iteration! 
✤ E-stepでzを推測するときActive Learningの結果を入れる! 
✤ 式のp(z|xi 
(m), wz)の設定によってアノテーターの 
曖昧な部分を確率的な解釈として残すことができる 
けど、今回は教師がiのときに1になる確率分布になってる! 
✤ zi’が前のiterationでの推測値! 
✤ z,yどっちの分類器も教師ありで事前トレーニングもする 
12 
ここ→ 
wz 
wy
Komachi Lab 
Experiments 
13
Komachi Lab 
Experiments 
✤ KBP (Knowledge Base Population) のslot fillingタスク! 
✤ 2010~2012をdev, 2013をtest! 
✤ 知識ベースはWikipediaのdump(2013 July)! 
✤ 325891 positive pair! 
✤ 158091 negative pair (意図的に入れたり)! 
✤ 1208524mention 
14
Komachi Lab 
Results 
15
Komachi Lab 
Results 
✤ Active Learning有り・なしと比べて 
16
Komachi Lab 
Results 
✤ 複数のActive Learningの比較 
17
Komachi Lab 
Conclusion 
✤ MIML-REのdistant supervisionのモデルに 
Active Learningの方法を取り入れて精度を上げた! 
✤ Active Learningでの事例の選び方は重要! 
✤ MIML-REの初期化(プレトレーニング)に敏感! 
✤ アノテーション付きのデータを作った 
18

More Related Content

More from marujirou

Deep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared MemoryDeep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared Memorymarujirou
 
怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えて怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えてmarujirou
 
Cross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAECross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAEmarujirou
 
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...marujirou
 
2015 08 survey
2015 08 survey2015 08 survey
2015 08 surveymarujirou
 
Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...
Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...
Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...marujirou
 
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)marujirou
 
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)marujirou
 
DL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシンDL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシンmarujirou
 

More from marujirou (9)

Deep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared MemoryDeep Multi-Task Learning with Shared Memory
Deep Multi-Task Learning with Shared Memory
 
怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えて怖くない誤差逆伝播法 Chainerを添えて
怖くない誤差逆伝播法 Chainerを添えて
 
Cross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAECross-Lingual Sentiment Analysis using modified BRAE
Cross-Lingual Sentiment Analysis using modified BRAE
 
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
Learning Tag Embeddings and Tag-specific Composition Functions in Recursive N...
 
2015 08 survey
2015 08 survey2015 08 survey
2015 08 survey
 
Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...
Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...
Representation Learning Using Multi-Task Deep Neural Networks
for Semantic Cl...
 
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
Semantic Compositionality through Recursive Matrix-Vector Spaces (Socher et al.)
 
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
Relation Classification via Convolutional Deep Neural Network (Zeng et al.)
 
DL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシンDL勉強会 01ディープボルツマンマシン
DL勉強会 01ディープボルツマンマシン
 

Recently uploaded

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 

Recently uploaded (9)

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 

Combining Distant and Partial Supervision for Relation Extraction (Angeli et al.)

  • 1. EMNLP読み会2014 Combining Distant and Partial Supervision for Relation Extraction (Angeli et al.) ※このスライド中の図はこの論文及びプレゼンスライド中のものです Komachi Lab 12/03 B4 宮崎亮輔
  • 2. Komachi Lab Relation Extraction 2 これ 入力: [Barack Obama] was born in [Hawaii] 出力: Born in Relation Extraction用語! entity: 対象とする名詞! mention: 名詞がマークされた入力! pair: entityのペア
  • 3. Komachi Lab Agenda ✤ Distant Supervision! ✤ MIML-RE! ✤ Active Learning! ✤ Experiments! ✤ Conclusion 3
  • 4. Komachi Lab Distant Supervision 4
  • 5. Komachi Lab Distant Supervision ✤ 知識ベースに大量に関係のタプルを持っている(e1, y, e2)! - (Obama, Born in, Hawaii), (Obama, Live in , Hawaii), …! ✤ e1, e2を含むmentionの関係はyだとしてトレーニングする! - Obama was born in Hawaii → Born in ! - Obama was born in Hawaii → Live in! - Obama is living in Hawaii → Born in! - Obama is living in Hawaii → Live in! ✤ 間違いも含むけど、関係を表すリッチな素性ができる! ✤ 教師データを作るコストがない、大量のデータを使える 5
  • 7. Multi-Instance Multi-Label Learning for Relation Extraction ✤ 同じpairが複数の関係ラベルを指す問題を 解決するためのモデル! ✤ entityのpairは真には1つのラベルしか持たないという 仮定(実際にはmention毎に違う)! ✤ x:同じpairをもつmention! ✤ yは2値分類、zは多値分類 Komachi Lab 7
  • 8. Komachi Lab Active Learning 8
  • 9. Komachi Lab Active Learning ✤ アノテーションをするときに、クリティカルに 効きそうな事例を選んでアノテーションできると嬉しい! ✤ 基本的には最も曖昧なデータを選びたい 9
  • 10. Komachi Lab Query-By-Committee ✤ 複数分類器の多数決で票が割れた分類器の入力を選ぶ! ✤ 分類器の予測分布それぞれと それらを平均した分布とのJSダイバージェンスが 一番大きい分類器! ➡ 平均的な分類器の出力分布と一番似ていない分類器の 入力を選ぶ 10
  • 11. Komachi Lab Sampling ✤ ほんとに一番似ていないものを選ぶ?! ✤ 3つで比較! - 一様分布でサンプリング! - 一番遠い! - 遠いところからサンプリング(提案手法)! ✤ 一番遠いものを選ぶのは一番右の分類器を選ぶ! ✤ 平均に近い分類器はたくさんある! ✤ 一様分布だと簡単なものを選びやすい 一番遠いのだとレアなケースを選ぶ(一般的な表現を学習できない) 遠いところからサンプリングすると、難しくてかつ表現力のある(レアじゃない)ものを選べる 11 ←平均に近い 平均から遠い分布 ↓ 分類器の分布
  • 12. Komachi Lab Learning ✤ どこで使うか! ✤ EMで学習してる, 7 iteration! ✤ E-stepでzを推測するときActive Learningの結果を入れる! ✤ 式のp(z|xi (m), wz)の設定によってアノテーターの 曖昧な部分を確率的な解釈として残すことができる けど、今回は教師がiのときに1になる確率分布になってる! ✤ zi’が前のiterationでの推測値! ✤ z,yどっちの分類器も教師ありで事前トレーニングもする 12 ここ→ wz wy
  • 14. Komachi Lab Experiments ✤ KBP (Knowledge Base Population) のslot fillingタスク! ✤ 2010~2012をdev, 2013をtest! ✤ 知識ベースはWikipediaのdump(2013 July)! ✤ 325891 positive pair! ✤ 158091 negative pair (意図的に入れたり)! ✤ 1208524mention 14
  • 16. Komachi Lab Results ✤ Active Learning有り・なしと比べて 16
  • 17. Komachi Lab Results ✤ 複数のActive Learningの比較 17
  • 18. Komachi Lab Conclusion ✤ MIML-REのdistant supervisionのモデルに Active Learningの方法を取り入れて精度を上げた! ✤ Active Learningでの事例の選び方は重要! ✤ MIML-REの初期化(プレトレーニング)に敏感! ✤ アノテーション付きのデータを作った 18