SlideShare a Scribd company logo
Joint Extraction of
Events and Entities
within a Document Context
Bishan Yang, Tom Mitchell
Carnegie Mellon University の解説
亀田 尭宙
(京都大学
地域研究統合情報センター)
Event Extraction
“On Thursday, there was a massive U.S. aerial bombardment
in which more than 300 Tomahawk cruise missiles rained
down on Baghdad. Earlier Saturday, Baghdad was again
targeted. ...”
イベントとして
モデル化
“Joint” Extraction of Events and Entities
• イベント内の構造、イベント間の関連、
イベントに現れるエンティティの相関を考慮できる!
の確率
エンティティの
確信度 by CRFイベントの
ラベルペアの確率
この最大化問題をどうやって解くか
• 緩和したILP(Integer Linear Programming)の問題と捉えられる
• AD3というソルバー使いました
以上
https://github.com/bishanyang/EventEntityExtractor
に実装が公開されています。
3.1 Learning Within-event Structures
{33 from ACE
+ None}
{28 + None}
{9 + None}
詳しくは
https://www.ldc.upenn.edu/collaboratio
ns/past-projects/ace/annotation-tasks-
and-specifications
および、/model 以下のモデルデータ
例: entity_mention_model
…, B_FAC, B_GPE, B_LOC, B_ORG,
B_PER, B_TIME, B_VALUE, B_VEH,
B_WEA
(GPE = Geographical/Social/Political
Entities)
“On Thursday, there was
a massive U.S. aerial
bombardment in which
more than 300
Tomahawk cruise
missiles rained down on
3.1 Learning Within-event Structures
t a
r
0/1 を
出力する
Feature
function
Θの学習はL-BFGS で
• こっちは少し説明ある
• 実際のコードではCRFとして学習
3.2 Learning Event-Event Relations
• 式の形は同じ。特徴関数の重みづけ
• Trigger 単独の特徴は先ほどと同じ
• それに加え、同文内or共参照と見做されたTrigger同士について
• 係り受けの関係にあるか
• 主語か目的語を共有しているか
• 正則化したら(lemma)同じか
• FrameNet 上で同じ Semantics を与えられているか
を見てる
• 学習はまたL-BFGS
3.3 Entity Extraction
• CRF
• 語とそのPOSタグ
• 前後2語
• 大文字・小文字・数字などの文字種
• Wikipediaから生成した地名辞書にマッチするか
• 別途学習した word embeddings (Mikolov et al., 2013)
• これは3.1のTreeの推測の際のEntityの候補作成にも使われてい
る(See 4章)Triggerの候補生成も同様だが地名辞書だけ除い
た。
実験
• ACE2005 コーパス、Train/Dev/Testの切り方は先行研究に合
わせた
Entity と Trigger の
候補はそれぞれ
50個と10個生成し、
それぞれ正解の
92.3% と96.3% を
カバーしていた。
結果
• 上二つが既存研究。WithinEventが3.1、JointEventEntityが
Jointのやつ。有意に負けているのは無いが、だいたい勝ってい
てそのうち3つが有意という満足な結果。F値は全勝。
• それ以外の結果表もそこそこ満足なので割愛します。
エラー分析
1. “At least three members of a family ... were hacked to
death ...”,
WordNetとEmbeddingで補完してはいるけど、めずらし
い用法過ぎて学習できない。曖昧性解消も大事。
2. “She is being held on 50,000 dollars bail on a charge of first-
degree reckless homicide ...”,
長距離の係り受け。
3. 比喩、熟語、皮肉
まとめ
• イベント内の構造、イベント間の関連、
イベントに現れるエンティティの相関を考慮できる
• 個々はL-BFGS(for CRF)で、全体はAD3(for ILP)で。
• このタスクは未だに人手な部分が多い?
本資料は第8回最先端NLP勉強会の発表資料です。
国立情報学研究所公募型共同研究「地域研究における論文と史料からの知識抽出」
のサーベイとして行っています。引用画像は表題の論文のものです。
コード読むときの参考になりそうな情報
(以下 2016/7/20 commit abd49936872e3119326b251ff2f7ee4661237ad6 について)
• L-BFGS 単独で使ってるように書いていても実際は CRF とし
て訓練しているよう
• `event_extractor.cpp` がメインなのでそこから読めばいいが、
訓練手続きの一部は void train(Param param) の中でコメント
アウトされている。
• 例えばそこから辿ると
• Eの学習が TreeCRFModel.cpp の ` TreeCRFLearner::Train`
• Rの学習が SequenceModel.cpp の `CRFLearner::TrainEventSeq`
みたいにそれぞれがCRFとして訓練されていることが分かる

More Related Content

Viewers also liked

Harnessing Deep Neural Networks with Logic Rules
Harnessing Deep Neural Networks with Logic RulesHarnessing Deep Neural Networks with Logic Rules
Harnessing Deep Neural Networks with Logic Rules
Sho Takase
 
知能数理研究室へようこそ!
知能数理研究室へようこそ!知能数理研究室へようこそ!
知能数理研究室へようこそ!
Yagami Kenta
 
Medeleini Esitlus
Medeleini EsitlusMedeleini Esitlus
Medeleini Esitlusandresta
 
Location aware apps for learning
Location aware apps for learningLocation aware apps for learning
Location aware apps for learning
Mike Sharples
 
2007 Slc Presenation
2007 Slc Presenation2007 Slc Presenation
2007 Slc PresenationHeithaus
 
2010 Jan Online
2010 Jan Online2010 Jan Online
2010 Jan Onlinexuanloc
 
Is That A Computer In Your Wide
Is That A Computer In Your   WideIs That A Computer In Your   Wide
Is That A Computer In Your WideIan Hay
 
Alumni Presentation - Homecoming 2007
Alumni Presentation - Homecoming 2007Alumni Presentation - Homecoming 2007
Alumni Presentation - Homecoming 2007aepitaudelta
 
PRESENTATION ABOUT SYN - ABAF
PRESENTATION ABOUT SYN  - ABAFPRESENTATION ABOUT SYN  - ABAF
PRESENTATION ABOUT SYN - ABAF
bryceives
 
Tegurdamine
TegurdamineTegurdamine
Tegurdamineandresta
 
Mobile Phone To Computer
Mobile Phone To ComputerMobile Phone To Computer
Mobile Phone To ComputerIan Hay
 
Facultys fear openness - EduHub Days 2011
Facultys fear openness - EduHub Days 2011Facultys fear openness - EduHub Days 2011
Facultys fear openness - EduHub Days 2011
noetzli
 

Viewers also liked (14)

Harnessing Deep Neural Networks with Logic Rules
Harnessing Deep Neural Networks with Logic RulesHarnessing Deep Neural Networks with Logic Rules
Harnessing Deep Neural Networks with Logic Rules
 
知能数理研究室へようこそ!
知能数理研究室へようこそ!知能数理研究室へようこそ!
知能数理研究室へようこそ!
 
Medeleini Esitlus
Medeleini EsitlusMedeleini Esitlus
Medeleini Esitlus
 
Location aware apps for learning
Location aware apps for learningLocation aware apps for learning
Location aware apps for learning
 
2007 Slc Presenation
2007 Slc Presenation2007 Slc Presenation
2007 Slc Presenation
 
2010 Jan Online
2010 Jan Online2010 Jan Online
2010 Jan Online
 
Is That A Computer In Your Wide
Is That A Computer In Your   WideIs That A Computer In Your   Wide
Is That A Computer In Your Wide
 
Alumni Presentation - Homecoming 2007
Alumni Presentation - Homecoming 2007Alumni Presentation - Homecoming 2007
Alumni Presentation - Homecoming 2007
 
PRESENTATION ABOUT SYN - ABAF
PRESENTATION ABOUT SYN  - ABAFPRESENTATION ABOUT SYN  - ABAF
PRESENTATION ABOUT SYN - ABAF
 
Chem Rev3
Chem Rev3Chem Rev3
Chem Rev3
 
Tegurdamine
TegurdamineTegurdamine
Tegurdamine
 
Ph Yrev1
Ph Yrev1Ph Yrev1
Ph Yrev1
 
Mobile Phone To Computer
Mobile Phone To ComputerMobile Phone To Computer
Mobile Phone To Computer
 
Facultys fear openness - EduHub Days 2011
Facultys fear openness - EduHub Days 2011Facultys fear openness - EduHub Days 2011
Facultys fear openness - EduHub Days 2011
 

More from Akihiro Kameda

iPRES Day 3 instruction
iPRES Day 3 instructioniPRES Day 3 instruction
iPRES Day 3 instruction
Akihiro Kameda
 
Evaluating Visual Representations for Topic Understanding and Their Effect...
Evaluating Visual Representations for Topic Understanding and Their Effect...Evaluating Visual Representations for Topic Understanding and Their Effect...
Evaluating Visual Representations for Topic Understanding and Their Effect...
Akihiro Kameda
 
ISWC2016 1-slide-survey
ISWC2016 1-slide-surveyISWC2016 1-slide-survey
ISWC2016 1-slide-survey
Akihiro Kameda
 
いかにしてデータを手に入れるか
いかにしてデータを手に入れるかいかにしてデータを手に入れるか
いかにしてデータを手に入れるか
Akihiro Kameda
 
Iodd2015osaka kameda-slideshare
Iodd2015osaka kameda-slideshareIodd2015osaka kameda-slideshare
Iodd2015osaka kameda-slideshare
Akihiro Kameda
 
PATTY: A Taxonomy of Relational Patterns with Semantic Types
PATTY: A Taxonomy of Relational Patterns with Semantic TypesPATTY: A Taxonomy of Relational Patterns with Semantic Types
PATTY: A Taxonomy of Relational Patterns with Semantic Types
Akihiro Kameda
 
Reference Scope Identification in Citing Sentences
Reference Scope Identification in Citing SentencesReference Scope Identification in Citing Sentences
Reference Scope Identification in Citing Sentences
Akihiro Kameda
 

More from Akihiro Kameda (7)

iPRES Day 3 instruction
iPRES Day 3 instructioniPRES Day 3 instruction
iPRES Day 3 instruction
 
Evaluating Visual Representations for Topic Understanding and Their Effect...
Evaluating Visual Representations for Topic Understanding and Their Effect...Evaluating Visual Representations for Topic Understanding and Their Effect...
Evaluating Visual Representations for Topic Understanding and Their Effect...
 
ISWC2016 1-slide-survey
ISWC2016 1-slide-surveyISWC2016 1-slide-survey
ISWC2016 1-slide-survey
 
いかにしてデータを手に入れるか
いかにしてデータを手に入れるかいかにしてデータを手に入れるか
いかにしてデータを手に入れるか
 
Iodd2015osaka kameda-slideshare
Iodd2015osaka kameda-slideshareIodd2015osaka kameda-slideshare
Iodd2015osaka kameda-slideshare
 
PATTY: A Taxonomy of Relational Patterns with Semantic Types
PATTY: A Taxonomy of Relational Patterns with Semantic TypesPATTY: A Taxonomy of Relational Patterns with Semantic Types
PATTY: A Taxonomy of Relational Patterns with Semantic Types
 
Reference Scope Identification in Citing Sentences
Reference Scope Identification in Citing SentencesReference Scope Identification in Citing Sentences
Reference Scope Identification in Citing Sentences
 

"Joint Extraction of Events and Entities within a Document Context"の解説

Editor's Notes

  1. これ自体は枠組みとして新しくないけれど、これも効率的にできましたとして貢献(Contribution)の1つに含まれています。
  2. 3つ目は具体例がわからんが、4と同じで要は同義語かどうかを見たいんだ