"Joint Extraction of Events and Entities within a Document Context"の解説

Joint Extraction of
Events and Entities
within a Document Context
Bishan Yang, Tom Mitchell
Carnegie Mellon University の解説
亀田尭宙
（京都大学
地域研究統合情報センター）

Event Extraction
“On Thursday, there was a massive U.S. aerial bombardment
in which more than 300 Tomahawk cruise missiles rained
down on Baghdad. Earlier Saturday, Baghdad was again
targeted. ...”
イベントとして
モデル化

“Joint” Extraction of Events and Entities
• イベント内の構造、イベント間の関連、
イベントに現れるエンティティの相関を考慮できる！
の確率
エンティティの
確信度 by CRFイベントの
ラベルペアの確率

この最大化問題をどうやって解くか
• 緩和したILP(Integer Linear Programming)の問題と捉えられる
• AD3というソルバー使いました
以上
https://github.com/bishanyang/EventEntityExtractor
に実装が公開されています。

3.1 Learning Within-event Structures
{33 from ACE
+ None}
{28 + None}
{9 + None}
詳しくは
https://www.ldc.upenn.edu/collaboratio
ns/past-projects/ace/annotation-tasks-
and-specifications
および、/model 以下のモデルデータ
例: entity_mention_model
…, B_FAC, B_GPE, B_LOC, B_ORG,
B_PER, B_TIME, B_VALUE, B_VEH,
B_WEA
（GPE = Geographical/Social/Political
Entities）
“On Thursday, there was
a massive U.S. aerial
bombardment in which
more than 300
Tomahawk cruise
missiles rained down on

3.1 Learning Within-event Structures
t a
r

0/1 を
出力する
Feature
function

Θの学習はL-BFGS で
• こっちは少し説明ある
• 実際のコードではCRFとして学習

3.2 Learning Event-Event Relations
• 式の形は同じ。特徴関数の重みづけ
• Trigger 単独の特徴は先ほどと同じ
• それに加え、同文内or共参照と見做されたTrigger同士について
• 係り受けの関係にあるか
• 主語か目的語を共有しているか
• 正則化したら（lemma）同じか
• FrameNet 上で同じ Semantics を与えられているか
を見てる
• 学習はまたL-BFGS

3.3 Entity Extraction
• CRF
• 語とそのPOSタグ
• 前後２語
• 大文字・小文字・数字などの文字種
• Wikipediaから生成した地名辞書にマッチするか
• 別途学習した word embeddings (Mikolov et al., 2013)
• これは3.1のTreeの推測の際のEntityの候補作成にも使われてい
る（See 4章）Triggerの候補生成も同様だが地名辞書だけ除い
た。

実験
• ACE2005 コーパス、Train/Dev/Testの切り方は先行研究に合
わせた
Entity と Trigger の
候補はそれぞれ
50個と10個生成し、
それぞれ正解の
92.3% と96.3% を
カバーしていた。

結果
• 上二つが既存研究。WithinEventが3.1、JointEventEntityが
Jointのやつ。有意に負けているのは無いが、だいたい勝ってい
てそのうち３つが有意という満足な結果。F値は全勝。
• それ以外の結果表もそこそこ満足なので割愛します。

エラー分析
1. “At least three members of a family ... were hacked to
death ...”,
WordNetとEmbeddingで補完してはいるけど、めずらし
い用法過ぎて学習できない。曖昧性解消も大事。
2. “She is being held on 50,000 dollars bail on a charge of first-
degree reckless homicide ...”,
長距離の係り受け。
3. 比喩、熟語、皮肉

まとめ
• イベント内の構造、イベント間の関連、
イベントに現れるエンティティの相関を考慮できる
• 個々はL-BFGS(for CRF)で、全体はAD3(for ILP)で。
• このタスクは未だに人手な部分が多い？
本資料は第8回最先端NLP勉強会の発表資料です。
国立情報学研究所公募型共同研究「地域研究における論文と史料からの知識抽出」
のサーベイとして行っています。引用画像は表題の論文のものです。

コード読むときの参考になりそうな情報
（以下 2016/7/20 commit abd49936872e3119326b251ff2f7ee4661237ad6 について）
• L-BFGS 単独で使ってるように書いていても実際は CRF とし
て訓練しているよう
• `event_extractor.cpp` がメインなのでそこから読めばいいが、
訓練手続きの一部は void train(Param param) の中でコメント
アウトされている。
• 例えばそこから辿ると
• Eの学習が TreeCRFModel.cpp の ` TreeCRFLearner::Train`
• Rの学習が SequenceModel.cpp の `CRFLearner::TrainEventSeq`
みたいにそれぞれがCRFとして訓練されていることが分かる

"Joint Extraction of Events and Entities within a Document Context"の解説

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (14)

More from Akihiro Kameda

More from Akihiro Kameda (7)

"Joint Extraction of Events and Entities within a Document Context"の解説

Editor's Notes