1. Lexical Inference over Multi-Word
Predicates: A Distributional Approach
Omri Abend, Shay B. Cohen, Mark Steedman
ACL 2014
読む人:高瀬翔
知識獲得研究会2015/2/4
1
2. 目的:複合述語の意味解析
• 複合述語:複数の単語からなる述語[Alsina+ 97]
– 複合語の一種
– 様々な言語現象を含む
• 軽動詞(make a decision)
• 句動詞(lead to)
• 慣用句(kick the bucket)
• Goal:(複合)述語間の含意関係認識
– prevent → reduce the incidence of
– increase the cost of → affect the price of
2
5. 手法の概要
• 含意関係認識を行う際にどの語彙的要素で判断すれば
良いか学習
– devour と eat greedily
• devour と eat の類似性から含意と判定
– lead to と cause
• lead to と cause の類似性から含意と判定
– 教師あり学習
• 語彙的要素対の素性に重み付けして含意/非含意を推定
• 語彙的要素:複合述語を構成する内容語の組み合わせ
– 前置詞も内容語とする
– have a large number of:have, large, have large, …
– 計算時間削減のため,大きさは最大2単語
5
6. モデル
6
L(w | D) =
1
M
logP(y(i)
| p(i)
,w)
i=1
M
å -
l
2
|| w ||2
目的関数
訓練データサイズ
正解(含意/非含意)
値は(1 or -1)
述語対
e.g., prevent と reduce the incidence of
重みベクトル
=
1
M
log exp(wT
F(p(i)
, y(i)
,h))
hÎH(i)
å - logZ(w,i)
æ
è
ç
ö
ø
÷
i=1
M
å
-
l
2
|| w ||2
語彙的要素対の集合
e.g., (prevent, reduce), (prevent, reduce incidence), …
各語彙的要素対の素性
7. モデル
7
L(w | D) =
1
M
logP(y(i)
| p(i)
,w)
i=1
M
å -
l
2
|| w ||2
目的関数
訓練データサイズ
正解(含意/非含意)
述語対
e.g., prevent と reduce the incidence of
重みベクトル
=
1
M
log exp(wT
F(p(i)
, y(i)
,h))
hÎH(i)
å - logZ(w,i)
æ
è
ç
ö
ø
÷
i=1
M
å
-
l
2
|| w ||2
語彙的要素対の集合
e.g., (prevent, reduce), (prevent, reduce incidence), …
各語彙的要素対の素性
述語間の語彙的要素の全組み合わせについ
て
素性を抽出,含意関係の判定
9. 語彙的要素対の分布類似度
• 語彙的要素対の含意関係の判定のため
– lead to → cause
– 語彙的要素の左側に出現する単語の分布類似度,右側に出現す
る単語の分布類似度の積を用いる
• 類似度は2つ
– コサイン類似度
– BInc(含意関係の判定)[Szpektor+ 08]
• コサイン類似度に項の被覆率を掛けあわせた値
• 語彙的要素のhead(最左の単語)だけも測定
– lead to, cause の場合
• lead to と cause の類似度
• lead と cause の類似度
• 各語彙的要素対に合計 4 種の素性
9
左側の類似度 右側の類似度