Identifying Cascading Errors using Constraints in Dependency Parsing ( 2015ACL読み会@すずかけ台 )3. 関連研究:エラー分析 on 構文解析
3
• Kummerfeld et al. (2012)
– 構文解析エラーの内訳を複数のパーザ間で
比較
– 単独のエラーの割合
– 本研究:エラーの割合+他のエラーへの影響
• 誤りやすいlabelの分類を参照している
Kummerfeld et al. (2012) より
5. エラークラスの定義
• 係り受けlabel単位で設定 (8 classes +
other)
– NP attachment…NPへの修飾
– NP internal…NPの内部における修飾
– PP attachment…前置詞句への修飾
the cat on the dog
pobj(on, dog) … NP attachment
det(dog, the) … NP internal
5
pet the cat with a hand
prep(pet, with)
6. 6
エラークラスの定義
• 係り受けlabel単位で設定 (8 classes +
other)
NP attachment
appos, dobj, iobj,
nsubj, nsubjpass,
pobj, and xsubj.
NP internal
abbrev, det, nn,
number, poss,
possessive, and
predet.
PP attachment
prepを含む
係り受け
clause
attachment
advcl, ccomp,
csubj, csubjpass,
purpcl, rcmod,
and xcomp.
…
10. 6.1 パーザの比較 (全体)
• ΔUAS: ZPar > MSTParserの傾向
– 特にclause, punctuation, NP attachment
– カバレッジの小さい (解析できない文が多い)
labelに多い
• ZParは制約なしだと解析できない文を大きく間違
える
• 制約ごとのUASランキングは類似
– 両者の振る舞いは一致している
10
11. 6.2 NP
• NP attachment … eff%(エラー率)は高
くないもののΔUASが最大
– コーパス中でNP attachmentが与える影響は
大きい
– NP internalの影響は小さい
• ZParの方がeff(エラー数)の割にΔuが高い
– ZParはエラーを含む状態をbeam(解析候補)
から除去するからではないか
11
12. 12
6.3 Coordination, Modifiers, and PPs
• PPs & coordination … labelのエラー自体は
多いが単独でのエラーが多く、Δuは小さい
– 係り先の選択肢がある程度小さい部分木の中に
しかない
– 実際、制約による係り受けの変化数(disp)も少ない
• modifiers (形容詞・副詞) … 比較的できて
いるようだが数が多いのでエラー源となる
17. 感想
• 興味深く思えた点
– cascading errorという指標
– NP attachmentのcascading errorの大きさから構文解
析に与える影響が大きいことを示す
– PP attachment(よく問題にはなる)の他に与える影響は
大きくないと示す
• これらを客観的な数字で示している
• 引っかかった点
– cascading error自体は興味深いが、ZPar (transition-
based) に有利そうな条件(ZParが解析できなかった文は
分母に入らない)であることが少し気になった
• 解析器自体の比較は一番大きな目的ではないためおそらく問題で
はないけど、数字を見る時には気をつけた方がいい
17
Editor's Notes OntoNote
いくつか紹介するにとどめておく
rcmod: relative clause modifier
“I saw the man you love” rcmod(man, love) MSTParser…coverageには影響を与えない
ZPar…beam中の全ての候補が制約によって却下されると解析に失敗する ここから、全体を比較した 注釈がない限りZParの数字を出しながら説明していきます
ここに毎回図を載っけておく!!!!! 修飾 何が起こっているのか書いて欲しかった MSTParser…coverageには影響を与えない
ZPar…beam中の全ての候補が制約によって却下されると解析に失敗する MSTParser…coverageには影響を与えない
ZPar…beam中の全ての候補が制約によって却下されると解析に失敗する ここでもいいたいけど、「あくまで後処理」であって、「他の処理に影響を与えずにそのエラーを直した」ことにする いくつか紹介するにとどめておく
rcmod: relative clause modifier
“I saw the man you love” rcmod(man, love) いくつか紹介するにとどめておく
rcmod: relative clause modifier
“I saw the man you love” rcmod(man, love) ※ 全ての弧は探索しているため、カバレッジへの影響はない NP attachment…headの決定に関わるため、NPの内部の構造にも関わる
NP internal … internalな構造ではheadが決まるため、NP attavhmentにも関わる