SlideShare a Scribd company logo
1 of 17
Identifying Cascading Errors
using Constraints in
Dependency Parsing
Dominick Ng and James R.
Curran
ACL 2015
紹介者: 馬緤美穂 (東工大)
目的
• 構文解析の誤りにおける重要度を分析
– どれだけcascading errorが発生するか
2
gold standard
parsing result (MSTparser)
名詞句中の誤り :
この部分だけ
root特定の誤り :
他の部分にも大きな影響
関連研究:エラー分析 on 構文解析
3
• Kummerfeld et al. (2012)
– 構文解析エラーの内訳を複数のパーザ間で
比較
– 単独のエラーの割合
– 本研究:エラーの割合+他のエラーへの影響
• 誤りやすいlabelの分類を参照している
Kummerfeld et al. (2012) より
• 各エラー(label)クラスについて「その
クラスだけは正解データを出力する」と
制約を加える
4
手法
parsing result
NP attachmentの正解が
与えられた上での解析結果
・制約による直接変化
・↑の変化による間接的変化
graph-based (MSTParser)
or
transition-based (ZPar)
NP
attachment
NP
internal
PP
attachment
ROOT
attachment
parser
NP
attachment
エラークラスの定義
• 係り受けlabel単位で設定 (8 classes +
other)
– NP attachment…NPへの修飾
– NP internal…NPの内部における修飾
– PP attachment…前置詞句への修飾
the cat on the dog
pobj(on, dog) … NP attachment
det(dog, the) … NP internal
5
pet the cat with a hand
prep(pet, with)
6
エラークラスの定義
• 係り受けlabel単位で設定 (8 classes +
other)
NP attachment
appos, dobj, iobj,
nsubj, nsubjpass,
pobj, and xsubj.
NP internal
abbrev, det, nn,
number, poss,
possessive, and
predet.
PP attachment
prepを含む
係り受け
clause
attachment
advcl, ccomp,
csubj, csubjpass,
purpcl, rcmod,
and xcomp.
…
パーザへの実装
• MSTParser…2次のEinser法
– 対象のクラスについての制約に違反しないも
ののみ、完全な部分木を作成してよい
• ZPar…arc-eager + beam search
– 対象のクラスについての制約に違反した弧は
作成できない
7
pet a cat with a hand pet a cat with a hand
[pet a cat] [with a hand][pet] [with a hand]
a cat
評価
• WSJで構文解析
• 9(8+other)の制約について
– 1つも制約を適用しない
– 1つずつ制約を適用した
– 全ての制約を適用した
– 場合の精度を調べる
• 制約さえ入れれば既存の
• システムで評価可能
8
(その他)
(全部)
結果
9
各制約によるエラー数(eff)
/ labelごとのエラー率 (eff%)
制約によって動いた他の単語
の平均数 (disp)
UASの上昇幅 (ΔUAS)の内、
制約によって直接改善 (Δc)
cascading errorの改善
(Δu)
(ZPar)
カバレッジ(何%の文を解析
できたか、ZPar基準)
6.1 パーザの比較 (全体)
• ΔUAS: ZPar > MSTParserの傾向
– 特にclause, punctuation, NP attachment
– カバレッジの小さい (解析できない文が多い)
labelに多い
• ZParは制約なしだと解析できない文を大きく間違
える
• 制約ごとのUASランキングは類似
– 両者の振る舞いは一致している
10
6.2 NP
• NP attachment … eff%(エラー率)は高
くないもののΔUASが最大
– コーパス中でNP attachmentが与える影響は
大きい
– NP internalの影響は小さい
• ZParの方がeff(エラー数)の割にΔuが高い
– ZParはエラーを含む状態をbeam(解析候補)
から除去するからではないか
11
12
6.3 Coordination, Modifiers, and PPs
• PPs & coordination … labelのエラー自体は
多いが単独でのエラーが多く、Δuは小さい
– 係り先の選択肢がある程度小さい部分木の中に
しかない
– 実際、制約による係り受けの変化数(disp)も少ない
• modifiers (形容詞・副詞) … 比較的できて
いるようだが数が多いのでエラー源となる
• MSTParserの方がZParよりエラー率(eff%)
が高いが、Δuは大差なし
– MSTParserの余計なエラーはself-contained?
– 難しいタスクではある (eff%がMSTParserでは
1位、ZParでも2位)
13
6.4 Clause attachment
(MSTParser)
(ZPar)
• ほとんどない(1つ/文)が、影響を受ける数
(disp)が多い
– ほとんどないのでΔUASは大きくない
14
6.5 Root attachment
• 句読点への係り受けは評価には入らないこ
とが多いが…
– 修正によって多くの語が変化 (disp)
– また、cascading errorも多く修正される (Δu)
– 評価対象でないとしても影響は大きい
15
6.6 punctuation error
結論
• 構文解析中のエラーが引き起こす
cascading errorを分析
– 手法:パーザに制約を加え、対象のlabelのみ
を正解させた場合の精度を見る
– 結果:単独のエラーだけではなく、エラーに
よる他の要素への影響も考慮した分析が可能に
– NP attachmentやpunctuationの影響を示す
• 今後の展望
– 他の解析器や交差ありの構文解析への適用
16
感想
• 興味深く思えた点
– cascading errorという指標
– NP attachmentのcascading errorの大きさから構文解
析に与える影響が大きいことを示す
– PP attachment(よく問題にはなる)の他に与える影響は
大きくないと示す
• これらを客観的な数字で示している
• 引っかかった点
– cascading error自体は興味深いが、ZPar (transition-
based) に有利そうな条件(ZParが解析できなかった文は
分母に入らない)であることが少し気になった
• 解析器自体の比較は一番大きな目的ではないためおそらく問題で
はないけど、数字を見る時には気をつけた方がいい
17

More Related Content

Recently uploaded

Recently uploaded (9)

LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
 
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
 
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdfネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
 
情報を表現するときのポイント
情報を表現するときのポイント情報を表現するときのポイント
情報を表現するときのポイント
 
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
 
部内勉強会(IT用語ざっくり学習) 実施日:2024年5月17日(金) 対象者:営業部社員
部内勉強会(IT用語ざっくり学習) 実施日:2024年5月17日(金) 対象者:営業部社員部内勉強会(IT用語ざっくり学習) 実施日:2024年5月17日(金) 対象者:営業部社員
部内勉強会(IT用語ざっくり学習) 実施日:2024年5月17日(金) 対象者:営業部社員
 
Keywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltdKeywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltd
 
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
 

Featured

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 

Identifying Cascading Errors using Constraints in Dependency Parsing ( 2015ACL読み会@すずかけ台 )

Editor's Notes

  1. OntoNote いくつか紹介するにとどめておく rcmod: relative clause modifier “I saw the man you love” rcmod(man, love)
  2. MSTParser…coverageには影響を与えない ZPar…beam中の全ての候補が制約によって却下されると解析に失敗する
  3. ここから、全体を比較した
  4. 注釈がない限りZParの数字を出しながら説明していきます ここに毎回図を載っけておく!!!!!
  5. 修飾
  6. 何が起こっているのか書いて欲しかった
  7. MSTParser…coverageには影響を与えない ZPar…beam中の全ての候補が制約によって却下されると解析に失敗する
  8. MSTParser…coverageには影響を与えない ZPar…beam中の全ての候補が制約によって却下されると解析に失敗する
  9. ここでもいいたいけど、「あくまで後処理」であって、「他の処理に影響を与えずにそのエラーを直した」ことにする
  10. いくつか紹介するにとどめておく rcmod: relative clause modifier “I saw the man you love” rcmod(man, love)
  11. いくつか紹介するにとどめておく rcmod: relative clause modifier “I saw the man you love” rcmod(man, love)
  12. ※ 全ての弧は探索しているため、カバレッジへの影響はない
  13. NP attachment…headの決定に関わるため、NPの内部の構造にも関わる NP internal … internalな構造ではheadが決まるため、NP attavhmentにも関わる