読解支援 5 261. Sentence Simplification as Tree Transduction
Dan Feblowitz David Kauchak
In Proceedings of the 51st Annual Meeting of the Association for
Computational Linguistics. pp1537-‐‑‒1546, 2013
Presentation
:
塩⽥田健⼈人
3. * テキスト平易易化とは
* ⽂文の意味を変えずに語数を減らし、複雑な⽂文法を取り除く
* どういったことに使われるか
* ⼦子ども、外国⼈人、障碍者などの⾔言語学習
* 専⾨門的な領領域 (例例 医療療関係など)
* その他の⾃自然⾔言語処理理の前処理理など
テキスト平易易化について
4. * STSGとは…
* Synchronous Tree Substitution Grammar
* ⽊木構造から⽊木構造への変換を表す⽂文法
→難解な⽂文法をもつ構⽂文⽊木を平易易な⽂文法をもつ構⽂文⽊木へ
提案⼿手法について
5. STSG*1
(S
(NP
(DT
That))
PRN
VP
.
))
↓
(b)となる
この基本⽊木で置き換えると…
↓
(c)となる
↓
同様にルールにより繰り返し
11. * 3つの簡易易化システムを作成し、⽐比較した
* ⽂文の解析にBerkeley Parser
* 単語アライメントにGiza++
テスト
System BLEU Oracle Length Ratio
Simple TT
Moses-‐‑‒Diff
Moses-‐‑‒Del
T3
0.564
0.543
0.605
0.244
0.663
-‐‑‒
0.642
-‐‑‒
0.849
0.960
0.991
0.581
K&M
augm-‐‑‒K&M
0.406
0.498
0.602
0.609
0.676
0.826
Corpus mean -‐‑‒ -‐‑‒ 0.85
14. ※トランスダクティブとは
* ラベルや関数値などの教師情報が付随したラベルありデータとそれらが
ないラベルなしデータが与えられる状況を考える。
* ここで、与えられていない未知データについてラベルを予測する必要は
なく、与えられたラベルなしデータのラベルだけ予測すればよいとする。
すなわち、半教師あり学習で、新規のデータのラベルを予想しない場合
である。
* このとき、通常の教師あり学習のように、任意のデータのラベルを予測
する関数を求めて、ラベルなしデータを代⼊入してラベルを求めるアプ
ローチも可能。しかし、ラベルを予測すればよいデータ点は⾮非常に限定
されているのに任意の点のラベルを予測する関数を求めるのは過剰に困
難な問題を解いているといえる。よって学習時にラベルなしデータの情
報を使うと予測精度度を向上させることができるらしい。
トランスダクティブ