More Related Content
More from sekizawayuuki (20)
読解支援@2015 05-22
- 1. 松吉俊,
佐藤理史.
文体と難易度を制御可能な
日本語機能表現の言い換え.
自然言語処理,
15(2),
pp.75-‐99,
2008.
プレゼンテーション 関沢祐樹
2015/05/22
1
- 3. はじめに(1)
• 機能表現・・・機能語と複合辞
– 機能語:助詞、助動詞、接続詞、形式名詞
– 複合辞:2語以上で、1つの機能語のように働く
– ほぼ全ての文、文節に含まれる→言い換えは重要
• 難易度・・・言い換え後の機能表現の
理解しやすさ
– 知らない機能表現は文の意味の理解の妨げ
– 必要以上にやさしく言い換えると、
意味的に曖昧になる可能性がある
– 読者にふさわしい難易度の表現に言い換えたい
2015/05/22
3
- 4. はじめに(2)
• 機能表現・・・多くの形態的異形を持つ
– 例、 「なければならない」
– 常体: 「なくてはならない」
– 敬体: 「なければなりません」
– 口語体: 「なけりゃならない」
– 堅い文体:「ねばならん」
– 言い換え先の文体を制御したい
• 形態階層構造、意味階層構造を持つ機能表現
辞書を用い、文体と難易度を制御しつつ、
日本語機能表現を言い換える手法を提案
2015/05/22
4
- 5. 形態階層構造
• 機能表現の異形を階層構造を用いて分類
– 全9層から成り立つ
– 下位階層ほど、細かい条件で表現を区別
• 下位階層ほど表現数が多い
– 階層構造における位置を表すIDが付与
• 上位階層の機能表現がわかる
– 文体、左接続、右接続、難易度などの情報つき
• 難易度は、日本語能力試験出題基準の級に基づく
2015/05/22
5
- 6. 意味階層構造
• 機能表現の少ない意味的等価クラスを
その上位の意味を示す意味的等価クラスの
下位クラスと再定義
– 言い換えのパターンの増加
– 3層からなる意味階層構造を作成
• 下位階層ほど、多くのクラスが存在
• 1つの意味的等価クラスに様々な難易度の機能
表現が存在する
– やさしい例:「とどうじに」、「たとたんに」
– 難しい例
:「やいなや」、「がはやいか」
2015/05/22
6
- 7. 指定を満たすすべての出現形の列挙
• 等価な機能表現の列挙
1. 形態階層構造で与えられた上位の機能表現の探索
2. 意味階層構造でその機能表現を含む意味的
等価クラスを見つけ、属する機能表現の集合を得る
3. 集合から、難易度指定を満たさない機能表現を排除
4. 形態階層構造に基づき、集合内の各機能表現に対して、
そのすべての異形を列挙
5. 得られた出現形のリストから、文体指定を満たさない
出現形を排除
2015/05/22
7
- 8. 機能表現の言い換え手法
• 入力表現の単位 ・・・ 文節
– 機能表現を含む最も基本的文構成
– 機能表現を言い換えて、代替表現を生成
• 予備調査 : 人間による機能表現の言い換え
– 以下の条件で、日本語教育の知識がある1人が調査
1. 機能語を言い換え(内容語は言い換えない)
2. 自由に言い換え(やさしく、短くといった制約なし)
3. 1つの文節に複数の代替表現がある場合、全て記述
* 代替表現がない場合、書き換えなくても良い
2015/05/22
8
- 10. 言い換えシステムのモジュール
1. 文節解析:文節を内容語と機能表現に分割
– 機能語部解析器:MeCab
• 17,000の機能表現の出現形のみを保持
– 機能語部抽出器:MeCab(IPA辞書を組み込み)
2. 言い換え生成:代替表現のリストを生成
– 文体指定と難易度指定をもとに生成
3. 順位付け
– 代替表現のリストをコーパス中の頻度に基づく
スコアで順位付け
2015/05/22
10
- 15. 議論2
• 1→1と少数語の挿入のみでは代替表現不可
– 1→n、n→1、n→mが必要
• 入力文節の解析誤り
– 例.ひらがなさえ
→
ひら
/
がな
/
さえ
– 人手での解析で、適切な代替表現を上位に出力可
– 文節解析モジュールの改善とともに減少するだろう
2015/05/22
15