SlideShare a Scribd company logo
1 of 37
Download to read offline
美野	
 秀弥 田中	
 英輝	
  
言語処理学会第17回年次大会発表論文集	
  
pp.744-­‐747,	
  2011	
  
	
  
プレゼンテーション:野口	
 真人	
  
1
p  動詞連用形名詞の平易化を行う理由	
  
p  動詞連用形名詞が難易度の高い(1,2級の)表現で
ある	
  
p  連用形名詞はニュースでもよく使用されている	
  
p  語彙の平易化において連用形名詞の平易化は効果
が大きい!	
  
p  どのような形に平易化?	
  
p  動詞連用形名詞は動詞から派生するという性質
上,用言(動詞)に平易化できることが多い	
  
p  連用形名詞を用言へと変換することに取り組む	
  
2
p 動詞の連用形が名詞へと派生した形態素	
  
p  読み・易い	
  
 	
 動詞連用形	
  形容詞	
  
p  読み・続ける	
  
 	
 動詞連用形	
   動詞	
  
p  深い・読み  	
  
 	
 連体修飾詞  名詞	
  
p  今回は,連体修飾詞を1つ持つ連用形名詞
を平易化の対象とした	
  
3
平易化対	
  
の獲得	
 
平易化対を	
  
用いた置換	
 
連体修飾句	
  
から	
  
連用修飾句	
  
への変換	
  
用言から	
  
体言への変換	
  
(扱わない)	
  
4	
 
p 例)「需要の見通し」を平易化	
  
(見通し(1級),予測する(2級))	
  
などの組み合わせを獲得	
  
「需要の予測する」	
  
「需要を予測する」	
  
「需要を予測すること」	
  
p 以下の3つの手法で平易化対を獲得する	
  
p  国語辞典を用いた手法	
  
p  シソーラスを用いた手法	
  
p  連用形名詞の特徴を用いた手法	
  
p 上2つの手法では獲得できる平易化対数が
少ないため,連用形名詞の特徴を用いた手
法も利用する	
  
5
p 論文「国語辞典を使った放送ニュースの
平易化」で報告した国語辞典を用いた手
法を利用	
 
6	
 
国語辞典	
  
からの抽出	
 
平易化対	
  
の獲得
p 国語辞典の語釈文から言い換え可能な平
易語を獲得する	
  
p その際,	
  冗長表現と不要表現を取り除く	
  
p  例)「救い」	
 
7	
 
見出し語:救い	
  
語釈文 :救うこと,	
  助けること              
          不要表現     不要表現	
  
候補  :「救う(2級)」,	
  「助ける(2級)」	
  
p 抽出した候補の中から平易化の関係にあ
る対を平易化対として獲得	
  
p 平易化対は(連用形名詞,	
  平易化した用
言)の形で獲得	
 
8	
 
連用形名詞:救い(1級)	
  
平易化用言:「救う(2級)」,	
  「助ける(2級)」	
  
平易化対 :(救い(1級),	
  救う(2級))	
  
      (救い(1級),	
  助ける(2級))	
  
p 単語間の上位下位関係が記述されたシ
ソーラスを用いて平易化対を獲得する	
  
p  例)「怒り(上位語)」と「激怒(下位語)」	
 
9	
 
感情	
 
怒り	
 
激怒	
 
喜び	
 
感情	
 
怒り	
 
激怒	
 
喜び
p 単語を分類し体系づけた辞書	
  
p  上位/下位関係	
  
p  部分/全体関係	
  
p  同義関係	
  
p  類義関係	
  
p 語彙の持つ意味から目的の単語に達する
ことができる	
  
p 代表的なものとして”WordNet”などがある	
 
10
日本語	
  
ワードネット	
  
からの抽出	
 
類似度を	
  
用いた手法	
 
平易化対	
  
の獲得	
 
11
p 日本語ワードネットから(上位語,	
  下位
語)の対を獲得する	
  
p  例)「備え」	
 
12	
 
下位語 :備え	
  
上位語 :準備,	
  仕込み,	
  用意,	
  警備	
  
平易化対:(備え,	
  準備),	
  (備え,	
  仕込み)	
  
     (備え,	
  用意),	
  (備え,	
  警備)	
  
p 国語辞典の語釈文間の類似度が高い対の
みを抽出する	
 
13	
 
見出し語:備え	
  
語釈文 :ある事態が起こった場合などに対する準備・用意	
  
見出し語:準備	
  
語釈文 :物事をする前に,	
  あらかじめ必要なものを用意すること	
  
見出し語:警備	
  
語釈文 :変事に備えて警戒し,	
  防備すること	
  
類似度高い	
 
類似度低い	
 
平易化対:(備え,	
  準備),	
  (備え,	
  仕込み)	
  
     (備え,	
  用意),	
  (備え,	
  警備)	
  
p 抽出した対の中で,	
  平易化の関係にある
対を抽出する	
 
14	
 
平易化対:(備え(級外),	
  準備(3級))	
  
     (備え(級外),	
  用意(3級))	
  
p 連用形名詞と,	
  その派生元である動詞を
平易化対として獲得する	
 
15	
 
(連用形名詞,	
  
	
  派生元の動詞)	
  
の対の獲得	
 
(動詞,	
  平易な動詞)	
  
の平易化対の獲得	
 
平易化対(連用形名詞,	
  
	
  平易化した用言)の獲
得
p 連用形名詞とその派生元の動詞を対とし
て獲得	
  
p  例)見込み	
 
16	
 
連用形名詞:見込み	
  
派生元動詞:見込む	
  
対    :(見込み,	
  見込む)	
  
p 「国語辞典を用いた手法」から,	
  派生元
の動詞の平易化対を獲得する	
 
17	
 
見出し語:見込む	
  
語釈文 :思う,	
  考える	
  
平易化対:(見込む,	
  思う),	
  (見込む,	
  考える)	
  
p 2つの対を組み合わせて(連用形名詞,	
  平
易化した用言)を平易化対として獲得する	
 
18	
 
P16の対	
 :(見込み,	
  見込む)	
  
P17の対	
 :(見込む,	
  思う),	
  (見込む,	
  考える)	
  
平易化対:(見込み(1級),	
  思う(3級))	
  
    	
 	
  (見込み(1級),	
  考える(3級))	
  
p  連用形名詞を用言へ変換したので,	
  連用形名
詞に修飾していた連体修飾句を連用修飾句に
変換しなければならない	
  
	
  
	
  
	
  
	
  
p  「の」は,「が」と「を」の両方に対応する	
  
p  用言に対して適切な助詞を選ぶ必要がある	
 
19	
 
連体修飾句	
 
需要の	
 
意義の	
 
連用形名詞	
 
落ち込み	
 
申し立て	
 
連体修飾句	
 
需要が	
 
意義を	
 
連用形名詞	
 
減る	
 
主張する
20	
 
手順Ⅰ:	
 
連体修飾句	
  
変換規則	
  
の適用	
 
手順Ⅱ:	
 
格フレーム	
  
との照合
p 連体修飾句が形容詞型か名詞型かを判定	
  
p  形容詞型の場合(形容詞型連体形)は,	
  形容詞
を連用形に変換	
  
p 例)「激しい当たり」→「激しく当たる」	
  
p  名詞型の場合(名詞+助詞相当句)は,	
  助詞相
当句置換規則を適用	
  
p 例)「社会とのかかわり」→「社会とかかわる」	
  
21
p  「としての/についての/にかけての/にあたって
の/に対しての/を通じての」	
  
p  後ろの「の」を省く	
  
p  例)「保障についての考え」→「保障について考える」	
  
p  「に対する」,「に関する」など助詞相当句に用
言相当語が含まれる場合	
  
p  助詞相当句中の用言相当語を連用形にする	
  
p  例)「健康に関する悩み」→「健康に関して悩む」	
  
p  助動詞「など」「だけ」などを伴う場合	
  
p  助動詞を省いてから助詞相当句置換規則を利用	
  
p  例)「議会などに対する働きかけ」	
  
   →「議会などに対して働きかける」	
  
22
p 「の」,「からの/への/での/との」,「に
よる」	
  
p  置換先の助詞相当句の候補が複数存在するた
め,	
  助詞相当句の決定には格フレームとの照
合が必要	
  
23
p 用言とそれが持ちうる格要素(名詞+助
詞)を記述したもの	
  
p 今回は格要素ごとに出現頻度が併記され
ている京大格フレームを利用	
  
	
  
24
25
26
 
	
 
27	
 
連用修飾句	
  
の変換候補	
  
の抽出	
 
格フレーム
対	
  
との照合
p 連用修飾句の変換候補を(名詞,助詞相当
句,用言)の形で抽出	
  
p  例)「復興への努め」(用言:努める)	
  
 →「への」の置換候補は「へ/に/を」なので	
  
  変換候補は以下の3つ	
  
p (復興,へ,努める)	
  
p (復興,に,努める)	
  
p (復興,を,努める)	
 
28
p 変換候補と格フレーム対との照合を行い,
照合できた対の中から頻度が最も多い対
を用いて連用修飾句を決定する	
  
p  例)格フレーム対(復興,に,努める,326)	
  
 「復興への努め」→「復興に努める」	
 
29
p 提案手法を2000年から2009年までのNHK
ニュース記事中の文節に適用	
  
p 平易化の対象は,	
  連用修飾句を1つ持つ連
用形名詞の難語(1,2級,	
  級外)とする	
  
p 連体修飾句の分類ごとに評価を行う	
  
p  評価Ⅰ:手順1のみで変換がおこなわれる場合	
  
p 20例ずつ無作為に抽出,	
  著者が評価	
  
p  評価Ⅱ:手順1に加えて,	
  手順2が必要な場合	
  
p 20例ずつ無作為に抽出,	
  著者を含めた3人の被験
者が評価	
  
30
p 「用言の評価」と「修飾句の評価」をそ
れぞれ以下の4段階で設定	
  
p 「修飾句の評価」は,	
  「用言の評価」が
0,1,2となった場合のみ行った	
  
  	
 
31
p Aは筆者,B,Cは筆者以外の被験者	
  
	
  
32
p 上部が評価Ⅰ,下部が評価Ⅱの結果である	
  
p 評価0,1,2を正解とする	
  
p 「用言の評価」について	
  
p  精度は評価Ⅰ,Ⅱ全体で76.4%	
  
p  「連用形名詞を用いた手法」を除いた場合の
精度は56.0%	
  
p 評価Ⅰの「修飾句の評価」について	
  
p  形容詞型,格フレームとの照合を必要としない
名詞型ともに精度は100%	
 
33
p 評価Ⅱの「修飾句の評価」について	
  
p  格フレームとの照合を必要とする名詞型の精
度は全体で69.6%	
  
p  助詞相当句別の精度は以下のようになる	
  
p Baselineは置換先の候補を無作為に選んだ場合の
頻度	
  
	
  
34
p  誤りとなった原因は,連用形名詞と平易化し
た用言との間の情報の欠落であった	
  
p  例)「住民の訴え」	
  
 →「住民が言う」と変換されてしまう	
  
p  解消のためには,	
  情報の欠落部分と平易化可
能性との関係性を明らかにする必要がある	
 
35	
 
見出し語:訴える	
  
語釈文 :不平や痛みなどを人に言うこと          
             冗長表現        不要表現	
  
p 正しい助詞相当句が付与されなかった場
合に誤りとなる	
  
p  例)「職員からの申し出」の変換候補	
  
p (職員,から,申し出る)	
  
p (職員,が,申し出る)←正解	
  
p (職員,に,申し出る)←格フレームに出現	
  
p 改善のためには格フレームの用例の増加
が必要	
  
p もしくは変換規則を加えればよい	
 
36
p 連体修飾句を連用修飾句へと変換する際,
連体修飾句変換規則の適用と格フレーム
との照合を組み合わせることが有効とわ
かった	
  
p 今回は変換後の接尾辞の付与や活用形の
修正について取り組まなかった	
  
p  文に埋め込むことを考えると体言への変換は
必須であり,今後の課題	
 
37

More Related Content

More from swenbe

Text simplification for reading assistance
Text simplification for reading assistanceText simplification for reading assistance
Text simplification for reading assistanceswenbe
 
論文紹介:語釈文を用いた小学生のための語彙平易化
論文紹介:語釈文を用いた小学生のための語彙平易化論文紹介:語釈文を用いた小学生のための語彙平易化
論文紹介:語釈文を用いた小学生のための語彙平易化swenbe
 
論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...
論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...
論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...swenbe
 
論文紹介:WWWからの大規模動詞含意知識の獲得
論文紹介:WWWからの大規模動詞含意知識の獲得論文紹介:WWWからの大規模動詞含意知識の獲得
論文紹介:WWWからの大規模動詞含意知識の獲得swenbe
 
論文紹介:Improve smt quality with automatically extracted paraphrase rules
論文紹介:Improve smt quality with automatically extracted paraphrase rules論文紹介:Improve smt quality with automatically extracted paraphrase rules
論文紹介:Improve smt quality with automatically extracted paraphrase rulesswenbe
 
Learning a lexical simplifier using wikipedia
Learning a lexical simplifier  using wikipediaLearning a lexical simplifier  using wikipedia
Learning a lexical simplifier using wikipediaswenbe
 
平易な表現への言い換えに必要なテキスト修正処理
平易な表現への言い換えに必要なテキスト修正処理平易な表現への言い換えに必要なテキスト修正処理
平易な表現への言い換えに必要なテキスト修正処理swenbe
 
言い換え認識技術の評価に適した言い換えコーパスの構築指針
言い換え認識技術の評価に適した言い換えコーパスの構築指針言い換え認識技術の評価に適した言い換えコーパスの構築指針
言い換え認識技術の評価に適した言い換えコーパスの構築指針swenbe
 

More from swenbe (8)

Text simplification for reading assistance
Text simplification for reading assistanceText simplification for reading assistance
Text simplification for reading assistance
 
論文紹介:語釈文を用いた小学生のための語彙平易化
論文紹介:語釈文を用いた小学生のための語彙平易化論文紹介:語釈文を用いた小学生のための語彙平易化
論文紹介:語釈文を用いた小学生のための語彙平易化
 
論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...
論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...
論文紹介 : Inducing lexical style properties for paraphrase and genre differentia...
 
論文紹介:WWWからの大規模動詞含意知識の獲得
論文紹介:WWWからの大規模動詞含意知識の獲得論文紹介:WWWからの大規模動詞含意知識の獲得
論文紹介:WWWからの大規模動詞含意知識の獲得
 
論文紹介:Improve smt quality with automatically extracted paraphrase rules
論文紹介:Improve smt quality with automatically extracted paraphrase rules論文紹介:Improve smt quality with automatically extracted paraphrase rules
論文紹介:Improve smt quality with automatically extracted paraphrase rules
 
Learning a lexical simplifier using wikipedia
Learning a lexical simplifier  using wikipediaLearning a lexical simplifier  using wikipedia
Learning a lexical simplifier using wikipedia
 
平易な表現への言い換えに必要なテキスト修正処理
平易な表現への言い換えに必要なテキスト修正処理平易な表現への言い換えに必要なテキスト修正処理
平易な表現への言い換えに必要なテキスト修正処理
 
言い換え認識技術の評価に適した言い換えコーパスの構築指針
言い換え認識技術の評価に適した言い換えコーパスの構築指針言い換え認識技術の評価に適した言い換えコーパスの構築指針
言い換え認識技術の評価に適した言い換えコーパスの構築指針
 

放送ニュースの動詞連用形名詞の平易化