SlideShare a Scribd company logo
1 of 13
Download to read offline
電気系 山本研究室
09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理
犬と散歩する → 犬と歩く
散歩すると歩くは換言可能な対である
このような換言可能な対を集めることで
・文章の平易化
・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言)
・国語辞書の語釈文
などを用いて換言処理を行なっている
→これらの換言が人間の感覚に沿った換言
となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい
→現状、人間の感覚に沿った換言を行うための
→言語資源は存在しない
→本研究では人間の感覚に沿って平易に
→換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出
・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞
・なるべく平易な表現に換言する
・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用
①”和える”を使った例文を考える
ごまと和える
②”和える”と置き換えて意味の通じる語を考えて換言
ごまと和える → ごまと混ぜる
③”和える”と”混ぜる”は換言可能として辞書に追加
和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない
・より平易な表現が思いつかない
→投げる、言う、話す など
・換言するときの必要語数が多い
→一進一退する など
・意味が明確に分からない
→笑み割れる、かがる など
品詞 換言対象語数 換言対作成数 無記入数
動詞 3,608語 3,206語 481語
サ変名詞 5,627語 4,494語 1,141語
形容詞 2,335語 1,851語 496語
副詞 1,243語 785語 463語
合計 12,813語 10,336語 2,585語
→およそ13,000語の単語を換言して
約10,000語の換言対を得られた
・無記入としたものについて
換言困難と判断したものがおおよそ3分の1
理解できない換言対象語がおおよそ3分の2となった
→無記入の妥当性や理解できないものへの対策
今回構築した辞書を用いて換言出来るようになった
→実際に換言を行った結果を考察し、
→辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言
複数文脈に使われる可能性のある語を換言する場合
それぞれについて換言を行う。
例:仰ぐの場合
空を仰ぐ → 空を見る
師匠を仰ぐ → 師匠を尊敬する
指示を仰ぐ → 指示を求める
この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言
換言する際に格関係を修正する必要がある場合がある
例:背く
上司に背く → 上司に裏切る →不適切
上司に背く → 上司を裏切る →適切
この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現
複数形態素の一部に換言する語が含まれている
例:入れる
ギターを手に入れる →入れる単体での換言は不可
→ギターを得るへの換言は可
この場合、手に入れるはまとめて得ると換言する

More Related Content

Similar to 用言等換言辞書の構築

Similar to 用言等換言辞書の構築 (6)

Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
 
はじめての生成文法 《後編》
はじめての生成文法 《後編》はじめての生成文法 《後編》
はじめての生成文法 《後編》
 
FSNLP Ch.3 Linguistic Essentials
FSNLP Ch.3 Linguistic EssentialsFSNLP Ch.3 Linguistic Essentials
FSNLP Ch.3 Linguistic Essentials
 

More from 長岡技術科学大学 自然言語処理研究室

More from 長岡技術科学大学 自然言語処理研究室 (20)

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 

用言等換言辞書の構築