SlideShare a Scribd company logo
1 of 26
Download to read offline
(c)長岡技術科学大学 電気系 1/26
用言等換言辞書を
人手で作りました
山本和英 吉倉孝太郎
長岡技術科学大学
(c)長岡技術科学大学 電気系 2/26
発表内容:
 1. 換言処理の話
 2. 作業内容
 3. 結果と今後
(c)長岡技術科学大学 電気系 3/26
 1. 換言処理の話
(c)長岡技術科学大学 電気系 4/26
研究の動機:
換言処理したいのに、
一般に利用可能な
汎用日本語換言辞書が
存在しない
(c)長岡技術科学大学 電気系 5/26
なぜ換言処理?
表現の多様性は
自然言語の特質である。
これを正面から扱わない限り、
自然言語処理は進展しない。
(c)長岡技術科学大学 電気系 6/26
表層表現
いわゆる意味表現
以後の
処理へ
理解
理想
(c)長岡技術科学大学 電気系 7/26
表層表現
いわゆる意味表現
理解
現実
(c)長岡技術科学大学 電気系 8/26
表層表現
いわゆる意味表現
理解
現実
これで
いいのか?
(c)長岡技術科学大学 電気系 9/26
表層表現
多様性を吸収した
言語表現
いわゆる意味表現
換言処理
理解
提案
(c)長岡技術科学大学 電気系 10/26
表層表現
多様性を吸収した
言語表現
いわゆる意味表現
換言処理
理解
提案
性能向上
するのでは?
(c)長岡技術科学大学 電気系 11/26
主張:換言処理は、
●
自然言語処理の性能向上に大いに
 寄与する。
● 表現平易化(やさしい日本語)や表
 現統一(産業日本語)などは社会で
 の需要が大きい。
よって、換言処理の進展がどうしても必
要だ。
(c)長岡技術科学大学 電気系 12/26
 2. 作業内容
(c)長岡技術科学大学 電気系 13/26
作業の概要
● サ変名詞、動詞、形容詞、副詞を対象
● JUMAN辞書項目が換言対象
– 合計約12,000語
● 1名が手作業で換言
● 短く置換できる語を思い出す
● 平易に換言する(難しく換言しない)
(c)長岡技術科学大学 電気系 14/26
言語資源を参照しない
作成時に国語辞典やシソーラスを一切見
ないで作業を行う。直感勝負。
● 作業効率の向上
● 既存の言語資源と同じ情報がほしいの
ではない
(c)長岡技術科学大学 電気系 15/26
無記入を許す
● 単語の意味が分からない
– 笑み割れる、かがる
● 換言できる語を思いつかない
– 投げる、言う、話す
● 換言可能でも長い説明を要する
– 一進一退する
以上のいずれかに該当する場合に無記入を許
す。
(c)長岡技術科学大学 電気系 16/26
多義語は文脈を付与する
● 空を仰ぐ  ⇒ 見る
● 師匠を仰ぐ ⇒ 尊敬する
● 指示を仰ぐ ⇒ 求める
多義語の場合は換言語と共に文脈(赤
字)を記述する。
(c)長岡技術科学大学 電気系 17/26
格変化は記述する
● 背く    ⇒ 裏切る
● 上司に背く ⇒ 上司を裏切る
換言によって格が変化する場合は、
格の変化も記述する。
(c)長岡技術科学大学 電気系 18/26
慣用的表現は
まとめて換言する
● 入れる   ⇒ ?
● 手に入れる ⇒ 得る
単語単位で換言できない(広い意味の)
慣用的表現はまとめて換言する。
(c)長岡技術科学大学 電気系 19/26
意味の重複可能性も
付記する
● 片付ける    ⇒ きれいにする
● 部屋を片付ける ⇒ 部屋をきれいにする
(c)長岡技術科学大学 電気系 20/26
意味の重複可能性も
付記する
● 片付ける    ⇒ きれいにする
● 部屋を片付ける ⇒ 部屋をきれいにする
● 部屋をきれいに片付ける
   ⇒ 部屋をきれいにきれいにする
意味が重複して表出する可能性がある
表現は括弧づけする。
(c)長岡技術科学大学 電気系 21/26
 3. 結果と今後
(c)長岡技術科学大学 電気系 22/26
作業結果
品詞 換言対象 換言作成 無記入
動詞 3,608語 3,206語 481語
サ変名詞 5,627語 4,494語 1,141語
形容詞 2,335語 1,851語 496語
副詞 1,243語 785語 463語
合計 12,813語 10,336語 2,585語
作業期間:5ヶ月程度
(c)長岡技術科学大学 電気系 23/26
辞書の分析
これからです。
● 国語辞典・シソーラスとの関係
● 日本語の基礎語彙との関係
(c)長岡技術科学大学 電気系 24/26
辞書の利用
これからです。
● 人に向けた換言
(表現の平易化、規格化など)
● 計算機に向けた換言
(自然言語処理の性能向上)
(c)長岡技術科学大学 電気系 25/26
名詞は換言しないのか?
● 名詞も換言辞書を作りたいが、用言等
ほど換言は簡単ではない。
● 検討中。
(c)長岡技術科学大学 電気系 26/26
発表まとめ
用言等換言辞書を
人手で作りました。

More Related Content

More from 長岡技術科学大学 自然言語処理研究室

More from 長岡技術科学大学 自然言語処理研究室 (20)

用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討
 
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
 

用言等換言辞書を人手で作りました