SlideShare a Scribd company logo
1 of 14
Download to read offline
「やさしい日本語」のための
語彙制限の検討
長岡技術科学大学 電気系
杢 真奈見 山本 和英
1
研究背景 2
現在、日本には十分な日本語
能力を持たない外国人が数十万人い
る。これらの人々のために日本語をやさ
しくする「やさしい日本語」がある。
「やさしい日本語」
・・・文法、語彙に制限をかけて、日本語
をやさしくする。対象は留学生や外国人
労働者等の日本語能力の低い人々。
関連研究(制限言語) 3
制限言語で書かれた文書は非母語
話者にとってわかりやすい。よって
各々の母国語への翻訳を必要としな
くなる。
本研究では、語彙制限による
「やさしい日本語」を目指す。
日本語WordNetを用いた
語彙制限により文書をやさしくし、
外国人の方々が理解できる
語彙制限について検討する。
研究目的 4
5使用するコーパス
 「やさしい日本語」コーパス
・・・公的文書を「やさしい日本語」にしたコーパス
公的文書(市役所、学校、病院等で配布され
る文書)
逐語訳、意訳、要約(日本語教師が公的文
書を訳したもの)
 公的文書(このコーパスにおける原文)
・・・評価実験の置き換えに使用
 逐語訳 ・・・評価実験の比較対象として使用
制限方法 6
1. ChaSenによる分かち書き
2. 全内容語を日本語WordNetと照合
3. 日本語WordNetに記載されていた
場合、上位語への置き換え
※複合名詞・・・記載されていない場合は形態
素を削り、組み合わせて照合
※多義性・・・人手で最も近い語義の上位語を
選択
評価実験 7
「やさしい日本語」コーパスの公的文書
より無作為に15文を抽出して評価した。
➢評価者:日本語学習者7名
(日本語能力試験におけるN2所有者)
➢評価方法:3種類
① それぞれの意味がわかるか
② やさしいと感じる順位
③ 意味がわからない語彙かどうか
評価基準 8
原文
出力文
逐語訳
意味がわかる 意味がわからない
意味がわかる 変化なし やさしい
意味がわからない やさしくない やさしくない
 評価①それぞれの意味がわかるか
 評価②やさしいと感じる順位
原文に対する出力文・逐語訳の順位 評価
順位が上がる やさしい
順位が同じ 変化なし
順位が下がる やさしくない
評価例 9
分類 評価文 評価① 評価②
原文
本 人 確 認 済 み の [ 口 座 ] を
利用した送金や送金の受領を
除きます
× 3
出力文
個人判定済みのアカウントを
使い行った支払金額や支払金
額の取得を消去します
○ 1
逐語訳
本 人 確 認 済 み の 口 座 を
使った送金や送金のもらいは
問題ない
○ 2
※ [ ] は評価③意味がわからない語彙
評価①の結果 10
評価①それぞれの意味がわかるか
やさしい 変化なし やさしくない
出力文 17.1% 15.2% 67.6%
逐語訳 33.3% 22.9% 43.8%
評価者の半数以上が「意味がわかる」と判断
した文は、原文は40%、出力文は13.3%、
逐語訳は73.3%であった。
置き換えることによって33.3%の文が
「意味がわかる」と判断されるが、
個人差が大きい。
評価②の結果 11
やさしい 変化なし やさしくない
出力文 24.8% 46.7% 28.6%
逐語訳 51.4% 46.7% 1.9%
評価②やさしいと感じる順位
出力文は人手でつくられた
逐語訳より評価が低いものの、
置き換えの効果はあった。
考察 12 意味がわかるようになった語彙
サ変名詞・・・サ変名詞は数も多い。動詞は
和語に置き換える処理が必要となる。
例) 原文:扶養している
→ 出力文:補助している
逐語訳:育てている
原文と逐語訳が等しい
・・・公的文書で頻出する語彙
例) 原文・逐語訳:口座、出力文:アカウント
考察 13
 意味がわからなくなった語彙
複合名詞・・・上位語への置き換え時に、分か
ち書きを行い個々の単語として置き換えること
により意味が変化してしまう。
例) 原文:医療機関
→ 出力文:トリートメント施設
逐語訳:病院
結論 14
 内容語の上位語への置き換えは
公的文書、新聞記事共に有効であった。
 今後の語彙制限のための検討結果
 置き換える語彙・・・サ変名詞
 置き換えない語彙
・・・公的文書で頻出する語彙、
日常生活に頻出する語彙
 今後検討 ・・・複合名詞
 (上位語の領域についても検討予定)

More Related Content

Similar to 「やさしい日本語」のための語彙制限の検討

国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化Kodaira Tomonori
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言Tomoyuki Kajiwara
 
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English ProficiencyAsahiko Matsuda
 
自然言語処理概要
自然言語処理概要自然言語処理概要
自然言語処理概要ratchiratchi
 
Mel20140709 12key
Mel20140709 12keyMel20140709 12key
Mel20140709 12keyyouwatari
 
ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察N.K KooZN
 

Similar to 「やさしい日本語」のための語彙制限の検討 (6)

国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
 
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
 
自然言語処理概要
自然言語処理概要自然言語処理概要
自然言語処理概要
 
Mel20140709 12key
Mel20140709 12keyMel20140709 12key
Mel20140709 12key
 
ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察
 

More from 長岡技術科学大学 自然言語処理研究室

More from 長岡技術科学大学 自然言語処理研究室 (20)

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 

Recently uploaded

論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 

Recently uploaded (8)

論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 

「やさしい日本語」のための語彙制限の検討