Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
長岡技術科学大学 自然言語処理研究室
PDF, PPTX
1,752 views
「やさしい日本語」変換システムの試作
杢真奈見, 山本 和英. 「やさしい日本語」変換システムの試作. 言語処理学会第19回年次大会, pp.678-681 (2013.3)
Technology
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 32
2
/ 32
3
/ 32
4
/ 32
5
/ 32
6
/ 32
7
/ 32
8
/ 32
9
/ 32
10
/ 32
11
/ 32
12
/ 32
13
/ 32
14
/ 32
15
/ 32
16
/ 32
17
/ 32
18
/ 32
19
/ 32
20
/ 32
21
/ 32
22
/ 32
23
/ 32
24
/ 32
25
/ 32
26
/ 32
27
/ 32
28
/ 32
29
/ 32
30
/ 32
31
/ 32
32
/ 32
More Related Content
PDF
「やさしい日本語」変換システムの試作
by
長岡技術科学大学 自然言語処理研究室
PPTX
NLP2018
by
Roy Ray
PDF
役所からの公的文書に対する「やさしい日本語」への変換システムへの構築
by
長岡技術科学大学 自然言語処理研究室
PPTX
All-but-the-Top: Simple and Effective Postprocessing for Word Representations
by
Makoto Takenaka
PDF
日本語学習者の文章読解支援のための語彙制限 ブースター
by
kentshioda
PDF
日本語学習者の文章読解支援のための語彙制限
by
kentshioda
PPTX
英語学習者のための発話自動採点システムの開発.
by
Yutaka Ishii
PDF
Hướng dẫn chuẩn bị cho kì thi JLPT 2014
by
Mina Japanese Center
「やさしい日本語」変換システムの試作
by
長岡技術科学大学 自然言語処理研究室
NLP2018
by
Roy Ray
役所からの公的文書に対する「やさしい日本語」への変換システムへの構築
by
長岡技術科学大学 自然言語処理研究室
All-but-the-Top: Simple and Effective Postprocessing for Word Representations
by
Makoto Takenaka
日本語学習者の文章読解支援のための語彙制限 ブースター
by
kentshioda
日本語学習者の文章読解支援のための語彙制限
by
kentshioda
英語学習者のための発話自動採点システムの開発.
by
Yutaka Ishii
Hướng dẫn chuẩn bị cho kì thi JLPT 2014
by
Mina Japanese Center
Viewers also liked
PPT
31応用練習の実際
by
guest1b518d
PPT
Cora quizon-ok
by
Jinky Quizon
PDF
весь-журнал
by
Milena Seekpeh
PPT
24 04 2015 Икт в метод работе
by
отдел образования
PDF
LeAP Leadership Accelerator Program
by
E2EPeoplePractices
PDF
The Mall of the World
by
Marina Kolesnichenko
PDF
Introduction to HTML5+CSS
by
Ramses Cabello
PDF
BAFC233
by
Janet Wacera
PDF
Three tier application
by
Venkat Pinagadi
PPT
New Technologies That Save Time & Money - HLA 2009
by
Sarah Houghton
PPTX
History of Hypnotherapy
by
Mindlife Hypnotherapy Singapore
PDF
ציפיות הלקוח, תפיסת השירות של המחר
by
hachamd
DOCX
матрёшка
by
Serhiy_
PPT
домашние любимцы
by
Orlovatania
DOCX
Universidad nacional de san agustín: su historia de vergüenza
by
lerikrat
PDF
Entrepreneurial Journeys - Part 1
by
Rajesh Lalwani
PPTX
SharePoint Saturday Philly - To the Cloud
by
Dan Usher
PDF
Diversifying Your Digital Marketing Efforts | SMX East 2013
by
97th Floor
PDF
Market briefing- London
by
The Economist Media Businesses
PPTX
Attractions in the majestic city of Kandy
by
Pushpitha Wijesinghe
31応用練習の実際
by
guest1b518d
Cora quizon-ok
by
Jinky Quizon
весь-журнал
by
Milena Seekpeh
24 04 2015 Икт в метод работе
by
отдел образования
LeAP Leadership Accelerator Program
by
E2EPeoplePractices
The Mall of the World
by
Marina Kolesnichenko
Introduction to HTML5+CSS
by
Ramses Cabello
BAFC233
by
Janet Wacera
Three tier application
by
Venkat Pinagadi
New Technologies That Save Time & Money - HLA 2009
by
Sarah Houghton
History of Hypnotherapy
by
Mindlife Hypnotherapy Singapore
ציפיות הלקוח, תפיסת השירות של המחר
by
hachamd
матрёшка
by
Serhiy_
домашние любимцы
by
Orlovatania
Universidad nacional de san agustín: su historia de vergüenza
by
lerikrat
Entrepreneurial Journeys - Part 1
by
Rajesh Lalwani
SharePoint Saturday Philly - To the Cloud
by
Dan Usher
Diversifying Your Digital Marketing Efforts | SMX East 2013
by
97th Floor
Market briefing- London
by
The Economist Media Businesses
Attractions in the majestic city of Kandy
by
Pushpitha Wijesinghe
Similar to 「やさしい日本語」変換システムの試作
PDF
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
by
長岡技術科学大学 自然言語処理研究室
PDF
公的文書に対する「やさしい日本語」換言辞書作成のための調査
by
長岡技術科学大学 自然言語処理研究室
PDF
PowerCMS X 日本語校正支援機能のご紹介
by
Alfasado
PDF
Let's write understandable Japanese! (Complete Version)
by
Yoshinobu Machida
PDF
「やさしい日本語」のための語彙制限の検討
by
長岡技術科学大学 自然言語処理研究室
PPT
N5_slides.ppt
by
PhngV911367
PPT
N3 slides for sensei to teach the student
by
rahmianisu
PDF
N2 vocabulary JLPT
by
Charbak Mukherjee
PDF
tmu_science_cafe02
by
Tomoyuki Kajiwara
PDF
文章読解支援のための語彙平易化@第1回NLP東京Dの会
by
Tomoyuki Kajiwara
PDF
一般のニュースからやさしい日本語ニュースへの書き換えの分析
by
AsakuraYasunobu
PDF
国語辞典を使った放送ニュースの名詞の平易化
by
Kodaira Tomonori
PDF
「情報保障とやさしい日本語」GAAD Japan 2024やさしい日本語についてのセッションスライド
by
junnamacom
PDF
Clil型中国語授業の試み(ネットアップ版)
by
Richard Pinner
PDF
5. N3 12-2014.pdf ôn thi kỳ thi nưng lực tiếng nhật n3
by
ymfqqzdtc2
PDF
日本語の語彙平易化システムの構築
by
Tomoyuki Kajiwara
PDF
完全掌握2级日本语能力考试语法对策
by
lionlion10
PDF
FULL 40 de thi N3.pdf
by
LinhKuty
PPT
日本語test日本語test日本語test日本語test日本語test日本語test.ppt
by
sadfwasdf
PDF
N2 grammar slide part 1
by
janice lim
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
by
長岡技術科学大学 自然言語処理研究室
公的文書に対する「やさしい日本語」換言辞書作成のための調査
by
長岡技術科学大学 自然言語処理研究室
PowerCMS X 日本語校正支援機能のご紹介
by
Alfasado
Let's write understandable Japanese! (Complete Version)
by
Yoshinobu Machida
「やさしい日本語」のための語彙制限の検討
by
長岡技術科学大学 自然言語処理研究室
N5_slides.ppt
by
PhngV911367
N3 slides for sensei to teach the student
by
rahmianisu
N2 vocabulary JLPT
by
Charbak Mukherjee
tmu_science_cafe02
by
Tomoyuki Kajiwara
文章読解支援のための語彙平易化@第1回NLP東京Dの会
by
Tomoyuki Kajiwara
一般のニュースからやさしい日本語ニュースへの書き換えの分析
by
AsakuraYasunobu
国語辞典を使った放送ニュースの名詞の平易化
by
Kodaira Tomonori
「情報保障とやさしい日本語」GAAD Japan 2024やさしい日本語についてのセッションスライド
by
junnamacom
Clil型中国語授業の試み(ネットアップ版)
by
Richard Pinner
5. N3 12-2014.pdf ôn thi kỳ thi nưng lực tiếng nhật n3
by
ymfqqzdtc2
日本語の語彙平易化システムの構築
by
Tomoyuki Kajiwara
完全掌握2级日本语能力考试语法对策
by
lionlion10
FULL 40 de thi N3.pdf
by
LinhKuty
日本語test日本語test日本語test日本語test日本語test日本語test.ppt
by
sadfwasdf
N2 grammar slide part 1
by
janice lim
More from 長岡技術科学大学 自然言語処理研究室
PDF
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
by
長岡技術科学大学 自然言語処理研究室
PDF
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
by
長岡技術科学大学 自然言語処理研究室
PDF
Selecting Proper Lexical Paraphrase for Children
by
長岡技術科学大学 自然言語処理研究室
PDF
Automatic Selection of Predicates for Common Sense Knowledge Expression
by
長岡技術科学大学 自然言語処理研究室
PDF
用言等換言辞書を用いた換言結果の考察
by
長岡技術科学大学 自然言語処理研究室
PDF
用言等換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
PDF
質問意図によるQAサイト質問文の自動分類
by
長岡技術科学大学 自然言語処理研究室
PDF
対訳コーパスから生成したワードグラフによる部分的機械翻訳
by
長岡技術科学大学 自然言語処理研究室
PDF
用言等換言辞書を人手で作りました
by
長岡技術科学大学 自然言語処理研究室
PDF
文字列の出現頻度情報を用いた分かち書き単位の自動取得
by
長岡技術科学大学 自然言語処理研究室
PDF
常識表現となり得る用言の自動選定の検討
by
長岡技術科学大学 自然言語処理研究室
PDF
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
by
長岡技術科学大学 自然言語処理研究室
PDF
二格深層格の定量的分析
by
長岡技術科学大学 自然言語処理研究室
PDF
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
PDF
文脈の多様性に基づく名詞換言の提案
by
長岡技術科学大学 自然言語処理研究室
PDF
保険関連文書を対象とした文章校正支援のための変換誤り検出
by
長岡技術科学大学 自然言語処理研究室
PDF
Developing User-friendly and Customizable Text Analyzer
by
長岡技術科学大学 自然言語処理研究室
PDF
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
PDF
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
PDF
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
by
長岡技術科学大学 自然言語処理研究室
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
by
長岡技術科学大学 自然言語処理研究室
Selecting Proper Lexical Paraphrase for Children
by
長岡技術科学大学 自然言語処理研究室
Automatic Selection of Predicates for Common Sense Knowledge Expression
by
長岡技術科学大学 自然言語処理研究室
用言等換言辞書を用いた換言結果の考察
by
長岡技術科学大学 自然言語処理研究室
用言等換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
質問意図によるQAサイト質問文の自動分類
by
長岡技術科学大学 自然言語処理研究室
対訳コーパスから生成したワードグラフによる部分的機械翻訳
by
長岡技術科学大学 自然言語処理研究室
用言等換言辞書を人手で作りました
by
長岡技術科学大学 自然言語処理研究室
文字列の出現頻度情報を用いた分かち書き単位の自動取得
by
長岡技術科学大学 自然言語処理研究室
常識表現となり得る用言の自動選定の検討
by
長岡技術科学大学 自然言語処理研究室
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
by
長岡技術科学大学 自然言語処理研究室
二格深層格の定量的分析
by
長岡技術科学大学 自然言語処理研究室
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
文脈の多様性に基づく名詞換言の提案
by
長岡技術科学大学 自然言語処理研究室
保険関連文書を対象とした文章校正支援のための変換誤り検出
by
長岡技術科学大学 自然言語処理研究室
Developing User-friendly and Customizable Text Analyzer
by
長岡技術科学大学 自然言語処理研究室
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
「やさしい日本語」変換システムの試作
1.
長岡技術科学大学 電気系 杢
真奈見、 山本 和英
2.
現在、日本には十分な日本語能力を持たな い外国人が数十万人いる。 これらの人々のために日本語をやさしくする
「やさしい日本語」プロジェクトがある。 「やさしい日本語」 ・・・対象は留学生や外国人労働者等の日本語 能力の低い人々(日本語初学者)。 1/14
3.
国語辞典を使った放送ニュースの名詞の平易化 (美野秀弥ら, 2010)
◦国語辞典の見出しとその説明文より平易化対を取得し、 日本語能力試験(JLPT)を基にした単語への級の付与によ り難語と平易語を定めた。 Plain Japanese (PJ) システム (松田真希子ら, 2009) ◦日本での工学教育で使用するために開発された。留学生 のために工学の文章の語彙と文法を制限する。 2/14
4.
対象:公的文書 ・・・市役所、学校、病院などで配布される文書。生 活する上で重要な情報を含む。
しかし、公的文書は日本語初学者が学習する文 に比べ理解が困難であり、特有な表現も含む。 (筒井千絵, 2009) 日本語初学者の公的文書の理解のため、 容易に「やさしい日本語」を 得ることができる システムを構築することを目的とした。 3/14
5.
「やさしい日本語」コーパスから確立させた ルールベースによる以下の4つのステップで システムを構成した。
デザイン 文の分割 表現意図を用いた図示への変換 重要部分の強調 変換 「やさしい日本語」への変換 4/14 ※「やさしい日本語」コーパス: 約40名の日本語教師が45,209文の公的文書を 「やさしい日本語」へ変換したもの
6.
5/14
7.
「やさしい日本語」へ変換することによって語 彙がやさしくなり、理解しやすくなると考える。 使用データ:「やさしい日本語」変換対
例)ご不明な点がありましたら(原文) →わからないことがありましたら(逐語訳) 方法:原文-逐語訳の6236対を用いて、入 力文の一部が原文側と一致した場合に逐語 訳側へ変換する。 6/14
8.
システムの出力例 入力: 入学手続が済めば、日本語学校の職員が代理
で就学ビザの在留資格認定証明書を申請する ことができます。 出力: 入学手続が済めば、日本語学校の人が代わり で就学ビザの在留資格認定証明の紙を申し込 みすることができます。 複合名詞処理(赤字)と形態素解析(/) の結果: 入学手続/が/済め/ば/、/日本語学校/の/職員 /が/代理/で/就学ビザ/の/在留資格認定証明/ 書/を/申請/すること/が/でき/ます/。 7/14 ・名詞連続、数字+助数詞、 動詞+「こと」は複合名詞とする (名詞中の接尾辞にあたるものは除く)
9.
「やさしい日本語」への変換について、 小規模な評価実験を行った。 ①正しさの評価
日本語母語話者(発表者)による日本語の 文法と意味の評価 ②やさしさの評価 日本語非母語話者による入力文(公的文 書)と出力文のやさしさの評価 8/14
10.
「やさしい日本語」コーパスより無作為に300 文を公的文書から抽出し、原文-逐語訳の 変換対を用いて評価文を作成する
評価者(発表者)は入力文と出力文を見て、 出力文の日本語の意味と文法の適切さにつ いてそれぞれ2択で評価する 9/14 評価文の例) 入力:健康被害発生時の保障は、太田市のみの保障と なります。 出力:体の調子が悪くなるようなことが 起こったの時の保 障は、太田市だけ の保障となってます。 意味→○ 文法→×
11.
意味 合計 ○
× 文法 ○ 137 53 190 × 35 20 55 合計 172 73 245 変換された文: 245文 / 300文 (変換率:81.7%) 10/14 結果、助詞や用言の活用の変化・ 複合名詞処理を含む変換ルールについて、 まだ改良が必要である。
12.
意味の間違い 複合名詞ではないとした「名詞+接尾辞」のうちの 「名詞」だけが変化したもの
変換例) 費用は対象外 → お金はのため外 文法の間違い 助詞や用言の活用の変化に対応していないことが 原因 変換例) 意味のある単語 → 意味のあります言葉 11/14
13.
①正しさの評価で「日本語が正しい」と評価さ れた137文より無作為に100文を抽出する 評価者は入力文と出力文を見て、どちらの文
がやさしいか、または同じくらいかと評価する 評価文それぞれに対してどちらがやさしいか を多数決方式で決定する 例) 入力:離乳食のお話 出力:子どもの食べ物の話 12/14
14.
13/14 やさしいと評価した 評価者数が多い文
変換後 同程度 変換前 全員 8名 15 85 0 日本在住期間 1年以上 4名 11 89 0 日本在住期間 1年未満 4名 46 54 0 「変換後の方が やさしい」 という評価が 増えた 結果、「やさしい日本語」変換は 日本在住期間の短い 「日本語初学者」に効果があった。
15.
デザインと変換から構成される「やさしい日本 語」変換システムの構築を目指した。 「やさしい日本語」への変換について評価実
験を行い、ルールの改善方針や日本語初学 者への効果が確認できた。 全工程において、高精度なもの(81%以上) はできたが、ルールの改善によりさらに精度 が向上する可能性がある。 最終的に、市役所で「やさしい日本語」による 文書の作成支援や日本語初学者が直接利 用できる環境づくりを目指したい。 14/14
16.
予備スライド
17.
出身国 人数 [名]
マレーシア 3 タイ 1 中国 1 ドイツ 1 ベネズエラ 1 ベトナム 1
18.
評価者が保有するJLPTの級 JLPTの保有級 人数
[名] N1 0 N2 4 N3 3 N4 0 N5 0 なし 1 合計 8 ※ただしN3には N2の試験に僅差で 不合格してJLPTの 級を保有していない 者を含み、 「保有級なし」は 点数の情報が なかったために 「保有級なし」とした。
19.
評価者の日本在住歴 人数 [名]
期間 人数 [名] 現在も在住 8 ~1年 4 1~2年 2 2~3年 0 3~4年 2 4~5年 0 5年~ 0
20.
評価者の日本語学習歴 ※5年以上の評価者は学習期間が約6年 日本語学習期間
人数 [名] ~1年 2 1~2年 1 2~3年 0 3~4年 2 4~5年 1 5年~ 2 合計 8
21.
「やさしい日本語」コーパスの公的文書と対応する 「やさしい日本語」の差異(句)を対とし構成している。 文単位で言い換えているため、句単位では等価で
ない場合もある。 例) 公的文書:その他、申請に関してご不明な点があり ましたら、下記までお問い合わせください。 タグ対象語(原文): ご不明な点がありましたら 逐語訳: わからないことがありましたら 意訳: わからなかった 要約: わからなかった
22.
原文、逐語訳、意訳、要約の4つの組み合わせで 以下の3つの変換対を作成した。 原文-逐語訳:
6236対 原文-意訳: 4772対 原文-要約: 3944対 変換の際には、原文側の句を 以下の順で優先順位を付けている。 i.文字数が多いもの ii.出現頻度の多いもの iii.Sort順
23.
表現意図タグの網羅性 旧ルール・・・9種類のタグを初期のルールで付与 新ルール・・・11種類のタグを最終ルールで付与
総文数 総節数 タグの付与数 網羅性 旧ルール 45209 [文] 53375 [節] 19380 [節] 34.8 [%] 新ルール 53322 [節] 24291 [節] 45.6 [%]
24.
公的文書の性質と精度を基にタグを決定 13/14 タグの種類
タグ数 [節] 付与誤り [節] 精度 [%] 忠告・助言 0 0 - 勧告 15 0 100 指示・命令 37 0 100 理由 40 1 98 条件・仮定・項目 164 3 98 通知・事実 207 12 94 禁止 0 0 - 接続詞 15 0 100 平均 98
25.
タグの種類 例 忠告・助言
~したほうがいいですよ 勧告 ~しませんか・しましょうよ 依頼 ~してもらえますか/くれませんか 指示・命令 ~してください・しなさい・お願いします 許可与え ~してもいいです 申し出 ~してあげましょうか 許可求め ~してもいいですか 確認 ~してもいいですね 通知・宣言 ~します・させてもらいます 条件・仮定 ~の場合・際、~方は、~として、~すれば(用言の仮定形) 理由 ~ので、~ため、~により 題目・タイトル ~について 項目 (各種項目の形式となっているもの) 既定の事実 (過去形) 禁止 ~いけません
26.
新ルール 文字列・・・「場合」「際」「について」「ので」「ため」 「により」「方は」
品詞・・・接続詞、接続助詞、用言の仮定形 11/20 文数 [文] 節数 [節] 分割誤り [節] 精度 [%] 旧ルール 500 669 13 96 新ルール 706 20 97 分割誤りの例) ①また、 ②口座振替の指定口座が残高不足等により振替に よるお支払いがいただけない場合は、 ③年金からのお支払いに切り替える場合が ④あります。←※この節1つで意味を成していない。
27.
3.表現意図を用いた図示への変換 システムの出力例 14/14
出力: しかし、 【予防接種を受けることの義務はなく、 ご本人が接種を希望する場合のみに】 予防接種を行います。 接続詞以降は インデントを増やす 条件や理由は 【 】で囲み、 次の節へ矢印を引く
28.
評価文 (1) 文で表示
(2) 節で表示 (3) 関係を図で表示 ① 25% 83% ② 100% 0% ③ 67% 58% ④ 79% 54% ⑤ 67% 46% ⑥ 63% 71% ⑦ 58% 63% ⑧ 46% 71% 下線・・・半数の評価者がわかりやすいとしたもの 斜体・・・何らかの変化を加えた方がわかりやすいもの
29.
4.重要部分の強調 システムの出力例 入力:
保護者の判断で登校を見合わせてください。 句: 1) 保護者の判断で見合わせてください。 2) 登校を見合わせてください。 係り受け解析の結果: 保護者の –D 判断で –D 登校を –D 見合わせてください。 ⇒ 強調 16/14
30.
順位 助詞 分類
種類 備考 1 ト 格助詞 一般 2 ヲ 格助詞 一般 動詞数が多い句が優先 3 カラ 格助詞 一般 ヲより動詞数が多いとカラが優先 3 マデ 副助詞 * ヲより動詞数が多いとマデが優先 5 ニヨリ 格助詞 連語 6 ガ 格助詞 一般 動詞数が少ない句が優先 7 へ 格助詞 一般 8 ニ 格助詞 一般 9 ハ 係助詞 * 10 デ 格助詞 一般 -1 カ 副助詞 /並立助詞 /終助詞 * 並立助詞があると、 その句の重要度が下がる。 ※全27個の助詞に重みを付けた。
31.
重要部分の正解を人手で作成したが、人手 でも1つに絞ることが難しいものが多かったた め、正解を1つとした正解データ、重要部分で
あれば複数でも可とする正解データの2種類 で行った。 評価文1文20文字以上の40文 節数 正解が単一 正解が複数可 正解節数 精度 正解節数 精度 45節 30節 64% 38節 81%
Download