SlideShare a Scribd company logo
小学生の読解支援に向けた 
語釈文から語彙的換言を選択する手法 
長岡技術科学大学 
梶原智之 山本和英
概要 
 教授はどうなのだろう 
【教授】
教授という地位の人 【教授】教授という地位 【教授】学問やわざなどを教えること 
【教授】大学の先生 
_原文 
国語辞典 
学習基本語彙 
       人:0.17 
学問:0.11 わざ:0.13 
大学:0.08 先生:0.25 
同じ品詞の語 
教授 地位  人_ 
学問 わざ 大学 先生 
平易語 
換言先候補 教授はどうなのだろう? 
先生はどうなのだろう?? 2
背景・目的 
一般語彙 小学国語辞典に 
学習語彙 
25000語 
登録される語 
( 理解できる上限 ) 
一般の国語辞典 
に登録される語 
( 難解な語 ) 
小学校国語科の教科書を作成している 
光村図書の「語彙指導の方法」による解説 
学習基本語彙 
5404語 
基礎語彙 
2000小学生が十分に 
駆使できる語 
語 
生活のために 
最低限必要な語 
一般語彙・学習語彙を 
学習基本語彙に言い換える 
小学生のための読解支援 3
先行研究 
•! 国語辞典を用いた換言 
–!見出し語 → 見出し語 
•! 藤田ら (2000)、美野ら (2011) 
–!見出し語 → 語釈文末の語 
•! 鍜治ら (2002)、美野ら (2011)、梶原ら (2013) 
•! 「見出し語より語釈文が平易」 
•! 「最終文節が見出し語の意味を表している」 
4
語釈文末の語に換言できない例 
•! 語釈文:【大詰め】芝居の最後の場面 
•! 換言例:大詰めの大一番 → 場面の大一番 
•! 換言例:大詰めの大一番 → 最後の大一番 
•! 必ずしも語釈文の末尾に 
換言可能な語が出現するわけではない 
•! 換言の前後で意味を保つために 
見出し語との類似度が最も高い語を選ぶ 
5
提案手法 
•! 換言先候補の獲得 
–!学習基本語彙に含まれない難語を抽出する 
–!国語辞典の見出し語の中から難語を検索する 
–!語釈文から難語と同じ品詞の語のみ抽出する 
•! 最適な換言先の選択 
–!学習基本語彙に含まれる平易語のみ抽出する 
–!WordNetを用いて見出し語との類似度を計算 
–!見出し語との類似度が最も高い候補を選択 
6
比較手法 
•! 換言先候補の獲得 
–!候補のうち最も文末に近い位置で出現する語 
•! 最適な換言先の選択 
–!候補中での各語の出現頻度で選択 
–!入力文中の各内容語との共起頻度で選択 
–!入力文中の各内容語とのPMI値で選択 
–!出力文の3-gram出現頻度で選択 
–!文脈ベクトルのコサイン類似度で選択 
–!上記5選択手法を用いた重み付き投票 7
実験データ 
•! 難語152語 
–!学習基本語彙に含まれていない 
–!毎日新聞2000年度分に50回以上出現 
–!語釈文中に換言可能な平易語が含まれている 
–!語釈文中に換言不可能な平易語が含まれている 
•! 国語辞典 
–!チャレンジ小学国語辞典 
–!三省堂国語辞典 
–!EDR日本語単語辞書 8
実験方法 
•! 52語 
–!提案手法 
–!比較手法(単体) 
•! 100語 
–!提案手法 
–!比較手法(投票) 
•! 評価 
–!◯:3人中2人以上が換言可能と判断 
–!Kappa値(各評価者2人ずつ) 
•! 0.617 
•! 0.600 
•! 0.662 
9
実験結果 
! #! $! %! ! '! (! )! 
(AFC:E)CE?B 
()78.9:;9*/' 
6! 03
3
 
5
3
	13#3 
1
3
	132343 
+%,-./0
 
*A;@D3=:E' 
$268 
268 10
実験結果 
! #! $! %! ! '! (! )! 
(AFC:E)CE?B 
()78.9:;9*/' 
@G$6,7*3%4. 
?G$6,7*3%4- 
G$25+/%4. 
=G$25+/%4- 
$268 
268 11
考察 
•! 換言先候補の獲得 
–!換言可能な平易語をより多く獲得できた 
–!しかし、比較手法との差は3.2ポイントのみ 
正解数 正解率(%) 
提案手法 165 / 221 74.7 
比較手法 158 / 221 71.5 
–!語釈文における見出し語の換言先として、 
やはり文末の語は有効である 
12
考察 
•! 最適な換言先の選択 
–!単体の比較手法よりも提案手法が有効 
–!比較手法は組合せて投票すると 
提案手法と同等程度まで精度が向上する 
–!しかし同等ならシンプルな提案手法が有効 
–!頻度や文脈の情報を用いるよりも 
難語との意味の類似度による選択が有効 
13

More Related Content

What's hot

日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価
Tomoyuki Kajiwara
 
クラークAELC英語学校パンフレット 2016.11
クラークAELC英語学校パンフレット 2016.11クラークAELC英語学校パンフレット 2016.11
クラークAELC英語学校パンフレット 2016.11
WEB制作仲間
 
タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—
タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—
タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—
Ken Urano
 
Essential japanese expressions - Expressões Essenciais em Japonês
Essential japanese expressions - Expressões Essenciais em JaponêsEssential japanese expressions - Expressões Essenciais em Japonês
Essential japanese expressions - Expressões Essenciais em Japonês
Romulo Silva
 
目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック
目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック
目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック
Ken Urano
 

What's hot (7)

日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価
 
クラークAELC英語学校パンフレット 2016.11
クラークAELC英語学校パンフレット 2016.11クラークAELC英語学校パンフレット 2016.11
クラークAELC英語学校パンフレット 2016.11
 
タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—
タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—
タスクを中心にした英語教育は日本で実現可能か—大学におけるライティング授業の事例—
 
Essential japanese expressions - Expressões Essenciais em Japonês
Essential japanese expressions - Expressões Essenciais em JaponêsEssential japanese expressions - Expressões Essenciais em Japonês
Essential japanese expressions - Expressões Essenciais em Japonês
 
目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック
目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック
目標言語を使った外国語の授業: 効果的なインプット・インタラクション・フィードバック
 
スタンダードクラス(表紙・語法・文法)
スタンダードクラス(表紙・語法・文法)スタンダードクラス(表紙・語法・文法)
スタンダードクラス(表紙・語法・文法)
 
ハイレベルクラス(表紙・語法・文法)
ハイレベルクラス(表紙・語法・文法)ハイレベルクラス(表紙・語法・文法)
ハイレベルクラス(表紙・語法・文法)
 

Viewers also liked

用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
Cannes insights mma
Cannes insights mmaCannes insights mma
Cannes insights mma
Mobile Marketing Association
 
Local SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitorsLocal SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitors
Greg Gifford
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
長岡技術科学大学 自然言語処理研究室
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
長岡技術科学大学 自然言語処理研究室
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
長岡技術科学大学 自然言語処理研究室
 
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
Bernard Moon
 
AIM-OPP for clearbook
AIM-OPP for clearbookAIM-OPP for clearbook
AIM-OPP for clearbookJinky Quizon
 
Dicas presentes de natal 2014
Dicas presentes de natal 2014Dicas presentes de natal 2014
Dicas presentes de natal 2014
Tudo de bom Cosméticos
 
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
НАЕК «Енергоатом»
 
5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation
Manisha Dorawala
 
Ordem trt2
Ordem trt2Ordem trt2
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
長岡技術科学大学 自然言語処理研究室
 
кратко
краткократко
краткоkulibin
 
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOWBALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
Jon Burkhart
 
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
North Texas Chapter of the ISSA
 
Consumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer AcquisitionConsumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer Acquisition
Dave McClure
 
10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own
Wishpond
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
長岡技術科学大学 自然言語処理研究室
 

Viewers also liked (20)

用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
Cannes insights mma
Cannes insights mmaCannes insights mma
Cannes insights mma
 
Local SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitorsLocal SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitors
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
 
AIM-OPP for clearbook
AIM-OPP for clearbookAIM-OPP for clearbook
AIM-OPP for clearbook
 
Socialmedianew
SocialmedianewSocialmedianew
Socialmedianew
 
Dicas presentes de natal 2014
Dicas presentes de natal 2014Dicas presentes de natal 2014
Dicas presentes de natal 2014
 
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
 
5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation
 
Ordem trt2
Ordem trt2Ordem trt2
Ordem trt2
 
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
 
кратко
краткократко
кратко
 
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOWBALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
 
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
 
Consumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer AcquisitionConsumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer Acquisition
 
10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 

Similar to 小学生の読解支援に向けた語釈文から語彙的換言を選択する手法

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
Tomoyuki Kajiwara
 
20150826千葉大学英語教育セミナーws
20150826千葉大学英語教育セミナーws20150826千葉大学英語教育セミナーws
20150826千葉大学英語教育セミナーws
Yamamoto Takenori
 
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
長岡技術科学大学 自然言語処理研究室
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
Tomoyuki Kajiwara
 
日本語教員養成のための反転授業の設計
日本語教員養成のための反転授業の設計日本語教員養成のための反転授業の設計
日本語教員養成のための反転授業の設計
別府大学
 
語彙の教え方、学び方
語彙の教え方、学び方語彙の教え方、学び方
語彙の教え方、学び方
Yoshifumi Murakami
 
N2 (Moji-Goi)
N2 (Moji-Goi)N2 (Moji-Goi)
N2 (Moji-Goi)Mae
 
文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会
Tomoyuki Kajiwara
 
ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察
N.K KooZN
 
Mel20140709 12key
Mel20140709 12keyMel20140709 12key
Mel20140709 12key
youwatari
 

Similar to 小学生の読解支援に向けた語釈文から語彙的換言を選択する手法 (12)

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
20150826千葉大学英語教育セミナーws
20150826千葉大学英語教育セミナーws20150826千葉大学英語教育セミナーws
20150826千葉大学英語教育セミナーws
 
期末テスト講習会
期末テスト講習会期末テスト講習会
期末テスト講習会
 
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
 
日本語教員養成のための反転授業の設計
日本語教員養成のための反転授業の設計日本語教員養成のための反転授業の設計
日本語教員養成のための反転授業の設計
 
語彙の教え方、学び方
語彙の教え方、学び方語彙の教え方、学び方
語彙の教え方、学び方
 
N2 (Moji-Goi)
N2 (Moji-Goi)N2 (Moji-Goi)
N2 (Moji-Goi)
 
文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会
 
ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察ラウンド制授業長期実証データと認知科学的考察
ラウンド制授業長期実証データと認知科学的考察
 
Mel20140709 12key
Mel20140709 12keyMel20140709 12key
Mel20140709 12key
 

More from 長岡技術科学大学 自然言語処理研究室

質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
長岡技術科学大学 自然言語処理研究室
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
長岡技術科学大学 自然言語処理研究室
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
長岡技術科学大学 自然言語処理研究室
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
長岡技術科学大学 自然言語処理研究室
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
長岡技術科学大学 自然言語処理研究室
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
長岡技術科学大学 自然言語処理研究室
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
長岡技術科学大学 自然言語処理研究室
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
長岡技術科学大学 自然言語処理研究室
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
長岡技術科学大学 自然言語処理研究室
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
長岡技術科学大学 自然言語処理研究室
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
長岡技術科学大学 自然言語処理研究室
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討
長岡技術科学大学 自然言語処理研究室
 
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~長岡技術科学大学 自然言語処理研究室
 

More from 長岡技術科学大学 自然言語処理研究室 (20)

質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討
 
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
 
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
 
QAサイトにおける専門用語を用いた最適な回答者提示
QAサイトにおける専門用語を用いた最適な回答者提示QAサイトにおける専門用語を用いた最適な回答者提示
QAサイトにおける専門用語を用いた最適な回答者提示
 
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
 
Web上の誹謗中傷を表す文の自動検出
Web上の誹謗中傷を表す文の自動検出Web上の誹謗中傷を表す文の自動検出
Web上の誹謗中傷を表す文の自動検出
 

Recently uploaded

MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 

Recently uploaded (16)

MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 

小学生の読解支援に向けた語釈文から語彙的換言を選択する手法

  • 2. 概要  教授はどうなのだろう 【教授】 教授という地位の人 【教授】教授という地位 【教授】学問やわざなどを教えること 【教授】大学の先生 _原文 国語辞典 学習基本語彙        人:0.17 学問:0.11 わざ:0.13 大学:0.08 先生:0.25 同じ品詞の語 教授 地位  人_ 学問 わざ 大学 先生 平易語 換言先候補 教授はどうなのだろう? 先生はどうなのだろう?? 2
  • 3. 背景・目的 一般語彙 小学国語辞典に 学習語彙 25000語 登録される語 ( 理解できる上限 ) 一般の国語辞典 に登録される語 ( 難解な語 ) 小学校国語科の教科書を作成している 光村図書の「語彙指導の方法」による解説 学習基本語彙 5404語 基礎語彙 2000小学生が十分に 駆使できる語 語 生活のために 最低限必要な語 一般語彙・学習語彙を 学習基本語彙に言い換える 小学生のための読解支援 3
  • 4. 先行研究 •! 国語辞典を用いた換言 –!見出し語 → 見出し語 •! 藤田ら (2000)、美野ら (2011) –!見出し語 → 語釈文末の語 •! 鍜治ら (2002)、美野ら (2011)、梶原ら (2013) •! 「見出し語より語釈文が平易」 •! 「最終文節が見出し語の意味を表している」 4
  • 5. 語釈文末の語に換言できない例 •! 語釈文:【大詰め】芝居の最後の場面 •! 換言例:大詰めの大一番 → 場面の大一番 •! 換言例:大詰めの大一番 → 最後の大一番 •! 必ずしも語釈文の末尾に 換言可能な語が出現するわけではない •! 換言の前後で意味を保つために 見出し語との類似度が最も高い語を選ぶ 5
  • 6. 提案手法 •! 換言先候補の獲得 –!学習基本語彙に含まれない難語を抽出する –!国語辞典の見出し語の中から難語を検索する –!語釈文から難語と同じ品詞の語のみ抽出する •! 最適な換言先の選択 –!学習基本語彙に含まれる平易語のみ抽出する –!WordNetを用いて見出し語との類似度を計算 –!見出し語との類似度が最も高い候補を選択 6
  • 7. 比較手法 •! 換言先候補の獲得 –!候補のうち最も文末に近い位置で出現する語 •! 最適な換言先の選択 –!候補中での各語の出現頻度で選択 –!入力文中の各内容語との共起頻度で選択 –!入力文中の各内容語とのPMI値で選択 –!出力文の3-gram出現頻度で選択 –!文脈ベクトルのコサイン類似度で選択 –!上記5選択手法を用いた重み付き投票 7
  • 8. 実験データ •! 難語152語 –!学習基本語彙に含まれていない –!毎日新聞2000年度分に50回以上出現 –!語釈文中に換言可能な平易語が含まれている –!語釈文中に換言不可能な平易語が含まれている •! 国語辞典 –!チャレンジ小学国語辞典 –!三省堂国語辞典 –!EDR日本語単語辞書 8
  • 9. 実験方法 •! 52語 –!提案手法 –!比較手法(単体) •! 100語 –!提案手法 –!比較手法(投票) •! 評価 –!◯:3人中2人以上が換言可能と判断 –!Kappa値(各評価者2人ずつ) •! 0.617 •! 0.600 •! 0.662 9
  • 10. 実験結果 ! #! $! %! ! '! (! )! (AFC:E)CE?B ()78.9:;9*/' 6! 03 3 5
  • 13. 実験結果 ! #! $! %! ! '! (! )! (AFC:E)CE?B ()78.9:;9*/' @G$6,7*3%4. ?G$6,7*3%4- G$25+/%4. =G$25+/%4- $268 268 11
  • 14. 考察 •! 換言先候補の獲得 –!換言可能な平易語をより多く獲得できた –!しかし、比較手法との差は3.2ポイントのみ 正解数 正解率(%) 提案手法 165 / 221 74.7 比較手法 158 / 221 71.5 –!語釈文における見出し語の換言先として、 やはり文末の語は有効である 12
  • 15. 考察 •! 最適な換言先の選択 –!単体の比較手法よりも提案手法が有効 –!比較手法は組合せて投票すると 提案手法と同等程度まで精度が向上する –!しかし同等ならシンプルな提案手法が有効 –!頻度や文脈の情報を用いるよりも 難語との意味の類似度による選択が有効 13
  • 16. 考察 •! 失敗例 –!最高の類似度を取る候補が複数ある場合 •! 主なポイントをまとめた •! ポイント:要点。点数。得点。地点。・・・ –!最高の類似度を取る候補が換言不可能な場合 •! 録画中の番組も再生できる •! 再生:廃物を再利用する。力や命を取り戻すこと。 14
  • 17. まとめ •! 提案手法は、語釈文全体から見出し語と 最も意味の類似した語への換言を行う •! 獲得 –!従来の文末の語への換言よりも 換言可能な平易語を多く獲得できる –!しかし換言可能な平易語の多くは文末 •! 選択 –!頻度や文脈の情報を用いるよりも 意味の類似度による候補の選択が有効 15