SlideShare a Scribd company logo
1 of 12
Download to read offline
梶原智之、山本和英
発表者:塩田健人
u  どのような問題を解いたか?
平易な語ほど頻度が高く、頻度が高い語ほど
文脈の種類数が多くなるとの仮定
語の難易度と頻度と文脈の種類数の関係
u  どうやって解いたか?
u  コーパス中の語、テキスト間の相関係数を計算し
て相関を調査
u  難易度
u  単語親密度が低い単語ほど難解な語、高い単語
ほど平易な語
u  日本語能力試験(JLPT)の出題基準
→1級(難解)から4級(平易)の4段階
u  文脈の定義
u  対象の語が含まれる文節と係り受け関係にある文
節中の内容語とする
→内容語:名詞、動詞、形容詞、副詞
u  新聞記事
u  1990年~2004年までの15年分の日経新聞
u  Wikipedia
u  2014年3月時点の全日本語記事の本文
u  論文
u  ANLP-20コーパスとして公開されている自然言語処
理年次大会予稿集のうち、論文PDFの抽出テキスト
記事数	
 単語数	
 異なり単語数	
新聞記事	
 2,479,065	
 703,761,303	
 151,514	
Wikipedia	
 853,134	
 357,761,882	
 158,971	
論文	
 4,082	
 14,787,129	
 37,282
u  平易な語ほど頻度が高い
→強い相関はない(最大の順位相関係数が0.65)
u  頻度が高いほど文脈の種類数が多い
→強い相関がある(最大の順位相関係数0.99)
u  平易な語ほど文脈の種類数が多い
→強い相関はない(最大の順位相関関数0.64)
u  平易な 語ほど頻度が高く、頻度が高い語ほど
文脈の種類数も多くなるという仮説
ü  頻度が高い語ほど平易な語
ü  文脈の種類が多いほど平易な語
ü  しかし、頻度が低くても平易な語
ü  文脈の種類数が少なくても平易な語もある
ü  語の難易度と頻度、文脈の種類数の間に強い相関は無い

More Related Content

What's hot

Jidoushi-Tadoushi_Grammatical category
Jidoushi-Tadoushi_Grammatical categoryJidoushi-Tadoushi_Grammatical category
Jidoushi-Tadoushi_Grammatical category
Tomonari Kuroda
 
英語の資料をITフル活用で乗り切る方法
英語の資料をITフル活用で乗り切る方法英語の資料をITフル活用で乗り切る方法
英語の資料をITフル活用で乗り切る方法
Iwasaki Yusuke
 
言語学概論第9回140630
言語学概論第9回140630言語学概論第9回140630
言語学概論第9回140630
Kazuya Abe
 
Genki chapter 10
Genki chapter 10Genki chapter 10
Genki chapter 10
nhansen11
 
121231 conversation analysis02
121231 conversation analysis02121231 conversation analysis02
121231 conversation analysis02
Tomonari Kuroda
 
121224 conversation analysis
121224 conversation analysis121224 conversation analysis
121224 conversation analysis
Tomonari Kuroda
 

What's hot (19)

Writing e mails in english revised part01 common grounds
Writing e mails in english revised part01 common groundsWriting e mails in english revised part01 common grounds
Writing e mails in english revised part01 common grounds
 
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
 
Jidoushi-Tadoushi_Grammatical category
Jidoushi-Tadoushi_Grammatical categoryJidoushi-Tadoushi_Grammatical category
Jidoushi-Tadoushi_Grammatical category
 
英語の資料をITフル活用で乗り切る方法
英語の資料をITフル活用で乗り切る方法英語の資料をITフル活用で乗り切る方法
英語の資料をITフル活用で乗り切る方法
 
Sigconf 2019 slide_ota_20191123
Sigconf 2019 slide_ota_20191123Sigconf 2019 slide_ota_20191123
Sigconf 2019 slide_ota_20191123
 
Nl220 Pitman-Yor Hidden Semi Markov Model
Nl220 Pitman-Yor Hidden Semi Markov ModelNl220 Pitman-Yor Hidden Semi Markov Model
Nl220 Pitman-Yor Hidden Semi Markov Model
 
Signl213
Signl213 Signl213
Signl213
 
冬期講習5講classic
冬期講習5講classic冬期講習5講classic
冬期講習5講classic
 
言語学概論第9回140630
言語学概論第9回140630言語学概論第9回140630
言語学概論第9回140630
 
Genki chapter 10
Genki chapter 10Genki chapter 10
Genki chapter 10
 
121231 conversation analysis02
121231 conversation analysis02121231 conversation analysis02
121231 conversation analysis02
 
191209 how to translate j to e
191209 how to translate j to e191209 how to translate j to e
191209 how to translate j to e
 
Asking where someone is from and responding
Asking where someone is from and respondingAsking where someone is from and responding
Asking where someone is from and responding
 
200424 6 passive form
200424 6 passive form200424 6 passive form
200424 6 passive form
 
121224 conversation analysis
121224 conversation analysis121224 conversation analysis
121224 conversation analysis
 
Conquest2012 1
Conquest2012 1Conquest2012 1
Conquest2012 1
 
中三生冬期講習資料ⅰ
中三生冬期講習資料ⅰ中三生冬期講習資料ⅰ
中三生冬期講習資料ⅰ
 
Japan.r 2018 slide ota_20181201
Japan.r 2018 slide ota_20181201Japan.r 2018 slide ota_20181201
Japan.r 2018 slide ota_20181201
 
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてーMT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー
 

Viewers also liked (13)

読解支援6 19
読解支援6 19読解支援6 19
読解支援6 19
 
読解支援 5 26
読解支援 5 26読解支援 5 26
読解支援 5 26
 
読解支援6 5
読解支援6 5読解支援6 5
読解支援6 5
 
読解支援7 3
読解支援7 3読解支援7 3
読解支援7 3
 
読解支援プレゼン 4 28
読解支援プレゼン 4 28読解支援プレゼン 4 28
読解支援プレゼン 4 28
 
読解支援_2本目
読解支援_2本目読解支援_2本目
読解支援_2本目
 
読解支援7 10
読解支援7 10読解支援7 10
読解支援7 10
 
読解支援 5 19
読解支援 5 19読解支援 5 19
読解支援 5 19
 
読解支援7 17
読解支援7 17読解支援7 17
読解支援7 17
 
Naacl 読み会
Naacl 読み会Naacl 読み会
Naacl 読み会
 
読解支援_2本目
読解支援_2本目読解支援_2本目
読解支援_2本目
 
読解支援_1本目
読解支援_1本目読解支援_1本目
読解支援_1本目
 
日本語学習者の文章読解支援のための語彙制限 ブースター
日本語学習者の文章読解支援のための語彙制限 ブースター日本語学習者の文章読解支援のための語彙制限 ブースター
日本語学習者の文章読解支援のための語彙制限 ブースター
 

読解支援6 26