SlideShare a Scribd company logo
1 of 57
Download to read offline
09/15/14 
Graded Readersにおける 
語彙の簡略化 
狭山ヶ丘高等学校 
伊藤亮太 
LET関西支部メソドロジー研究部会 
2014年度第2回研究会@信州大学
Introduction 
研究目的 
原文 (OR) と学習者のために簡略化さ 
れたGraded Readers (GR) の語彙の特 
徴を明らかにする。 
日本人の英語教師が学習者用に英文を 
書き換えるときのヒントを明らかにす 
る。 
2
3 
Outline 
Outline 
Graded Readers 
Review of    
Literature 
Research 
Question 
Style 
Data 
Methods 
Result & 
Discussion 
✔ Keywords 
✔ PCA 
✔ Examples 
Conclusion
Graded Readers 
Penguin Readers は、 
語彙と文法に統制をかけて、各レベル 
ごとに英語のレベルを設けたシリーズ 
Level 5 Headwords 2300, CEFR B2, 
TOEIC 600, TOEFL iBT 62-63, 
英検 2級-準1級 
Sherlock Holmes Short Stories 
理由:高校卒業の学習レベルに対応、 
   Level 5、e-text化 
4
Review of Literature 1 
Krashen (1989) インプット仮説 
Day and Bamford (1998) 多読の役割 
Nation (2001), Shmitt et al. (2011) 
98%の語彙理解→60%の読解 
Qian (2002) 語彙知識の広さと深さと読解 
の関係 
Yano et al. (1994), Oh (2001) Baseline vs. 
Linguistic Simplification vs. Elaboration 
5
Review of Literature 2 
Kobayashi (2006), Kobayashi and Kitao 
(2010) Penguin Readersと教科書の語彙 
の関係 
Semino (2011) Shakespeareの原文と簡略 
化された英文の語彙 
伊藤 (2011) ORとGRの語彙分析 
6
Research Questions 
ORからGRに書き換えにおいて、 
1. 語彙は簡略化されているか。 
2. どのような語彙に違いがあるか。 
3. 各作品の文体に違いはあるか。 
4. どのような違いがあるか。 
7
8 
Styleとは 
単語→句→節→文→段落→小説 
でも、今日は… 
→単語に注目
分析のテキスト 
9 
Holmes 短編作品 
● 1891“The Man with the Twisted Lips”(T) 
● 1891“The Engineer’s Thumb”(E) 
● 1892“The Resident Patient”(P) 
● 1917“Wisteria Lodge”(W) 
● 1917“Disappearance of Lady Fances 
Carfax”(D) 
● 1927“The Three Garridebs”(G)
Holmes Works Data 
works letters tokens types lemmas sentences 
letters 
/tokens 
syllables 
/tokens 
tokens 
/sentences 
OR_T 37800 9303 1964 1656 650 4.06 1.36 14.31 
OR_E 34574 8437 1785 1511 525 4.1 1.38 16.07 
OR_P 31194 7387 1688 1445 507 4.22 1.43 14.57 
OR_W 48180 11470 2279 1928 845 4.2 1.42 13.57 
OR_D 32644 7745 1737 1499 660 4.21 1.43 11.73 
OR_G 25519 6245 1479 1296 553 4.09 1.4 11.29 
GR_T 24669 6515 1135 926 546 3.79 1.31 11.93 
GR_E 30118 7759 1291 1035 551 3.88 1.33 14.08 
GR_P 13857 3603 757 629 352 3.85 1.36 10.24 
GR_W 27533 6915 1273 1055 610 3.98 1.38 11.34 
GR_D 23695 6091 1033 858 572 3.89 1.37 10.65 
GR_G 26511 6729 1195 1002 503 3.94 1.37 13.38
OR & GR Example 
The Original (OR) 
…I think we may take it that Prescott, the 
American criminal, used to live in the very 
room which our innocent friend now devotes 
to his museum. … (OR_The three Garridebs. txt) 
Graded Readers Level 5 (GR) 
…My guess is that Prescott, the American 
criminal, used to live in Little Ryder Street, in 
the room where old Mr Garrideb keeps his 
collection. … (GR_The three Garridebs. txt) 
11
Methodology 1 
1. OR CorpusとGR Corpusからそれぞれ高頻度 
語彙のリスト作成 (token、全て小文字化) 
2.カイ二乗検定 
3.GRにおけるKeywords(positive, negative)を 
それぞれ、上位50語に限定し、考察 
4.Added WordsとDeleted Wordsの考察 
5.JACET 8000におけるカバー率を比較
Token, Type, and Lemma 
例文 卯城 et al.(2009) 
President Obama's statement “What is 
required of us now is a new era of 
responsibility” requires us to think of how we 
should be responsible for our behavior. 
• 述べ語数(Tokens) 28語 
• 異なり語数(Types) 24語 
→is, us, of →28‐4 
• 見出し語数(Lemmas) 22語 
→require, requires, required→24‐2
Positive 50 Key words 
Rank Frequency Keyness words 有意確率 
1 36 47.761 saint p < 0.05 
2 216 44.256 mr p < 0.05 
3 29 41.138 captain p < 0.05 
4 71 40.572 garrideb p < 0.05 
5 23 32.627 replied p < 0.05 
6 33 32.432 please p < 0.05 
7 119 30.315 house p < 0.05 
8 83 30.183 asked p < 0.05 
9 65 29.96 went p < 0.05 
10 60 28.644 looked p < 0.05 
11 90 27.486 t p < 0.05 
12 112 24.27 about p < 0.05 
13 24 22.727 terrible p < 0.05 
14 257 22.01 said p < 0.05 
15 38 21.588 carriage p < 0.05 
16 15 21.278 tomorrow p < 0.05 
17 94 19.982 did p < 0.05 
18 260 19.885 holmes p < 0.05 
19 14 19.86 decided p < 0.05 
20 1159 19.521 i p < 0.05
Positive 50 Key words 
Rank Frequency Keyness words 有意確率 
21 21 18.755 immediately p < 0.05 
22 17 18.146 unusual p < 0.05 
23 52 17.44 strange p < 0.05 
24 14 16.716 nobody p < 0.05 
25 36 16.671 money p < 0.05 
26 17 15.715 completely p < 0.05 
27 11 15.604 haven p < 0.05 
28 29 14.598 everything p < 0.05 
29 66 14.276 like p < 0.05 
30 45 14.213 frances p < 0.05 
31 10 14.186 schlessinger p < 0.05 
32 620 14.106 he p < 0.05 
33 195 14.093 on p < 0.05 
34 14 14.054 quickly p < 0.05 
35 12 13.921 extremely p < 0.05 
36 27 13.827 hotel p < 0.05 
37 69 13.581 yes p < 0.05 
38 45 13.284 police p < 0.05 
39 18 12.923 almost p < 0.05 
40 320 12.832 but p < 0.05
Positive 50 Key words 
Rank Frequency Keyness words 有意確率 
41 11 12.529 plan p < 0.05 
42 27 12.504 servant p < 0.05 
43 49 12.245 london p < 0.05 
44 38 11.96 told p < 0.05 
45 14 11.787 disappeared p < 0.05 
46 21 11.541 person p < 0.05 
47 26 11.486 peters p < 0.05 
48 59 11.445 old p < 0.05 
49 12 11.364 jumped p < 0.05 
50 8 11.348 owner p < 0.05
分析・考察 Positive Key Words 
• 敬称・特定の登場人物名前の増加。 
e.g. saint (1), mr (2), garrideb (4), holmes (18) 
Immediately (21) やquickly (34)、動作を急がせる語 
彙の増加。 
• unusual (22), strange (23), terrible(13) などネガ 
ティブな意味の表現の増加。 
• I (20), nobody (24), he (32) の代名詞の増加。 
17
分析・考察 Positive Key Words 
●completely (26), extremely (35), almost (39) など 
量的に強調を表す表現の増加。 
●said (14), replied (5), asked (8), told (44) など発話 
を表す動詞の増加。 
18 
●接続詞 but (40)の増加。
Negative 50 Key words 
Rank Frequency Keyness words 有意確率 
1 66 90.675 which p < 0.05 
2 67 22.225 by p < 0.05 
3 429 21.633 it p < 0.05 
4 184 19.596 as p < 0.05 
5 34 18.678 should p < 0.05 
6 11 16.577 might p < 0.05 
7 719 15.673 of p < 0.05 
8 300 15.222 his p < 0.05 
9 32 13.659 may p < 0.05 
10 9 12.975 most p < 0.05 
11 1 11.59 companion p < 0.05 
12 214 10.881 with p < 0.05 
13 6 10.84 yet p < 0.05 
14 3 10.834 passed p < 0.05 
15 65 9.983 some p < 0.05 
16 1 8.817 client p < 0.05 
17 5 8.73 within p < 0.05 
18 23 8.395 say p < 0.05 
19 3 8.235 having p < 0.05 
20 286 7.816 my p < 0.05
Negative 50 Key words 
Rank Frequency Keyness words 有意確率 
21 1 7.439 save p < 0.05 
22 6 6.738 far p < 0.05 
23 2 6.134 god p < 0.05 
24 7 6.042 lay p < 0.05 
25 3 5.725 words p < 0.05 
26 22 5.555 hand p < 0.05 
27 95 5.46 so p < 0.05 
28 1 5.393 nervous p < 0.05 
29 1 5.393 obvious p < 0.05 
30 17 5.359 matter p < 0.05 
31 6 5.103 point p < 0.05 
32 26 5.054 their p < 0.05 
33 79 4.867 our p < 0.05 
34 2 4.854 follow p < 0.05 
35 2 4.854 maid p < 0.05 
36 11 4.848 hour p < 0.05 
37 128 4.797 from p < 0.05 
38 1 4.719 drawn p < 0.05 
39 1 4.719 household p < 0.05 
40 5 4.698 entered p < 0.05
Rank Frequency Keyness words 有意確率 
41 5 4.698 none p < 0.05 
42 25 4.649 over p < 0.05 
43 78 4.568 if p < 0.05 
44 3 4.521 close p < 0.05 
45 3 4.521 nor p < 0.05 
46 3 4.521 step p < 0.05 
47 11 4.407 once p < 0.05 
48 1 4.052 quick p < 0.05 
49 1 4.052 remarked p < 0.05 
50 1 4.052 trap p < 0.05
分析・考察 Negative Key Words 
• which (1), by (2), with (12), of (7) など後置 
修飾を行う機能語の減少。 
• If (43), nor (45), so (27) の接続詞の減少。 
• should (5), might(6), may(9) の助動詞の 
減少。 
• client (16), companion (11) のいくつかの 
名詞の減少。 
• his (8), my (20), our (33), their (32) の所 
有格代名詞の減少。 
22
Added WordsとDeleted Words 
• OR CorpusのNegative Key WordsとGR 
CorpusのPositive Key Wordsを比較 
(Added Words) 
• OR CorpusのPositive Key WordsとGR 
CorpusのNegative Key Wordsを比較 
(Deleted Words)
Added Words and Deleted Words 1 
captain, replied, decided, 
tomorrow, haven, 
schlessinger, owner, policemen 
upon, inspector, however, st, fellow, instant, 
colonel, remarkable, cab, curious, 
morrow, singular, indeed, sprang, den, lodge, 
glanced, lascar, pray, absolutely, evidence, 
eye, features, stair, save, confederate, 
drew, glance, hydraulic, shlessinger
Added Words and Deleted Words 2 
captain vs. colnel 
tomorrow vs. morrow 
on vs. upon 
however
Jacet 8000 下位語 
日本人英語学習者のための教育語彙表 
 ・Level 1 〔順位1000位まで〕  
 中学校英語教科書に頻出する基本語。一般英文の70%をカバー。 
 ・Level 2 〔順位1001~2000位〕 
 高校初級。英字新聞の75%をカバー。英検準2級に相当。 
 ・Level 3 〔順位2001~3000位〕 
 高等学校英語教科書・大学入試センター試験は、ほぼこのレベル 
28 
の単語で作成。 
 英検2級に相当。社会人は教養として必要なレベル。 
 ・Level 4 〔順位3001~4000位〕 
 大学受験、大学一般教養初級。日本人が単語力の有無を問われ 
るレベル。英検2級に相当。
Jacet 8000 上位語 
 ・Level 5 〔順位4001~5000位〕 
 難関大学受験、大学一般教養。英検準1級のレベル。TOEICでは、おおよ 
29 
そ400点から500点前後に相当。 
 ・Level 6 〔順位5001~6000位〕 
 英語専門外の大学生やビジネスマンが目標とするレベル。英検準1 
級、TOEICでは600点に相当。 
 ・Level 7 〔順位6001~7000位〕 
 英語専門の大学生、英語教師、仕事で英語を使うビジネスマンの到達目標 
。英検1級やTOEICでは95%以上の単語をカバー。 
 ・Level 8 〔順位7001~8000位〕 
 日本人英語学習者の最終目標。英語を仕事して使う場合、95%の単語を 
知っていることに。 
 英検1級やTOEICでは95%以上の単語をカバー。
30 
Unknown words 
Jacet 8000から除外された語 
算用数字・アルファベット綴りの数詞・序数詞 
(1, 23, ten, third, 17th) 
大文字で始まる語 
地名、人名、月名、曜日名、 
頭字語 の名詞・形容詞 
(English, Ken, Ninja, March, Friday, KKK) 
実際に収録されていない語 
(opium etc)
Jacet 8000による語彙の分類 
Lemmas GR Corpus OR Corpus Tpokens GR Corpus OR Corpus 
Level 1 826 882 Level 1 29685 40432 
Level 2 436 657 Level 2 2022 2825 
Level 3 184 437 Level 3 592 1222 
Level 4 41 267 Level 4 94 672 
Unknown 407 1312 Unknown 2950 4016 
Level 5 48 267 Level 5 163 595 
Level 6 38 212 Level 6 84 389 
Level 7 37 164 Level 7 113 322 
Level 8 26 152 Level 8 67 270 
Total 2043 4350 Total 31 
35770 50743
Jacet 8000 語彙のカバー率 (Lemma) 
32 
100% 
90% 
80% 
70% 
60% 
50% 
40% 
30% 
20% 
10% 
0% 
GR Corpus OR Corpus 
Level8 
Level7 
Level6 
Level5 
Level4 
Unknown 
Level3 
Level2 
Level1
Jacet 8000 語彙のカバー率(Token) 
33 
100% 
90% 
80% 
70% 
60% 
50% 
40% 
30% 
20% 
10% 
0% 
GR Corpus OR Corpus 
Level8 
Level7 
Level6 
Level5 
Level4 
Unknown 
Level3 
Level2 
Level1
Methodology 2 
1. OR & GR Corpora から、 
高頻度語彙100語 抽出 
2. 各作品における100語の頻度を集計 
3. 統一するため、 
10万語調整頻度に計算 
4. 主成分分析 
5. 結果をグラフにし、考察 
6. 具体例
主成分分析とは 
複数ある変数を最適なバランスで 
まとめて表す視点 
(Tabata, 1995; 石川 et al., 2010) 
ケース:各作品(OR_T, GR_Pなど) 
変数:高頻度語彙 
相関行列を使用 
35
Top 100 Words: 
the, i, a, and, to, of, in, was, he, that, it, you, is, 
his, had, my, have, but, at, with, as, for, me, we, 
holmes, said, this, not, be, there, s, on, him, 
been, which, mr, very, from, her, man, she, out, 
one, no, an, were, what, are, your, all, so, then, 
has, by, would, up, who, when, our, they, will, if, 
well, some, could, into, do, house, now, room, 
see, about, can, us, watson, down, upon, come, 
did, only, two, here, time, must, should, t, came, 
face, door, am, think, or, little, asked, may, 
know, back, them, good, way
Standarized 100,000 word 
the i a and to    … way 
OR_T 5255.834 2547.634 2943.695 2900.878 2526.226    … 149.8608 
OR_E 5153.901 3734.192 2791.696 3018.373 2600.811    … 143.1639 
OR_P 5052.006 2931.244 2120.762 2553.019 2661.083    … 148.5884 
OR_W 5096.204 2357.428 2591.437 2660.773 2270.757    … 190.6743 
OR_D 5463.64 1962.293 2424.009 2488.136 2064.897    … 141.0799 
OR_G 3813.155 2955.195 3034.636 2113.124 2351.446    … 111.217 
GR_T 5156.478 3226.853 2448.516 2545.808 2610.67    … 97.29204 
GR_E 5292.366 4209.529 2355.171 3018.408 2476.99    … 162.4256 
GR_P 4293.381 3995.23 2385.212 2444.842 2474.657    … 59.63029 
GR_W 5116.209 2369.454 2369.454 2520.374 2520.374    … 120.7365 
GR_D 4610.052 2790.295 2443.674 1889.081 2876.95    … 121.3172 
GR_G 4046.332 3042.471 2795.367 2084.942 2409.266    … 108.1081
スクリープロット 
38
主成分分析の結果 
SPSSより、 
11個の主成分に集約し、上位4つ 
の項目を採用 
39 
寄与率・累積寄与率 
成分1 2 3 4 
合計25.244 17.972 12.649 11.179 
分散の % 25.244 17.972 12.649 11.179 
累積 % 25.244 43.215 55.865 67.043
成分行列 
成分行列語彙1 2 3 4 
1 the -0.466 -0.548 -0.552 -0.292 
2 i 0.313 -0.56 0.321 0.582 
3 a -0.324 0.362 0.269 0.453 
4 and -0.492 -0.811 -0.093 0.114 
5 to 0.361 -0.307 -0.002 0.1 
6 of -0.909 0.058 -0.002 0.069 
7 in -0.44 0.553 0.107 -0.413 
8 was 0.554 -0.083 -0.353 0.028 
9 he 0.663 0.07 0.606 -0.087 
10 that -0.782 -0.092 0.201 0.184 
: :     :     :     :     : 
100 way -0.745 -0.143 -0.348 -0.115
Factor 1 and Factor 2 Text Plot 
41 
OR GR 
20C 
works 
19C 
works
Factor 1 and Factor 2 Word Plot 
42 
20C 
works 
19C 
works 
OR GR
Factor 1: Keyword 
• OR: which, by, with, of, from, as, upon, 
could, should, may, if, and, or 
• GR: t, s, must, asked, said, very, mr, 
holmes, man, but, room, house 
• Keywords ✔ 明示化 
✔ 口語表現の増加 
✔ 後置修飾の減少 
43
Factor 1: Explicitness 
"You want me to see him?" 
"What do you say, Mr. Holmes? Don't you think 
it would be wiser? ... (OR The Three Garrideb) 
' You want me to see him? ' said Mr Nathan 
Garrideb, as if this suggestion were a great 
shock to him. 
' Well, what's your opinion, Mr Holmes? ' asked 
Mr John Garrideb. ' Don't you think it would be 
better for him to go? ... (GR The Three Garrideb) 
44
Factor 2: Century 
: up, down, back, out, into, 
at, by, on, upon, way, 
come, room, door 
: may, can, would, should, 
think, see, know 
• 19世紀の作品 
E, P, T 
→場所の提示、物の移動 客観性 
• 20世紀の作品 
G, D 
→モダリティ、知覚動詞 思考
言語学的に書き換えても 
テクストジャンルは、 
一貫性を保持
Factor 2 and Factor 4 Word Plot 
47 
Third person / 
Objective style 
First person / 
Subjective style
Factor 2 and Factor 4 Text Plot 
48 
Third person / 
Objective style 
First person / 
Subjective style
Factor 4 Subjectivity 1 
"And I say east," said my patient. 
"I am for west," remarked the plain-clothes man. "There 
are several quiet little villages up there." 
"And I am for north," said I, "because there are no hills 
there, and our friend says that he did not notice the 
carriage go up any." …(OR The engineer's thumb) 
' And I say east, ' said Hatherley. 
' I think it is to the west, ' said the second policeman. ' 
There are several quiet little villages up there. ' 
' And I think it is to the north, ' I said, ' because there are 
no hills there, and Mr Hatherley says that he did not 
notice the carriage going up any. ' …(GR The engineer's 
thumb)
Factor 4 Subjectivity 2 
… "We agreed to work on our own lines, Mr. Holmes. 
That's what I am doing." 
"Oh, very good," said Holmes. "Don't blame me." (中略) 
"Let us say no more about it." "You're welcome always 
to my news. This fellow is a perfect savage, as strong 
as a cart-horse and as fierce as the devil.… 
  (OR Wisteria Lodge) 
… ' You have your methods, Mr Holmes, and I have 
mine. ' ' Oh, very good, ' said Holmes. ' But don't 
blame me if things go wrong.' (中略) ' Let us say no 
more about it …' ' But let me tell you about the cook. 
He's a wild man, as strong as a carthorse and as 
violent as the devil.....(GR Wisteria House)
まとめ・教育的示唆 1 
ORからGRへの書き換えを比べると、 
語彙を簡略化させるために、Keywordsに変 
化があった 
51 
✔ 口語表現の増加 
✔ 後置修飾の減少 
Added WordsとDeleted Wordsがあった 
Tokenの場合、上位3000語とその他の語は 
JACET8000でのカバー率が98%を超えた
まとめ・教育的示唆 2 
ORからGRへの書き換えを比べると、 
Factor 1 Keyword, 明示化 
52 
✔ 口語表現の増加 
✔ 後置修飾の減少 
Factor 2 19世紀 客観性 / 20世紀 思考 
✔ ジャンルの持つ一貫性を保持 
Factor 4 一人称性の高まり (会話らしさ)
53 
今後の展望 
1. コロケーションの分析 
2. 他のGraded Readersとの比較 
3. 教材としての活用法・実践報告
資料 
Doyle, A. C. (1999). Sherlock Holmes Short Stories. 
(selected and retold by Anthony Laude)Edinburgh: Pearson 
Education Limited. 
資料サイト 
Project Gutenberg 
2011/06/11(http://www.gutenberg.org/wiki/Main_Page) 
Wikilivres 2011/05/21(http://wikilivres.info/wiki/Main_Page) 
Someya Yasumasa Word Level Checker 2012/05/20 (http://someya-net. 
com/wlc/) 
使用プログラム 
Anthony Laurence “AntConc” 2011/06 
(http://www.antlab.sci.waseda.ac.jp/) 
e.Typist NEO Ver. 13.0 (株) メディアドライブ 
2011/05(http://mediadrive.jp/) 
サクラエディタ 2011/06 
(http://sakura-editor.sourceforge.net/)
55 
References 1 
Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus 
analysis toolkit. IWLeL 2004: An Interactive Workshop on Language e-Learning, 
7-13. 
Day, R. R., & Bamford, J. (1998). Extensive Reading in the Second Language 
Classroom. New York: Cambridge University Press. 
Honeyfield. (1977). Simplification. TESOL Quartely, 17, 503-516. 
石川慎一郎. (2008). 『英語コーパスと言語教育―データとしてのテクスト―』 東 
京:大修館書店. 
石川慎一郎,前田忠彦,山崎誠. (編著) (2010). 『言語研究のための統計入門』 東 
京:くろしお出版. 
伊藤亮太.(2011). 「コーパスを基にしたGraded Readersの語彙分析」. 配布資料 
2011年度法政大学英文学会, 2011年10月22日. 
Kobayashi, Y. (2006). A corpus-based approach to the vocabulary control of graded 
readers. Theoria, 35, 89-110. 
Kobayashi, Y., & Kenji, K. (2010). Comparing graded Readers and Authorized English 
Language Textbooks in Junior and Senior Schools ―From the Viewpoint of 
Vocabulary and Readability―. Journal of Culture and Information Science, 5 (1), 
1-14.
56 
Reference 2 
Leech, G., & Mick, S. (2007). Style in Fiction A Linguistic Introduction to English 
Fictional Prose. 2nd edition, Harlow: Pearson Longman. 
Leow, R. P. (1993). To simplify or not to simplify: A look at intake. SSLA, 15, 333-355. 
Nation, P. (2001). Learning vocabulary in another language. Cambridge: Cambridge 
University Press. 
Oh, S-Y. (2001). Two types of input modification and EFL reading comprehension: 
Simplification versus elaboration. TESOL Quarterly, 35, 69-96. 
Qian, D. D. (2002). Investigating the Relationship Between Vocabulary Knowledge and 
Academic Reading Performance: An Assessment Perspective. Language Learning 52 
(3), 513-536. 
斉藤俊雄,中村純作,赤野一郎. (編著) (2005). 『英語コーパス言語学―基礎と実践― 
改訂新版』 東京:研究社. 
Semino, E. (2011). Using Corpus Linguistic Methods to Compare a Simplified Version of 
Shakespeare’s Romeo and Juliet with the Original Play. Paper presented at 
Corpus Linguistics 2011 DISCOUSE AND CORPUS LINGUISTICS, Birmingham 20 
July. 2011.
57 
Reference 3 
Shmitt, N., Xiangyng, J., & Willam, G. (2011). The Percentage of Words Known in a 
Text and Reading Comprehension. The Modern Language Journal 95, 26-43. 
Stephen, K. (1989). We Acquire Vocabulary and Spelling by Reading: Additional 
Evidence for the Input Hypothesis., The Modern Language Journal, 73 (4), 440- 
464. 
染谷泰正. (2009). 『オンライン版「英文語彙難易度解析プログラム」(Word Level 
Checker)の概要とその応用可能性について』 (http://someya-net.com/wlc/). 
Tabata, T. (1995). Narrative Style and the Frequencies of Very Common Words: A 
Corpus-Based Approach to Dickens's first person and third person narratives. 
English Corpus Studies, 2, 91-109. 
卯城祐司. (編著) (2009). 『英語リーディングの科学―「読めたつもり」の謎を解く 
』東京:研究社. 
卯城祐司. (編著) (2012). 『英語リーディングテストの考え方と作り方』東京:研究 
社  
Yano, Y., Long, M. H., & Ross, S. (1994). The effects of simplified and elaborated 
texts on foreign language reading comprehension. Language Learning, 44, 189- 
219.  

More Related Content

Viewers also liked

日本語総まとめ N2 漢字
日本語総まとめ N2 漢字日本語総まとめ N2 漢字
日本語総まとめ N2 漢字sofyanasrun
 
6000 most common korean words
6000 most common korean words6000 most common korean words
6000 most common korean wordsShinichi Kudo
 
Kanji isn't that hard (kanji wa muzukashiku nai)
Kanji isn't that hard (kanji wa muzukashiku nai)Kanji isn't that hard (kanji wa muzukashiku nai)
Kanji isn't that hard (kanji wa muzukashiku nai)Working in Japan
 
Nihongo sou matome n1 goi
Nihongo sou matome n1   goiNihongo sou matome n1   goi
Nihongo sou matome n1 goiMèo Mỡ
 
Kanji is not that hard!
Kanji is not that hard!Kanji is not that hard!
Kanji is not that hard!Tung Nguyen
 
イラストでわかる日本語表現 中級
イラストでわかる日本語表現 中級イラストでわかる日本語表現 中級
イラストでわかる日本語表現 中級Working in Japan
 
Minna no Nihongo Shokyuu 1 - Choukai
Minna no Nihongo Shokyuu 1 - ChoukaiMinna no Nihongo Shokyuu 1 - Choukai
Minna no Nihongo Shokyuu 1 - ChoukaiArtur Filipe Segumdo
 

Viewers also liked (10)

日本語総まとめ N2 漢字
日本語総まとめ N2 漢字日本語総まとめ N2 漢字
日本語総まとめ N2 漢字
 
Vocabulary n4
Vocabulary n4Vocabulary n4
Vocabulary n4
 
6000 most common korean words
6000 most common korean words6000 most common korean words
6000 most common korean words
 
Kanji isn't that hard (kanji wa muzukashiku nai)
Kanji isn't that hard (kanji wa muzukashiku nai)Kanji isn't that hard (kanji wa muzukashiku nai)
Kanji isn't that hard (kanji wa muzukashiku nai)
 
Nihongo sou matome n1 goi
Nihongo sou matome n1   goiNihongo sou matome n1   goi
Nihongo sou matome n1 goi
 
Kanji is not that hard!
Kanji is not that hard!Kanji is not that hard!
Kanji is not that hard!
 
イラストでわかる日本語表現 中級
イラストでわかる日本語表現 中級イラストでわかる日本語表現 中級
イラストでわかる日本語表現 中級
 
N3 tanki master
N3 tanki masterN3 tanki master
N3 tanki master
 
Minna no Nihongo Shokyuu 1 - Choukai
Minna no Nihongo Shokyuu 1 - ChoukaiMinna no Nihongo Shokyuu 1 - Choukai
Minna no Nihongo Shokyuu 1 - Choukai
 
Minna No Nihongo- Chapter 1
Minna No Nihongo- Chapter 1Minna No Nihongo- Chapter 1
Minna No Nihongo- Chapter 1
 

Recently uploaded

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationYukiTerazawa
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptyuitoakatsukijp
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ssusere0a682
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024koheioishi1
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ssusere0a682
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2Tokyo Institute of Technology
 

Recently uploaded (6)

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 

2014メソ研graded readers における語彙の簡略化 slideshare

  • 1. 09/15/14 Graded Readersにおける 語彙の簡略化 狭山ヶ丘高等学校 伊藤亮太 LET関西支部メソドロジー研究部会 2014年度第2回研究会@信州大学
  • 2. Introduction 研究目的 原文 (OR) と学習者のために簡略化さ れたGraded Readers (GR) の語彙の特 徴を明らかにする。 日本人の英語教師が学習者用に英文を 書き換えるときのヒントを明らかにす る。 2
  • 3. 3 Outline Outline Graded Readers Review of    Literature Research Question Style Data Methods Result & Discussion ✔ Keywords ✔ PCA ✔ Examples Conclusion
  • 4. Graded Readers Penguin Readers は、 語彙と文法に統制をかけて、各レベル ごとに英語のレベルを設けたシリーズ Level 5 Headwords 2300, CEFR B2, TOEIC 600, TOEFL iBT 62-63, 英検 2級-準1級 Sherlock Holmes Short Stories 理由:高校卒業の学習レベルに対応、    Level 5、e-text化 4
  • 5. Review of Literature 1 Krashen (1989) インプット仮説 Day and Bamford (1998) 多読の役割 Nation (2001), Shmitt et al. (2011) 98%の語彙理解→60%の読解 Qian (2002) 語彙知識の広さと深さと読解 の関係 Yano et al. (1994), Oh (2001) Baseline vs. Linguistic Simplification vs. Elaboration 5
  • 6. Review of Literature 2 Kobayashi (2006), Kobayashi and Kitao (2010) Penguin Readersと教科書の語彙 の関係 Semino (2011) Shakespeareの原文と簡略 化された英文の語彙 伊藤 (2011) ORとGRの語彙分析 6
  • 7. Research Questions ORからGRに書き換えにおいて、 1. 語彙は簡略化されているか。 2. どのような語彙に違いがあるか。 3. 各作品の文体に違いはあるか。 4. どのような違いがあるか。 7
  • 8. 8 Styleとは 単語→句→節→文→段落→小説 でも、今日は… →単語に注目
  • 9. 分析のテキスト 9 Holmes 短編作品 ● 1891“The Man with the Twisted Lips”(T) ● 1891“The Engineer’s Thumb”(E) ● 1892“The Resident Patient”(P) ● 1917“Wisteria Lodge”(W) ● 1917“Disappearance of Lady Fances Carfax”(D) ● 1927“The Three Garridebs”(G)
  • 10. Holmes Works Data works letters tokens types lemmas sentences letters /tokens syllables /tokens tokens /sentences OR_T 37800 9303 1964 1656 650 4.06 1.36 14.31 OR_E 34574 8437 1785 1511 525 4.1 1.38 16.07 OR_P 31194 7387 1688 1445 507 4.22 1.43 14.57 OR_W 48180 11470 2279 1928 845 4.2 1.42 13.57 OR_D 32644 7745 1737 1499 660 4.21 1.43 11.73 OR_G 25519 6245 1479 1296 553 4.09 1.4 11.29 GR_T 24669 6515 1135 926 546 3.79 1.31 11.93 GR_E 30118 7759 1291 1035 551 3.88 1.33 14.08 GR_P 13857 3603 757 629 352 3.85 1.36 10.24 GR_W 27533 6915 1273 1055 610 3.98 1.38 11.34 GR_D 23695 6091 1033 858 572 3.89 1.37 10.65 GR_G 26511 6729 1195 1002 503 3.94 1.37 13.38
  • 11. OR & GR Example The Original (OR) …I think we may take it that Prescott, the American criminal, used to live in the very room which our innocent friend now devotes to his museum. … (OR_The three Garridebs. txt) Graded Readers Level 5 (GR) …My guess is that Prescott, the American criminal, used to live in Little Ryder Street, in the room where old Mr Garrideb keeps his collection. … (GR_The three Garridebs. txt) 11
  • 12. Methodology 1 1. OR CorpusとGR Corpusからそれぞれ高頻度 語彙のリスト作成 (token、全て小文字化) 2.カイ二乗検定 3.GRにおけるKeywords(positive, negative)を それぞれ、上位50語に限定し、考察 4.Added WordsとDeleted Wordsの考察 5.JACET 8000におけるカバー率を比較
  • 13. Token, Type, and Lemma 例文 卯城 et al.(2009) President Obama's statement “What is required of us now is a new era of responsibility” requires us to think of how we should be responsible for our behavior. • 述べ語数(Tokens) 28語 • 異なり語数(Types) 24語 →is, us, of →28‐4 • 見出し語数(Lemmas) 22語 →require, requires, required→24‐2
  • 14. Positive 50 Key words Rank Frequency Keyness words 有意確率 1 36 47.761 saint p < 0.05 2 216 44.256 mr p < 0.05 3 29 41.138 captain p < 0.05 4 71 40.572 garrideb p < 0.05 5 23 32.627 replied p < 0.05 6 33 32.432 please p < 0.05 7 119 30.315 house p < 0.05 8 83 30.183 asked p < 0.05 9 65 29.96 went p < 0.05 10 60 28.644 looked p < 0.05 11 90 27.486 t p < 0.05 12 112 24.27 about p < 0.05 13 24 22.727 terrible p < 0.05 14 257 22.01 said p < 0.05 15 38 21.588 carriage p < 0.05 16 15 21.278 tomorrow p < 0.05 17 94 19.982 did p < 0.05 18 260 19.885 holmes p < 0.05 19 14 19.86 decided p < 0.05 20 1159 19.521 i p < 0.05
  • 15. Positive 50 Key words Rank Frequency Keyness words 有意確率 21 21 18.755 immediately p < 0.05 22 17 18.146 unusual p < 0.05 23 52 17.44 strange p < 0.05 24 14 16.716 nobody p < 0.05 25 36 16.671 money p < 0.05 26 17 15.715 completely p < 0.05 27 11 15.604 haven p < 0.05 28 29 14.598 everything p < 0.05 29 66 14.276 like p < 0.05 30 45 14.213 frances p < 0.05 31 10 14.186 schlessinger p < 0.05 32 620 14.106 he p < 0.05 33 195 14.093 on p < 0.05 34 14 14.054 quickly p < 0.05 35 12 13.921 extremely p < 0.05 36 27 13.827 hotel p < 0.05 37 69 13.581 yes p < 0.05 38 45 13.284 police p < 0.05 39 18 12.923 almost p < 0.05 40 320 12.832 but p < 0.05
  • 16. Positive 50 Key words Rank Frequency Keyness words 有意確率 41 11 12.529 plan p < 0.05 42 27 12.504 servant p < 0.05 43 49 12.245 london p < 0.05 44 38 11.96 told p < 0.05 45 14 11.787 disappeared p < 0.05 46 21 11.541 person p < 0.05 47 26 11.486 peters p < 0.05 48 59 11.445 old p < 0.05 49 12 11.364 jumped p < 0.05 50 8 11.348 owner p < 0.05
  • 17. 分析・考察 Positive Key Words • 敬称・特定の登場人物名前の増加。 e.g. saint (1), mr (2), garrideb (4), holmes (18) Immediately (21) やquickly (34)、動作を急がせる語 彙の増加。 • unusual (22), strange (23), terrible(13) などネガ ティブな意味の表現の増加。 • I (20), nobody (24), he (32) の代名詞の増加。 17
  • 18. 分析・考察 Positive Key Words ●completely (26), extremely (35), almost (39) など 量的に強調を表す表現の増加。 ●said (14), replied (5), asked (8), told (44) など発話 を表す動詞の増加。 18 ●接続詞 but (40)の増加。
  • 19. Negative 50 Key words Rank Frequency Keyness words 有意確率 1 66 90.675 which p < 0.05 2 67 22.225 by p < 0.05 3 429 21.633 it p < 0.05 4 184 19.596 as p < 0.05 5 34 18.678 should p < 0.05 6 11 16.577 might p < 0.05 7 719 15.673 of p < 0.05 8 300 15.222 his p < 0.05 9 32 13.659 may p < 0.05 10 9 12.975 most p < 0.05 11 1 11.59 companion p < 0.05 12 214 10.881 with p < 0.05 13 6 10.84 yet p < 0.05 14 3 10.834 passed p < 0.05 15 65 9.983 some p < 0.05 16 1 8.817 client p < 0.05 17 5 8.73 within p < 0.05 18 23 8.395 say p < 0.05 19 3 8.235 having p < 0.05 20 286 7.816 my p < 0.05
  • 20. Negative 50 Key words Rank Frequency Keyness words 有意確率 21 1 7.439 save p < 0.05 22 6 6.738 far p < 0.05 23 2 6.134 god p < 0.05 24 7 6.042 lay p < 0.05 25 3 5.725 words p < 0.05 26 22 5.555 hand p < 0.05 27 95 5.46 so p < 0.05 28 1 5.393 nervous p < 0.05 29 1 5.393 obvious p < 0.05 30 17 5.359 matter p < 0.05 31 6 5.103 point p < 0.05 32 26 5.054 their p < 0.05 33 79 4.867 our p < 0.05 34 2 4.854 follow p < 0.05 35 2 4.854 maid p < 0.05 36 11 4.848 hour p < 0.05 37 128 4.797 from p < 0.05 38 1 4.719 drawn p < 0.05 39 1 4.719 household p < 0.05 40 5 4.698 entered p < 0.05
  • 21. Rank Frequency Keyness words 有意確率 41 5 4.698 none p < 0.05 42 25 4.649 over p < 0.05 43 78 4.568 if p < 0.05 44 3 4.521 close p < 0.05 45 3 4.521 nor p < 0.05 46 3 4.521 step p < 0.05 47 11 4.407 once p < 0.05 48 1 4.052 quick p < 0.05 49 1 4.052 remarked p < 0.05 50 1 4.052 trap p < 0.05
  • 22. 分析・考察 Negative Key Words • which (1), by (2), with (12), of (7) など後置 修飾を行う機能語の減少。 • If (43), nor (45), so (27) の接続詞の減少。 • should (5), might(6), may(9) の助動詞の 減少。 • client (16), companion (11) のいくつかの 名詞の減少。 • his (8), my (20), our (33), their (32) の所 有格代名詞の減少。 22
  • 23. Added WordsとDeleted Words • OR CorpusのNegative Key WordsとGR CorpusのPositive Key Wordsを比較 (Added Words) • OR CorpusのPositive Key WordsとGR CorpusのNegative Key Wordsを比較 (Deleted Words)
  • 24.
  • 25.
  • 26. Added Words and Deleted Words 1 captain, replied, decided, tomorrow, haven, schlessinger, owner, policemen upon, inspector, however, st, fellow, instant, colonel, remarkable, cab, curious, morrow, singular, indeed, sprang, den, lodge, glanced, lascar, pray, absolutely, evidence, eye, features, stair, save, confederate, drew, glance, hydraulic, shlessinger
  • 27. Added Words and Deleted Words 2 captain vs. colnel tomorrow vs. morrow on vs. upon however
  • 28. Jacet 8000 下位語 日本人英語学習者のための教育語彙表  ・Level 1 〔順位1000位まで〕   中学校英語教科書に頻出する基本語。一般英文の70%をカバー。  ・Level 2 〔順位1001~2000位〕  高校初級。英字新聞の75%をカバー。英検準2級に相当。  ・Level 3 〔順位2001~3000位〕  高等学校英語教科書・大学入試センター試験は、ほぼこのレベル 28 の単語で作成。  英検2級に相当。社会人は教養として必要なレベル。  ・Level 4 〔順位3001~4000位〕  大学受験、大学一般教養初級。日本人が単語力の有無を問われ るレベル。英検2級に相当。
  • 29. Jacet 8000 上位語  ・Level 5 〔順位4001~5000位〕  難関大学受験、大学一般教養。英検準1級のレベル。TOEICでは、おおよ 29 そ400点から500点前後に相当。  ・Level 6 〔順位5001~6000位〕  英語専門外の大学生やビジネスマンが目標とするレベル。英検準1 級、TOEICでは600点に相当。  ・Level 7 〔順位6001~7000位〕  英語専門の大学生、英語教師、仕事で英語を使うビジネスマンの到達目標 。英検1級やTOEICでは95%以上の単語をカバー。  ・Level 8 〔順位7001~8000位〕  日本人英語学習者の最終目標。英語を仕事して使う場合、95%の単語を 知っていることに。  英検1級やTOEICでは95%以上の単語をカバー。
  • 30. 30 Unknown words Jacet 8000から除外された語 算用数字・アルファベット綴りの数詞・序数詞 (1, 23, ten, third, 17th) 大文字で始まる語 地名、人名、月名、曜日名、 頭字語 の名詞・形容詞 (English, Ken, Ninja, March, Friday, KKK) 実際に収録されていない語 (opium etc)
  • 31. Jacet 8000による語彙の分類 Lemmas GR Corpus OR Corpus Tpokens GR Corpus OR Corpus Level 1 826 882 Level 1 29685 40432 Level 2 436 657 Level 2 2022 2825 Level 3 184 437 Level 3 592 1222 Level 4 41 267 Level 4 94 672 Unknown 407 1312 Unknown 2950 4016 Level 5 48 267 Level 5 163 595 Level 6 38 212 Level 6 84 389 Level 7 37 164 Level 7 113 322 Level 8 26 152 Level 8 67 270 Total 2043 4350 Total 31 35770 50743
  • 32. Jacet 8000 語彙のカバー率 (Lemma) 32 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% GR Corpus OR Corpus Level8 Level7 Level6 Level5 Level4 Unknown Level3 Level2 Level1
  • 33. Jacet 8000 語彙のカバー率(Token) 33 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% GR Corpus OR Corpus Level8 Level7 Level6 Level5 Level4 Unknown Level3 Level2 Level1
  • 34. Methodology 2 1. OR & GR Corpora から、 高頻度語彙100語 抽出 2. 各作品における100語の頻度を集計 3. 統一するため、 10万語調整頻度に計算 4. 主成分分析 5. 結果をグラフにし、考察 6. 具体例
  • 35. 主成分分析とは 複数ある変数を最適なバランスで まとめて表す視点 (Tabata, 1995; 石川 et al., 2010) ケース:各作品(OR_T, GR_Pなど) 変数:高頻度語彙 相関行列を使用 35
  • 36. Top 100 Words: the, i, a, and, to, of, in, was, he, that, it, you, is, his, had, my, have, but, at, with, as, for, me, we, holmes, said, this, not, be, there, s, on, him, been, which, mr, very, from, her, man, she, out, one, no, an, were, what, are, your, all, so, then, has, by, would, up, who, when, our, they, will, if, well, some, could, into, do, house, now, room, see, about, can, us, watson, down, upon, come, did, only, two, here, time, must, should, t, came, face, door, am, think, or, little, asked, may, know, back, them, good, way
  • 37. Standarized 100,000 word the i a and to    … way OR_T 5255.834 2547.634 2943.695 2900.878 2526.226    … 149.8608 OR_E 5153.901 3734.192 2791.696 3018.373 2600.811    … 143.1639 OR_P 5052.006 2931.244 2120.762 2553.019 2661.083    … 148.5884 OR_W 5096.204 2357.428 2591.437 2660.773 2270.757    … 190.6743 OR_D 5463.64 1962.293 2424.009 2488.136 2064.897    … 141.0799 OR_G 3813.155 2955.195 3034.636 2113.124 2351.446    … 111.217 GR_T 5156.478 3226.853 2448.516 2545.808 2610.67    … 97.29204 GR_E 5292.366 4209.529 2355.171 3018.408 2476.99    … 162.4256 GR_P 4293.381 3995.23 2385.212 2444.842 2474.657    … 59.63029 GR_W 5116.209 2369.454 2369.454 2520.374 2520.374    … 120.7365 GR_D 4610.052 2790.295 2443.674 1889.081 2876.95    … 121.3172 GR_G 4046.332 3042.471 2795.367 2084.942 2409.266    … 108.1081
  • 39. 主成分分析の結果 SPSSより、 11個の主成分に集約し、上位4つ の項目を採用 39 寄与率・累積寄与率 成分1 2 3 4 合計25.244 17.972 12.649 11.179 分散の % 25.244 17.972 12.649 11.179 累積 % 25.244 43.215 55.865 67.043
  • 40. 成分行列 成分行列語彙1 2 3 4 1 the -0.466 -0.548 -0.552 -0.292 2 i 0.313 -0.56 0.321 0.582 3 a -0.324 0.362 0.269 0.453 4 and -0.492 -0.811 -0.093 0.114 5 to 0.361 -0.307 -0.002 0.1 6 of -0.909 0.058 -0.002 0.069 7 in -0.44 0.553 0.107 -0.413 8 was 0.554 -0.083 -0.353 0.028 9 he 0.663 0.07 0.606 -0.087 10 that -0.782 -0.092 0.201 0.184 : :     :     :     :     : 100 way -0.745 -0.143 -0.348 -0.115
  • 41. Factor 1 and Factor 2 Text Plot 41 OR GR 20C works 19C works
  • 42. Factor 1 and Factor 2 Word Plot 42 20C works 19C works OR GR
  • 43. Factor 1: Keyword • OR: which, by, with, of, from, as, upon, could, should, may, if, and, or • GR: t, s, must, asked, said, very, mr, holmes, man, but, room, house • Keywords ✔ 明示化 ✔ 口語表現の増加 ✔ 後置修飾の減少 43
  • 44. Factor 1: Explicitness "You want me to see him?" "What do you say, Mr. Holmes? Don't you think it would be wiser? ... (OR The Three Garrideb) ' You want me to see him? ' said Mr Nathan Garrideb, as if this suggestion were a great shock to him. ' Well, what's your opinion, Mr Holmes? ' asked Mr John Garrideb. ' Don't you think it would be better for him to go? ... (GR The Three Garrideb) 44
  • 45. Factor 2: Century : up, down, back, out, into, at, by, on, upon, way, come, room, door : may, can, would, should, think, see, know • 19世紀の作品 E, P, T →場所の提示、物の移動 客観性 • 20世紀の作品 G, D →モダリティ、知覚動詞 思考
  • 47. Factor 2 and Factor 4 Word Plot 47 Third person / Objective style First person / Subjective style
  • 48. Factor 2 and Factor 4 Text Plot 48 Third person / Objective style First person / Subjective style
  • 49. Factor 4 Subjectivity 1 "And I say east," said my patient. "I am for west," remarked the plain-clothes man. "There are several quiet little villages up there." "And I am for north," said I, "because there are no hills there, and our friend says that he did not notice the carriage go up any." …(OR The engineer's thumb) ' And I say east, ' said Hatherley. ' I think it is to the west, ' said the second policeman. ' There are several quiet little villages up there. ' ' And I think it is to the north, ' I said, ' because there are no hills there, and Mr Hatherley says that he did not notice the carriage going up any. ' …(GR The engineer's thumb)
  • 50. Factor 4 Subjectivity 2 … "We agreed to work on our own lines, Mr. Holmes. That's what I am doing." "Oh, very good," said Holmes. "Don't blame me." (中略) "Let us say no more about it." "You're welcome always to my news. This fellow is a perfect savage, as strong as a cart-horse and as fierce as the devil.…   (OR Wisteria Lodge) … ' You have your methods, Mr Holmes, and I have mine. ' ' Oh, very good, ' said Holmes. ' But don't blame me if things go wrong.' (中略) ' Let us say no more about it …' ' But let me tell you about the cook. He's a wild man, as strong as a carthorse and as violent as the devil.....(GR Wisteria House)
  • 51. まとめ・教育的示唆 1 ORからGRへの書き換えを比べると、 語彙を簡略化させるために、Keywordsに変 化があった 51 ✔ 口語表現の増加 ✔ 後置修飾の減少 Added WordsとDeleted Wordsがあった Tokenの場合、上位3000語とその他の語は JACET8000でのカバー率が98%を超えた
  • 52. まとめ・教育的示唆 2 ORからGRへの書き換えを比べると、 Factor 1 Keyword, 明示化 52 ✔ 口語表現の増加 ✔ 後置修飾の減少 Factor 2 19世紀 客観性 / 20世紀 思考 ✔ ジャンルの持つ一貫性を保持 Factor 4 一人称性の高まり (会話らしさ)
  • 53. 53 今後の展望 1. コロケーションの分析 2. 他のGraded Readersとの比較 3. 教材としての活用法・実践報告
  • 54. 資料 Doyle, A. C. (1999). Sherlock Holmes Short Stories. (selected and retold by Anthony Laude)Edinburgh: Pearson Education Limited. 資料サイト Project Gutenberg 2011/06/11(http://www.gutenberg.org/wiki/Main_Page) Wikilivres 2011/05/21(http://wikilivres.info/wiki/Main_Page) Someya Yasumasa Word Level Checker 2012/05/20 (http://someya-net. com/wlc/) 使用プログラム Anthony Laurence “AntConc” 2011/06 (http://www.antlab.sci.waseda.ac.jp/) e.Typist NEO Ver. 13.0 (株) メディアドライブ 2011/05(http://mediadrive.jp/) サクラエディタ 2011/06 (http://sakura-editor.sourceforge.net/)
  • 55. 55 References 1 Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. IWLeL 2004: An Interactive Workshop on Language e-Learning, 7-13. Day, R. R., & Bamford, J. (1998). Extensive Reading in the Second Language Classroom. New York: Cambridge University Press. Honeyfield. (1977). Simplification. TESOL Quartely, 17, 503-516. 石川慎一郎. (2008). 『英語コーパスと言語教育―データとしてのテクスト―』 東 京:大修館書店. 石川慎一郎,前田忠彦,山崎誠. (編著) (2010). 『言語研究のための統計入門』 東 京:くろしお出版. 伊藤亮太.(2011). 「コーパスを基にしたGraded Readersの語彙分析」. 配布資料 2011年度法政大学英文学会, 2011年10月22日. Kobayashi, Y. (2006). A corpus-based approach to the vocabulary control of graded readers. Theoria, 35, 89-110. Kobayashi, Y., & Kenji, K. (2010). Comparing graded Readers and Authorized English Language Textbooks in Junior and Senior Schools ―From the Viewpoint of Vocabulary and Readability―. Journal of Culture and Information Science, 5 (1), 1-14.
  • 56. 56 Reference 2 Leech, G., & Mick, S. (2007). Style in Fiction A Linguistic Introduction to English Fictional Prose. 2nd edition, Harlow: Pearson Longman. Leow, R. P. (1993). To simplify or not to simplify: A look at intake. SSLA, 15, 333-355. Nation, P. (2001). Learning vocabulary in another language. Cambridge: Cambridge University Press. Oh, S-Y. (2001). Two types of input modification and EFL reading comprehension: Simplification versus elaboration. TESOL Quarterly, 35, 69-96. Qian, D. D. (2002). Investigating the Relationship Between Vocabulary Knowledge and Academic Reading Performance: An Assessment Perspective. Language Learning 52 (3), 513-536. 斉藤俊雄,中村純作,赤野一郎. (編著) (2005). 『英語コーパス言語学―基礎と実践― 改訂新版』 東京:研究社. Semino, E. (2011). Using Corpus Linguistic Methods to Compare a Simplified Version of Shakespeare’s Romeo and Juliet with the Original Play. Paper presented at Corpus Linguistics 2011 DISCOUSE AND CORPUS LINGUISTICS, Birmingham 20 July. 2011.
  • 57. 57 Reference 3 Shmitt, N., Xiangyng, J., & Willam, G. (2011). The Percentage of Words Known in a Text and Reading Comprehension. The Modern Language Journal 95, 26-43. Stephen, K. (1989). We Acquire Vocabulary and Spelling by Reading: Additional Evidence for the Input Hypothesis., The Modern Language Journal, 73 (4), 440- 464. 染谷泰正. (2009). 『オンライン版「英文語彙難易度解析プログラム」(Word Level Checker)の概要とその応用可能性について』 (http://someya-net.com/wlc/). Tabata, T. (1995). Narrative Style and the Frequencies of Very Common Words: A Corpus-Based Approach to Dickens's first person and third person narratives. English Corpus Studies, 2, 91-109. 卯城祐司. (編著) (2009). 『英語リーディングの科学―「読めたつもり」の謎を解く 』東京:研究社. 卯城祐司. (編著) (2012). 『英語リーディングテストの考え方と作り方』東京:研究 社  Yano, Y., Long, M. H., & Ross, S. (1994). The effects of simplified and elaborated texts on foreign language reading comprehension. Language Learning, 44, 189- 219.