外国語としての音声言語理解と
ワーキングメモリ
近畿大学 経済学部 菅井康祐
2010年10月9日
ことばの科学会オープンフォーラム2010:
第2回年次大会
於:関西学院大学梅田キャンパス
0. 本発表の流れ
1. 音韻ループと音声言語のボトムアップ処理
の概観
2. 菅井他のポーズを中心としたリスニング研
究の紹介
3. 教育・研究における問題点
1.1 ボトムアップ処理の概念図
1.2 音韻ループの概念図
(Baddeley, 1992, Gathercole and Baddeley, 1993より)
Phonological
Short-term store
Speech inputs
Subvocal
rehearsal
Non-speech Inputs
1.3 音韻ループ容量についての諸説
Magical number 7±2(Miller, 1956)
7±2のchunk(数字、文字、単語など)
Magical number 4(Cowan, 2001)
2秒(Baddeley, 1992)
330 ms以内に連続する要素7±2(河野, 1994)
河野はこれをPerceptual Sense Unit(PSU)と定義
1.4 疑問点
(1)日本語母語EFL学習者が音韻ループに保持
できる容量は?
(2)発話速度は容量に影響を及ぼすのか?
(3)超分節素(super-segmental features)はどの
ような働きをするのか?
1.5 自身の研究の着想
・音韻ループに保持できる容量ごとにポーズを
置くことで、学習者の理解が高まるのでは?
学習者の理解を助けるポーズの間隔がわか
れば学習者の保持容量の実態にせまれるか
も?
2.1 菅井、山根、神崎(2006)
実験1: 文構造を統制した文復唱課題
(LL機器を用いて録音した音声を分析)
type 1: S V O / 前置詞句 (7/3(音節数))
type 2: S (前置詞句) / V C (7/3)
type 3: S (分詞句)/ V C (7/3)
type 4: S V C / 関係詞節 (6/4)
type 5: S V O / 分詞句 (5/5)
①文中(9~14音節)のポーズが1>2>0箇所の順に正
解率が高い。
②15文の中で語数が最も少なく(7語)ポーズが1つもな
い刺激文の聞き取りが1番難しかった。
③主部(名詞句+前置詞句)+述部と主部が長い文の正
解率が他の構文よりも低かった。
④ポーズが置かれるとその前の単語の聞き取り正解率
が上昇した。
⑤1文レベルにおいてはポーズの長さは一部のタイプの
構文を除いてリスニングに影響を及ぼさない
要因が多すぎ、はっきりとしない結果
2.2 Sugai, Kanzaki, & Yamane(2007)
音声の長さに焦点を絞った調査
発話速度とポーズの長さを厳密に統制
発話速度 or 調音速度 or ポーズ
どの要素がリスニングに影響?
実験1(文章聞き取り課題)
<課題>英検準2級、3級の問題の中から5問ずつ
選出し、合計10問作成。
選定基準
・語彙レベルの低いもの
(Jacet 8000 2000語レベル)
・7 ± 2音節(9音節)以内の自然な位置にポーズ
を置けるもの(Miller 1956)
音声編集
・文末を含む96カ所のポーズを
200 ms、450 ms、700 msに編集
ポーズ長3種類、調音速度3種類(Fast, Normal, Slow)に設定
計算例)Fastの調音長+全ポーズ長
– (93 sec) (450 msec×96)
– = Normal の調音長+全ポーズ長
– (117 sec) (200 msec×96)
– =136.2 sec
ポーズ長
(msec)
調音長
(sec)
ポーズ長
合計(sec)
本文合計
(msec)
WPM
fast 200 93 19.2 112.2 212.8
450 93 43.2 136.2 175.3
700 93 67.2 160.2 149.1
normal 200 117 19.2 136.2 175.3
450 117 43.2 160.2 149.1
700 117 67.2 184.2 129.6
slow 200 141 19.2 160.2 149.1
450 141 43.2 184.2 129.6
700 141 67.2 208.2 114.7
(
実験方法
•・初級から中級の大学生英語学習者480名
• 9種類の課題に対し、被験者のレベルが概ねそろ
うように2クラスずつ選択。(各課題に対し約50~
60名)
•・それぞれの授業教室備え付けのスピーカから流
される音声を聞く形でのリスニングテスト
•・レベル統制用のテストを行い、少し休憩をおいた
後本課題を実施。
speed Fast Normal Slow
pause (ms) 200 450 700 200 450 700 200 450 700
Total
Mean score 4.67 5.96 5.79 5.10 6.06 5.56 5.78 5.10 6.00 5.56
SD 2.04 1.81 1.74 1.54 1.76 2.31 1.88 1.74 2.08 1.88
n 27 27 38 31 48 32 36 39 32 310
実験1結果
1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
type
0.00
2.00
4.00
6.00
8.00
10.00
post
20
speed
1.00
2.00
3.00
実験1結果
Two-way ANCOVA
従属変数: Post-test
重回帰分析結果Source F
9 11.67 3.44 0 0.09
Intercept 77.2 1 77.2 22.75 0 0.07
pre-test 42.58 1 42.58 12.55 0 0.04
speed 2.9 2 1.45 0.43 0.65 0
pause 18.3 2 9.15 2.7 0.07 0.02
Error 1017.91 300 3.39
Total 10811 310
1122.97 309
Type III
Sum
of Squares df
Mean
Square p η2
Corrected
Model 105.066(b)
Corrected
Total
速度別比較
4.5
5
5.5
6
6.5
Fast Normal Slow
ポーズ長比較
4.5
5
5.5
6
6.5
200 450 700
実験1のまとめ
・調音速度はリスニングに
ほとんどプラスの影響を及ぼさない
・ポーズ長はリスニングを助ける可能性
がある(200 ms と 450 msの間に有意傾向)
実験2目的
実験1の結果をふまえ
ポーズ長のみに絞って更なる調査を行った
。
・長いポーズは本当にリスニングを助ける
のか
・どのぐらいの長さのポーズが効果がある
のか
実験方法
実験1と同様に課題作成
•
音声編集・分析ソフトpraatを用い
ポーズ長を6種類に編集
(200, 300, 400, 500, 600, 700 ms)
•
実験2結果
200 300 400 500 600 700
Mean score 5.56 5.64 5.83 7.11 7.07 6.73
SD 2.21 2.35 2.12 1.8 1.89 2.16
n 59 55 53 57 54 56
pause (ms)
200.00 300.00 400.00 500.00 600.00 700.00
pause
0.00
2.00
4.00
6.00
8.00
10.00
post
192
226
実験2結果グラフ
Two-way ANCOVA
Sauce F
6 109.29 37.88 0 0.41
Intercept 107.34 1 107.34 37.2 0 0.07
pre-test 502.1 1 502.1 174.02 0 0.31
pause 86.72 5 17.35 6.01 0 0.05
Error 943.49 327 2.89
Total 14891 334
1599.24 333
Type III Sum
of Squares df
Mean
Square p η2
Corrected
Model 655.743(b)
Corrected
Total
2.3 菅井、神崎、山根の調査のまとめ
初中級・中級の学習者にとって
リスニングを助けるのは、
発話速度でも調音速度でもなく
適切な位置に置かれたポーズである
また、その長さは450 ms以上
(河野1994他による分析的処理に必要な長さ)
→PSUの処理が自動化していない
3.1 学習者が抱える問題
• チャンクの構成要素が小さすぎるため、音韻
ループに保持できる情報が少なすぎる。
• ボトムアップ処理の各段階で十分な自動化が
されていないため。
3.2 考えられる対策
音素・音節といった基本的な知覚を自動化する
ための訓練をもっと積む必要がある
(シャドーイング、ATRcallなど?)
・メンタルレキシコンへのアクセス速度を上げる
ような訓練。
・文法処理の自動化を促すような訓練
3.3 研究的課題
・日本語母語EFL学習者の音声知覚の単位どのような
音声要素で、訓練によってその要素を大きなものに
することができるのか。
・音声言語処理における音韻ループ(ワーキングメモ
リ)の容量はどのくらいなのか。
・学習者の音声習熟レベルをより詳細に測定できない
か。
参考文献
Baddeley, A. (1992). Working memory. Science, 255, 556–559.
Cowan, N. (2001). The magical number 4 in short-term memory: A reconsideration of
mental storage capacity. Behavioral and Brain Sciences, 24, 87-185.
Gathercole, S., and Baddeley, A.(1993) Phonological working memory: A critical
building block for reading development and vocabulary acquisition? EUROPEAN
JOURNAL OF PSYCHOLOGY OF EDUCATION, 8, 259-272.
門田修平(2006). 『第二言語理解の認知メカニズム』 東京:くろしお出版
河野守夫(1998).「モーラ,音節,リズムの心理言語学的考察」『音声研究』 第2巻
第1号:16-24.
Miller, G. A. (1956). "The magical number seven, plus or minus two: Some limits on
our capacity for processing information". Psychological Review 63(2): 343–355.
齊藤智(1997)『音韻的作動記憶に関する研究』東京:風間書房
Sugai, K., Kanzaki, K. & Yamane, S. (2007). The effect of pause on the listening process
of Japanese EFL learners. Language Education & Technology, 44, 187-204.
菅井康祐、山根繁、神崎和男(2006)「日本人EFL学習者のリスニングプロセス:大脳
レベルでのポーズへの反応」『外国語教育メディア学会第46回全国研究大会発
表論文集』 29-37

外国語としての音声言語理解とワーキングメモリ

Editor's Notes

  • #5 ・音声言語は、そのままの形でphonological short-term storeに蓄えられる(受動的機能)  約2秒で消失する ・文字言語などはsubvocal rehearsalにおいて内的に反復しながら保持する(能動的機能)
  • #6 ・Millerは後に、数字なら7,文字なら6,単語なら5chunkと考えた。
  • #13 200 ms: ポーズがあると認識されうるできるだけ不自然でない長さ 450 ms: 菅井他2007で行った調査で、500 msのポーズに効果がみられたので、河野によるanalyticな処理が行われる420 ms以上の450 msでも効果があるかをみるため 700 ms: 上の2つの差に従った。