SlideShare a Scribd company logo
1 of 32
Download to read offline
第二言語習得研究における
学習者コーパス利用の過去・現在・未来
外国語教育メディア学会(LET)関西支部メソドロジー研究部会 2014年度第3回研究会
@沖縄県青年会館 1F 珊瑚の間
2014-12-20
阪上 辰也@
Agenda
1. 学習者コーパス (LC) 概論
2. SLA 研究のための LC の過去
3. SLA 研究のための LC の現在
4. SLA 研究のための LC の未来
5. おわりに
Agenda
1. 学習者コーパス (LC) 概論
2. SLA 研究のための LC の過去
3. SLA 研究のための LC の現在
4. SLA 研究のための LC の未来
5. おわりに
お買い上げありがとうございます
1. 学習者コーパス (LC) 概論
Learner Corpus (LC) の定義
electronic collections of authentic FL/SL
textual data according to explicit design
for a particular SLA/FLT purpose.
Granger (2002: 5)
電子的なデータ + 目的を持って構築
1. 学習者コーパス (LC) 概論
Díaz-Negrillo and Thompson (2013: 10)
learner corpora
Cross-sectional
Spoken
Written
Monolingual
Annotated
Data from!
-control condition
Specialised
Unannotated
Multilingual
Data from!
+control conditions
Longitudinal,!
developmental
General
1. 学習者コーパス (LC) 概論
Díaz-Negrillo and Thompson (2013: 17)
learner corpora
Language!
testers
Teacher!
trainers
Teachers
Learners
SLA!
researchers
Materials writers,!
curriculum developers
Lexicographers,!
grammarians
Computational!
linguists
Corpus!
linguists
FLT!
researchers
Test
hypotheses
Trace
acquisition
Compare with
NS or NNS data
Evidence-based
learning
Create models
Describe
Connect
performances
to levels
Agenda
1. 学習者コーパス (LC) 概論
2. SLA 研究のための LC の過去
3. SLA 研究のための LC の現在
4. SLA 研究のための LC の未来
5. おわりに
2. SLA 研究のための LC の過去
2つの先駆的存在
!
CHILDES
(Child Language Data Exchange System)
と
ICLE
(International Corpus of Learner English)
memo: 前者は数千件,後者も数百件の研究事例
2. SLA 研究のための LC の過去
!
CHILDES
!
・こどもの口語英語の DB (1984-)
・第1言語の獲得研究が主
・第2言語習得研究のデータも
http://talkbank.org/data/SLABank/
2. SLA 研究のための LC の過去
!
CHILDES
!
・CHAT format の採用
・各個人のデータ量は多くない
・SLA のための最初の LC?
2. SLA 研究のための LC の過去
!
ICLE
!
・大規模学習者コーパスの先駆け
・大学3・4年生の書き言葉データ
・様々な国の学習者を対象 (4M)
2. SLA 研究のための LC の過去
!
ICLE
!
・習熟度 (proficiency) については…
・Two fuzzy variables 扱い
 (もうひとつは ESL/EFL の区別)
2. SLA 研究のための LC の過去
第2部 まとめ
!
・CHILDESが当時唯一のSLA向けLC
・本格的 LC としての ICLE 現る
・NS vs. NNS あるいは NNS vs. NNS
・SLA 研究には使いにくい
Agenda
1. 学習者コーパス (LC) 概論
2. SLA 研究のための LC の過去
3. SLA 研究のための LC の現在
4. SLA 研究のための LC の未来
5. おわりに
3. SLA 研究のための LC の現在
つらい
3. SLA 研究のための LC の現在
日本人英語学習者コーパスが構築されるも
SLA 向けとは言い難い現実…
!
!
ちなみにいろいろな LC あります
http://www.uclouvain.be/en-cecl-lcworld.html
3. SLA 研究のための LC の現在
日本人英語学習者を対象とした LC
・NICT-JLE
・JEFLL
・NICE
・ICNALE
種類 特徴 条件統制
NICT-JLE S
話し言葉!
エラータグ
▲
JEFLL W 中高生 ▲
NICE W 添削文 ▲
ICNALE W アジア圏大学生 ▲
注)「条件統制」は SLA 研究向けとして考えた場合の主観的評価
3. SLA 研究のための LC の現在
SLA 用データとしての問題点
・習熟度の分類に互換性無し
・学年やら CEFR やら…
・タスク関連の統制がいまひとつ
・そもそも産出が日本人には高負荷(?)
3. SLA 研究のための LC の現在
SLA 用データとしての問題点
Many corpus-based researchers do not know
enough about the theoretical background of
SLA research to communicate with them [i.e.
SLA researchers] effectively, while SLA
researchers typically know little about what
corpora can do for them.
(Tono 2003: 806)
第3部 まとめ
!
・日本人英語学習者コーパスが利用可能に
・(習熟度も含め)ざっくり仕分け
・トピック等の条件統制は意識されつつある
・SLA 研究に使えそうだがまだやはり使いづらい
  (SLA 研究を意識した CEDEL2 のものもある)
3. SLA 研究のための LC の現在
Agenda
1. 学習者コーパス (LC) 概論
2. SLA 研究のための LC の過去
3. SLA 研究のための LC の現在
4. SLA 研究のための LC の未来
5. おわりに
4. SLA 研究のための LC の未来
条件の統制はどこまでやればいいのか問題
  
  ・自然産出か強制産出
  ・時間制限:何分あればどれだけ書ける?
  ・トピック:産出しやすいかどうか
  ・媒体:手書き・タイピング…
  ・その他条件:指示・文体・辞書・語数
  ・学習者の詳細な属性
4. SLA 研究のための LC の未来
・学習者の詳細な属性を客観的数値で詳しくとらえる
・TOEIC 等の標準テストのみに頼らない
・Writing/Speaking の能力を構成するものを測る
・語彙サイズ・文法・WM 関連テスト(cf: CEDEL2)
・場合によりタイピング速度・発話量なども
・Testing/Writing の専門家との協力でのコーパス構築も(?)
4. SLA 研究のための LC の未来
(今日はあまり話せませんでしたが)
技術的には…
R・Perl・Python・Ruby の
ワンライナーにはなっておきたい
(集計・読解用に加工できればいい)
4. SLA 研究のための LC の未来
見えないものを見るには
実験(elicitation)
との組み合わせも必要
コーパスがすべてではないのは百も承知
4. SLA 研究のための LC の未来
ことばの問題なので
読んで解釈を試みるべし
コーパスの機械的処理に任せすぎない
4. SLA 研究のための LC の未来
SLA 研究のためのコーパス構築の手順
!
1. テストを交えた個人の属性データ収集
2. コーパス用のデータ産出・収集
3. データの整形・情報埋込(Cording)
4. 取り扱い方法の文書化(Documentation)
5. コーパスの公開:再現性の確保
6. コーパス分析=集計+読解
Agenda
1. 学習者コーパス (LC) 概論
2. SLA 研究のための LC の過去
3. SLA 研究のための LC の現在
4. SLA 研究のための LC の未来
5. おわりに
1. 条件統制
2. 技術習得
3. 読解必須
5. おわりに
Reference
!
Díaz-Negrillo, Ana, Nicolas
Ballier and Paul Thompson.
(2013). Automatic Treatment
and Analysis of Learner
Corpus Data. Amsterdam:
John Benjamins.

More Related Content

More from SAKAUE, Tatsuya

外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」SAKAUE, Tatsuya
 
統計解析環境Rによる言語データの分析
統計解析環境Rによる言語データの分析統計解析環境Rによる言語データの分析
統計解析環境Rによる言語データの分析SAKAUE, Tatsuya
 
ベクタ画像と PNG 画像の比較
ベクタ画像と PNG 画像の比較ベクタ画像と PNG 画像の比較
ベクタ画像と PNG 画像の比較SAKAUE, Tatsuya
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するかSAKAUE, Tatsuya
 
LET2012 ワークショップ「R による教育・言語データ処理のススメ」
LET2012 ワークショップ「R による教育・言語データ処理のススメ」LET2012 ワークショップ「R による教育・言語データ処理のススメ」
LET2012 ワークショップ「R による教育・言語データ処理のススメ」SAKAUE, Tatsuya
 
授業外で個別学習を促進するためのポッドキャスト利用
授業外で個別学習を促進するためのポッドキャスト利用授業外で個別学習を促進するためのポッドキャスト利用
授業外で個別学習を促進するためのポッドキャスト利用SAKAUE, Tatsuya
 
「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...
「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...
「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...SAKAUE, Tatsuya
 
Osaka.R #7 LT: フォントのオハナシ
Osaka.R #7 LT: フォントのオハナシOsaka.R #7 LT: フォントのオハナシ
Osaka.R #7 LT: フォントのオハナシSAKAUE, Tatsuya
 
HiRoshima.R #2 LT by @sakaue
HiRoshima.R #2 LT by @sakaueHiRoshima.R #2 LT by @sakaue
HiRoshima.R #2 LT by @sakaueSAKAUE, Tatsuya
 
HiRoshima.R #2 入門者講習資料
HiRoshima.R #2 入門者講習資料HiRoshima.R #2 入門者講習資料
HiRoshima.R #2 入門者講習資料SAKAUE, Tatsuya
 
Introduction to "R" for Language Researchers
Introduction to "R" for Language ResearchersIntroduction to "R" for Language Researchers
Introduction to "R" for Language ResearchersSAKAUE, Tatsuya
 
Japan.R #2 Introduction to R
Japan.R #2 Introduction to RJapan.R #2 Introduction to R
Japan.R #2 Introduction to RSAKAUE, Tatsuya
 

More from SAKAUE, Tatsuya (20)

HiroshimaR5_Intro
HiroshimaR5_IntroHiroshimaR5_Intro
HiroshimaR5_Intro
 
JASELE2015-KumamotoWS
JASELE2015-KumamotoWSJASELE2015-KumamotoWS
JASELE2015-KumamotoWS
 
HiroshimaR4_LT_sakaue
HiroshimaR4_LT_sakaueHiroshimaR4_LT_sakaue
HiroshimaR4_LT_sakaue
 
Hiroshimar4_Rintro
Hiroshimar4_RintroHiroshimar4_Rintro
Hiroshimar4_Rintro
 
Hiroshimar3_rmecab
Hiroshimar3_rmecabHiroshimar3_rmecab
Hiroshimar3_rmecab
 
HiRoshimaR3_IntroR
HiRoshimaR3_IntroRHiRoshimaR3_IntroR
HiRoshimaR3_IntroR
 
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
 
統計解析環境Rによる言語データの分析
統計解析環境Rによる言語データの分析統計解析環境Rによる言語データの分析
統計解析環境Rによる言語データの分析
 
ベクタ画像と PNG 画像の比較
ベクタ画像と PNG 画像の比較ベクタ画像と PNG 画像の比較
ベクタ画像と PNG 画像の比較
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
 
LET2012 ワークショップ「R による教育・言語データ処理のススメ」
LET2012 ワークショップ「R による教育・言語データ処理のススメ」LET2012 ワークショップ「R による教育・言語データ処理のススメ」
LET2012 ワークショップ「R による教育・言語データ処理のススメ」
 
授業外で個別学習を促進するためのポッドキャスト利用
授業外で個別学習を促進するためのポッドキャスト利用授業外で個別学習を促進するためのポッドキャスト利用
授業外で個別学習を促進するためのポッドキャスト利用
 
「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...
「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...
「R による英語コーパスの処理入門―接続詞 and/but の使用実態調査を例に―」Computing Language and Culture with...
 
Osaka.R #7 LT: フォントのオハナシ
Osaka.R #7 LT: フォントのオハナシOsaka.R #7 LT: フォントのオハナシ
Osaka.R #7 LT: フォントのオハナシ
 
HiRoshima.R #2 LT by @sakaue
HiRoshima.R #2 LT by @sakaueHiRoshima.R #2 LT by @sakaue
HiRoshima.R #2 LT by @sakaue
 
HiRoshima.R #2 入門者講習資料
HiRoshima.R #2 入門者講習資料HiRoshima.R #2 入門者講習資料
HiRoshima.R #2 入門者講習資料
 
Introduction to "R" for Language Researchers
Introduction to "R" for Language ResearchersIntroduction to "R" for Language Researchers
Introduction to "R" for Language Researchers
 
How2Install "R"
How2Install "R"How2Install "R"
How2Install "R"
 
Japan.R #2 Introduction to R
Japan.R #2 Introduction to RJapan.R #2 Introduction to R
Japan.R #2 Introduction to R
 
Nagoya.R #6 LT Beanplot
Nagoya.R #6 LT BeanplotNagoya.R #6 LT Beanplot
Nagoya.R #6 LT Beanplot
 

MethokenOkinawa_Sakaue_LearnerCorpus

  • 2. Agenda 1. 学習者コーパス (LC) 概論 2. SLA 研究のための LC の過去 3. SLA 研究のための LC の現在 4. SLA 研究のための LC の未来 5. おわりに
  • 3. Agenda 1. 学習者コーパス (LC) 概論 2. SLA 研究のための LC の過去 3. SLA 研究のための LC の現在 4. SLA 研究のための LC の未来 5. おわりに
  • 5. 1. 学習者コーパス (LC) 概論 Learner Corpus (LC) の定義 electronic collections of authentic FL/SL textual data according to explicit design for a particular SLA/FLT purpose. Granger (2002: 5) 電子的なデータ + 目的を持って構築
  • 6. 1. 学習者コーパス (LC) 概論 Díaz-Negrillo and Thompson (2013: 10) learner corpora Cross-sectional Spoken Written Monolingual Annotated Data from! -control condition Specialised Unannotated Multilingual Data from! +control conditions Longitudinal,! developmental General
  • 7. 1. 学習者コーパス (LC) 概論 Díaz-Negrillo and Thompson (2013: 17) learner corpora Language! testers Teacher! trainers Teachers Learners SLA! researchers Materials writers,! curriculum developers Lexicographers,! grammarians Computational! linguists Corpus! linguists FLT! researchers Test hypotheses Trace acquisition Compare with NS or NNS data Evidence-based learning Create models Describe Connect performances to levels
  • 8. Agenda 1. 学習者コーパス (LC) 概論 2. SLA 研究のための LC の過去 3. SLA 研究のための LC の現在 4. SLA 研究のための LC の未来 5. おわりに
  • 9. 2. SLA 研究のための LC の過去 2つの先駆的存在 ! CHILDES (Child Language Data Exchange System) と ICLE (International Corpus of Learner English) memo: 前者は数千件,後者も数百件の研究事例
  • 10. 2. SLA 研究のための LC の過去 ! CHILDES ! ・こどもの口語英語の DB (1984-) ・第1言語の獲得研究が主 ・第2言語習得研究のデータも http://talkbank.org/data/SLABank/
  • 11. 2. SLA 研究のための LC の過去 ! CHILDES ! ・CHAT format の採用 ・各個人のデータ量は多くない ・SLA のための最初の LC?
  • 12. 2. SLA 研究のための LC の過去 ! ICLE ! ・大規模学習者コーパスの先駆け ・大学3・4年生の書き言葉データ ・様々な国の学習者を対象 (4M)
  • 13. 2. SLA 研究のための LC の過去 ! ICLE ! ・習熟度 (proficiency) については… ・Two fuzzy variables 扱い  (もうひとつは ESL/EFL の区別)
  • 14. 2. SLA 研究のための LC の過去 第2部 まとめ ! ・CHILDESが当時唯一のSLA向けLC ・本格的 LC としての ICLE 現る ・NS vs. NNS あるいは NNS vs. NNS ・SLA 研究には使いにくい
  • 15. Agenda 1. 学習者コーパス (LC) 概論 2. SLA 研究のための LC の過去 3. SLA 研究のための LC の現在 4. SLA 研究のための LC の未来 5. おわりに
  • 16. 3. SLA 研究のための LC の現在 つらい
  • 17. 3. SLA 研究のための LC の現在 日本人英語学習者コーパスが構築されるも SLA 向けとは言い難い現実… ! ! ちなみにいろいろな LC あります http://www.uclouvain.be/en-cecl-lcworld.html
  • 18. 3. SLA 研究のための LC の現在 日本人英語学習者を対象とした LC ・NICT-JLE ・JEFLL ・NICE ・ICNALE
  • 19. 種類 特徴 条件統制 NICT-JLE S 話し言葉! エラータグ ▲ JEFLL W 中高生 ▲ NICE W 添削文 ▲ ICNALE W アジア圏大学生 ▲ 注)「条件統制」は SLA 研究向けとして考えた場合の主観的評価
  • 20. 3. SLA 研究のための LC の現在 SLA 用データとしての問題点 ・習熟度の分類に互換性無し ・学年やら CEFR やら… ・タスク関連の統制がいまひとつ ・そもそも産出が日本人には高負荷(?)
  • 21. 3. SLA 研究のための LC の現在 SLA 用データとしての問題点 Many corpus-based researchers do not know enough about the theoretical background of SLA research to communicate with them [i.e. SLA researchers] effectively, while SLA researchers typically know little about what corpora can do for them. (Tono 2003: 806)
  • 23. Agenda 1. 学習者コーパス (LC) 概論 2. SLA 研究のための LC の過去 3. SLA 研究のための LC の現在 4. SLA 研究のための LC の未来 5. おわりに
  • 24. 4. SLA 研究のための LC の未来 条件の統制はどこまでやればいいのか問題      ・自然産出か強制産出   ・時間制限:何分あればどれだけ書ける?   ・トピック:産出しやすいかどうか   ・媒体:手書き・タイピング…   ・その他条件:指示・文体・辞書・語数   ・学習者の詳細な属性
  • 25. 4. SLA 研究のための LC の未来 ・学習者の詳細な属性を客観的数値で詳しくとらえる ・TOEIC 等の標準テストのみに頼らない ・Writing/Speaking の能力を構成するものを測る ・語彙サイズ・文法・WM 関連テスト(cf: CEDEL2) ・場合によりタイピング速度・発話量なども ・Testing/Writing の専門家との協力でのコーパス構築も(?)
  • 26. 4. SLA 研究のための LC の未来 (今日はあまり話せませんでしたが) 技術的には… R・Perl・Python・Ruby の ワンライナーにはなっておきたい (集計・読解用に加工できればいい)
  • 27. 4. SLA 研究のための LC の未来 見えないものを見るには 実験(elicitation) との組み合わせも必要 コーパスがすべてではないのは百も承知
  • 28. 4. SLA 研究のための LC の未来 ことばの問題なので 読んで解釈を試みるべし コーパスの機械的処理に任せすぎない
  • 29. 4. SLA 研究のための LC の未来 SLA 研究のためのコーパス構築の手順 ! 1. テストを交えた個人の属性データ収集 2. コーパス用のデータ産出・収集 3. データの整形・情報埋込(Cording) 4. 取り扱い方法の文書化(Documentation) 5. コーパスの公開:再現性の確保 6. コーパス分析=集計+読解
  • 30. Agenda 1. 学習者コーパス (LC) 概論 2. SLA 研究のための LC の過去 3. SLA 研究のための LC の現在 4. SLA 研究のための LC の未来 5. おわりに
  • 31. 1. 条件統制 2. 技術習得 3. 読解必須 5. おわりに
  • 32. Reference ! Díaz-Negrillo, Ana, Nicolas Ballier and Paul Thompson. (2013). Automatic Treatment and Analysis of Learner Corpus Data. Amsterdam: John Benjamins.