Your SlideShare is downloading. ×
千葉大学統計勉強会20130918,20
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

千葉大学統計勉強会20130918,20

369
views

Published on

Published in: Education

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
369
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 千葉大学教育学部英語科統計勉強会 2013年9月18日・20日 於 千葉大学教育学部 伝わりやすい統計結果の 記載に向けて 記述統計と推測統計 そして効果量と検定力 山本長紀 ytakenori@icloud.com Saturday, October 26, 13
  • 2. これ読んでどう思います? 「交際相手いない若者、男性6割・女性5割」 2013年版の厚生労働白書案が26日、明らかになった。 白書案は「若者の意識を探る」というサブタイトルで、結婚や出 産・子育て、仕事に関する若者の意識などを分析した。  結婚については、国立社会保障・人口問題研究所の調査(20 10年)などで、〈1〉18∼39歳の未婚者の9割弱が結婚願 望を抱いている〈2〉異性の交際相手も友人もいない割合は男性 で約6割、女性で約5割に上っている――との結果になったこと などを踏まえ、白書案で「結婚相手の候補となりうる交際相手が いる若者は限定的」と指摘した。 Yomiuri Online 8月26日記事 http://www.yomiuri.co.jp/national/news/20130826-OYT1T00614.htm Saturday, October 26, 13
  • 3. これ読んでどう思います? 5割ずつが付き合っても男性は1割余る? Saturday, October 26, 13
  • 4. これ読んでどう思います? 5割の人たち 1割の男性 Saturday, October 26, 13
  • 5. でも実は… 割合≠数 2010年の20歳から39歳(若者)の人口は… 男性 20∼24 3,543,000 3,359,000 25∼29 3,829,000 3,667,000 合計 Saturday, October 26, 13 女性 7,372,000 7,026,000
  • 6. でも実は… 男性の6割=4,423,000 女性の5割=3,513,000 ↓ 差は910,000人の男性 男性の1割2分3厘 Saturday, October 26, 13
  • 7. でも実は… 1割2分3厘の男性 Saturday, October 26, 13
  • 8. つまり… 必要な情報を記載しましょう Saturday, October 26, 13
  • 9. つまり… 正しく伝えるために情報を記載する必要性 Saturday, October 26, 13
  • 10. 今回のめあて 「何」を「どう」記載すれば良いのか学ぼう Saturday, October 26, 13
  • 11. 今回のめあて 「何」を「どう」記載すれば良いのか学ぼう 記述統計 推測統計(t検定, χ2検定, 相関分析) 効果量 検定力 Saturday, October 26, 13
  • 12. Saturday, October 26, 13
  • 13. そ の ま え に Saturday, October 26, 13
  • 14. 1. 統計を使う研究法とは ・「仮説検証型」の研究 ・検証のためのツール=統計 ・検証した結果の一般化が可能 検証される仮説って? →Task 1へ Saturday, October 26, 13
  • 15. 1.1 仮説と実験デザイン 仮説=研究目的/Research Question (できれば)仮説はYes/Noで答えられるもの Saturday, October 26, 13
  • 16. 1.2 一般化が可能とは 標本抽出 母集団 標本 推測 Saturday, October 26, 13 →Task 2へ
  • 17. 1.2 一般化が可能とは 母集団 偏った標本に対して推測統計を用いる場合 は、標本から母集団をどこまで広げて解釈 とするか、しっかりと考える必要があるで しょう(竹内・水本, 2012, p. 47) Saturday, October 26, 13
  • 18. 1.2 一般化が可能とは 母集団の解釈のために被検者の記述はしっかり ・TOEICのスコアの報告だけで十分? ・附属中生は中学生全体の標本となるか? Saturday, October 26, 13
  • 19. 1.3 結果の記述 →Task 3へ Saturday, October 26, 13
  • 20. 1.3 結果の記述 今回はここの記述の仕方を学びます そのために統計がどういうものか学びます Saturday, October 26, 13
  • 21. 1.4 量的研究の流れ ・大きな研究テーマの決定 ・先行研究の洗い出し。具体的なテーマの決定 ・データ収集 ・データ分析 ・解釈 Saturday, October 26, 13
  • 22. 1.4 量的研究の流れ ・データ収集 被験者の決定、実験デザインの決定 テスト作成、実験の実施、テストの実施など ・データ分析 統計を使う(記述統計と推測統計) Saturday, October 26, 13
  • 23. 1.4 量的研究の流れ 分析方法を考えず適当にデータを集めると… Garbage in, Garbage out Saturday, October 26, 13
  • 24. 今回のめあて 結果の記述の仕方を学びます 統計がどういうものか学びます 使う統計を踏まえて実験デザインを考える Saturday, October 26, 13
  • 25. 今回のめあて 記述統計 推測統計(t検定, χ2検定, 相関分析) 効果量 検定力 Saturday, October 26, 13
  • 26. 記述統計 その前に「尺度」について… Saturday, October 26, 13
  • 27. 2. 記述統計(1) 尺度水準・・・現象をデータとして集めるための基準 比(率)尺度 間隔尺度 順序尺度 名義尺度 Saturday, October 26, 13
  • 28. 2. 記述統計(1) 名義尺度 性別 1.男性 2.女性 好きな教科 1.英語 2.国語 3.数学… 四則演算不可 数字を入れ替えても大丈夫 Saturday, October 26, 13
  • 29. 2. 記述統計(1) 順序尺度 学年 1.1年生 2.2年生 3.3年生 テストの順位 四則演算不可 大小の比較はできる 数字の間隔は等間隔ではない Saturday, October 26, 13
  • 30. 2. 記述統計(1) 間隔尺度 テストの得点 加算、除算のみ可 数字の間隔は一定 「ゼロ」は無を意味しない Saturday, October 26, 13
  • 31. 2. 記述統計(1) 比尺度 語数 時間 四則演算可 数字の間隔が等間隔 「ゼロ」が無を意味する Saturday, October 26, 13
  • 32. 2. 記述統計(1) 比尺度と間隔尺度は同じものとして扱う Saturday, October 26, 13
  • 33. 2. 記述統計(1) ここで問題です! Saturday, October 26, 13
  • 34. 2. 記述統計(1) ここで問題です! Sonobe, Ueda & Yamane (2009)の10段階評価は 何尺度でしょう? Saturday, October 26, 13
  • 35. 2. 記述統計(1) Sonobe, Ueda & Yamane (2009)の10段階評価は 何尺度でしょう? 自粛 Saturday, October 26, 13
  • 36. 2. 記述統計(1) Sonobe, Ueda & Yamane (2009)の10段階評価は 何尺度でしょう? Likert scaleは本来順序尺度だが、 間隔尺度と「みなして」統計処理を行う Saturday, October 26, 13
  • 37. 2. 記述統計(1) 尺度は統計的検定の選択に大きく影響するので 正しく理解する必要があります Saturday, October 26, 13
  • 38. 3. 記述統計(2) 「このデータの特徴は⃝⃝ですよ」と記述する統計 →Task 4へ Saturday, October 26, 13
  • 39. 3. 記述統計(2) クラス1 クラス2 クラス3 合計 男性の人数 18 17 13 48 女性の人数 12 14 18 44 合計 30 31 31 92 被験者数=サンプルサイズ Saturday, October 26, 13
  • 40. 3. 記述統計(2) クラス1 クラス2 クラス3 平均 366.17 402.58 509.03 中央値 367.5 405 510 最頻値 365 300 605 分散 4297.73 9969.78 9497.37 標準偏差 65.56 99.85 97.45 Saturday, October 26, 13
  • 41. 3. 記述統計(2) データの中心を表す 平均値、中央値、最頻値 Saturday, October 26, 13
  • 42. 3. 記述統計(2) Saturday, October 26, 13
  • 43. 3. 記述統計(2) データの平均値を中心としたばらつきを表す 分散=標準偏差2 Saturday, October 26, 13
  • 44. 0.08 0.10 3. 記述統計(2) 0.06 M=50 0.00 0.02 0.04 SD=5 0 Saturday, October 26, 13 20 40 60 80 100
  • 45. 0.08 0.10 3. 記述統計(2) 0.06 M=50 0.00 0.02 0.04 SD=10 0 Saturday, October 26, 13 20 40 60 80 100
  • 46. 0.08 0.10 3. 記述統計(2) 0.06 M=50 0.00 0.02 0.04 SD=15 0 Saturday, October 26, 13 20 40 60 80 100
  • 47. 0.00 0.02 0.04 0.06 0.08 0.10 3. 記述統計(2) 0 Saturday, October 26, 13 20 40 60 80 100
  • 48. 3. 記述統計(2) 記述統計のうち 少なくともMとSDは記載しましょう Saturday, October 26, 13
  • 49. 3. 記述統計(2) 実験1 英語のテストの平均点がA組60点、B組40点で5%水準 で有意な差があった。 実験2 英語のテストの平均点がA組60点、B組40点で有意な 差がなかった。 Saturday, October 26, 13
  • 50. 3. 記述統計(2) A組 0.08 実験1 0.10 English Test 0.04 0.06 M=60 SD=5 0.02 B組 0.00 M=40 SD=5 0 20 40 60 Score Saturday, October 26, 13 80 100
  • 51. 3. 記述統計(2) A組 0.08 実験1 0.10 English Test 0.04 0.06 M=60 SD=5 0.02 B組 0.00 M=40 SD=5 0 20 40 60 Score Saturday, October 26, 13 80 100
  • 52. 3. 記述統計(2) A組 0.08 実験2 0.10 English Test 0.04 0.06 M=60 SD=20 0.02 B組 0.00 M=40 SD=20 0 20 40 60 Score Saturday, October 26, 13 80 100
  • 53. 3. 記述統計(2) A組 0.08 実験2 0.10 English Test 0.04 0.06 M=60 SD=20 0.02 B組 0.00 M=40 SD=20 0 20 40 60 Score Saturday, October 26, 13 80 100
  • 54. 3. 記述統計(2) 数字だけではなく、 グラフを作成することも大切 →Task 5へ Saturday, October 26, 13
  • 55. 3. 記述統計(2) 1) 48% Man Saturday, October 26, 13 52% Woman
  • 56. 3. 記述統計(2) 30 Histogram of TOEIC_total 15 0 5 10 Frequency 20 25 2) 0 200 400 TOEIC_total Saturday, October 26, 13 600 800
  • 57. 3. 記述統計(2) 3) Class1 Class2 Class3 0% 25% low Saturday, October 26, 13 50% middle 75% high 100%
  • 58. 3. 記述統計(2) 0 200 400 600 800 おまけ(箱ひげ図) Saturday, October 26, 13 Box Plot
  • 59. 3. 記述統計(2) 800 おまけ(箱ひげ図) Box Plot 600 最大値 0 200 400 3/4 Saturday, October 26, 13 1/4 中央値 最小値
  • 60. 3. 記述統計(2) Box Plot 200 300 400 500 600 700 800 おまけ(箱ひげ図) Pre_TOEIC Saturday, October 26, 13 Post_TOEIC
  • 61. 3. 記述統計(2) 正しくグラフを作りましょう Saturday, October 26, 13
  • 62. 3. 記述統計(2) Saturday, October 26, 13
  • 63. 3. 記述統計(2) Saturday, October 26, 13
  • 64. 3. 記述統計(2) Saturday, October 26, 13
  • 65. 3. 記述統計(2) Saturday, October 26, 13
  • 66. 3.2 正規分布 M±1SDに約68% Saturday, October 26, 13 M±2SDに約96%
  • 67. 3.2 正規分布 M±1.96SDの外側が合計5% Saturday, October 26, 13
  • 68. 4.1妥当性 構成概念妥当性(ハンドアウト5ページ) 測定しようとしているものが、構成概念(直接は 測定出来ないもの)に沿っているかどうか 例えば…「英語学習への動機づけ」を見るために 「英語の先生が好きかどうか」を測定する Saturday, October 26, 13
  • 69. 4.1妥当性 構成概念妥当性(ハンドアウト5ページ) とりあえずアンケートしてみる Saturday, October 26, 13
  • 70. 4.1妥当性 構成概念妥当性(ハンドアウト5ページ) 測定項目の妥当性を「事前に」確かめる Saturday, October 26, 13
  • 71. 4.2信頼性 測定を何度やっても同じ人には同じ結果が得られ るであろう精度 クロンバックのアルファ(Cronbach’s alpha) Interrater reliability 例えばスピーキングの評価を2人で行った 場合の信頼性 Saturday, October 26, 13
  • 72. 4. 妥当性と信頼性 妥当性は事前に 信頼性は事後に それぞれ確認をする Saturday, October 26, 13
  • 73. 今回のめあて 記述統計 推測統計(t検定, χ2検定, 相関分析) 効果量 検定力 Saturday, October 26, 13
  • 74. 今回のめあて 推測統計(t検定, χ2検定, 相関分析) Saturday, October 26, 13
  • 75. 母集団 標本 推測 Saturday, October 26, 13
  • 76. 記述統計 母集団 標本 推測 Saturday, October 26, 13
  • 77. 記述統計 母集団 標本 推測 推測統計 Saturday, October 26, 13
  • 78. 1. 統計を使う研究法とは おさらい ・「仮説検証型」の研究 ・仮説の検証のためのツール=推測統計 ・検証した結果の一般化が可能 Saturday, October 26, 13
  • 79. 1. 統計を使う研究法とは おさらい ・「仮説検証型」の研究 ・仮説の検証のためのツール=推測統計 ・検証した結果の一般化が可能 Saturday, October 26, 13
  • 80. 5.1 帰無仮説と対立仮説 帰無仮説(null hypothesis, H0) 対立仮説(alternative hypothesis, H1) Saturday, October 26, 13
  • 81. 5.1 帰無仮説と対立仮説 帰無仮説(null hypothesis, H0) 男女で英語のテストの平均点に差はない 対立仮説(alternative hypothesis, H1) 男女で英語のテストの平均点に差がある Saturday, October 26, 13
  • 82. 5.1 帰無仮説と対立仮説 推測統計の考え方(ざっくり) 得られたデータの下で帰無仮説が正しい確率を求め る。その確率がとても小さい(5%未満)ならば帰 無 仮 説 が 正 し い と は 考 えず ( 帰 無 仮 説 を 棄 却 す る)、対立仮説が正しいと考える(対立仮説を採択 する)。 Saturday, October 26, 13
  • 83. 5.1 帰無仮説と対立仮説 推測統計の考え方(ざっくり) 「差がない」という帰無仮説を棄却した場合、 「差がある」のではなく、「差がないとはいえ ない」が正しい 帰無仮説が正しい確率=p値 5%=有意水準 Saturday, October 26, 13
  • 84. 5.2 第1種&第2種の過誤 真の結果 研究結果 差がない 差がある 有意差なし 正しい判断(1-α) 第2種の過誤(β) 有意差あり 第1種の過誤(α) 正しい判断(1-β) Saturday, October 26, 13
  • 85. 5.2 第1種&第2種の過誤 第1種の過誤 本当は差がないのに、統計で差がある という結果になる 女の子はBoyのことを本当は好きじゃない 数々のデータから「自分のこと好きなんだ」 と結論を導き出してしまう勘違いBoy Saturday, October 26, 13
  • 86. 5.2 第1種&第2種の過誤 第1種の過誤 本当は差がないのに、統計で差がある という結果になる 確率は5% (=α) Saturday, October 26, 13
  • 87. 5.2 第1種&第2種の過誤 第2種の過誤 本当は差があるのに、統計で差がない という結果になる 女の子はBoyのことを本当に好き 数々のデータから「自分のこと好きじゃな い」と結論を導き出してしまうドン臭いBoy Saturday, October 26, 13
  • 88. 5.2 第1種&第2種の過誤 第2種の過誤 本当は差があるのに、統計で差がない という結果になる 確率は20% (=β) Saturday, October 26, 13
  • 89. 推測統計(t検定, χ2検定, 相関分析) 「差があるかどうか」を見る検定 「関係があるかどうか」を見る検定 Saturday, October 26, 13
  • 90. 6.1差の検定 対応のないt検定 対応のあるt検定 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 2検定 χ Saturday, October 26, 13
  • 91. 6.1.1 t検定 対応のないt検定 対応のあるt検定 2つのグループの平均値の差を見る検定 Saturday, October 26, 13
  • 92. 6.1.1 t検定 例えば、1学期期末テストの平均点がA組68 点、B組78点でした。この10点の差は統計的 に差があると言えるのか。 Saturday, October 26, 13
  • 93. 6.1.1 t検定 0.03 0.04 English test A-B 0.00 0.01 差がなければ… 0.02 差があれば… 0 20 40 60 Test score Saturday, October 26, 13 80 100
  • 94. 6.1.1 t検定 正規性が確保されているか (母集団が正規分布かどうか) 間隔尺度以上か 2グループのサンプルサイズに偏りがないか 2グループの分散が等しいか(等分散か) Saturday, October 26, 13
  • 95. 6.1.1 t検定 対応のないt検定 対応のあるt検定 対応のない=異なる2グループが       1つのテストを受けた場合 対応のある=同じ1グループが       1つのテストを2回受けた場合 Saturday, October 26, 13
  • 96. 6.1.1 t検定 「対応のない」の例 A組 B組 Saturday, October 26, 13 授業 言語能力 テスト
  • 97. 6.1.1 t検定 「対応のある」の例(pre-postデザイン) A組 Pretest 言語能力 テスト Saturday, October 26, 13 授業 Posttest 言語能力 テスト
  • 98. 6.1.1 t検定 2つを組み合わせたデザイン A組 B組 Saturday, October 26, 13 Pretest 言語能力 テスト 授業 Posttest 言語能力 テスト
  • 99. 6.1.1 t検定 2つを組み合わせたデザイン A組 B組 Pretest 言語能力 テスト 授業 Posttest 言語能力 テスト これはt検定では分析できない Saturday, October 26, 13
  • 100. 6.1.1 t検定 →Task 6へ →Task 7へ Saturday, October 26, 13
  • 101. 6.1.1 t検定 Task6 H0:男女の間でTOEICのスコアに差はない H1:男女の間でTOEICのスコアに差がある 結果:男女の間でTOEICのスコアに差があるか どうか対応のないt検定を用いて分析した結 果、男女の間でTOEICのスコアに有意な差は ないことが明らかとなった (t(90)=.53, p=.60) Saturday, October 26, 13
  • 102. 6.1.1 t検定 Task7 H0:実験の前後でTOEICのスコアに差がない H1:実験の前後でTOEICのスコアに差がある 結果:実験の前後でTOEICのスコアに差があるか どうか対応のあるt検定を用いて分析した結 果、実験の前後でTOEICのスコアに有意な差が あることが明らかとなった (t(91)=-2.61, p=.01) Saturday, October 26, 13
  • 103. 6.1差の検定 対応のないt検定 対応のあるt検定 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 2検定 χ Saturday, October 26, 13
  • 104. 6.1.2 一元配置分散分析 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 3つ以上のグループの平均値の差を見る検定 Saturday, October 26, 13
  • 105. 6.1.2 一元配置分散分析 例えば、1学期期末テストの平均点がA組68 点、B組78点、C組45点。この3つのグルー プの差は統計的に差があると言えるのか。 Saturday, October 26, 13
  • 106. 6.1.2 一元配置分散分析 0.00 0.01 0.02 0.03 0.04 English test A-B 0 20 40 60 Test score Saturday, October 26, 13 80 100
  • 107. 6.1.2 一元配置分散分析 正規性が確保されているか 間隔尺度以上か 3グループ以上のサンプルサイズに偏りがないか 等分散であるか Saturday, October 26, 13
  • 108. 6.1.2 一元配置分散分析 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 繰り返しのない=異なる3グループ以上が       1つのテストを受けた場合 繰り返しのある=同じ1グループが     1つのテストを3回以上受けた場合 Saturday, October 26, 13
  • 109. 6.1.2 一元配置分散分析 「繰り返しのない」の例 A組 B組 C組 Saturday, October 26, 13 授業 言語能力 テスト
  • 110. 6.1.2 一元配置分散分析 「繰り返しのある」の例 A組 test1 授業 test2 授業 test3 分散分析と多重比較について (ハンドアウトp.10) Saturday, October 26, 13
  • 111. 6.1.2 一元配置分散分析 分散分析 A組 test1 多重比較 Saturday, October 26, 13 授業 test2 授業 test3
  • 112. 6.1.2 一元配置分散分析 結局t検定を 繰り返しているだけ じゃないか! ハンドアウトp. 9 Saturday, October 26, 13
  • 113. 6.1.2 一元配置分散分析 第1種の過誤 本当は差がないのに、統計で差がある という結果になる 確率は5% (=α) Saturday, October 26, 13
  • 114. 6.1.2 一元配置分散分析 Sonobe, Ueda, & Yamane (2009)は… 実験群 Pretest 指導 Posttest 統制群 差がなかった Saturday, October 26, 13 差があった
  • 115. 6.1.2 一元配置分散分析 Saturday, October 26, 13
  • 116. 6.1.2 分散分析 繰り返しのない二元配置分散分析 繰り返しのある二元配置分散分析 2要因混合計画の分散分析 多元配置分散分析 Saturday, October 26, 13
  • 117. 6.1差の検定 対応のないt検定 対応のあるt検定 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 2検定 χ Saturday, October 26, 13
  • 118. 6.1.3 2検定 χ 適合度検定 独立性の検定 Saturday, October 26, 13 2検定 χ
  • 119. 6.1.3 2検定 χ 2検定 適合度検定 χ 例えば... 生徒の最も好きな教科の選択に差があるのか 国語 数学 英語 理科 社会 55 30 13 74 58 被験者数 230 Saturday, October 26, 13
  • 120. 6.1.3 2検定 χ 2検定 適合度検定 χ 名義尺度のデータを扱う検定 国語 数学 英語 理科 社会 55 30 13 74 58 Saturday, October 26, 13
  • 121. 6.1.3 2検定 χ 2検定 適合度検定 χ データが名義尺度であるか データが累積の頻度であるか データが独立しているか    が5以上であるか 期待値 Saturday, October 26, 13
  • 122. 6.1.3 2検定 χ 2検定 適合度検定 χ 期待値 同じように選択されると仮定した場合の値 つまり「差がない」と仮定した場合の値 国語 実測値 55 期待値 46 被験者数 230 Saturday, October 26, 13 数学 30 46 英語 13 46 理科 74 46 社会 58 46
  • 123. 6.1.3 2検定 χ 2検定 適合度検定 χ 実測値と期待値がどれだけ離れているかを 検定し、全体として差があるかどうか見る Saturday, October 26, 13
  • 124. 6.1.3 2検定 χ 2検定 適合度検定 χ 実測値と期待値がどれだけ離れているかを 検定し、全体として差があるかどうか見る どこが多くてどこが少ないのかは、 多重比較を用いて分析(今回は扱わない) Saturday, October 26, 13
  • 125. 6.1.3 2検定 χ 適合度検定 独立性の検定 Saturday, October 26, 13 2検定 χ
  • 126. 6.1.3 2検定 χ 2検定 独立性の検定 χ 例えば... 男女ごとで最も好きな教科の選択に違いがあるか 男子 女子 Saturday, October 26, 13 国語 11 34 数学 25 5 英語 6 7 理科 40 34 社会 16 42
  • 127. 6.1.3 2検定 χ 2検定 独立性の検定 χ 期待値 実測値 国語 男子 女子 合計 11 44 55 数学 英語 理科 社会 合計 25 6 40 16 98 5 7 34 42 132 30 13 74 58 230 期待値 x : 98 = 55 : 230     x = (55 × 98) ÷ 230 Saturday, October 26, 13
  • 128. 6.1.3 2検定 χ 2検定 独立性の検定 χ 期待値 実測値 国語 男子 女子 合計 11 44 55 数学 英語 理科 社会 合計 25 6 40 16 98 5 7 34 42 132 30 13 74 58 230 期待値 x : 98 = 55 : 230     x = (55 × 98) ÷ 230 Saturday, October 26, 13
  • 129. 6.1.3 2検定 χ 2検定 独立性の検定 χ 期待値 男女に関係なく教科が選ばれた場合の値 つまり、性別と教科の選択に関係がないと 仮定した場合の値 Saturday, October 26, 13
  • 130. 6.1.3 2検定 χ 2検定 独立性の検定 χ 2つの変数(性別・好きな教科)は 関係があるかどうかを見る検定 もし関係があれば、どこかが多くなり、 どこかが少なくなるかも… →残差分析を用いて分析 Saturday, October 26, 13
  • 131. 6.1.3 2検定 χ →Task 8へ →Task 9へ Saturday, October 26, 13
  • 132. 6.1.3 2検定 χ Task8 H0:母語別の被験者数に差はない H1:母語別の被験者数に差がある 結果:母語別の被験者数に差があるかどうか 2検定を用いて分析した結果、被験者数に有 χ 意な差があった Saturday, October 26, 13 2(2)=16.80, p=.00) (χ
  • 133. 6.1.3 2検定 χ Task9 H0:性別と実験の効果の有無は独立である H1:性別と実験の効果の有無は独立でない 結果:性別と実験の効果の有無に関係がある 2検定用いて分析した結果、性別と かどうかχ 実験の効果の有無に有意な関係があることが 明らかとなった (χ2(1)=5.53, p=.02) Saturday, October 26, 13
  • 134. 6.1関係の検定 相関分析(ピアソン積率相関) Saturday, October 26, 13
  • 135. 6.1関係の検定 相関分析(ピアソン積率相関) 例えば… 中学生の国語と英語のテストの間に相関関係 があるかどうか Saturday, October 26, 13
  • 136. 6.1関係の検定 相関分析(ピアソン積率相関) 間隔尺度以上 (厳密には)正規性が確保されている Saturday, October 26, 13
  • 137. 6.1関係の検定 相関分析(ピアソン積率相関) ピアソン積率相関係数 r r = ± .70∼1.0 r = ± .40∼.70 中程度の相関あり r = ± .20∼.40 弱い相関あり r = ± .00∼.20 Saturday, October 26, 13 強い相関あり 相関なし
  • 138. 相関 r = .00 Saturday, October 26, 13
  • 139. 相関 r = .25 Saturday, October 26, 13
  • 140. 相関 r = .50 Saturday, October 26, 13
  • 141. 相関 r = .75 Saturday, October 26, 13
  • 142. 相関 r = .90 Saturday, October 26, 13
  • 143. 相関 r = 1.00 Saturday, October 26, 13
  • 144. 6.1関係の検定 相関分析(ピアソン積率相関) しかし、「どういう相関関係か」と「統計的 に有意な相関関係があるか」は別問題。 →帰無仮説・対立仮説(ハンドアウトp. 13) Saturday, October 26, 13
  • 145. 6.1関係の検定 相関分析(ピアソン積率相関) 相関関係を視覚的に見るために散布図を! →Task 10へ Saturday, October 26, 13
  • 146. 6.1関係の検定 Task10 H0:国語と英語の得点の間に相関がない H1:国語と英語の得点の間に相関がある 結果:国語の得点と英語の得点の間に相関関 係があるかどうか相関分析を行った結果、2 つの得点の間に強い正の相関関係があった (r=.72, p=.00) Saturday, October 26, 13
  • 147. 6.1関係の検定 Task10 100 Scatter Plot 90 ● ● ● ● ● 80 ● 70 ● ● ● ● 60 English ● ● ● ● ● 50 ● ● ● 40 ● ● 20 30 40 50 60 Japanese Saturday, October 26, 13 70 80 90
  • 148. 6.1関係の検定 Task10 100 Scatter Plot 90 ● ● ● ● ● 80 ● 70 ● ● ● ● 60 English ● ● ● ● ● 50 ● ● ● 40 ● ● 20 30 40 50 60 Japanese Saturday, October 26, 13 70 80 90
  • 149. 8 実践してみよう →Task 11へ →Task 12へ Saturday, October 26, 13
  • 150. 9.1効果量 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Saturday, October 26, 13 Diff p value 2.00 .374 Diff p value 2.00 .046
  • 151. 9.1効果量 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Saturday, October 26, 13 Diff 2.00 Diff 2.00 n 20 20 p value n 200 200 p value .374 .046
  • 152. 9.1効果量 サンプルサイズが大きいと、有意になりやすい Group Group 1 Group 2 Saturday, October 26, 13 M 50.00 52.00 SD 10.00 10.00 Diff 2.00 n 200 200 p value .046
  • 153. 9.1効果量 サンプルサイズに左右されず、 実験の「効果」を見るにはどうすれば… Saturday, October 26, 13
  • 154. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 Group A Group B 70 57 52 79 38 64 59 55 58 76 61 61 48 43 76 89 28 90 45 51 54 58 68 71 58 38 63 63 38 38 69 41 42 43 43 41 47 58 51 83 78 60 36 93 68 48 51 47 40 45 39 37 50 24 71 52 68 36 26 41 あるテストの結果 Saturday, October 26, 13
  • 155. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 平均点 Group A 52.1 Group B < 57.1 Group B の方が優秀? Saturday, October 26, 13
  • 156. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 9" 8" 7" 6" 5" Group"A" 4" Group"B" 3" 2" 1" 0" 0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100" 「差」ではなく「重なり」を見よう Saturday, October 26, 13
  • 157. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 (吉田, 1998, p. 173) Saturday, October 26, 13
  • 158. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 差は同じ (吉田, 1998, p. 173) Saturday, October 26, 13
  • 159. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 重なりの量が違う Saturday, October 26, 13
  • 160. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 9" 8" 7" 6" 5" Group"A" 4" Group"B" 3" 2" 1" 0" 0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100" この重なりは多いの?少ないの? Saturday, October 26, 13
  • 161. 9.1効果量 この重なりは多いの?少ないの? 重なりの大小を示す指標=効果量 Saturday, October 26, 13
  • 162. 9.1効果量 この重なりは多いの?少ないの? 重なりの大小を示す指標=効果量 水本・竹内(2008, p. 62)へ Saturday, October 26, 13
  • 163. 9.1効果量 Task6 H0:男女の間でTOEICのスコアに差はない H1:男女の間でTOEICのスコアに差がある 結果:男女の間でTOEICのスコアに差があるかど うか対応のないt検定を用いて分析した結果、 男女の間でTOEICのスコアに有意な差はないこ とが明らかとなった (t(90)=.53, p=.60, d=.11) Saturday, October 26, 13
  • 164. 9.1効果量 Task7 H0:実験の前後でTOEICのスコアに差がない H1:実験の前後でTOEICのスコアに差がある 結果:実験の前後でTOEICのスコアに差があるか どうか対応のあるt検定を用いて分析した結果、 実験の前後でTOEICのスコアに有意な差がある ことが明らかとなった (t(91)=-2.61, p=.01, Δ=.57) Saturday, October 26, 13
  • 165. Sonobe, Ueda, & Yamane (2009) の結果 Post-practice 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 0.4 0.4 0.5 0.5 0.6 0.6 Pre-practice 2 4 6 Evaluation 8 10 2 4 6 Evaluation 赤:実験群 青:統制群 Saturday, October 26, 13 8 10
  • 166. Sonobe, Ueda, & Yamane (2009) の結果 Post-practice 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 0.4 0.4 0.5 0.5 0.6 0.6 Pre-practice 2 4 6 8 Evaluation Cohen’s d=0.21 Saturday, October 26, 13 10 2 4 6 8 Evaluation Cohen’s d=1.18 10
  • 167. 9.2検定力 事前の検定力分析 事後の検定力分析 Saturday, October 26, 13
  • 168. 9.2検定力 有意確率 (α) 効果量 Saturday, October 26, 13 サンプル サイズ 検定力 (1-β)
  • 169. 9.2検定力 5% ? 有意確率 (α) 中程度 サンプル サイズ 効果量 検定力 (1-β) 事前の検定力分析 Saturday, October 26, 13 80%
  • 170. 9.2検定力 事前の検定力分析 適切な検定力(80%)を得るためには、いく つのサンプルサイズにすれば良いのかを分析 する Saturday, October 26, 13
  • 171. 9.2検定力 有意確率 (α) 効果量 Saturday, October 26, 13 サンプル サイズ 検定力 (1-β)
  • 172. 9.2検定力 n 5% 有意確率 (α) d サンプル サイズ 効果量 検定力 (1-β) 事後の検定力分析 Saturday, October 26, 13 ?
  • 173. 9.2検定力 事後の検定力分析 被験者数、データから効果量を用いて、実験 における検定力を得るために行う分析 Saturday, October 26, 13