Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
千葉大学教育学部英語科統計勉強会
2013年9月18日・20日 於 千葉大学教育学部

伝わりやすい統計結果の
記載に向けて
記述統計と推測統計 そして効果量と検定力
山本長紀
ytakenori@icloud.com

Saturday, O...
これ読んでどう思います?
「交際相手いない若者、男性6割・女性5割」
2013年版の厚生労働白書案が26日、明らかになった。
白書案は「若者の意識を探る」というサブタイトルで、結婚や出
産・子育て、仕事に関する若者の意識などを分析した。
 結婚...
これ読んでどう思います?

5割ずつが付き合っても男性は1割余る?

Saturday, October 26, 13
これ読んでどう思います?

5割の人たち

1割の男性

Saturday, October 26, 13
でも実は…
割合≠数
2010年の20歳から39歳(若者)の人口は…
男性
20∼24

3,543,000

3,359,000

25∼29

3,829,000

3,667,000

合計

Saturday, October 26, ...
でも実は…
男性の6割=4,423,000
女性の5割=3,513,000
↓
差は910,000人の男性
男性の1割2分3厘

Saturday, October 26, 13
でも実は…
1割2分3厘の男性

Saturday, October 26, 13
つまり…

必要な情報を記載しましょう

Saturday, October 26, 13
つまり…

正しく伝えるために情報を記載する必要性

Saturday, October 26, 13
今回のめあて

「何」を「どう」記載すれば良いのか学ぼう

Saturday, October 26, 13
今回のめあて
「何」を「どう」記載すれば良いのか学ぼう
記述統計
推測統計(t検定, χ2検定, 相関分析)
効果量
検定力
Saturday, October 26, 13
Saturday, October 26, 13
そ の ま え に

Saturday, October 26, 13
1. 統計を使う研究法とは
・「仮説検証型」の研究
・検証のためのツール=統計
・検証した結果の一般化が可能
検証される仮説って?
→Task 1へ
Saturday, October 26, 13
1.1 仮説と実験デザイン

仮説=研究目的/Research Question

(できれば)仮説はYes/Noで答えられるもの

Saturday, October 26, 13
1.2 一般化が可能とは
標本抽出

母集団
標本
推測
Saturday, October 26, 13

→Task 2へ
1.2 一般化が可能とは
母集団

偏った標本に対して推測統計を用いる場合
は、標本から母集団をどこまで広げて解釈
とするか、しっかりと考える必要があるで
しょう(竹内・水本, 2012, p. 47)
Saturday, October 26...
1.2 一般化が可能とは

母集団の解釈のために被検者の記述はしっかり
・TOEICのスコアの報告だけで十分?
・附属中生は中学生全体の標本となるか?

Saturday, October 26, 13
1.3 結果の記述

→Task 3へ

Saturday, October 26, 13
1.3 結果の記述

今回はここの記述の仕方を学びます

そのために統計がどういうものか学びます

Saturday, October 26, 13
1.4 量的研究の流れ
・大きな研究テーマの決定
・先行研究の洗い出し。具体的なテーマの決定
・データ収集
・データ分析
・解釈
Saturday, October 26, 13
1.4 量的研究の流れ
・データ収集
被験者の決定、実験デザインの決定
テスト作成、実験の実施、テストの実施など
・データ分析
統計を使う(記述統計と推測統計)

Saturday, October 26, 13
1.4 量的研究の流れ
分析方法を考えず適当にデータを集めると…
Garbage in, Garbage out

Saturday, October 26, 13
今回のめあて
結果の記述の仕方を学びます

統計がどういうものか学びます

使う統計を踏まえて実験デザインを考える

Saturday, October 26, 13
今回のめあて
記述統計
推測統計(t検定, χ2検定, 相関分析)
効果量
検定力
Saturday, October 26, 13
記述統計

その前に「尺度」について…
Saturday, October 26, 13
2. 記述統計(1)
尺度水準・・・現象をデータとして集めるための基準
比(率)尺度
間隔尺度
順序尺度
名義尺度

Saturday, October 26, 13
2. 記述統計(1)
名義尺度
性別 1.男性

2.女性

好きな教科 1.英語 2.国語 3.数学…
四則演算不可
数字を入れ替えても大丈夫
Saturday, October 26, 13
2. 記述統計(1)
順序尺度
学年 1.1年生 2.2年生 3.3年生
テストの順位
四則演算不可
大小の比較はできる
数字の間隔は等間隔ではない
Saturday, October 26, 13
2. 記述統計(1)
間隔尺度
テストの得点

加算、除算のみ可
数字の間隔は一定
「ゼロ」は無を意味しない
Saturday, October 26, 13
2. 記述統計(1)
比尺度
語数
時間
四則演算可
数字の間隔が等間隔
「ゼロ」が無を意味する
Saturday, October 26, 13
2. 記述統計(1)

比尺度と間隔尺度は同じものとして扱う

Saturday, October 26, 13
2. 記述統計(1)

ここで問題です!

Saturday, October 26, 13
2. 記述統計(1)
ここで問題です!

Sonobe, Ueda & Yamane (2009)の10段階評価は
何尺度でしょう?

Saturday, October 26, 13
2. 記述統計(1)
Sonobe, Ueda & Yamane (2009)の10段階評価は
何尺度でしょう?

自粛

Saturday, October 26, 13
2. 記述統計(1)
Sonobe, Ueda & Yamane (2009)の10段階評価は
何尺度でしょう?

Likert scaleは本来順序尺度だが、
間隔尺度と「みなして」統計処理を行う

Saturday, October 26,...
2. 記述統計(1)

尺度は統計的検定の選択に大きく影響するので
正しく理解する必要があります

Saturday, October 26, 13
3. 記述統計(2)

「このデータの特徴は⃝⃝ですよ」と記述する統計

→Task 4へ
Saturday, October 26, 13
3. 記述統計(2)

クラス1

クラス2

クラス3

合計

男性の人数

18

17

13

48

女性の人数

12

14

18

44

合計

30

31

31

92

被験者数=サンプルサイズ
Saturday,...
3. 記述統計(2)
クラス1

クラス2

クラス3

平均

366.17

402.58

509.03

中央値

367.5

405

510

最頻値

365

300

605

分散

4297.73

9969.78

9...
3. 記述統計(2)

データの中心を表す
平均値、中央値、最頻値

Saturday, October 26, 13
3. 記述統計(2)

Saturday, October 26, 13
3. 記述統計(2)

データの平均値を中心としたばらつきを表す
分散=標準偏差2

Saturday, October 26, 13
0.08

0.10

3. 記述統計(2)

0.06

M=50

0.00

0.02

0.04

SD=5

0

Saturday, October 26, 13

20

40

60

80

100
0.08

0.10

3. 記述統計(2)

0.06

M=50

0.00

0.02

0.04

SD=10

0

Saturday, October 26, 13

20

40

60

80

100
0.08

0.10

3. 記述統計(2)

0.06

M=50

0.00

0.02

0.04

SD=15

0

Saturday, October 26, 13

20

40

60

80

100
0.00

0.02

0.04

0.06

0.08

0.10

3. 記述統計(2)

0

Saturday, October 26, 13

20

40

60

80

100
3. 記述統計(2)

記述統計のうち
少なくともMとSDは記載しましょう

Saturday, October 26, 13
3. 記述統計(2)
実験1
英語のテストの平均点がA組60点、B組40点で5%水準
で有意な差があった。
実験2
英語のテストの平均点がA組60点、B組40点で有意な
差がなかった。

Saturday, October 26, 13
3. 記述統計(2)
A組

0.08

実験1

0.10

English Test

0.04

0.06

M=60
SD=5

0.02

B組

0.00

M=40
SD=5
0

20

40

60
Score

Saturd...
3. 記述統計(2)
A組

0.08

実験1

0.10

English Test

0.04

0.06

M=60
SD=5

0.02

B組

0.00

M=40
SD=5
0

20

40

60
Score

Saturd...
3. 記述統計(2)
A組

0.08

実験2

0.10

English Test

0.04

0.06

M=60
SD=20

0.02

B組

0.00

M=40
SD=20
0

20

40

60
Score

Satu...
3. 記述統計(2)
A組

0.08

実験2

0.10

English Test

0.04

0.06

M=60
SD=20

0.02

B組

0.00

M=40
SD=20
0

20

40

60
Score

Satu...
3. 記述統計(2)

数字だけではなく、
グラフを作成することも大切

→Task 5へ
Saturday, October 26, 13
3. 記述統計(2)
1)

48%

Man
Saturday, October 26, 13

52%

Woman
3. 記述統計(2)
30

Histogram of TOEIC_total

15
0

5

10

Frequency

20

25

2)

0

200

400
TOEIC_total

Saturday, October 26...
3. 記述統計(2)
3)

Class1
Class2
Class3
0%

25%
low

Saturday, October 26, 13

50%
middle

75%
high

100%
3. 記述統計(2)

0

200

400

600

800

おまけ(箱ひげ図)

Saturday, October 26, 13

Box Plot
3. 記述統計(2)
800

おまけ(箱ひげ図)

Box Plot

600

最大値

0

200

400

3/4

Saturday, October 26, 13

1/4

中央値

最小値
3. 記述統計(2)
Box Plot

200

300

400

500

600

700

800

おまけ(箱ひげ図)

Pre_TOEIC
Saturday, October 26, 13

Post_TOEIC
3. 記述統計(2)

正しくグラフを作りましょう

Saturday, October 26, 13
3. 記述統計(2)

Saturday, October 26, 13
3. 記述統計(2)

Saturday, October 26, 13
3. 記述統計(2)

Saturday, October 26, 13
3. 記述統計(2)

Saturday, October 26, 13
3.2 正規分布
M±1SDに約68%

Saturday, October 26, 13

M±2SDに約96%
3.2 正規分布
M±1.96SDの外側が合計5%

Saturday, October 26, 13
4.1妥当性
構成概念妥当性(ハンドアウト5ページ)
測定しようとしているものが、構成概念(直接は
測定出来ないもの)に沿っているかどうか

例えば…「英語学習への動機づけ」を見るために
「英語の先生が好きかどうか」を測定する
Saturday...
4.1妥当性
構成概念妥当性(ハンドアウト5ページ)

とりあえずアンケートしてみる

Saturday, October 26, 13
4.1妥当性
構成概念妥当性(ハンドアウト5ページ)

測定項目の妥当性を「事前に」確かめる

Saturday, October 26, 13
4.2信頼性
測定を何度やっても同じ人には同じ結果が得られ
るであろう精度
クロンバックのアルファ(Cronbach’s alpha)
Interrater reliability
例えばスピーキングの評価を2人で行った
場合の信頼性
Satu...
4. 妥当性と信頼性

妥当性は事前に
信頼性は事後に
それぞれ確認をする

Saturday, October 26, 13
今回のめあて
記述統計
推測統計(t検定, χ2検定, 相関分析)
効果量
検定力
Saturday, October 26, 13
今回のめあて

推測統計(t検定, χ2検定, 相関分析)

Saturday, October 26, 13
母集団
標本
推測

Saturday, October 26, 13
記述統計

母集団
標本
推測

Saturday, October 26, 13
記述統計

母集団
標本
推測
推測統計
Saturday, October 26, 13
1. 統計を使う研究法とは
おさらい
・「仮説検証型」の研究
・仮説の検証のためのツール=推測統計
・検証した結果の一般化が可能

Saturday, October 26, 13
1. 統計を使う研究法とは
おさらい
・「仮説検証型」の研究
・仮説の検証のためのツール=推測統計
・検証した結果の一般化が可能

Saturday, October 26, 13
5.1 帰無仮説と対立仮説

帰無仮説(null hypothesis, H0)
対立仮説(alternative hypothesis, H1)

Saturday, October 26, 13
5.1 帰無仮説と対立仮説
帰無仮説(null hypothesis, H0)
男女で英語のテストの平均点に差はない

対立仮説(alternative hypothesis, H1)
男女で英語のテストの平均点に差がある

Saturday,...
5.1 帰無仮説と対立仮説
推測統計の考え方(ざっくり)
得られたデータの下で帰無仮説が正しい確率を求め
る。その確率がとても小さい(5%未満)ならば帰
無 仮 説 が 正 し い と は 考 えず ( 帰 無 仮 説 を 棄 却 す
る)、対...
5.1 帰無仮説と対立仮説
推測統計の考え方(ざっくり)
「差がない」という帰無仮説を棄却した場合、
「差がある」のではなく、「差がないとはいえ
ない」が正しい

帰無仮説が正しい確率=p値
5%=有意水準
Saturday, October ...
5.2 第1種&第2種の過誤
真の結果
研究結果
差がない

差がある

有意差なし

正しい判断(1-α)

第2種の過誤(β)

有意差あり

第1種の過誤(α)

正しい判断(1-β)

Saturday, October 26, 13
5.2 第1種&第2種の過誤
第1種の過誤
本当は差がないのに、統計で差がある
という結果になる
女の子はBoyのことを本当は好きじゃない
数々のデータから「自分のこと好きなんだ」
と結論を導き出してしまう勘違いBoy
Saturday, Oc...
5.2 第1種&第2種の過誤
第1種の過誤
本当は差がないのに、統計で差がある
という結果になる
確率は5% (=α)

Saturday, October 26, 13
5.2 第1種&第2種の過誤
第2種の過誤
本当は差があるのに、統計で差がない
という結果になる
女の子はBoyのことを本当に好き
数々のデータから「自分のこと好きじゃな
い」と結論を導き出してしまうドン臭いBoy
Saturday, Octo...
5.2 第1種&第2種の過誤
第2種の過誤
本当は差があるのに、統計で差がない
という結果になる
確率は20% (=β)

Saturday, October 26, 13
推測統計(t検定, χ2検定, 相関分析)

「差があるかどうか」を見る検定
「関係があるかどうか」を見る検定

Saturday, October 26, 13
6.1差の検定
対応のないt検定
対応のあるt検定
繰り返しのない一元配置分散分析(ANOVA)
繰り返しのある一元配置分散分析(ANOVA)
2検定
χ

Saturday, October 26, 13
6.1.1 t検定
対応のないt検定
対応のあるt検定

2つのグループの平均値の差を見る検定

Saturday, October 26, 13
6.1.1 t検定

例えば、1学期期末テストの平均点がA組68
点、B組78点でした。この10点の差は統計的
に差があると言えるのか。

Saturday, October 26, 13
6.1.1 t検定

0.03

0.04

English test A-B

0.00

0.01

差がなければ…

0.02

差があれば…

0

20

40

60
Test score

Saturday, October 26...
6.1.1 t検定
正規性が確保されているか
(母集団が正規分布かどうか)
間隔尺度以上か
2グループのサンプルサイズに偏りがないか
2グループの分散が等しいか(等分散か)

Saturday, October 26, 13
6.1.1 t検定
対応のないt検定
対応のあるt検定
対応のない=異なる2グループが
      1つのテストを受けた場合
対応のある=同じ1グループが
      1つのテストを2回受けた場合

Saturday, October 26, ...
6.1.1 t検定
「対応のない」の例
A組
B組

Saturday, October 26, 13

授業

言語能力
テスト
6.1.1 t検定
「対応のある」の例(pre-postデザイン)

A組

Pretest
言語能力
テスト

Saturday, October 26, 13

授業

Posttest
言語能力
テスト
6.1.1 t検定
2つを組み合わせたデザイン

A組
B組

Saturday, October 26, 13

Pretest
言語能力
テスト

授業

Posttest
言語能力
テスト
6.1.1 t検定
2つを組み合わせたデザイン

A組
B組

Pretest
言語能力
テスト

授業

Posttest
言語能力
テスト

これはt検定では分析できない
Saturday, October 26, 13
6.1.1 t検定
→Task 6へ
→Task 7へ

Saturday, October 26, 13
6.1.1 t検定
Task6
H0:男女の間でTOEICのスコアに差はない
H1:男女の間でTOEICのスコアに差がある
結果:男女の間でTOEICのスコアに差があるか
どうか対応のないt検定を用いて分析した結
果、男女の間でTOEICのスコ...
6.1.1 t検定
Task7
H0:実験の前後でTOEICのスコアに差がない
H1:実験の前後でTOEICのスコアに差がある
結果:実験の前後でTOEICのスコアに差があるか
どうか対応のあるt検定を用いて分析した結
果、実験の前後でTOEI...
6.1差の検定
対応のないt検定
対応のあるt検定
繰り返しのない一元配置分散分析(ANOVA)
繰り返しのある一元配置分散分析(ANOVA)
2検定
χ

Saturday, October 26, 13
6.1.2 一元配置分散分析
繰り返しのない一元配置分散分析(ANOVA)
繰り返しのある一元配置分散分析(ANOVA)
3つ以上のグループの平均値の差を見る検定

Saturday, October 26, 13
6.1.2 一元配置分散分析

例えば、1学期期末テストの平均点がA組68
点、B組78点、C組45点。この3つのグルー
プの差は統計的に差があると言えるのか。

Saturday, October 26, 13
6.1.2 一元配置分散分析

0.00

0.01

0.02

0.03

0.04

English test A-B

0

20

40

60
Test score

Saturday, October 26, 13

80

10...
6.1.2 一元配置分散分析

正規性が確保されているか
間隔尺度以上か
3グループ以上のサンプルサイズに偏りがないか
等分散であるか

Saturday, October 26, 13
6.1.2 一元配置分散分析
繰り返しのない一元配置分散分析(ANOVA)
繰り返しのある一元配置分散分析(ANOVA)
繰り返しのない=異なる3グループ以上が
      1つのテストを受けた場合
繰り返しのある=同じ1グループが
    1...
6.1.2 一元配置分散分析
「繰り返しのない」の例
A組
B組
C組

Saturday, October 26, 13

授業

言語能力
テスト
6.1.2 一元配置分散分析
「繰り返しのある」の例

A組

test1

授業

test2

授業

test3

分散分析と多重比較について (ハンドアウトp.10)
Saturday, October 26, 13
6.1.2 一元配置分散分析
分散分析

A組

test1

多重比較
Saturday, October 26, 13

授業

test2

授業

test3
6.1.2 一元配置分散分析

結局t検定を
繰り返しているだけ
じゃないか!

ハンドアウトp. 9
Saturday, October 26, 13
6.1.2 一元配置分散分析
第1種の過誤
本当は差がないのに、統計で差がある
という結果になる
確率は5% (=α)

Saturday, October 26, 13
6.1.2 一元配置分散分析
Sonobe, Ueda, & Yamane (2009)は…

実験群
Pretest

指導

Posttest

統制群

差がなかった
Saturday, October 26, 13

差があった
6.1.2 一元配置分散分析

Saturday, October 26, 13
6.1.2 分散分析
繰り返しのない二元配置分散分析
繰り返しのある二元配置分散分析
2要因混合計画の分散分析
多元配置分散分析

Saturday, October 26, 13
6.1差の検定
対応のないt検定
対応のあるt検定
繰り返しのない一元配置分散分析(ANOVA)
繰り返しのある一元配置分散分析(ANOVA)
2検定
χ

Saturday, October 26, 13
6.1.3
2検定
χ

適合度検定
独立性の検定

Saturday, October 26, 13

2検定
χ
6.1.3

2検定
χ

2検定 適合度検定
χ

例えば...
生徒の最も好きな教科の選択に差があるのか

国語

数学

英語

理科

社会

55

30

13

74

58

被験者数 230
Saturday, October...
6.1.3

2検定
χ

2検定 適合度検定
χ

名義尺度のデータを扱う検定

国語

数学

英語

理科

社会

55

30

13

74

58

Saturday, October 26, 13
6.1.3

2検定
χ

2検定 適合度検定
χ

データが名義尺度であるか
データが累積の頻度であるか
データが独立しているか
   が5以上であるか
期待値

Saturday, October 26, 13
6.1.3

2検定
χ

2検定 適合度検定
χ

期待値
同じように選択されると仮定した場合の値
つまり「差がない」と仮定した場合の値

国語
実測値 55
期待値 46
被験者数 230
Saturday, October 26, 13
...
6.1.3

2検定
χ

2検定 適合度検定
χ

実測値と期待値がどれだけ離れているかを
検定し、全体として差があるかどうか見る

Saturday, October 26, 13
6.1.3

2検定
χ

2検定 適合度検定
χ

実測値と期待値がどれだけ離れているかを
検定し、全体として差があるかどうか見る

どこが多くてどこが少ないのかは、
多重比較を用いて分析(今回は扱わない)

Saturday, Octobe...
6.1.3
2検定
χ

適合度検定
独立性の検定

Saturday, October 26, 13

2検定
χ
6.1.3

2検定
χ

2検定 独立性の検定
χ

例えば...
男女ごとで最も好きな教科の選択に違いがあるか

男子
女子
Saturday, October 26, 13

国語
11
34

数学
25
5

英語
6
7

理科
4...
6.1.3

2検定
χ

2検定 独立性の検定
χ

期待値
実測値 国語

男子
女子
合計

11
44
55

数学 英語 理科 社会 合計
25
6
40
16
98
5
7
34
42
132
30
13
74
58
230

期待...
6.1.3

2検定
χ

2検定 独立性の検定
χ

期待値
実測値 国語

男子
女子
合計

11
44
55

数学 英語 理科 社会 合計
25
6
40
16
98
5
7
34
42
132
30
13
74
58
230

期待...
6.1.3

2検定
χ

2検定 独立性の検定
χ

期待値
男女に関係なく教科が選ばれた場合の値
つまり、性別と教科の選択に関係がないと
仮定した場合の値

Saturday, October 26, 13
6.1.3

2検定
χ

2検定 独立性の検定
χ

2つの変数(性別・好きな教科)は
関係があるかどうかを見る検定
もし関係があれば、どこかが多くなり、
どこかが少なくなるかも…
→残差分析を用いて分析
Saturday, October ...
6.1.3

2検定
χ

→Task 8へ
→Task 9へ

Saturday, October 26, 13
6.1.3

2検定
χ

Task8
H0:母語別の被験者数に差はない
H1:母語別の被験者数に差がある
結果:母語別の被験者数に差があるかどうか
2検定を用いて分析した結果、被験者数に有
χ

意な差があった

Saturday, Octo...
6.1.3

2検定
χ

Task9
H0:性別と実験の効果の有無は独立である
H1:性別と実験の効果の有無は独立でない
結果:性別と実験の効果の有無に関係がある
2検定用いて分析した結果、性別と
かどうかχ

実験の効果の有無に有意な関係が...
6.1関係の検定

相関分析(ピアソン積率相関)

Saturday, October 26, 13
6.1関係の検定
相関分析(ピアソン積率相関)
例えば…
中学生の国語と英語のテストの間に相関関係
があるかどうか

Saturday, October 26, 13
6.1関係の検定
相関分析(ピアソン積率相関)
間隔尺度以上
(厳密には)正規性が確保されている

Saturday, October 26, 13
6.1関係の検定
相関分析(ピアソン積率相関)
ピアソン積率相関係数 r

r = ± .70∼1.0
r = ± .40∼.70

中程度の相関あり

r = ± .20∼.40

弱い相関あり

r = ± .00∼.20
Saturday...
相関

r = .00

Saturday, October 26, 13
相関

r = .25

Saturday, October 26, 13
相関

r = .50

Saturday, October 26, 13
相関

r = .75

Saturday, October 26, 13
相関

r = .90

Saturday, October 26, 13
相関

r = 1.00

Saturday, October 26, 13
6.1関係の検定
相関分析(ピアソン積率相関)
しかし、「どういう相関関係か」と「統計的
に有意な相関関係があるか」は別問題。
→帰無仮説・対立仮説(ハンドアウトp. 13)

Saturday, October 26, 13
6.1関係の検定
相関分析(ピアソン積率相関)

相関関係を視覚的に見るために散布図を!

→Task 10へ
Saturday, October 26, 13
6.1関係の検定
Task10
H0:国語と英語の得点の間に相関がない
H1:国語と英語の得点の間に相関がある
結果:国語の得点と英語の得点の間に相関関
係があるかどうか相関分析を行った結果、2
つの得点の間に強い正の相関関係があった
(r=....
6.1関係の検定
Task10
100

Scatter Plot

90

●

●

●
●

●

80

●

70

●
●
●

●

60

English

●
●
●

●
●

50

●
●

●

40

●

●

2...
6.1関係の検定
Task10
100

Scatter Plot

90

●

●

●
●

●

80

●

70

●
●
●

●

60

English

●
●
●

●
●

50

●
●

●

40

●

●

2...
8 実践してみよう

→Task 11へ
→Task 12へ

Saturday, October 26, 13
9.1効果量
Group
Group 1
Group 2

M
50.00
52.00

SD
10.00
10.00

Group
Group 1
Group 2

M
50.00
52.00

SD
10.00
10.00

Saturda...
9.1効果量
Group
Group 1
Group 2

M
50.00
52.00

SD
10.00
10.00

Group
Group 1
Group 2

M
50.00
52.00

SD
10.00
10.00

Saturda...
9.1効果量

サンプルサイズが大きいと、有意になりやすい
Group
Group 1
Group 2

Saturday, October 26, 13

M
50.00
52.00

SD
10.00
10.00

Diff
2.00

n...
9.1効果量
サンプルサイズに左右されず、
実験の「効果」を見るにはどうすれば…

Saturday, October 26, 13
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量
Group A

Group B
...
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量
平均点

Group A

52....
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量
9"
8"
7"
6"
5"

G...
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量

(吉田, 1998, p. 17...
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量

差は同じ
(吉田, 1998, ...
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量

重なりの量が違う
Saturda...
浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆
http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/

9.1効果量
9"
8"
7"
6"
5"

G...
9.1効果量

この重なりは多いの?少ないの?
重なりの大小を示す指標=効果量

Saturday, October 26, 13
9.1効果量

この重なりは多いの?少ないの?
重なりの大小を示す指標=効果量

水本・竹内(2008, p. 62)へ
Saturday, October 26, 13
9.1効果量
Task6
H0:男女の間でTOEICのスコアに差はない
H1:男女の間でTOEICのスコアに差がある
結果:男女の間でTOEICのスコアに差があるかど
うか対応のないt検定を用いて分析した結果、
男女の間でTOEICのスコアに有...
9.1効果量
Task7
H0:実験の前後でTOEICのスコアに差がない
H1:実験の前後でTOEICのスコアに差がある
結果:実験の前後でTOEICのスコアに差があるか
どうか対応のあるt検定を用いて分析した結果、
実験の前後でTOEICのス...
Sonobe, Ueda, & Yamane (2009)
の結果
Post-practice

0.0

0.0

0.1

0.1

0.2

0.2

0.3

0.3

0.4

0.4

0.5

0.5

0.6

0.6

Pre...
Sonobe, Ueda, & Yamane (2009)
の結果
Post-practice

0.0

0.0

0.1

0.1

0.2

0.2

0.3

0.3

0.4

0.4

0.5

0.5

0.6

0.6

Pre...
9.2検定力

事前の検定力分析
事後の検定力分析

Saturday, October 26, 13
9.2検定力
有意確率
(α)

効果量

Saturday, October 26, 13

サンプル
サイズ

検定力
(1-β)
9.2検定力
5%

?
有意確率
(α)

中程度

サンプル
サイズ

効果量

検定力
(1-β)

事前の検定力分析
Saturday, October 26, 13

80%
9.2検定力

事前の検定力分析
適切な検定力(80%)を得るためには、いく
つのサンプルサイズにすれば良いのかを分析
する

Saturday, October 26, 13
9.2検定力
有意確率
(α)

効果量

Saturday, October 26, 13

サンプル
サイズ

検定力
(1-β)
9.2検定力
n

5%
有意確率
(α)

d

サンプル
サイズ

効果量

検定力
(1-β)

事後の検定力分析
Saturday, October 26, 13

?
9.2検定力

事後の検定力分析
被験者数、データから効果量を用いて、実験
における検定力を得るために行う分析

Saturday, October 26, 13
Upcoming SlideShare
Loading in …5
×

千葉大学統計勉強会20130918,20

686 views

Published on

Published in: Education
  • Be the first to comment

千葉大学統計勉強会20130918,20

  1. 1. 千葉大学教育学部英語科統計勉強会 2013年9月18日・20日 於 千葉大学教育学部 伝わりやすい統計結果の 記載に向けて 記述統計と推測統計 そして効果量と検定力 山本長紀 ytakenori@icloud.com Saturday, October 26, 13
  2. 2. これ読んでどう思います? 「交際相手いない若者、男性6割・女性5割」 2013年版の厚生労働白書案が26日、明らかになった。 白書案は「若者の意識を探る」というサブタイトルで、結婚や出 産・子育て、仕事に関する若者の意識などを分析した。  結婚については、国立社会保障・人口問題研究所の調査(20 10年)などで、〈1〉18∼39歳の未婚者の9割弱が結婚願 望を抱いている〈2〉異性の交際相手も友人もいない割合は男性 で約6割、女性で約5割に上っている――との結果になったこと などを踏まえ、白書案で「結婚相手の候補となりうる交際相手が いる若者は限定的」と指摘した。 Yomiuri Online 8月26日記事 http://www.yomiuri.co.jp/national/news/20130826-OYT1T00614.htm Saturday, October 26, 13
  3. 3. これ読んでどう思います? 5割ずつが付き合っても男性は1割余る? Saturday, October 26, 13
  4. 4. これ読んでどう思います? 5割の人たち 1割の男性 Saturday, October 26, 13
  5. 5. でも実は… 割合≠数 2010年の20歳から39歳(若者)の人口は… 男性 20∼24 3,543,000 3,359,000 25∼29 3,829,000 3,667,000 合計 Saturday, October 26, 13 女性 7,372,000 7,026,000
  6. 6. でも実は… 男性の6割=4,423,000 女性の5割=3,513,000 ↓ 差は910,000人の男性 男性の1割2分3厘 Saturday, October 26, 13
  7. 7. でも実は… 1割2分3厘の男性 Saturday, October 26, 13
  8. 8. つまり… 必要な情報を記載しましょう Saturday, October 26, 13
  9. 9. つまり… 正しく伝えるために情報を記載する必要性 Saturday, October 26, 13
  10. 10. 今回のめあて 「何」を「どう」記載すれば良いのか学ぼう Saturday, October 26, 13
  11. 11. 今回のめあて 「何」を「どう」記載すれば良いのか学ぼう 記述統計 推測統計(t検定, χ2検定, 相関分析) 効果量 検定力 Saturday, October 26, 13
  12. 12. Saturday, October 26, 13
  13. 13. そ の ま え に Saturday, October 26, 13
  14. 14. 1. 統計を使う研究法とは ・「仮説検証型」の研究 ・検証のためのツール=統計 ・検証した結果の一般化が可能 検証される仮説って? →Task 1へ Saturday, October 26, 13
  15. 15. 1.1 仮説と実験デザイン 仮説=研究目的/Research Question (できれば)仮説はYes/Noで答えられるもの Saturday, October 26, 13
  16. 16. 1.2 一般化が可能とは 標本抽出 母集団 標本 推測 Saturday, October 26, 13 →Task 2へ
  17. 17. 1.2 一般化が可能とは 母集団 偏った標本に対して推測統計を用いる場合 は、標本から母集団をどこまで広げて解釈 とするか、しっかりと考える必要があるで しょう(竹内・水本, 2012, p. 47) Saturday, October 26, 13
  18. 18. 1.2 一般化が可能とは 母集団の解釈のために被検者の記述はしっかり ・TOEICのスコアの報告だけで十分? ・附属中生は中学生全体の標本となるか? Saturday, October 26, 13
  19. 19. 1.3 結果の記述 →Task 3へ Saturday, October 26, 13
  20. 20. 1.3 結果の記述 今回はここの記述の仕方を学びます そのために統計がどういうものか学びます Saturday, October 26, 13
  21. 21. 1.4 量的研究の流れ ・大きな研究テーマの決定 ・先行研究の洗い出し。具体的なテーマの決定 ・データ収集 ・データ分析 ・解釈 Saturday, October 26, 13
  22. 22. 1.4 量的研究の流れ ・データ収集 被験者の決定、実験デザインの決定 テスト作成、実験の実施、テストの実施など ・データ分析 統計を使う(記述統計と推測統計) Saturday, October 26, 13
  23. 23. 1.4 量的研究の流れ 分析方法を考えず適当にデータを集めると… Garbage in, Garbage out Saturday, October 26, 13
  24. 24. 今回のめあて 結果の記述の仕方を学びます 統計がどういうものか学びます 使う統計を踏まえて実験デザインを考える Saturday, October 26, 13
  25. 25. 今回のめあて 記述統計 推測統計(t検定, χ2検定, 相関分析) 効果量 検定力 Saturday, October 26, 13
  26. 26. 記述統計 その前に「尺度」について… Saturday, October 26, 13
  27. 27. 2. 記述統計(1) 尺度水準・・・現象をデータとして集めるための基準 比(率)尺度 間隔尺度 順序尺度 名義尺度 Saturday, October 26, 13
  28. 28. 2. 記述統計(1) 名義尺度 性別 1.男性 2.女性 好きな教科 1.英語 2.国語 3.数学… 四則演算不可 数字を入れ替えても大丈夫 Saturday, October 26, 13
  29. 29. 2. 記述統計(1) 順序尺度 学年 1.1年生 2.2年生 3.3年生 テストの順位 四則演算不可 大小の比較はできる 数字の間隔は等間隔ではない Saturday, October 26, 13
  30. 30. 2. 記述統計(1) 間隔尺度 テストの得点 加算、除算のみ可 数字の間隔は一定 「ゼロ」は無を意味しない Saturday, October 26, 13
  31. 31. 2. 記述統計(1) 比尺度 語数 時間 四則演算可 数字の間隔が等間隔 「ゼロ」が無を意味する Saturday, October 26, 13
  32. 32. 2. 記述統計(1) 比尺度と間隔尺度は同じものとして扱う Saturday, October 26, 13
  33. 33. 2. 記述統計(1) ここで問題です! Saturday, October 26, 13
  34. 34. 2. 記述統計(1) ここで問題です! Sonobe, Ueda & Yamane (2009)の10段階評価は 何尺度でしょう? Saturday, October 26, 13
  35. 35. 2. 記述統計(1) Sonobe, Ueda & Yamane (2009)の10段階評価は 何尺度でしょう? 自粛 Saturday, October 26, 13
  36. 36. 2. 記述統計(1) Sonobe, Ueda & Yamane (2009)の10段階評価は 何尺度でしょう? Likert scaleは本来順序尺度だが、 間隔尺度と「みなして」統計処理を行う Saturday, October 26, 13
  37. 37. 2. 記述統計(1) 尺度は統計的検定の選択に大きく影響するので 正しく理解する必要があります Saturday, October 26, 13
  38. 38. 3. 記述統計(2) 「このデータの特徴は⃝⃝ですよ」と記述する統計 →Task 4へ Saturday, October 26, 13
  39. 39. 3. 記述統計(2) クラス1 クラス2 クラス3 合計 男性の人数 18 17 13 48 女性の人数 12 14 18 44 合計 30 31 31 92 被験者数=サンプルサイズ Saturday, October 26, 13
  40. 40. 3. 記述統計(2) クラス1 クラス2 クラス3 平均 366.17 402.58 509.03 中央値 367.5 405 510 最頻値 365 300 605 分散 4297.73 9969.78 9497.37 標準偏差 65.56 99.85 97.45 Saturday, October 26, 13
  41. 41. 3. 記述統計(2) データの中心を表す 平均値、中央値、最頻値 Saturday, October 26, 13
  42. 42. 3. 記述統計(2) Saturday, October 26, 13
  43. 43. 3. 記述統計(2) データの平均値を中心としたばらつきを表す 分散=標準偏差2 Saturday, October 26, 13
  44. 44. 0.08 0.10 3. 記述統計(2) 0.06 M=50 0.00 0.02 0.04 SD=5 0 Saturday, October 26, 13 20 40 60 80 100
  45. 45. 0.08 0.10 3. 記述統計(2) 0.06 M=50 0.00 0.02 0.04 SD=10 0 Saturday, October 26, 13 20 40 60 80 100
  46. 46. 0.08 0.10 3. 記述統計(2) 0.06 M=50 0.00 0.02 0.04 SD=15 0 Saturday, October 26, 13 20 40 60 80 100
  47. 47. 0.00 0.02 0.04 0.06 0.08 0.10 3. 記述統計(2) 0 Saturday, October 26, 13 20 40 60 80 100
  48. 48. 3. 記述統計(2) 記述統計のうち 少なくともMとSDは記載しましょう Saturday, October 26, 13
  49. 49. 3. 記述統計(2) 実験1 英語のテストの平均点がA組60点、B組40点で5%水準 で有意な差があった。 実験2 英語のテストの平均点がA組60点、B組40点で有意な 差がなかった。 Saturday, October 26, 13
  50. 50. 3. 記述統計(2) A組 0.08 実験1 0.10 English Test 0.04 0.06 M=60 SD=5 0.02 B組 0.00 M=40 SD=5 0 20 40 60 Score Saturday, October 26, 13 80 100
  51. 51. 3. 記述統計(2) A組 0.08 実験1 0.10 English Test 0.04 0.06 M=60 SD=5 0.02 B組 0.00 M=40 SD=5 0 20 40 60 Score Saturday, October 26, 13 80 100
  52. 52. 3. 記述統計(2) A組 0.08 実験2 0.10 English Test 0.04 0.06 M=60 SD=20 0.02 B組 0.00 M=40 SD=20 0 20 40 60 Score Saturday, October 26, 13 80 100
  53. 53. 3. 記述統計(2) A組 0.08 実験2 0.10 English Test 0.04 0.06 M=60 SD=20 0.02 B組 0.00 M=40 SD=20 0 20 40 60 Score Saturday, October 26, 13 80 100
  54. 54. 3. 記述統計(2) 数字だけではなく、 グラフを作成することも大切 →Task 5へ Saturday, October 26, 13
  55. 55. 3. 記述統計(2) 1) 48% Man Saturday, October 26, 13 52% Woman
  56. 56. 3. 記述統計(2) 30 Histogram of TOEIC_total 15 0 5 10 Frequency 20 25 2) 0 200 400 TOEIC_total Saturday, October 26, 13 600 800
  57. 57. 3. 記述統計(2) 3) Class1 Class2 Class3 0% 25% low Saturday, October 26, 13 50% middle 75% high 100%
  58. 58. 3. 記述統計(2) 0 200 400 600 800 おまけ(箱ひげ図) Saturday, October 26, 13 Box Plot
  59. 59. 3. 記述統計(2) 800 おまけ(箱ひげ図) Box Plot 600 最大値 0 200 400 3/4 Saturday, October 26, 13 1/4 中央値 最小値
  60. 60. 3. 記述統計(2) Box Plot 200 300 400 500 600 700 800 おまけ(箱ひげ図) Pre_TOEIC Saturday, October 26, 13 Post_TOEIC
  61. 61. 3. 記述統計(2) 正しくグラフを作りましょう Saturday, October 26, 13
  62. 62. 3. 記述統計(2) Saturday, October 26, 13
  63. 63. 3. 記述統計(2) Saturday, October 26, 13
  64. 64. 3. 記述統計(2) Saturday, October 26, 13
  65. 65. 3. 記述統計(2) Saturday, October 26, 13
  66. 66. 3.2 正規分布 M±1SDに約68% Saturday, October 26, 13 M±2SDに約96%
  67. 67. 3.2 正規分布 M±1.96SDの外側が合計5% Saturday, October 26, 13
  68. 68. 4.1妥当性 構成概念妥当性(ハンドアウト5ページ) 測定しようとしているものが、構成概念(直接は 測定出来ないもの)に沿っているかどうか 例えば…「英語学習への動機づけ」を見るために 「英語の先生が好きかどうか」を測定する Saturday, October 26, 13
  69. 69. 4.1妥当性 構成概念妥当性(ハンドアウト5ページ) とりあえずアンケートしてみる Saturday, October 26, 13
  70. 70. 4.1妥当性 構成概念妥当性(ハンドアウト5ページ) 測定項目の妥当性を「事前に」確かめる Saturday, October 26, 13
  71. 71. 4.2信頼性 測定を何度やっても同じ人には同じ結果が得られ るであろう精度 クロンバックのアルファ(Cronbach’s alpha) Interrater reliability 例えばスピーキングの評価を2人で行った 場合の信頼性 Saturday, October 26, 13
  72. 72. 4. 妥当性と信頼性 妥当性は事前に 信頼性は事後に それぞれ確認をする Saturday, October 26, 13
  73. 73. 今回のめあて 記述統計 推測統計(t検定, χ2検定, 相関分析) 効果量 検定力 Saturday, October 26, 13
  74. 74. 今回のめあて 推測統計(t検定, χ2検定, 相関分析) Saturday, October 26, 13
  75. 75. 母集団 標本 推測 Saturday, October 26, 13
  76. 76. 記述統計 母集団 標本 推測 Saturday, October 26, 13
  77. 77. 記述統計 母集団 標本 推測 推測統計 Saturday, October 26, 13
  78. 78. 1. 統計を使う研究法とは おさらい ・「仮説検証型」の研究 ・仮説の検証のためのツール=推測統計 ・検証した結果の一般化が可能 Saturday, October 26, 13
  79. 79. 1. 統計を使う研究法とは おさらい ・「仮説検証型」の研究 ・仮説の検証のためのツール=推測統計 ・検証した結果の一般化が可能 Saturday, October 26, 13
  80. 80. 5.1 帰無仮説と対立仮説 帰無仮説(null hypothesis, H0) 対立仮説(alternative hypothesis, H1) Saturday, October 26, 13
  81. 81. 5.1 帰無仮説と対立仮説 帰無仮説(null hypothesis, H0) 男女で英語のテストの平均点に差はない 対立仮説(alternative hypothesis, H1) 男女で英語のテストの平均点に差がある Saturday, October 26, 13
  82. 82. 5.1 帰無仮説と対立仮説 推測統計の考え方(ざっくり) 得られたデータの下で帰無仮説が正しい確率を求め る。その確率がとても小さい(5%未満)ならば帰 無 仮 説 が 正 し い と は 考 えず ( 帰 無 仮 説 を 棄 却 す る)、対立仮説が正しいと考える(対立仮説を採択 する)。 Saturday, October 26, 13
  83. 83. 5.1 帰無仮説と対立仮説 推測統計の考え方(ざっくり) 「差がない」という帰無仮説を棄却した場合、 「差がある」のではなく、「差がないとはいえ ない」が正しい 帰無仮説が正しい確率=p値 5%=有意水準 Saturday, October 26, 13
  84. 84. 5.2 第1種&第2種の過誤 真の結果 研究結果 差がない 差がある 有意差なし 正しい判断(1-α) 第2種の過誤(β) 有意差あり 第1種の過誤(α) 正しい判断(1-β) Saturday, October 26, 13
  85. 85. 5.2 第1種&第2種の過誤 第1種の過誤 本当は差がないのに、統計で差がある という結果になる 女の子はBoyのことを本当は好きじゃない 数々のデータから「自分のこと好きなんだ」 と結論を導き出してしまう勘違いBoy Saturday, October 26, 13
  86. 86. 5.2 第1種&第2種の過誤 第1種の過誤 本当は差がないのに、統計で差がある という結果になる 確率は5% (=α) Saturday, October 26, 13
  87. 87. 5.2 第1種&第2種の過誤 第2種の過誤 本当は差があるのに、統計で差がない という結果になる 女の子はBoyのことを本当に好き 数々のデータから「自分のこと好きじゃな い」と結論を導き出してしまうドン臭いBoy Saturday, October 26, 13
  88. 88. 5.2 第1種&第2種の過誤 第2種の過誤 本当は差があるのに、統計で差がない という結果になる 確率は20% (=β) Saturday, October 26, 13
  89. 89. 推測統計(t検定, χ2検定, 相関分析) 「差があるかどうか」を見る検定 「関係があるかどうか」を見る検定 Saturday, October 26, 13
  90. 90. 6.1差の検定 対応のないt検定 対応のあるt検定 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 2検定 χ Saturday, October 26, 13
  91. 91. 6.1.1 t検定 対応のないt検定 対応のあるt検定 2つのグループの平均値の差を見る検定 Saturday, October 26, 13
  92. 92. 6.1.1 t検定 例えば、1学期期末テストの平均点がA組68 点、B組78点でした。この10点の差は統計的 に差があると言えるのか。 Saturday, October 26, 13
  93. 93. 6.1.1 t検定 0.03 0.04 English test A-B 0.00 0.01 差がなければ… 0.02 差があれば… 0 20 40 60 Test score Saturday, October 26, 13 80 100
  94. 94. 6.1.1 t検定 正規性が確保されているか (母集団が正規分布かどうか) 間隔尺度以上か 2グループのサンプルサイズに偏りがないか 2グループの分散が等しいか(等分散か) Saturday, October 26, 13
  95. 95. 6.1.1 t検定 対応のないt検定 対応のあるt検定 対応のない=異なる2グループが       1つのテストを受けた場合 対応のある=同じ1グループが       1つのテストを2回受けた場合 Saturday, October 26, 13
  96. 96. 6.1.1 t検定 「対応のない」の例 A組 B組 Saturday, October 26, 13 授業 言語能力 テスト
  97. 97. 6.1.1 t検定 「対応のある」の例(pre-postデザイン) A組 Pretest 言語能力 テスト Saturday, October 26, 13 授業 Posttest 言語能力 テスト
  98. 98. 6.1.1 t検定 2つを組み合わせたデザイン A組 B組 Saturday, October 26, 13 Pretest 言語能力 テスト 授業 Posttest 言語能力 テスト
  99. 99. 6.1.1 t検定 2つを組み合わせたデザイン A組 B組 Pretest 言語能力 テスト 授業 Posttest 言語能力 テスト これはt検定では分析できない Saturday, October 26, 13
  100. 100. 6.1.1 t検定 →Task 6へ →Task 7へ Saturday, October 26, 13
  101. 101. 6.1.1 t検定 Task6 H0:男女の間でTOEICのスコアに差はない H1:男女の間でTOEICのスコアに差がある 結果:男女の間でTOEICのスコアに差があるか どうか対応のないt検定を用いて分析した結 果、男女の間でTOEICのスコアに有意な差は ないことが明らかとなった (t(90)=.53, p=.60) Saturday, October 26, 13
  102. 102. 6.1.1 t検定 Task7 H0:実験の前後でTOEICのスコアに差がない H1:実験の前後でTOEICのスコアに差がある 結果:実験の前後でTOEICのスコアに差があるか どうか対応のあるt検定を用いて分析した結 果、実験の前後でTOEICのスコアに有意な差が あることが明らかとなった (t(91)=-2.61, p=.01) Saturday, October 26, 13
  103. 103. 6.1差の検定 対応のないt検定 対応のあるt検定 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 2検定 χ Saturday, October 26, 13
  104. 104. 6.1.2 一元配置分散分析 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 3つ以上のグループの平均値の差を見る検定 Saturday, October 26, 13
  105. 105. 6.1.2 一元配置分散分析 例えば、1学期期末テストの平均点がA組68 点、B組78点、C組45点。この3つのグルー プの差は統計的に差があると言えるのか。 Saturday, October 26, 13
  106. 106. 6.1.2 一元配置分散分析 0.00 0.01 0.02 0.03 0.04 English test A-B 0 20 40 60 Test score Saturday, October 26, 13 80 100
  107. 107. 6.1.2 一元配置分散分析 正規性が確保されているか 間隔尺度以上か 3グループ以上のサンプルサイズに偏りがないか 等分散であるか Saturday, October 26, 13
  108. 108. 6.1.2 一元配置分散分析 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 繰り返しのない=異なる3グループ以上が       1つのテストを受けた場合 繰り返しのある=同じ1グループが     1つのテストを3回以上受けた場合 Saturday, October 26, 13
  109. 109. 6.1.2 一元配置分散分析 「繰り返しのない」の例 A組 B組 C組 Saturday, October 26, 13 授業 言語能力 テスト
  110. 110. 6.1.2 一元配置分散分析 「繰り返しのある」の例 A組 test1 授業 test2 授業 test3 分散分析と多重比較について (ハンドアウトp.10) Saturday, October 26, 13
  111. 111. 6.1.2 一元配置分散分析 分散分析 A組 test1 多重比較 Saturday, October 26, 13 授業 test2 授業 test3
  112. 112. 6.1.2 一元配置分散分析 結局t検定を 繰り返しているだけ じゃないか! ハンドアウトp. 9 Saturday, October 26, 13
  113. 113. 6.1.2 一元配置分散分析 第1種の過誤 本当は差がないのに、統計で差がある という結果になる 確率は5% (=α) Saturday, October 26, 13
  114. 114. 6.1.2 一元配置分散分析 Sonobe, Ueda, & Yamane (2009)は… 実験群 Pretest 指導 Posttest 統制群 差がなかった Saturday, October 26, 13 差があった
  115. 115. 6.1.2 一元配置分散分析 Saturday, October 26, 13
  116. 116. 6.1.2 分散分析 繰り返しのない二元配置分散分析 繰り返しのある二元配置分散分析 2要因混合計画の分散分析 多元配置分散分析 Saturday, October 26, 13
  117. 117. 6.1差の検定 対応のないt検定 対応のあるt検定 繰り返しのない一元配置分散分析(ANOVA) 繰り返しのある一元配置分散分析(ANOVA) 2検定 χ Saturday, October 26, 13
  118. 118. 6.1.3 2検定 χ 適合度検定 独立性の検定 Saturday, October 26, 13 2検定 χ
  119. 119. 6.1.3 2検定 χ 2検定 適合度検定 χ 例えば... 生徒の最も好きな教科の選択に差があるのか 国語 数学 英語 理科 社会 55 30 13 74 58 被験者数 230 Saturday, October 26, 13
  120. 120. 6.1.3 2検定 χ 2検定 適合度検定 χ 名義尺度のデータを扱う検定 国語 数学 英語 理科 社会 55 30 13 74 58 Saturday, October 26, 13
  121. 121. 6.1.3 2検定 χ 2検定 適合度検定 χ データが名義尺度であるか データが累積の頻度であるか データが独立しているか    が5以上であるか 期待値 Saturday, October 26, 13
  122. 122. 6.1.3 2検定 χ 2検定 適合度検定 χ 期待値 同じように選択されると仮定した場合の値 つまり「差がない」と仮定した場合の値 国語 実測値 55 期待値 46 被験者数 230 Saturday, October 26, 13 数学 30 46 英語 13 46 理科 74 46 社会 58 46
  123. 123. 6.1.3 2検定 χ 2検定 適合度検定 χ 実測値と期待値がどれだけ離れているかを 検定し、全体として差があるかどうか見る Saturday, October 26, 13
  124. 124. 6.1.3 2検定 χ 2検定 適合度検定 χ 実測値と期待値がどれだけ離れているかを 検定し、全体として差があるかどうか見る どこが多くてどこが少ないのかは、 多重比較を用いて分析(今回は扱わない) Saturday, October 26, 13
  125. 125. 6.1.3 2検定 χ 適合度検定 独立性の検定 Saturday, October 26, 13 2検定 χ
  126. 126. 6.1.3 2検定 χ 2検定 独立性の検定 χ 例えば... 男女ごとで最も好きな教科の選択に違いがあるか 男子 女子 Saturday, October 26, 13 国語 11 34 数学 25 5 英語 6 7 理科 40 34 社会 16 42
  127. 127. 6.1.3 2検定 χ 2検定 独立性の検定 χ 期待値 実測値 国語 男子 女子 合計 11 44 55 数学 英語 理科 社会 合計 25 6 40 16 98 5 7 34 42 132 30 13 74 58 230 期待値 x : 98 = 55 : 230     x = (55 × 98) ÷ 230 Saturday, October 26, 13
  128. 128. 6.1.3 2検定 χ 2検定 独立性の検定 χ 期待値 実測値 国語 男子 女子 合計 11 44 55 数学 英語 理科 社会 合計 25 6 40 16 98 5 7 34 42 132 30 13 74 58 230 期待値 x : 98 = 55 : 230     x = (55 × 98) ÷ 230 Saturday, October 26, 13
  129. 129. 6.1.3 2検定 χ 2検定 独立性の検定 χ 期待値 男女に関係なく教科が選ばれた場合の値 つまり、性別と教科の選択に関係がないと 仮定した場合の値 Saturday, October 26, 13
  130. 130. 6.1.3 2検定 χ 2検定 独立性の検定 χ 2つの変数(性別・好きな教科)は 関係があるかどうかを見る検定 もし関係があれば、どこかが多くなり、 どこかが少なくなるかも… →残差分析を用いて分析 Saturday, October 26, 13
  131. 131. 6.1.3 2検定 χ →Task 8へ →Task 9へ Saturday, October 26, 13
  132. 132. 6.1.3 2検定 χ Task8 H0:母語別の被験者数に差はない H1:母語別の被験者数に差がある 結果:母語別の被験者数に差があるかどうか 2検定を用いて分析した結果、被験者数に有 χ 意な差があった Saturday, October 26, 13 2(2)=16.80, p=.00) (χ
  133. 133. 6.1.3 2検定 χ Task9 H0:性別と実験の効果の有無は独立である H1:性別と実験の効果の有無は独立でない 結果:性別と実験の効果の有無に関係がある 2検定用いて分析した結果、性別と かどうかχ 実験の効果の有無に有意な関係があることが 明らかとなった (χ2(1)=5.53, p=.02) Saturday, October 26, 13
  134. 134. 6.1関係の検定 相関分析(ピアソン積率相関) Saturday, October 26, 13
  135. 135. 6.1関係の検定 相関分析(ピアソン積率相関) 例えば… 中学生の国語と英語のテストの間に相関関係 があるかどうか Saturday, October 26, 13
  136. 136. 6.1関係の検定 相関分析(ピアソン積率相関) 間隔尺度以上 (厳密には)正規性が確保されている Saturday, October 26, 13
  137. 137. 6.1関係の検定 相関分析(ピアソン積率相関) ピアソン積率相関係数 r r = ± .70∼1.0 r = ± .40∼.70 中程度の相関あり r = ± .20∼.40 弱い相関あり r = ± .00∼.20 Saturday, October 26, 13 強い相関あり 相関なし
  138. 138. 相関 r = .00 Saturday, October 26, 13
  139. 139. 相関 r = .25 Saturday, October 26, 13
  140. 140. 相関 r = .50 Saturday, October 26, 13
  141. 141. 相関 r = .75 Saturday, October 26, 13
  142. 142. 相関 r = .90 Saturday, October 26, 13
  143. 143. 相関 r = 1.00 Saturday, October 26, 13
  144. 144. 6.1関係の検定 相関分析(ピアソン積率相関) しかし、「どういう相関関係か」と「統計的 に有意な相関関係があるか」は別問題。 →帰無仮説・対立仮説(ハンドアウトp. 13) Saturday, October 26, 13
  145. 145. 6.1関係の検定 相関分析(ピアソン積率相関) 相関関係を視覚的に見るために散布図を! →Task 10へ Saturday, October 26, 13
  146. 146. 6.1関係の検定 Task10 H0:国語と英語の得点の間に相関がない H1:国語と英語の得点の間に相関がある 結果:国語の得点と英語の得点の間に相関関 係があるかどうか相関分析を行った結果、2 つの得点の間に強い正の相関関係があった (r=.72, p=.00) Saturday, October 26, 13
  147. 147. 6.1関係の検定 Task10 100 Scatter Plot 90 ● ● ● ● ● 80 ● 70 ● ● ● ● 60 English ● ● ● ● ● 50 ● ● ● 40 ● ● 20 30 40 50 60 Japanese Saturday, October 26, 13 70 80 90
  148. 148. 6.1関係の検定 Task10 100 Scatter Plot 90 ● ● ● ● ● 80 ● 70 ● ● ● ● 60 English ● ● ● ● ● 50 ● ● ● 40 ● ● 20 30 40 50 60 Japanese Saturday, October 26, 13 70 80 90
  149. 149. 8 実践してみよう →Task 11へ →Task 12へ Saturday, October 26, 13
  150. 150. 9.1効果量 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Saturday, October 26, 13 Diff p value 2.00 .374 Diff p value 2.00 .046
  151. 151. 9.1効果量 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Group Group 1 Group 2 M 50.00 52.00 SD 10.00 10.00 Saturday, October 26, 13 Diff 2.00 Diff 2.00 n 20 20 p value n 200 200 p value .374 .046
  152. 152. 9.1効果量 サンプルサイズが大きいと、有意になりやすい Group Group 1 Group 2 Saturday, October 26, 13 M 50.00 52.00 SD 10.00 10.00 Diff 2.00 n 200 200 p value .046
  153. 153. 9.1効果量 サンプルサイズに左右されず、 実験の「効果」を見るにはどうすれば… Saturday, October 26, 13
  154. 154. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 Group A Group B 70 57 52 79 38 64 59 55 58 76 61 61 48 43 76 89 28 90 45 51 54 58 68 71 58 38 63 63 38 38 69 41 42 43 43 41 47 58 51 83 78 60 36 93 68 48 51 47 40 45 39 37 50 24 71 52 68 36 26 41 あるテストの結果 Saturday, October 26, 13
  155. 155. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 平均点 Group A 52.1 Group B < 57.1 Group B の方が優秀? Saturday, October 26, 13
  156. 156. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 9" 8" 7" 6" 5" Group"A" 4" Group"B" 3" 2" 1" 0" 0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100" 「差」ではなく「重なり」を見よう Saturday, October 26, 13
  157. 157. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 (吉田, 1998, p. 173) Saturday, October 26, 13
  158. 158. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 差は同じ (吉田, 1998, p. 173) Saturday, October 26, 13
  159. 159. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 重なりの量が違う Saturday, October 26, 13
  160. 160. 浦野研先生の日本第二言語習得学会2013年度夏季セミナー投影資料を加筆 http://www.urano-ken.com/blog/2013/08/19/j-sla2013-workshop/ 9.1効果量 9" 8" 7" 6" 5" Group"A" 4" Group"B" 3" 2" 1" 0" 0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100" この重なりは多いの?少ないの? Saturday, October 26, 13
  161. 161. 9.1効果量 この重なりは多いの?少ないの? 重なりの大小を示す指標=効果量 Saturday, October 26, 13
  162. 162. 9.1効果量 この重なりは多いの?少ないの? 重なりの大小を示す指標=効果量 水本・竹内(2008, p. 62)へ Saturday, October 26, 13
  163. 163. 9.1効果量 Task6 H0:男女の間でTOEICのスコアに差はない H1:男女の間でTOEICのスコアに差がある 結果:男女の間でTOEICのスコアに差があるかど うか対応のないt検定を用いて分析した結果、 男女の間でTOEICのスコアに有意な差はないこ とが明らかとなった (t(90)=.53, p=.60, d=.11) Saturday, October 26, 13
  164. 164. 9.1効果量 Task7 H0:実験の前後でTOEICのスコアに差がない H1:実験の前後でTOEICのスコアに差がある 結果:実験の前後でTOEICのスコアに差があるか どうか対応のあるt検定を用いて分析した結果、 実験の前後でTOEICのスコアに有意な差がある ことが明らかとなった (t(91)=-2.61, p=.01, Δ=.57) Saturday, October 26, 13
  165. 165. Sonobe, Ueda, & Yamane (2009) の結果 Post-practice 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 0.4 0.4 0.5 0.5 0.6 0.6 Pre-practice 2 4 6 Evaluation 8 10 2 4 6 Evaluation 赤:実験群 青:統制群 Saturday, October 26, 13 8 10
  166. 166. Sonobe, Ueda, & Yamane (2009) の結果 Post-practice 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 0.4 0.4 0.5 0.5 0.6 0.6 Pre-practice 2 4 6 8 Evaluation Cohen’s d=0.21 Saturday, October 26, 13 10 2 4 6 8 Evaluation Cohen’s d=1.18 10
  167. 167. 9.2検定力 事前の検定力分析 事後の検定力分析 Saturday, October 26, 13
  168. 168. 9.2検定力 有意確率 (α) 効果量 Saturday, October 26, 13 サンプル サイズ 検定力 (1-β)
  169. 169. 9.2検定力 5% ? 有意確率 (α) 中程度 サンプル サイズ 効果量 検定力 (1-β) 事前の検定力分析 Saturday, October 26, 13 80%
  170. 170. 9.2検定力 事前の検定力分析 適切な検定力(80%)を得るためには、いく つのサンプルサイズにすれば良いのかを分析 する Saturday, October 26, 13
  171. 171. 9.2検定力 有意確率 (α) 効果量 Saturday, October 26, 13 サンプル サイズ 検定力 (1-β)
  172. 172. 9.2検定力 n 5% 有意確率 (α) d サンプル サイズ 効果量 検定力 (1-β) 事後の検定力分析 Saturday, October 26, 13 ?
  173. 173. 9.2検定力 事後の検定力分析 被験者数、データから効果量を用いて、実験 における検定力を得るために行う分析 Saturday, October 26, 13

×