理科教育学研究のための統計分析⼊⾨
⽇本体育⼤学
雲財 寛
2020/12/19
⽇本理科教育学会若⼿育成TF
第1回 オンラインセミナー
誰︖ 2
名前︓雲財 寛(うんざい ひろし)
研究内容︓科学的推論,モデル,認知欲求
⽅法論︓⼼理統計 など
SNSやってます︕
気軽にフォローしてください ︕
雲財 寛
統計分析で何ができるのか 3
● 評価⽅法 を開発することができる
● ⼦供や教師の実態 を量的に明らかにできる
● 教育実践の効果 を量的に明らかにできる
● 研究成果 を量的に統合することができる
t 検定
分散分析
共分散構造分析
𝜒! 検定
項⽬反応理論
メタ分析
共分散分析
因⼦分析
相関分析 回帰分析
クラスター分析
重回帰分析
など
本⽇はコレ
本⽇はコレ
雲財ら(2020,p.248)
本⽇の事例(架空) 4
事例. 指導前後におけるテストの得点の変化は︖
⽬的︓○○を育成することを⽬指した指導法を考案し,その効果を検証した
⽅法︓指導法を実践し,実践前後に○○を測定する10点満点のテストを実施した
対象︓T 県の⼩学校第 6 学年 1 クラスの児童 40 名
結果︓次のスライド
事前テストと事後テストのローデータ 5
id 事前テスト 事後テスト
1 7 8
2 4 6
3 6 8
4 6 7
5 3 7
6 4 8
7 6 9
8 5 7
9 6 7
10 5 7
11 4 6
12 7 8
13 4 6
14 6 7
15 4 5
16 7 7
17 5 5
18 4 7
19 5 5
20 7 8
id 事前テスト 事後テスト
21 5 8
22 5 7
23 4 5
24 5 7
25 6 8
26 6 7
27 5 6
28 5 7
29 6 5
30 5 7
31 6 7
32 4 6
33 6 8
34 4 5
35 5 7
36 5 7
37 4 7
38 5 6
39 6 8
40 4 7
「結果と分析」に書きそうな⽂章 6
指導の前後に実施した○○テストの平均値と標準偏差は表のようになった。
事前と事後のテストの得点に差があるかを明らかにするため,
対応のある t 検定を⾏った。
その結果,事前と事後の得点に有意な差がみられた(t (39) = 10.12, p = 0.00)。
平均値(標準偏差)
事前 5.15(1.03)
事後 6.83(1.03)
表 テストの得点(n = 40)
有意な差がみられたってなに︖
対応のある t 検定ってなに︖
なぜ平均値と標準偏差を⽰すの︖
何を話し,何を話さないか 7
●話すこと
ー統計の基本的な考え⽅
ー統計的仮説検定(少し気が重い話もします)
→初学者にありがちな誤解・誤⽤を⾃戒を込めて説明する
●話さないこと
ー調査・研究のデザイン
ー⾼度な統計分析
本⽇の内容 8
1.統計分析とは
ー記述統計と推測統計
ー⺟集団と標本
2.基本統計量の算出
ー尺度の種類
ー代表値(平均値,中央値,最頻値)
ー散布度(分散,標準偏差)
3.確率変数と確率分布
ー確率変数と確率分布
4.統計的仮説検定
ー統計的仮説検定とは
ー検定の⼿順
ー留意事項
5.演習
ー対応のある t 検定
6.おわりに
ー p 値の取り扱い
ー健全な科学の発展のために
記述統計と推測統計 9
⺟集団
無作為抽出
(ランダムサンプリング)
推測統計
記述統計
標本
⺟集団の特徴を推測する
標本の特徴を記述(要約)する
出⼝調査
当確予想
A⽒ B⽒
例.選挙の当確予想
本⽇の内容 10
1.統計分析とは
ー記述統計と推測統計
ー⺟集団と標本
2.基本統計量の算出
ー尺度の種類
ー代表値(平均値,中央値,最頻値)
ー散布度(分散,標準偏差)
3.確率変数と確率分布
ー確率変数と確率分布
4.統計的仮説検定
ー統計的仮説検定とは
ー検定の⼿順
ー留意事項
5.演習
ー対応のある t 検定
6.おわりに
ー p 値の取り扱い
ー健全な科学の発展のために
尺度の種類 11
●尺度︓数量化されたデータ
●名義尺度 < 順序尺度 < 間隔尺度 < ⽐率尺度の順で⽔準(精密さ)が⾼くなる
尺度の⽔準 イメージ 例 可能な計算
質的
データ
名義尺度
A B C
(質的な差異)
ID,クラス
順序尺度
A<B<C
(順位)
テストの順位,
成績の5段階評価
⼤⼩関係の⽐較
量的
データ
間隔尺度
A<B<C
(順位&等間隔)
テストの点数,気温 +,ー
⽐率尺度
0<A<B<C
(順位&等間隔&原点)
⾝⻑,質量 ×,÷,+,ー
尺度の⽔準によって,可能となる統計処理が異なるので注意が必要
Stevens(1946),⼭⽥・村井(2004,p.24)⼩塩(2004,p.2)を参考
尺度の扱いに関する留意事項 12
●「1,2,3,4,5」で回答する5件法のデータは,厳密に⾔うと「順序尺度」である。
しかし,便宜的に「間隔尺度」とみなして取り扱っている。
代表値 13
記述統計
⼿元にある標本の特徴,つまりデータの分布を知りたい
そのデータを代表する値(代表値)がほしい!!
代表値の種類
平均値(mean) ︓データの値をすべて合計してデータ数で割った値(算術平均)
中央値(median) ︓データを昇順/または降順に並び替えたときの真ん中の値
データ数が偶数のときは中央の2つの値の平均
最頻値(mode) ︓最も出現頻度の⾼い値
代表値の計算 14
問題
5⼈に実施した理科のテスト(100点満点)の結果は,次のようになった。
平均値,中央値,最頻値をもとめよ。
10,10,20,25,100
答え
平均値︓33,中央値︓20,最頻値︓10
代表する値として
適切なのは どれ︖
代表値の指標とその特徴 15
⼭⽥・村井(2004,p.33)を⼀部改
⻑所 短所
平均値
データをすべて⽤いるため,
データのもつ情報を有効に使っている
外れ値の影響をうけやすい
中央値 外れ値の影響をうけにくい
中央値よりも⼤きなものと⼩さなものが
どのような値でも,それらの点は中央値
には反映されない
最頻値 外れ値の影響をうけにくい
最頻値が分布の端に位置した場合,
データを適切に代表するとはいいがたい
平均値は同じでも… 16
平均値︓50
平均値︓50
分布が違う?????
散布度 17
●代表値 だけではデータの分布を適切に記述できない
●データの散らばりを⽰す指標(「散布度」という)がほしい
●具体例で考えてみる。
例.児童5⼈に10点満点の○○テストを実施したら,次のようになった
{1, 3, 5, 8, 10}
数直線で考えると… 18
5 8 1031
5.4
平均値
●各データの平均からの距離(偏差)を計算する
1 - 5.4 = -4.4
3 - 5.4 = -2.4
5 - 5.4 = -0.4
8 - 5.4 = 2.6
10 - 5.4 = 4.6
偏差を平均したら0になってしまう。
どうすれば・・・
データの散布度を計算する 19
●それぞれの偏差を⼆乗する(偏差平⽅)
−4.4 ! = 19.36 , −2.4 ! = 5.76 , −0.4 ! = 0.16 , 2.6 ! = 6.76 , 4.6 ! = 21.16
●偏差平⽅を合計し,データ数で割る(偏差平⽅和をデータ数で割る)
19.36 + 5.76 + 0.16 + 6.76 + 21.16
5
= 𝟏𝟎. 𝟔𝟒
●分散は⼆乗した値で扱いづらいので,分散の平⽅根を計算する
10.64 = 𝟑. 𝟐𝟔
分散
標準偏差
⾔葉の式で整理する 20
偏差 = データ ー 平均
偏差平⽅ = 偏差 !
偏差平⽅和 = 偏差平⽅を全て⾜し合わせた合計
分散 = 偏差平⽅和 ÷ データ数
標準偏差 = 分散
5 8 1031
5.4
平均
基本統計量のまとめ 21
●得られたデータの分布を簡潔に把握したい︕
●でも,代表値ではデータの散布度がわからないので・・・
補⾜︓散布度はほかにも⾊々(例えば,最⼤値・最⼩値など)
代表値(平均値,中央値,最頻値)を算出する︕
分散や標準偏差も算出する︕
冒頭の問いに対する回答 22
Q. なぜ平均値や標準偏差を⽰すのか︖
今回調査した標本の特徴,つまりデータの分布を⽰すため。
データの分布を⽰す代表値と散布度を基本統計量という。
今回は,代表値として平均値(M),散布度として標準偏差(sd)を⽰した。
検定はこれらの基本統計量をもとに計算する。
これらの基本統計量は,研究と研究を統合するメタ分析にも使われる
基本統計量のまとめ 23
Excelで
平均値や標準偏差を
算出してみよう
データセット(再掲) 24
id 事前テスト 事後テスト
1 7 8
2 4 6
3 6 8
4 6 7
5 3 7
6 4 8
7 6 9
8 5 7
9 6 7
10 5 7
11 4 6
12 7 8
13 4 6
14 6 7
15 4 5
16 7 7
17 5 5
18 4 7
19 5 5
20 7 8
id 事前テスト 事後テスト
21 5 8
22 5 7
23 4 5
24 5 7
25 6 8
26 6 7
27 5 6
28 5 7
29 6 5
30 5 7
31 6 7
32 4 6
33 6 8
34 4 5
35 5 7
36 5 7
37 4 7
38 5 6
39 6 8
40 4 7
やってみよう 25
●今回は Excel のアドイン「データ分析」を使う
●クリックカチカチ で基本的な集計や分析を⾏うことができる
●表⽰の⽅法
Windows︓ファイル → オプション → アドイン → 設定 → 分析ツールにチェック → OK
Mac︓ ツール → Excel アドイン → 有効なアドインの 分析ツール に チェック → OK
→「データ」タブに 「データ分析」 が表⽰される
基本統計量を算出する 26
●平均値や標準偏差などを「基本統計量」という
●「データ」タブ データ分析 → 基本統計量 → OK
基本統計量を算出する 27
●変数「事前テスト」の基本統計量を求めてみる
●⼊⼒範囲に B列 を指定し,「先頭⾏をラベルとして使⽤」にチェック
●「統計情報」にチェック,「OK」をクリック
基本統計量を算出する 28
●新しいシートに事前テストの基本統計量が表⽰される
●複数の列を指定すると,まとめて算出できる
⼩数点の調整
基本統計量を算出する 29
●なんかうじゃうじゃ出てきたけど・・・
尖度(せんど)
分布がどれだけ尖っているかを表す統計量
歪度(わいど)
分布がどれだけ歪んでいるかを表す統計量
「3-5 歪度と尖度」より
thttps://bellcurve.jp/statistics/course/17950.html
本⽇の内容 30
1.統計分析とは
ー記述統計と推測統計
ー⺟集団と標本
2.基本統計量の算出
ー尺度の種類
ー代表値(平均値,中央値,最頻値)
ー散布度(分散,標準偏差)
3.確率変数と確率分布
ー確率変数と確率分布
4.統計的仮説検定
ー統計的仮説検定とは
ー検定の⼿順
ー留意事項
5.演習
ー対応のある t 検定
6.おわりに
ー p 値の取り扱い
ー健全な科学の発展のために
確率変数と確率分布 31
確率変数
「どういう確率でどういう値を取るか」を⽰す変数
ー離散型確率変数︓サイコロを振ったときに出る⽬の数 X
ー連続型確率変数︓ある⽜丼屋の「⽜丼 並盛」における具の量 Y
確率分布
確率変数の分布。偉い⼈によって様々な確率分布が定式化されている
例.正規分布,t 分布など(詳しくは次のスライド)
確率
変数
1 2 3 4 5 6
確率
1
6
1
6
1
6
1
6
1
6
1
6
確率分布表
正規分布
「⽬の数が1になる確率は
"
#
」 と読む例. 𝑃 𝑋 = 1 =
1
6
「⽜丼並盛における具の量が,68g から72gになる確率は 0.95(95%)」 と読む例. 𝑃 68 ≤ 𝑌 ≤ 72 = 0.95
確率分布の⾊々 32
確率分布
離散型
連続型
⼀様分布
⼆項分布
ポアソン分布
正規分布
z分布(標準正規分布)
𝝌 𝟐分布
t 分布
F 分布
栗原(2012,p.26)
正規分布 t 分布
(df = 20)
𝝌 𝟐 分布
(df = 5)
F 分布(df1 = 2, df2 = 9)
確率分布は下記リンクから作成
(https://statdist.ksmzn.com/)
⼆項分布 ポアソン分布⼀様分布
なぜ確率分布の話をしたのか 33
推測統計
標本抽出を繰り返し,⼿に⼊れた標本の特徴から,⺟集団の特徴を推測する
なんだけれでも・・・
●通常,1回の調査では1つの標本しか⼿に⼊れることはできない
●複数の標本を使わずに,1つの標本からでも,うまく⺟集団の分布を推測する「仕組み」がほしい
●そこで,⺟集団を「特定の確率分布にしたがう⼀種のデータ発⽣装置」とみなす
⼭⽥・村井(2004,p.75),南⾵原(2003, pp.88-91)を参考
なぜ確率分布の話をしたのか 34
●たとえば,⺟集団が正規分布にしたがっていると仮定すると,
標本統計量の分布(「標本分布」という)も正規分布にしたがうことが数理的にわかっている
●これを利⽤して,⺟集団の特徴を推測することができる
⼭⽥・村井(2004,p.79)⼀部改
⺟集団
⺟平均 µ
標本1
標本2
標本 k
4𝑋 = ̅𝑥"
4𝑋 = ̅𝑥!
4𝑋 = ̅𝑥4
︙⺟集団分布に
正規分布を仮定すると, 標本統計量の分布(標本分布)も
正規分布になる。
標本統計量(標本平均)
ややこしい⽤語の確認 35
⼭⽥・村井(2003,p.90)を⼀部改
名称 意味 利⽤される⽂脈
⺟集団分布
⺟集団に属するすべての値の分布。
正規分布などの確率分布を仮定する。
推測統計
標本分布
標本に関する統計量の分布。
⺟集団分布の仮定により,数理的に導かれる確率分布。
推測統計
度数分布
(ヒストグラム)
実際に得られたデータについて作成される。
データの値と度数を対応させたもの。
記述統計
本⽇の内容 36
1.統計分析とは
ー記述統計と推測統計
ー⺟集団と標本
2.基本統計量の算出
ー尺度の種類
ー代表値(平均値,中央値,最頻値)
ー散布度(分散,標準偏差)
3.確率変数と確率分布
ー確率変数と確率分布
4.統計的仮説検定
ー統計的仮説検定とは
ー検定の⼿順
ー留意事項
5.演習
ー対応のある t 検定
6.おわりに
ー p 値の取り扱い
ー健全な科学の発展のために
【再掲】記述統計と推測統計 37
⺟集団
無作為抽出
(ランダムサンプリング)
推測統計
記述統計
標本
⺟集団の特徴を推測する
標本の特徴を記述(要約)する
出⼝調査
当確予想
A⽒ B⽒
例.選挙の当確予想
推測統計の基本的な考え⽅ 38
●標本に関する統計量を 標本統計量 という
例.標本平均 ̅𝑥 ,標本分散 𝑠! ,標本標準偏差 s	など
●標本統計量を必要に応じて補正して,⺟集団の特徴を推測する
●確率分布を使って推測したいのは, ⺟数(パラメータ)である。
例.⺟平均 𝜇,⺟分散 𝜎!,⺟標準偏差 𝜎 など
標本統計量と⺟数 39
⺟集団
標本
標本平均 ︓ ̅𝑥
標本分散 ︓𝑠!
標本標準偏差︓s
⺟平均 ︓𝜇
⺟分散 ︓𝜎!
⺟標準偏差︓𝜎
標本統計量
⺟数(パラメータ)
「必要に応じて」とはどういうことか 40
●標本から計算した散布度の統計量には,
標本の散布度(標本分散 𝒔 𝟐,標本標準偏差 s)≦ ⺟集団の散布度(⺟分散 𝝈 𝟐,⺟標準偏差 𝝈)
という性質があるので,これを踏まえて補正する。
たとえば,標本分散から⺟分散を推定する場合,
データ数の n ではなく,データ数から 1 を引いた「n - 1」で割ることで補正する。
この統計量を 不偏分散 という 。
標本分散 =
偏差平⽅和
データ数
不偏分散 =
偏差平⽅和
データ数ー1 栗原(2012,pp.45-46)
標本統計量・不偏推定量・⺟数 41
⺟集団
標本
標本平均 ︓ ̅𝑥
標本分散 ︓𝑠!
標本標準偏差︓s
不偏平均 ︓)𝜇
不偏分散 ︓*𝜎!
不偏標準偏差︓ )𝜎
⺟平均 ︓𝜇
⺟分散 ︓𝜎!
⺟標準偏差︓𝜎
標本統計量
⺟数(パラメータ)
不偏推定量
統計的仮説検定とは 42
●「標本」から得られたデータの特徴が,
「⺟集団」にも当てはまるかどうかを確率的に判定する⼿段
●確率的に判定するために,正規分布や t 分布などの「確率分布」を使う
●検定は,ざっくり⾔えば背理法のロジックを使う
【補⾜】背理法 43
𝟐 が無理数であることを証明するとき
1. 2を有理数と仮定する。
2.その仮定で考えると,⽭盾することが起きる(証明略)
3.仮定が間違っていたので,仮定を棄却する。よって, 2 は無理数
検定の⼿順 44
① 仮説(帰無仮説と対⽴仮説)を設定する
② 検定に⽤いられる標本統計量(検定統計量)を選択する
③ 仮説が間違っているか正しいかの判断基準になる確率(有意⽔準)を設定する
④ 実際のデータで(検定統計量の実現値を)計算する
⑤ (検定統計量の実現値 以上の 検定統計量 が得られる確率(有意確率)を計算し)
最初に定めた仮説が間違っているか正しいかを判断する
⼭⽥・村井(2004,p.108)を⼀部改
対⽴仮説と帰無仮説 45
検定では,対⽴仮説を証明したいために,⼀度それを「無に帰する」帰無仮説を⽴てる
帰無仮説 𝑯 𝟎︓その現象は偶然⽣じたものである
対⽴仮説 𝑯 𝟏︓その現象は偶然⽣じたものではない
事例を思い出してみる。40⼈を対象に実践前後にテストを実施した。得点の変化の⺟平均 𝝁 を考える
帰無仮説 𝑯 𝟎: 𝜇 = 0
対⽴仮説 𝑯 𝟏: 𝜇 ≠ 0
⺟集団
標本
n = 40
id 事前
テスト
事後
テスト
差得点
1 7 8 +1
2 4 6 +2
3 6 8 +2
⁝ ⁝ ⁝ ⁝
40 4 7 +3
8 − 7 = 1
6 − 4 = 2
︙
7 − 4 = 3
̅𝑥 = 1.68
差得点の
平均
︖
検定統計量 46
検定統計量
検定をおこなうために,標本から計算される標本統計量。
標本平均や不偏分散などから計算される。
例.t 値,𝝌 𝟐値(カイジジョウと読む),F 値など
検定統計量の実現値
実際のデータについて計算された,検定統計量の具体的な値。
例.t = 10.12 など
⼭⽥・村井(2004,p.111)
𝑡 =
̅𝑥 − 𝜇!
'𝜎!
𝑛
有意⽔準と有意確率 47
有意⽔準( α )
「どの程度低い確率の結果が⽰されたら帰無仮説を棄却するか」 という基準。
α(アルファ)で表す。慣例として,
0.05 (5%⽔準)
0.01 (1%⽔準)
という基準が⽤いられている。
有意確率( p )
帰無仮説が正しい(例. 𝜇 = 0 )という条件のもとで,
標本から計算した 検定統計量の実現値 以上の 検定統計量 が得られる確率
⼭⽥・村井(2004,p.112)を⼀部改
検定の⼿順 48
検定の⼿順
① 帰無仮説と対⽴仮説を設定する
② 検定統計量を選択する
③ 有意⽔準を設定する
④ データから検定統計量の実現値を計算する
⑤ 帰無仮説を棄却 / 保持する
⼭⽥・村井(2004,p.122)を⼀部改
例. 対応のある t 検定(指導前後の得点の変化)
① 𝑯 𝟎: 𝜇 = 0,𝑯 𝟏: 𝜇 ≠ 0
② t 値
③ 5%
④ t = ○○.○○
⑤ p = .○○・・・,
p 値が 0.05(5%)以下なら
帰無仮説を棄却する
対応のある t 検定の⼝語訳 49
帰無仮説 𝑯 𝟎: 𝜇 = 0,対⽴仮説 𝑯 𝟏: 𝜇 ≠ 0
● 得点の変化の⺟平均が 0 であると仮定します(ホントは 0 じゃなさそうだけど)。
● データから t 値を計算しました。
● この t 値は t 分布にしたがうことがわかっています。
● 計算したt 値を取りうる p 値を計算してみると,とてもレアな確率になりました。
● ⺟平均が 0 という仮定がおかしかったのです。偶然とは思えません。
● そうだ︕ 実施した指導が得点の変化に影響を及ぼしたのではないでしょうか︕
初学者にありがちな検定の⼿順 50
① 統計ソフトを⽴ち上げる
② 統計ソフトのマニュアル本の⽬次から,
同じようなデータセットで分析している章を⾒つける
③ マニュアル本に書かれた⼿順に沿ってマウスをカチカチして,
有意差があることを祈りながら,p 値を出⼒する
④ 有意差があれば終了する。
なかったら,有意差がある組み合わせが⾒つかるまで検定を繰り返す
検定の留意事項 その1 51
●有意⽔準( α )は「危険率」ともいう
●仮説検定は誤った判断をしてしまう可能性を含んでいる
第1種の誤り と 第2種の誤り 52
第1種の誤り
帰無仮説が本当は正しいにもかかわらず,
帰無仮説を棄却してしまうこと
対応のある t 検定の場合
本当︓
帰無仮説 𝐻%: ⺟平均は0である( 𝜇 = 0 )
実際の判断︓帰無仮説を棄却し,対⽴仮説を採択
対⽴仮説𝐻&: ⺟平均は0ではない( 𝜇 ≠ 0 )
第2種の誤り
帰無仮説が本当は誤っているにもかかわらず,
帰無仮説を保持してしまうこと
対応のある t 検定の場合
本当︓
対⽴仮説 𝐻&: ⺟平均は0ではない( 𝜇 ≠ 0 )
実際の判断︓帰無仮説を保持
帰無仮説𝐻%: ⺟平均は0である( 𝜇 = 0 )
犯⼈逮捕で例えると 53
「犯⼈を逮捕すること」を「帰無仮説を棄却すること」とすると…
第⼀種の誤り
⼀般市⺠を冤罪で
逮捕してしまうこと
(誤認逮捕)
第⼆種の誤り
犯⼈を取り逃がすこと
お前が犯⼈だな︕
⼀般市⺠
この中に犯⼈はいないな︕
犯⼈
検定における2種類の誤り 54
事実
検定による判断
帰無仮説を保持 帰無仮説を棄却
帰無仮説が真 正しい判断 第1種の誤り
(誤認逮捕)
帰無仮説が偽
(対⽴仮説が真)
第2種の誤り
(犯⼈取り逃がし)
正しい判断
我々はそう信じて判断している。
でも果たして本当にそうなのだろうか。
検定の留意事項 その2 55
●検定は⺟集団に対する推論であり,「なんだかすごいお墨付き」を与える⼿段ではない
ー「有意な差がみられた」からといって,偉いわけではない
●想定している⺟集団によって,検定結果からの結論も変わる
ー学年,学校種,地域など,何をどこまで⼀般化しようとしているのかに留意する
●検定には仮定や前提がある
ーランダムサンプリングなど
本⽇の内容 56
1.統計分析とは
ー記述統計と推測統計
ー⺟集団と標本
2.基本統計量の算出
ー尺度の種類
ー代表値(平均値,中央値,最頻値)
ー散布度(分散,標準偏差)
3.確率変数と確率分布
ー確率変数と確率分布
4.統計的仮説検定
ー統計的仮説検定とは
ー検定の⼿順
ー留意事項
5.演習
ー対応のある t 検定
6.おわりに
ー p 値の取り扱い
ー健全な科学の発展のために
t 検定について 57
● t 検定は,⺟平均に対する検定である
● t 検定はデータに対応があるかどうかで計算式が変わる
ー対応なし(例.1組と2組のテストの平均点を⽐べる)
ー1つの平均値の検定
ー独⽴な 2 群の t 検定
ー対応あり(例.事前テストと事後テストの平均点を⽐べる)
ー対応のある t 検定
本⽇はコレ
本⽇の事例(再掲) 58
事例. 指導前後におけるテストの得点の変化は︖
⽬的︓○○を育成することを⽬指した指導法を考案し,その効果を検証した
⽅法︓指導法を実践し,実践前後に○○を測定する10点満点のテストを実施した
対象︓T 県の⼩学校第 6 学年 1 クラスの児童 40 名
結果︓次のスライド
事前テストと事後テストのローデータ 59
id 事前テスト 事後テスト
1 7 8
2 4 6
3 6 8
4 6 7
5 3 7
6 4 8
7 6 9
8 5 7
9 6 7
10 5 7
11 4 6
12 7 8
13 4 6
14 6 7
15 4 5
16 7 7
17 5 5
18 4 7
19 5 5
20 7 8
id 事前テスト 事後テスト
21 5 8
22 5 7
23 4 5
24 5 7
25 6 8
26 6 7
27 5 6
28 5 7
29 6 5
30 5 7
31 6 7
32 4 6
33 6 8
34 4 5
35 5 7
36 5 7
37 4 7
38 5 6
39 6 8
40 4 7
検定の前に 60
●検定をする前に,それぞれの変数の基本統計量を確認する
●事前テストと事後テストを⽐べると
得点が増加傾向にある
平均値(標準偏差)
事前 5.15(1.03)
事後 6.83(1.03)
検定の前に 61
●視覚的にも確認してみる
●右の図は箱ひげ図という(別ソフトで出⼒)
ー上のひげの端︓最⼤値
ー下のひげの端︓最⼩値
ー箱の区間 ︓全体の25~75%
ー箱の中の線 ︓中央値
●やはり得点が増加している気がする
0
1
2
3
4
5
6
7
8
9
10
事前テスト 事後テスト
得
点
検定の⼿順(再掲) 62
検定の⼿順
① 帰無仮説と対⽴仮説を設定する
② 検定統計量を選択する
③ 有意⽔準を設定する
④ データから検定統計量の実現値を計算する
⑤ 帰無仮説を棄却 / 保持する
⼭⽥・村井(2004,p.122)を⼀部改
対応のある t 検定(指導前後の得点の変化)
① 𝑯 𝟎: 𝜇 = 0,𝑯 𝟏: 𝜇 ≠ 0
② t 値
③ 5%
④ t = ○○.○○
⑤ p = .○○・・・
④ と ⑤ を Excel にやってもらう
演習 対応のある t 検定 63
●t 検定: ⼀対の標本による平均の検定 を選択し, OK をクリック
演習 対応のある t 検定 64
●変数1の⼊⼒範囲に事後テストのデータ(C1:C41)を⼊れる
●変数2の⼊⼒範囲に事前テストのデータ(B1:B41)を⼊れる
●ラベル にチェックを⼊れて,OK をクリック
演習 対応のある t 検定 65
●新しいシートに結果が出⼒される
●t, ⾃由度, 「P(T<=t) 両側」を⾒る
●t (39) = 10.12,p = 0.00・・・
●p = 0.00・・・で,
決めた有意⽔準0.05(5%)以下なので,
帰無仮説を棄却する
④ データから検定統計量の実現値を計算する 66
𝑡 =
̅"#$*
+,*
-
= 10.12
差得点の標本平均
差得点の⺟平均
帰無仮説では0と仮定
データ数 40
id 事前
テスト
事後
テスト
差得点
𝒙
1 7 8 1
2 4 6 2
⁝ ⁝ ⁝ ⁝
40 4 7 3
̅𝑥 = 𝟏. 𝟔𝟖
(𝜎3 = 𝟏. 𝟏𝟎
t 値の実現値はどのように計算されたのか︖
差得点の不偏分散
⑤ 帰無仮説を棄却 / 保持する 67
どのように帰無仮説を棄却したのか︖
●今回計算した t 値は ⾃由度 39 の t 分布にしたがう
●この t 分布について,有意⽔準を 5% に設定したとき,
t 値 は 95% の確率で -2.02 〜 2.02 に⼊ることがわかっている。
この範囲を受容域,これらの値を臨界値という。
●実現値が,受容域に⼊っていれば帰無仮説を保持し,⼊っていなければ帰無仮説を棄却する
●今回,𝑡 = 10.12 だったので,受容域に⼊っていないので(棄却域に⼊っているので),
帰無仮説を棄却した
受容域︓ −𝟐. 𝟎𝟐 ≦ 𝒕 ≦ 𝟐. 𝟎𝟐
棄却域︓ 𝐭 < −𝟐. 𝟎𝟐, 𝟐. 𝟎𝟐 ≦ 𝒕
-2.02 2.02受容域
⑤ 帰無仮説を棄却 / 保持する 68
出⼒された p 値ってどこのこと︖
●t = 10.12 で,p = 0.00・・・だと⾒えないので,
別の画像(⾃由度 20 の t 分布)
●たとえば,t 値が -2 以下 または 2 以上となる確率は
⾚で塗られている部分。その⾯積が p 値
引⽤︓kke-minitab-support.zendesk.com/hc/ja/articles/360019115751-2016-06-Minitab-blog-t検定の仕組みを理解しよう-t値とt分布
めでたしめでたし︖ 69
指導の前後に実施した○○テストの平均値と標準偏差は表のようになった。
事前と事後のテストの得点に差があるかを明らかにするため,
対応のある t 検定を⾏った。
その結果,事前と事後の得点に有意な差がみられた(t (39) = 10.12, p = 0.00)。
平均値(標準偏差)
事前 5.15(1.03)
事後 6.83(1.03)
表 テストの得点(n = 40)
事前と事後の得点に有意な差がみられた
実施した指導法には効果がみられた
︖
いくつか問題がありそうな 70
●検定はランダムサンプリングを仮定しているのではなかったか︖
●検定で推論した⺟集団とは何を指すのか︖
●「得点が上がった」 → 「指導法には効果がある」は論理の⾶躍では︖
そのとおり。これは今も解決できていない悩ましい問題・・・。
あくまで証拠の1つに過ぎない。その他のデータから多⾓的に検証する必要がある。
結果がどこまで⼀般化可能なのかは,仮定や⽂脈に依存する。過度な⼀般化は禁物。
冒頭の問いに対する回答 71
Q. 「有意な差がみられた」とはどういうこと︖
今回⼿に⼊れたデータで検定統計量の実現値を計算してみたら,
その実現値が出てくるのはとてもレアな確率だった,というだけ。
この結果をさらに解釈し,我々分析者は,
「なんらかの要因によって⽣じたものだ」と論理を⾶躍させて推論している。
冒頭の問いに対する回答 72
Q. 対応のある t 検定ってなに︖
対応のあるデータの平均値に対して,
⺟平均に対する仮説(帰無仮説 𝑯 𝟎: 𝝁 = 𝟎,対⽴仮説 𝑯 𝟏: 𝝁 ≠ 𝟎)を設定し,
その仮説を保持または棄却する検定。
t 値は標本平均,データ数,不偏分散によって計算される。
本⽇の内容 73
1.統計分析とは
ー記述統計と推測統計
ー⺟集団と標本
2.基本統計量の算出
ー尺度の種類
ー代表値(平均値,中央値,最頻値)
ー散布度(分散,標準偏差)
3.統計的仮説検定
ー統計的仮説検定とは
ー検定の⼿順
ー留意事項
4.演習
ー対応のある t 検定
5.おわりに
ー p 値の取り扱い
ー健全な科学の発展のために
p 値についての最近の議論 その1 74
●P値の誤⽤の蔓延に⽶国統計学会が警告(2016年3⽉10⽇)
https://doi.org/10.1038/ndigest.2016.160612
p 値についての最近の議論 その2 75
●「“統計的に有意差なし”もうやめませんか」Natureに科学者800⼈超が
署名して投稿(2019年03⽉26⽇)
https://www.itmedia.co.jp/news/articles/1903/26/news112.html
問題となる研究態度や⾏為 76
●p-hacking
有意な p 値になるまでデータ分析を繰り返して,有意な値がでたら,
それを⽤いて論⽂を書こうとする態度
●HARKing(Hypothesizing After the Results are Known)
データを分析してみて結果を⾒てから,それにフィットするように仮説を作り,
あたかもその仮説がデータ収集よりも先に存在していたかのように論⽂化する⾏為
(参考︓https://tomsekiguchi.hatenablog.com/entry/20170727/1501136241)
p-hacking の具体例 77
(1)⾏った条件や測定した変数の⼀部しか報告しない
(2)参加者を少しずつ⾜しながら分析を⾏い,有意差に⾄ったところで⽌める
(3)様々な共変量を⽤いて分析を⾏い,有意になった組み合わせのみを報告する
池⽥・平⽯(2016,p.4)
なぜ問題なのか︖ 78
① 第⼀種の誤りを犯している研究が多くなる
② 不確かな研究がさらに不確かな研究を⽣む
③ ちゃんとした知⾒が蓄積されず,ヤバい
健全な科学の発展のために 79
●p-hacking, HARKing を理解しよう
●仮説検証型の研究では,分析前に必ず仮説に⽴ち返る
●いきあたりばったりではなく,調査デザインを練ってから調査を開始しよう
●研究の限界をちゃんと明記しよう
おわりに 今⽇伝えたいこと 80
●統計的仮説検定は,⺟集団に対する推論である
ー結果に対して「なんだかすごいお墨付き」を与えるものではない
●統計的仮説検定は,前提や仮定を含む推論である
ー統計ソフトは前提や仮定を教えてくれない。結論はすべて条件付きである
●それっぽい検定 より 地に⾜のついた報告 が重要である
ー研究はチームプレイ。正しく知を共有し,未来につなげよう
【HAD】基本的な分析を独習したい⽅へ 81
●関⻄学院⼤学の清⽔裕⼠先⽣が公開している
Excelで動くフリーの統計分析⽤プログラム
●使いやすく,基本的な統計分析はこれでOK
●解説本もあります
●解説動画もあります
読書案内 その1 初級 82
書名 ︓⼼理学のための統計学⼊⾨
出版年︓2014年
著者 ︓川端⼀光・荘島宏⼆郎
●統計処理に関する基本的事項が
とても丁寧に書かれている本
●⼆⾊刷りで,図表も豊富
●このシリーズの他の本もオススメ
読書案内 その2 中級 83
書名 ︓よくわかる⼼理統計
出版年︓2004年
著者 ︓⼭⽥剛史・村井潤⼀郎
●私はこれで勉強し直しました
●導出までの計算もかなり丁寧
●コラムも充実
84読書案内 その3 上級
書名 ︓⼼理統計学の基礎 統合的理解のために
出版年︓2002年
著者 ︓南⾵原朝和
●⼼理統計界のバイブル(⼜聞き)
●数式を使った厳密な説明と解説
●わからなくなったときはこれを⾒てます
引⽤・参考⽂献 85
南⾵原頼和(2002)『⼼理統計学の基礎 統合的理解のために』有斐閣
池⽥功毅・平⽯界(2016)「⼼理学における再現可能性危機︓問題の構造と解決策」『⼼理学研究』59(1), 3-14.
川端⼀光・荘島宏⼆郎(2014)『⼼理学のための統計学1 ⼼理学のための統計学⼊⾨ ココロのデータ分析』誠信書房.
栗原伸⼀(2012)『⼊⾨統計学―検定から多変量解析・実験計画法』オーム社
⼩宮あすか・布井雅⼈(2018)『Excelで今すぐはじめる⼼理統計 簡単ツールHADで基本を⾝につける』講談社.
皆本昇弥(2015)『スッキリわかる確率統計―定理の詳しい証明つき―』近代科学社
Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251). https://doi.org/10.1126/science.
aac4716
⼤久保街亜・岡⽥謙介(2012)『伝えるための⼼理統計 効果量 信頼区間 検定⼒』勁草書房
清⽔裕⼠ (2016 )「フリーの統計分析ソフトHAD︓機能の紹介と統計学習・教育,研究実践における利⽤⽅法の提案」『 メディア・情報・コ
ミュニケーション研究』 1, 59-73.
Stevens, S. S. (1946). On the Theory of Scales of Measurement. Science, 103(2684), 677–680.
雲財寛・⼭根悠平・⻄内舞・中村⼤輝(2020)「教科教育学における量的研究―分類と留意点―」『⽇本体育⼤学⼤学院教育学研究科紀要』
3(2), 245-252.
Wasserstein, R. L., & Lazar, N. A. (2016). The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician, 70(2),
129–133.
⼭⽥剛史・村井潤⼀郎(2004)『よくわかる⼼理統計』ミネルヴァ書房.
平均値,標準偏差…
今⽇の話を1枚にまとめたスライド 86
⺟集団
無作為抽出
(ランダムサンプリング)
推測統計
記述統計
標本
標本統計量を使って検定統計量 などを算出し,確率分布を⽤いて
⺟集団の特徴を推測する
基本統計量を算出し,数量的・視覚的に
標本の特徴を記述(要約)する
統計的仮説検定など
t 値,F 値, 𝜒"値 … t 分布,F 分布, 𝜒" 分布…
ヒストグラム,散布図…
【資料】データ⼊⼒の基礎 レイアウト 87
●1⾏⽬に「変数名」,2⾏⽬以降に「データ」を⼊⼒する
ー1⾏⽬︓変数がずらっと右に並ぶイメージ
ー2⾏⽬以降︓各⾏に1⼈のデータがずらっと右に並ぶイメージ
●「A1」セルは「id」として,回答者の通し番号を⼊⼒する
ーIDをつけておくと,あとで何かあっても照合しやすい
【資料】データ⼊⼒の基礎 ⼊⼒ 88
⼊⼒
●数字の⼊⼒は「半⾓」で⾏う
●1セルに1データを⼊⼒する。2つ以上のデータを⼊⼒しない
●回答がなかった項⽬は「空⽩」にする
●⾃由記述の場合,誤字脱字等があってもそのまま⼊⼒する
【資料】データ⼊⼒の基礎 ⼊⼒の留意事項 89
留意事項
●セルの結合はしない
●回答情報を⼊⼒したデータ(ローデータ)は必ず1つのシートにまとめる
ークラス毎にシートを分けない。変数「クラス」として⼊⼒する
●名義尺度の場合,たとえば「A=1」「B=2」「C=3」「D=4」として
適当な数字を割り当てておくと集計が楽
【資料】中⼼極限定理 90
●中⼼極限定理
同じ分布に従う互いに独⽴な確率変数 𝑋", 𝑋!, … , 𝑋Fについて,
𝐸 𝑋G = 𝜇 , 𝑉 𝑋G = 𝜎! (𝑖 = 1, 2, … , 𝑛)
とする。このとき,確率変数 の分布は n が⼤きいとき,近似的に
平均 𝜇 ,分散
H!
F
の正規分布にしたがう
皆本(2015,p.180)
4𝑋 =
1
𝑛
I
GI"
F
𝑋G
【資料】確率分布の地図 91
http://www.math.wm.edu/ leemis/chart/UDR/UDR.html
Leemis and McQueston(2008)より引⽤
正規分布
●丸四⾓が1つ1つの確率分布を表している
●確率分布間には相互の関係がある
例.t 分布をする確率変数 𝑥 の⼆乗𝑥! はF分布に従う
【資料】アメリカ統計学会による声明 92
P値とは?
おおざっぱにいうと、P値とは特定の統計モデルのもとで、データの統計的要約(たとえば、2グ
ループ⽐較での標本平均の差)が観察された値と等しいか、それよりも極端な値をとる確率である。
1. P値はデータと特定の統計モデル(訳注: 仮説も統計モデルの要素のひとつ)が⽭盾する程度を
しめす指標のひとつである。
2. P値は、調べている仮説が正しい確率や、データが偶然のみでえられた確率を測るものではない。
3. 科学的な結論や、ビジネス、政策における決定は、P値がある値(訳注: 有意⽔準)を超えたか
どうかにのみ基づくべきではない。
4. 適正な推測のためには、すべてを報告する透明性が必要である。
5. P値や統計的有意性は、効果の⼤きさや結果の重要性を意味しない。
6. P値は、それだけでは統計モデルや仮説に関するエビデンスの、よい指標とはならない。
Wasserstein & Lazar (2016),⽇本計量⽣物学会(2017)訳

理科教育学研究のための統計分析入門