More Related Content Similar to Rm20140507 4key Similar to Rm20140507 4key (20) Rm20140507 4key4. 基本統計量の出し方・扱い方
●
● ●
●
● ● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●●
●
●
● ●
●
5 10 15 20
5
10
15
20
Data 1
Data2
7. データの質
• I have been in Shizuoka for 6 years.
• a) been/for/I/six/Shizuoka/have/years/in
• b) be/for/I/six/Shizuoka/have/years/in: 動詞を正し
く活用させて
8. データの質
• 妥当性(validity): 例.「恋愛力」測定
• 構成的妥当性: 恋愛力?, 人懐っこさ?or 自己中…?
• Cf. Rubin, Z. (1970) Measurement of romantic love.
• 概念的定義: 性質を記述 a) affiliative and
dependent need, b) a predisposition to help, and c)
an orientation of exclusiveness and absorption
• 操作的定義: 測定方法 The 13-item love-scale scores
11. 「妥当性」for what?
• a) データの一般化の可能性: 平均的な対象の行動を
収集データがどれだけ代表しているかということ
• b) 再使用性: 後になっても再検証できるようになっ
ていること
• c) 確証性: 同じ結果を確認できること
• Cf. 客観性・再現性・普遍性
13. 「妥当性」for what?
• 仮説検証型リサーチ; 実験の処理効果と実験結果
の因果関係・共起関係を示せるか
• 独立変数: 予測因子、研究者が操作する要因・現象
• 従属変数: 予測される方の変数、変化を測られる手段
• その他の変数: 被験者変数、外部変数
24. - 2 -
→ :
:
! :
! : N
:
! :
! : n
:
n: 数十程度(標本 3)
通学時間平均 42 分
(標本統計量の実現値)
母集団 N: 非常に大きい
母集団の通学時間平均
Y 分(母数)
無作為抽出
推定
推測統計の考え方
25. 推測統計の考え方
- 2 -
→ :
:
! :
! : N
:
! :
! : n
:
n: 数十程度(標本 3)
通学時間平均 42 分
(標本統計量の実現値)
n: 数十程度(標本 2)
通学時間平均 58 分
(標本統計量の実現値)
母集団 N: 非常に大きい
母集団の通学時間平均
Y 分(母数)
無作為抽出
推定
26. 推測統計の考え方
- 2 -
→ :
:
! :
! : N
:
! :
! : n
:
n: 数十程度(標本 3)
通学時間平均 42 分
(標本統計量の実現値)
n: 数十程度(標本 2)
通学時間平均 58 分
(標本統計量の実現値)
母集団 N: 非常に大きい
母集団の通学時間平均
Y 分(母数)
n: 数十程度(標本 1)
通学時間平均 37 分
(標本統計量の実現値)
無作為抽出
推定
27. 推測統計の考え方
- 2 -
→ :
:
! :
! : N
:
! :
! : n
:
n: 数十程度(標本 3)
通学時間平均 42 分
(標本統計量の実現値)
n: 数十程度(標本 2)
通学時間平均 58 分
(標本統計量の実現値)
母集団 N: 非常に大きい
母集団の通学時間平均
Y 分(母数)
n: 数十程度(標本 1)
通学時間平均 37 分
(標本統計量の実現値)
無作為抽出
推定
標本統計量 X
29. Task 2
• Q1. サイコロ1つを1回振ったときに出
る目の数とその確率は…
確率変数の取る値 1 2 3 4 5 6
確率
30. Task 2
• Q1. サイコロ1つを1回振ったときに出
る目の数とその確率は…
確率変数の取る値 1 2 3 4 5 6
確率 1/6 1/6 1/6 1/6 1/6 1/6
31. Task 2
•P(α X β)=(βα) p
•P(2 X 5)=(52) 1/6=0.5
確率変数の取る値 1 2 3 4 5 6
確率 1/6 1/6 1/6 1/6 1/6 1/6
33. Task 2
• Q2. サイコロ2つを1回振ったときに出
た目の平均とその確率は…
確率変数
の取る値
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
確率
34. Task 2
• Q2. サイコロ2つを1回振ったときに出
た目の平均とその確率は…
確率変数
の取る値
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
組合わせ 1 2 3 4 5 6 5 4 3 2 1
確率
1/
36
1/
18
1/
12
1/
9
5/
36
1/
6
5/
36
1/
9
1/
12
1/
18
1/
36
35. Task 2
• 正規分布: 左右対称・釣り鐘型の性質
をもつ分布
確率変数
の取る値
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
組合わせ 1 2 3 4 5 6 5 4 3 2 1
確率
1/
36
1/
18
1/
12
1/
9
5/
36
1/
6
5/
36
1/
9
1/
12
1/
18
1/
36
36. Task 2
• 正規分布: 左右対称・釣り鐘型の性質
をもつ分布
確率変数
の取る値
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
組合わせ 1 2 3 4 5 6 5 4 3 2 1
確率
1/
36
1/
18
1/
12
1/
9
5/
36
1/
6
5/
36
1/
9
1/
12
1/
18
1/
360"
0.02"
0.04"
0.06"
0.08"
0.1"
0.12"
0.14"
0.16"
0.18"
1" 1.5" 2" 2.5" 3" 3.5" 4" 4.5" 5" 5.5" 6"
40. 母集団分布の仮定・推測
• Q3. 大学生の恋愛感情得点(3∼15)の確率は
どの分布になる?
• 一様分布: どこも一様に同じ確率の分布
• 正規分布: 左右対称・釣り鐘型の性質をもつ分布
• 標準正規分布: 平均0、分散1の正規分布
• 非正規分布: 一様分布でも正規分布でもない
0" 0" 0" 0" 0"
2"
4"
2"
3"
1"
5"
1"
2"
3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15"
0" 0" 0" 0" 0"
1"
3"
1"
9"
14"
4"
3"
0"
3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15"
2013年度
n = 35
43. 母集団分布の仮定・推測
• X~ N (μ, σ2
)
• 母集団に正規分布を仮定→標本平均の標本分布も正規分布
• 標本分布の分散 σx
2
=σ2
/n: 4.81/20=0.2405
• 標準誤差(SE): σ/√n: 2.19/√20=0.4904...
• 標本統計量の変動の大きさを評価する指標
• 母数について推測するときの精度
44. 母集団分布の仮定・推測
• X~ N (μ, σ2
)
• 標準誤差(standard error, SE): σ/√n
• 標本分布の標準化:
• X ̅~ N (μ, σ2
/n)
• Z=(X ̅−μ)/σ⁄√n → Z~ N (0, 12
)
• ≒データの値−平均/標準偏差(σ)
52. 母集団分布の仮定・推測
• 推定量: 母数の推定に用いられる標本統計量
• 不偏性がある: 推定量の期待値と母数の差(偏り)が0
• 95%信頼区間: p−1.96σp ≦ π ≦ p+1.96σp
• 標本抽出を繰返す度に信頼区間を求めると全体の95
%は母数πを含む区間になる
• 例. 恋愛感情得点: 11.30±1.96×0.49 = 95% CI [10.34, 12.26]
55. 統計的仮説検定の手順
• [手順1] 仮説を設定する
• 帰無仮説: 棄却される(不支持になる)ことを目的に作られる仮説
• 対立仮説: 帰無仮説が棄却されたときに採択される仮説
• 両側検定: 差がある、方向は問わない
• 片側検定: 差・方向性がある
• どちらかをこの時点で(データをとる前に)決定
56. 統計的仮説検定の手順
• [手順1] 仮説を設定する
• 帰無仮説: 例. 小テストに口頭試験を導入しても、生徒のスピーキ
ング能力に変化はない。
• 対立仮説: 例. 小テストに口頭試験を導入すると、生徒のスピー
キング能力に変化がある。
• 両側検定:
• 帰無仮説H0:生徒のスピーキング能力の変化=0
• 対立仮説H1:生徒のスピーキング能力の変化≠0
61. 統計的仮説検定の手順
Data 1 Data 2
6
8
10
12
14
16
18
Means and +/−1 SDs are displayed in red.
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●●
●
●
● ●
●
● ● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●●
●
●
● ●
●
5 10 15 20
5
10
15
20
Data 1
Data2