統計学基礎
- 12. 具体例
(某大学のプログラミング実習)
• 毎回の授業内で課題が出る → 提出時間が早い
ほど高得点
• インデントの綺麗さの得点
• 期末試験
出席番号
授業内課
題平均
インデント
点数平均
期末テスト
1 64.260648745.83 65
2 41.981871882.63 34
3 45.756291247.33 82
4 55.762500894.95 54
5 42.731943635.05 42
6 69.38951323.07 34
7 56.90555683.96 35
8 28.846433927.18 64
・・・
・みんなどのくらいできてる?
・期末テストの点数 (最終的な習熟度) を
上げるにはどうしたらいいだろう?
- 14. 授業内課題得点の分布
点数 人数
0 1
10 0
20 0
30 3
40 2
50 5
60 8
70 5
80 2
90 0
100 0
0"
2"
4"
6"
8"
10"
0" 10" 20" 30" 40" 50" 60" 70" 80" 90" 100"
!
度数分布表
記述統計学
- 17. 代表値
• 平均 (Average)
457.6
• 最頻値 (mode)
300
• 中央値 (median)
400
0"
10"
20"
30"
40"
50"
60"
100"
200"
300"
400"
500"
600"
700"
800"
900"
1000"
1100"
1200"
1300"
1400"
1500"
1600"
1700"
1800"
1900"
2000"
2100"
平均
中央値
- 24. 平均偏差
1/n * (
| 64.26064874 - 50.86744977 |
| 41.98187188 - 50.86744977 |
| 45.75629124 - 50.86744977 |
以下略
)
出席番号
授業内課
題
インデント
点数平均
期末テスト
1 64.260648745.83 65
2 41.981871882.63 34
3 45.756291247.33 82
4 55.762500894.95 54
5 42.731943635.05 42
6 69.38951323.07 34
7 56.90555683.96 35
8 28.846433927.18 64
- 28. 具体例
(某大学のプログラミング実習)
• 毎回の授業内で課題が出る → 提出時間が早い
ほど高得点
• インデントの綺麗さの得点
• 期末試験
出席番号
授業内課
題平均
インデント
点数平均
期末テスト
1 64.260648745.83 65
2 41.981871882.63 34
3 45.756291247.33 82
4 55.762500894.95 54
5 42.731943635.05 42
6 69.38951323.07 34
7 56.90555683.96 35
8 28.846433927.18 64
・・・
- 29. 相関関係
0"
10"
20"
30"
40"
50"
60"
70"
80"
90"
0.00" 1.00" 2.00" 3.00" 4.00" 5.00" 6.00" 7.00" 8.00" 9.00"
!
0"
10"
20"
30"
40"
50"
60"
70"
80"
90"
0" 10" 20" 30" 40" 50" 60" 70" 80"
0.00#
1.00#
2.00#
3.00#
4.00#
5.00#
6.00#
7.00#
8.00#
9.00#
0# 10# 20# 30# 40# 50# 60# 70# 80#
インデント点数と期末テストの点数に
相関関係がある?
- 33. どんな相関があるか (共分散)
sxy : 共分散
x¯, y¯ : x, y の平均
xi, yi : データx, データy の値
n : データの個数
正の値: 比例
負の値: 反比例
0 : 相関なし
- 39. どのくらい相関があるの?(相関係数)
x の標準偏差 * y の標準偏差
x の標準偏差 y の標準偏差
-1.0 < 相関係数 < -0.7: かなり強い負の相関
-0.7 < 相関係数 < -0.4: 強い負の相関
-0.4 < 相関係数 < -0.2: 弱い負の相関
-0.2 < 相関係数 < 0.2: 相関なし
0.2 < 相関係数 < 0.4: 弱い正の相関
0.4 < 相関係数 < 0.7: 強い正の相関
0.7 < 相関係数 < 1.0: かなり強い正の相関
- 40. どのくらい相関があるの?(相関係数)
x の標準偏差 * y の標準偏差
x の標準偏差 y の標準偏差
= 0.92
0"
10"
20"
30"
40"
50"
60"
70"
80"
90"
0.00" 1.00" 2.00" 3.00" 4.00" 5.00" 6.00" 7.00" 8.00" 9.00"
!
- 45. データと y = ax + b の距離が最小になる線を計算
→最小二乗法
0"
10"
20"
30"
40"
50"
60"
70"
80"
90"
0.00" 1.00" 2.00" 3.00" 4.00" 5.00" 6.00" 7.00" 8.00" 9.00"
!
y = 8.7206x + 6.0847
- 49. 具体例
(某大学のプログラミング実習)
• 毎回の授業内で課題が出る → 提出時間が早い
ほど高得点
• インデントの綺麗さの得点
• 期末試験
出席番号
授業内課
題平均
インデント
点数平均
期末テスト
1 64.260648745.83 65
2 41.981871882.63 34
3 45.756291247.33 82
4 55.762500894.95 54
5 42.731943635.05 42
6 69.38951323.07 34
7 56.90555683.96 35
8 28.846433927.18 64
・・・
期末テストの点数 (最終的な習熟度)
を上げるにはどうしたらいいだろう?