SlideShare a Scribd company logo
1 of 12
解説:課題1~3
中央値 2
有限個のデータを小さい順に並べたとき中央に位置する値
標準偏差 3
𝑠 =
1
𝑛
𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2
簡単に言うと平均からどのくらい離れているかの平均
マイナスを取り除くために二乗する
面積のままだと比較しにくいので平方根
分散 4
データの散らばり具合を表す指標
符号の影響を排除したもの
𝜎2 =
1
𝑛
𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2
𝑥:𝒙の平均値
𝜎:𝒙の標準偏差
不偏分散の標本分散 5
標本分散は標本のみを考え、その分散を算出
不偏分散は標本の属する母集団全体について考え、その分散を算出
𝜎2 =
1
𝑛 − 1
𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2不偏分散
共分散 6
2組の対応するデータの間の関係を表す数値
𝑠 𝑥𝑦 =
1
𝑛
𝑖=1
𝑛
(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
𝑥:𝒙の平均値
𝑦:𝒚の平均値
分散共分散行列 7
2組の対応するデータの間の関係を表す数値をまとめたもの
𝑠 𝑥
2
𝑠 𝑥𝑦
𝑠 𝑦𝑥 𝑠 𝑦
2 =
1
𝑛
𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2
1
𝑛
𝑖=1
𝑛
(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
1
𝑛
𝑖=1
𝑛
(𝑦𝑖 − 𝑦)(𝑥𝑖 − 𝑥)
1
𝑛
𝑖=1
𝑛
(𝑦𝑖 − 𝑦)2
相関行列 8
2組の対応するデータの間の関係の強弱を示す指標
1
𝑛 𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2
1
𝑛 𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2 1
𝑛 𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2
1
𝑛 𝑖=1
𝑛
(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
1
𝑛 𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2 1
𝑛 𝑖=1
𝑛
(𝑦𝑖 − 𝑦)2
1
𝑛 𝑖=1
𝑛
(𝑦𝑖 − 𝑦)(𝑥𝑖 − 𝑥)
1
𝑛 𝑖=1
𝑛
(𝑦𝑖 − 𝑦)2 1
𝑛 𝑖=1
𝑛
(𝑥𝑖 − 𝑥)2
1
𝑛 𝑖=1
𝑛
(𝑦𝑖 − 𝑦)2
1
𝑛 𝑖=1
𝑛
(𝑦𝑖 − 𝑦)2 1
𝑛 𝑖=1
𝑛
(𝑦𝑖 − 𝑦)2
オートスケーリング 9
与えられたデータを平均0、分散1のデータに変換する操作
各データから平均値を引き、標準偏差で割る
𝑧 =
𝑥 − 𝑥
𝜎
𝜎:𝒙の標準偏差
平均化 10
与えられたデータを平均0に変換する操作
このままだとどこを基準にして
比較すれば良いのかわからない
与えられたデータの平均値との差を
取ればどのデータも平等に比較できる
新しいデータに対しても
設定した値との差から
身長が高いか低いかを判断できる
標準化 11
与えられたデータを分散1に変換する操作
各国で身長の振れ幅が違うため
このままでは比較しづらい!
データのばらつきを示す分散を統一
してしまえば比較が楽になる
標準化の式 12
平均化後
𝜎2 =
1
𝑛
𝑖=1
𝑛
(𝑥𝑖)2分散
𝑥𝑖 =
𝑥𝑖
𝜎
𝜎2 =
1
𝑛
𝑖=1
𝑛
(𝑥𝑖)2 =
1
𝑛
𝑖=1
𝑛
𝑥𝑖
𝜎
2
=
1
𝑛
∗
1
𝜎2
𝑖=1
𝑛
𝑥𝑖
2 =
1
𝑛
∗
𝑛
𝑖=1
𝑛
𝑥𝑖
2
∗
𝑖=1
𝑛
𝑥𝑖
2 = 1
データを標準偏差で割る

More Related Content

Similar to Assignment1-3 (7)

PRML2.1 2.2
PRML2.1 2.2PRML2.1 2.2
PRML2.1 2.2
 
データ解析10 因子分析の基礎
データ解析10 因子分析の基礎データ解析10 因子分析の基礎
データ解析10 因子分析の基礎
 
統計学第三回
統計学第三回統計学第三回
統計学第三回
 
データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
 
ラビットチャレンジレポート 応用数学
ラビットチャレンジレポート 応用数学ラビットチャレンジレポート 応用数学
ラビットチャレンジレポート 応用数学
 
2013年度秋学期 統計学 第13回「不確かな測定の不確かさを測る ― 不偏分散とt分布」
2013年度秋学期 統計学 第13回「不確かな測定の不確かさを測る ― 不偏分散とt分布」2013年度秋学期 統計学 第13回「不確かな測定の不確かさを測る ― 不偏分散とt分布」
2013年度秋学期 統計学 第13回「不確かな測定の不確かさを測る ― 不偏分散とt分布」
 
001 z test
001 z test001 z test
001 z test
 

Assignment1-3