More Related Content More from takemuralab (9) 120517 サブゼミ 統計(2)11. 2
1
dat[,2]
0
−1
−2
−3 −2 −1 0 1 2 3
dat[,1]
13. 3
2
1
dat[,2]
0
−1
−2
−3
−3 −2 −1 0 1 2 3
dat[,1]
20. もっと簡単に相関を説明すると
、
• データを標準化して(データを測定単位
に依存しない形に変換して)から、標準
化した変数の偏差同士で共分散式を作っ
ても測定単位に依存しない形にできる!
!
25. 相関係数の性質
• 1, 外れ値の影響
• 2, 擬似相関
• 3, データの層別化
• 4, 選抜効果
• 5, 相関関係と因果関係
27. 外れ値の影響 外れ値
• 外れ値 ( 右上の点
) を含めた相関係
数:
• r = 0.59
• 外れ値を含めない
相関係数:
• r = 0.07
• → 散布図を描こう
!
29. 擬似相関
• 2つの変数 X と Y の間に
本当は相関がないにもか
かわらず、第3の変数 Z
の存在によりあらわれる
、見かけ上の相関のこと
。
• たとえば、アイスの売り
上げ (x) とサンダルの売り
上げ (y) の間に相関があっ
たからといってその2つ
の間には本当に相関関係
があるとみなすのではな
く、気温の上昇 (z) によっ
てあらわれた相関と考え
られる。
31. データの層別化
• 全体の相関係数: 0.48
• ○ の相関係数: -0.77
• ■ の相関係数: -0.63
• → 相関係数を解釈すると
きにはどのような集団に
基づいて計算されたもの
なのかを考慮する必要が
ある
• 「層別相関」:○や■のよ
うに集団ごとに計算した
相関係数のこと
33. 選抜効果 / 切断
効果
• 集団の一部だけで相関係
数を計算すると、相関係
数が小さくなる傾向にあ
ること。
• たとえば、大学試験の成
績と入学後の成績の相関
を計算した場合。
• 合格者(成績の良かった
人)だけで相関係数を計
算すると相関は低くなっ
てしまう。
• 不合格者(成績の悪かっ
た人)も含めて相関係数
を計算しなくてはいけな
い。
35. 相関関係と因果関係の違い
• 相関関係:変数 A と B が関係がある。共変関係
。
• 因果関係:原因と結果の関係。 A (原因)が起
こったから B (結果)
• → 相関関係が強いということは因果関係をしめ
すということではない。つまり、変数 A と変数
B の相関係数が 0.7 であったとしても、「変数 A
の値が上がるから変数 B の値も上がる」という
解釈をしてはいけない。
• 正しくは「変数 A の値が低いとき変数 B の値も
低く、変数 A の値が高いとき変数 B の値も高い