More Related Content
Similar to 【統計】1001:第3章 (7)
【統計】1001:第3章
- 1. 1001
第三章 定量變量的關係
3.1 找出 scatterplots 散步點(數據)的分佈
scatterplots
解釋變量為 x 軸,應變量為 y 軸
(圖 3.1)
positive association x 軸與 y 軸成正比
negative association x 軸與 y 軸成反比
scatterplots 可以分成線型分布(像上圖)跟曲線分布
3.2 使用迴歸線描述線型分布
regression analysis 迴歸分析
找出當 x 每上升 1,y 會上升多少的關係
迴歸方程式:ŷ = b0 + b1x
y-hat:找出 y 值的中間點
b0:當 X=0 時 y 的值(y-intercept)
b1x:斜率
statistical relationship 散落數值沒有成為一線,回歸線不能準確預測
deterministic relationship 散落數值有成為一線,回歸線能準確預測
excel 操作
(exel tip)
預測錯誤與殘值(residuals)
殘值(residuals) = 預測錯誤
公式為:y(鎖定某一觀察值) – yhat
- 2. 殘值就是背離回歸線的數值
least squares
least squares line= least sumof squared errors line (least SSE line)
表示一條線的誤差值小於所有可能的線,也就是最準的線
3.3 用 correlation(相關)測量強度與方向
correlation(相關,r)是一個數字,表示線性分布的強度與方向
強度(strength),表示分布點與回歸線的靠近程度
方向(direction),說明當一個變數上升,另一變數是否上升或下降()
這個方法稱作 correlation coefficient(相關係數)
相關係數的公式
r =
1
n−1
∑ (
xi−x̅
sx
)i (
yi−y̅
sy
)
解釋相關係數
1 相關係數會在-1 到+1 之間
2 相關係數的大小(無關正負號),決定強度(靠近程度)
*相關係數為+1 或-1 表示數值剛好全部落在一條線
3 正號表示正相關,負號表示負相關
4 相關係數為 0,表示兩個變數無相關,所以回歸線為水平直線
(圖 3.11)
平方相關係數 r2
1 會在 0 到 1(或 100%)之間
2 解釋 x 變數有多少%的變化可以在 y 變數中觀察到