第五組報告卡方檢定
- 3. 要比較的樣本個數
單一樣本→t檢定
雙樣本→雙樣本獨立t檢定
兩個以上的樣本→ANOVA
以上皆可→卡方檢定
- 5. 投擲一硬幣 500 次,得出 230 個正面,欲檢定
此硬幣為公平硬幣
正面 反面
觀察值 230 270
理論值 250 250
- 7. 隨機抽樣調查 200 位大學生,獲得其就讀年級
與吸煙習慣的資料如下:
年級 一年級 二年級 三年級 四年級
習慣
吸煙 21 33 25 20
不吸煙 47 26 19 9
- 8. 無母數與有母數之比較
*無母數統計方法( nonparametric
method )
一種不需要知道母體機率分配的類型,不用
在乎母數的探討,而且主要是適用於名義變
項或是次序變項資料的統計推論方法,則稱
為無母數統計方法;又稱為自由分配法
( distribution free method )。
其基本假設為: (1) 隨機抽樣
(randomized) ; (2) 獨立性 (independent) ;
(3) 至少為順序變項的資料 (ordinal) 。
- 9. 有母數統計 無母數統計
對象 有限定母體的分配型 不限
態及母體參數。
樣本數 較適合大樣本。 較適合小樣本。
限制 較嚴格 ( 如常態分配 ) 既不嚴格 ( 如抽樣分
配)
難易度 較難,不易明辨。 較簡單
資料型態 連續變項為主。 名義、次序。
屬 中心位置 算數平均數 中位數
描
述
性 離差量數 變易數 , 標準差 全距 , 四分位差 , 百
統 分位差
計
- 10. 大樣本的問題
2. 樣本數提升,容易得到統計顯著結果,卻不見
得具有實質意義。
4. 例子:兩個人
6. 希望觀察與期望個數差異大,以推翻虛無假說
,所以會使樣本數增加,則達到統計意義。
- 11. 例子︰ ( 課本 p.439~ p.440)
卡方檢定值 ( 表 20.17) ︰ X2 樣本 =1.08148
10 倍樣本數 (n=14610)
卡方檢定值 ( 表 20.18) ︰ X2 樣本 =10.8148
結論:
a. 用更細的類別,使在類別上有更多選項。
b. 增加其中一個變數的類別題目。
- 12. 虛無假說的五個步驟:
步驟 1 :列出虛無及對立假說
H0 :性別與購買名牌的能力沒有相關
Ha :性別與購買名牌的能力有相關
步驟 2 : 選擇合適的顯著性檢定方法
採用卡方檢定來測驗是否為獨立變數
步驟 3 :計算樣本統計量
先算出每個格子的期望個數
- 13. 購買品牌原因是追
求流行 總和
是 否
大學生的 男 個數
性別
2 9 11
期望個數 1.7 9.4 11.0
購買品牌原因是追求流
行內的 %
16.7% 13.2% 13.8%
女 個數 10 59 69
期望個數 10.4 58.7 69.0
購買品牌原因是追求流
行內的 %
83.3% 86.8% 86.3%
總和 個數 12 68 80
期望個數 12.0 68.0 80.0
購買品牌原因是追求流
行內的 %
100.0% 100.0% 100.0%
- 14. X2 樣本 =0.101
步驟 4 :建立臨界值及臨界域
X2 臨界值 =3.841(a=0.05 , df =1)
步驟 5 :下決策
拒絕
H0
- 15. 樣本卡方值沒有落在臨界域內,所以不能
拒絕虛無假說。
即性別與購買名牌的能力沒有相關。
- 16. 小樣本的問題
當:
2 維列聯表任一格子之期望個數小於 1
2 維列聯表中比例最大的格子之期望個數
小於 5( 理想狀況要大於等於 5)
--- 卡方檢定對於估計過小樣本的情況
並不理想
- 17. 小樣本的問題
對於大於 2x2 之 2 維列聯表,建議將其中一個或兩
個變數一些類別合併
(合併時必須確認這些類別的出現沒有差別)
可用 SPSS 之重新編碼來避免期望個數太小的問
題
例:將「最低」、「低」合併為「低」
「最高」、「高」合併為「高」
- 21. 如上表, III , IV 世代之卡方檢定 P
值< .05 ,也即所謂樣本與母體期望
差異大,可推論未婚與已婚差異甚高。
因此可知 50 年代以前,由樣本推論
大部分人皆已婚;而 50 年代以後出
生者可能仍有許多未婚者。
- 22. 附錄
卡方檢定可以 2 維列聯表 , 測驗兩個變數
是否獨立 .
如果 2 維列聯表為 2x2, 則也可用 z 檢定 ,
而且會得到相同結果 .
以 z 檢定比較兩個比例是否有差異 , 是卡
方檢定的特例 .
- 23. 用 z 檢定比較兩個比例
抽樣變異可能會抽到很極端的樣本 , 所以
就算抽出的樣本相同 , 也不見得能反映母
體的情況 .
而差異越大表示來自抽樣變異的可能性越
低 , 用 z 檢定比較兩個比例 , 便可知發生
的機率有多少 .
- 24. 重點
雙樣本 z 檢定是卡方檢定的特例 . 因為雙
樣本 z 檢定的公式比較繁瑣 , 所以建議用
卡方檢定 .
- 25. 總結
為甚麼會用卡方檢定 ?
因為用來看兩個變項之間是否互相獨立 .
影響卡方檢定的因素 ?
樣本大小和顯著水準 .
卡方檢定使用的前題 ?
為無母數檢定 和資料是名義或順序尺度
.
- 26. 變項之間有組間的差異代表有顯著相關嗎
?
這時要用 Phi 與 Cramer‘s V 係數來看變
項的關聯性強度 .