SlideShare a Scribd company logo
1 of 26
卡方檢定:
測驗兩個類別變數的獨立性
 第五組:林晏平.劉佩怡.廖一珊.
     洪子媛.劉佳宜.謝雯帆.
   要比較的樣本個數
單一樣本→t檢定
雙樣本→雙樣本獨立t檢定
兩個以上的樣本→ANOVA
        
以上皆可→卡方檢定
卡方適合度檢定




   類別資料所佔的比例可以反映出某種特定
    的機率分配
   投擲一硬幣 500 次,得出 230 個正面,欲檢定
    此硬幣為公平硬幣

               正面    反面


         觀察值   230   270

         理論值   250   250
卡方獨立性檢定



      兩種類別資料是否相關
   隨機抽樣調查 200 位大學生,獲得其就讀年級
    與吸煙習慣的資料如下:

         年級   一年級   二年級   三年級   四年級

    習慣
    吸煙        21    33    25    20

    不吸煙       47    26    19    9
無母數與有母數之比較

   *無母數統計方法( nonparametric
    method )

   一種不需要知道母體機率分配的類型,不用
    在乎母數的探討,而且主要是適用於名義變
    項或是次序變項資料的統計推論方法,則稱
    為無母數統計方法;又稱為自由分配法
    ( distribution free method )。

   其基本假設為: (1) 隨機抽樣
    (randomized) ; (2) 獨立性 (independent) ;
    (3) 至少為順序變項的資料 (ordinal) 。
有母數統計        無母數統計

    對象     有限定母體的分配型    不限
           態及母體參數。

    樣本數    較適合大樣本。      較適合小樣本。

    限制     較嚴格 ( 如常態分配 ) 既不嚴格 ( 如抽樣分
                         配)
    難易度    較難,不易明辨。      較簡單

    資料型態   連續變項為主。      名義、次序。

屬   中心位置   算數平均數        中位數
描
述
性   離差量數   變易數 , 標準差    全距 , 四分位差 , 百
統                       分位差
計
大樣本的問題

2.   樣本數提升,容易得到統計顯著結果,卻不見
     得具有實質意義。

4.   例子:兩個人

6.   希望觀察與期望個數差異大,以推翻虛無假說
     ,所以會使樣本數增加,則達到統計意義。
   例子︰ ( 課本 p.439~ p.440)

    卡方檢定值 ( 表 20.17) ︰ X2 樣本 =1.08148

                   10 倍樣本數 (n=14610)

    卡方檢定值 ( 表 20.18) ︰ X2 樣本 =10.8148

   結論:
    a. 用更細的類別,使在類別上有更多選項。
    b. 增加其中一個變數的類別題目。
虛無假說的五個步驟:

 步驟 1 :列出虛無及對立假說
 H0 :性別與購買名牌的能力沒有相關
 Ha :性別與購買名牌的能力有相關
 步驟 2 : 選擇合適的顯著性檢定方法
 採用卡方檢定來測驗是否為獨立變數
 步驟 3 :計算樣本統計量
 先算出每個格子的期望個數
購買品牌原因是追
                           求流行               總和
                          是         否
大學生的   男   個數
性別
                               2         9      11
           期望個數            1.7       9.4      11.0
           購買品牌原因是追求流
           行內的 %
                        16.7%      13.2%     13.8%
       女   個數                 10        59      69
           期望個數           10.4      58.7      69.0
           購買品牌原因是追求流
           行內的 %
                        83.3%      86.8%     86.3%
總和         個數                 12        68      80
           期望個數           12.0      68.0      80.0
           購買品牌原因是追求流
           行內的 %
                        100.0% 100.0% 100.0%
X2 樣本 =0.101

步驟 4 :建立臨界值及臨界域
X2 臨界值 =3.841(a=0.05 , df =1)

步驟 5 :下決策



                                拒絕
 H0
   樣本卡方值沒有落在臨界域內,所以不能
    拒絕虛無假說。
    即性別與購買名牌的能力沒有相關。
小樣本的問題

當:
   2 維列聯表任一格子之期望個數小於 1

   2 維列聯表中比例最大的格子之期望個數
    小於 5( 理想狀況要大於等於 5)

--- 卡方檢定對於估計過小樣本的情況
  並不理想
小樣本的問題

對於大於 2x2 之 2 維列聯表,建議將其中一個或兩
 個變數一些類別合併
(合併時必須確認這些類別的出現沒有差別)


   可用 SPSS 之重新編碼來避免期望個數太小的問
    題
   例:將「最低」、「低」合併為「低」
    「最高」、「高」合併為「高」
圖一




2.。
30
30
如上表, III , IV 世代之卡方檢定 P
值< .05 ,也即所謂樣本與母體期望
差異大,可推論未婚與已婚差異甚高。
因此可知 50 年代以前,由樣本推論
大部分人皆已婚;而 50 年代以後出
生者可能仍有許多未婚者。  
附錄

   卡方檢定可以 2 維列聯表 , 測驗兩個變數
    是否獨立 .
   如果 2 維列聯表為 2x2, 則也可用 z 檢定 ,
    而且會得到相同結果 .
   以 z 檢定比較兩個比例是否有差異 , 是卡
    方檢定的特例 .
用 z 檢定比較兩個比例

   抽樣變異可能會抽到很極端的樣本 , 所以
    就算抽出的樣本相同 , 也不見得能反映母
    體的情況 .
   而差異越大表示來自抽樣變異的可能性越
    低 , 用 z 檢定比較兩個比例 , 便可知發生
    的機率有多少 .
重點



   雙樣本 z 檢定是卡方檢定的特例 . 因為雙
    樣本 z 檢定的公式比較繁瑣 , 所以建議用
    卡方檢定 .
總結

 為甚麼會用卡方檢定 ?
 因為用來看兩個變項之間是否互相獨立 .


 影響卡方檢定的因素 ?
 樣本大小和顯著水準 .


 卡方檢定使用的前題 ?
 為無母數檢定 和資料是名義或順序尺度
  .
   變項之間有組間的差異代表有顯著相關嗎
    ?
   這時要用 Phi 與 Cramer‘s V 係數來看變
    項的關聯性強度 .

More Related Content

What's hot

康軒中自二下Ppt經典款ch1 3
康軒中自二下Ppt經典款ch1 3康軒中自二下Ppt經典款ch1 3
康軒中自二下Ppt經典款ch1 3
fbw41598
 
【經理人必修】目標管理7步驟
【經理人必修】目標管理7步驟【經理人必修】目標管理7步驟
【經理人必修】目標管理7步驟
周建良 Zhou Jian Liang
 
企業精進讀書會-獲利世代 自己動手,畫出你的商業模式
企業精進讀書會-獲利世代 自己動手,畫出你的商業模式企業精進讀書會-獲利世代 自己動手,畫出你的商業模式
企業精進讀書會-獲利世代 自己動手,畫出你的商業模式
TheraChing
 
QM-039-何謂SPC
QM-039-何謂SPCQM-039-何謂SPC
QM-039-何謂SPC
handbook
 
教育概論
教育概論教育概論
教育概論
clinic
 
02 spc訓練教材
02 spc訓練教材02 spc訓練教材
02 spc訓練教材
營松 林
 

What's hot (20)

PLS偏最小平方法教材一天-三星統計謝章升-20131122
PLS偏最小平方法教材一天-三星統計謝章升-20131122PLS偏最小平方法教材一天-三星統計謝章升-20131122
PLS偏最小平方法教材一天-三星統計謝章升-20131122
 
統計心法-基本內功
統計心法-基本內功統計心法-基本內功
統計心法-基本內功
 
現場生產力管理 productivity management
現場生產力管理 productivity management現場生產力管理 productivity management
現場生產力管理 productivity management
 
三星統計張偉豪-統計4超人-SPSS,SEM,HLM,PLS
三星統計張偉豪-統計4超人-SPSS,SEM,HLM,PLS三星統計張偉豪-統計4超人-SPSS,SEM,HLM,PLS
三星統計張偉豪-統計4超人-SPSS,SEM,HLM,PLS
 
Strategy-Generation-and-Selection.pptx
Strategy-Generation-and-Selection.pptxStrategy-Generation-and-Selection.pptx
Strategy-Generation-and-Selection.pptx
 
康軒中自二下Ppt經典款ch1 3
康軒中自二下Ppt經典款ch1 3康軒中自二下Ppt經典款ch1 3
康軒中自二下Ppt經典款ch1 3
 
【經理人必修】目標管理7步驟
【經理人必修】目標管理7步驟【經理人必修】目標管理7步驟
【經理人必修】目標管理7步驟
 
4. 建立職場愛的關係
4. 建立職場愛的關係4. 建立職場愛的關係
4. 建立職場愛的關係
 
HLM階層線性模型基礎班-三星統計張偉豪
HLM階層線性模型基礎班-三星統計張偉豪HLM階層線性模型基礎班-三星統計張偉豪
HLM階層線性模型基礎班-三星統計張偉豪
 
103.11.10 企業問題分析與診斷能力提昇--國際教育訓練處-詹翔霖
103.11.10 企業問題分析與診斷能力提昇--國際教育訓練處-詹翔霖103.11.10 企業問題分析與診斷能力提昇--國際教育訓練處-詹翔霖
103.11.10 企業問題分析與診斷能力提昇--國際教育訓練處-詹翔霖
 
SPSS從0開始-三星統計張偉豪
SPSS從0開始-三星統計張偉豪SPSS從0開始-三星統計張偉豪
SPSS從0開始-三星統計張偉豪
 
企業精進讀書會-獲利世代 自己動手,畫出你的商業模式
企業精進讀書會-獲利世代 自己動手,畫出你的商業模式企業精進讀書會-獲利世代 自己動手,畫出你的商業模式
企業精進讀書會-獲利世代 自己動手,畫出你的商業模式
 
如何設計一場工作坊
如何設計一場工作坊如何設計一場工作坊
如何設計一場工作坊
 
QM-039-何謂SPC
QM-039-何謂SPCQM-039-何謂SPC
QM-039-何謂SPC
 
教育概論
教育概論教育概論
教育概論
 
系統性問題解決方法-QC Story
系統性問題解決方法-QC Story系統性問題解決方法-QC Story
系統性問題解決方法-QC Story
 
IE手法-愚巧法、防錯法 Fool-Proofing
IE手法-愚巧法、防錯法 Fool-ProofingIE手法-愚巧法、防錯法 Fool-Proofing
IE手法-愚巧法、防錯法 Fool-Proofing
 
How to write up and report PLS analyses-三星統計張偉豪-20141004
How to write up and report PLS analyses-三星統計張偉豪-20141004How to write up and report PLS analyses-三星統計張偉豪-20141004
How to write up and report PLS analyses-三星統計張偉豪-20141004
 
作業程序圖 process chart
作業程序圖 process chart作業程序圖 process chart
作業程序圖 process chart
 
02 spc訓練教材
02 spc訓練教材02 spc訓練教材
02 spc訓練教材
 

More from clinic

正義:一場思辨之旅
正義:一場思辨之旅正義:一場思辨之旅
正義:一場思辨之旅
clinic
 
02輔導的基本概念與發展
02輔導的基本概念與發展02輔導的基本概念與發展
02輔導的基本概念與發展
clinic
 
02教學科技的定義與內涵
02教學科技的定義與內涵02教學科技的定義與內涵
02教學科技的定義與內涵
clinic
 
98陳師上課板書10~12堂
98陳師上課板書10~12堂98陳師上課板書10~12堂
98陳師上課板書10~12堂
clinic
 
98陳師上課板書1~6堂
98陳師上課板書1~6堂98陳師上課板書1~6堂
98陳師上課板書1~6堂
clinic
 
98陳師上課板書13~15堂
98陳師上課板書13~15堂98陳師上課板書13~15堂
98陳師上課板書13~15堂
clinic
 
98陳師上課板書16~18堂
98陳師上課板書16~18堂98陳師上課板書16~18堂
98陳師上課板書16~18堂
clinic
 
98陳師上課板書7~9堂
98陳師上課板書7~9堂98陳師上課板書7~9堂
98陳師上課板書7~9堂
clinic
 
知識加法條背訟方法
知識加法條背訟方法知識加法條背訟方法
知識加法條背訟方法
clinic
 
關鍵字~領導(影印版)
關鍵字~領導(影印版)關鍵字~領導(影印版)
關鍵字~領導(影印版)
clinic
 
關鍵字~管理
關鍵字~管理關鍵字~管理
關鍵字~管理
clinic
 
關鍵字~預算(影印版)
關鍵字~預算(影印版)關鍵字~預算(影印版)
關鍵字~預算(影印版)
clinic
 
行政學
行政學行政學
行政學
clinic
 
關鍵字~新公共行政、新公共管理及新
關鍵字~新公共行政、新公共管理及新關鍵字~新公共行政、新公共管理及新
關鍵字~新公共行政、新公共管理及新
clinic
 
關鍵字~治理(影印版)
關鍵字~治理(影印版)關鍵字~治理(影印版)
關鍵字~治理(影印版)
clinic
 
關鍵字~行政(影印版)
關鍵字~行政(影印版)關鍵字~行政(影印版)
關鍵字~行政(影印版)
clinic
 
關鍵字~三大理論時期(影印版)
關鍵字~三大理論時期(影印版)關鍵字~三大理論時期(影印版)
關鍵字~三大理論時期(影印版)
clinic
 
關鍵字~組織(影印版)
關鍵字~組織(影印版)關鍵字~組織(影印版)
關鍵字~組織(影印版)
clinic
 

More from clinic (20)

123
123123
123
 
123
123123
123
 
正義:一場思辨之旅
正義:一場思辨之旅正義:一場思辨之旅
正義:一場思辨之旅
 
02輔導的基本概念與發展
02輔導的基本概念與發展02輔導的基本概念與發展
02輔導的基本概念與發展
 
02教學科技的定義與內涵
02教學科技的定義與內涵02教學科技的定義與內涵
02教學科技的定義與內涵
 
98陳師上課板書10~12堂
98陳師上課板書10~12堂98陳師上課板書10~12堂
98陳師上課板書10~12堂
 
98陳師上課板書1~6堂
98陳師上課板書1~6堂98陳師上課板書1~6堂
98陳師上課板書1~6堂
 
98陳師上課板書13~15堂
98陳師上課板書13~15堂98陳師上課板書13~15堂
98陳師上課板書13~15堂
 
98陳師上課板書16~18堂
98陳師上課板書16~18堂98陳師上課板書16~18堂
98陳師上課板書16~18堂
 
98陳師上課板書7~9堂
98陳師上課板書7~9堂98陳師上課板書7~9堂
98陳師上課板書7~9堂
 
知識加法條背訟方法
知識加法條背訟方法知識加法條背訟方法
知識加法條背訟方法
 
關鍵字~領導(影印版)
關鍵字~領導(影印版)關鍵字~領導(影印版)
關鍵字~領導(影印版)
 
關鍵字~管理
關鍵字~管理關鍵字~管理
關鍵字~管理
 
關鍵字~預算(影印版)
關鍵字~預算(影印版)關鍵字~預算(影印版)
關鍵字~預算(影印版)
 
行政學
行政學行政學
行政學
 
關鍵字~新公共行政、新公共管理及新
關鍵字~新公共行政、新公共管理及新關鍵字~新公共行政、新公共管理及新
關鍵字~新公共行政、新公共管理及新
 
關鍵字~治理(影印版)
關鍵字~治理(影印版)關鍵字~治理(影印版)
關鍵字~治理(影印版)
 
關鍵字~行政(影印版)
關鍵字~行政(影印版)關鍵字~行政(影印版)
關鍵字~行政(影印版)
 
關鍵字~三大理論時期(影印版)
關鍵字~三大理論時期(影印版)關鍵字~三大理論時期(影印版)
關鍵字~三大理論時期(影印版)
 
關鍵字~組織(影印版)
關鍵字~組織(影印版)關鍵字~組織(影印版)
關鍵字~組織(影印版)
 

第五組報告卡方檢定

  • 2.
  • 3. 要比較的樣本個數 單一樣本→t檢定 雙樣本→雙樣本獨立t檢定 兩個以上的樣本→ANOVA          以上皆可→卡方檢定
  • 4. 卡方適合度檢定  類別資料所佔的比例可以反映出某種特定 的機率分配
  • 5. 投擲一硬幣 500 次,得出 230 個正面,欲檢定 此硬幣為公平硬幣 正面 反面 觀察值 230 270 理論值 250 250
  • 6. 卡方獨立性檢定  兩種類別資料是否相關
  • 7. 隨機抽樣調查 200 位大學生,獲得其就讀年級 與吸煙習慣的資料如下: 年級 一年級 二年級 三年級 四年級 習慣 吸煙 21 33 25 20 不吸煙 47 26 19 9
  • 8. 無母數與有母數之比較  *無母數統計方法( nonparametric method )  一種不需要知道母體機率分配的類型,不用 在乎母數的探討,而且主要是適用於名義變 項或是次序變項資料的統計推論方法,則稱 為無母數統計方法;又稱為自由分配法 ( distribution free method )。  其基本假設為: (1) 隨機抽樣 (randomized) ; (2) 獨立性 (independent) ; (3) 至少為順序變項的資料 (ordinal) 。
  • 9. 有母數統計 無母數統計 對象 有限定母體的分配型 不限 態及母體參數。 樣本數 較適合大樣本。 較適合小樣本。 限制 較嚴格 ( 如常態分配 ) 既不嚴格 ( 如抽樣分 配) 難易度 較難,不易明辨。 較簡單 資料型態 連續變項為主。 名義、次序。 屬 中心位置 算數平均數 中位數 描 述 性 離差量數 變易數 , 標準差 全距 , 四分位差 , 百 統 分位差 計
  • 10. 大樣本的問題 2. 樣本數提升,容易得到統計顯著結果,卻不見 得具有實質意義。 4. 例子:兩個人 6. 希望觀察與期望個數差異大,以推翻虛無假說 ,所以會使樣本數增加,則達到統計意義。
  • 11. 例子︰ ( 課本 p.439~ p.440) 卡方檢定值 ( 表 20.17) ︰ X2 樣本 =1.08148 10 倍樣本數 (n=14610) 卡方檢定值 ( 表 20.18) ︰ X2 樣本 =10.8148  結論: a. 用更細的類別,使在類別上有更多選項。 b. 增加其中一個變數的類別題目。
  • 12. 虛無假說的五個步驟: 步驟 1 :列出虛無及對立假說 H0 :性別與購買名牌的能力沒有相關 Ha :性別與購買名牌的能力有相關 步驟 2 : 選擇合適的顯著性檢定方法 採用卡方檢定來測驗是否為獨立變數 步驟 3 :計算樣本統計量 先算出每個格子的期望個數
  • 13. 購買品牌原因是追 求流行 總和 是 否 大學生的 男 個數 性別 2 9 11 期望個數 1.7 9.4 11.0 購買品牌原因是追求流 行內的 % 16.7% 13.2% 13.8% 女 個數 10 59 69 期望個數 10.4 58.7 69.0 購買品牌原因是追求流 行內的 % 83.3% 86.8% 86.3% 總和 個數 12 68 80 期望個數 12.0 68.0 80.0 購買品牌原因是追求流 行內的 % 100.0% 100.0% 100.0%
  • 14. X2 樣本 =0.101 步驟 4 :建立臨界值及臨界域 X2 臨界值 =3.841(a=0.05 , df =1) 步驟 5 :下決策 拒絕 H0
  • 15. 樣本卡方值沒有落在臨界域內,所以不能 拒絕虛無假說。 即性別與購買名牌的能力沒有相關。
  • 16. 小樣本的問題 當:  2 維列聯表任一格子之期望個數小於 1  2 維列聯表中比例最大的格子之期望個數 小於 5( 理想狀況要大於等於 5) --- 卡方檢定對於估計過小樣本的情況 並不理想
  • 17. 小樣本的問題 對於大於 2x2 之 2 維列聯表,建議將其中一個或兩 個變數一些類別合併 (合併時必須確認這些類別的出現沒有差別)  可用 SPSS 之重新編碼來避免期望個數太小的問 題  例:將「最低」、「低」合併為「低」     「最高」、「高」合併為「高」
  • 19. 30
  • 20. 30
  • 21. 如上表, III , IV 世代之卡方檢定 P 值< .05 ,也即所謂樣本與母體期望 差異大,可推論未婚與已婚差異甚高。 因此可知 50 年代以前,由樣本推論 大部分人皆已婚;而 50 年代以後出 生者可能仍有許多未婚者。  
  • 22. 附錄  卡方檢定可以 2 維列聯表 , 測驗兩個變數 是否獨立 .  如果 2 維列聯表為 2x2, 則也可用 z 檢定 , 而且會得到相同結果 .  以 z 檢定比較兩個比例是否有差異 , 是卡 方檢定的特例 .
  • 23. 用 z 檢定比較兩個比例  抽樣變異可能會抽到很極端的樣本 , 所以 就算抽出的樣本相同 , 也不見得能反映母 體的情況 .  而差異越大表示來自抽樣變異的可能性越 低 , 用 z 檢定比較兩個比例 , 便可知發生 的機率有多少 .
  • 24. 重點  雙樣本 z 檢定是卡方檢定的特例 . 因為雙 樣本 z 檢定的公式比較繁瑣 , 所以建議用 卡方檢定 .
  • 25. 總結  為甚麼會用卡方檢定 ?  因為用來看兩個變項之間是否互相獨立 .  影響卡方檢定的因素 ?  樣本大小和顯著水準 .  卡方檢定使用的前題 ?  為無母數檢定 和資料是名義或順序尺度 .
  • 26. 變項之間有組間的差異代表有顯著相關嗎 ?  這時要用 Phi 與 Cramer‘s V 係數來看變 項的關聯性強度 .