การทดสอบไค-สแควร์ Chi-square Test
การทดสอบไค - สแควร์ เนื่องจากข้อมูลที่ได้จากการวิจัยบางเรื่องเป็นข้อมูลที่อยู่ในรูปของความถี่ และถ้าผู้วิจัยต้องการตรวจสอบว่าข้อมูลที่รวบรวมได้เป็นไปตามทฤษฎีหรือตามที่คาดหวัง หรือต้องการหาความสัมพันธ์ระหว่างตัวแปร  2  ตัว  ผู้วิจัยสามารถหาคำตอบได้โดยใช้การทดสอบไค - สแควร์
การใช้การทดสอบไค - สแควร์  2  กรณี กรณีที่  1  การทดสอบข้อมูลที่มี  1   มิติ  ( The  one -variable case  หรือ  Goodness of fit test) กรณีที่  2  การทดสอบความเป็นอิสระ (  The  test for Independence)
การทดสอบข้อมูลที่มี  1  มิติ การทดสอบข้อมูลที่มี  1  มิติ ใช้พิจารณาว่ามีความแตกต่างระหว่างความถี่ที่สังเกตได้ ( Observed Frequency)  ในแต่ละประเภทกับความถี่ที่คาดหวังไว้  (Expected Frequency)   หรือความถี่ตามทฤษฎีหรือไม่ ซึ่งข้อความนี้ก็คือสมมติฐานหลัก ( Null Hypothesis: H 0 )  ซึ่งอาจกล่าวอีกอย่างหนึ่งได้ว่า การทดสอบแบบนี้ใช้พิจารณาว่า “ความถี่ที่สังเกตได้เป็นไปตามที่คาดหวังหรือไม่”
การทดสอบไค - สแควร์ H 0  ที่ตั้งไว้ว่า “ ไม่มีความแตกต่างระหว่างความถี่ที่สังเกตได้กับความถี่ที่คาดหวัง ” H 1  ได้แก่ “ ความที่ที่สังเกตได้แตกต่างจากความถี่ที่คาดหวัง” สูตร เมื่อ  O  แทนความถี่ที่สังเกตได้ E  แทนความถี่ที่คาดหวัง 2
ความถี่ที่ได้จากการสังเกต   ( Observed Frequency) ข้อมูลที่รวบรวมได้จากกลุ่มตัวอย่าง ซึ่งเป็นข้อมูลในลักษณะที่ได้จากการนับ ส่วนความถี่ตามทฤษฎีก็คือตัวเลขหรือความถี่ที่กำหนดไว้ตามทฤษฎี หรือกฎต่างๆ หรือเป็นความถี่ที่ผู้วิจัยคาดหวังว่าจะเป็นเช่นนั้น
ความถี่ตามที่คาดหวัง ( Expected Frequency) ลักษณะที่  1   คือ ต้องคำนวณหาเองโดยเอาผลรวมของความถี่ที่ได้จากการสังเกตทั้งหมดหารด้วยจำนวนประเภทหรือจำนวนพวก ลักษณะที่  2   คือ เป็นความถี่ตามทฤษฎี ซึ่งอาจอยู่ในรูปสัดส่วนหรือร้อยละ
ตัวอย่างค่าที่สังเกตได้หรือค่าที่คาดหวัง โยนเหรียญ  1   อัน  100  ครั้ง ปรากฏว่าออกหัวนับได้  68   ครั้ง ออกก้อยนับได้  32   ครั้ง  ตัวเลข  68  และ  32  เป็นความถี่ที่สังเกตได้ ส่วนความถี่ที่คาดหวังก็จะเป็น ออกหัว  50   ครั้งและออกก้อย  50  ครั้ง
ขั้นตอนที่  1   ตั้งสมมติฐาน H 0  :  ไม่มีความแตกต่างระหว่างความถี่ที่สังเกตได้กับความถี่ที่คาดหวัง H 1  :  ความถี่ที่สังเกตได้กับความถี่ที่คาดหวังแตกต่างกัน ขั้นตอนที่  2  กำหนดระดับนัยสำคัญ ขั้นตอนที่  3  คำนวณค่า  จากสูตร ขั้นตอนที่  4   หาค่า  จากตาราง ณ ระดับนัยสำคัญที่ตั้งไว้ โดยมี  df = k-1 ขั้นตอนการทดสอบไค-สแควร์
ขั้นตอนที่  5  เปรียบเทียบค่า  ที่ได้จากการคำนวณกับ ค่า  ที่ได้จากตาราง ขั้นตอนที่  6  สรุปผล ถ้า  คำนวณ มากกว่าหรือเท่ากับ  ตาราง ก็ปฏิเสธ   H 0   ยอมรับ  H 1 และ ถ้า  คำนวณ น้อยกว่า  ตาราง ก็ยอมรับ   H 0 ขั้นตอนการทดสอบไค-สแควร์(2)
ตัวอย่างการคำนวณ ทางมหาวิทยาลัยต้องการทราบความคิดเห็นของอาจารย์ว่า เห็นด้วยหรือไม่ที่จะมีการออกระเบียบว่าด้วยการแต่งกายของนิสิต จึงได้สุ่มตัวอย่างอาจารย์  100  คน มาสอบถาม ปรากฎว่า มีอาจารย์ที่ตอบว่า เห็นด้วย  60  คน ไม่เห็นด้วย  40  คน จงทดสอบว่าจะสรุปว่าอาจารย์ส่วนใหญ่ของมหาวิทยาลัยเห็นด้วยได้หรือไม่ ใช้ แฟ้มข้อมูล ชื่อ  chi_square1.sav
การวิเคราะห์ด้วย  SPSS
 
click click click
ผลการวิเคราะห์ ความถี่ที่สังเกตได้และค่าความคาดหวัง ค่าไค - สแควร์และระดับนัยสำคัญ
การทดสอบความเป็นอิสระ เป็นการทดสอบความสัมพันธ์ระหว่างตัวแปร  2  ตัวเมื่อข้อมูลที่รวบรวมได้เป็นข้อมูลในระดับนามบัญญัติ  (Nominal Scale)  ซึ่งจะเป็นข้อมูลที่อยู่ในรูปความถี่ สัดส่วนหรือร้อยละ โดยที่ตัวแปรแต่ละตัวแบ่งเป็นประเภทหรือเป็นกลุ่มย่อยๆ ตั้งแต่  2  กลุ่มขึ้นไป อาจเป็นแบบ  2x2, 2x3, 3x3, 3x4,… เป็นต้น  การทดสอบความเป็นอิสระนี้จะต้องตั้งสมมติฐานหลัก ว่าตัวแปร  2  ตัวนั้นไม่มีความสัมพันธ์กัน ซึ่งกล่าวอีกอย่างหนึ่งได้ว่า ตัวแปร  2   ตัวนั้นเป็นอิสระจากกัน ดังนั้นจึงเรียกการทดสอบนี้ว่า “การทดสอบความเป็นอิสระ” การทดสอบความเป็นอิสระ
การทดสอบความเป็นอิสระ สูตร 2 เมื่อ  O  แทนความถี่ที่สังเกตได้ E  แทนความถี่ที่คาดหวัง และหา  E  ที่คู่กับ  O  แต่ละตัว โดย R  แทนผลรวมของความถี่ในแถวนั้น C  แทนผลรวมของความถี่ในคอลัมน์นั้น N  แทนผลรวมของความถีทั้งหมด E =
ตัวอย่างการทดสอบความเป็นอิสระ สมมติว่า นักวิจัยท่านหนึ่งต้องการทดสอบว่า การสูบบุหรี่กับการเกิดมะเร็งมีความสัมพันธ์กันหรือไม่ หรือเป็นอิสระจากกัน จากข้อมูลที่เก็บรวบรวมมาพบว่า มีผู้ไม่สูบบุหรี่  30  คน และผู้สูบบุหรี่  50   คน  ในกลุ่มผู้ที่ไม่สูบบุหรี่เป็นมะเร็ง  12  คน ไม่เป็นมะเร็ง  18  คน ในกลุ่มผู้สูบบุหรี่ เป็นมะเร็ง  30  คน และไม่เป็นมะเร็ง  20  คน ใช้ แฟ้มข้อมูล ชื่อ  chi_square2.sav
การวิเคราะห์ด้วย  SPSS
click
Select click
click click Select click
ผลการวิเคราะห์ จำนวนและร้อยละของการสูบบุหรี่และการเป็นมะเร็ง
ค่าไค - สแควร์และระดับนัยสำคัญ
การหาระดับความสัมพันธ์จากค่าไค - สแควร์ จากการทดสอบความเป็นอิสระ เมื่อพบว่ามีนัยสำคัญทางสถิติ สรุปได้เพียงว่า ตัวแปร  2  ตัวแปรนั้นมีความสัมพันธ์กันมากน้อยเพียงใด ถ้าต้องการทราบว่า  2  ตัวแปร นั้นสัมพันธ์กันมากน้อยเพ ี ยงใด จะต้องใช้สถิติ Phi Coefficient (  ) หรือ  Contingency Coefficient (C ) หรือ  Cramer’s V (V)
เมื่อ  N  แทนจำนวนข้อมูลทั้งหมดที่ศึกษา สูตร 2 Phi Coefficient  แทนค่า ไค - สแควร์
1.  ใช้ได้กับ  Contingency table 2x2  เท่านั้น 2.  ค่า  จะอยู่ระหว่าง  0  ถึง   1 3.  ใช้ได้เฉพาะข้อมูลที่อยู่ในระดับนามบัญญัติและบอกเพียงความสัมพันธ์แต่ไม่บอกทิศทาง Phi Coefficient
Contingency Coefficient สูตร C  =   +  N เมื่อ  N  แทนจำนวนข้อมูลทั้งหมดที่ศึกษา แทนค่า ไค - สแควร์
1.  ใช้ได้กับ   Contingency Table  ที่อยู่ในรูปมากกว่า  2x2 2.  ค่า  C  ที่คำนวณได้ต่ำสุดเป็น  0  แต่สูงสุดไม่ถึง  1 3.  ค่าสูงสุดของ  C  มีค่าเท่ากับ  k-1 Contingency Coefficient k เมื่อ  k  แทนจำนวนแถว หรือคอลัมน์
Cramer's V (V) สูตร V =   N Minimum(r-1 or c-1) Cramer’ s V  เป็นวิธีที่เหมาะสมที่สุดทั้งนี้เพราะ 1.  ใช้ได้กับ Contingency  ขนาดใดก็ได้ 2.  ค่า  V  ที่คำนวณได้มีค่าอยู่ระหว่าง  0  กับ  1
การวิเคราะห์ความสัมพันธ์จากค่าไค - สแควร์ด้วย  SPSS กระบวนการต่างๆ เหมือนกับการวิเคราะห์ไค - สแควร์ แต่เพิ่มตรงค่าสถิติในการวิเคราะห์ดังภาพ Select
ค่าความสัมพันธ์ระหว่างการสูบบุหรี่กับการเป็นมะเร็ง
In survey  to determine high school students’ preference for Instructional model  the results were : Model A  Model B  Model C Boys  25  30  52 Girls  46  22  28 Was there any relationship between the model preference and the gender of high school students? Exercise

Chi square

  • 1.
  • 2.
    การทดสอบไค - สแควร์เนื่องจากข้อมูลที่ได้จากการวิจัยบางเรื่องเป็นข้อมูลที่อยู่ในรูปของความถี่ และถ้าผู้วิจัยต้องการตรวจสอบว่าข้อมูลที่รวบรวมได้เป็นไปตามทฤษฎีหรือตามที่คาดหวัง หรือต้องการหาความสัมพันธ์ระหว่างตัวแปร 2 ตัว ผู้วิจัยสามารถหาคำตอบได้โดยใช้การทดสอบไค - สแควร์
  • 3.
    การใช้การทดสอบไค - สแควร์ 2 กรณี กรณีที่ 1 การทดสอบข้อมูลที่มี 1 มิติ ( The one -variable case หรือ Goodness of fit test) กรณีที่ 2 การทดสอบความเป็นอิสระ ( The test for Independence)
  • 4.
    การทดสอบข้อมูลที่มี 1 มิติ การทดสอบข้อมูลที่มี 1 มิติ ใช้พิจารณาว่ามีความแตกต่างระหว่างความถี่ที่สังเกตได้ ( Observed Frequency) ในแต่ละประเภทกับความถี่ที่คาดหวังไว้ (Expected Frequency) หรือความถี่ตามทฤษฎีหรือไม่ ซึ่งข้อความนี้ก็คือสมมติฐานหลัก ( Null Hypothesis: H 0 ) ซึ่งอาจกล่าวอีกอย่างหนึ่งได้ว่า การทดสอบแบบนี้ใช้พิจารณาว่า “ความถี่ที่สังเกตได้เป็นไปตามที่คาดหวังหรือไม่”
  • 5.
    การทดสอบไค - สแควร์H 0 ที่ตั้งไว้ว่า “ ไม่มีความแตกต่างระหว่างความถี่ที่สังเกตได้กับความถี่ที่คาดหวัง ” H 1 ได้แก่ “ ความที่ที่สังเกตได้แตกต่างจากความถี่ที่คาดหวัง” สูตร เมื่อ O แทนความถี่ที่สังเกตได้ E แทนความถี่ที่คาดหวัง 2
  • 6.
    ความถี่ที่ได้จากการสังเกต ( Observed Frequency) ข้อมูลที่รวบรวมได้จากกลุ่มตัวอย่าง ซึ่งเป็นข้อมูลในลักษณะที่ได้จากการนับ ส่วนความถี่ตามทฤษฎีก็คือตัวเลขหรือความถี่ที่กำหนดไว้ตามทฤษฎี หรือกฎต่างๆ หรือเป็นความถี่ที่ผู้วิจัยคาดหวังว่าจะเป็นเช่นนั้น
  • 7.
    ความถี่ตามที่คาดหวัง ( ExpectedFrequency) ลักษณะที่ 1 คือ ต้องคำนวณหาเองโดยเอาผลรวมของความถี่ที่ได้จากการสังเกตทั้งหมดหารด้วยจำนวนประเภทหรือจำนวนพวก ลักษณะที่ 2 คือ เป็นความถี่ตามทฤษฎี ซึ่งอาจอยู่ในรูปสัดส่วนหรือร้อยละ
  • 8.
    ตัวอย่างค่าที่สังเกตได้หรือค่าที่คาดหวัง โยนเหรียญ 1 อัน 100 ครั้ง ปรากฏว่าออกหัวนับได้ 68 ครั้ง ออกก้อยนับได้ 32 ครั้ง ตัวเลข 68 และ 32 เป็นความถี่ที่สังเกตได้ ส่วนความถี่ที่คาดหวังก็จะเป็น ออกหัว 50 ครั้งและออกก้อย 50 ครั้ง
  • 9.
    ขั้นตอนที่ 1 ตั้งสมมติฐาน H 0 : ไม่มีความแตกต่างระหว่างความถี่ที่สังเกตได้กับความถี่ที่คาดหวัง H 1 : ความถี่ที่สังเกตได้กับความถี่ที่คาดหวังแตกต่างกัน ขั้นตอนที่ 2 กำหนดระดับนัยสำคัญ ขั้นตอนที่ 3 คำนวณค่า จากสูตร ขั้นตอนที่ 4 หาค่า จากตาราง ณ ระดับนัยสำคัญที่ตั้งไว้ โดยมี df = k-1 ขั้นตอนการทดสอบไค-สแควร์
  • 10.
    ขั้นตอนที่ 5 เปรียบเทียบค่า ที่ได้จากการคำนวณกับ ค่า ที่ได้จากตาราง ขั้นตอนที่ 6 สรุปผล ถ้า คำนวณ มากกว่าหรือเท่ากับ ตาราง ก็ปฏิเสธ H 0 ยอมรับ H 1 และ ถ้า คำนวณ น้อยกว่า ตาราง ก็ยอมรับ H 0 ขั้นตอนการทดสอบไค-สแควร์(2)
  • 11.
    ตัวอย่างการคำนวณ ทางมหาวิทยาลัยต้องการทราบความคิดเห็นของอาจารย์ว่า เห็นด้วยหรือไม่ที่จะมีการออกระเบียบว่าด้วยการแต่งกายของนิสิตจึงได้สุ่มตัวอย่างอาจารย์ 100 คน มาสอบถาม ปรากฎว่า มีอาจารย์ที่ตอบว่า เห็นด้วย 60 คน ไม่เห็นด้วย 40 คน จงทดสอบว่าจะสรุปว่าอาจารย์ส่วนใหญ่ของมหาวิทยาลัยเห็นด้วยได้หรือไม่ ใช้ แฟ้มข้อมูล ชื่อ chi_square1.sav
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
    การทดสอบความเป็นอิสระ เป็นการทดสอบความสัมพันธ์ระหว่างตัวแปร 2 ตัวเมื่อข้อมูลที่รวบรวมได้เป็นข้อมูลในระดับนามบัญญัติ (Nominal Scale) ซึ่งจะเป็นข้อมูลที่อยู่ในรูปความถี่ สัดส่วนหรือร้อยละ โดยที่ตัวแปรแต่ละตัวแบ่งเป็นประเภทหรือเป็นกลุ่มย่อยๆ ตั้งแต่ 2 กลุ่มขึ้นไป อาจเป็นแบบ 2x2, 2x3, 3x3, 3x4,… เป็นต้น การทดสอบความเป็นอิสระนี้จะต้องตั้งสมมติฐานหลัก ว่าตัวแปร 2 ตัวนั้นไม่มีความสัมพันธ์กัน ซึ่งกล่าวอีกอย่างหนึ่งได้ว่า ตัวแปร 2 ตัวนั้นเป็นอิสระจากกัน ดังนั้นจึงเรียกการทดสอบนี้ว่า “การทดสอบความเป็นอิสระ” การทดสอบความเป็นอิสระ
  • 17.
    การทดสอบความเป็นอิสระ สูตร 2เมื่อ O แทนความถี่ที่สังเกตได้ E แทนความถี่ที่คาดหวัง และหา E ที่คู่กับ O แต่ละตัว โดย R แทนผลรวมของความถี่ในแถวนั้น C แทนผลรวมของความถี่ในคอลัมน์นั้น N แทนผลรวมของความถีทั้งหมด E =
  • 18.
    ตัวอย่างการทดสอบความเป็นอิสระ สมมติว่า นักวิจัยท่านหนึ่งต้องการทดสอบว่าการสูบบุหรี่กับการเกิดมะเร็งมีความสัมพันธ์กันหรือไม่ หรือเป็นอิสระจากกัน จากข้อมูลที่เก็บรวบรวมมาพบว่า มีผู้ไม่สูบบุหรี่ 30 คน และผู้สูบบุหรี่ 50 คน ในกลุ่มผู้ที่ไม่สูบบุหรี่เป็นมะเร็ง 12 คน ไม่เป็นมะเร็ง 18 คน ในกลุ่มผู้สูบบุหรี่ เป็นมะเร็ง 30 คน และไม่เป็นมะเร็ง 20 คน ใช้ แฟ้มข้อมูล ชื่อ chi_square2.sav
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
    การหาระดับความสัมพันธ์จากค่าไค - สแควร์จากการทดสอบความเป็นอิสระ เมื่อพบว่ามีนัยสำคัญทางสถิติ สรุปได้เพียงว่า ตัวแปร 2 ตัวแปรนั้นมีความสัมพันธ์กันมากน้อยเพียงใด ถ้าต้องการทราบว่า 2 ตัวแปร นั้นสัมพันธ์กันมากน้อยเพ ี ยงใด จะต้องใช้สถิติ Phi Coefficient ( ) หรือ Contingency Coefficient (C ) หรือ Cramer’s V (V)
  • 26.
    เมื่อ N แทนจำนวนข้อมูลทั้งหมดที่ศึกษา สูตร 2 Phi Coefficient แทนค่า ไค - สแควร์
  • 27.
    1. ใช้ได้กับ Contingency table 2x2 เท่านั้น 2. ค่า จะอยู่ระหว่าง 0 ถึง 1 3. ใช้ได้เฉพาะข้อมูลที่อยู่ในระดับนามบัญญัติและบอกเพียงความสัมพันธ์แต่ไม่บอกทิศทาง Phi Coefficient
  • 28.
    Contingency Coefficient สูตรC = + N เมื่อ N แทนจำนวนข้อมูลทั้งหมดที่ศึกษา แทนค่า ไค - สแควร์
  • 29.
    1. ใช้ได้กับ Contingency Table ที่อยู่ในรูปมากกว่า 2x2 2. ค่า C ที่คำนวณได้ต่ำสุดเป็น 0 แต่สูงสุดไม่ถึง 1 3. ค่าสูงสุดของ C มีค่าเท่ากับ k-1 Contingency Coefficient k เมื่อ k แทนจำนวนแถว หรือคอลัมน์
  • 30.
    Cramer's V (V)สูตร V = N Minimum(r-1 or c-1) Cramer’ s V เป็นวิธีที่เหมาะสมที่สุดทั้งนี้เพราะ 1. ใช้ได้กับ Contingency ขนาดใดก็ได้ 2. ค่า V ที่คำนวณได้มีค่าอยู่ระหว่าง 0 กับ 1
  • 31.
    การวิเคราะห์ความสัมพันธ์จากค่าไค - สแควร์ด้วย SPSS กระบวนการต่างๆ เหมือนกับการวิเคราะห์ไค - สแควร์ แต่เพิ่มตรงค่าสถิติในการวิเคราะห์ดังภาพ Select
  • 32.
  • 33.
    In survey to determine high school students’ preference for Instructional model the results were : Model A Model B Model C Boys 25 30 52 Girls 46 22 28 Was there any relationship between the model preference and the gender of high school students? Exercise