การหาคุณภาพเครื่องมือวัดผล

การหาคุณภาพเครื่องมือการประเมินการเรียนรู้
การหาคุณภาพของเครื่องมือเป็นกระบวนการในการพัฒนาคุณภาพเครื่องมือ เพื่อให้ผล
การประเมินเป็นที่เชื่อถือได้ แม้จะเป็นแนวทางที่เหมาะสมกับแบบทดสอบเท่านั้น แต่ก็ยังมีความ
จาเป็นที่ครูผู้สอนต้องใช้ในการประเมินในชั้นเรียน ดังนั้นการหาคุณภาพเครื่องมือครูผู้สอนต้อง
อาศัยความรู้พื้นฐานที่สาคัญทางด้านสถิติวิเคราะห์ ซึ่งมีวิธีการที่เหมาะสมสอดคล้องแตกต่างกันไป
ในปัจจุบันมีโปรแกรมคอมพิวเตอร์สาเร็จรูปที่ใช้ในการหาคุณภาพดังกล่าวเป็นจานวนมาก ทั้งนี้ใน
การหาคุณภาพเครื่องมือมาจากความเชื่อที่ว่าผลการประเมินที่ถูกต้องย่อมมาจากเครื่องมือที่มี
คุณภาพนั่นเอง
1. สถิติภาคบรรยายสรุป
1.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง
1.2 การวัดการกระจาย
1.3 การวัดความสัมพันธ์
2. การหาคุณภาพเครื่องมือรายข้อ
2.1 ระยะการสร้างเครื่องมือ
2.2 ระยะการพัฒนาเครื่องมือ
3. การหาคุณภาพเครื่องมือทั้งฉบับ
3.1 การหาความเที่ยงตรง
3.2 การหาความเชื่อมั่น
1. สถิติภาคบรรยายสรุป
สถิติภาคบรรยายสรุป (Descriptive Statistics) เป็นพื้นฐานสาคัญที่จะทาให้ผู้ประเมิน
มองเห็นแนวทางในการหาข้อสรุปไม่ว่าจะอยู่ในระหว่างการสร้างหรือพัฒนาเครื่องมือก็ตาม สถิติ
ภาคบรรยายสรุปได้แก่
1.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)
1.2 การวัดการกระจาย (Measures of Variability)

32
1.3 การวัดความสัมพันธ์ (Measures of Relationship)
1.1 การวัดแนวโน้มเข้าสู่ส่วนกลางที่นิยมใช้กันทั่วไปมี 3 วิธี คือ
1) ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) คือ ค่าที่ได้จากการนาข้อมูลทั้งหมดมารวมกัน
แล้วหารด้วยจานวนข้อมูลทั้งหมด
สาหรับวิธีการคานวณสามารถหาได้ 2 วิธี คือ
1.1) การคานวณค่าเฉลี่ยสาหรับข้อมูลที่ไม่แจกแจงความถี่ ใช้สูตร
1.2) การคานวณค่าเฉลี่ยสาหรับข้อมูลที่แจกแจงความถี่ ใช้สูตร
=
เมื่อ
คือ ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง
คือ ผลรวมของข้อมูลทั้งหมด
n คือ จานวนข้อมูลทั้งหมดจากกลุ่มตัวอย่างโดย n = f
f คือ ความถี่
2) มัธยฐาน (Median) คือ ค่าของข้อมูลที่อยู่ตรงกลางกลุ่ม เมื่อคะแนนหรือข้อมูลนั้นเรียง
ไว้ตามลาดับซึ่งตาแหน่งนั้นจะมีครึ่งหนึ่งของจานวนข้อมูลทั้งหมดมีค่าสูงกว่าและอีกครึ่งหนึ่งมีค่า
ต่ากว่า มีวิธีการหามัธยฐานดังนี้
2.1) การหามัธยฐานสาหรับข้อมูลที่ไม่แจกแจงความถี่ วิธีการหาค่ามัธยฐานให้นาข้อมูล
ทั้งหมดมาเรียงลาดับจากน้อยไปหามาก หรือมากไปหาน้อยก็ได้ แล้วพิจารณาว่า ข้อมูลตัวใดอยู่
ตาแหน่งตรงกลางข้อมูลนั้นก็เป็นมัธยฐานที่ต้องการ ซึ่ง จะเป็นข้อมูลตรงกับตาแหน่งที่
ต้องการ

33
2.2) การหามัธยฐานสาหรับข้อมูลที่แจกแจงความถี่ การหามัธยฐานโดยนาข้อมูลมาจัดเรียงแล้ว
พิจารณาตาแหน่งตรงกลางดังกล่าว แต่ในกรณีที่มีข้อมูลจานวนมากย่อมทาให้ไม่สะดวก ดังนั้นจึง
ต้องจัดข้อมูลเหล่านั้นให้อยู่ในรูปตารางแจกแจงความถี่ หาความถี่สะสมแล้วจึงคานวณหามัธยฐาน
Median (Mdn) โดยใช้สูตร














f
cf
2
n
iLMdn ð
เมื่อ Mdn คือ มัธยฐาน
Lo คือ ขีดจากัดล่างจริงของคะแนนในชั้นที่มีมัธยฐาน
F คือ ความถี่สะสมของช่วงคะแนนที่อยู่ใต้ช่วงที่มีมัธยฐาน
f คือ ความถี่ของคะแนนในขั้นที่มีมัธยฐาน
n คือ จานวนข้อมูลทั้งหมด
i คือ ค่าอันตรภาคชั้น
3) ฐานนิยม (Mode) คือ ค่าที่เกิดขึ้นบ่อยหรือซ้ากันมากที่สุด หรือมีความถี่มากที่สุด
หรือถ้าทราบค่าเฉลี่ยเลขคณิต (X ) และค่ามัธยฐาน (Mdn) จะสามารถหาค่าฐานนิยม (Mo) ได้จาก
ความสัมพันธ์ระหว่างค่าเฉลี่ยและค่ามัธยฐานแต่จะเป็นค่าประมาณจากสมการต่อไปนี้
Mo = 3 Mdn - 2X
1.2 การวัดการกระจาย (Measure of Variability)
ค่าที่บอกการกระจายที่เป็นที่นิยมและมีความสอดคล้องกับค่าแนวโน้มเข้าสู่ส่วนกลางมีอยู่
3 ค่า คือ ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ส่วนเบี่ยงเบนควอไทล์ (Quartile
Deviation) และพิสัย(Range) ในทางสถิตินิยมเขียนประกอบกันดังนี้ (อุทุมพร จามรมาน.2532 : 8)

34
ตาราง 3.1 ค่าที่นิยมเขียนประกอบกัน
ค่าแนวโน้มเข้าสู่ส่วนกลาง ค่าการกระจาย
ค่าเฉลี่ยเลขคณิต ส่วนเบี่ยงเบนมาตรฐาน
มัธยฐาน ส่วนเบี่ยงเบนควอไทล์
ฐานนิยม พิสัย
ในการสรุปลักษณะต่าง ๆ ของข้อมูลด้วยการใช้การวัดแนวโน้มเข้าสู่ส่วนกลางเพียงอย่าง
เดียวไม่พอ เนื่องจากการวัดแนวโน้มเข้าสู่ส่วนกลางนั้น เพียงแต่ได้ค่าที่เป็นตัวแทนของข้อมูลแต่ละ
ชุดเท่านั้นแต่จะไม่ทราบว่าข้อมูลเหล่านั้นมีค่าใกล้เคียงกัน หรือกระจายจากกันมากน้อยเพียงใด
ข้อมูลบางชุดอาจจะมีค่าที่ได้จากการวัดแนวโน้มเข้าสู่ส่วนกลางเท่ากัน แต่การกระจายของข้อมูล
แต่ละชุดอาจจะต่างกันได้ การคานวณหาการกระจายทั้ง 3 ค่า ทาได้ดังนี้
1) ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) คือรากที่สองของความแปรปรวน หรือ
ค่าเฉลี่ยการกระจายของข้อมูล การคานวณค่าเบี่ยงเบนมาตรฐาน ทาได้ดังนี้
หรือ
เมื่อ S คือ ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง
X คือ ค่าของข้อมูลแต่ละตัวหรือจุดกลางชั้นแต่ละชั้น
คือ ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง
n คือ จานวนข้อมูลทั้งหมดของกลุ่มตัวอย่าง
f คือ ค่าถี่ของข้อมูลแต่ละชั้น
2) ส่วนเบี่ยงเบนควอไทล์ (Quartile Deviation) คือค่าที่แบ่งข้อมูลที่เรียงลาดับจากน้อยไป
หามากออกเป็นสี่ส่วนเท่า ๆ กัน
3) พิสัย (Range) คือ ความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุด (Maximum) กับข้อมูล
ที่มีค่าต่าสุด (Minimum) ซึ่งการวัดการกระจายแบบนี้เป็นการวัดอย่างหยาบ

35
1.3 การวัดความสัมพันธ์ (Measures of Relationship)
เป็นการศึกษาถึงความสัมพันธ์ระหว่างตัวแปรที่สนใจว่ามีความสัมพันธ์กันหรือไม่
และความสัมพันธ์ดังกล่าวเป็นไปในทิศทางใด
การพิจารณาว่าความสัมพันธ์ระหว่างตัวแปรมีมากน้อยเพียงใดนั้นทราบได้โดยการคานวณค่า
สัมประสิทธิ์สหสัมพันธ์(CorrelationCoefficient)ซึ่งในที่นี้จะกล่าวถึงเฉพาะค่าสัมประสิทธิ์สหสัมพันธ์
อย่างง่าย(Simple Correlation Coefficient) เท่านั้นเพื่อเป็นพื้นฐานในการหาคุณภาพของเครื่องมือและ
อธิบายตัวแปรอย่างง่าย ๆ ซึ่งค่าสัมประสิทธิ์สหสัมพันธ์จะมีค่าอยู่ระหว่าง (-1) ถึง (+1) ถ้าค่า
สัมประสิทธิ์สหสัมพันธ์มีค่าเป็นลบแสดงว่าตัวแปรสองตัวนั้นมีความสัมพันธ์ในทางกลับกันคือถ้าตัว
แปรตัวหนึ่งมีค่าสูงตัวแปรอีกตัวหนึ่งมีแนวโน้มที่จะมีค่าต่าและถ้าตัวแปรตัวหนึ่งมีค่าต่าตัวแปรอีกตัวก็
มีแนวโน้มที่จะมีค่าสูง ดังตัวอย่างแสดงในรูปความสัมพันธ์ระหว่างตัวแปรในเชิงเส้นตรงระหว่าง
ผลสัมฤทธิ์ทางการเรียนกับอัตราการขาดเรียนดังนี้(Website:Msu.ed.ac.th.2006)
ภาพประกอบ 3.1 ความสัมพันธ์ในทางกลับกัน ภาพประกอบ 3.2 ความสัมพันธ์ทางเดียวกัน
ถ้าค่าสัมประสิทธิ์สหสัมพันธ์มีค่าเป็นบวก แสดงว่าตัวแปรสองตัวนั้นมีความสัมพันธ์
ในทางเดียวกันคือ ถ้าตัวแปรตัวหนึ่งมีค่าสูงตัวแปรอีกตัวหนึ่งมีแนวโน้มที่จะมีค่าสูงด้วย ดัง
ภาพประกอบ 3.2 แสดงความสัมพันธ์ระหว่างตัวแปรในเชิงเส้นตรงระหว่าง IQ กับผลสัมฤทธิ์
ทางการเรียน
ถ้าสัมประสิทธิ์สหสัมพันธ์มีค่าเป็นศูนย์แสดงว่าตัวแปรสองตัวนั้นไม่มีความสัมพันธ์กัน ดัง
ตัวอย่างแสดงในรูปความสัมพันธ์ระหว่างตัวแปรในเชิงเส้นตรงระหว่างน้าหนัก กับผลสัมฤทธิ์
ทางการเรียนดังภาพประกอบ 3.3 (Website:Msu.ed.ac.th.2006)

36
ภาพประกอบ 3.3 ไม่มีความสัมพันธ์กัน
ถ้านาค่าสัมประสิทธิ์สหสัมพันธ์มายกกาลังสองค่าที่ได้นั้นจะแสดงให้เห็นถึงสัดส่วนของความ
แปรปรวนของตัวแปรตัวหนึ่งที่สามารถอธิบายได้เมื่อรู้ค่าของตัวแปรอีกตัวหนึ่งเช่นถ้าค่าสัมประสิทธิ์
สหสัมพันธ์ระหว่างIQ และผลสัมฤทธิ์ทางการเรียนเท่ากับ0.87 R2
= 0.7569 ตัวแปรอิสระ(IQ) มี
ความสัมพันธ์กับผลสัมฤทธิ์ทางการเรียนสูงและสามารถพยากรณ์และอธิบายความแปรปรวนของตัวแปร
ตาม(ผลสัมฤทธิ์ทางการเรียน) ได้ถึงร้อยละ75.69 ดังภาพประกอบ3.4 ดังนี้ (Website:Msu.ed.ac.th.2006)
ภาพประกอบ 3.4 ประสิทธิภาพในการพยากรณ์
จากภาพประกอบ 3.4 แสดงว่าตัวแปรอิสระ (IQ) สามารถอธิบายความแปรปรวนของตัว
แปรตาม (ผลสัมฤทธิ์ทางการเรียน) ได้ร้อยละ 75.69 ส่วนที่เหลือตัวแปรอิสระ (IQ) ไม่สามารถ
อธิบาย ความแปรปรวนของตัวแปรตาม(ผลสัมฤทธิ์ทางการเรียน) ได้คือร้อยละ 24.30 ในการ
คานวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัวนั้นมีหลายวิธีขึ้นอยู่กับชนิดของข้อมูล ซึ่ง
ในที่นี้จะกล่าวถึงเฉพาะสัมประสิทธิ์สหสัมพันธ์เพียร์สันโปรดักโมเมนต์(Pearson Product moment
Correlation Coefficient) ซึ่งเป็นดัชนีที่ชี้ให้เห็นความสัมพันธ์ระหว่าง ตัวแปรสองชุด เมื่อตัวแปร
ทั้งสองชุดนั้นเป็นข้อมูลมาตราอันตรภาค (Interval Scale) ซึ่งคานวณได้จากสูตรต่อไปนี้
คานวณจากกลุ่มตัวอย่าง
เมื่อ rxy คือ ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันโพรดักโมเมนต์
n คือ จานวนคู่ของประชากรหรือกลุ่มตัวอย่างตามลาดับ
X คือ ค่าของตัวแปรชุดที่ 1

37
Y คือ ค่าของตัวแปรชุดที่ 2
2. การหาคุณภาพเครื่องมือรายข้อ
เป็นการหาคุณภาพของเครื่องมือ โดยพิจารณาทีละข้อว่ามีลักษณะข้อความเป็นอย่างไร
ทุกข้อมีคุณภาพตามเกณฑ์ในแต่ละลักษณะของแบบประเมินนั้นหรือไม่ การวิเคราะห์รายข้อ
สามารถกระทาได้ทั้งในระยะการสร้างเครื่องมือประเมินและขั้นตอนการพัฒนาเครื่องมือ
รายละเอียดดังนี้ (อุทุมพร จามรมาน. 2532, ล้วน สายยศ. 2543.)
2.1 ในระยะของการสร้างเครื่องมือ
ในระยะของการเริ่มสร้างเครื่องมือสามารถที่จะพัฒนาคุณภาพได้ด้วยการการ
วิเคราะห์รายข้อโดยการพิจารณาความสอดคล้องระหว่างข้อความ/ข้อคาถามที่สร้างขึ้นกับ
จุดมุ่งหมายในการสร้างและเนื้อหาสาระที่สร้าง ซึ่งผู้สร้างจะเป็นผู้ที่พิจารณาว่าการประเมินนั้น
สอดคล้องกับวัตถุประสงค์ที่ต้องการหรือผลการเรียนรู้ที่คาดหวังหรือไม่
2.2 ในระยะของการพัฒนาเครื่องมือ
การวิเคราะห์รายข้อใช้ข้อมูลจากการทดลองใช้/หรือใช้จริงมาหาค่าต่าง ๆ เพื่อระบุ
คุณสมบัติของข้อความ/ข้อคาถามนั้น ๆ โดยสามารถกระทาได้ดังนี้
1) จานวนผู้ตอบข้อความนั้น หรือค่าความยากง่าย (p)
คือสัดส่วนที่ผู้ตอบคาถามได้ถูกต้อง ค่านี้มักจะใช้กับแบบทดสอบ ข้อคาถามใด
มีผู้ตอบถูกมากแสดงว่าข้อคาถามนั้นง่าย ส่วนคาถามใดที่มีผู้ตอบถูกน้อยแสดงว่าข้อคาถามนั้นยาก
ค่าของความยากง่ายจึงมีค่าตั้งแต่ 0 ถึง 1 ความยากง่ายที่เหมาะสมควรจะมีค่าอยู่ระหว่าง 0.20 – 0.80
ซึ่งการประเมินการเรียนรู้ในชั้นเรียน การหาคุณภาพของเครื่องมือไม่นิยมหาความยากง่าย เพราะ
การจัดการเรียนการสอนให้ความสาคัญกับการบรรลุตามวัตถุประสงค์มากกว่า
2) อานาจจาแนก (r)
อานาจจาแนกของข้อคาถามรายข้อ คือสัดส่วนของผลต่างระหว่างจานวนผู้ตอบ
ถูกในกลุ่มเก่งกับจานวนผู้ตอบถูกในกลุ่มอ่อน คาถามข้อใดที่ผู้ตอบในกลุ่มเก่งตอบถูกหมดและ
กลุ่มอ่อนตอบไม่ถูกเลย คาถามข้อนั้นจะมีอานาจจาแนกเป็น 1 (หรือจาแนกได้ 100%) ในทาง
กลับกัน ถ้าผู้ตอบในกลุ่มเก่งตอบผิดหมด และกลุ่มอ่อนตอบถูกหมด คาถามข้อนั้นจะมีอานาจ
จาแนกเป็น -1 แต่ถ้าคาถามข้อนั้นผู้ตอบในกลุ่มเก่งและกลุ่มอ่อนตอบถูกหมด (คาถามง่ายมาก)
หรือทั้ง 2 กลุ่มตอบไม่ถูกเลย (คาถามยากมาก) หรือตอบถูกใกล้เคียงกัน คาถามข้อนั้นจะมี

38
อานาจจาแนกเป็น 0 หรือใกล้เคียงกับ 0 ซึ่งแสดงว่าคาถามข้อนั้นไม่สามารถแยกกลุ่มเก่งออกจาก
กลุ่มอ่อนได้ ข้อคาถามที่ดีควรมีค่าอานาจจาแนกไม่ต่ากว่า 0.20 ข้อคาถามรายข้อที่มีค่าอานาจ
จาแนกสูงมักจะมีความยากง่ายเหมาะสม แต่ข้อคาถามรายข้อที่มีความยากง่ายเหมาะสม ไม่จาเป็น
จะต้องมีอานาจจาแนกสูงเสมอไป ส่วนคาว่า กลุ่มเก่ง และกลุ่มอ่อน นั้นใช้กับผู้ตอบที่ทา
แบบทดสอบ แต่ถ้าเป็นแบบสอบถามแล้วจะใช้คาว่า กลุ่มสูงหรือกลุ่มที่มีความเห็นทางบวก (+)
แทนกลุ่มเก่งอิสระ กลุ่มต่าหรือกลุ่มที่มีความเห็นทางลบ (–) แทนกลุ่มอ่อน ทั้งนี้ เพราะคาตอบ
ในแบบสอบถามจะไม่มีลักษณะถูกหรือผิดเหมือนกับแบบทดสอบ ในการประเมินการเรียนรู้ใน
ระดับชั้นเรียนสามารถหาค่าอานาจจาแนก ดังนี้
2.1) การหาค่าอานาจจาแนกจากผลการสอบสองครั้ง
เป็นการหาค่าอานาจจาแนกจากผลการสอบก่อนสอนและหลังสอน โดยใช้ดัชนี
เอส (S- Index) จากสูตร
S = Rpose – Rpre
N
เมื่อ S คือ ค่าอานาจจาแนกของข้อสอบ
Rpose คือ จานวนคนหลังสอนตอบถูก
Rpre คือ จานวนคนก่อนสอนตอบถูก
N คือ จานวนผู้เข้าสอบทั้งหมด
2.2)การหาค่าอานาจจาแนก จากผลการสอบครั้งเดียว
เป็นการหาค่าอานาจจาแนกจากผลการสอบครั้งเดียวโดยใช้ดัชนี บี (B-Index) จาก
สูตร
B = U/N1 – L/N2
เมื่อ B คือ ค่าอานาจจาแนกของข้อสอบ
U คือ จานวนคนสอบผ่านเกณฑ์ที่ตอบถูกในข้อนั้น
N1 คือ จานวนคนผ่านเกณฑ์
L คือ จานวนคนสอบไม่ผ่านเกณฑ์ที่ตอบถูกในข้อนั้น
N2 คือ จานวนคนไม่ผ่านเกณฑ์

39
จากการหาค่าอานาจจาแนกข้างต้นเป็นการหาคุณภาพเฉพาะตัวเลือกที่ถูก ถ้าต้องการหา
คุณภาพของตัวเลือกที่เป็นตัวลวง ก็สามารถทาได้โดยการกลับสูตรดังนี้
กรณีตัวลวงโดยใช้ ดัชนี เอส S = Rpre – Rpose
N
กรณีตัวลวงโดยใช้ ดัชนี บี B = L/N2 - U/N1
2.3)การแปลความหมายค่าอานาจจาแนก
อานาจจาแนกที่ดี คือ r มีค่าไม่น้อยกว่า 0.20 สาหรับตัวถูก และมีค่าไม่น้อยกว่า
0.05 สาหรับตัวลวง ดังตาราง 3.1
ตาราง 3.1 การแปลความค่าอานาจจาแนก (r)
อานาจจาแนกของข้อสอบ
r ความหมาย
น้อยกว่า 0.00 จาแนกติดลบ
0.00 – 0.19 จาแนกได้น้อยหรือจาแนกไม่ได้
0.20 – 0.39 พอใช้
0.40 – 0.59 ดี
0.60 – 1.00 ดีมาก
สาหรับการหาคุณภาพดังกล่าว สามารถใช้โปรแกรมสาเร็จรูปในการช่วยวิเคราะห์คุณภาพเครื่องมือ
ได้ ตัวอย่างเช่น โปรแกรมวิเคราะห์ข้อสอบ (B – index for windows) ที่พัฒนาขึ้นโดย สาคร แสงผึ้ง
(2006) ผู้สนใจสามารถเข้าไปดาวน์โหลดโปรแกรมดังกล่าวจากเวปไซต์ www.nitesonline.net ดัง
ภาพประกอบ 3.5 แสดงหน้าจอของโปรแกรม

40
ภาพประกอบ 3.5 แสดงหน้าจอโปรแกรมวิเคราะห์คุณภาพข้อสอบ
3) ความสอดคล้องระหว่างข้อ
เป็นการหาคุณภาพรายข้ออีกวิธีหนึ่งโดยนามาคานวณค่าสหสัมพันธ์ระหว่างข้อ ซึ่ง
จะบอกให้ทราบว่าข้อความดังกล่าวมีความสัมพันธ์กันมากน้อยเพียงใดเป็นคู่ ๆ
ตัวอย่างเช่นมีข้อความ 4 ข้อ คานวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคู่ได้
ผลสรุปในตารางเมตริก 4  4 ดังนี้
ตาราง 3.2 การหาคุณภาพรายข้อด้วยการหาความสัมพันธ์ระหว่างข้อ
ข้อ
ข้อ
1 2 3 4
1 – .43 .44 .81
2 – .77 .57
3 – .45
4 –

41
ค่าความสัมพันธ์ในตารางนี้จะช่วยให้มองเห็นว่า ข้อความข้อ 1 มีความสัมพันธ์สูงกับ
ข้อ 4 รองลงมาคือข้อ 2 มีความสัมพันธ์สูงกับข้อ 3 การพิจารณาข้อความดังกล่าวจึงควรวิเคราะห์
ว่า ทาไมข้อความดังกล่าวจึงมีความสัมพันธ์กัน และเป็นความสัมพันธ์ในประเด็นเนื้อหาหรือ
วัตถุประสงค์หรืออะไร
4) ค่าที่บอกความแตกต่างระหว่างกลุ่ม
ในกรณีที่มีกลุ่มผู้ให้ข้อมูลหลายกลุ่มที่มีความแตกต่างกันชัดเจน ข้อความที่จาแนก
กลุ่มดังกล่าวออกได้ก็แสดงว่าข้อคาถามนั้นมีคุณสมบัติในการจาแนก
ตัวอย่างเช่น ข้อความ 5 ข้อ วิเคราะห์เปรียบเทียบค่าเฉลี่ยของกลุ่มที่ทดสอบ (เช่น
นักศึกษาครู) กับกลุ่มอาชีพครู พบค่าสถิติทดสอบ t ดังนี้
ตาราง 3.3 การหาคุณภาพรายข้อที่บอกความแตกต่างระหว่างกลุ่ม
ข้อความ ค่า t
1 1.97*
2 2.64*
3 1.00
4 2.56*
5 3.48*
* P  .05
ข้อความ 4 ข้อคือ ข้อ 1, 2, 4, 5 สามารถจาแนกค่าเฉลี่ยระหว่างกลุ่มนักศึกษาครู
ออกจากกลุ่มครูได้ ถ้าข้อความเหล่านั้นจะนาไปใช้ในการคัดเลือกผู้เรียนในอาชีพนั้น ๆ ควรเลือก
ข้อความข้อ 1, 2, 4 และ 5

42
5) ค่าที่บอกความสัมพันธ์กับคะแนนรวม
การหาค่าความสัมพันธ์ระหว่างข้อกับคะแนนรวม (ทุกข้อ) เป็นการวิเคราะห์รายข้อ
อีกแบบหนึ่งซึ่งแสดงให้เห็นว่า ข้อความนั้นเป็นส่วนหนึ่งของแบบวัดนั้นหรือไม่
ตัวอย่างเช่น ข้อความ 5 ข้อ มีค่าสหสัมพันธ์กับคะแนนรวม (Total Score) ดังนี้
ตาราง 3.4 การหาคุณภาพรายข้อด้วยการหาความสัมพันธ์กับคะแนนรวม
ข้อความ r r2
%
1 .8 .64 32.00
2 .6 .36 18.00
3 .7 .49 24.50
4 .4 .16 8.00
5 .6 .36 18.00
รวม 100.00
ข้อความข้อ 1, 2, 3, 5 มีความสัมพันธ์กับคะแนนรวม
เกณฑ์ในการเลือกข้อคือ
ก) ถ้าต้องการวัดสิ่งที่เป็นลักษณะเดียวกับของแบบวัด ควรเลือกข้อ 1 เพียงข้อเดียว
หรือ
ข) ถ้าต้องการข้อที่ร่วมกันวัดควรตัดข้อ 1 ทิ้งและเลือกข้อ 3, 4, 5 ไว้

43
3. การวิเคราะห์คุณภาพของเครื่องมือทั้งฉบับ
เครื่องมือวัดประกอบด้วยข้อความ/ข้อคาถามที่สร้างแล้วนามารวมกันตามแบบแผนที่
กาหนดไว้ล่วงหน้าแม้ว่าจะมีการวิเคราะห์เป็นรายข้อแล้วก็ตาม เมื่อนาข้อความมารวมกันก็ต้อง
พิจารณาว่า จะจัดเรียงข้อความอย่างไร ข้อใดมาก่อนหลังและเมื่อรวมแล้วจะได้เครื่องมือวัด 1 ชุด
ที่มีคุณภาพที่เชื่อถือได้หรือไม่
การวิเคราะห์คุณภาพของเครื่องมือวัดทั้งฉบับ ประกอบด้วย การหาความเที่ยงตรง
(Validity) และการหาความเชื่อมั่น (Reliability) มีรายละเอียดดังนี้ (Peter W. Airasian. 1994 : 20 –
23)
ความเที่ยงตรง (Validity) หมายถึง ความสอดคล้องระหว่างเครื่องมือวัดลักษณะกับ
ลักษณะที่วัด เป็นหัวใจสาคัญอันดับหนึ่งของข้อสอบ
ความเที่ยงตรงมี 3 ประเภท คือ
1. ความเที่ยงตรงเชิงเนื้อหา (Content Validity) หมายถึงว่า การวัดนั้นครอบคลุม
เนื้อหาที่ต้องการจะวัดหรือไม่ วัดนั้นสุ่มเนื้อหาเป็นสัดส่วนกับประชากรเนื้อหาหรือไม่
2. ความเที่ยงตรงเชิงโครงสร้าง (Construct Validity) หมายถึงว่า การวัดนั้น
อธิบายลักษณะเชิงนามธรรมของสิ่งที่จะวัดตามโครงสร้างที่วางไว้หรือไม่
3. ความเที่ยงตรงเชิงเกณฑ์ที่กาหนด (Criterion Related Validity) หมายถึงว่า การ
วัดนั้นสอดคล้องกับเกณฑ์ภายนอกที่กาหนดขึ้นหรือไม่ แบ่งเป็น 2 ประเภท คือ
ก. ความเที่ยงตรงตามสภาพ (Concurrent Validity) หมายถึง คุณภาพของ
แบบทดสอบที่วัดได้ตรงความจริงในสภาพปัจจุบัน เช่น แบบทดสอบศีลธรรม ถ้าเด็กทาได้
คะแนนสูงในเวลาสอบ สภาพความเป็นจริงของเด็กนั้นควรจะเป็นผู้มีศีลธรรมสูงด้วย ไม่ใช่สอบ
วัดศีลธรรมได้คะแนนสูง แต่กลับมีนิสัยชอบลักเล็กขโมยน้อย เบียดเบียนเพื่อนฝูง
ข. ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity) เป็นความเที่ยงตรงอีก
แบบหนึ่งที่ต้องอาศัยเกณฑ์เป็นเครื่องช่วยชี้ผลแต่เกณฑ์ (Criterion) ในความเที่ยงตรงแบบนี้ เป็น
เกณฑ์ที่จะเกิดขึ้นในอนาคต นั่นคือถ้าจะหาความเที่ยงตรงแบบนี้ต้องสอบแบบทดสอบนั้นไว้ก่อน
แล้วทิ้งระยะเวลาไว้สักระยะหนึ่ง เช่น เดือนหน้า ภาคเรียนหน้า หรือปีหน้า แล้วเอาคะแนน
เกณฑ์ที่ต้องการมาหาความสัมพันธ์กับคะแนนแบบทดสอบนั้น ได้ค่าเท่าไรก็จะเป็นค่าของความ
เที่ยงตรงเชิงพยากรณ์ตามที่ต้องการซึ่งอาจจะสูงหรือต่าขึ้นอยู่กับคุณภาพของแบบทดสอบคะแนน
ที่หวังไว้อนาคตเช่น ความสนใจ เจตคติ ค่านิยม จริยธรรม และบุคลิกภาพ

44
ความเชื่อมั่น (Reliability) หมายถึง คงเส้นคงวาในการวัด วัดกี่ครั้งก็ได้ข้อมูลที่
ใกล้เคียงกัน
ในการประเมินการเรียนรู้ในระดับชั้นเรียนเพื่อให้ได้เครื่องมือที่มีคุณภาพ นาเสนอ
วิธีการหาความเที่ยงตรง และความเชื่อมั่นที่เป็นที่นิยมดังต่อไปนี้ (ล้วน สายยศ. 2544 : 310-331,
บุญชม ศรีสะอาด. 2543 : 81 – 101. สมนึก ภัททิยธนี. 2537 : 164 - 178)
3.1 การหาความเที่ยงตรง (Validity)
ในการหาความเที่ยงตรงของการประเมินระดับชั้นเรียน นิยมหาความเที่ยงตรงเชิง
เนื้อหา และความเที่ยงตรงเชิงโครงสร้าง ดังนี้
3.1.1 ความเที่ยงตรงเชิงเนื้อหา
การหาความเที่ยงตรงตามเนื้อหา การวัดด้านพุทธิพิสัย (Cognitive domain) การ
หาความเที่ยงตรงตามเนื้อหามีความจาเป็นอย่างมาก ซึ่งมีวิธีการนามาไปสู่ความเที่ยงตรงตามเนื้อหา
ทาได้ดังนี้
1) เขียนข้อสอบหรือคาถามตามกรอบที่กาหนดให้อย่างละเอียด ก็จะมีความ
เที่ยงตรงตามเนื้อหาได้
2) การให้ผู้เชี่ยวชาญด้านเนื้อหา พิจารณา ว่าข้อความที่เขียนถูกต้องตามนิยาม
ปฏิบัติการในกรอบขอบเขตที่ต้องการวัดหรือไม่ (Gable. 1986) การพิจารณาข้อความตลอดจน
การวิเคราะห์แต่ละรายข้อออกมาว่าเหมาะสมเพียงใด แก้ไขอย่างไรบ้าง
3.1. 2 ความเที่ยงตรงเชิงโครงสร้าง
ถ้านักเรียนได้เรียนรู้ครบตามผลการเรียนรู้ของการจัดกิจกรรมการเรียนการสอน
และผ่านในผลการเรียนรู้ได้ถูกต้อง ถือได้ว่าแบบประเมินนั้นมีความเที่ยงตรงเชิงโครงสร้าง ในการ
หาความเที่ยงตรงที่นิยมใช้คือวิธีของคาร์เวอร์ (Carver Method) โดยมีแนวคิดว่าผู้เรียนที่เรียนแล้ว
น่าจะสอบผ่าน ผู้ที่ยังไม่ได้เรียนน่าจะสอบไม่ผ่าน โดยนาผลการประเมินมาจัดลงในตาราง ดังนี้
กลุ่มที่ยังไม่ได้เรียน กลุ่มที่เรียนแล้ว
สอบผ่าน
สอบไม่ผ่าน
a
ฤ
A
b
ฤ
A
c
ฤ
A
d
ฤ
A

45
คานวณหาค่าความเที่ยงตรงจากสูตร
rc = b + c
N
เมื่อ rc คือ ค่าความเที่ยงตรงเชิงโครงสร้าง
b คือ กลุ่มที่เรียนแล้ว ผ่านการประเมิน
c คือ กลุ่มที่ยังไม่ได้เรียน ไม่ผ่านการประเมิน
N คือ จานวนคนสอบทั้งหมด
3.2 การหาความเชื่อมั่น (Reliability)
การหาความเชื่อมั่นของเครื่องมือวัด ในการประเมินระดับชั้นเรียน มีแนวคิดที่ว่า
แบบประเมินที่มีความเชื่อมั่นจะสามารถจาแนกผู้สอบได้ว่าใครเป็นผู้รอบรู้ (ผ่านเกณฑ์) ใครเป็นผู้
ไม่รอบรู้ (ไม่ผ่านเกณฑ์) ได้อย่างคงเดิม ซึ่งอาจจะใช้การวัดสองครั้ง หรือการสร้างแบบวัดคู่ขนาน
สองฉบับ และการหาสอบครั้งเดียว แล้วนามาวิเคราะห์ค่าความเชื่อมั่น ซึ่งมีวิธีคานวณที่นิยมจาก
สูตร ดังนี้
3.2.1 กรณีวัดสองครั้ง หรือใช้แบบวัดคู่ขนานสองฉบับ
1) วิธีของคาร์เวอร์ (Carver Method) และวิธีของแฮมเบิลตันและโนวิก
(Hambleton and Novick Method) เนื่องจากวิธีทั้งสองมีหลักการคานวณคล้ายกัน จึงขอนาเสนอใน
ภาพสรุปตามวิธีของคาร์เวอร์ นาผลการวัดนามาจัดลงในตารางเพื่อหาความเชื่อมั่น ดังนี้
ครั้งที่ 2 (ฉบับ ข)
ครั้งที่ 1 (ฉบับ ก.)
ผ่านเกณฑ์ ไม่ผ่านเกณฑ์
ผ่านเกณฑ์ a b
ไม่ผ่านเกณฑ์ c d

46
คานวณหาค่าความเชื่อมั่นจากสูตร
rcc = a + d
N
เมื่อ rcc คือ ค่าความเชื่อมั่น
a คือ กลุ่มที่ผ่านเกณฑ์ทั้งสองฉบับ
d คือ กลุ่มที่ไม่ผ่านเกณฑ์ทั้งสองฉบับ
N คือ จานวนคนสอบทั้งหมด
2) วิธีของสวามินาธาน แฮมเบิลตันและอัจจินา (Swaminathan Hambleton
and Algina Method) มีหลักการและการคานวณคล้ายวิธีแรก แต่จะเพิ่มความละเอียดมากกว่า โดย
หักความสอดคล้องที่จะอาจเกิดขึ้นโดยบังเอิญแล้วมีผลทาให้ความเชื่อมั่นสูงเกินจริง นาผลการวัด
นามาจัดลงในตารางเพื่อหาความเชื่อมั่น ดังนี้
ครั้งที่ 2 (ฉบับ ข)
ครั้งที่ 1 (ฉบับ ก.)
ผ่านเกณฑ์ ไม่ผ่านเกณฑ์ รวม
ผ่านเกณฑ์ a b a+b
ไม่ผ่านเกณฑ์ c d c+d
รวม a+ c b+d N
K = Po -Pe/ 1 - Pe
เมื่อ K คือ ค่าความเชื่อมั่น
Po คือ ค่าความเชื่อมั่นตามวิธีของคาร์เวอร์ = a + d
N
Pe คือ อัตราส่วนความสอดคล้องที่คาดหวัง

47
= (a+b)(c+d)+(a+c)(b+d)
3.2.2 กรณีวัดครั้งเดียว
การหาความเชื่อมั่นในกรณีวัดครั้งเดียวมีแนวคิดเพื่อตรวจหาความ
สอดคล้องของคะแนนแต่ละคนที่แปรปรวนไปจากคะแนนจุดตัด โดยใช้แบบวัด 1 ฉบับกับนักเรียน
กลุ่มเดียว ซึ่งมีวิธีคานวณที่นิยมคือวิธีของลิวิงสตัน (Livingston Method) และวิธีของโลเวท (Lovett
Method) อย่างไรก็ตามวิธีของโลเวทถือว่าเป็นวิธีที่สะท้อนแนวคิดการประเมินในชั้นเรียนและเป็น
ที่นิยม จึงนาเสนอ ดังนี้
rcc = 1 - KXi - X2
i/ (K-1) ( Xi –C)2
เมื่อ rcc คือ ค่าความเชื่อมั่น
K คือ จานวนข้อ
Xร คือ คะแนนสอบของนักเรียนแต่ละคน
C คือ คะแนนเกณฑ์
ระดับความเชื่อมั่นที่ยอมรับ ในการพิจารณาว่า ค่าความเชื่อมั่นเท่าไรจึงจะเป็นที่ยอมรับ
ได้นั้นขึ้นอยู่กับชนิดของเครื่องมือโดยทั่วไปแล้วเครื่องมือวัดด้านความรู้สึกจะมีความเชื่อมั่นต่ากว่า
เครื่องมือวัดด้านสติปัญญา เหตุผลก็เพราะกรอบของความรู้สึกหรือเนื้อหาของความรู้สึกไม่
แน่นอนจริง ๆ เป็นลักษณะโครงสร้าง (construct) ไม่มีความแน่นอนเหมือนกรอบหรือเนื้อหาของ
ด้านสติปัญญา เช่น เนื้อหาในวิชาต่าง ๆ วิธีการให้คะแนนมีเกณฑ์ที่ไม่แน่นอน เพราะความรู้สึก
ไม่มีถูกมีผิด ระบบการให้คะแนนจึงไม่ค่อยแน่นอน คะแนนที่ได้จึงทาให้ความเชื่อมั่นส่วนใหญ่
ต่า ขณะที่ข้อสอบมาตรฐานด้านสติปัญญามีความเชื่อมั่นสูงถึง .90 และมีค่าค่าเพียง .70 ที่สูง
ถึง .90 ขึ้นไปก็มีบ้างแต่น้อย เกเบิลกล่าวว่า เครื่องมือวัดด้านความรู้สึกหรือจิตพิสัย ควรมีความ
เชื่อมั่นอย่างต่า .70 (Gable. 1986 : 147) ส่วนนันนัลลี่มองแบบทดสอบทั่วไปใช้ในการทาวิจัย
ควรมีความเชื่อมั่น .80 ไม่ถือว่าสูงมากนัก (Nunnally. 1967 : 226)

48
หนังสืออ่านประกอบ
บุญชม ศรีสะอาด. (2543). การวิจัยเบื้องต้น. พิมพ์ครั้งที่ 7. กรุงเทพ : สุวิริยาสาสน์.
ล้วน สายยศ และอังคณา สายยศ. (2543). การวัดด้านจิตพิสัย. กรุงเทพมหานคร : สุวิริยาสาสน์.
สมนึก ภัททิยธนี. (2543). การวัดผลการศึกษา. กาฬสินธุ์ : ประสานการพิมพ์.
อุทุมพร จามรมาน. (2532). การสร้างและพัฒนาเครื่องมือวัดลักษณะผู้เรียน. กรุงเทพ ฯ :
จุฬาลงกรณ์มหาวิทยาลัย.
Gable, Robert K. (1986). Instrument Development in the Affective Domain. Boston :
Kluwer – Nijhoff.
Nunnally, Jum C. (1967). Psychometric Theory. New York : McGraw – Hill.
Peter W. Airasian. (1994). Classroom Assessment. 2 nd. New York : McGraw-Hill, Inc.
เว็ปไซต์ที่เกี่ยวข้อง
http://wbc.msu.ac.th/wbc/edu/0504304/index.html
http://www.watpon.com
http://www.nitesonline.net
แบบฝึกหัดประจาบทที่ 3
พิจารณาคาถามต่อไปนี้และเลือกคาตอบที่เห็นว่าถูกต้องที่สุด
1. ค่าอานาจจาแนก = -1 หมายความว่าอย่างไร ?
ก. คนเก่งตอบผิดหมด ข. คนอ่อนตอบถูกหมด
ค. ข้อสอบใช้ไม่ได้ ง. คนเก่งตอบถูกหมด
จ. ถูกมากกว่า 1 ข้อ
2. ข้อใดเป็นการหาคุณภาพเครื่องมือรายข้อ ?
ก. ความสอดคล่องระหว่างข้อ ข. ความแตกต่างระหว่างกลุ่ม
ค. ความยากง่ายและอานาจจาแนก ง. ความสัมพันธ์ระหว่างข้อกับคะแนนรวม

49
จ. ถูกหมดทุกข้อ
3. คากล่าวใดถูกต้อง ?
ก. ความเชื่อมั่นนามาสู่ความเที่ยงตรง
ข. ความเที่ยงตรงนามาสู่ความเชื่อมั่น
ค. เครื่องมือที่ดีต้องอาศัยการวิเคราะห์ทางสถิติ
ง. การสร้างตารางวิเคราะห์เป็นการหาความเชื่อมั่น
จ. การหาความเชื่อมั่นต้องทดลองตั้งแต่ 2 ครั้งขึ้นไป
4.. การหาคุณภาพเครื่องมือเพื่อวิเคราะห์รายข้อในขั้นการเขียนข้อสอบทาได้อย่างไร ?
ก. พิจารณาข้อคาถามกับจุดมุ่งหมาย ข. เปรียบเทียบกับข้อสอบมาตรฐาน
ค. ให้ผู้เชี่ยวชาญพิจารณา ง. ทดลองใช้กับกลุ่มตัวอย่าง
จ. ถูกหมดทุกข้อ
พิจารณาสถานการณ์แล้วตอบคาถามข้อ 5 - 7
จากการวิเคราะห์คุณภาพข้อสอบวิชาหนึ่ง มีจานวนผู้ตอบกลุ่มผ่านเกณฑ์(H)และกลุ่มไม่ผ่านเกณฑ์(H)
อย่างละ50 คน รวมเป็น 100 คน (n=100) ผลการวิเคราะห์ข้อสอบข้อที่ 1 ปรากฏผลดังนี้
คาตอบ จานวนผู้ตอบ ค่าร้อยละ สัดส่วนการตอบถูก
p
อานาจจาแนก
rH L H L
ก
ข*
ค
ง
50
A
0
17
17
100 %
32 %
0 %
34 %
B
16 %
C
D
E
F
5. ค่าอานาจจาแนกตัวเลือกที่ถูกเท่ากับเท่าไร
ก. 0.10 ข. 0.20
ค. 0.50 ง. 0.80 จ. 1.00
6. ค่าอานาจจาแนกตัวเลือก ง เท่ากับเท่าไร ?
ก. 0.10 ข. 0.23
ค. 0.34 ง. 0.50 จ. .80
7. ข้อสอบข้อนี้มีลักษณะอย่างไร ?
ก. เป็นข้อสอบที่ดี ข. มีค่าอานาจจาแนกต่า
ค. ข้อสอบที่ยาก ง. ควรพิจารณาตัวเลือกเพิ่ม จ. ข้อมูลไม่เพียงพอ

50
พิจารณาตัวเลือกที่เป็นคุณภาพของเครื่องมือต่อไปนี้ที่สอดคล้องกับข้อความข้อ 8 - 10
ก. Difficulty
ข. Discrimination
ค. Validity
ง. Reliability
8. แปลกนะข้อนี้เด็กเก่งตอบผิด
9. คะแนนสอบสุขศึกษาดีทาไมสุขภาพแย่จัง
10. ไม่สงสัยหรอกว่าทาไม่เขาได้เกรด A ดูคะแนนสอบเข้ามาสิ

การหาคุณภาพเครื่องมือวัดผล

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to การหาคุณภาพเครื่องมือวัดผล

Similar to การหาคุณภาพเครื่องมือวัดผล (20)

More from Suriya Phongsiang

More from Suriya Phongsiang (20)

การหาคุณภาพเครื่องมือวัดผล