4. PENGERTIAN VALIDITAS
• A test is valid if it measures what it
purpose to measures (Scarvia B. Anderson)
• The degree to which a test measures what
it is supposed to be measured.(Osterhof)
• Ibarat memotret hasil pemotretan sesuai
dengan keadaan aslinya
5. PRUSEDUR VALIDASI
VALIDASI
LOGIS
EMPIRIS
PREDICTIVE
CONCURRENT
KONSTRUSI
ISI
Validitas yang “ada
sekarang”: ‘sesuai’ dg
pengalaman. Mis: hasil
tes sumatif saat ini
dipasangkan dengan
hasil tes sumatif tahun
lalu yg sudah standar
Kemampuan meramal
apa yang akan terjadi
dimsa datang. Mis: tes
masuk MA dikorelasikan
dengan prestasi siswa
tersebut di MA kelas X
semester 1
BAHASA
6. KORELASI PRODUCT MOMENT
• Rxy = })(}{)({))(( 2222
22
YYNXXN
YXXYNxy
yx
Analisis Validitas juga bisa dilakukan pada analisis
butir soal (Validitas Butir Soal)
Validitas bisa dilihat dari nilai r dengan diskripsi:
1,0 ≤ r < 0,8 Sangat Tinggi
0,8 ≤ r < 0,6 Tinggi
0,6 ≤ r < 0,4 Sedang
0,4 ≤ r < 0,2 Rendah
0,2 ≤ r < 0,0 sangat rendah
7. RELIABILITAS
• Reliabilitas: ‘keajegan’
• Reliability: The consistency of (scoring
procedures or test) when the testing
procedures are repeated on a population
of individuals or groups
8. JENIS RELIABILITAS
RELIABILITAS
PARALEL/
EQIUVALENT
SPLIT-HALF
TEST RE-TEST
Dua test ‘paralel’ A (yang
dicari R) dan B diberikan
pada kelompok siswa yg
sama (Double test, double
trial)
Satu perangkat tes
diujicobakan dua kali pada
kelompok siswa yang
sama dalam waktu yang
berbeda (Single test
double trial)
Satu perangkat tes, di ujikan
sekali hasilnya dibelah dua
(ganjil-genap atau awal-akhir),
‘single test single trial’
9. PROSEDUR RELIABILITAS
• Untuk jenis reliabilita paralel dan test re-test
koefisien relibilitas dirumuskan:
• Untuk jenis Split-half dirumuskan:
2
1S
2
2
2
1
12
S
S
)1(
2
11
11
11
r
r
Varian kel 1
Varian kel 2
)1(2 2
2
2
2
1
11
tS
SS
FLANAGAN
r = Korelasi produc
moment 2
2S
2
tS
Varian belahan pertama/ganjil
Varian belahan kedua/genap
Varian keseluruhan
N
N
X
X
S
2
2
2
)(
10. PROPORSI KUNCI JAWABAN
Jumlah soal=50, jumlah option= 5
= (50 : 5) ± 3 = 10 ±3 Max = 13 Min = 7
KUNCI JAWABAN A= 13
B= 10 RUMUS= (Σ SOAL : Σ OPTION) ± 3
C= 8
D= 12
E= 7
Jumlah= 50
LEMBAR JAWABAN
1. A B C D E 11. A B C D E 21. A B C D E 31. A B C D E 41. A B C D E
2. A B C D E 12. A B C D E 22. A B C D E 32. A B C D E 42. A B C D E
3. A B C D E 13. A B C D E 23. A B C D E 33. A B C D E 43. A B C D E
4. A B C D E 14. A B C D E 24. A B C D E 34. A B C D E 44. A B C D E
5. A B C D E 15. A B C D E 25. A B C D E 35. A B C D E 45. A B C D E
6. A B C D E 16. A B C D E 26. A B C D E 36. A B C D E 46. A B C D E
7. A B C D E 17. A B C D E 27. A B C D E 37. A B C D E 47. A B C D E
8. A B C D E 18. A B C D E 28. A B C D E 38. A B C D E 48. A B C D E
9. A B C D E 19. A B C D E 29. A B C D E 39. A B C D E 49. A B C D E
10. A B C D E 20. A B C D E 30. A B C D E 40. A B C D E 50. A B C D E
11. Pengecoh (Destructor) Berfungsi?
D= (Σ Peserta Tes : 4n) atau D= (Σ Peserta Tes : n2)
(Haladyna, Thomas M.:1994)
atau D= 5% dari Σ Peserta Tes
n= banyaknya option jawaban
Pengecoh dikatakan berfungsi jika pengecoh dipilih oleh
minimal sejumlah D siswa
Contoh:
Jumlah Peserta tes = 40; option= 5
D = 40: (4x5) = 40:20 = 2
Artinya pengecoh dari suatu soal dikatakan berfungsi jika
paling tidak dipilih oleh 2 peserta tes
(Aturan ini tidak bisa digunakan pada kelas-kelas dengan
kemampuan khusus, dan biasanya diabaikan)
12. TINGKAT KESUKARAN (Difficulty Index)
Tingkat kesukaran
dirumuskan:
B: banyaknya siswa yang jawab benar
N: Banyak peserta tes non-Omit
Klasifikasi:
0,00≤ TK <0,25 Sulit
0,25≤ TK <0,50 Sedang
0,50≤ TK < 0,75 Mudah
0,75≤ TK ≤ 1,00 Sangat Mudah
N
B
TK
Ada yang dinyatakan
dalam persen
=(B:N)x100%
ba
ba
JJ
BB
TK
Ba = banyaknya kelompok atas
yang jawab benar
Bb = banyaknya kelompok bawah
yang jawab benar
Ja = Jumlah kelompok atas
Jb = Jumlah kelompok bawah
13. CONTOH:
Peserta tes sebanyak 150 siswa; setelah
dianalisa pada Soal nomor 10, terdapat
siswa yang menjawab benar 100 siswa,
tingkat kesulitan soal ini adalah:
TK = 100: 150 = 0,67
Jadi Soal nomor 10 masuk kategori
“sedang”
14. DAYA PEMBEDA (Discrimination Index )
Daya Pembeda: kemampuan soal untuk membedakan peserta tes
yang berkemampuan tinggi dengan yang berkemampuan rendah
Prosedur:
1. Rangkinglah hasil pekerjaan peserta tes urut turun (Descending)
2. Bagilah jadi dua kelompok, 27% kelompok atas dan 27% kelompok
bawah
3. Hitung banyak siswa kelompok atas yang jawab benar (Ba), banyak
siswa kelompok bawah yang jawab benar (Bb)
Kriteria:
0,00≤ DP <0,20 Jelek
0,20≤ DP<0,40 Cukup
0,40≤ DP <0,70 Baik
0,70≤ DP ≤ 1,00 Baik Sekali
)(
2
1
ba
ba
JJ
BB
DP
Butir soal dengan Daya pembeda yang
Bernilai nilai Negatif adalah jelek,
Sebaiknya tidak digunakan
DP= Daya Pembeda
Ja= Banyaknya kelompok atas
Jb= Banyaknya kelompok bawah
15. CONTOH:
Peserta tes sebanyak 200 siswa; setelah dinilai
dan diurutkan turun dipilih 27% kelompok atas
(Rangking 1 s.d. 54) dan 27% kelompok bawah
(rangking 147 s.d. 200, hasilnya untuk soal
nomor 8, Ba=50 dan Bb=10; daya pembedanya
adalah:
DP=(50-10): ½ (54+54) = 40:54 = 0,74
Jadi Soal nomor 8 masuk kategori memiliki daya
pembeda “baik sekali”
* Nilai DP yang dianjurkan para ahli adalah
antara 0,25 s.d. 0,75
16. REFERENCES
• Linn, Robert L. and Gronlund, Norman E. (1995).
Measurement and Assessment in teaching (Seventh
Edition). Ohio: Merrill, an immprint of Prentice Hall.
• Nitko, Anthony J. (1996). Educational Assessment of
Students, Second Edition. Ohio: Merrill an imprint of
Prentice Hall Englewood Cliffs
• Pedhazur, Elazar J. and Schmekin, Liora Pedhazur.
(1991). Measurement, Design, and Analysis: An
Integrated Approach. New Jersey: Lowrence Erlbaum
Associates, Publishers.
• Haladyna, Thomas M. (1994). Developing and Validating
Multiple-Choice Test Items. New Jersey: Lawrence
Erlbaum Associates, Publishers
17. Jawablah Pertanyaan Berikut!
• Sudah tepatkah proporsi kunci Jawaban soal
tersebut?
• Apakah seluruh item soal pengecohnya
berfungsi? Item soal berapa yang harus
diperbaiki? Apa saranya?
• Soal item berapakah yang masuk kategori sulit,
sedang dan mudah? Berapa perbandingannya?
• Soal item berapakah yang memiliki daya
pembeda masuk kategori jelek, cukup, baik dan
baik sekali? Berapa perbandingannya?