Kriteria penilaian alat evaluasi meliputi validitas, reliabilitas, objektivitas, praktikabilitas, derajat kesulitan, daya beda, efektivitas dan efisiensi. Validitas merupakan ukuran sejauh mana alat evaluasi mampu mengukur apa yang seharusnya diukur, yang dapat diuji melalui validitas logika, empiris, isi, konstruksi, dan banding. Faktor seperti petunjuk yang kurang jelas dan struktur so
3. Validitas Alat Evaluasi
• Sebuah tes disebut valid apabila tes itu dapat
tepat mengukur apa yang hendak diukur.
• Validitas identik dengan kevalidan atau
ketepatan atau kesahihan atau keabsahan.
• Secara Umum ada dua macam validitas:
Validitas logic (logical validity) dan validitas
ramalan empiris (empirical validity)
5. Validitas Teoritik atau logic
Validitas berdasarkan pertimbangan teori
atau logika yang dilakukan oleh evaluator
yang dianggap ahli. Judgment dilakukan
terhadap:
• Isi (content), yakni ketepatan alat evaluasi
ditinjau dari segi materi yang dievaluasikan.
Validitas ini sering juga disebut validitas
kurikuler.
6. • Konstruksi (construct), berkaitan dengan aspek
psikologi dalam hal ini mengukur setiap aspek
berfikir yang disebutkan dalam tujuan
pembelajaran (indikator).
• Muka (face), berkaitan dengan keabsahan
kalimat atau kata-kata dalam soal, tanda baca,
gambar, diagram, dll yang berkaitan dengan
wajah.
7. Validitas Kriterium/Empiris
Validitas yang ditinjau dalam hubungannya dengan
kriterium tertentu. Validitas ini diperoleh melalui
observasi atau pengalaman empirik. Ada dua macam
validitas kriterium:
• Validitas Banding (concurrent validity)
Disebut juga validitas ada sekarang. Misalkan
membandingkan tes hasil buatan guru dengan rata-rata
ulangan harian sebagai kriteria.
• Validitas Ramal (predictive validity)
Kemampuan alat penilaian dalam meramalkan hal-hal
yang akan terjadi. Misalnya tes UMPTN, UN sebagai alat
seleksi PSB, dll.
8. Koefisien Validitas
• Korelasi produk moment angka kasar
• Korelasi produk moment memakai simpangan
• Korelasi metode rank
• Korelasi biserial
9. Korelasi Product Moment Pearson
• Korelasi dengan simpangan
22
yx
xy
rXY
Dengan:
n
YX
XYxy
n
Y
Yy
n
X
Xx
YYy
XXx
YdenganXdarikorelasirXY
2
22
2
22
:
10. • Product Moment Angka Kasar
• Korelasi Spearman
222
YYnXXn
YXXYn
rXY
YdenganXrangkingselisihd
dengan
nn
d
r
i
i
XY
:
:
,
)1(
6
1 2
2
11. Kategori nilai r dan uji signifikansinya
• Kategori nilai r menurut Guilford
• Uji signifikansi nilai r digunakan uji-t, dengan
• Jika nilai t hitung lebih besar dari t tabel dengan dk = n – 2, maka koefisien
validitas tersebut signifikan.
• Dapat juga membandingkan nilai r hitung dengan nilai r tabel. Jika r hitung
lebih besar dari r tabel, maka koefisein korelasi tersebut signifikan
Koefisien Validitas Kriteria
0,00 – 0,19 Sangat Jelek/Rendah
0,20 – 0,39 Rendah
0,40 – 0,59 Cukup
0,60 – 0,79 Baik
0,80 – 1,00 Sangat Baik
2
1
2
r
n
rt
12. Contoh:
• Misalkan diberikan hasi Tes X (yang akan dicari validitasnya)
dan rata-rata ulangan harian (Y) sebagai berikut:
No X Y
1 7,5 7,5
2 7,8 5,5
3 6,0 6,0
4 5,6 7,0
5 9,3 8,5
6 5,4 6,5
7 4,6 5,0
8 5,8 6,5
9 4,3 4,0
10 5,0 5,5
16. Korelasi Biserial
q
p
s
xx
t
tp
pbi
Dengan :
: rata-rata skor dari subjek yang menjawab benar untuk
butir soal yang dicari validitasnya
: rata-rata skor toal
: simpangan baku skor total
p : Proporsi siswa yang menjawab benar pada butir soal yang
diuji
q : Proporsi siswa yang menjawab salah pada butir soal yang
diuji
px
tx
ts
17. Faktor-faktor yang mempengaruhi
validitas
• Petunjuk pengerjaan yang tidak jelas
• Struktur kalimat dan perbendaharaan kata yang
sulit
• Penyusunan soal yang kurang baik
• Kekaburan (multi tafsir atau ambiguitas)
• Derajat kesukaran yang tidak cocok
• Materi tidak refresentatif
• Pengaturan soal yang kurang tepat
• Pola jawaban yang teridentifikasi