1. Kriteria Instrumen Evaluasi
Kelompok 12
Rofiani Intan Widuri Cn. NIM. 15842018
Julianti Syayidah NIM. 15842029
Kelas A Semester 4
Evaluasi Proses dan Hasil Pembelajaran
2. Pengertian Kriteria
Menurut Kamus Besar Bahasa Indonesia (KBBI), Kriteria adalah ukuran yang
menjadi dasar penilaian atau penetapan sesuatu.
Inggris: criterion; Yunani: kriterion (cara menilai) dari krites (hakim seseorang
yang memutuskan). Artinya, suatu standar (aturan, metode) untuk menilai
atau mengukur sesuatu. Kaidah atau aturan yang dipakai untuk menilai benar
salahnya keputusan-keputusan.
Kriteria juga dapat didefinisikan sebagai suatu patokan sifat atau karakteristik
yang ditetapkan sebagai alat pembanding bagi karakteristik-karakteristik
lainnya. Misalnya, kriteria validitas tes intelegensi adalah suatu pengukuran
tentang inteligensi, dan bukan tentang lainnya.
3. Pengertian Evaluasi
• Evaluasi adalah kegiatan mengukur dan menilai. Mengukur adalah membandingkan sesuatu dengan
satu ukuran dan bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu keputusan
terhadap sesuatu dengan ukuran baik buruk dan bersifat kualitatif. Mengadakan evaluasi meliputi
kedua langkah di atas, yakni mengukur dan menilai (Arikunto, 2007: 3).
• Dalam suatu proses belajar mengajar, yang melaksanakan evaluasi adalah guru, yaitu orang yang
merencanakan dan melaksanakan kegiatan belajar mengajar. Guru sebagai figur yang selalu
berinteraksi dengan murid memerlukan evaluasi formatif secara teratur agar dapat memperbaiki
atau menyempurnakan proses belajar mengajar yang dilaksanakan. Selain itu, gurulah yang paling
menghayati permasalahan yang dihadapi murid-muridnya sehingga dapat mencari upaya cara
menanganinya.
• Evaluasi adalah kegiatan untuk mengetahui apakah tindakan yang telah dikerjakan cukup berhasil
atau tidak.
4. Pengertian Instrumen Evaluasi
(Arikunto, 2007: 25-26)
• Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan untuk mempermudah
seseorang untuk melaksanakan tugas atau mencapai tujuan secara lebih efektif dan efisien. Kata
“alat” biasa disebut juga dengan istilah “instrumen”. Dengan demikian maka alat evaluasi juga
dikenal dengan instrumen evaluasi. Dalam kegiatan evaluasi, fungsi alat juga untuk memperoleh
hasil yang lebih baik sesuai dengan kenyataan yang dievaluasi.
• Contoh pertama: Jika yang dievaluasi seberapa siswa mampu mengingat nama kota atau sungai,
hasil evaluasinya berupa berapa banyak siswa dapat menyebutkan nama kota dan sungai yang
diingat.
• Dengan pengertian tersebut maka alat evaluasi dikatakan baik apabila mempu mengevaluasi
sesuatu yang dievaluasi dengan hasil seperti keadaan yang dievaluasi. Dalam menggunakan alat
tersebut evaluator menggunakan cara atau teknik, dan oleh karena itu dikenal dengan teknik
evaluasi, yaitu teknik nontes dan teknik tes.
5. Kriteria Instrumen Evaluasi
Dalam setiap penelitian, instrumen merupakan sesuatu yang mempunyai
kedudukan sangat penting, karena instrumen akan menentukan kualitas data
yang dikumpulkan. Semakin tinggi kualitas instrumen, semakin tinggi pula
hasil evaluasinya (Arikunto, 2004: 69).
Dalam melakukan penilaian, seorang guru harus memperhatikan instrumen-
instrumen yang digunakan. Misalnya saja pada pengggunaan instrumen
evaluasi. Instrumen Evaluasi yang baik memiliki ciri-ciri dan harus memenuhi
beberapa kaidah antara lain :
6. Validitas
Sebuah Instrumen Evaluasi dikatakan baik manakala memiliki validitas yang tinggi. Yang dimaksud Validitas
disini adalah kemampuan instrumen tersebut mengukur apa yang seharusnya diukur. Ada tiga Aspek yang
hendak dievaluasi dalam evaluasi hasil belajar yaitu Aspek Kognitif, Psikomotor dan Afektif.
Sebuah data atau informasi dapat dikatakan valid apabila sesuai dengan keadaan senyatanya. Sebagai contoh,
informasi tentang seorang bernama A menyebutkan bahwa si A pendek karena tingginya tidak lebih dari 140
sentimeter. Data tentang A ini dikatakan valid apabila memang sesuai dengan kenyataan, yakni bahwa tinggi A
kurang dari 140 sentimeter.
Contoh: Untuk mengukur besarnya partisipasi siswa dalam proses belajar-mengajar, bukan diukur melalui nilai
yang diperoleh pada waktu ulangan, tetapi dilihat melalui: kehadiran, terpusatnya perhatian pada pelajaran,
dan ketepatan menjawab pertanyaan-pertanyaan yang diajukan oleh guru dalam arti relevan pada
permasalahannya.
7. Nilai yang diperoleh pada waktu ulangan, bukan menggambarkan partisipasi, tetapi menggambarkan
prestasi belajar. Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada
hasil pengetesan atau skornya. Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman.
Messick (1993) menyatakan bahwa validitas secara tradisional terdiri dari:
• validitas isi, yaitu ketepatan materi yang diukur dalam tes;
• validitas criterion-related, yaitu membandingkan tes dengan satu atau lebih variabel atau kriteria;
• valitidas prediktif, yaitu ketepatan hasil pengukuran dengan alat lain yang dilakukan kemudian;
• validitas serentak (concurrent), yaitu ketepatan hasil pengukuran dengan dua alat ukur lainnya yang
dilakukan secara serentak;
• validitas konstruk, yaitu ketepatan konstruksi teoretis yang mendasari disusunnya tes.
8. Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari kata realibility dalam bahasa Inggris, berasal
dari kata reliable yang artinya dapat dipercaya.
Instrumen dikatakan memiliki reliabilitas yang tinggi manakala instrumen tersebut dapat
menghasilkan hasil pengukuran yang ajeg. Keajegan/ketetapan disini tidak diartikan selalu sama
tetapi mengikuti perubahan secara ajeg. Jika keadaan seseorang si Upik berada lebih rendah
dibandingkan orang lain misalnya si Badu, maka jika dilakukan pengukuran ulang hasilnya si upik
juga berada lebih rendah terhadap si badu. Tinggi rendahnya reliabilitas ini dapat di hitung
dengan uji reliabilitias dan dinyatakan dengan koefisien reliabilitas.
Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat
memberikan hasil yang tetap. Maka pengertian reliabilitas tes berhubungan dengan masalah
ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah perubahan yang terjadi dapat
dikatakan tidak berarti.
10. • Sebuah tes dikatakan reliabel apabila hasil-hasil tes tersebut menunjukkan ketetapan. Dengan kata lain,
jika kepada para siswa diberikan tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap
berada dalam urutan (ranking) yang sama dalam kelompoknya.
• Walaupun tampaknya hasil tes pada pengetesan kedua lebih baik akan tetapi karena kenaikannya dialami
oleh semua siswa, maka tes yang digunakan dapat dikatakan memiliki reliabilitas yang tinggi. Kenaikan
hasil tes kedua barangkali disebabkan oleh adanya “pengalaman” yang diperoleh pada waktu mengerjakan
tes pertama. Dalam keadaan seperti ini dikatakan bahwa ada carry-over effect atau practice-effect, yaitu
adanya akibat yang dibawa karena siswa telah mengalami suatu kegitan.
• Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendapat bahwa “ajeg” atau “tetap”
diartikan sebagai “sama”. Dalam pembicaraan evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu
harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih rendah
dibanding dengan B, maka jika diadakan pengukuran ulang, si A juga berada lebih rendah dari B. Itulah
yang dikatakan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain.
Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas
instrumen.
11. Objektivitas
Dalam pengertian sehari-hari telah dengan cepat diketahui bahwa objektif
berarti tidak adanya unsur pribadi yang mempengaruhi. Lawan dari objektif
adalah subjektif, artinya terdapat unsur pribadi yang masuk mempengaruhi.
Sebuah tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes
itu tidak ada faktor subjektif yang mempengaruhi. Hal ini terutama terjadi
pada sistem skoringnya.
Instrumen evaluasi hendaknya terhindar dari pengaruh-pengaruh
subyektifitas pribadi dari si evaluator dalam menetapkan hasilnya. Dalam
menekan pengaruh subyektifitas yang tidak bisa dihindari hendaknya evaluasi
dilakukan mengacu kepada pedoman tertama menyangkut masalah
kontinuitas dan komprehensif.
12. Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan ketepatan (consistency) pada sistem
skoring, sedangkan reliabilitas menekankan ketetapan dalam hasil tes.
Ada 2 faktor yang mempengaruhi subjektivitas dari sesuatu tes yaitu bentuk tes dan penilai.
• Bentuk tes
Tes yang berbentuk uraian, akan memberi banyak kemungkinan kepada si penilai untuk memberikan
penilaian menurut caranya sendiri. Dengan demikian maka hasil dari seorang siswa yang mengerjakan
soal-soal dari sebuah tes, akan dapat berbeda apabila dinilai oleh dua orang penilai. Itulah sebabnya
pada waktu itu ini ada kecenderungan penggunaan tes objektif di berbagai bidang. Untuk menghindari
masuknya unsur subjektivitas dari penilai, maka sistem skoringnya dapat dilakukan dengan cara sebaik-
baiknya, antara kain dengan membuat pedoman skoring terlebih dahulu.
• Penilai
Subjektivitas dari penilai akan dapat masuk secara agak leluasa terutama dalam tes bentuk uraian.
Faktor-faktor yang mempengaruhi subjektivitas antara lain: kesan penilai terhadap siswa, tulisan,
bahasa, waktu mengadakan penilaian, kelelahan, dan sebagainya. Untuk menghindari atau mengurangi
masuknya unsur subjektivitas dalam pekerjaan penilaian, maka penilaian atau evaluasi ini harus
dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud, terutama menyangkut masalah
pengadministrasian yaitu kontinuitas dan komprehensivitas.
13. Evaluasi harus dilakukan secara kontinu (terus-menerus). Dengan evaluasi yang berkali-kali
dilakukan maka guru akan memperoleh gambaran yang lebih jelas tentang keadaan siswa. Tes
yang diadakan secara on the spot dan hanya satu atau dua kali, tidak akan dapat memberikan
hasil yang objektif tentang keadaan siswa. Faktor kebetulan, akan sangat mengganggu hasilnya.
Kalau misalnya ada seorang anak yang sebetulnya pandai, tetapi pada waktu guru mengadakan
tes dia sedang dalam kondisi yang jelek karena semalaman merawat ibunya yang sedang sakit,
maka ada kemungkinan nilai tesnya jelek pula.
Evaluasi harus dilakukan secara komprehensif (menyeluruh) yang dimaksud dengan evaluasi yang
komprehensif di sini adalah atas berbagai segi peninjauan, yaitu:
• Mencakup keseluruhan materi.
• Mencakup berbagai aspek berpikir (ingatan, pemahaman, aplikasi, dan sebagainya).
• Melalui berbagai cara yaitu tes tertulis, tes lisan, tes perbuatan, pengamatan insidental, dan
sebagainya.
14. Praktikabilitas
Sebuah intrumen evaluasi dikatakan memiliki praktikabilitas yang tinggi apabila bersifat praktis mudah
pengadministrasiannya dan memiliki ciri : Mudah dilaksanakan, tidak menuntut peralatan yang banyak
dan memberi kebebasan kepada audience mengerjakan yang dianggap mudah terlebih dahulu. Mudah
pemeriksaannya artinya dilengkapi pedoman skoring, kunci jawaban. Dilengkapi petunjuk yang jelas
sehingga dapat di laksanakan oleh orang lain.
Tes yang praktis adalah tes yang:
• Mudah dilaksanakan, misalnya tidak menuntut peralatan yang banyak dan memberi kebebasan
kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa.
• Mudah pemeriksaannya, artinya bahwa tes itu dilengkapi dengan kunci jawaban maupun pedoman
skoringnya. Untuk soal bentuk objektif, pemeriksaan akan lebih mudah dilakukan jika dikerjakan
oleh siswa dalam lembar jawaban.
• Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan/diawali oleh orang lain.
16. Taraf Kesukaran
Instrumen yang baik terdiri dari butir-butir instrumen yang tidak
terlalu mudah dan tidak terlalu sukar. Butir soal yang terlalu
mudah tidak mampu merangsang audience mempertinggi usaha
memecahkannya sebaliknya kalau terlalu sukar membuat
audiece putus asa dan tidak memiliki semangat untuk mencoba
lagi karena diluar jangkauannya.
17. Daya Pembeda
Daya pembeda sebuah instrumen adalah kemampuan instrumen
tersebut membedakan antara audience yang pandai
(berkemampuan tinggi) dengan audience yang tidak pandai
(berkemampuan rendah).
18. • Evaluasi harus dilakukan secara kontinu (terus-menerus). Dengan evaluasi
yang berkali-kali dilakukan maka evaluator akan memperoleh gambaran
yang lebih jelas tentang keadaan Audience yang dinilai. Evaluasi yang
diadakan secara on the spot dan hanya satu atau dua kali, tidak akan
dapat memberikan hasil yang obyektif tentang keadaan audience yang di
evaluasi. Faktor kebetulan akan sangat mengganggu hasilnya.
• Linn dan Gronlund (1995) menyatakan bahwa tes yang baik harus
memenuhi tiga karakteristik, yaitu: validitas, reliabilitas, dan usabilitas.
Validitas artinya ketepatan interpretasi hasil prosedur pengukuran,
reliabilitas artinya konsistensi hasil pengukuran, dan usabilitas artinya
praktis prosedurnya.
19. Nitko (1999) dan Popham (1995) menyatakan bahwa reliabilitas berhubungan dengan
konsistensi hasil pengukuran. Untuk meningkatkan validitas dan reliabilitas tes perlu
dilakukan analisis butir soal. Kegunaan analisis butir soal di antaranya adalah:
• dapat membantu para pengguna tes dalam evaluasi atas tes yang diterbitkan,
• sangat relevan bagi penyusunan tes informal dan lokal seperti kuis, ulangan yang
disiapkan guru untuk peserta didik di kelas,
• mendukung penulisan butir soal yang efektif,
• secara materi dapat memperbaiki tes di kelas,
• meningkatkan validitas soal dan reliabilitas.
21. Kesimpulan
Kriteria dapat didefinisikan sebagai suatu patokan sifat atau karakteristik yang ditetapkan sebagai alat pembanding bagi
karakteristik-karakteristik lainnya. Misalnya, kriteria validitas tes intelegensi adalah suatu pengukuran tentang inteligensi,
dan bukan tentang lainnya.
Evaluasi adalah kegiatan mengukur dan menilai. Mengukur adalah
membandingkan sesuatu dengan satu ukuran dan bersifat kuantitatif.
Sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu
dengan ukuran baik buruk dan bersifat kualitatif. Mengadakan evaluasi
meliputi kedua langkah di atas, yakni mengukur dan menilai.
Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan untuk mempermudah
seseorang untuk melaksanakan tugas atau mencapai tujuan secara lebih efektif dan efisien.
Kata “alat” biasa disebut juga dengan istilah “instrumen”. Dengan demikian maka alat evaluasi
juga dikenal dengan instrumen evaluasi. Dalam kegiatan evaluasi, fungsi alat juga untuk
memperoleh hasil yang lebih baik sesuai dengan kenyataan yang dievaluasi.
Dalam buku-buku penelitian selalu disebutkan sekurang-kurangnya ada empat persyaratan
bagi instrumen yang baik, yaitu valid, realibel, praktibel, dan ekonomis.