1. Validitas dan Reliabilitas
Dwitya Sobat Ady Dharma (22703261012)
Program Studi Ilmu Pendidikan (S3)
Konsentrasi Pendidikan Luar Biasa
Fakultas Pascasarjana
Universitas Negeri Yogyakarta
2. 1. Jenis Validitas dan faktor yang mempengaruhi validitas
2. Mengetahui Validitas/ analisis Validitas
3. Jenis reliabilitas dan faktor yang mempengaruhinya
4. Metode Analisis Reliabilitas
3. Pengertian
• Validitas berasal dari kata validity yang berarti sejauh mana ketepatan
dan juga kecermatan suatu alat ukur dalam melakukan fungsi
ukurannya (Azwar, 2000).
• Validitas merujuk pada suatu ukuran yang menjamin bahwa suatu
variabel yang diukur, benar-benar merupakan variabel yang memang
diteliti. (Cooper & Schindler, 2006).
• Validitas akan menunjukkan dukungan fakta empiris dan alasan
teoretis terhadap terhadap interpretasi skor tes atau skor suatu
instrumen, dan terkait dengan kecermatan pengukuran.
4. Jenis-jenis validitas: Validitas Isi
• Validitas isi merujuk pada sejauh mana isi dari suatu perangkat
instrumen penelitian dapat mengukur apa yang seharusnya diukur.
Jika dikaitkan dengan pembelajaran, maka validitas isi adalah
kesesuaian sola-soal atau materi dalam ujian dengan apa yang telah
dipelajari siswa (Mardapi, 2008).
• Pengujian terhadap validitas isi menggunakan logika atau analisis
rasioanal dengan melihat apakah item-item soal telah sesuai dengan
kisi-kisinya. Dengan kata lain validitas isi dapat dikatakan sebagai
penilaian yang ditentukan berdasarkan indvidu atau secara subjektif
5. Jenis-jenis validitas: Validitas Konstruk
• Validitas konstruk mempersoalkan sejauh mana skor-skor hasil pengukuran
dengan suatu instrumen merefleksikan konstruk teoritik yang mendasari
penyusunan alat ukur tersebut.
• Validitas konstruk adalah validitas yang menunjukkan sejauhmana
instrumen mengungkap suatu kemampuan atau konstruk teoretis tertentu
yang hendak diukurnya.
• Validitas konstruk adalah validitas yang berkaitan dengan kesanggupan suatu
alat ukur dalam mengukur pengertian suatu konsep yang diukurnya.
• Instrumen non-tes mempunyai validitas konstruk, jika instrumen tersebut
dapat digunakan untuk mengukur konsep sesuai dengan yang didefinisikan
(Suryabrata, 2000).
6. Jenis-jenis validitas: Validitas Kriteria
• Validitas kriteria dikenal dengan nama lain yaitu validitas empiris. Validitas
kriteria digunakan ketika nilai atau skor tes dihubungkan dengan suatu
kriteria. Kriteria adalah beberapa perilaku dimana nilai tes dapat digunakan
untuk memprediksi.
• Sebagai contoh misalnya, untuk mendapatkan validitas hubungan kriteria,
skor dalam suatu instrumen tes yang dikembangkan untuk penyeleksian
pelamar pekerjaan harus dihubungkan dengan kriteria keefektifan kinerja.
• Fernandes (1984) mengatakan validitas berdasarkan kriteria dimaksudkan
untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan
peserta di masa mendatang (predictive validity) atau mengestimasi
kemampuan dengan alat ukur lain dengan tenggang waktu yang hampir
bersamaan (concurrent validity).
7. Faktor yang memengaruhi Validitas
Internal Eksternal
- Instruksi tes jelas dan mudah dipahami siswa.
- Penggunaan kata dan kalimat di dalam butir
soal yang mudah dipahami dan dibaca.
- Konstruksi setiap butir soal yang baik sesuai
kaidah penulisan soal.
- Tingkat kesulitan setiap soal yang tepat atau
sesuai dengan materi/ bahan pembelajaran
siswa.
- Jumlah soal yang cukup mewakili sampel
bahan/ materi pembelajaran atau kompetensi
dasar yang dituntut.
- Setiap soal yang disajikan memiliki jawaban.
- Tidak ada kecurangan yang
dilakukan siswa pada saat
dilakukan administrasi tes
(mencontek, guru memberikan
petunjuk, dll).
- Waktu pengerjaan tes yang
tepat (tidak kurang atau lebih
waktunya).
- Penskoran yang konsisten.
9. Mengetahui Validitas
• Validitas isi dapat ditentukan dengan cara validasi kepada ahli (expert). Ahli
dalam bidang studi diasumsikan dapat mengukur konten dari instrument yang
divalidasi (content related). Hal ini dikarenakan instrumen pengukuran ( dapat
berupa tes atau angket) dibuktikan valid jika ahli (expert) meyakini bahwa bahwa
instrumen tersebut mengukur penguasaan kemampuan yang didefinisikan dalam
domain.
• Validitas konstruk: Proses pembuktian validitas konstruk dapat dilakukan dengan
membuktikan bahwa konstruk instrumen memang ada (exists) dan kemudian
dibuktikan hasil pengukurannya secara empiris (Retnawati, 2016) (Prosedur
validasi konstruk diawali dari suatu identifikasi dan batasan mengenai variabel
yang hendak diukur dan dinyatakan dalam bentuk konstruk logis berdasarkan
teori mengenai variabel tersebut). Analisis yang banyak digunakan antara lain
dengan analisis faktor eksploratori (exploratory factor analysis, EFA) maupun
konfirmatori (confirmatory factor analysis, CFA).
10. Lanjutan
• Validitas kriteria: Pada pembuktian validitas dengan cara ini, diperlukan
skor hasil pengukuran menggunakan instrumen lain yang lebih terstandar
(Retnawati, 2016). Validitas kriteria merupakan validitas yang melihat
hubungan alat ukur dengan hal-hal yang berada di luar alat ukur tersebut
baik pada masa sekarang maupun yang akan datang (Azwar, 2014).
• Validasi tes yang dipergunakan dalam dunia pendidikan sebaiknya
melibatkan analisis isi tes dan analisis konstruk (empiris) dari skor tes dan
data respons terhadap butir oleh peserta tes. Analisis isi tes terkait dengan
validitas isi yang selanjutnya diperlukan juga analisis empiris untuk
mengetahui validitas konstruk. Kedua analisis ini dimaksudkan agar tes di
dunia pendidikan memenuhi syarat tes yang standar.
11. Reliabilitas
• Reliabilitas ialah tingkat konsistensi (keajegan) skor yang dihasilkan
apabila suatu tes digunakan secara berulang pada individu atau
sekelompok individu yang sama.
• Reliabilitas menekankan pada konsistensi skor, bukan pada tes atau
instrumennya.
• Dalam kaitannya dengan penilaian pendidikan, prestasi atau
kemampuan seorang siswa dikatakan reliabel jika dilakukan
pengukuran, hasil pengukuran akan sama informasinya, walaupun
penguji berbeda, korektornya berbeda atau butir soal yang berbeda
tetapi memiliki karakteristik yang sama.
12. Mengukur Reliabilitas (Retnawati, 2014;
Arikunto, 2018; Endrayanto, 2014)
• Metode Test-Retest: metode analisis reliabilitas di mana tes yang
sama digunakan sebanyak dua kali kesempatan pengukuran pada
siswa atau kelompok siswa yang sama.
• Guru melakukan pengukuran dan menggukana tes pada kondisi yang
kurang lebih sama (jam pelaksanaan, aturan, dll)
• Metode ini memiliki kelamahan: pertama, siswa hanya akan
mengandalkan ingatan karena tes pertama dan kedua menggunakan
butir soal yang sama (dapat disiasati dengan jarak waktu yang
lumayan lama). Kedua, masalah stabilitas psikis siswa. Secara umum,
kondisi psikis siswa tidak stabil dari waktu ke waktu
13. Metode bentuk parallel (equivalent)
• Disebut juga metode bentuk sejajar (alternate form).
• Metode parallel menggunakan dua bentuk tes yang dianggap parallel
berdasarkan kesamaan jenis soal, jumlah soal, bahan materi
pembelajaran, tingkat kesukaran, dan jumlah siswa yang mengikuti
tes, namun pelaksanaan tes dilakukan pada waktu yang berbeda.
• Dari segi waktu, metode ini relative lebih pendek.
• Hasil kedua tes tersebut kemudian dikorelasikan sehingga diperoleh
koefisien korelasi.
14. Metode belah dua (split half method)
• Metode belah dua merupakan salah satu bentuk reliabilitas
berdasarkan konsistensi internal.
• Konsistensi internal menalaah apakah setiap butir soal mengukur
kemampuan yang sama.
• Kelebihan metode ini, tes hanya dilakukan satu kali.
• Hal yang dilakukan, guru menggunakan satu tes pada satu kali
pengukuran terhadap sekelompok siswa, kemudian skor tersebut
dibagi dua (ganjil dan genap). Hasil bagi dua tersebut kemudian
dikorelasikan menggunakan rumus spearman-Brown.
15. Contoh kesalahan sistematis dan kesalahan
anak (dalam konteks reliabilitas)
Kesalahan sistematis Kesalahan anak
- Butir soal menggunakan kosakata dan
kalimat yang kurang tepat.
- Kalimat pada butir soal yang terlalu
panjang sehingga menuntut kemampuan
siswa membaca.
- Instruksi tes yang kurang tepat atau tidak
jelas.
- Jumlah butir soal yang terlalu sedikit.
- Kecurangan pada saat administrasi tes,
misalnya menyontek.
- Faktor tebakan jawaban (pola tertentu).
- Faktor kesukaran butir soal yang kurang
sesuai
- Kondisi sakit
- Kecerobohan
- Motivasi siswa
- Faktor mental
- Kebisingan
- Meja dan tempat
duduk yang tidak
nyaman.
16. Arifin (2014) berpendapat bahwa terdapat empat
faktor yang mempengaruhi reliabilitas yaitu:
1. Panjang tes (length of test)
• Makin banyak soal dalam tes maka akan makin tinggi tingkat reliabilitas suatu tes
dikarenakan terdapat banyak sampel yang diukur dan proporsi jawaban yang benar
makin banyak.
2. Sebaran skor (spread of scores)
• Besarnya sebaran skor akan membuat tingkat reliabilitas menjadi lebih tinggi karena
koefisien reliabilitas yang lebih besar diperoleh ketika responden tetap pada posisi yang
relatif sama dalam satu kelompok pengujian ke pengujian berikutnya
3. Tingkat kesukaran (difficulty indeks)
• Tingkat tes yang sukar dan tes yang mudah untuk responden cenderung akan
menghasilkan tingkat reliabilitas yang rendah
4. Obyektivitas (objectivity)
• Menunjukkan skor tes kemampuan yang sama antara responden yang satu dengan
responden yang lain.
17. Reliabilitas yang rendah dapat terjadi karena inkonsistensi
pengamat, ketidakstabilan atribut dari subjek yang diukur dan
situasi pengukuran yang tidak mendukung.
Berikut cara untuk meningkatkan reliabilitas (Murti, 2011) :
• 1. Memilih item pertanyaan untuk alat ukur kemudian dilakukan uji
konsistensi internal dan stabilitas alat ukur melalui suatu uji coba
• 2. Menghilangkan variasi pengukuran antar pengamat dengan cara
menggunakan orang-orang yang terlatih dan termotivasi
• 3. Menghilangkan variasi pengukuran intra pengamat dengan cara
mengurangi sumber variasi eksternal seperti kejemuan, kelelahan,
lingkungan berisik yang semuanya berpengaruh pada subjek penelitian
maupun pengamat
• 4. Melakukan koreksi terhadap pengamat berdasarkan kalibrasi (tanda
yang menyatakan pembagian skala) alat ukur dalam studi reliabilitas
• 5. Membakukan situasi/ konteks/ lingkungan penggunaan instrumen.
18. Contoh kasus yang sering terjadi di lapangan
• Soal Bahasa Indonesia-nya terlalu panjang.
• Pendamping yang membacakan soalnya
terlalu cepat.
• Dibantu menjawab soal.
19.
20.
21. Daftar Referensi
• Arifin, Z. 2014. Evaluasi Pembelajaran. Bandung : PT.Remaja Rosdakarya
• Arikunto, S. 2018. Prosedur Penelitian : Suatu Pendekatan Praktik. Jakarta: PT. Rineka Cipta
• Azwar, S. 2011. Reliabilitas dan Validitas.Yogyakarta: Pustaka Pelajar
• Allen, M. J. & Yen, W. M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/ Cole Publishing Company.
• Azwar, S. (2012). Reliabiltas dan Validitas. Edisi 4. Yogyakarta : Pustaka Pelajar.
• Azwar, S. (2014). Penyusunan skala psikologi. Yogyakarta: Pustaka Pelajar.
• Murti, B. 2011. Validitas dan Reliabilitas Pengukuran. Surakarta: Institute Of Health Economic And Policy Studies (IHEPS). Bagian
Ilmu Kesehatan Masyarakat. Fakultas Kedokteran Universitas Sebelas Maret
• Popham, W.J. (1995). Classroom assessment: What teachers need to know. Boston, MA: Allyn and Bacon, Inc.
• Retnawati, H. (2016). Analisis Kuantitatif Instrumen Penelitian (Panduan Peneliti, Mahasiswa, dan Psikometrian). Yogyakarta:
Parama Publishing.
• Retnawati, H. (2017). Validitas dan Reliabilitas Konstruk Skor Tes Kemampuan Calon Mahasiswa. Jurnal Ilmu Pendidikan, Jilid 23,
Nomor 2, Desember 2017, hlm. 126 -135.
• Suryabrata, S. (2002). Pengembangan Alat Ukur Psikologis. Yogyakarta: Andi Offet.
• Thorndike, R.M. 2005. Measurement and Evaluation in Psychology and Education Seventh Edition. New Jersey : Prentice Hall,Inc