Your SlideShare is downloading. ×
Mkalah evaluasi
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Mkalah evaluasi

6,434
views

Published on


0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
6,434
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
177
Comments
0
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. VALIDITAS Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan ataukebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh manakecermatan atau ketepatan alat ukur dalam melakukan fungsi ukurnya. Sebuah instrumenyang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jikakita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan atau neraca bukanmeteran, termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertianbahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yangdiinginkan. Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek danmengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran dalam duniapembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupunpanjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perludipelajari dengan hati -hati. Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secaraumum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuksuatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkanuntuk tujuan yang sama pada kelompok yang lain. Validitas secara umum menunjukkan ukuran yang mengukur apa yang akan diukur(Anonim: 2006: 1). Validitas mengacu pada keberartian, kebenaran, kemanfaatan, dankeseuaian skor tes (Jafar Ahiri: 1). Validitas adalah suatu konsep yang berkaitan dengansejauh mana tes telah mengukur apa yang seharusnya diukur (Sumarna Supranata: 2004: 50).Dalam buku “ Encyclopedia of Educational Evaluation (Suharsimi A: 1987: 60) dikatakan,bahwa sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur.Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam kaitannya denganmengukur hal yang seharusnya diukur (Sumarna Supranata: 2004: 50). Menurut Nunnaly(1972) dalam Sumarna Supranata (2004: 50), menyatakan, bahwa pengertian validitassenantiasa dikaitkan dengan penelitian empiris dan pembuktian-pembuktiannya bergantungkepada macam validitas yang digunakan. Kemudian, menurut Anastasi (1988) dalamSumarna Supranata (2004: 50), menyatakan, bahwa validitas adalah suatu tingkatan yangmenyatakan bahwa suatu alat ukur telah sesuai dengan apa yang diukur. Sedangkan Gronlund(1985) dalam Sumarna Supranata (2004: 50), menyatakan bahwa validitas berkaitan denganhasil suatu alat ukur, menunjukkan tingkatan, dan bersifat khusus sesuai dengan tujuanpengukuran yang akan dilakukan. Suatu tes dapat dikatakan mempunyai validitas tinggiapabila tes tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur sesuai denganmakna dan tujuan diadakannya tes tersebut.Linn & Gronlund (2000) mengemukakan hakikat validitas tes dan asesmensebagai berikut :1. Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya.2. Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan), sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan derajad maka sebuah instrumen dapat dikategorikan mempunyai derajad validitas tinggi, sedang, dan rendah.
  • 2. 3. Validitas selalu bersifat khusus untuk penggunaan atau interpretasi tertentu. Tidak ada asesmen yang valid untuk semua tujuan. Sebagai contoh, hasil tes aritmatika mungkin mempunyai tingkat validitas yang tinggi untuk kemampuan hitung, validitas yang rendah untuk alasan-alasan aritmatika, dan mempunyai derajat validitas sedang untuk memprediksi kesuksesan prestasi matematika yang akan datang.4. Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang sebagai sebuah kesatuan konsep berdasark an berbagai macam bagian dari fakta.5. Validitas melibatkan sebuah keputusan evaluatif yang menyeluruh.A. Macam-macam Validitas Validitas dapat dibedakan menjadi 3 macam yaitu validitas isi ( content validity), validitas konstruksi (construct validity), dan validitas berdasar kriteria (criterion related validity). Validitas berdasar kriteria dapat dibedakan menjadi dua macam yaitu, validitas konkuren (validitas ada sekarang, concurent validity) dan validitas prediktif (predictive validity). 1) Validitas Isi (Content Validity) Validitas isi disebut juga validitas kurikuler. Oleh karena itu, validitas ini erat kaitannya dengan materi yang akan diukur dalam tes. Tentu saja materi yang dimaksud adalah materi yang terdapat dalam kurikulum. Validitas isi mencerminkan sejauh mana butir-butir dalam tes mencerminkan materi yang disajikan dalam kurikulum. Sebuah tes dikatakan memiliki validitas isi jika butir - butir tes bersifat representatif terhadap isi materi dalam kurikulum tersebut. Pengujian validitas isi tidak melalui prosedur pengujian secara statistik, melainkan melalui analisis secara rasional. Pengetahuan terhadap kurikulum menjadi dasar berpijak yang penting untuk dapat melakukan analisis validitas isi. Cara yang praktis untuk melakukan analisis validitas isi adalah dengan melihat apakah butir-butir tes telah disusun sesuai dengan blue-print (kisi-kisi) yang sudah dirancang sebelumnya. Blue print menjadi acuan dalam menuangkan domain atau ranah dan indikator yang akan diukur dalam tes.2) Validitas Konstruk (Construct Validity) Validitas konstruk adalah validitas yang menyangkut bangunan teoretik variabel yang akan diukur. Sebuah tes dikatakan mempunyai validitas konstruk apabila butir-butir soal yang disusun dalam tes mengukur setiap aspek berpikir dari sebuah variabel yang akan diukur melalui tes tersebut. Seperti halnya validitas isi, untuk mempertinggi validitas konstruk dapat dilakukan dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek. Pengujian validitas konstruk diperlukan an alisis statistik yang kompleks seperti prosedur analisis faktor. Salah satu prosedur pengujian validitas konstruk yang tidak terlalu kompleks dapat dilakukan dengan pendekatan multi-trait multi-method. Dua atau lebih trait yang diukur melalui dua atau lebih metode dapat diuji secara serentak dengan pendekatan ini, sehingga akan diperoleh adanya bukti adanya validitas diskriminan dan validitas konvergen. Validitas diskriminan ditunjukkan oleh rendahnya korelasi antara faktor skala atau tes yang mengukur trai t yang berbeda terutama bila digunakan metode yang sama. Validitas konvergen ditunjukkan oleh tingginya korelasi skor tes –tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda.
  • 3. 3) Validitas Berdasarkan Kriteria Sesuai dengan namanya, validitas ini didasarkan pada kriteria tertentu. Dengan demikian bukti adanya validitas ditunjukkan adanya hubungan korelasional skor pada tes yang bersangkutan dengan skor suatu kriteria. Pengujian validitas ini bersifat empirik, artinya pengujian hanya dapat dilakukan setelah mendapatkan data di lapangan. Apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil pengamatan di lapangan terbukti bahwa tes hasil belajar dapat mengukur hasil belajar yang seharusnya diungkap secara tepat maka berarti alat tes tersebut mempunyai validitas empirik. Untuk keperluan pengujian jenis validitas ini dapat dilakukan dengan dua cara yaitu dari segi kemampuannya dalam melakukan ramalan ( predictive validity) serta daya ketepatan bandingannya (concurent validity). Perbedaan utama antara validitas ramalan dengan validitas bandingan adalahketersediaan pembanding (kriterium). Pada validitas ramalan , kriterium diperoleh pada waktuyang akan datang setelah dilakukan tes yang akan diukur validitasnya tersebut. Sedangkanpada validitas bandingan, kriterium sudah ada atau dapat diperoleh pada saat yang samadengan waktu untuk memperoleh data tentang tes yang akan diukur validitasnya tersebuttanpa harus menunggu masa yang akan datang.B. Pengujian Validitas Tes Secara Empirik Validitas empirik adalah kerapatan mengukur yang didasarkan pada hasil analisis yangbersifat empirik. Dengan kata lain validitas empirik adalah validitas yang bersumber padaatau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirikataukah belum, dapat dilakukan penelusuran dari dua segi :a) Validitas ramalan (predictive validity) Sebagai ilustrasi adalah adanya tes masuk Perguruan Tinggi Negeri. Setelah melaluiserangkaian tes maka hanya calon mahasiswa yang mempunyai skor tinggi yang diterima olehpanitia seleksi mahasiswa baru. Sesungguhnya keputusan panitia seleksi yang hanyamenerima mahasiswa yang mempunyai skor tinggi saja berarti sudah memprediksikan bahwacalon mahasiswa dengan skor tinggi tersebut kelak yang akan lebih berhasil dalam studinya.Sedangkan para calon mahasiswa yang mempunyai skor sedang apalagi rendah diprediksikanakan banyak menemui kendala dalam studinya. Oleh karena itu tes yang digunakan dalamseleksi calon mahasiwa baru tersebut akan mempunyai tingkat validitas prediktif yang tinggiapabila secara empirik terbukti bahwa prestasi belajar mereka juga baik. Dengan demikianantara skor tes masuk dengan prestasi belajar harus mempunyai korelasi yang positif. Pada kasus di atas, yang dipermasalahkan validitasnya adalah tes masuk. Oleh karenaitu hasil belajar pada masa perkuliahan digunakan sebagai tolok ukur (kriterium). Adanyakesejajaran, kesesuaian, kesamaan arah antara tes seleksi masuk dengan hasil belajarmempunyai korelasi yang positif. Berdasarkan pada uraian di atas, dapatlah dipahami bahwa untuk mengetahui apakahsuatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalanataukah belum, dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yangsedang diuji validitas ramalan itu dapat dinyatakan sebagai tes hasil belajar yang telahmemiliki daya ramalan yang tepat.
  • 4. Contoh : Nilai hasil tes seleksi bahasa arab di Fakultas Nilai (Variabel y) yang berhasil dicapai oleh 5 orang. No X Y 1. 58 65 2. 50 57 “ tidak terdapat korelasi fositif yang signifikan, antara variable 3. 53 60 X dengan variable Y” 4. 49 56 5. 58 65 a) Menyiapkan Peta Korelasi No X Y Y 2 Y2 .Y 1. 58 65 4 4 16 16 16 2. 50 57 -4 -4 16 16 16 3. 53 60 -1 -1 1 -1 1 4. 49 56 -5 2 -10 25 4 5. 58 65 4 4 16 16 16 b) Menghitung mean x dan y c) Menghitung Standard deviasi X dan Y d) Angka Indeks korelasi X Yb) Validitas bandingan (Concurent Validity) Validitas ini sering pula disebut sebagai validitas ada sekarang, validitas sama saat,validitas pengalaman, dan validitas empiris. Disebut sebagai validitas ada sekarang karenapengujiannya berdasarkan pengalaman yang saat ini sudah ada di tangan. Disebut sebagaivaliditas sama saat karena validitas ini segera dapat kita peroleh informasinya pada saat yangsama dengan waktu diperolehnya data hasil tes yang diukur validitasnya tersebut. Disebutvaliditas pengalaman (empiris) karena validitas ini dikaitkan dengan pengalaman yang sudahada. Dalam hal ini pengalaman digunakan sebagai kriterium. Guna menentukan validitasbandingan ini tidak perlu menunggu waktu untuk membuktikannya. Seperti disebutkan padaalenia di atas bahwa yang berfungsi sebagai kriterium adalah data hasil pengalaman. Apabiladata dari tes yang ada sekarang mempunyai hubungan yang searah dengan data hasilpengalaman maka dikatakan telah mempunyai validitas bandingan.Contoh : Bagaimana cara pengujian validitas bandingan. Misalnya pada tanggal 1 Agustus 1994 sebanyak 24 orang siswa. Dua minggu kemudian, yaitu pada tanggal 15 Agustus 1994, tanpa pemberitahuan terlebih dahulu, 20 orang siswa diatas dihadapkan pada tes formatif kedua dengan mata pelajaran yang sama dengan menggunakan butir soal yang sama dengan butir-butir soal yang telah dikeluarkan pada tes formatif pertama.
  • 5. Tekhnik pengujian validitas item tes hasil belajara. Pengertian validitas item Dimaksud dengan validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item ( yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas ), dalam negukur apa yang seharusnya diukur lewat butir item tersebut.b. Tehknik Pengujian Validitas Item Tes Hasil Belajar Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu. Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul atau salah. Rumus : PB 1 = √B. Faktor-faktor yang mempengaruhi validitas Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di antaranyatampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang akan berpikir untukmengukur pengetahuan biologi dengan asesmen matematika. Demikian pula juga tidak adaguru yang akan mengukur kemampuan memecahkan masalah (problem solving) biologi kelas7 SMP dengan menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contohtersebut sudah sangat jelas hasil asesmen akan menjadi tidak valid. Faktor yangmempengaruhi validitas tes antara lain:1. Faktor dari dalam tes itu sendiri Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes yangdigunakan untuk mengukur isi materi atau fungsi - fungsi mental yang akan diakses olehguru. Bagaimanapun juga, beberapa fak tor berikut dapat menjaga butir tes dari fungsi yangdikehendaki dan dengan demikian juga terj aga dari rendahnya validitas hasil asesmen. Limafaktor yang pertama dapat diterapkan sejajar dengan asesmen penampilan siswa secara luasser ta tes-tes tradisional.Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes pilihan dan tesdengan jawaban singkat dengan jawaban benar atau salah. a. Petunjuk yang tidak jelas . Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan apa yang seharusnya dilakukan. b. Penggunaan kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata atau struktur kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman terhadap pemahaman maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri. c. Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya validitas sebuah tes. d. Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang cukup untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.
  • 6. e. Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas soal. f. Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar . Kualitas yang tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang bersifat untuk mengungkap pengetahuan faktual saja. g. Susunan tes yang jelek. h. Tes terlalu pendek. i. Penyusunan butir tes yang tidak runtut . j. Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C, B, A, dan sebagainya.2. Faktor berfungsinya tes dan prosedur mengajar3. Faktor administrasi dan penskoran Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian terhadap validitas akan memberikan makna yang berbeda.4. Faktor tanggapan siswa Tanggapan siswa yang tidak serius bias anya dijumpai pada saat siswa diminta untuk mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh karena itu berikan angket pada waktu dan kondisi yang tepat .5. Hakikat kelompok dan kriteria Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada sekelompok siswa pada sebuah sekolah dengan kualitas biasa –biasa saja tentu akan berbeda hasilnya jika tes yang sama diberikan pada sekelompok siswa pada sekolah yang favorit. RELIABILITAS Pada bagian di atas telah dibahas mengenai validitas. Validitas adalah sebuah evaluasiterhadap ketepatan interpretasi dan penggunaan hasil asesmen. Validitas mempunyai artisejauh mana ketepatan dan kecermatan alat ukur mampu melakukan fungsi ukurnya. Selainvaliditas, alat ukur yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalahalat ukur yang valid dan reliabel. Hubungan antara validitas dengan reliabilitas dapatdigambarkansebagaimana tembakan yang selalu tepat mengenai sasaran yang diinginkan,seperti ilustrasi pada gambar di bawah ini.
  • 7. Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya(tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes terebutmemberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepadaresponden yang sama. Hasil tes yang tetap atau seandainya berubah maka perubahan i tu tidaksignifikan maka tes tersebut dikatakan reliabel. Oleh karena itu reliabilitas sering disebutdengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya.Seperti diuraikan di atas sebuah alat ukur yang baik harus valid dan reliabel. Namun demikianvaliditas lebih penting dibandingkan dengan reliabilitas. Reliabilitas merupakan penyokongvaliditas. Sebuah alat ukur yang valid selalu reliabel. Akan tetapi alat ukur yang reliabelbelum tentu valid, seperti digambarkan pada ilustrasi di atas. Seperti halnya validitas,reliabilitas juga merupakan tingkatan. Tingkat atau kadar reliabilitas dinyatakan dengankoefisien reliabilitas. Berikut ini akan dibahas macam-macam metode mencari besarnyakoefisien reliabilitas.Metode Mencari Koefisien Reliabilitas1) Metode Tes Ulang (Test Retest Method) Metode ini diterapkan untuk menghindari adanya penyusunan dua seri tes. Teknisnyaadalah sebuah tes yang sama diberikan dua kali kepada responden yang sama dengan jarakwaktu tertentu. Jika hasil tes pertama mempunyai kesejajaran dengan hasil tes yang keduamaka tes tersbut dikatakan reliable. Oleh karena pengujian ini dilakukan terhadap sebuah tesyang diujicobakan dua kali maka sering disebut pula sebagai single-test-double-trial-method.Kelemahan metode ini adalah jika jeda waktu tes terlalu singkat sedangkan soal tes banyakmengungkapkan aspek pengetahuan maka responden cenderung masih mengingat materi yangditeskan, sehingga ada kemungkinan hasil tes yang kedua lebih baik daripada hasil tespertama. Sebaliknya jika jeda waktu tes pertama dengan kedua terlalu lama dikhawatirkanbanyak faktor serta situasi dan kondisi sudah banyak berubah dan mempengaruhi hasil tesyang kedua. Adapun langkah-langkah yang ditempuh pada uji reabilitas ini adalah sebagai berikut : 1. Menyusun sebuah tes yang akan diukur reabilitasnya 2. Mengajukan tes yang sudah disusun tersebut (tahap I) 3. Mennghitung skor hasil tes ( tahap I) 4. Mengjukan ulang tes yang tersusun tersebut ( tahap II)
  • 8. 5. Menghitung reabilitas tes tersebut dengan jalan mengkorelasikan skor tes I dengan skor tes II dengan rumus korelasi produk moment person2) Metode Tes Sejajar (Equivalent) Metode ini mengharuskan adanya dua buah seri soal yang mempunyai kesamaantujuan, bobot soal, tingkat kesukaran, susunan soal, tetpai butir –butir soalnya berbeda.Dengan kata lain, dua buah tes yang digunakan harus sejajar (paralel, equivalen). Koefisienrelibiabilitas diperoleh dengan me ngkorelasikan hasil tes pertama dengan hasil tes kedua.Oleh karena metode ini menggunakan dua buah tes yang berbeda dan diteskan pada siswayang sama maka disebut juga doublé test – double – trial – method. Sudah tentu metode iniakan menambah kerepotan. Inilah kelemahan metode ini. Kelebihan dari metode ini adalahdapat memperbaiki kelemahan pada metode pertama yaitu terhindarnya dari kondisi “siswamasih mengingat materi tes pertama”. Aspek ingatan dan hafalan pada pengerjaan tes pertamatidak terbawa pada saat mengerjakan tes yang kedua.Adapun langkah yang ditempuh adalah : 1) Menyusun dua buah tes yang equivalent 2) Mengajukan kedua buah tes tersebut atau dalam waktu yang brsamaan atau beriringan. 3) Memberikan skor hasil tes yang telah diujikan, disusun dengan memisahkan antara tes A dan tes B. 4) Mencari koofesien stabilitas kedua tes ( A dan B ) dengan jalan mencari korelasinya melalui rumus korelasi product moment.3) Metode Tes Tunggal (Single Test – Single Trial) Metode tes tunggal dilihat dari kepraktisannya lebih praktis dari pada dua metodesebelumnya. Metode ini hanya melakukan sekali tes kepada sekelompok subjek. Dengandemikian tidak perlu menunggu waktu maupun harus mempunyai data dari tes sejenis untukdapat menentukan reliabilitasnya. Koefisien reliabilitas dapat diperoleh dengan caramembelah instrumen menjadi dua, tiga, empat, atau bahkan sebanyak butir yang dimiliki olehinstrumen tersebut. Teknik perhitungannya tergantung pada banyaknya belahan, bentuk, sertasifat alat ukurnya.Adapun langkah-langkah secara umum yang ditempuh untuk mencari reliabilitas tes iniadalah sebagai berikut : 1) Menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila dibelah sama. 2) Mengajukan tes tersebut pada sebuah sampel 3) Menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat dikelompokkan skor ganjil dan genap, dapat pula dikelompokkan skor belahan atas dan skor belahan bawah 4) Mencari reliabilitas setengan tes, dengan jalan mengkorelasikan kedua skor tersebut dengan rumus produck moment 5) Mencari reliabilitas satu tes penuh dengan menggunakan rumus spearman Brown atau rumus lainnya.Beberapa teknik yang sering digunakan untuk menentukan koefisien reliabilitas denganmetode tes tunggal ini antara lain:
  • 9. a) Formula Kuder Richardson (KR20) Formula KR20 dapat diterapkan pada instrumen yang yang mempunyai data skordikotomi dari tes yang seolah -olah dibagi-bagi menjadi belahan sebanyak butir yang dimiliki.Hasil perhitungan dengan rumus KR20 lebih teliti, tetapi perhitungan lebih rumit.Rumus:b) Formula Kuder Richardson (KR21) Formula KR21 lebih sederhana dalam perhitungannya. Kelemahannya adalah kurangteliti dibandingkan dengan KR20. Rumusnya adalah sebagai berikut:Keterangan:r11 = koefisien reliabilitasn = banyaknya butir soal1 = bilangan konstanMt = mean total (rata-rata hitung dari skor total)St2 = varian totalc) Formula Spearman-Brown Formula Spearman-Brown hanya dapat diterapkan pada soal yang mempunyai jumlahbutir genap. Formula ini menggunakan teknik belah dua ( split half method), yaitu soaldibelah menjadi 2 bagian (belahan ganjil dan belahan genap atau belahan kiri dengan belahankanan). Kedua belahan tersebut sejajar.Formulanya adalah sebagai berikut:
  • 10. Keterangan:r11 = koefisien reliabilitasrhh = koefisien korelasi product moment antara skor belahan satudengan skor belahan yang lain1 & 2 = bilangan konstand) Formula Rulon Formula Rulon ini juga dapat diterapkan dengan belah dua ( split half method) sepertihalnya pada formula Spearman -Brown. Hanya saja cara pandannya terhadap reliabilitas berbeda dengan Spearman-Brown. Menurut Rulon reliabilitas dapat dipandang dari adanyaselisih skor yang diperoleh oleh responden pada belahan pertama dengan belahan kedua.Selisih tersebut yang menjadi sumber variasi error sehingga bila dibandingkan dengan v ariasiskor akan dapat menjadi dasar untuk melakukan estimasi reliabilitas tes. Formula Rulonadalah sebagai berikut.Keterangan:r11 = koefisien reliabilitasSd2 = varians perbedaan skor belahanSt2 = varians skor total1 = bilangan konstane) Formula Alpha Formula-formula di atas (Spearman-Brown, KR, Rulon) hanya berlaku untuk soalobjektif yang mempunyai kemungkinan jawaban benar dan salah. Sedangkan untuk soal yangmempunyai gradualitas skor jawaban misalnya pada soal uraian ataupun pada angket ( tessikap) formula yang paling pas adalah dengan menggunakan Formula Alpha. Hal inidimungkinkan karena Formula Alpha mengakomodasi adanya variasi skor dalam setiap butirsoal. Rumus yang digunakan adalah sebagai berikut.
  • 11. Keterangan:r11 = koefisien reliabilitasSi2 = varians skor tiap-tiap butir soalSt2 = varians skor total1 = bilangan konstanf) Formula C. Hoyt Berbeda dengan formula-formula yang lain, C. Hoyt memandang bahwa sebuah tesdapat dipandang sebagai sebuah interaksi faktorial di mana skor-skor tes dianggap sebagaihasil eksperimen. Dalam hal ini, berlaku sebagai faktor Ia dalah subjek (responden)sedangkan faktor II adalah butir soal. Dengan demikian masing-masing sel terdiri atas satusubjek, untuk selanjutnya dapat dicari interaksi antara subjek dengan butir soal. Kelebihanformula ini adalah dapat diterapkan baik pada soal yang mempunyai skor dikotomi 1 dan 0maupun pada soal yang mempunyai variasi skor pada butirnya (tes sikap maupun tes uraian).Rumus yang digunakan adalah sebagai berikut.Keterangan:r11 = koefisien reliabilitasMKe = mean kuadrat interaksi antara subjek dengan butir soalMKs = mean kuadrat antarsubjek1 = bilangan konstang) Formula Flanagan Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya korelasi antarabelahan I dengan belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat deviasi(varians) pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan II, dan jumlahkuadrat deviasi (varians) skor total. Formula yang digunakan adalah sebagai berikut:Keterangan:r11 = koefisien reliabilitasS12 = varians skor belahan 1S22 = varians skor belahan 2St2 = varians skor total2 & 1 = bilangan konstan
  • 12. Faktor-faktor yang mempengaruhi reliabilitas1. Jumlah butir tes Umumnya semakin besar jumlah butir soal tes samakin tinggi pula reliabilitasnya. Halini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyakperilaku yang terukur dengan lebih tepat. Skor skor yang diperoleh tepat dan kemungkinansedikit mengalami penyimpangan (distorsi) oleh adanya faktor -faktor yang sudah biasadikenal dengan sebuah tes yang diberikan atau kurangnya pemahaman terhadap apa yangdiharapkan pada sebuah tes yang diberikan.2. Penyebaran skor Sebagai catatan awal, koefisien reliabilitas secara langsung dipengaruhi olehpenyebaran skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besarpenyebaran skor maka semakin besar pula indeks reliabilitas yang diperoleh. Karena semakinbesar indeks reliabilitas yang dihasilkan ketika individu-individu berada pada posisi yangrelatif sama dalam sebuah kelompok sebuah asesmen dengan asesmen yang lain, hal inisecara alami mengikuti bahwa segala sesuatu yang mengurangi kemungkinan bergeser nyaposisi dalam kelompok juga turut andil dalam memperbesar koefisien reliabilitas. Dalamkasus ini, semakin besar perbedaan skor individu mengurangi kemungkinan pergeseranpososi. Dengan kata lain kesalahan dalam pengukuran kurang berpengaruh terhadap posisirelatif individu ketika perbedaan -perbedaan di antara anggota - anggota kelompok yangbesar. Hal ini terjadi ketika skornya tersebar luas.3. Objektivitas Objektivitas sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yangsama mendapatkan ha sil yang sama. Sebagian besar tes bakat dan tes prestasi standarmempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti pilihan ganda danskor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakintinggi tin gkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya.4. Metode estimasi reliabilitas Saat menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakanuntuk menentukan besarnya koefisien reliabilitas merupakan hal yang penting. Secara umum,besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan untuk estimasireliabilitas. a. Metode tes ulang (Test Retest Method) : mungkin hasilnya lebih besar dibandingkan dengan metode belah dua jika interval waktunya pendek. Koefisien reliabilitas yang dihasilkan menjadi lebih kecil jika interval waktu tesnya ditingkatkan b. Tes sejajar (Equivalent Test) tanpa waktu interval : Koefisien reliabilitas cenderung lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang menggunakan interval waktu singkat. c. Tes Sejajar dengan interval waktu : koefisien menjadi lebih kecil seiring dengan peningkatan interval waktu tes. d. Metode belah dua (Split-half Method ): Metode ini menyediakan sebuah indikasi konsistensi internal tes.
  • 13. Tugas TerstrukturPak Umar Bakri ingin mengetahui a pakah soal ulangan Biologi yang dibuatnya sudah validdan reliabel untuk mengukur hasil belajar materi sistem pernapasan. Untuk keperluan ini, PakUmar Bakri melakukan uji coba pada sejumlah siswa.Hasil uji coba tersebut adalah sebagaiberikut.Pertanyaan:a. Butir soal nomor berapakah yang mempunyai koefisien validitas palingrendah?b. Butir soal nomor berapakah yang mempunyai koefisien validitas palingtinggi?c. Berapakah koefisien reliabilitas tes tersebut jika dihitung dengan formulaSperman-Brown?HUBUNGAN ANTARA VALIDITAS DAN RELIABITAS TES Hubungan Antara Validitas dengan Reliabilitas Umumnya orang berpendapat bahwavaliditas mempunyai hubungan proporsional dengan reliabilitas. Orang menduga bahwasemakin valid suatu tes, semakin reliabel dan sebaliknya. Dugaan itu tidak sepenuhnya salah,tetapi juga tidak sepenuhnya betul (Noeng Muhadjir, 1984:56). Ada kemungkinan hubunganantara validitas reliabilitas itu bersifat independent, bebas satu sama lain dan dapat pulabersifat detrimental. Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internalrendah, tetapi mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogenmungkin sekali mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya denganmenambah item tanpa menambah varians menambah varians dalam faktor umum yang tidakbersangkutan dengan kriteria. Tujuan validitas dan reliabilitas seringkali bersilangan. Bila kita ingin mempunyaisuatu tes reliabel sekaligus valid dengan koefisien tinggi, sering kita mengerjakan pekerjaanyang mempunyai tujuan bersilangan. Reliabilitas maksimal membutuhkan interkorelasi tinggiantar item, sedangkan validitas prediktif yang maksimal memerlukan interkorelasi antar itemrendah. Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkanvaliditas prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlukompromi. Bila kita ingin mempertinggi reliabilitas suatu tes dan sekaligus mempertinggivaliditas, cara yang dapat ditempuh adalah menambah varians faktor umum (Noeng Muhadjir,1984:56-57). Namun jika langkah ini kita ambil, sebaiknya diperhitungkan apakahpenambahan faktor umum ini dapat terjangkau oleh peserta didik. Oleh karena itu perlu dalampenentuan perencanaan, terutama dalam penyusunan kisi-kisi tes, faktor umum yang akandiperbanyak itu diperhitungkan juga jangan terlalu keluar dari program dan proses pendidikansebelumnya.
  • 14. CARA MENINGKATKAN RELIABITITAS TES 1. Mengonsep satu variabel dengan jelas. 2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain. 3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin diperoleh. 4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual. 5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.