BAHAN SOSIALISASI PPDB SMA-SMK NEGERI DISDIKSU TP. 2024-2025 REVISI.pptx
RELIABILITAS BAB 6
1. BAB 6
RELIABILITAS
KELOMPOK 2
AHMAD KHOIRUL HUDA 120
IKA WAHYU KURNIA 14010664001
YUMNA ULAYYA CAHYANI 14010664003
ISNANI CAHYANINGTYAS 14010664005
HARUM KEMBANG M J 14010664007
M YOGA ADI WIBAWA 14010664010
2. BAGAN BAB
LOGIKA ANALISIS RELIABILITAS
• Teori yang Mendasari Analisis Reliabilitas
• Mengukur Reliabilitas
• Faktor-faktor yang Mempengaruhi Tes
Reliabilitas
- Hal-hal yang Membuat Hasil Tidak Konsisten
- Faktor-faktor Sampling
- Faktor-faktor Statistik
3. MACAM-MACAM ANALISIS RELIABILITAS
• Menggunakan 2 Set Penilaian
- Reliabilitas Test-Retest
- Reliabilitas Alternate-Form
• Menggunakan 1 Set Penilaian
- Reliabilitas Split-Half
- Konsistensi Internal Koefisien Lain
4. MENERAPKAN INFORMASI RELIABILITAS
• Pengukuran Standar Kesalahan
• Interval-interval Kepercayaan
• Megevaluasi Perbedaan Antara 2 Nilai
• Mengevaluasi Nilai Gabungan atau Rata-
Rata
STANDAR-STANDAR RELIABILITAS
• Menaksirkan Reliabilitas
• Meningkatkan Reliabilitas
5. LOGIKA ANALISIS RELIABILITAS
Terdapat 3 macam analisis reliabilitas, masing-masing berfokus pada
tipe yang berbeda pada penampilan konsisten. Sebuah tes yang
reliabel yaitu jika seseorang akan mendapat nilai yang sama jika :
1. Diuji pada hari yang berbeda (test-retest reliabilitas)
2. Diuji dengan 2 versi yang berbeda (alternate-form reliabilitas)
3. Diuji dengan subset yang berbeda dari pertanyaan pada tes
(internal consistency or homogenity)
Pada semua kasus, reliabilitas direpresentasikan secara statistik
sebagai sebuah korelasi yang disebut dengan koefisien reliabilitas.
Reliabilitas tes sangat penting karena jika nilai orang-orang dirubah
antara pengujian-pengujian atau versi satu ke versi lainnya dari tes, kita
dapat menyimpulkan bahwa perbedaan-perbedaan menggambarkan
perubahan-perubahan nyata pada pengetahuan atau karakteristik
mereka.
6. TEORI YANG MENDASARI ANALISIS
RELIABILITAS
Analisis reliabilitas beranggapan bahwa nilai tes
mencerminkan pengaruh dari 2 faktor :
1. Karakteristik stabil dari individu (disebut karakteristik
sebenarnya dari individu)
2. Segi kesempatan dari individu atau situasi (disebut
kesalahan pengukuran acak)
Hubungan antara komponen-komponen tersebut di
representasikan secara matematis sebagai berikut
X = T + E
yang mana
X = nilai tes seseorang (nilai mentah)
T= karakteristik stabil atau pengetahuan seseorang (nilai
sebenarnya)
E = kesempatan (nilai salah)
7. Kita juga dapat menggunakan persamaan untuk
menentukan proporsi atau presentase dari nilai
tes yang mencerminkan masing-masing faktor :
= proporsi dari nilai tes mencerminkan
seseorang sebenarnya (stabil)
pengetahuan atau karakteristik
= proporsi dari nilai skor mencerminkan
kesalahan acak (kesempatan kejadian)
8. Tes reliabel adalah salah satu yang mana proporsi lebih banyak
dari varians nilai tes diakibatkan oleh perbedaan pada nilai
sebenarnya. Perbedaan sebenarnya pada pengetahuan atau
karakteristik pengambil tes. Hal ini dapat di representasikan
sebagai :
>
Perbedaan reliabel antara orang-orang pada nilai tes adalah
perbedaan yang nyata kepada pengetahuan sebenarnya atau
karakteristik. Ini berarti bahwa reliabilitas dari tes didefinisikan
secara matematis sebagai
9. MENGUKUR RELIABILITAS
Dalam bentuk yang paling sederhana, analisis kemampuan
berkorelasi kinerja pada dua ukuran skala interval dan
menggunakan korelasi yang menunjukkan sejauh mana
perbedaan skor yang benar. Meskipun kami menggunakan rumus
sama untuk menghitung koefisien korelasi, dalam analisis
reliabilitas disebut koefisien reliabilitas (rxx) dan ditafsirkan
sebagai
Rxx =
10. Tes relabilitas dipengaruhi oleh faktor yang
membuat kesalahan dalam proses pengukuran.
Namun kemampuan juga dipengaruhi oleh
variabel lain seperti panjang tes dan variabilitas
skor tes. Faktor-faktor yang dapat
mempengaruhi uji reliabilitas dapat
dikelompokkan menjadi beberapa kategori :
faktor menghasilkan kinerja yang tidak
konsisten, faktor contoh, dan faktor statistik.
11. FAKTOR-FAKTOR YANG
MEMPENGARUHI TES RELIABILITAS
1. KEJADIAN-KEJADIAN YANG MEMBUAT HASIL TIDAK
SEMPURNA
Salah satu alasan untuk koefisien reliabilitas rendah adalah
pengambil tes tidak tampil konsisten pada setiap masing
masing tes yang dipelajari.
Disamping itu, hasil yang tidak konsisten dapat
menggambarkan perubahan pada kesalahan nilai, akibat
dari kesalahan acak. Perubahan pada kesalahan nilai dapat
dihasilkan dari perbedaan kesempatan pengambil tes,
sebuah faktor yang mana pengambil tes tidak memiliki
kontrol. Perbedaan kesempatan dihasilkan dari kejadian-
kejadian seperti sakit, tidak dapat konsentrasi, menebak,
salah membaca pertanyaan tes atau mengingat pertanyaan
dari perintah sebelumnya.
12. 2. FAKTOR-FAKTOR SAMPLING
Tes mengevaluasi hanya sampel pengetahuan
atau karakteristik pengambil tes. kecukupan
prosedur sampling yang digunakan untuk
mengembangkan tes akan mempengaruhi
reliabilitas tes.
13. 3. FAKTOR-FAKTOR STATISTIK
Jangkauan dan tingkat variabilitas dari hasil tes
juga mempengaruhi uji reliabilitas. sebenarnya,
rentang nilai ujian dan variabilitas
mempengaruhi nilai koefisien korelasi. ketika
rentang skor tes dibatasi, korelasi dihitung
antara skor menurun. distribusi skor tes dengan
rentang yang lebih panjang biasanya
menghasilkan koefisien korelasi yang lebih
tinggi, sebab menggambarkan variabel dengan
korelasi yang positif yang tinggi
14. MACAM-MACAM ANALISIS
RELIABILITAS
1. MENGGUNAKAN DUA SET NILAI
ada dua jenis analisis reliabilitas menggunakan dua set
nilai : test-retest dan alternatif-form. masing-masing
membahas hal yang berbeda dalam reliabilitas dan
melibatkan skenario pengujian yang berbeda. Pada
kenyataannya, itu adalah mungkin bahwa tes tertentu
akan dievaluasi dua arah. tergantung pada desain dan
tujuan. jika tes ini dirancang untuk diberikan lebih dari
sekali, reliabilitas test-retest adalah penting. jika tes ini
dirancang dalam dua bentuk yang setara, reliabilitas
alternative-form adalah yang penting dalam kedua kasus.
15. • Reliabilitas Test-Retest
Reliabilitas test-retest adalah indeks stabilitas
nilai tes. Digunakan untuk mengevaluasi
kesalahan yang terkait dengan pemberian tes
pada dua waktu yang berbeda. Tes yang
digunakan untuk pengujian dan pengujian ulang
biasanya dirancang untuk mengukur
karakteristik. reliabilitas test-retest juga dapat
digunakan untuk mendukung hipotesis
penelitian.
16. prosedur untuk menentukan reliabilitas test-
retest adalah cukup sederhana. tes diberikan
kepada sekelompok orang dan kemudian lagi
pada umur tertentu setelah jangka waktu yang
tepat.
17. • Reliabilitas Alternative-Form
Reliabilitas alternative form digunakan untuk
mengevaluasi sejauh mana dua bentuk yang berbeda
mengukur pengetahuan atau karakteristik yang sama.
Reliabilitas alternative-form memiliki satu aplikasi yang
jelas : memastikan bahwa yang berbeda forms dari tes
sebenarnya setara.
prosedur untuk menentukan reliabilitas alternative-form
adalah lurus kedepan. dua bentuk setara dengan tes yang
dikembangkan dengan memilih pertanyaan dari bentuk
yang sama, konten , dan tingkat kesulitan. dua bentuk
yang diadministrasikan pada saat yang sama , salah satu
mengikuti yang lain, atau setelah pilihan interval waktu
yang relatif singkat.
18. 2. MENGGUNAKAN SATU SET NILAI
Beberapa tes tidak memiliki bentuk alternatif dan
diadministrasikan hanya satu. Namun reliabilitas tes ini masih
penting. Kami akan dapat menyimpulkan bahwa perbedaan
antara orang-orang dalam skor ini mencerminkan perbedaan
benar dalam pengetahuan atau karakteristik mereka dan oleh
karena itu, untuk menyimpulkan bahwa skor mereka pada tes ini
adalah refleksi umumnya akurat dari apa yang mereka ketahui
atau apa yang mereka sukai .Dalam kata lain , kami ingin bisa
generalisasi dari kinerja mereka pada tes ini untuk kinerja
mereka pada ukuran lain dari domain yang sama. Pendekatan
khusus ini untuk memperkirakan keandalan tes yang disebut
konsistensi internal atau pendekatan homogenoity. Jika tes
secara internal konsisten, semua soal tes sebenarnya menekan
daerah yang sama pengetahuan atau karakteristik pribadi.
Demikian juga, barang yang bisa dianggap sebagai homogen,
semua menarik dari domain yang sama
19. • Reliabilitas Split-Half
Reliabilitas Split-Half memperlakukan administrasi tes
tunggal seperti administrasi simultan dari dua bentuk
alternatif. Tes ini diberikan kepada sekelompok orang dan
soal tes kemudian dibagi menjadi dua setengah tes. total
sekelompok orang dan soal tes dihitung untuk setiap
orang, dan dua distribusi skor setengah-test dibandingkan
dengan menggunakan rumus korelasi tradisional.
Ada banyak cara untuk membagi tes menjadi dua bagian.
Teknik yang paling umum adalah untuk membagi tes
menjadi barang ganjil dan genap. Setelah menyelesaikan
tes, skor total masing-masing individu dipecah menjadi
dua parsial Rata-satu yang mewakili kinerja pada
pertanyaan nomor ganjil, skor-satu parsial mewakili
kinerja pada pertanyaan nomor ganjil.
20. • Koefisien konsistensi internal lainnya
Meskipun koefisien split-setengah tradisional
diidentifikasi sebagai ukuran konsistensi internal, itu tidak
selalu ukuran terbaik. Tes internal konsisten adalah
homogen-semua barang yang menarik dari domain yang
sama dan karena itu mengukur karakteristik tes-taker
yang sama. Dalam split-setengah analisis, kami
membandingkan kinerja uji pengambil 'pada dua
himpunan bagian dari item. Pada intinya, kita
menentukan apakah atau tidak dua himpunan bagian
pada item yang diambil dari domain yang sama. estimasi
terbaik konsistensi internal tes ini akan membandingkan
kinerja pada setiap item untuk kinerja pada item aech
untuk kinerja pada semua barang-barang lainnya.
21. Sebaliknya yang berfokus pada satu sepasang
setengah-tes, itu akan mengambil semua
kemungkinan perpecahan membagi menjadi
pertimbangan-proses yang jauh lebih ketat.
Salah satu metode akan menghasilkan semua
bagian perpecahan kemungkinan tes,
menghitung koefisien split-setengah untuk aech,
dan menentukan rata-rata dari mereka
koefisien.
22. MENERAPKAN INFORMASI RELIABILITAS
• Pengukuran Standar Kesalahan
Analisis reliabilitas untuk menentukan sejauh
mana kesalahan pengukuran dalam tes. Alasan
utama pengguanaan analisis reliabilitas adalah
menentukan tingkat kesalahan pengukuran yang
membawa ke dua kesimpulan tentang nilai ujian.
Pertama, skor tes harus selalu dilihat sebagai
perkiraan pengetahuan atau karakteristik individu.
Kedua, Keputusan berdasarkan nilai ujian harus
selalu mempertimbangkan kemungkinan variasi
kesempatan tersebut.
23. • Kesalahan standar pengukuran
• Setiap set nilai tes memiliki standard error ukura
sm). SEM merupakan indeks jumlah rata-rata kes
dalam skor tes.SEM didefinisikan sebagai (1) stan
dari skor kesalahan, atau (2) standar deviasi dari
sekitar skor benar. Ini sebenarnya adalah dua ca
berbeda untuk mengatakan hal yang sama.SEM
dibuat dalam kontek variabel dan skala raw skor.
SEM or SM = (𝜎 𝑥) 1 − 𝑟𝑥𝑥
24. • Interval terpercaya
• Interval yang berguna untuk mengubah tes
individu dengan jarak skor sesungguhnya yang
terlampau jauh. Rumus umum untuk
membangun interval kepercayaan, oleh
karena itu,
X±(z-score)(sm)
• Dimana
X + (z-score)(sm) = batas atas interval
X - (z-score)(sm) = batas bawah interval
25. MENGEVALUASI PERBEDAAN ANTARA
DUA SKOR
LATIHAN 6.8 KEYAKINAN INTERVAL
Menggunakan jawaban Anda dari Praktek Box 6.7, menghitung dan
menginterpretasikan interval kepercayaan 68% dan 95% untuk rata-rata setiap tes
dievaluasi. Memeriksa jawaban Anda terhadap orang-orang di akhir buku dan
membaca ulang bagian yang diperlukan.
26. Lanjutan
• Jika perbedaan keandalan kurang dari keandalan
tersebut, SEM dari perbedaan antara dua nilai ha
besar maka tes SEM itu baik . Untuk mengevalua
perbedaan antara dua nilai tes, mulai dengan me
SEM dari perbedaan. SEM dari perbedaan dapat
diperkirakan dengan rumus
SEMdif =
(𝐒𝐄𝐌 𝒕𝒆𝒔𝒕𝟏)
𝟐
+(𝑺𝑬𝑴 𝒕𝒆𝒔𝒕𝟐)
𝟐
• Pada dasarnya, SEM dari perbedaan adalah stan
dari himpunan nilai perbedaan yang mungkin bis
27. Tabel 6.10 menggambarkan penggunaan prosedur ini untuk
mengevaluasi kinerja siswa dalam merebut kembali pada ujian.
LATIHAN 6.9 Evaluasi dua Skor Berbeda
Menggunakan informasi dari analisis tes-tes ulang dalam Praktek
Box 6.2, mengevaluasi perbedaan antara skor Orang A pada dua administrasi
tes (skor = 5 dan 4). Lakukan hal yang sama untuk skor Orang C pada dua
bentuk dianalisis dalam Praktek Kotak 6.3 (skor = 4 dan 6). Bandingkan
jawaban Anda dengan jawaban di akhir buku ini. Membaca ulang bagian
yang diperlukan.
28. MENGEVALUASI KOMPOSISI ATAU RATA-RATA
SKOR
• Dalam konteks tertentu, seseorang dievaluasi tidak
skor tes tunggal, tetapi atas dasar serangkaian tes.
semua nilai tes masuk ke perhitungan akhir hal ini
melibatkan kesalahan pengukuran, total atau rata
didefinisikan di mana tingkat sebenarnya dari letak
ide yang baik untuk menghitung interval kepercaya
sekitar jumlah atau rata-rata nilai sebelum memut
pada nilai akhir.
Untuk melakukan ini, Anda harus menghitung SEM d
atau rata-rata skor. Rumus untuk SEM dari skor total
rata adalah
SEM =
𝝈𝒙
29.
30. STANDAR UNTUK RELIABILITAS
• ESTIMASI RELIABILITAS
Prosedur tes dapat membutuhkan banyak waktu. Hal ini
dimungkinkan, untuk memperkirakan keandalan dan / atau
tes SEM berdasarkan parameter seperti jumlah item, uji
mean, dan standar deviasi tes. Uji reliabilitas dapat
diperkirakan dari informasi dalam Tabel 6.13 setelah Anda
menghitung tes dan standar deviasi. SEM dapat
diperkirakan dari informasi dalam Tabel 6.14
32. • Rumus bernubuat spearman-brown menunjukkan b
banyak keandalan tes akan meningkat dengan memp
tes, dengan asumsi bahwa item baru hanya sebagai b
buruk) sebagai item asli.
New rxx =
(𝑵)(𝒄𝒖𝒓𝒓𝒆𝒏𝒕 𝐫𝐱𝐱
)
𝟏+ 𝑵−𝟏 (𝒄𝒖𝒓𝒓𝒆𝒏𝒕 𝒓𝒙𝒙)
• Di mana N adalah faktor dengan uji yang panjang me
adalah rumus yang sama yang digunakan untuk mem
koefisien split-setengah. Dalam hal ini, N = 2 karena
menentukan keandalan tes dua kali selama dua sete
dianalisis di split-setengah perhitungan. Namun, form
dapat digunakan untuk mengetahui pengaruh tiga ka
33. • Rumus Spearman-Brown juga dapat digunakan untuk m
berapa banyak tes yang harus diperpanjang untuk men
tingkat yang diinginkan keandalan, mengingat keandala
Perhitungan ini lebih mudah jika formula diubah sebag
N =
𝒅𝒆𝒔𝒊𝒓𝒆𝒅 𝒓𝒙𝒙 (𝟏−𝒄𝒖𝒓𝒓𝒆𝒏𝒕 𝒓𝒙𝒙)
(𝒄𝒖𝒓𝒓𝒆𝒏𝒕 𝒓𝒙𝒙)(𝟏−𝒅𝒆𝒔𝒊𝒓𝒆𝒅 𝒓𝒙𝒙)
• Versi kedua dari rumus dapat digunakan dalam
1. Untuk menunjukkan faktor dengan panjang tes tu
ditingkatkan untuk mencapai tingkat tertentu
2. Untuk menunjukkan jumlah tes panjang te
kehandalan yang dibutuhkan untuk skor keseluruhan (
pada semua tes ini) untuk memiliki tingkat yang
keandalan.