Teori tes klasik berfokus pada skor murni dan asumsi bahwa skor tampak merupakan penjumlahan skor murni dan error. Teori ini menganalisis reliabilitas dan validitas dengan berbagai teknik seperti test-retest, bentuk paralel, dan konsistensi internal.
2. - Teori klasik atau biasa disebut true score theory
- Fokus kajian teori tes klasik yang ingin melihat nilai skor murni dari skor
tampak yang diperoleh
- Diperkenalkan oleh Charles Spearman (1904)
- CTT dikembangkan dengan menggabungkan konsep erorr dan korelasi
(Salkind, 2007)
3. - Teori klasik -> pendekatan deterministik -> fokus pada skor total
- X = T + E
- T dan E adalah variable latent
- Teori tes klasik bekerja pada tataran skor tampak dengan menggunakan
model linier
4. Asumsi Tes Klasik
Hubungan antara skor tampak (X), skor murni (T) dan eror (E) adalah aditif. Skor
X merupakan akumulasi T dan E
5. Asumsi Tes Klasik
Nilai skor murni adalah nilai harapan dari X. Karena besar skor murni diasumsikan
tetap dalam setiap pengukuran, maka besar varians skor tampak akan tergantung
pada variasi eror pengukuran.
6. Asumsi Tes Klasik
Tidak ada korelasi antara error pengukuran dengan skor murni. Distribusi eror dan
skor murni independen
7. Asumsi Tes Klasik
Jika e1 = error Test 1, dan e2 = error test 2, maka distribusi error kedua tes tidak
berkorelasi
9. Teori Reliabilitas & Error Pengukuran
- Asumsi klasik X = T + E
- Semakin besar porsi varians error maka semakin tidak reliabel dan
sebaliknya
- Koefisien reliabilitas =
- Variabilitas skor individual dipengaruhi oleh (2); pertama, varians dari skor T
itu sendiri dan kedua oleh varians error
- Dapat disimpulkan bahwa reliabilitas yang tinggi memang dikarenakan
adanya varians T, dan rendahnya reliabilitas disebabkan oleh varians error
pengukuran
10. Beberapa interpretasi Reliabilitas (Allen & Yen, 1979)
- Interpretasi 1
Prr` = adalah korelasi antar-skor tampak pada dua tes yang paralel
11. Beberapa interpretasi Reliabilitas (Allen & Yen, 1979)
- Interpretasi 2
= besarnya proporsi varians X yang dijelaskan oleh hubungan
liniernya
dengan X`
12. Beberapa interpretasi Reliabilitas (Allen & Yen, 1979)
- Interpretasi 3 - varians T yang tercermin pada varians X. Reliabilitas yang
semakin mendekati 1 maka akan semakin mendekati varians X = varians T.
Bila makin jauh berarti varians X mengandung error
=
13. Beberapa interpretasi Reliabilitas (Allen & Yen, 1979)
- Interpretasi 4 - korelasi X dan T akan selalu lebih tinggi dari koefisien
reliabilitas ( 0 - 1,0) atau korelasi dengan variabel lain (Y)
(PR)
=
14. Beberapa interpretasi Reliabilitas (Allen & Yen, 1979)
- Interpretasi 5 - Semakin tinggi korelasi X dan E semakin kecil nilai reliabilitas,
lebih jauh varians X yang mencerminkan E dapat dilihat dari nilai koefisien
reliabilitas
= 1 - S
16. Reliabilitas
- Berbagai macam teknik mendapatkan reliabilitas
1. Test - retest
2. Parallel forms
3. Single trial administration
17. Test-re(Test)
- Test diberikan dua kali pada sampel ukur yang
sama dalam tenggang waktu tertentu
- Nilai reliabilitas : 0.707 -> stability over time
- Bila dicermati ada perubahan skor, walau kecil
namun mempengaruhi koefisien reliabilitas
- Perubahan yg tidak seragam = eror random
Subjek X1 X2
Orang 1 15 16
Orang 2 15 7
Orang 3 9 8
Orang 4 5 9
Orang 5 5 14
Orang 6 11 12
Orang 7 11 9
Orang 8 10 7
Orang 9 12 5
Orang 10 5 8
Orang 11 7 7
Orang 12 15 16
Orang 13 15 7
Orang 14 9 8
Orang 15 5 9
Orang 16 5 14
Orang 17 11 12
Orang 18 11 9
Orang 19 10 7
Orang 20 12 5
Orang 21 5 8
Orang 22 7 7
18. Bentuk Paralel
- Menggabungkan dua test paralel menjadi satu
kesatuan test
- Meminimalisir carry-over effect
- Bila eror pada test-retest bisa karena tenggang
waktu, pada bentuk paralel bisa karena faktor test itu
sendiri atau sampel
- Paralel = menghasilkan skor murni yg sama
- Cek paralelitas = mean, varians, kesetaraan
koefisien korelasi thd ukuran lain
Subjek X X’
Orang 1 125 111
Orang 2 117 118
Orang 3 120 117
Orang 4 122 100
Orang 5 100 103
Orang 6 100 102
Orang 7 111 99
Orang 8 100 107
Orang 9 115 110
Orang 10 110 108
Orang 11 125 113
Orang 12 125 111
Orang 13 117 118
Orang 14 120 117
Orang 15 122 100
Orang 16 100 103
Orang 17 100 102
Orang 18 111 99
Orang 19 100 107
Orang 20 115 110
Orang 21 110 108
Orang 22 125 103
19. Single Trial - Internal Consistency
- Estimasi reliabilitas dengan membagi test ke dalam beberapa bagian
- Menguji konsistensi item dalam tes sebagai indikasi reliabilitas
- Pembelahan tes perlu mempertimbangkan kesamaan karakteristik item
- Pemilihan cara tergantung pada blueprint test, jumlah dan karakteristik item,
sifat dan fungsi test (power or speed test) dsb
- Apapun caranya tujuannya satu: mendapatkan belahan yg setara
- Beberapa cara pembelahan tes: random, ganjil-genap, matched-random
subsets
20. Single Trial - Internal Consistency
- Beberapa cara pembelahan tes: random, ganjil-genap, matched-random
subsets.
- Random = item harus homogen (konten), daya diskriminasi, tingkat kesulitan
dan test yang mengukur kemampuan (Azwar, 2014)
- Bila test terdiri dari beberapa aspek, randomisasi dilakukan pada tiap aspek
untuk sebaran yang merata
- Ganjil-genap = belahan 1 (1,3,5,7 dst) belaha 2 (2,4,6,8, dst). Dibagi menjadi
3 bagian = Belahan 1 (1,4,7,10 dst) belahan 2 (2,5,8,11, dst) belahan 3
(3,6,9,12, dst)
- matched-random subsets (Gulliksen, 1950) = untuk test kemampuan, bila
indeks kesukaran diketahui
21. Single Trial - Internal Consistency
- Download data set https://rb.gy/jzst8
26. Single Trial - Internal Consistency
Formula Kuder Richardson (KR-20)
27. Single Trial - Internal Consistency
Formula Kuder Richardson (KR-21)
28. Single Trial - Internal Consistency (tidak sama panjang)
Formula Feldt
29. Single Trial - Internal Consistency (tiga belahan)
Formula Kristof
30. Validitas
- Validitas alat ukur kaitannya pada apa yang menjadi tujuan ukur dan kualitas
hasil ukur yang dihasilkan oleh suatu alat ukur (Anastasi & Urbina, 1997)
- Masih ingat, bahwa, yang reliabel itu belum tentu valid, tapi bila valid maka
sudah tentu itu reliabel
- Uji reliabilitas hanya menguji konsistensi bukan tentang apa yang diukur
(Crocker & Algina, 1986)
- Namun sebuah tes tidak bisa disebut valid bila tidak reliabel.
- Jadi reliabilitas memang penting tapi tidak cukup
32. Validitas
- Dalam teori tes klasik, validitas merujuk pada seberapa jauh atau dekat nilai
X terhadap T
- Semakin dekat X ke T, E semakin kecil, artinya makin valid
- Tiga prosedur pengujian validitas: content validity, criterion-related validity
dan construct validity
33. Content Validity
- Terkait pengujian kualitas item dalam suatu tes
- Menilai sejauh mana keterwakilan indikator keperilakuan dari suatu atribut
oleh item
- Validasi isi merupakan prosedur yang dilakukan pada tahapan awal
pengembangan alat ukur
- Prosedur validasi melalui penilaian (judgement) ahli
34. Content Validity
- Semakin banyak judgement semakin meningkatkan objektifitas penilaian
- Hasil penilaian dapat dihitung melalui formula Aiken’s V (Aiken, 1985)
lo = angka penilaian validitas terendah
C = angka validitas tertinggi
r = angka yang diberikan penilai
S = r - lo
35. Content Validity
- Prosedur alternatif : CVR (Content Validity Ratio) (Lawshe, 1975)
- Penentuan CVR dilakukan oleh SME (Subject Matter Experts) yang menilai apakah suatu item
merupakan esensi untuk operasionaliasi konstrak teoritik
- Rumus:
ne = jumlah SME yang menilai item adalah esensial
n = jumlah SME total
36. Criterion Validity
- Validitas kriteria menunjukkan efektifitas suatu alat ukur terkait fungsi
prediktifnya terhadap kemampuan seseorang (Anastasi & Urbina, 1997)
- Kriteria yang dimaksud bisa berupa kriteria yang diperoleh dalam jangka
waktu tertentu atau dalam waktu yang sama
- Ada 2 jenis, validitas konkuren dan validitas prediktif
- Validitas konkuren = kriteria pembanding tidak memerlukan waktu lama
- Validitas prediktif = kriteria pembanding diperoleh dalam jangka waktu
tertentu.
- Contoh?
37. Construct Validity
- Validitas konstruk memastikan bahwa ada kesesuaian antara konstruk teoritik
dengan konstruk data hasil tes
- Validitas konstruk bisa dikatakan validitas yang dinamis seiring
perkembangan teori sebagai atribut yang diukur
- Prosedur validitas konstruk: multitrait-multimethod, confirmatory factor
analysis hingga Structural Equation Modelling (SEM)
38. Construct Validity: Multitrait-multimethod (Campbell &
Fiske, 1959)
- Prosedur pengajuan validitas dengan mengkorelasikan alat ukur yang
mengukur trait yang sama namun metodenya berbeda, serta
mengkorelasikan trait yang berbeda dengan metode yang sama.
- Dari cara ini dapat disimpulkan ada 2 jenis: validitas konvergen dan validitas
diskriminan
39.
40. Construct Validity: Analisis Faktor
- Melalui prosedur CFA (Confirmatory Factor Analysis)
- Analisis faktor merupakan sekumpulan prosedur matematik yang kompleks
guna menganalisi saling hubungan di antara variabel dan menjelaskan
hubungan tersebut dalam bentuk kelompok variabel yang terbatas yang
disebut faktor
42. Construct Validity: Analisis Faktor
- Analisis faktor adalah prosedur untuk mengidentifikasi aitem atau variabel
berdasarkan kemiripannya. Kemiripan tersebut ditunjukkan dengan nilai
korelasi yang tinggi. Item yang memiliki korelasi yang tinggi akan membentuk
satu kerumunan faktor
- Konstrak empirik dan konstriak laten
- Item adalah konstrak empirik karena langsung diperoleh dari skor empirik,
faktor adalah konstrak laten karena tidak ada data empirik yang menunjukkan
nilai faktor tersebut
- Faktor = buatan peneliti -> item dgn interkorelasi tinggi
- Peneliti merasionalisasi sepereangkat item tsb, memberi label utk mereka
44. Construct Validity: Analisis Faktor
- Analisis faktor memungkinkan peneliti untuk
1) menguji ketepatan model (goodness of fit test) faktor yang terbentuk
dari item-item alat ukur
2) menguji kesetaraan unit pengukuran antar item,
3) menguji reliabilitas item-item pada tiap faktor yang diukur,
4) menguji adanya invarian aitem pada populasi.
- Jenis Analisis Faktor = EFA, CFA, IFA