Dokumen tersebut merangkum hasil analisis butir soal tes yang terdiri dari 20 pertanyaan. Analisis mencakup daya pembeda butir soal, tingkat kesukaran butir soal, fungsi jawaban pengecoh, dan reliabilitas tes. Secara umum menunjukkan bahwa sebagian besar butir soal memiliki daya pembeda dan tingkat kesukaran yang baik serta jawaban pengecoh yang berfungsi dengan baik. Koefisien reliabilitas tes adalah 0,722 yang
1. 1
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
ANALISIS BUTIR SOAL
Data hasil tes dengan jumlah soal 20 butir dan jumlah responden 25 siswa, analisisnya
meliputi :
A. Daya Pembeda Butir Soal
Daya beda butir soal adalah kemampuan butir soal untuk membedakan antara murid yang
berkemampuan tinggi dengan murid yang memiliki kemampuan rendah. Indeks daya beda
dikategorikan menjadi 3, yaitu :
a. < 0,10 = ditolak
b. 0,10 – 0,29 = direvisi
c. > 0,30 = diterima
Menurut Suharsimi Arikunto, indeks daya beda dikategorikan sebagai berikut:
a. 0,00 – 0,20 = jelek
b. 0,21 – 0,40 = cukup
c. 0,41 – 0,70 = baik
d. 0,71 – 1,00 = baik sekali
Untuk butir soal yang ideal, daya bedanya berkisar antara 0,2 hingga 1,00. Sehingga
apabila ditemukan daya beda butir yang negatif, sebaiknya guru mengganti butir tersebut apabila
hendak dimunculkan dalam tes berikutnya. Karena daya beda negatif memberi pengertian bahwa
kelompok lower (kurang mampu) lebih baik dari pada kelompok upper (paling baik) sebesar
angka negatif yang diperoleh.
TABEL DAYA PEMBEDA
NOMOR
SOAL
Indeks daya beda 3 kategori Indeks daya beda 4 kategori
DAYA
PEMBEDA
KATEGORI
DAYA BEDA
DAYA
PEMBEDA
KATEGORI
DAYA BEDA
1 0,391 DITERIMA 0,391 CUKUP
2 0,251 DIREVISI 0,251 CUKUP
3 0,417 DITERIMA 0,417 BAIK
4 0,269 DIREVISI 0,269 CUKUP
5 0,301 DITERIMA 0,301 CUKUP
2. 2
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
6 0,417 DITERIMA 0,417 BAIK
7 0,251 DIREVISI 0,251 CUKUP
8 0,279 DIREVISI 0,279 CUKUP
9 0,532 DITERIMA 0,532 BAIK
10 0,494 DITERIMA 0,494 BAIK
11 0,348 DITERIMA 0,348 CUKUP
12 0,495 DITERIMA 0,495 BAIK
13 0,448 DITERIMA 0,448 BAIK
14 0,677 DITERIMA 0,677 BAIK
15 0,373 DITERIMA 0,373 CUKUP
16 0,421 DITERIMA 0,421 BAIK
17 0,532 DITERIMA 0,532 BAIK
18 0,306 DITERIMA 0,306 CUKUP
19 0,475 DITERIMA 0,475 BAIK
20 0,339 DITERIMA 0,339 CUKUP
Dari tabel diatas, dapat disimpulkan bahwa :
a. Soal yang dikategorikan dapat diterima yaitu soal nomor 1, 3, 5, 6, 9, 10, 11, 12, 13, 14,
15, 16, 17, 18, 19 dan 20. Dan soal yang dikategorikan baik yaitu soal nomor 3, 6, 9, 10,
12, 13, 14, 16, 17 dan 19.
b. Soal yang dikategorikan perlu direvisi yaitu soal nomor 2, 4, 7 dan 8. Dan soal yang
dikategorikan cukup yaitu soal nomor 1, 2, 4, 5, 7, 8, 11, 15, 18 dan 20.
c. Sedangkan untuk soal yang dikategorikan ditolak dan jelek tidak ditemukan pada hasil
analisis tabel diatas, begitu juga dengan soal yang dikategorikan sangat baik.
B. Tingkat Kesukaran Butir Soal
Dari Prop. Correct juga dapat diketahui indeks tingkat kesukaran soal secara klasikal.
Indeks kesukaran butir soal atau p dinyatakan dengan angka yang yang berada antara 0,00
sampai dengan 1,00. Klasifikasi indeks/ tingkat kesukaran butir soal adalah:
a. Soal Sangat Sukar : p < 0,210 tidak dapat digunakan
b. Soal Sukar : p = 0,210 – 0,400 dapat digunakan
3. 3
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
c. Soal Sedang : p = 0,410 – 0,700 dapat digunakan
d. Soal Mudah : p = 0,710 – 0,900 dapat digunakan
e. Soal Sangat Mudah : p > 0,900 tidak dapat digunakan
Berikut ini data yang menunjukkan hasil indeks/tingkat kesukaran tiap soal pada analisis
iteman yang sudah dilakukan :
TABEL TINGKAT KESUKARAN
No. Soal Prop. Correct Tingkat
Kesukaran
Dapat Digunakan Tidak Dapat
Digunakan
1 0,720 Mudah √
2 0,760 Mudah √
3 0,720 Mudah √
4 0,840 Mudah √
5 0,800 Mudah √
6 0,720 Mudah √
7 0,760 Mudah √
8 0,760 Mudah √
9 0,800 Mudah √
10 0,720 Mudah √
11 0,680 Sedang √
12 0,720 Mudah √
13 0,680 Sedang √
14 0,800 Mudah √
15 0,680 Sedang √
16 0,600 Sedang √
17 0,800 Mudah √
18 0,760 Mudah √
19 0,800 Mudah √
20 0,720 Mudah √
Berdasarkan table tersebut dapat diketahui bahwa soal-soal tersebut dapat digunakan. Jika
dilihat dari rata-rata tingkat kesukaran semua butir soal dalam tes secara klasikal (Mean P), soal-
soal tersebut mempunyai Mean P sebesar 0,744 yang artinya bahwa soal-soal tersebut termasuk
soal yang mudah.
C. Distraktor (Jawaban Pengecoh)
4. 4
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
Setiap tes pilihan ganda memiliki satu pertanyaan serta beberapa pilihan jawaban. Diantara
pilihan jawaban yang ada, hanya satu benar. Selain jawaban yang benar tersebut, adalah jawaban
yang salah. Jawaban yang salah itulah yang dikenal dengan distraktor. Dengan demikian
efektifitas distraktor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes
yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak peserta tes yang
memilih distraktor tersebut, maka distraktor itu dapat menjalankan fungsinya dengan baik.
Apabila proporsi siswa yang memilih pengecoh kurang dari 0,05 maka pengecoh tersebut
harus direvisi dan apabila proporsinya 0,00 ditolak. Untuk mengetahui proporsi siswa yang
memilih pengecoh pada program ITEMAN dapat dilihat pada Prop. Endorsing.
TABEL FUNGSI JAWABAN PENGECOH
NO.
SOAL
KUNCI
JAWABAN
PROPORSI
JAWABAN BENAR
JAWABAN
SALAH
PROPORSI
JAWABAN SALAH
FUNGSI
PENGECOH
1 A 0,72 B 0,12 Berfungsi
C 0,04 Tidak Berfungsi
D 0,04 Tidak Berfungsi
E 0,08 Berfungsi
2 C 0,76 A 0,04 Tidak Berfungsi
B 0,08 Berfungsi
D 0,08 Berfungsi
E 0,04 Tidak Berfungsi
3 B 0,72 A 0,04 Tidak Berfungsi
C 0,08 Berfungsi
D 0,12 Berfungsi
E 0,04 Tidak Berfungsi
4 D 0,84 A 0,04 Tidak Berfungsi
B 0,04 Tidak Berfungsi
C 0,04 Tidak Berfungsi
E 0,04 Tidak Berfungsi
5 E 0,80 A 0,04 Tidak Berfungsi
5. 5
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
B 0,04 Tidak Berfungsi
C 0,04 Tidak Berfungsi
D 0,08 Berfungsi
6 E 0,72 A 0,12 Berfungsi
B 0,04 Tidak Berfungsi
C 0,08 Berfungsi
D 0,04 Tidak Berfungsi
7 D 0,76 A 0,04 Tidak Berfungsi
B 0,08 Berfungsi
C 0,04 Tidak Berfungsi
E 0,08 Berfungsi
8 A 0,76 B 0,08 Berfungsi
C 0,04 Tidak Berfungsi
D 0,08 Berfungsi
E 0,04 Tidak Berfungsi
9 C 0,80 A 0,08 Berfungsi
B 0,04 Tidak Berfungsi
D 0,04 Tidak Berfungsi
E 0,04 Tidak Berfungsi
10 C 0,72 A 0,08 Berfungsi
B 0,12 Berfungsi
D 0,04 Tidak Berfungsi
E 0,04 Tidak Berfungsi
11 B 0,68 A 0,04 Tidak Berfungsi
C 0,12 Berfungsi
D 0,08 Berfungsi
E 0,08 Berfungsi
12 D 0,76 A 0,12 Berfungsi
B 0,04 Tidak Berfungsi
6. 6
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
C 0,04 Tidak Berfungsi
E 0,04 Tidak Berfungsi
13 A 0,68 B 0,16 Berfungsi
C 0,04 Tidak Berfungsi
D 0,08 Berfungsi
E 0,04 Tidak Berfungsi
14 E 0,80 A 0,04 Tidak Berfungsi
B 0,04 Tidak Berfungsi
C 0,04 Tidak Berfungsi
D 0,08 Berfungsi
15 D 0,68 A 0,12 Berfungsi
B 0,04 Tidak Berfungsi
C 0,08 Berfungsi
E 0,08 Berfungsi
16 C 0,60 A 0,08 Berfungsi
B 0,12 Berfungsi
D 0,08 Berfungsi
E 0,12 Berfungsi
17 C 0,80 A 0,04 Tidak Berfungsi
B 0,12 Berfungsi
D 0,04 Tidak Berfungsi
E 0,00 Ditolak
18 B 0,76 A 0,04 Tidak Berfungsi
C 0,08 Berfungsi
D 0,08 Berfungsi
E 0,04 Tidak Berfungsi
19 A 0,80 B 0,00 Ditolak
C 0,12 Berfungsi
D 0,04 Tidak Berfungsi
7. 7
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
E 0,04 Tidak Berfungsi
20 E 0,72 A 0,04 Tidak Berfungsi
B 0,08 Berfungsi
C 0,08 Berfungsi
D 0,08 Berfungsi
Jadi, kesimpulan dari tabel diatas adalah :
a. Kunci Jawaban dan Pengecoh Layak Untuk Digunakan
Artinya daya beda kunci jawaban lebih besar daripada daya beda pengecoh. Dan semua
pengecoh ada yang memilih dan proporsinya lebih dari 0,05. Yang termasuk dalam
kategori ini adalah soal nomor 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18 dan
20.
b. Pengecoh Ditolak
Artinya pengecoh tidak ada yang memilih atau proporsinya 0,00. Yang termasuk dalam
kategori ini adalah pengecoh pada soal nomor 17 (poin E) dan soal nomor 19 (poin B).
c. Kunci Jawaban Digugurkan
Artinya kunci jawaban memiliki daya beda yang lebih rendah dari salah satu daya beda
pengecoh, artinya kunci jawaban perlu direvisi. Tidak ada yang termasuk dalam kategori
ini.
D. Deskripsi Reliabilitas
Sebenarnya tidak terdapat suatu ukuran yang pasti mengenai berapa tinggi koefisien
reliabilitas. Reliabilitas yang baik tergantung pada tujuan atau kegunaan tes. Menurut Remmers
et al. (1960) menyatakan bahwa kebanyakan tes-tes di bidang pendidikan pada umumnya
memiliki koefisien reliabilitas minimal 0,8 untuk populasi yang sesuai. Sedangkan menurut
Nunally (1972) dan Kaplan & Saccuzo, koefisien reliabilitas 0,7 s.d. 0,8 sudah termasuk cukup
tinggi untuk penelitian dasar. Berdasarkan hasil analisis, diperoleh :
Scale Statistics
----------------
Scale: 0
-------
N of Items 20
8. 8
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
N of Examinees 25
Mean 14.880
Variance 11.946
Std. Dev. 3.456
Skew -0.451
Kurtosis -0.137
Minimum 6.000
Maximum 20.000
Median 15.000
Alpha 0.722
SEM 1.821
Mean P 0.744
Mean Item-Tot. 0.401
Mean Biserial 0.549
Tampak bahwa koefisien reliabilitas Alpha sebesar 0.722.
a. < 0.60 = tidak baik
b. 0.61 sampai dengan 0.70 = kurang baik
c. 0.71 sampai dengan 0.80 = baik
d. 0.81 = sangat baik
Jadi, koefisisen reliabilitasnya BAIK.
E. Deskripsi Nilai-nilai Statistik
Di bawah ini adalah data-data hasil
analisis program iteman dari statistik
tes, yaitu :
a. N of Items adalah jumlah butir
soal dalam tes/skala yang ikut
dianalisis.
Dalam hal ini, jumlah soal yang
dianalisis ada 20 butir soal.
b. N of Examinees adalah jumlah
peserta tes (jumlah responden).
Jumlah peserta tes ada sebanyak
25 orang
c. Mean adalah skor rata-rata
peserta tes. Skor rata-rata dari
responden yaitu 14.880
9. 9
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
d. Variance adalah varians dari
distribusi skor peserta tes. Varians
distribusi peserta tes yaitu 11.946
e. Std. Dev. adalah deviasi standar
dari distribusi skor peserta tes.
Standar deviasinya yaitu 3.456
f. Skew adalah kemiringan
distribusi skor peserta tes.
Kemiringan distribusi skor peserta
tes yaitu -0,451
g. Kurtosis adalah puncak distribusi
skor atau keruncingan kurva.
Keruncingan kurvanya yaitu -
0.137
h. Minimum adalah skor terendah
peserta tes. Skor terendah dari
peserta tes yaitu 6.000
i. Maximum adalah skor tertinggi
peserta tes. Skor tertinggi peserta
tes yaitu 20.000
j. Median adalah skor tengah
peserta tes. Nilai tengah dari
pesera tes yaitu 15.000
k. Alpha adalah koefisien reliabilitas
alpha untuk tes/skala tersebut.
Homogenitas tes tersebut adalah
0.722
a. < 0.60 = tidak baik
b. 0.61 sampai dengan 0.70
= kurang baik
c. 0.71 sampai dengan 0.80
= baik
d. > 0.81 = sangat baik
l. SEM adalah kesalahan
pengukuran standar. Kesalahan
pengukuran standar yaitu 1.821
m. Mean P adalah rata-rata tingkat
kesukaran semua butir soal dalam
tessecara klasikal. Rata-rata
tingkat kesukaran semua butir
soal dalam tes yaitu 0.744
n. Mean Item Tot adalah nilai rata-
rata indeks daya pembeda dari
semua soal dalam tes, yang
dihitung dari rata-rata koefisien
point-biserial. Nilai rata-rata
indeks daya pembeda dari
koefisien point biserial yaitu
0.401
o. Mean Beserial adalah juga nilai
rata-rata indeks daya pembeda
dari semua soal dalam tes, yang
dihitung dari rata-rata koefisien
biserial.
Nilai rata-rata indeks pembeda dari
semua soal dari koefisien biserial
yaitu 0.549
10. 10
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
F. Perolehan Skor Setiap Responden
TABEL PEROLEHAN SKOR RESPONDEN
NO. NAMA
RESPONDEN
TOTAL
JAWABAN
BENAR
NO. NAMA
RESPONDEN
TOTAL
JAWABAN
BENAR
1 Aliya 15.00 14 Ninis 20.00
2 Aulia 12.00 15 Fazri 18.00
3 Intan 13.00 16 Rozak 15.00
4 Harry 20.00 17 Ratih 17.00
5 Ahmad 13.00 18 Santi 19.00
6 Ilham 10.00 19 Riyan 13.00
7 Iklas 12.00 20 Mugio 16.00
8 Malia 12.00 21 Mario 17.00
9 Rosia 14.00 22 Yanti 17.00
10 Rijal 20.00 23 Nurul 16.00
11 Fenny 10.00 24 Laila 18.00
12 Ambar 6.00 25 Linda 16.00
13 Annis 13.00 - - -
G. Rangkuman Butir Soal yang Layak Sebagai Bank Soal
Butir soal yang layak sebagai bank soal harus memenuhi kriteria sebagai berikut:
1. Daya pembeda ≥ 0.3
2. Pengecoh berfungsi dengan baik, Prop. Endorsing harus memenuhi ≥ 0.050
3. Daya pembedanya rbis dan rpbis (Biser dan Point Biser) pada kolom Item Statistics bernilai
positif
4. rbis dan rpbis (Biser dan Point Biser) pada alternatif jawaban pengecoh bernilai negatif dengan
daya pembeda tidak lebih besar dari alternatif kunci jawaban.
5. Koefisien reliabilitas alpha > 0.71
Pada soal nomor 1 Tingkat kesukaran soal ini adalah 0,720 (mudah), yakni sebanyak 72%
peserta tes dapat menjawab soal dengan benar. Daya pembedanya, rbis=0,521 dan rpbis=0,391
11. 11
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
menunjukkan keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang pintar (skor
totalnya tinggi) cenderung menjawab benar soal ini dan peserta tes yang kurang pintar cenderung
menjawab salah soal ini. Karena alternatif jawaban A merupakan kunci, maka tanda positif ini
menunjukkan bahwa kunci jawaban sudah berfungsi sebagaimana mestinya. Ditinjau dari
distribusi jawaban yaitu persentase peserta tes merespons alternatif jawaban, tidak semua
pengecoh berfungsi dengan baik. Dapat dilihat pada kolom Prop Endorsing (Pengecoh yang
berfungsi dengan baik jika proporsi jawaban siswa lebih dari 5%), pengecoh yang berfungsi
dengan baik tampak bahwa peserta tes merespons alternatif jawaban B dan E sebanyak 12% dan
8%; sedangkan pengecoh tidak berfungsi dengan baik tampak pada peserta tes yang merespons
alternative jawaban C dan D keduanya 4%. Ditinjau dari daya pembeda masing-masing
pengecoh juga dapat dikatakan berfungsi baik karena rbis atau rpbis untuk alternatif jawaban B,
C, D, dan E seluruhnya bernilai negatif artinya peserta tes yang pintar cenderung tidak memilih
alternatif jawaban itu dan siswa yang kurang pintar cenderung memilih aternatif jawaban
tersebut. Dengan kata lain, peserta tes yang skornya rendah lebih memilih pengecoh sebagai
jawaban yang benar.
Kesimpulan : butir soal nomor 1 sudah cukup baik dan dapat digunakan. Sama halnya dengan
butir soal nomor 3, 4, 7, 8, 10, 12, 13, 14, 17, 18 dan 20 sudah cukup baik dan dapat digunakan
karena memiliki analisis butir soal yang sama dengan butir soal nomor 1. Akan tetapi tingkat
kesukaran pada butir soal tersebut ada yang berbeda, yaitu butir soal nomor 13 termasuk dalam
kategori soal yang sedang (0,30 sampai dengan 0,70).
Sedangkan pada soal nomor 2, tingkat kesukarannya adalah 0,760 (mudah), sebanyak
76% peserta tes dapat menjawab soal tersebut dengan benar. Daya pembedanya, rbis=0,345 dan
rpbis=0,251 menunjukkan keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang
pintar cenderung menjawab benar soal ini dan peserta tes yang kurang pintar cenderung
menjawab salah. Karena alternatif jawaban C merupakan kunci, maka tanda positif ini
menunjukkan bahwa kunci jawaban sudah berfungsi sebagaimana mestinya. Dengan demikian
soal ini termasuk kategori soal yang cukup baik dan dapat digunakan walaupun ditinjau dari
pengecohnya tampak bahwa alternatif jawaban B, daya pembedanya juga bernilai positif dengan
sebanyak 8% peserta tes merespons alternatif jawaban B. Pada soal ini tidak ada peringatan
untuk mengecek kembali, karena besarnya nilai daya pembeda pada kunci jawaban C tetap lebih
12. 12
Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A
besar dari alternative jawaban B, sehingga butir soal ini tetap bisa diterima dan baik untuk
digunakan.
Kesimpulan : butir soal nomor 2 sudah cukup baik dan dapat digunakan. Sama halnya dengan
butir soal nomor 5, 6, 9, 11, 15, 16 dan 19 sudah cukup baik dan dapat digunakan karena
memiliki analisis butir soal yang sama dengan butir soal nomor 2. Akan tetapi tingkat kesukaran
pada butir soal tersebut berbeda, yaitu butir soal nomor 11, 15, dan 16 termasuk soal sedang
(0,30 sampai dengan 0,70)