Analisis butir soal pilihan ganda matematika wajib kelas XII IPA Penilaian Tengah Semester T.A. 2019-2020 dibuat dengan menggunakan perangkat lunak IBM SPSS Statistics 23 berdasarkan pada uji validitas, uji reliabilitas, uji tingkat kesukaran, dan ujian daya pembeda.
1. 1hirwanto.math@gmail.com Analisis Butir Soal PG
ANALISIS BUTIR SOAL PILIHAN GANDA MATEMATIKA WAJIB KELAS XII IPA
PENILAIAN TENGAH SEMESTER GANJIL
TAHUN AJARAN 2019/2020
Oleh : Hirwanto
SMA Islam Nurul Fikri Boarding School
ABSTRAKS
Analisis butir soal merupakan satu langkah penting yang harus dilakukan guru setelah guru
memberikan suatu evaluasi tes hasil belajar berupa Penilaian Tengah Semester(PTS) khususnya
pada pembelajaran matematika wajib yang diujikan meliputi materi integral fungsi aljabar dan
dimensi tiga. Melalui analisis tersebut, guru akan dapat mengetahui kelebihan dan kelemahan
kualitas soal yang dibuatnya. Ada 4 pokok penting dari analisis butir soal yaitu (1) dapat
mengetahui tara kesukaran soal dengan menfungsikan beberapa distractor, (2) dapat
menentukan daya pembeda soal yang dapat membedakan kelompok peserta didik yang pandai
dan yang kurang pandai, (3) dapat mengetahui penyebaran pola jawaban soal baik sebagai kunci
jawaban maupun sebagai pengecoh, serta (4) kondisi tiap butir soal terhadapa skor keseluruhan.
Manfaat lain yang diperoleh dari analisis butir soal, guru dapat mengetahui gambaran
kemampuan peserta didik, serta dapat melakukan koreksi yang akan datang dalam metode
mengajar sehingga kualitas soal dibuat semakin sempurna. Analisis butir soal menggunakan
perangkat lunak IBM SPSS Statistics 25 dengan kriteria pengujian yaitu (1) Validitas, (2)
Reliabelitas, (3) Tingkat Kesukaran dan (4) Daya Pembeda serta jumlah sample yang diujikan
sebanyak 102 santri tolib dan tolibah.
Kata Kunci :Validitas, Reliabilitas, Tingkat Kesukaran,Daya Pembeda
Kegiatan belajar mengajar di SMA Islam Nurul Fikri Boarding Schoool dimulai dari pagi
hingga siang hari. Sebagai bagian dari tanggung jawab pendidik kepada peserta didik, maka
pendidik perlu melakukan suatu analisis butir soal dalam hal ini yang digunakan adalah hasil dari
penilaian tengah semester ganjil tahun ajaran 2019-2020. Jumlah sampel yang
digunakan/terwakili 102 santri tolib dan tolibah kelas XII IPA. Pendidik berharap melalui analisis
butir soal ini dapat meningkatkan kualitas soal yang dibuat dan sebagai sebuah acuan dalam
membuat soal untuk tes-tes yang mendatang.
1. DASAR TEORI
Analisis butir soal dilakukan untuk mengetahui tingkatan soal yang dibuat. Adapun
analisisnya dapat dilakukan melalui dua analisis yaitu secara kualitatif dan kuantitatif. Analisis
kualitatif sering disebut validitas logis yang dilakukan sebelum soal digunakan. Analiis ini
2. 2hirwanto.math@gmail.com Analisis Butir Soal PG
berguna untk melihat berfungsi tidaknya sebuah soal. Sedangkan untuk analisis soal secara
kuantitatif sering disebut validitas empiris yang dilakukan untuk melihat lebih berfungsi
tidaknya sebuah soal itu diujicobakan kepada sampel yang representatif.
Salah satu tujuan dilakukan analisis adalah untuk meningkatkan kualitas soal, yaitu
apakah suatu soal (1) dapat diterima karena telah didukung oleh data statistik yang memadai,
(2) diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3) tidak digunakan
sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.
1. Analisis Kualitatif. Yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal
ditinjau dari segi teknis, isi, dan editorial. Analisis secara teknis dimaksudkan sebagai
penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format penulisan soal.
Analisis secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan dengan
kelayakan pengetahuan yang ditanyakan. Analisis secara editorial dimaksudkan sebagai
penelaahan yang khususnya berkaitan dengan keseluruhan format dan keajegan editorial
dari soal yang satu ke soal yang lainnya.
Analisis kualitatif lainnya dapat juga dikategorikan dari segi materi, konstruksi,
dan bahasa. Analisis materi dimaksudkan sebagai penelaahan yang berkaitan dengan
substansi keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai
dengan soal. Analisis konstruksi dimaksudkan sebagai penelaahan yang umumnya
berkaitan dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai penelaahan
soal yang berkaitan dengan penggunaan bahasa Indonesia yang baik dan benar menurut
EYD.
2. Analisis Kuantitatif. Digunakan untuk mengetahui sejauh mana soal dapat membedakan
antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria
dengan peserta tes yang kemampuannya rendah (melalui analisis statistik).
Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal
tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif
dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas.
Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang untuk
menebak atau menjawab soal dengan benar dan berfungsi tidaknya pilihan jawaban, yaitu
penyebaran semua alternatif jawaban dari subyek-subyek yang dites.
3. Tingkat Kesukaran. Ada beberapa alasan untuk menyatakan tingkat kesukaran soal.
Bisa saja tingkat kesukaran soal ditentukan oleh kedalaman soal, kompleksitas, atau hal-
hal lain yang berkaitan dengan kemampuan yang diukur oleh soal. Namun demikian,
ketika kita mengkaji lebih mendalam terhadap tingkat kesukaran soal, akan sulit
menentukan mengapa sebuah soal lebih sukar dibandingkan dengan soal yang lain.
3. 3hirwanto.math@gmail.com Analisis Butir Soal PG
Secara umum, menurut teori klasik, tingkat kesukaran dapat dinyatakan melalui
beberapa cara diantaranya (1) proporsi menjawab benar, (2) skala kesukaran linear, (3)
indeks Davis, dan (4) skala bivariat. Proporsi jawaban benar (p), yaitu jumlah peserta tes
yang menjawab benar pada butir soal yang dianalisis dibandingkan dengan jumlah
peserta tes seluruhnya merupakan tingkat kesukaran yang paling umum digunakan.
Intinya, bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama
dapat diketahui dari derajat kesukaran atau taraf kesukaran yang dimiliki oleh masing-
masing butir item tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai
butir-butir item yang baik, apabila butir-butir item tersebut tidak terlalu sukar dan tidak
pula terlalu mudah dengan kata lain derajat kesukaran item itu adalah sedang atau cukup.
Angka yang dapat memberikan petunjuk mengenai tingkat kesulitan item itu dikenal
dengan istilah difficulty index (angka indeks kesukaran item), yang dalam dunia evaluasi
hasil belajar umumnya dilambangkan dengan huruf P, yaitu singkatan dari
kata proportion (proporsi = proporsa).
Kategori Tingkat Kesukaran
Nilai P Kategori
P < 0.3 Sukar
0.3 ≤ P ≤ 0.7 Sedang
P > 0.7 Mudah
Tindak Lanjut Hasil Analisis
Interpretasi
Item
Tindak Lanjut
Sukar
1. butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam tes-tes hasil
belajar yang akan datang
2. diteliti ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang bersangkutan sulit dijawab oleh testee,
apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan
soalnya sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah
yang tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir itemtersebut
dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3. butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama
tes seleksi) yang sifatnya sangat ketat.
4. 4hirwanto.math@gmail.com Analisis Butir Soal PG
Sedang
Butir item ini dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu
yang akan datang
Mudah
1. butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam tes-tes hasil
belajar yang akan datang
2. diteliti ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang bersangkutan sulit dijawab oleh testee,
apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan
solnya sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah
yang tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir itemtersebut
dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3. butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama
tes seleksi) yang sifatnya longgar.
4. Daya Pembeda. Salah satu tujuan analisis kuantitatif soal adalah untuk menentukan
dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan
perbedaan yang ada dalam kelompok itu. Indeks yang digunakan dalam membedakan
antara peserta tes yang berkemampuan rendah adalah indeks daya pembeda (item
discrimination). Indeks daya pembeda soal-soal yang ditetapkan dari selisih proporsi
yang menjawab dari masing-masing kelompok. Indeks ini menunjukkan kesesuaian
antara fungsi soal dengan fungsi tes secara keseluruhan. Dengan demikian validitas soal
ini sama dengan daya pembeda soal yaitu daya dalam membedakan antara peserta tes
yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.
Angka yang menunjukkan besarnya daya pembeda berkisar antara -1 sampai
dengan +1. Tanda negatif menunjukkan bahwa peserta tes yang kemampuannya rendah
dapat menjawab benar sedangkan peserta tes yang kemampuannya tinggi menjawab salah.
Dengan demikian soal indeks daya pembedanya negatif menunjukkan terbaliknya
kualitas peserta.
Indeks diskriminasi item umumnya diberi lambang dengan huruf D (singkatan
daridiscriminatory power).
Indeks Dsikriminasi Item(D)Klasifikasi Interpretasi
< 0,20 Poor
Butir item yang bersangkutan daya
pembedanya lemah sekali (jelek), dianggap
tidak memiliki daya pembeda yang baik
0,20 – 0,40 Satisfactory
Butir item yang bersangkutan telah memiliki
daya pembeda yang cukup (sedang)
5. 5hirwanto.math@gmail.com Analisis Butir Soal PG
0,40 – 0,70 Good
Butir item yang bersangkutan telah memiliki
daya pembeda yang baik
0,70 – 1,00 Excellent
Butir item yang bersangkutan telah memiliki
daya pembeda yang baik sekali
Bertanda negatif (-) –
Butir item yang bersangkutan daya
pembedanya negative sekali (jelek sekali)
5. Fungsi Distraktor. Pada saat membicarakan tes objektif bentuk multiple choice item
tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi
dengan beberapa kemungkinan jawab, atau yang sering dikenal dengan istilah option atau
alternatif.
Option atau alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan
dari kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item itu, salah
satu diantaranya adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya
adalah merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal
dengan istilah distractor (pengecoh).
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu :
menganalisis pola penyebaran jawaban item. Adapun yang dimaksud dengan pola
penyebaran jawaban itemadalah suatu pola yang dapat menggambarkan
bagaimana testee menentukan pilihan jawabnya terhadap kemungkinan-kemungkinan
jawab yang telah dipasangkan pada setiap butir item.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang
dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata
lain, testeemenyatakan “blangko”. Pernyataan blangko ini sering dikenal dengan istilah
omiet dan biasa diberi lambang dengan huruf O.
Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila
distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5 % dari seluruh peserta tes.
Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut
maka distraktor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi
pada tes-tes yang akan datang, sedangkan distraktor yang belum dapat berfungsi dengan
baik sebaiknya diperbaiki atau diganti dengan distraktor yang lain.
6. Reliabilitas. Keajegan dan ketidakajegan skor tes merupakan fokus dari pengkajian
tentang reliabilitas. Berikut adalah faktor yang mempengaruhi perolehan skor peserta
didik (Thorndike) yang berakibat pada ketidakajegan terhadap skor.
6. 6hirwanto.math@gmail.com Analisis Butir Soal PG
Faktor yang Mempengaruhi Reliabilitas Skor
NO. KETERANGAN
1
Karakteristik umum yang permanen peserta tes
1. kemampuan yang dimiliki peserta didik dalam menghadapi tes
2. kemampuan umum dan teknik yang digunakan ketika mengambil tes
3. kemampuan umum untuk memahami petunjuk tes
2
Karakteristik khusus yang permanent peserta tes
1. kemampuan peserta didik yang berkaitan dengan atribut yang diukur dalam sebuah
tes
2. pengetahuan dan kemampuan khusus yang berkaitan dengan soal
3. keajegan respon peserta didik terhadap pilihan jawaban (misalnya mereka cenderung
memberi jawaban A dari 4 alternatif yang disediakan atau cenderung memilih B dari
soal benar salah yang disajikan)
Khusus yang berkaitan dengan soal
1. pengetahuan khusus yang berkaitan dengan fakta atau konsep khusus
2. pengetahuan dan kemampuan khusus yang berkaitan dengan soal
3
Karakteristik umum yang temporer seperti :
1. kesehatan
2. kelelahan
3. motivasi
4. gangguan emosi
5. kemampuan umum dan teknik yang digunakan ketika mengambil tes
6. pemahaman mekanisme tes
7. faktor panas, cahaya, ventilasi, dan lain sebagainya
4
Karakteristik khusus yang temporer seperti :Khusus yang berkaitan dengan tes secara
keseluruhan
1. pemahaman terhadap petunjuk tes
2. trik atau teknik-teknik mengatasi tes
3. pengalaman/latihan menghadapi tes terlebih lagi dalam tes psikomotor
7. 7hirwanto.math@gmail.com Analisis Butir Soal PG
4. kebiasaan menghadapi sebuah tes
Khusus yang berkaitan dengan soal
1. fluktuasi ingatan yang dimiliki peserta didik
2. hal-hal yang berkaitan dengan perhatian dan keakuratan
5
Faktor penyelenggaraan
1. waktu, bebas dari gangguan, dan petunjuk yang jelas
2. pengawasan
3. penskoran
6
Faktor yang tidak pernah diperhitungkan
1. keberuntungan karena faktor menebak
2. mengingat soal yang telah dilihatnya
2. ANALISIS BUTIR SOAL MENGGUNAKAN SPSS
Analisis butir soal menggunakan IBM SPSS Statistics 23. Adapun analisis butir soal yang
akan diuji memiliki empat kriteria, yaitu :
a. Validitas
b. Reliabelitas
c. Tingkat Kesukaran
d. Daya Pembeda
Sebelum melakukan analisis butir soal menggunakan SPSS, terlebih dahulu siapkan data
yang akan digunakan yaitu 102 sampel nilai yang berisi nilai benar dan salah tiap santri dan
disimpan dalam
bentuk file ekstensi
excel .xlsx. Ketentuan
file yang dibuat adalah
angkat “1” untuk soal
dengan jawaban benar
dan angka “0” untuk
soal yang dengan
jawaban salah.
8. 8hirwanto.math@gmail.com Analisis Butir Soal PG
Selanjuntya salin dan pindahkan data di atas ke file dokumen di SPSS dengan terlebih dahulu
dengan klik ikon Start > IBM SPSS Statistics 23.
2.1. Uji Validitas
Untuk melakukan uji validitas dengan menggunakan IBM SPSS Statistics 23 dapat
dilakukan dengan cara sebagai berikut :
1. Analyze --> Correlate --> Bivariate
2. Kotak “Variables” diisi SOAL01SOAL02......SOAL30 JUMLAH
3. Klik Pearson, Klik Two-tailed, Klik
Flag significant correlation
4. Klik OK.
9. 9hirwanto.math@gmail.com Analisis Butir Soal PG
5. Hasil output diperoleh seperti gambar berikut:
Analisis: Hasil pada kolom "Jumlah" jika nilai sig < 0,05 menyatakan butir soal tersebut Valid. Contoh
untuk soal nomor 1, nilai sig = 0,002, dimana nilai tersebut < 0,05, maka soal nomor 1 dinyatakan
valid.
2.2. Uji Reliabilitas
Untuk melakukan uji reliabilitas dengan menggunakan IBM SPSS Statistics 23 adalah
sebagai berikut :
1. Analyze --> Scale --> Reliability Analysis ...
2. Kotak “Item” diisi
SOAL01SOAL02................................SOAL30.
10. 10hirwanto.math@gmail.com Analisis Butir Soal PG
3. Pada kolom model, klik Alpha.
4. Klik Statistics, Klik Scale if item deleted, Klik Continue
5. Klik OK
6. Hasil output diperoleh seperti gambar berikut:
Analisis: Berdasarkan nilai Cronbach's Alpha pada tabel Reliability Statistics
diperoleh nilai 0,772 dengan kategori Tinggi dimana ditafsirkan dengan kriteria :
No Reliabilitas Kategori
1.
2.
3.
4.
5.
0,800 - 1,000
0,600 - 0,799
0,400 - 0,500
0,200 - 0,399
> 0,200 Sangat rendah
Sangat tinggi
Tinggi
Cukup
Rendah
11. 11hirwanto.math@gmail.com Analisis Butir Soal PG
2.3. Uji Tingkat Kesukaran
Untuk melakukan uji reliabilitas dengan menggunakan IBM SPSS Statistics 23 adalah
sebagai berikut :
1. Analyze --> Descriptive Statistics --> Frequencies
2. Kotak “Variables” diisi
SOAL01SOAL02 ....SOAL30
3. Klik Statistics, Klik Mean, Klik Continue
4. Klik OK
5. Hasil output diperoleh seperti gambar berikut:
12. 12hirwanto.math@gmail.com Analisis Butir Soal PG
Analisis : dari hasil yangditunjukkan nilai MEAN pada tabel statistcs ditafsirkan pada rentang
tingkat kesukaran, yaitu
No. Keterangan
1.
2.
3.
0,00 - 0,20 = Sukar
0,21 - 0,70 = Sedang
0,71 - 1,00 = Mudah
Maka untuk soal nomor satu, diperoleh nilai 0,9902 yang berarti tingkat kesukaran soal nomor satu
adalah MUDAH.
2.4. Uji Daya Pembeda
Untuk menentukan daya pembeda, maka nilai perhitungan yang digunakan adalah rhitung pada
SPSS yang dibandingkan dengan kriteria :
Keterangan
0.40 – 1.00 = Soal Baik
0.30 – 0.39 = Soal diterima dan diperbaiki
0.20 – 0.29 = Soal Diperbaiki
0.00 – 0.19 = Soal ditolak
R hitung dapat dilihat dari nilai pearson correlation pada uji validitas.
Maka hasil yang diperoleh untuk soal nomor satu pada kolom jumlah adalah 0,297 yang berarti
SOAL DIPERBAIKI.
13. 13hirwanto.math@gmail.com Analisis Butir Soal PG
3. PEMBAHASAN
Berikut pembahasan analisis butir soal menggunakan IBM SPSS Statistics dengan 4
kriteria yaitu uji validitas, uji reliabilitas, uji tingkat kesukaran dan uji daya pembeda.
3.1. Uji Validitas
Uji validitas berguna untuk mengetahui kevalidan atau kesesuaian butir soal yang
digunakan oleh memperoleh data dari para responden atau sampel penelitian. Uji validitas
product moment pearson correlation menggunakan prinsip mengkorelasikan atau
menghubungkan antara masing-masing skor item atau soal dengan total yang diperoleh dari
jawaban dari masing-masing responden. Dalam hal ini, sampel yang digunakan adalah 102
santri tolib dan tolibah kelas 12 IPA. Penarikan kesimpulan dari uji validitas salah satunya
membandingkan nilai Sig.(2-tailed) dengan Probabilitas 0,05 dengan ketentuan sebagai
berikut:
1. Jila nilai Sig.(2-tailed)<0,05 dan Pearson Correlation bernilai positif, maka
item/butir soal tersebut valid.
2. Jika nilai Sig.(2-tailed)<0,05 dan Pearson Correlation bernilai negatif, maka
item/butir soal tersebut tidak valid.
3. Jika nilai Sig.(2-tailed)>0,05, maka item/butir soal tersebut tidak valid.
Pertanyaan yang diberikan adalah soal PTS Matematika Wajib Kelas 12 IPA dengan
jumlah soal sebanyak 30 butir soal dengan skali likert memiliki dua pilihan yaitu bernilai “1”
untuk jawaban benar dan “0” untuk jawaban salah. Perlu diperhatikan bahwa jika setelah
dilakukan uji validitas terdapat item soal/butir soal yang tidak valid, maka ada beberapa pilihan
solusi yang tepat yaitu (1) Mengulang dan mengganti dengan soal yang lain, (2) Mengulang
dan membagikan soal kepada responden tanpa harus diganti soalnya, (3) Tidak mengubah soal
dan tidak membagikan soal namun soal yang tidak valid dibuang dalam artian bahwa soal yang
valid masih dapat menggambarkan dan mengukur variabel yang diteliti dalam pengujian
berikut(uji reliabilitas).
14. 14hirwanto.math@gmail.com Analisis Butir Soal PG
CORRELATIONS
UJI VALIDITAS JUMLAH KET UJI VALIDITAS JUMLAH KET UJI VALIDITAS JUMLAH KET
SOAL01 Pearson
Correlation
.297** Valid SOAL11 Pearson
Correlation
.513** Valid SOAL21 Pearson
Correlation
.380** Valid
Sig. (2-tailed) .002 Sig. (2-tailed) .000 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL02 Pearson
Correlation
.214* Valid SOAL12 Pearson
Correlation
.258** valid SOAL22 Pearson
Correlation
.674** Valid
Sig. (2-tailed) .031 Sig. (2-tailed) .009 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL03 Pearson
Correlation
.424** Valid SOAL13 Pearson
Correlation
.339** Valid SOAL23 Pearson
Correlation
.428** Valid
Sig. (2-tailed) .000 Sig. (2-tailed) .001 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL04 Pearson
Correlation
.556** Valid SOAL14 Pearson
Correlation
.267** valid SOAL24 Pearson
Correlation
.559** Valid
Sig. (2-tailed) .000 Sig. (2-tailed) .007 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL05 Pearson
Correlation
.409** Valid SOAL15 Pearson
Correlation
.436** Valid SOAL25 Pearson
Correlation
.346** Valid
Sig. (2-tailed) .000 Sig. (2-tailed) .000 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL06 Pearson
Correlation
.554** Valid SOAL16 Pearson
Correlation
.144
Tidak
valid
SOAL26 Pearson
Correlation
.435** Valid
Sig. (2-tailed) .000 Sig. (2-tailed) .149 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL07 Pearson
Correlation
.364** Valid SOAL17 Pearson
Correlation
.470** Valid SOAL27 Pearson
Correlation
.437** Valid
Sig. (2-tailed) .000 Sig. (2-tailed) .000 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL08 Pearson
Correlation
-.123
Tidak
valid
SOAL18 Pearson
Correlation
.049
Tidak
valid
SOAL28 Pearson
Correlation
.478** Valid
15. 15hirwanto.math@gmail.com Analisis Butir Soal PG
Sig. (2-tailed) .218 Sig. (2-tailed) .625 Sig. (2-tailed) .000
N 102 N 102 N 102
SOAL09 Pearson
Correlation
.318** Valid SOAL19 Pearson
Correlation
.249* Valid SOAL29 Pearson
Correlation
.236* Valid
Sig. (2-tailed) .001 Sig. (2-tailed) .012 Sig. (2-tailed) .017
N 102 N 102 N 102
SOAL10 Pearson
Correlation
.509** Valid SOAL20 Pearson
Correlation
.231* Valid SOAL30 Pearson
Correlation
.304** Valid
Sig. (2-tailed) .000 Sig. (2-tailed) .019 Sig. (2-tailed) .002
N 102 N 102 N 102
Hasil uji validitas diperoleh hasil sebagai berikut :
Soal Hasil Uji Validitas Keterangan
08. Hasil dari ∫(5 − 4𝑥 + 9𝑥2
− 2𝑥3)𝑑𝑥 = ⋯ .
A. 5𝑥 − 2𝑥2
+ 3𝑥3
−
1
2
𝑥4
+ 𝐶
B. 5𝑥 + 2𝑥2
+ 3𝑥3
−
1
2
𝑥4
+ 𝐶
C. 5𝑥 − 2𝑥2
− 3𝑥3
−
1
2
𝑥4
+ 𝐶
D. 5𝑥 − 2𝑥2
+ 3𝑥3
+
1
2
𝑥4
+ 𝐶
E. 5𝑥 + 2𝑥2
+ 3𝑥3
−
1
2
𝑥4
+ 𝐶
Pearson Correlation : -.123(bernilai
negatif) dan Sig.(2-tailed) :
0,218>0,05
Tidak valid, soal dapat diperbaiki/dibuang.
16. Perhatikan gambar berikut ini. Pearson Correlation : .144(bernilai
positif) dan Sig.(2-tailed) :
0,149>0,05
Tidak valid, soal dapat diperbaiki/dibuang.
16. 16hirwanto.math@gmail.com Analisis Butir Soal PG
Soal Hasil Uji Validitas Keterangan
Titik 𝑋 terletak pada bidang ....
A. 𝐴𝐵𝐶𝐷 D. 𝐸𝐹𝐺𝐻
B. 𝐵𝐶𝐺𝐹 E. 𝐴𝐵𝐹𝐸
C. 𝐶𝐷𝐻𝐺
18. Pada kubus 𝐴𝐵𝐶𝐷. 𝐸𝐹𝐺𝐻 , bidang yang sejajar
dengan garis 𝐺𝐻 adalah ....
A. 𝐴𝐵𝐶𝐷 D. 𝐴𝐶𝐺𝐸
B. 𝐴𝐷𝐻𝐸 E. 𝐵𝐷𝐻𝐹
C. 𝐵𝐶𝐺𝐹
Pearson Correlation : 0,049(bernilai
positif) dan
Sig.(2-tailed) : 0,625>0,05
Tidak valid, soal dapat diperbaiki/dibuang.
17. 17hirwanto.math@gmail.com Analisis Butir Soal PG
3.2. Uji Reliabilitas
Uji reliabilitas Alpha Cronbach’s berfungsi untuk mengetahui tingkat konsistensi suatu
butir soal yang digunakan oleh peneliti, sehingga butir soal tersebut dapat dihandalkan untuk
mengukur variabel penelitian, walaupun penelitian ini dilakukan berulang-ulang dengan butir
soal yang sama. Penarikan kesimpulan dalam uji reliabilitas adalah sebagai berikut :
1. Jika nilai Cronbach’s Alpha > 0,60, maka butir soal dinyatakan reliabel atau
konsisten.
2. Sementara, jika nilai Cronbach’s <0,60, maka butir soal dinyatakan tidak reliabel
atau tidak konsisten.
Interpretasi Output Uji Reliabilitas Alpah Cronbach’s dengan SPSS
Tabel Output Pertama “Case Processing Summary”
Case Processing Summary
N %
Cases Valid 102 100.0
Excludeda 0 .0
Total 102 100.0
a. Listwise deletion based on all variables in the procedure.
Tabel output di atas, memberikann informasi tentang jumlah sampel(N) 102 orang.
Karena tidak ada data yang kosong(dalam pengertian jawaban responden terisi semua),
maka jumlah valid adalah 100%.
Tabel Output Kedua “ Reliability Statistics”
Reliability Statistics
Cronbach's Alpha N of Items
.772 30
Dari tabel output di atas di bahwa ada 30 butir soal yang diujikan dengan nilai
Cronbach’s Alpha 0,772>0,60, maka sebagaimana dasar pengambilan keputusan dalam
ujia realiabilitas di atas, dapat disimpulkan bahwa ke-30 butir soal matematika wajib
kelas 12 IPA pada Penilaian Tengah Semester Tahun Ajaran 2019-2020 adalah reliabel
atau konsisten/terpercaya.
Tabel Output Ketiga “Item Total Statistics”
Item-Total Statistics
Scale Mean if
Item Deleted
Scale Variance
if Item Deleted
Corrected Item-
Total
Correlation
Cronbach's
Alpha if Item
Deleted
SOAL01 23.1765 19.355 .277 .770
SOAL02 23.1863 19.361 .184 .770
SOAL03 23.2647 18.573 .366 .763
SOAL04 23.3137 17.980 .497 .756
18. 18hirwanto.math@gmail.com Analisis Butir Soal PG
SOAL05 23.4804 18.133 .316 .764
SOAL06 23.4118 17.670 .481 .755
SOAL07 23.4706 18.331 .268 .766
SOAL08 23.1863 19.777 -.154 .776
SOAL09 23.2353 18.954 .265 .767
SOAL10 23.4706 17.737 .425 .757
SOAL11 23.4118 17.829 .436 .757
SOAL12 23.3824 18.833 .168 .771
SOAL13 23.6275 18.355 .233 .769
SOAL14 23.2647 18.989 .203 .769
SOAL15 23.4706 18.034 .346 .762
SOAL16 23.3529 19.260 .056 .776
SOAL17 23.4706 17.895 .383 .760
SOAL18 23.1765 19.573 .027 .773
SOAL19 23.2843 18.998 .178 .770
SOAL20 23.2549 19.103 .169 .770
SOAL21 23.3137 18.534 .308 .764
SOAL22 23.3725 17.345 .619 .748
SOAL23 23.4020 16.857 .224 .788
SOAL24 23.3725 17.761 .490 .755
SOAL25 23.7843 18.349 .243 .768
SOAL26 23.4118 18.126 .351 .762
SOAL27 23.3137 18.356 .368 .762
SOAL28 23.3922 18.003 .400 .759
SOAL29 23.2255 19.166 .185 .769
SOAL30 23.3529 18.706 .221 .768
Tabel output di atas memberikan gambaran tentang nilai statistik untuk 30 butir
soal yang diujikan. Perhatikan bahwa 30 butir soal tersebut, diketahui nilai Cronbach’s
Alpah >0,60. Jadi, dapat disimpulkan bahwa 30 butir soal yang diujikan reliabel atau
terpercaya.
3.3. Uji Tingkat Kesukaran
Uji tingkat kesukaran dapat ditunjukkan dengan nilai rata-rata(MEAN) pada tabel
statistics ditafsirkan pada rentang tingkat kesukaran yaitu : Analisis : dari hasil
yangditunjukkan nilai MEAN pada tabel statistcs ditafsirkan pada rentang tingkat
kesukaran, yaitu
1. Rentang 0,00-0,20 artinya soal dikatakan sukar
2. Rentang 0,21-0,70 artinya soal dikatakan sedang
3. Rentang 0,71-1,00 artinya soal dikatakan mudah.
19. 19hirwanto.math@gmail.com Analisis Butir Soal PG
Berdasarkan hasil uji tingkat kesukaran menggunakan perangkat lunak IBM SPS
Statistics 23 diperoleh hasil output di bawah ini.
Tabel Output “Statistics”
SOAL01 SOAL02 SOAL03 SOAL04 SOAL05 SOAL06 SOAL07 SOAL08 SOAL09 SOAL10
N Valid 102 102 102 102 102 102 102 102 102 102
Missing 0 0 0 0 0 0 0 0 0 0
Mean .9902 .9804 .9020 .8529 .6863 .7549 .6961 .9804 .9314 .6961
KET MUDAH MUDAH MUDAH MUDAH SEDANG MUDAH SEDANG MUDAH MUDAH SEDANG
SOAL11 SOAL12 SOAL13 SOAL14 SOAL15 SOAL16 SOAL17 SOAL18 SOAL19 SOAL20
N Valid 102 102 102 102 102 102 102 102 102 102
Missing 0 0 0 0 0 0 0 0 0 0
Mean .7549 .7843 .5392 .9020 .6961 .8137 .6961 .9902 .8824 .9118
KET MUDAH MUDAH SEDANG MUDAH SEDANG MUDAH SEDANG MUDAH MUDAH MUDAH
SOAL21 SOAL22 SOAL23 SOAL24 SOAL25 SOAL26 SOAL27 SOAL28 SOAL29 SOAL30
N Valid 102 102 102 102 102 102 102 102 102 102
Missing 0 0 0 0 0 0 0 0 0 0
Mean .8529 .7941 .7647 .7941 .3824 .7549 .8529 .7745 .9412 .8137
KET MUDAH MUDAH MUDAH MUDAH SEDANG MUDAH MUDAH MUDAH MUDAH MUDAH
Dari tabel output di atas diperoleh kesimpulan bahwa tingkat kesukaran soal matematika
wajib kelas 12 IPA memiliki 7 soal tingkat sedang dengan prosentase sebesar
7
30
× 100% =
23,33%, 23 soal tingkat mudah dengan prosentase sebesar
23
30
× 100% = 76,67% serta 0 soal
tingkat sukar dengan prosentasi sebesar 0%.
3.4. Uji Daya Pembeda
Untuk menentukan daya pembeda, maka nilai perhitungan yang digunakan adalah rhitung pada
SPSS yang dibandingkan dengan kriteria :
1. Rentang 0,40-1,00 maka soal dikatakan baik.
2. Rentang 0,30-0,39 maka soal dikatakan diterima dan diperbaiki
3. Rentang 0,20-0,29 maka soal perlu diperbaiki
4. Rentang 0,00-0,19 maka soal ditolak.
Kriteria di atas dapat dillihat dari tabel output nilai Pearson Correlation pada uji validitas
menggunakan IBM SPSS Statistics 23. Berikut ini tabel nilai pearson correlation pada uji
validitas untuk data sebanyak 30 sampel penelitian
20. 20hirwanto.math@gmail.com Analisis Butir Soal PG
R hitung dapat dilihat dari nilai pearson correlation pada uji validitas.
Tabel Output “Pearson Correlation”
Pearson
Correlation
KET. Pearson
Correlation
KET. Pearson
Correlation
KET.
SOAL01
.297** Perlu diperbaiki SOAL11
.513** Baik SOAL21
.380** Diterima dan
diperbaiki
SOAL02 .214* Perlu diperbaiki SOAL12 .258** Perlu diperbaiki SOAL22 .674** Baik
SOAL03
.424** Baik SOAL13
.339** Diterima dan
diperbaiki
SOAL23
.428** Baik
SOAL04 .556** Baik SOAL14 .267** Perlu diperbaiki SOAL24 .559** Baik
SOAL05
.409** Baik SOAL15
.436** Baik SOAL25
.346** Diterima dan
diperbaiki
SOAL06 .554** Baik SOAL16 .144 Ditolak SOAL26 .435** Baik
SOAL07
.364** Diterima dan
diperbaiki
SOAL17
.470** Baik SOAL27
.437** Baik
SOAL08 -.123 Ditolak SOAL18 .049 Ditolak SOAL28 .478** Baik
SOAL09
.318** Diterima dan
diperbaiki
SOAL19
.249* Perlu diperbaiki SOAL29
.236* Perlu
diperbaiki
SOAL10
.509** Baik SOAL20
.231* Perlu diperbaiki SOAL30
.304** Diterima dan
diperbaiki
Dari hasil tabel output di atas, diperoleh penarikan kesimpulan yaitu sebagai berikut :
1. Soal dikatakan baik terdapat pada nomor soal 3,4,5,6,10,11,15,17,22,23,24,26,27,28
sebanyak 13 soal dengan prosentasi sebesar
14
30
× 100% = 46,67%
2. Soal dikatakan diterima dan diperbaiki terdapat pada nomor soal 7,8,13,21,25,30
sebanyak 6 soal dengan prosentasi sebesar
6
30
× 100% = 20,00%
3. Soal dikatakan perlu diperbaiki terdapat pada nomor soal 1,2,12,14,19,20,29 sebanyak
7 soal dengan prosentasi sebesar
7
30
× 100% = 23,33%
4. Soal dikatakan ditolak terdapat pada nomor soal 8,16,18 sebanyak 3 soal dengan
prosentasi sebesar
3
30
× 100% = 10,00%
4. KESIMPULAN
Analisis butir soal menggunakan perangkat lunak IBM SPS Statistics versi 23 diperoleh
hasil sebagai berikut :
4.1.Uji Validitas
Melalui uji validitas diperoleh kesimpulan yaitu :
a. Soal no. 8 pada tes yang diujikan tidak valid. Hal ini dikarena nilai Pearson
Correlation : -.123(bernilai negatif) dan Sig.(2-tailed) : 0,218>0,05 sehingga soal
dapat diperbaiki/dibuang.
b. Soal no. 16 pada tes yang diujikan tidak valid. Hal ini dikarenakan nilai Pearson
Correlation : .144(bernilai positif) dan Sig.(2-tailed) : 0,149>0,05 sehingga soal dapat
diperbaiki/dibuang.
21. 21hirwanto.math@gmail.com Analisis Butir Soal PG
c. Soal no. 18 pada tes yang diujikan tidak valid. Hal ini dikarenakan nilai Pearson
Correlation : 0,049(bernilai positif) dan Sig.(2-tailed) : 0,625>0,05 sehingga soal
dapat diperbaiki/dibuang.
4.2.Uji Reliabilitas
Melalui uji reliabilitas diperoleh kesimpulan yaitu :
a. Berdasarkan nilai Cronbach’s Alpha 0,7772>0,60, maka 30 butir soal
matematika wajib kelas 12 pada Penilaian Tengah Semester Ganjil Tahun
Ajaran 2019-2020 adalah reliabel atau konsisten/terpercaya.
b. Nilai Cronbach’s untuk tiap butir soal yang diujikan mempunyai nilai >0,60
sehingga semua butir soal adalah reliabel atau konsisten/terpercaya.
4.3.Uji Tingkat Kesukaran
Melalui uji tingkat kesukaran diperoleh kesimpulan bahwa tingkat kesukaran soal
matematika wajib kelas 12 IPA memiliki 7 soal tingkat sedang dengan prosentase sebesar
7
30
×
100% = 23,33%, 23 soal tingkat mudah dengan prosentase sebesar
23
30
× 100% = 76,67% serta
0 soal tingkat sukar dengan prosentasi sebesar 0%.
4.4.Uji Daya Pembeda
Melalui uji daya pembeda diperoleh kesimpulan yaitu :
1. Soal dikatakan baik terdapat pada nomor soal 3,4,5,6,10,11,15,17,22,23,24,26,27,28
sebanyak 13 soal dengan prosentasi sebesar
14
30
× 100% = 46,67%
2. Soal dikatakan diterima dan diperbaiki terdapat pada nomor soal 7,8,13,21,25,30
sebanyak 6 soal dengan prosentasi sebesar
6
30
× 100% = 20,00%
3. Soal dikatakan perlu diperbaiki terdapat pada nomor soal 1,2,12,14,19,20,29 sebanyak
7 soal dengan prosentasi sebesar
7
30
× 100% = 23,33%
4. Soal dikatakan ditolak terdapat pada nomor soal 8,16,18 sebanyak 3 soal dengan
prosentasi sebesar
3
30
× 100% = 10,00%
Berdasarkan keempat uji di atas dapat dijadikan panduan dalam pembuatan soal agar lebih
baik dan sempurna. Selain itu, sebagai acuan/referensi untuk penelitian selanjutnya.
22. 22hirwanto.math@gmail.com Analisis Butir Soal PG
5. SARAN DAN KRITIK
Analisis butir soal menggunakan perangkat lunak IBM SPSS Statistics versi 23 memiliki
kemudahan dalam hal menginterpresikan data yang diperlukan. Selain itu, penulis berharap
untuk penelitian selanjutnya dapat menggunakan lebih banyak variabel tidak hanya dua
variabel yang diujikan yaitu “1” bernilai benar dan “0” bernilai salah serta sampel penelitian
dapat lebih diperbanyak.
6. DAFTAR PUSTAKA
[1] www.spssindonesia.com diakses jam 13.26 tanggal 15 Oktober 2019
[2] paper “Analisis Butir Soal Pilihan Ganda” oleh Sridadi Dosen Jurusan Pendidikan
Olahraga FIK UNY.