2. Kandungan Kuliah
Definisi Kesahan
Kesahan dalam kajian kuantitatif
Kesahan dalam kajian kualitatif
Jenis-jenis Kesahan
Definisi Kebolehpercayaan
Kebolehpercayaan dalam kajian kuantitatif
Kebolehpercayaan dalam kajian kualitatif
Ensuring validity (bagaimana utk pastikan kesahan?)
3. DEFINISI KESAHAN (VALIDITY)
Refer to the degree to which a test
measures what it is supposed to measure
Merujuk kepada takat sesuatu alat itu
mengukur apa yang seharusnya diukur
Contoh: ketinggian : pembaris berat :
penimbang
Oleh itu, penimbang tidak mempunyai
kesahan untuk mengukur ketinggian
4. Kesahan (Validity) berkait rapat dengan:
Kesesuaian (appropriateness)
Pembetulan (correctness)
Kebermaknaan (meaningfulness)
Kegunaan (usefulness)- kepada spesifik inferens
yang dibuat oleh penyelidik berdasarkan
maklumat yang diperolehi
5. TYPES OF VALIDITY
THERE ARE TWO TYPES OF RESEARCH VALIDITY:
1. INTERNAL VALIDITY
2. EXTERNAL VALLIDITY
INTERNAL VALIDITY – CAN BE CONTROLLED BY THE DESIGN
OF THE RESEARCH
EXTERNAL VALIDITY – RELATED TO THE SAMPLING OF THE
RESEARCH PARTICIPANT. RESEARCH IS SAID TO HAVE HIGH
EXTERNAL VALIDITY IF THE RESULT CAN BE GENERALISED TO
A BIGGER POPULATION.
6. WHY INTERNAL VALIDITY IS
IMPORTANT?
This idea that X causes Y
is important because internal
validity is about being able to justify
that X actually caused Y. We highlight
the word actually because there are
many different reasons that can make
it difficult to know whether X causes
Y.
Therefore it relates to WHAT YOU
REALLY MEASURE…
7. WHY IS IT IMPORTANT TO
HAVE EXTERNAL VALIDITY?
External validity is the extent to
which results of a study can be
generalized to the world at large.
Because the goal of research is to
tell us about the world,external
validity is a very important part of
designing a study. ...
8. Terdapat 4 jenis pendekatan
untuk menguji kesahan:
a) Kesahan berkaitan kandungan(content
validity)
b) Kesahan berkaitan kriteria(criterion-related
validity)
c) Kesahan berkaitan konstruk(Construct
validity)
d) Kesahan berkaitan akibat(consequential
validity)
9. Kesahan Kandungan
Merujuk kepada sejauh mana alat itu
mengumpul data yang merangkumi kandungan
sesuatu bidang yang dikaji.
Sesuatu alat pengukuran dikatakan mempunyai
kesahan kandungan yang tinggi sekiranya alat
tersebut dapat mengukur semua isi serta
kandungan bidang
Ini hanya dapat ditentukan oleh mereka yang
pakar dalam bidang-bidang berkenaan.
Satu kaedah lain dalam menentukan kesahan
kandungan melibatkan penggunaan jadual
penentuan ujian (JPU)
10.
11. Kesahan Kriteria
Merujuk kepada sejauh mana perhubungan antara butir-
butir dalam alat kajian dengan kriteria luaran yang
berkecuali.
Kriteria yang hendak diukur adalah kriteria yang
konsisten sebagaimana ditunjukkan oleh subjek diluar
pengukuran.
Contoh
ibu bapa menunjukkan sikap yang positif terhadap
peranan pendidikan vokasional berbanding dengan
pendidikan akademik sebagaimana yang ditunjukkan
oleh alat kajian berkaitan sedangkan mereka masih
menghantar anak-anak mereka untuk mengikuti
pelajaran dalam aliran pendidikan akademik.
12. Kesahan Kriteria terdiri daripada
2 jenis:
1. Kriteria serentak (Concurrent Validity):
Kriteria yang ditunjukkan pada masa yang sama atau
hampir sama dengan pengukuranyang dikenakan ke atas
kriteria tersebut.
Contoh
Kesahan kriteria serentak yang tinggi. Seseorang pelajar
yang mencapai kebolehan yang cemerlang dalam ujian
biologi juga pada masa yang sama menunjukkan kebolehan
menggunakan microskop dengan baik.
13. 2. Kriteria Jangkaan (Predictive Validity)
Kriteria yang mana ujian untuk menjangkakan sejauh
mana perlakuan seseorang pada masa hadapan.
Contoh: Kesahan kriteria jangkaan yang rendah
1. Seseorang pelajar yang mencapai kebolehan yang
tinggi dalam ujian biologi tidak dapat menunjukkan
kebolehannya dalam menjalankan eksperimen
pengujian darah beberapa bulan selepas ujian
tersebut diadakan.
14. Kesahan Akibat(Consequential
Validity)
Merujuk kepada akibat yang berlaku daripada ujian yang
dikaji.
Dengan menilai kesahan akibat membenarkan penyelidik
mengenalpasti sama ada wujud masalah yang
mendatangkan kesan buruk kepada pelajar, guru dan orang
yang diuji.
Isu yang timbul ialah apakah kesan pelbagai bentuk ujian
kepada guru dan pelajar.
Contoh: bagaimana ujian yang hanya menguji pelajar
dengan items aneka pilihan mempengaruhi pembelajaran
pelajar berbanding dengan mentaksir mereka yang
menggunakan items yang tidak ada had.
15. Faktor-faktor Yang Mempengaruhi Kesahan
a.Arahan kurang jelas
b.Perbendaharaan kata dan struktur ayat sukar
difahami
c.Ambiguiti-kekaburan
d.Masa yang diberikan tidak mencukupi
e.Aras kesukaran yang kurang sesuai
f.Item ujian yang dibina kurang baik
g.Item ujian kurang sesuai bagi aras kemahiran
yang dikehendaki
h.Bilangan item yang tidak mencukupi
i.Susunan item kurang tepat
j.Susunan jawapan (ujian objektif)
16. Kesahan Kandungan
Kaedah Penyelidikan Perniagaan
JENIS KESAHAN
KESAHAN
APA YG DIUKUR KAEDAH
KANDUNGAN Adakah pengukuran mengukur
dengan sekupnya konsep yang
dikaji?
• Pertimbangan Penilaian Panel
Panel
• Nisbah Kesahan Kandungan
MUKA Adakah pakar mengesahkan
bahawa pengukuran mengukur
apa yang diukur sama dengan
namanya?
- Mendapatkan persetujuan
pakar
17. Kesahan Berasaskan-Kriteria
Kaedah Penyelidikan Perniagaan
JENIS APA YG DIUKUR KAEDAH
Berasaskan
Kriteria
Adakah pengukuran membantu dalam
membezakan dan menelah pembolehubah
pembolehubah kriteria?
Korelasi
Selari Adakah pengukuran membantu dalam
membezakan dan menelah pembolehubah
pembolehubah kriteria pada masa kini?
Telahan Adakah pengukuran membantu dalam
membezakan kriteria pada masa hadapan?
hadapan?
18. Kesahan Konstruk
Kaedah Penyelidikan 1
JENIS APA YANG DIUKUR KAEDAH
Konstruk Adakah pengukuran mengukur konsep seperti
yang dinyatakan dalam teori atau model?
• Pertimbangan
• Korelasi alat ukuran
cadangan dengan
yang sedia ada.
• Teknik menumpu-
diskriminasi
• Analisis Faktor
Menumpu Adakah dua alat pengukuran yang mengukur
konsep yang sama mempunyai korelasi yang
tinggi?
Diskriminasi Adakah alat pengukuran ini mempunyai korelasi
yang rendah dengan sesuatu pembolehubah yang
yang tiada perkaitan dengannya
19. Kebolehpercayaan (Reliability)
Merujuk kepada takat ketekalan alat pengukur itu
mengukur apa yang hendak diukur
Alat ukur yang mengukur sesuatu gagasan atau
pembolehubah dengan tekal dikatakan mempunyai
kebolehpercayaan yang tinggi
Sebaliknya, alat ukur yang menghasilkan markah
yang berubah-ubah bagi mengukur gagasan atau
pembolehubah yang sama dikatakan tidak tekal
seterusnya mempunyai kebolehpercayaan yang
rendah
20. BASES OF RELIABILITY IN
QUANTITATIVE RESEARCH
BASES OF RELIABILITY IN
QUALITATIVE RESEARCH
Reliability Dependability
Demonstrability Trustworthiness
Stability and replicability Stability and replicability
Parallel forms Parallel forms
Context-freedom Context-specificity
Objectivity Authenticity and confirmability
Coverage of domain Comprehensiveness of situation
Verification of data and analysis Honesty and candour
Answering research questions Depth of response
Meaningfulness to the research Meaningfulness to respondents
Parsimony Richness
Internal consistency Credibility
Generalizability Transferability
Inter-rater reliability & triangulation Inter-rater reliability and triangulation
Accuracy and precision Accuracy and comprehensiveness
Neutrality Multiple interests represented
Consistency Consistency
Alternative forms (equivalence)
Split-half and inter-item correlation
21. Reliability in Quantitative and Qualitative
Research
Reliability in quantitative research:
consistency (stability), accuracy,
predictability, equivalence, replicability,
concurrence, descriptive and causal
potential.
Reliability in qualitative research:
accuracy, fairness, dependability,
comprehensiveness, respondent validation,
‘check ability’, empathy, uniqueness,
explanatory and descriptive potential,
confirmability.
22. Types Of Reliability In Quantitative
Research
Reliability as stability:
Consistency over time and samples;
Reliability as equivalence:
Equivalent forms of same instrument;
Inter-rater reliability;
Reliability as internal
consistency:
Split half reliability (e.g. for test items)
23. Kebolehpercayaan
Kestabilan
Ujian-ujian semula (Test-retest)
Setara (Equivalence)
Bentuk selari (Parallel form)
Antara Pengukur (Inter-Rater)
Konsistensi dalaman
Belah-dua (Split-half)
Antara Item (Inter item)
Kaedah Penyelidikan 1
24. Kebolehpercayaan
(Kestabilan)
Kaedah Penyelidikan 1
JENIS APA YANG DIUKUR KAEDAH
Kestabilan Kebolehan sesuatu pengukuran untuk
mengekalkan kestabilan mengikut masa
walaupun keadaan penyelidikan dan responden
responden tidak dapat dikawal
Korelasi
Uji-ujian
semula
Ujian yang sama diberikan kepada satu
kumpulan responden dua kali dalam tempoh cth
cth 6 bulan
25. Uji dan Uji Semula
(test and re-test)
Darjah di mana skor ke atas ujian yang sama adalah konsisten pada
selang masa tertentu
Didapati skor yang diperoleh pada ujian yang pertama menghampiri
skor untuk ujian yang diuji sekali lagi
Semakin sama skor pada ujian yang dijalankan pada selang masa
tertentu, semakin stabil skor ujian tersebut.
Prosedur
1. Menjalankan ujian terhadap kumpulan tertentu
2. Selepas dua minggu, ujian yang sama dijalankan ke atas kumpulan
yang sama
3. Hitungkan pekali korelasi antara skor ujian yang pertama dengan
skor ujian kedua.
4. Menilai keputusan yang diperoleh
26. Masalah yang dihadapi :
1. Jika selang masa terlalu singkat untuk ujian yang
sama diulangi, pelajar akan mengingati apa yang
diuji pada kali pertama (kebolehpercayaan palsu
adalah tinggi)
2. Jika selang masa terlalu lama untuk ujian yang
sama diulangi, pelajar akan memperbaiki diri dan
menjadi matang(kebolehpercayaan palsu adalah
rendah)
3. Selang masa yang sesuai digunakan untuk menguji
semula adalah 2-6 minggu
27. Masalah Ujian-ujian semula
1. Beza masa membawa kepada perubahan faktor
situasi
2. Masa yang pendek, membenarkan responden
untuk ingat jawapan sebelumnya
3. Sensitiviti topik, mendorong responden untuk
mengetahui dengan lebih mendalam
4. Pengenalan pembolehubah gangguan,
menyebabkan responden berubah pendirian
disebabkan faktor yang tidak berkaitan dengan
penyelidikan
Kaedah Penyelidikan 1
28. Kebolehpercayaan
(Persamaan)
Kaedah Penyelidikan 1
JENIS APA YANG DIUKUR KAEDAH
Setara (equivalence)
(equivalence)
Sejauhmanakah bentuk alternative ujian yang
yang sama menghasilkan hasil yang serupa
atau hampir serupa?
Korelasi
Bentuk Selari Item dan skala jawapan adalah sama. Hanya
Hanya perkataan dan susunan diubah.
Antara Pengukur Sejauhmanakah persamaan ukuran mengenai
mengenai kejadian yang sama oleh dua orang
orang pengukur yang berlainan?
29. Ujian bentuk setara
Darjah di mana dua bentuk set soalan yang hampir sama
menghasilkan skor yang hampir sama daripada satu
kumpulan yang diuji
Soalan dibina secara berasingan dan mestilah memenuhi
spesifikasi yang ditetapkan iaitu dari segi bilangan item,
bentuk, arahan, tempoh ujian, format, kandungan,
julat, aras kesukaran tetapi mempunyai soalan-soalan
yang berbeza
Kedua-dua ujian boleh dijalankan secara bergilir jika
kedua-duanya setara
Kaedah ini digunakan untuk mengelakkan mengingat
item yang diuji
30. Prosedur
Menjalankan satu bentuk ujian terhadap satu
kumpulan
Pada sesi yang sama atau jangka masa yang
singkat, jalankan bentuk ujian yang kedua
terhadap kumpulan yang sama
Hitungkan korelasi skor bagi kedua-dua ujian yang
ditadbirkan
Menilai keputusan yang diperolehi
31. Kesetaraan dan Kestabilan
Menggabungkan kesetaraaan dan kestabilan
Jika dua ujian dijalankan pada masa yang
berbeza, menghasilkan keputusan yang sama
seperti yang diukur oleh korelasi
Prosedur
Jalankan sesuatu ujian terhadap sesuatu kumpulan
Selepas selang masa tertentu, jalankan ujian
berlainan terhadap kumpulan yang sama
Hitungkan kedua-dua skor yang diperolehi
Menilai keputusan yang diperolehi
32. Kebolehpercayaan
(Konsistensi Dalaman)
Kaedah Penyelidikan 1
JENIS APA YANG DIUKUR KAEDAH
Konsistensi Dalaman
Dalaman
Sejauhmana item dalam alat pengukuran
pengukuran adalah homogenius dan
mencerminkan konstruk yang sama?
Cronbach Alpha
Split half
correlation
Konsistensi Antara
Item
Mengukur kosistensi jawapan responden
responden kepada setiap item dalam alat
alat pengukuran
Belah-dua Alat ukuran dibahagikan kepada dua
bahagian dan korelasi diukur
33. Konsistensi Dalaman
Satu ujian diambil hanya sekali
Mengukur sejauh mana item dalam satu ujian
adalah konsisten antara satu sama lain dan dengan
keseluruhannya
Terdiri daripada tiga jenis:
1. Kebolehpercayaan belah dua (split-half
reliability)
2. Kebolehpercayaan Kuder-Richardson20
3. Kebolehpercayaan Cronbach’s alpha
34. Kebolehpercayaan Split-Half
Melibatkan pembahagian satu ujiankepada dua sub ujian
Setiap ujian mengandungi sebahagian(½)daripada
bilangan item yang asal
Tujuan membahagikan kepada dua subujian ialah untuk
mendapatkan dua ujian yang selari mungkin
Kaedah ini sesuai untuk satu ujian yang panjang dan
mengambil masa yang lama atau susah untuk diuji
Prosedur
1. Jalankan keseluruhan ujian terhadap satu kumpulan
2. Bahagikan ujian tersebut kepada duabentuk yang berbeza
dengan memilih item ganjil atau item genap
3. Kirakan setiap skor pelajar bagi kedua-dua bahagian
4. Hitungkan pekali korelasi bagi kedua-dua skor
5. Aplikasikan formula pembetulan Spearman-Brown
6. Menilai keputusan
36. Kuder-Richardson 20 (KR 20)
Rumus tersebut dibuat berdasarkan penskoran
secara dikotomi (betul-salah) seperti dalam ujian
objektif pelbagai pilihan.
Formula KR 21 lebih mudah dihitung dan
mengurangkan masa pengiraan tetapi kurang tepat
berbanding KR 20.
39. Kebolehpercayaan Cronbach’s
alpha
Digunakan apabila ujian mempunyai skor yang lebih
daripada dua pilihan
Menganalisis konsisten dalaman jika nombor digunakan
untuk menunjukkan pilihan respon
Pekali alpha yang kerap kali digunakan dalam
menganggarkan kebolehpercayaan ketekalan-dalaman
40. Kebolehpercayaan Skorer
(Scorer Reliability)
Mengkaji individu yang mendapat skor untuk ujian yang
dijalankan
Interjudge- merujuk kepada dua atau lebih individu
yangmendapat skor yang konsisten
Intrajudge- merujuk kepada individu yang mendapat
skor yang konsisten selepas satu jangka masa
Penting apabila penskoran berpotensi sebagai subjektif
Penting untuk menentukan kebolehpercayaan seseorang
individu yang menskor ujian terbuka (tidak
terhad)(open-ended tests)
Kebolehpercayaan penskor penting untuk ditentukan
apabila perlakuan ke atas ujian mempunyai kesan yang
serius terhadap pengambil ujian
42. RELIABILITY AND REPLICATION IN
QUALITATIVE RESEARCH
Repeat:
The status position of the researcher
The choice of informants/respondents
The social situations and conditions
The analytic constructs used
The methods of data collection and analysis
Address:
Stability of observations
Parallel forms
Inter-rater reliability
Respondent validation
43. IMPROVING RELIABILITY
Minimise external sources of variation;
Standardise conditions under which
measurement occurs;
Improve researcher consistency;
Broaden the sample of measurement
questions by:
a) adding similar questions to the
instrument;
b) increasing the number of researchers
(triangulation);
c) increasing the number of occasions in
an observational study.
Exclude extreme responses (outliers).
44. Memperbaiki Kebolehpercayaan
Minimumkan punca variasi luaran
Piawaikan keadaan/situasi pengukuran
Perbaiki konsistensi dengan menggunakan
penyelidik yang berpengalaman dan terlatih
Tambah item dalam ukuran atau sampel
Perbaiki konsistensi dalaman dengan
mengambilkira hanya nilai ekstreem sahaja
Kaedah Penyelidikan 1
45. Practicality
Ekonomi
Kemudahan (Convenience)
Kebolehtafsiran (Intrepretability)
Fungsi Ujian
Arahan terperinci
Arahan pemarkahan
Piawaian untuk kumpulan rujukan
Bukti mengenai kebolehpercayaan
Panduan menggunakan ujian
Kaedah Penyelidikan 1
46. Perkaitan antara Kesahan dengan
Kebolehpercayaan
1. Kesahan akan memastikan ujian yang dibina itu menepati
matlamat atau objektif ujian itu dibina
2. Kebolehpercayaan memastikan ketekalan dalam
pengukuran sesuatu ujian
3. Kebolehpercayaan boleh dikaji terus dari data ujian tetapi
kesahan tidak boleh
4. Ujian yang boleh diterima mestilah sah dan boleh
dipercayai
5. Untuk mengesahkan sesuatu yang digunakan,pengukuran
hendaklah mempunyai kebolehpercayaan
6. Konsep kesahan dan kebolehpercayaan lebih
merujukkepada maklumat yang diperolehi daripada alat
pengukur itu dari menerangkan alat pengukur itu sendiri