4. Sınav tam olarak derste ne öğretildiyse ,onları ölçer niteliktedir. Yukarıdaki ve benzer yorumlar tamamen yapılan sınavın geçerli puanlar verdiğini belirten yorumlardır. Bu soruların doğru yorumlanması için ölçümlerin geçerliliği ve geçerlik kestirme yöntemlerinin kavranmış olması gerekmektedir. Eğitimde ölçme ve değerlendirme,okullarda birçok amaca hizmet etmektedir. Örneğin ; öğrencilerin belli bir programı seçimi ve bu programda kur veya düzeyin belirlenmesinde, öğrencilerin öğrenme-öğretme süreci içerisindeki eksiklik ve yetersizliklerin belirlenmesinde ,kurs bitiminde öğrencilerin öğrenme düzeylerinin belirlenmesinde yine ölçme ve değerlendirmeden faydalanılmaktadır. Amacımız bir işle ilgili hızı,performansı ölçmek veya kişilik,ilgi,tutum,yetenek,başarı gibi faktörleri ölçmek olabilir. Anlaşılacağı üzere eğitimde ölçülmek istenen özellikler genelde;başarı,ilgi,tutum gibi bazı soyut niteliklerdir. Bu değişkenleri ölçerken elde edilecek ölçümlere,ölçülmesi amaçlanmayan değişkenlerin karışması söz konusudur ki bu ölçme açısından hiç istenmeyen bir durumdur
5. Ölçme geçerliliğini düşüren etkenler Bir ölçme aracından elde edilen puanlara,arcın ölçmek istediği niteliklerin dışındaki niteliklerin karışması(dili kullanma,puanlamada yanlılık gibi). Ölçülecek bir değişkeni eksik bir şekilde ölçen bir ölçme araç veya yöntem Tesadüfi ölçme hatalarının çok olduğu anlamına gelen düşük güvenirlik(kopya,puanlama hatası gibi) katsayısı da geçerlilik katsayısının düşük olmasına sebep olur. Geçerlik Bulma Yöntemleri 1) Kapsam geçerliliği(ContentValidation) 2) Ölçüt geçerliliği(Criterion-relatedvalidation) 3) Yapı geçerliliği-Teorik yapıyı destekleme (ConstructValidation) 4)Görünüş geçerliliği (FaceValidity) 1)Kapsam Geçerliliği Bir ölçme aracının kapsam geçerliliği;testi oluşturan maddelerin ölçülen davranışlar evrenini temsil etme düzeyi hakkında bir karara varmadır. Başka bir ifade ile kapsam geçerliliği;bir ölçme aracının hem konu ve davranış boyutuna bakılarak hem de test maddelerinin ölçülmek istenen davranışları ölçmede uygun olup olmadığına bakılarak varılan bir geçerlilik yargısıdır.
6. Kapsam geçerliliği aşamaları 1)Ölçülecek değişkenle ilgili davranışlar evreninin belirlenmesi. 2)Testi oluşturacak davranışlarının (örneklemin) belirlenmesi. 3)Testi oluşturan davranışlar örnekleminin, evreni temsil düzeyinin tespit edilmesi. 4)Testteki soruların ilgili olduğu davranışı ölçmeye uygun olup olmadığının kontrol edilmesi. Kapsam geçerliliği aşamalarında,genelde gözden kaçırılan son aşamanın bir kez daha vurgulanmasında fayda vardır. Bir testin kapsam geçerliliği hakkında karar verirken, testte sorulan soruların ilgi davranışları ölçmede uygun olup olmadığının da tespit edilmesi gerekmektedir. Bir sorunun ilgi davranışı ölçmek için,uygun bir şekilde nasıl yazılacağı bu kitabın “sınav türleri” ünitesinde detaylı olarak anlatılmıştır.
7. Bir test maddesinin geçerliği hakkında yargıda bulunmanın bir yolu da; öğrencinin bu maddeden aldıkları puanlarla, testin tümünden aldıkları puanlar arasında ne düzeyde bir benzerlik olduğunun bulunmasıdır(madde ayırıcılık gücü). Bu benzerliğin veya ilişkinin ölçüsü istatistiksel olarak çift serili korelasyonla tespit edilebilir. Geçerlilik katsayısı bir korelasyon katsayısı olduğu için teorik olarak “-1” ile “+1” arasında değer alabilir. Eğer bir madde için hesaplanan madde test korelasyonu veya madde test korelasyonu 0.20 den az ise bu madde; testin tümünün ölçtüğü boyutu ölçmede geçersiz bir madde olarak yorumlanabilir. Çift serili korelasyon katsayısı 0.20 den düşük maddelerin teste alınmaması güvenilir ve geçerli bir test elde etmek için önerilir Bloom, Hasting ve Madaus(1971) davranışların sınıflandırılmasına yönelik kapsamlı bir çalışmalar yapmışlardır. Kapsam geçerliliğinin tespit edilmesinde; testi oluşturan davranışların, davranışlar evrenini temsil etme düzeyinin belirlenmesinde bir belirtke tablosunun hazırlanmasını önermişlerdir.
8. 2) Ölçüt Geçerliliği Geçerliği çalışan bir ölçme aracıyla,geçerliği olduğu kabul edilen bir öğrenme aracının aynı denklere uygulanması sonucu elde edilen ölçümler arası korelasyondur. Genel de iki tür ölçüt geçerlik katsayısı tanımlanmaktadır. a) Uyum geçerliliği b) Yordama geçerliliği ölçüt geçerliliğinin hangi anlamda tanımlandığı, kriter yada ölçülen değişkene ait ölçümlerin elde edilme zamanları arasındaki farka bağlıdır. Uyum geçerliliği,bir kişinin kriter değişkendeki performansının, o anda ölçmeye konu olan değişkendeki performansını nasıl tahmin ettiğiyle ilgilidir. Yordama geçerliğinde ise geçerliği çalışkan bir testle daha sonra elde edilecek olan kriter testi puanlarının benzer puanlar verme durumuna göre yordayıcı testin geçerliliği hakkında karar verilir.Yordayıcı testin amacı, gelecekte belli olacak bir değişkene yönelik olarak tahminde bulunmaktadır. Geçerliliği önceden kanıtlanmış bir ölçme aracının uygulanması. Geçerliği çalışkan (yordayıcı) bir testin uygulanması. İki uygulamadan elde edilen ölçümler arasındaki korelasyon katsayısının hesaplanması.
9. 3) Yapı Geçerliği- Teorik Yapıyı Destekleme Bir ölçme aracının teorik olarak ölçmek istediği yapıyı ölçmeye uygun olup olmadığına dair kanıt toplama çabasındadır. Anlaşılacağı üzere yapı geçerliliği çalışması genel olarak hem teorik oluşturmada hem de teori test etmede kullanılabilir. Bu teorik yapı ile kast edilen ; Yaratıcılık, kişilik, zeka gibi bireylerin doğasında var olan özelliklerdir. Bu teorik yapılar soyut değişken niteliğinde olduklarından ölçmeleri zordur.Çünkü dolaylı bir şekilde gözlenmeleri gerekmektedir. Günümüzde ,istatiksel olarak bir ölçme aracının yapı geçerliğini çalışmada; açıklayıcı faktör analizi, doğrulayıcı faktör analizi,yapısal eşitleme modeli gibi teknikler kullanılmaktadır. Geçerliliği Etkileyen Faktörler Geçerliliği düşüren bazı etkenler aşağıda kısaca sunulmuştur. Güvenirlik;Bir testin güvenirliği , o testin geçerliliğini etkileyen faktörlerdendir. Güvenirlik geçerlilik için gerekli ama yeterli bir şart değildir. Güvenirliğin düşük veya tam olmasının geçerliği nasıl düşüreceği aşağıdaki eşitlikte Lord & Novicktarafından formüle edilmiştir. p(Tх,Ty)= Pxy/ √PxxPyy
10. Sistematik Yanlılık Ölçümlerimizi ait geçerliliğin düşük olmasını etkileyen etkenlerden biride, ölçme sisteminden kaynaklanan hataların olmasıdır. Bu hatalardan bazıları şunlardır. a) Ölçme Yöntemi Kullanılan ölçme yöntemi bireyin alacağı puanı etkileyebilir. Yazılı yoklama, çoktan seçmeli test, doğru-yanlış testi veya sözlü yoklama gibi ölçme yöntemlerinden birinin seçimi ve uygulanış biçimi öğrencinin alacağı puandaki hata miktarını değiştirebilir. b) Soru Seçimi Sınavda yoklanacak davranışları ölçmek için test maddelerini yazmak ve yazılan maddeler arasından bazılarını seçmek söz konusudur. Sorulan kapsam geçerliliğine uygun olarak seçilmemesi durumu ölçümlerin geçerliği ve güvenirliği düşer. Seçilen test maddelerinin nitelikleri hem test puanlarının güvenirliğini hem de kapsam geçerliğini önemli ölçüde etkilemektedir. c) İstenmedik Değişkenlerin Ölçümlere Karışması Ölçme aracının ölçmeyi amaçlamadığı değişkenlerinde ölçümleri etkilemesi de geçerliliği düşürür.( tarih dersinde kompozisyon sınavında yazı güzelliğine puan verilmesi) d) Test Yanlılığı Öğrencilerin aynı düzeyde olmalarına rağmen , testteki performansları veya test başarılarının farklı olması durumunda testin yanlı sonuçlar verdiği yorumlanır.
11. e) Normlar Normlara dayalı bir ölçme ve değerlendirme yapılacaksa, norm oluşturan grubun evreni yeterli düzey de temsil etmemesi geçerliliği düşürür. ÜNİTE SORULARI “ bir başarı testinden elde edilen ölçümlerin geçerliliği yüksektir” demekle kast edilen nedir? Açılayınız örnek vererek. Yapı geçerliliğini bir örnekle açıklayınız. Uygulanmış bir sınavın geçerlik çalışması nasıl yapılabilir?