SlideShare a Scribd company logo
1 of 42
Veriler için Güvenirlik ve Geçerlik
1
Veriler için Güvenirlik ve Geçerlik
Saed Jama Abdi
Anadolu Üniversitesi
İstatistik Bölüm
25 Mayıs, 2016
2
SUNUM İÇERİĞİ
 Giriş
 Terimlerin tanımı
 Güvenilirlik Türleri
 Güvenilirlik ölçümü
 Örnek (spss)
 Geçerlilik Türleri
 Geçerlilik ölçümü
 Örnek (spss)
3
Giriş
Veri, araştırmada süreçten geçirilecek, işlenecek, ve
anlam verilecek enformasyon veya ölçülmüş bilgi
demektir.
Temel olarak iki ana veri türü vardır. niceliksel ve
nitelikseldir. Eğer veri sayısal biçimdeyse niceliksel veri
denir. sayısal olmayan ise nitelikseldir.
Her niteliksel veri ölçeklere konularak, gruplaştılırak,
nicesel bakimdan ifade edebilir.
4
Bilimsel araştırma sürecinde araştırmacı temelde
bir açıklama bir soruya cevap aramaktadır.
Bu cevabın doğruluğu, yanlışlığı ya da hatalı
ölçümü ile ilgili olarak ise bilimsel araştırma
yöntemlerinin geliştirdiği iki kavram ön plana
çıkmaktadır; geçerlilik ve güvenilirlilik.
5
Güvenirlik ve geçerlik bir tasarımda,
uygulamada, analiz ve değerlendirmede hata
yapmamayla ilgilidir.
Bu hatalardan önde gelenleri; yanliş nedensellik
bağları kurmayla beslenen yanlışlıklar, nüfusun
tanımı, örneklem çerçevesinin çıkartılması ve
örneklem almayla ilgili hatalar; sorularla ve
ölçmeyle ilgili hatalar.
6
Güvenirlik
Bir ölçme aracının ölçmeye çalıştığı bir özelliği her
defasında aynı sonucu verecek şekilde ölçebilmesi
(Sabancı, 2000).
Güvenirlik, bir ölçme aracının, ölçe hedeflediği özelliği
ne kadar doğru ölçütüğü anlamı gelmektedir.
Bir ölçme aracı her uygulanışında aynı sonucu veriyorsa
güvenilirdir.
7
Bu açıdan ele alındığında, güvenirlik kavramı,
ölçümlerin dakıklığı tutarlılığı, yordanabilirliği ve hatan
arınıklığı kavramlarıyla yakından ılışkıdı.
Güvenirlik ile ölçme hatası arasında ters bir ilişki
vardır; yani güvenirlik arttıkça ölçme işleminde yapılan
hata oranı da o derece düşer (Sabancı, 2000).
Bir ölçme aracı ne kadar çok hatalı sonuç veriyorsa o
kadar az güvenilirdir.
8
ölçüm aracı yardımıyla alınan ölçümün iki birleşen vardır.
𝜎𝑡
2
= 𝜎𝑔
2
+𝜎𝑒
2
𝜎𝑡
2
= toplam varyans
𝜎𝑔
2
= gerçek varyans
𝜎𝑒
2 = hata varyans. Anlamina gelmektedir.
Buna dayanarak, güvenirlik şöyle tanımlanabilir.
Gerçek varyansın, toplam varyansa oranı güvenirliktir.
Güvenirlik, bir korelasyon katsayısı olduğundan, yukarıdakı
tanım dıkkate alınarak şu eşitlik yazılabilir.
9
𝑟𝑡𝑡 =
𝜎𝑔
2
𝜎𝑡
2
𝜎𝑡
2
𝜎𝑡
2 =
𝜎 𝑔
2
𝜎𝑡
2 +
𝜎 𝑒
2
𝜎𝑡
2 1 =
𝜎 𝑔
2
𝜎𝑡
2 +
𝜎 𝑒
2
𝜎𝑡
2 bulunur
𝜎 𝑔
2
𝜎𝑡
2 güvenirlik olduğuna göre:
𝑟𝑡𝑡 = 1 −
𝜎 𝑒
2
𝜎𝑡
2
10
1. Test-Tekrar Test Güvenirliği
(Test-Retest Reliability)
2. İç Tutarlılık Güvenirlik
(Internal consistency
reliability)
 iki yarı güvenirliği (Split half
Reliability Test)
 Cronbach’s alpha güvenirliği
 Kuder-Richardson (KR20).
11
Güvenilirlik Teknikleri
1. Test-retest
2. Parallel Forms
3. Split-half
T1 T2
A1 A2
T
A B
Score Score
1
100
50 pairs
4. Internal Consistency
K-R-20 Coefficient
Alpha
12
Test-Tekrar Test Güvenirliği
(Test-Retest Reliability)
Bu yöntemle test güvenirliğini kestirmek için, bir test aynı
gruba belli bir zaman aralığıyla iki kez uygulanır. Daha sonra
bireylerin birinci uygulamada aldıkları puanlarla ikinci
uygulamada aldıkları puanlar arasındaki korelasyon bulunur.
Elde edilen korelasyon katsayısı testin güvenirlik katsayısıdır.
Güvenirlikle ilgili korelasyon tam yani 1 olması hiç sıra
değişmesi olmadığını, 0 olması ise sıralar arasında hiçbir ilişki
bulunmadığını gösterir.
13
Test Tekrar Test Yönteminin
Hesaplanması
ÖĞRENCİ I.
UYGULAMA
(X)
II.
UYGULA
MA (Y)
X
2
Y
2
XY
1 15 17 225 289 255
2 16 15 256 225 240
3 17 17 289 289 289
4 10 11 100 121 110
5 14 14 196 196 196
6 6 5 36 25 30
7 17 17 289 289 289
8 12 11 144 121 132
9 3 4 9 16 12
10 8 9 64 81 72
11 9 9 81 81 81
12 14 14 196 196 196
13 15 13 225 169 195
14 12 13 144 169 156
15 15 15 225 225 225
N=15  X 183  184Y  X
2
=2479
 Y
2
=2492
  2478XY
14







 








 






 
NN
N
YX
XY
Y
Y
X
X
rXY
)()
2
2
2
2
(
)()(
95.0
15
33856
2492
15
33489
2479
15
184183
2478
















rXY
Sunulan örnekte bir test aynı öğrenci grubuna belli bir süre
arayla iki kez uygulanıyor ve uygulama sonuçları arasındaki
korelasyon katsayısı 0.95 olarak bulunuyor ve testin
güvenirlinin yüksek olduğu söylenebilir.
15
İç Tutarlılık Güvenirlik
iki yarı güvenirliği (Split half Reliability Test)
iki yarım güvenirliği için tek bir test formu hazırlanır ve
mümküm olan durumlarda, maddelerin sırası
seçkisizleştirilir (randamizyon).
Test uyguladıktan sorna her hangı bir yolla ikiye ayrılır
ve testın iki yarısından alınan puanlar arasındakı
korelesyon hesaplanır.
16
Uygulanmış olan test iki eşdeğer (equivalence) yarıya
bölünerek öğrencilerin testin iki yarısından aldıkları puanlar
arasındaki korelasyon hesaplanır ve daha sonra bu hesaplanan
korelasyondan hareketle Spearman–Brown formülünden de
yararlanarak testin bütünün güvenirliği kestirilir.
Bu yöntem, aslında iç tutarlılık katsayısı verir. Spearman-
Brown formülü aşağıdaki gibidir.
17
Spearman-Brown Formula.
𝑟𝑥𝑥 =
2𝑟ℎℎ
1+𝑟ℎℎ
Mesela eğer 𝑟ℎℎ = 0.80 ise
rxx = 0.89 olacak
iki-yarım Testin
Güvenilirliği
18
Örnek
Reliability Statistics
Cronbach's Alpha
Part 1
Value .593
N of Items 4a
Part 2
Value .239
N of Items 3b
Total N of Items 7
Correlation Between Forms .517
Spearman-Brown Coefficient
Equal Length .682
Unequal Length .685
Guttman Split-Half Coefficient .654
a. The items are: K11a. K11b. K11c.K11d.
b. The items are: K11e. K11f. K11g.
Tüm
Testinin
Güvenilirliği
İlk 4 madd
ikinci 3 mad
ortalamasi/to
bulmak ve
sonra korel
k. hesaplan
19
Kuder-Richardson (KR20)
Kuder-Richardson (KR20) Anket soruları iki şıklı olduğu
durumda, mesela geçti kaldı veya evet hayır gibi kullanıllan
bir yöntemdir.
Geçti oranı p ile gösterilir ve kaldı oranı 1-p ile gösterilir.
𝑟𝑥𝑥 =
𝑛
𝑛 − 1
𝑠 𝑥
2
− 𝑖=1
𝑛
𝑝 𝑖 𝑞 𝑖
𝑠 𝑥
2
• n = Testin soru sayısı
• p = Madde güçlüğü
• q = 1- p
• 𝑠 𝑥
2
= Testin varyansı
20
Örnek
Reliability Statistics
Cronbach's Alpha Cronbach's Alpha Based
on Standardized Items
N of Items
.684 .692 5
21
Inter-Item Correlation Matrix
K11a. K11b. K11c. K11d. K11e.
K11a. 1.000 .311 .103 .378 .412
K11b. .311 1.000 .204 .366 .386
K11c. .103 .204 1.000 .251 .266
K11d. .378 .366 .251 1.000 .420
K11e. .412 .386 .266 .420 1.000
Item-Total Statistics
Scale Mean if
Item Deleted
Scale Variance
if Item
Deleted
Corrected
Item-Total
Correlation
Squared
Multiple
Correlation
Cronbach's
Alpha if Item
Deleted
K11a. 4.83 1.466 .428 .237 .642
K11b. 4.72 1.261 .455 .218 .627
K11c. 4.83 1.433 .288 .103 .700
K11d. 4.65 1.166 .516 .277 .597
K11e. 4.82 1.325 .547 .311 .593
Düşük
korelasy
…
C
Al
22
Cronbach’s Alpha Güvenirliği
Alpha güvenirlik katsayısı tek bir uygulama gerektiren
güvenirlik bulma tekniklerinden biridir.
Ağırlıklı puanlama veya dereceleme yöntemiyle puanlama
uygulandığı durumlarda kullanılabilecek bir güvenirlik
hesaplama tekniğidir.
23
Testi oluşturan maddelerin dereceleme ölçeğine göre
puanlanması (1’den 5’e kadar veya 0’dan 4’e kadar gibi)
genellikle tutum amacıyla hazırlanan ölçme araçlarının
puanlanmasında veya tutum ölçeklerinin puanlanmasında
kullanılmakla birlikte kısa cevaplı testlerin güvenirliğinin
kestirilmesinde de kullanılabilir.
Alpha katsayısının hesaplanması için kullanılan bağıntı
aşağıdaki gibidir.
24
𝛼 =
𝑘
𝑘 − 1
1 −
1
𝑠 𝑇
2
𝑖=1
𝑘
𝑠𝑖
2
 K = Testin soru sayısı
 𝒔𝒊
𝟐
= Testin varyansı
 𝒔 𝑻
𝟐
𝑇 maddesinin varyansı
25
(Nunnally, 1978) göre minimum kabul edilebilir
güvenilirlik değeri 0.7’dir, ayrica (Cronbach, 1951;
Helmstater 1964) göre 0.5 daha fazla güvenilirlik testi
kabul edilebilir.
Örnek:
Reliability Statistics
Cronbach's Alpha Cronbach's Alpha
Based on
Standardized Items
N of Items
.621 .613 8
26
Geçerlilik
...ölçme sonuçlarının ölçerlığı, amaclanan ölçmenin
gerçekleştirebilme derecesidir.
…bir araştırma tasarımının ölçmek istediğini ölçüp ölçmediği
ile ilgilidir.
Açık uçlu ve kapalı uçlu olarak biçimlendirilmiş sorular ölçme
isteneni ölçüyor mu. eğer ölmüyorsa geçerlilik sorunu vardır.
27
Genellikle anket bütün olarak probleme
uydurulmaya çalışılmış, tüm problemin ayrı ayrı
özellikleriyle ilgili, nispeten özel ve birbirinden
bağımsız sorulardan meydana gelmiştir.
Bu bakımdan tüm anketin geçerlik derecesi
yerine değişik soruların geçerliğini düşünmek
daha doğru görülmektedir.
28
Geçerli (doğru) bir test aynı zamanda güvenilir
bir testtir, ancak, Güvenilir bir test geçerli bir test
olmayabilir !!!!
29
• Ölçme aracı belli bir amaç ve belli durumlar için geçerlidir.
Başka bir amaç için geçerli sayılmaz. Örneğin bir grup
öğrenciye uygulandığında geçerli olan test diğer öğrenci
grubuna uygulandığında geçerli olmayabilir (Karasar:
2003; 151).
• Örneğin Türkçe dersinde yazılı anlatım becerisini ölçen bir
test bu amaca hizmet ettiği sürece geçerlidir. Aynı testi
beden eğitimi dersi için kullanamayız. Çünkü o dersin
amaçları için hazırlanmamıştır (Sönmez:2003;418).
30
Geçerlik Türler
literatürde değişik sınıflandırılmalara rastlamakla APA
1997 ile Croceker ve Algina’nin geçerlik türlerin üç
toplanması daha çok tercih edilmektedir.
1. İçerik (Kapsam) Geçerliği (Content Validity).
2. Yordama (deneysel) Geçerliği (predictive validity).
3. Yapı Geçerliği (construct validity).
31
İçerik Geçerliği (content validity).
İçerik geçerliği, ölçme aracında bulunan soruların
(maddelerin) ölçme amacına uygun olup olmadığı, ölçülmek
istenen alanı temsil edip etmediği sorunu ile ilgili olup,
"uzman görüşüne göre saptanır.
Kapsam geçerliği, bir bütün olarak testin ve testteki her bir
maddenin maksada ne derece hizmet ettiğidir (Tekin: 2008;
45).
32
Örneğin, öğrencinin basketbol uygulama durumu
değerlendirildiğinde sadece pas çalışması ile değerlendirmenin
yapılması diğer basketbol tekniklerinin durumunu anlamak
için bilgi vermez.
Bu durumun önlenmesi için uzman grubuna başvurulup
görüşleri alınarak ölçme aracının geçerliği yapılmış olur.
33
Yordama Geçerliği (predictive validity)
Yordama geçerliği, yapılan ölçme ile ölçülmeye çalışılan şeyin
gerçek hayattaki yansımalarının karşılaştırılmasındaki
uyumdur.
Örneğin okulda alınan notların hayattaki başarı ile olan ilişkisi
aranabilir. Okuldaki notları yüksek olanlar hayatta da başarılı
oluyorlarsa, okuldaki ölçmeler geçerlidir denir.
34
ÖSS korelasyon Akademik başarı
(yordayıcı) (ölçüt)
İşe giriş sınavı korelasyon İş yerindeki performans
(yordayıcı) (ölçüt)
35
Yapı Geçerliği (Construct Validity)
Yapı geçerliği, bilimsel olduğu kadar, felsefi yönü de ağır
basan bir geçerlik ölçütüdür. Kuramsal (theoritical) olarak,
geçerlik ölçmenin dayandığı "temel kuramların" geçerliği ile
ilgilidir.
Yani, önceden kabul edilen olası "neden-sonuç" ilişkileri ile
ilgilidir özellikle, dolaylı ölçmelerin yapıldığı (asıl ölçülmek
istenen şeyin onun çeşitli belirtileri ile ölçüldüğü) durumlarda,
ölçülen belirtilerin, gerçekten aranan belirtiler olup olmadığı
sorunu vardır.
36
Geçerlik ve Güvenirlik Arasındaki İlişki
Güvenirlik sabit ve sistemli hatalardan etkilenmeyip
sadece rasgele hatalardan etkilenir.
 Güvenirlik, geçerlik için gerekli koşuldur, fakat
yeterli koşul değildir.
 Güvenirliği yüksek olan bir testin geçerliği yüksek
olmayabilir.
37
Geçerlilik Test için EFA kullanılır
SD = Strongly disagree, D = Disagree, N = Neither, A = Agree, SA = Strongly Agree
S D D N A S A
1 Statistics makes me cry O O O O O
2 My friends will think I'm stupid for not being able to cope with SPSS. O O O O O
3 Standard deviations excite me. O O O O O
4 I dream that Pearson is attacking me with correlation coefficients. O O O O O
5 I don't understand statistics. O O O O O
6 I have little experience of computers. O O O O O
7 All computers hate me. O O O O O
8 I have never been good at mathematics. O O O O O
9 My friends are better at statistics than me. O O O O O
10 Computers are useful only for playing games O O O O O
11 I did badly at mathematics at school. O O O O O
12 O O O O O
13 O O O O O
14 O O O O O
15 Computers are out to get me. O O O O O
16 I weep openly at the mention of central tendency. O O O O O
17 I slip into a coma whenever I see an equation. O O O O O
18 SPSS always crashes when I try to use it. O O O O O
19 Everybody looks at me when I use SPSS. O O O O O
20 I can't sleep for thoughts of eigenvectors. O O O O O
21 O O O O O
22 My friends are better a SPSS than I am. O O O O O
23 If I am good at statistics people will think I am a nerd. O O O O O
People try to tell you that SPSS makes statistics easier to understand
but it doesn't.
I worry that I will cause irreparable damage because of my incomptence
with computers.
Computers have minds of their own and deliberately go wrong
whenever I use them.
I wake up under my duvet thinking that I am trapped under a normal
distribution.
38
Örnek
KMO and Bartlett's Test
,930
19334,492
253
,000
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Approx. Chi-Square
df
Sig.
Bartlett's Test of
Sphericity
KMO-measures >.9
are superb!
KMO measures the ratio of the squared
correlation between variables
to the squared partial correlation
between variables.
KMO measures for
individual factors are
produced on the diagonal
of the anti-image corr
matrix
The KMO-measures
give us a hint at
which variables should
be excluded from
the factor analysis
Bartlett's test tests if the matrix is an
identity matrix (matrix with only 1's in the
diagonal and 0's off-diagonal). However,
we want to have correlated variables, so
the off-diagonal elements should NOT be
0. Thus, the test should be significant,
i.e., the R-matrix should NOT be an
identity matrix.
39
Factor structure refers to the Intercorrelations among the variables being tested in
the EFA
Pattern Matrixa
,706
,591
-,511
,405
,400
,643
,621
,615
,507
,885
,713
,653
,650
,588
,585
,412 ,462
,411
-,902
-,774
-,774
Q20 I can't sleep for thoughts of eigen vectors
Q21 I wake up under my duvet thinking that I am trapped under a normal
distribtion
Q03 Standard deviations excite me
Q04 I dream that Pearson is attacking me with correlation coefficients
Q16 I weep openly at the mention of central tendency
Q01 Statiscs makes me cry
Q05 I don't understand statistics
Q22 My friends are better at SPSS than I am
Q09 My friends are better at statistics than me
Q23 If I'm good at statistics my friends will think I'm a nerd
Q02 My friends will think I'm stupid for not being able to cope with SPSS
Q19 Everybody looks at me when I use SPSS
Q06 I have little experience of computers
Q18 SPSS always crashes when I try to use it
Q07 All computers hate me
Q13 I worry that I will cause irreparable damage because of my
incompetenece with computers
Q14 Computers have minds of their own and deliberately go wrong
whenever I use them
Q10 Computers are useful only for playing games
Q12 People try to tell you that SPSS makes statistics easier to understand
but it doesn't
Q15 Computers are out to get me
Q08 I have never been good at mathematics
Q17 I slip into a coma whenever I see an equation
Q11 I did badly at mathematics at school
1 2 3 4
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Oblimin with Kaiser Normalization.
Rotation converged in 29 iterations.a.
F1:
'Fear of statistics'
F2:
'Fear of peer
evaluation'
F3:
'Fear of computers'
F4:
‘ Fear of mathemat
40
Güvenirlik Belirleme Tekniklerine İlişkin Özet
Bilgiler
Güvenirlik
Katsayısı Tipi Anlamı
Gereken form
sayısı
Uygulama sayısı Hata varyansı
kaynağı
KUDER-
RICHARSON KR
- 20 ve KR - 21
İç tutarlık Bir Bir
Kapsam örneklemi
ve heterojenliği
CRONBACH ALFA İç tutarlık Bir Bir
Kapsam örneklemi
ve heterojenliği
İKİ YARI İç tutarlık Bir Bir Kapsam örneklemi
TEST-TEKRAR
TEST
Kararlılık Bir İki Zaman örneklemi
PARALEL
FORMLAR
Tutarlık İki İki Zaman ve kapsam
41
Kaynaklar
• Making Sense of Cronbach’s alpha, Article, MOHSEN TAVAKOL, REG DENNIC,
2011
• Handbook of Health Research Methods: Investigation Measurement and Analysis,
SHAH EBRAHIM, ANN BOWLING.
• Statistical Analysis in psychology and Education. George A.Ferguson. FIFTH
EDITION.
• Best Split-Half and Maximum Reliability Satyendra Nath Chakrabartty (Prof,
Galgotias Business School, India).
• Assessing Construct Validity: The Utility of Factor Analysis Cheng Hsiung Lu.
• Reliability and validity testing of a new scale for measuring attitude towards
learning statistics with technology, Article. Volume 4, November 1, 2011.
• http://badmforum.blogspot.com.tr/2012/08/factor-analysis-kmo-bartletts-test.html.
• ARAŞTIRMA YÖNTEMLERİ DERSİ ÖDEVİ. YRD. DOÇ. DR. HASAN
HÜSEYİN AKSOY. Ankara Mayis 2006.
• Ölçme Araçlarının Yapısal Nitelikleri, Dr. Fatih DERVENT.
42

More Related Content

What's hot

Two-Way ANOVA Overview & SPSS interpretation
Two-Way ANOVA Overview & SPSS interpretationTwo-Way ANOVA Overview & SPSS interpretation
Two-Way ANOVA Overview & SPSS interpretationSr Edith Bogue
 
Normality test on SPSS
Normality test on SPSSNormality test on SPSS
Normality test on SPSSAmnaFazal3
 
Anova by Hazilah Mohd Amin
Anova by Hazilah Mohd AminAnova by Hazilah Mohd Amin
Anova by Hazilah Mohd AminHazilahMohd
 
Merkezi Eğilim ve Dağılım Ölçüleri
Merkezi Eğilim ve Dağılım ÖlçüleriMerkezi Eğilim ve Dağılım Ölçüleri
Merkezi Eğilim ve Dağılım ÖlçüleriGülşah Başol
 
Qualitative Data Analysis
Qualitative Data  AnalysisQualitative Data  Analysis
Qualitative Data AnalysisMaisa Rahman
 
Application of statistical tests in Biomedical Research .pptx
Application of statistical tests in Biomedical Research .pptxApplication of statistical tests in Biomedical Research .pptx
Application of statistical tests in Biomedical Research .pptxHalim AS
 
Critical Appraisal of systematic review and meta analysis articles
Critical Appraisal of systematic review and meta analysis articlesCritical Appraisal of systematic review and meta analysis articles
Critical Appraisal of systematic review and meta analysis articlesDr. Majdi Al Jasim
 
The Chi Square Test
The Chi Square TestThe Chi Square Test
The Chi Square TestMax Chipulu
 
Mixed between-within groups ANOVA
Mixed between-within groups ANOVAMixed between-within groups ANOVA
Mixed between-within groups ANOVAMahsa Farahanynia
 
ANCOVA-Analysis-of-Covariance.pptx
ANCOVA-Analysis-of-Covariance.pptxANCOVA-Analysis-of-Covariance.pptx
ANCOVA-Analysis-of-Covariance.pptxRomielyn Beran
 
One way anova in spss (procedure and output)
One way anova in spss (procedure and output)One way anova in spss (procedure and output)
One way anova in spss (procedure and output)Unexplord Solutions LLP
 
What is a phi coefficient?
What is a phi coefficient?What is a phi coefficient?
What is a phi coefficient?Ken Plummer
 
T12 non-parametric tests
T12 non-parametric testsT12 non-parametric tests
T12 non-parametric testskompellark
 

What's hot (20)

Two-Way ANOVA Overview & SPSS interpretation
Two-Way ANOVA Overview & SPSS interpretationTwo-Way ANOVA Overview & SPSS interpretation
Two-Way ANOVA Overview & SPSS interpretation
 
Normality test on SPSS
Normality test on SPSSNormality test on SPSS
Normality test on SPSS
 
Anova by Hazilah Mohd Amin
Anova by Hazilah Mohd AminAnova by Hazilah Mohd Amin
Anova by Hazilah Mohd Amin
 
Merkezi Eğilim ve Dağılım Ölçüleri
Merkezi Eğilim ve Dağılım ÖlçüleriMerkezi Eğilim ve Dağılım Ölçüleri
Merkezi Eğilim ve Dağılım Ölçüleri
 
Normality tests
Normality testsNormality tests
Normality tests
 
Qualitative Data Analysis
Qualitative Data  AnalysisQualitative Data  Analysis
Qualitative Data Analysis
 
Application of statistical tests in Biomedical Research .pptx
Application of statistical tests in Biomedical Research .pptxApplication of statistical tests in Biomedical Research .pptx
Application of statistical tests in Biomedical Research .pptx
 
Probability
ProbabilityProbability
Probability
 
Psychological Statistics Chapter 2
Psychological Statistics Chapter 2Psychological Statistics Chapter 2
Psychological Statistics Chapter 2
 
Chi square mahmoud
Chi square mahmoudChi square mahmoud
Chi square mahmoud
 
Critical Appraisal of systematic review and meta analysis articles
Critical Appraisal of systematic review and meta analysis articlesCritical Appraisal of systematic review and meta analysis articles
Critical Appraisal of systematic review and meta analysis articles
 
Validity and reliability
Validity and reliabilityValidity and reliability
Validity and reliability
 
The Chi Square Test
The Chi Square TestThe Chi Square Test
The Chi Square Test
 
Mixed between-within groups ANOVA
Mixed between-within groups ANOVAMixed between-within groups ANOVA
Mixed between-within groups ANOVA
 
ANCOVA-Analysis-of-Covariance.pptx
ANCOVA-Analysis-of-Covariance.pptxANCOVA-Analysis-of-Covariance.pptx
ANCOVA-Analysis-of-Covariance.pptx
 
qualitative analysis
qualitative analysisqualitative analysis
qualitative analysis
 
ANOVA II
ANOVA IIANOVA II
ANOVA II
 
One way anova in spss (procedure and output)
One way anova in spss (procedure and output)One way anova in spss (procedure and output)
One way anova in spss (procedure and output)
 
What is a phi coefficient?
What is a phi coefficient?What is a phi coefficient?
What is a phi coefficient?
 
T12 non-parametric tests
T12 non-parametric testsT12 non-parametric tests
T12 non-parametric tests
 

Viewers also liked

Viewers also liked (16)

Statistics 1
Statistics 1Statistics 1
Statistics 1
 
Scale Development
Scale DevelopmentScale Development
Scale Development
 
Si̇gara ve bi̇li̇şsel davranişçi terapi̇
Si̇gara ve bi̇li̇şsel davranişçi terapi̇Si̇gara ve bi̇li̇şsel davranişçi terapi̇
Si̇gara ve bi̇li̇şsel davranişçi terapi̇
 
01 konsep statistik 2014
01 konsep statistik 201401 konsep statistik 2014
01 konsep statistik 2014
 
Cognitive therapies
Cognitive therapiesCognitive therapies
Cognitive therapies
 
Türk Eğitim Tarihi - Ana Hatlar
Türk Eğitim Tarihi - Ana HatlarTürk Eğitim Tarihi - Ana Hatlar
Türk Eğitim Tarihi - Ana Hatlar
 
Alteryx 2016 Veri Analitigi Ongoruleri
Alteryx 2016 Veri Analitigi OngoruleriAlteryx 2016 Veri Analitigi Ongoruleri
Alteryx 2016 Veri Analitigi Ongoruleri
 
İstatistik Temel Kavramlar
İstatistik Temel Kavramlarİstatistik Temel Kavramlar
İstatistik Temel Kavramlar
 
Türk Eğitim Tarihi - Osmanlı Dönemi - Kuruluştan Eğitimde İlk Yenileşme Harek...
Türk Eğitim Tarihi - Osmanlı Dönemi - Kuruluştan Eğitimde İlk Yenileşme Harek...Türk Eğitim Tarihi - Osmanlı Dönemi - Kuruluştan Eğitimde İlk Yenileşme Harek...
Türk Eğitim Tarihi - Osmanlı Dönemi - Kuruluştan Eğitimde İlk Yenileşme Harek...
 
İstatistiğin Temel Kavramları
İstatistiğin Temel Kavramlarıİstatistiğin Temel Kavramları
İstatistiğin Temel Kavramları
 
Türk tari̇hi̇
Türk tari̇hi̇Türk tari̇hi̇
Türk tari̇hi̇
 
Parametrik ve Parametrik Olmayan İstatistikler
Parametrik ve Parametrik Olmayan İstatistiklerParametrik ve Parametrik Olmayan İstatistikler
Parametrik ve Parametrik Olmayan İstatistikler
 
Sunum
SunumSunum
Sunum
 
Statistics
StatisticsStatistics
Statistics
 
NİTEL ARAŞTIRMA YÖNTEMLERİNDE ÖRNEKLEM SEÇİMİ
NİTEL ARAŞTIRMA YÖNTEMLERİNDE ÖRNEKLEM SEÇİMİNİTEL ARAŞTIRMA YÖNTEMLERİNDE ÖRNEKLEM SEÇİMİ
NİTEL ARAŞTIRMA YÖNTEMLERİNDE ÖRNEKLEM SEÇİMİ
 
Modern turkey jacoby
Modern turkey jacobyModern turkey jacoby
Modern turkey jacoby
 

Similar to Güvenirlik ve Geçerlik (Validity & Reliability )

İleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma Yöntemleriİleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma YöntemleriGizem Turgut
 
öLçümlerin geçerliliği
öLçümlerin geçerliliğiöLçümlerin geçerliliği
öLçümlerin geçerliliğidilekservet
 
Sunu1 (1)
Sunu1 (1)Sunu1 (1)
Sunu1 (1)AYTUL92
 
Güvenirlik ve Geçerlik.ppt
Güvenirlik ve Geçerlik.pptGüvenirlik ve Geçerlik.ppt
Güvenirlik ve Geçerlik.ppthadjimehmet
 
Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...
Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...
Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...Andy Samthre
 
Analitik Yöntem Validasyonu ve Detaylı Açıklamalar
Analitik Yöntem Validasyonu ve Detaylı AçıklamalarAnalitik Yöntem Validasyonu ve Detaylı Açıklamalar
Analitik Yöntem Validasyonu ve Detaylı AçıklamalarHalilIbrahimUlusoy
 
Güvenirlik Analizi
Güvenirlik AnaliziGüvenirlik Analizi
Güvenirlik AnaliziEngin Çakir
 
Analiz sonuçlarının istatistiksel değerlendirilmesi
Analiz sonuçlarının istatistiksel değerlendirilmesiAnaliz sonuçlarının istatistiksel değerlendirilmesi
Analiz sonuçlarının istatistiksel değerlendirilmesiibrahim bulduk
 
Stata Uygulamalı Panel Eşbütünleşme Testleri ve Model Tahmini
Stata Uygulamalı Panel Eşbütünleşme Testleri ve Model TahminiStata Uygulamalı Panel Eşbütünleşme Testleri ve Model Tahmini
Stata Uygulamalı Panel Eşbütünleşme Testleri ve Model Tahminiyigitcanozmeral
 
Uzaktan eği̇ti̇mde ölçme ve değerlendi̇rme
Uzaktan eği̇ti̇mde ölçme ve değerlendi̇rmeUzaktan eği̇ti̇mde ölçme ve değerlendi̇rme
Uzaktan eği̇ti̇mde ölçme ve değerlendi̇rmeozgurkaragoz54
 
01 giris1(1)
01 giris1(1)01 giris1(1)
01 giris1(1)Hoca26
 

Similar to Güvenirlik ve Geçerlik (Validity & Reliability ) (17)

İleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma Yöntemleriİleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma Yöntemleri
 
öLçümlerin geçerliliği
öLçümlerin geçerliliğiöLçümlerin geçerliliği
öLçümlerin geçerliliği
 
Geçerlilik
GeçerlilikGeçerlilik
Geçerlilik
 
Sunu1 (1)
Sunu1 (1)Sunu1 (1)
Sunu1 (1)
 
Güvenirlik ve Geçerlik.ppt
Güvenirlik ve Geçerlik.pptGüvenirlik ve Geçerlik.ppt
Güvenirlik ve Geçerlik.ppt
 
Veri̇anali̇zi̇
Veri̇anali̇zi̇Veri̇anali̇zi̇
Veri̇anali̇zi̇
 
Veri̇anali̇zi̇
Veri̇anali̇zi̇Veri̇anali̇zi̇
Veri̇anali̇zi̇
 
Veri̇anali̇zi̇
Veri̇anali̇zi̇Veri̇anali̇zi̇
Veri̇anali̇zi̇
 
Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...
Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...
Ki kare ve kolmogorov smirnov uygunluk testlerinin simülasyon ile elde edilen...
 
Analitik Yöntem Validasyonu ve Detaylı Açıklamalar
Analitik Yöntem Validasyonu ve Detaylı AçıklamalarAnalitik Yöntem Validasyonu ve Detaylı Açıklamalar
Analitik Yöntem Validasyonu ve Detaylı Açıklamalar
 
Güvenirlik Analizi
Güvenirlik AnaliziGüvenirlik Analizi
Güvenirlik Analizi
 
Analiz sonuçlarının istatistiksel değerlendirilmesi
Analiz sonuçlarının istatistiksel değerlendirilmesiAnaliz sonuçlarının istatistiksel değerlendirilmesi
Analiz sonuçlarının istatistiksel değerlendirilmesi
 
Skula
SkulaSkula
Skula
 
Deney tasarımı
Deney tasarımıDeney tasarımı
Deney tasarımı
 
Stata Uygulamalı Panel Eşbütünleşme Testleri ve Model Tahmini
Stata Uygulamalı Panel Eşbütünleşme Testleri ve Model TahminiStata Uygulamalı Panel Eşbütünleşme Testleri ve Model Tahmini
Stata Uygulamalı Panel Eşbütünleşme Testleri ve Model Tahmini
 
Uzaktan eği̇ti̇mde ölçme ve değerlendi̇rme
Uzaktan eği̇ti̇mde ölçme ve değerlendi̇rmeUzaktan eği̇ti̇mde ölçme ve değerlendi̇rme
Uzaktan eği̇ti̇mde ölçme ve değerlendi̇rme
 
01 giris1(1)
01 giris1(1)01 giris1(1)
01 giris1(1)
 

Güvenirlik ve Geçerlik (Validity & Reliability )

  • 1. Veriler için Güvenirlik ve Geçerlik 1
  • 2. Veriler için Güvenirlik ve Geçerlik Saed Jama Abdi Anadolu Üniversitesi İstatistik Bölüm 25 Mayıs, 2016 2
  • 3. SUNUM İÇERİĞİ  Giriş  Terimlerin tanımı  Güvenilirlik Türleri  Güvenilirlik ölçümü  Örnek (spss)  Geçerlilik Türleri  Geçerlilik ölçümü  Örnek (spss) 3
  • 4. Giriş Veri, araştırmada süreçten geçirilecek, işlenecek, ve anlam verilecek enformasyon veya ölçülmüş bilgi demektir. Temel olarak iki ana veri türü vardır. niceliksel ve nitelikseldir. Eğer veri sayısal biçimdeyse niceliksel veri denir. sayısal olmayan ise nitelikseldir. Her niteliksel veri ölçeklere konularak, gruplaştılırak, nicesel bakimdan ifade edebilir. 4
  • 5. Bilimsel araştırma sürecinde araştırmacı temelde bir açıklama bir soruya cevap aramaktadır. Bu cevabın doğruluğu, yanlışlığı ya da hatalı ölçümü ile ilgili olarak ise bilimsel araştırma yöntemlerinin geliştirdiği iki kavram ön plana çıkmaktadır; geçerlilik ve güvenilirlilik. 5
  • 6. Güvenirlik ve geçerlik bir tasarımda, uygulamada, analiz ve değerlendirmede hata yapmamayla ilgilidir. Bu hatalardan önde gelenleri; yanliş nedensellik bağları kurmayla beslenen yanlışlıklar, nüfusun tanımı, örneklem çerçevesinin çıkartılması ve örneklem almayla ilgili hatalar; sorularla ve ölçmeyle ilgili hatalar. 6
  • 7. Güvenirlik Bir ölçme aracının ölçmeye çalıştığı bir özelliği her defasında aynı sonucu verecek şekilde ölçebilmesi (Sabancı, 2000). Güvenirlik, bir ölçme aracının, ölçe hedeflediği özelliği ne kadar doğru ölçütüğü anlamı gelmektedir. Bir ölçme aracı her uygulanışında aynı sonucu veriyorsa güvenilirdir. 7
  • 8. Bu açıdan ele alındığında, güvenirlik kavramı, ölçümlerin dakıklığı tutarlılığı, yordanabilirliği ve hatan arınıklığı kavramlarıyla yakından ılışkıdı. Güvenirlik ile ölçme hatası arasında ters bir ilişki vardır; yani güvenirlik arttıkça ölçme işleminde yapılan hata oranı da o derece düşer (Sabancı, 2000). Bir ölçme aracı ne kadar çok hatalı sonuç veriyorsa o kadar az güvenilirdir. 8
  • 9. ölçüm aracı yardımıyla alınan ölçümün iki birleşen vardır. 𝜎𝑡 2 = 𝜎𝑔 2 +𝜎𝑒 2 𝜎𝑡 2 = toplam varyans 𝜎𝑔 2 = gerçek varyans 𝜎𝑒 2 = hata varyans. Anlamina gelmektedir. Buna dayanarak, güvenirlik şöyle tanımlanabilir. Gerçek varyansın, toplam varyansa oranı güvenirliktir. Güvenirlik, bir korelasyon katsayısı olduğundan, yukarıdakı tanım dıkkate alınarak şu eşitlik yazılabilir. 9
  • 10. 𝑟𝑡𝑡 = 𝜎𝑔 2 𝜎𝑡 2 𝜎𝑡 2 𝜎𝑡 2 = 𝜎 𝑔 2 𝜎𝑡 2 + 𝜎 𝑒 2 𝜎𝑡 2 1 = 𝜎 𝑔 2 𝜎𝑡 2 + 𝜎 𝑒 2 𝜎𝑡 2 bulunur 𝜎 𝑔 2 𝜎𝑡 2 güvenirlik olduğuna göre: 𝑟𝑡𝑡 = 1 − 𝜎 𝑒 2 𝜎𝑡 2 10
  • 11. 1. Test-Tekrar Test Güvenirliği (Test-Retest Reliability) 2. İç Tutarlılık Güvenirlik (Internal consistency reliability)  iki yarı güvenirliği (Split half Reliability Test)  Cronbach’s alpha güvenirliği  Kuder-Richardson (KR20). 11
  • 12. Güvenilirlik Teknikleri 1. Test-retest 2. Parallel Forms 3. Split-half T1 T2 A1 A2 T A B Score Score 1 100 50 pairs 4. Internal Consistency K-R-20 Coefficient Alpha 12
  • 13. Test-Tekrar Test Güvenirliği (Test-Retest Reliability) Bu yöntemle test güvenirliğini kestirmek için, bir test aynı gruba belli bir zaman aralığıyla iki kez uygulanır. Daha sonra bireylerin birinci uygulamada aldıkları puanlarla ikinci uygulamada aldıkları puanlar arasındaki korelasyon bulunur. Elde edilen korelasyon katsayısı testin güvenirlik katsayısıdır. Güvenirlikle ilgili korelasyon tam yani 1 olması hiç sıra değişmesi olmadığını, 0 olması ise sıralar arasında hiçbir ilişki bulunmadığını gösterir. 13
  • 14. Test Tekrar Test Yönteminin Hesaplanması ÖĞRENCİ I. UYGULAMA (X) II. UYGULA MA (Y) X 2 Y 2 XY 1 15 17 225 289 255 2 16 15 256 225 240 3 17 17 289 289 289 4 10 11 100 121 110 5 14 14 196 196 196 6 6 5 36 25 30 7 17 17 289 289 289 8 12 11 144 121 132 9 3 4 9 16 12 10 8 9 64 81 72 11 9 9 81 81 81 12 14 14 196 196 196 13 15 13 225 169 195 14 12 13 144 169 156 15 15 15 225 225 225 N=15  X 183  184Y  X 2 =2479  Y 2 =2492   2478XY 14
  • 15.                            NN N YX XY Y Y X X rXY )() 2 2 2 2 ( )()( 95.0 15 33856 2492 15 33489 2479 15 184183 2478                 rXY Sunulan örnekte bir test aynı öğrenci grubuna belli bir süre arayla iki kez uygulanıyor ve uygulama sonuçları arasındaki korelasyon katsayısı 0.95 olarak bulunuyor ve testin güvenirlinin yüksek olduğu söylenebilir. 15
  • 16. İç Tutarlılık Güvenirlik iki yarı güvenirliği (Split half Reliability Test) iki yarım güvenirliği için tek bir test formu hazırlanır ve mümküm olan durumlarda, maddelerin sırası seçkisizleştirilir (randamizyon). Test uyguladıktan sorna her hangı bir yolla ikiye ayrılır ve testın iki yarısından alınan puanlar arasındakı korelesyon hesaplanır. 16
  • 17. Uygulanmış olan test iki eşdeğer (equivalence) yarıya bölünerek öğrencilerin testin iki yarısından aldıkları puanlar arasındaki korelasyon hesaplanır ve daha sonra bu hesaplanan korelasyondan hareketle Spearman–Brown formülünden de yararlanarak testin bütünün güvenirliği kestirilir. Bu yöntem, aslında iç tutarlılık katsayısı verir. Spearman- Brown formülü aşağıdaki gibidir. 17
  • 18. Spearman-Brown Formula. 𝑟𝑥𝑥 = 2𝑟ℎℎ 1+𝑟ℎℎ Mesela eğer 𝑟ℎℎ = 0.80 ise rxx = 0.89 olacak iki-yarım Testin Güvenilirliği 18
  • 19. Örnek Reliability Statistics Cronbach's Alpha Part 1 Value .593 N of Items 4a Part 2 Value .239 N of Items 3b Total N of Items 7 Correlation Between Forms .517 Spearman-Brown Coefficient Equal Length .682 Unequal Length .685 Guttman Split-Half Coefficient .654 a. The items are: K11a. K11b. K11c.K11d. b. The items are: K11e. K11f. K11g. Tüm Testinin Güvenilirliği İlk 4 madd ikinci 3 mad ortalamasi/to bulmak ve sonra korel k. hesaplan 19
  • 20. Kuder-Richardson (KR20) Kuder-Richardson (KR20) Anket soruları iki şıklı olduğu durumda, mesela geçti kaldı veya evet hayır gibi kullanıllan bir yöntemdir. Geçti oranı p ile gösterilir ve kaldı oranı 1-p ile gösterilir. 𝑟𝑥𝑥 = 𝑛 𝑛 − 1 𝑠 𝑥 2 − 𝑖=1 𝑛 𝑝 𝑖 𝑞 𝑖 𝑠 𝑥 2 • n = Testin soru sayısı • p = Madde güçlüğü • q = 1- p • 𝑠 𝑥 2 = Testin varyansı 20
  • 21. Örnek Reliability Statistics Cronbach's Alpha Cronbach's Alpha Based on Standardized Items N of Items .684 .692 5 21
  • 22. Inter-Item Correlation Matrix K11a. K11b. K11c. K11d. K11e. K11a. 1.000 .311 .103 .378 .412 K11b. .311 1.000 .204 .366 .386 K11c. .103 .204 1.000 .251 .266 K11d. .378 .366 .251 1.000 .420 K11e. .412 .386 .266 .420 1.000 Item-Total Statistics Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item-Total Correlation Squared Multiple Correlation Cronbach's Alpha if Item Deleted K11a. 4.83 1.466 .428 .237 .642 K11b. 4.72 1.261 .455 .218 .627 K11c. 4.83 1.433 .288 .103 .700 K11d. 4.65 1.166 .516 .277 .597 K11e. 4.82 1.325 .547 .311 .593 Düşük korelasy … C Al 22
  • 23. Cronbach’s Alpha Güvenirliği Alpha güvenirlik katsayısı tek bir uygulama gerektiren güvenirlik bulma tekniklerinden biridir. Ağırlıklı puanlama veya dereceleme yöntemiyle puanlama uygulandığı durumlarda kullanılabilecek bir güvenirlik hesaplama tekniğidir. 23
  • 24. Testi oluşturan maddelerin dereceleme ölçeğine göre puanlanması (1’den 5’e kadar veya 0’dan 4’e kadar gibi) genellikle tutum amacıyla hazırlanan ölçme araçlarının puanlanmasında veya tutum ölçeklerinin puanlanmasında kullanılmakla birlikte kısa cevaplı testlerin güvenirliğinin kestirilmesinde de kullanılabilir. Alpha katsayısının hesaplanması için kullanılan bağıntı aşağıdaki gibidir. 24
  • 25. 𝛼 = 𝑘 𝑘 − 1 1 − 1 𝑠 𝑇 2 𝑖=1 𝑘 𝑠𝑖 2  K = Testin soru sayısı  𝒔𝒊 𝟐 = Testin varyansı  𝒔 𝑻 𝟐 𝑇 maddesinin varyansı 25
  • 26. (Nunnally, 1978) göre minimum kabul edilebilir güvenilirlik değeri 0.7’dir, ayrica (Cronbach, 1951; Helmstater 1964) göre 0.5 daha fazla güvenilirlik testi kabul edilebilir. Örnek: Reliability Statistics Cronbach's Alpha Cronbach's Alpha Based on Standardized Items N of Items .621 .613 8 26
  • 27. Geçerlilik ...ölçme sonuçlarının ölçerlığı, amaclanan ölçmenin gerçekleştirebilme derecesidir. …bir araştırma tasarımının ölçmek istediğini ölçüp ölçmediği ile ilgilidir. Açık uçlu ve kapalı uçlu olarak biçimlendirilmiş sorular ölçme isteneni ölçüyor mu. eğer ölmüyorsa geçerlilik sorunu vardır. 27
  • 28. Genellikle anket bütün olarak probleme uydurulmaya çalışılmış, tüm problemin ayrı ayrı özellikleriyle ilgili, nispeten özel ve birbirinden bağımsız sorulardan meydana gelmiştir. Bu bakımdan tüm anketin geçerlik derecesi yerine değişik soruların geçerliğini düşünmek daha doğru görülmektedir. 28
  • 29. Geçerli (doğru) bir test aynı zamanda güvenilir bir testtir, ancak, Güvenilir bir test geçerli bir test olmayabilir !!!! 29
  • 30. • Ölçme aracı belli bir amaç ve belli durumlar için geçerlidir. Başka bir amaç için geçerli sayılmaz. Örneğin bir grup öğrenciye uygulandığında geçerli olan test diğer öğrenci grubuna uygulandığında geçerli olmayabilir (Karasar: 2003; 151). • Örneğin Türkçe dersinde yazılı anlatım becerisini ölçen bir test bu amaca hizmet ettiği sürece geçerlidir. Aynı testi beden eğitimi dersi için kullanamayız. Çünkü o dersin amaçları için hazırlanmamıştır (Sönmez:2003;418). 30
  • 31. Geçerlik Türler literatürde değişik sınıflandırılmalara rastlamakla APA 1997 ile Croceker ve Algina’nin geçerlik türlerin üç toplanması daha çok tercih edilmektedir. 1. İçerik (Kapsam) Geçerliği (Content Validity). 2. Yordama (deneysel) Geçerliği (predictive validity). 3. Yapı Geçerliği (construct validity). 31
  • 32. İçerik Geçerliği (content validity). İçerik geçerliği, ölçme aracında bulunan soruların (maddelerin) ölçme amacına uygun olup olmadığı, ölçülmek istenen alanı temsil edip etmediği sorunu ile ilgili olup, "uzman görüşüne göre saptanır. Kapsam geçerliği, bir bütün olarak testin ve testteki her bir maddenin maksada ne derece hizmet ettiğidir (Tekin: 2008; 45). 32
  • 33. Örneğin, öğrencinin basketbol uygulama durumu değerlendirildiğinde sadece pas çalışması ile değerlendirmenin yapılması diğer basketbol tekniklerinin durumunu anlamak için bilgi vermez. Bu durumun önlenmesi için uzman grubuna başvurulup görüşleri alınarak ölçme aracının geçerliği yapılmış olur. 33
  • 34. Yordama Geçerliği (predictive validity) Yordama geçerliği, yapılan ölçme ile ölçülmeye çalışılan şeyin gerçek hayattaki yansımalarının karşılaştırılmasındaki uyumdur. Örneğin okulda alınan notların hayattaki başarı ile olan ilişkisi aranabilir. Okuldaki notları yüksek olanlar hayatta da başarılı oluyorlarsa, okuldaki ölçmeler geçerlidir denir. 34
  • 35. ÖSS korelasyon Akademik başarı (yordayıcı) (ölçüt) İşe giriş sınavı korelasyon İş yerindeki performans (yordayıcı) (ölçüt) 35
  • 36. Yapı Geçerliği (Construct Validity) Yapı geçerliği, bilimsel olduğu kadar, felsefi yönü de ağır basan bir geçerlik ölçütüdür. Kuramsal (theoritical) olarak, geçerlik ölçmenin dayandığı "temel kuramların" geçerliği ile ilgilidir. Yani, önceden kabul edilen olası "neden-sonuç" ilişkileri ile ilgilidir özellikle, dolaylı ölçmelerin yapıldığı (asıl ölçülmek istenen şeyin onun çeşitli belirtileri ile ölçüldüğü) durumlarda, ölçülen belirtilerin, gerçekten aranan belirtiler olup olmadığı sorunu vardır. 36
  • 37. Geçerlik ve Güvenirlik Arasındaki İlişki Güvenirlik sabit ve sistemli hatalardan etkilenmeyip sadece rasgele hatalardan etkilenir.  Güvenirlik, geçerlik için gerekli koşuldur, fakat yeterli koşul değildir.  Güvenirliği yüksek olan bir testin geçerliği yüksek olmayabilir. 37
  • 38. Geçerlilik Test için EFA kullanılır SD = Strongly disagree, D = Disagree, N = Neither, A = Agree, SA = Strongly Agree S D D N A S A 1 Statistics makes me cry O O O O O 2 My friends will think I'm stupid for not being able to cope with SPSS. O O O O O 3 Standard deviations excite me. O O O O O 4 I dream that Pearson is attacking me with correlation coefficients. O O O O O 5 I don't understand statistics. O O O O O 6 I have little experience of computers. O O O O O 7 All computers hate me. O O O O O 8 I have never been good at mathematics. O O O O O 9 My friends are better at statistics than me. O O O O O 10 Computers are useful only for playing games O O O O O 11 I did badly at mathematics at school. O O O O O 12 O O O O O 13 O O O O O 14 O O O O O 15 Computers are out to get me. O O O O O 16 I weep openly at the mention of central tendency. O O O O O 17 I slip into a coma whenever I see an equation. O O O O O 18 SPSS always crashes when I try to use it. O O O O O 19 Everybody looks at me when I use SPSS. O O O O O 20 I can't sleep for thoughts of eigenvectors. O O O O O 21 O O O O O 22 My friends are better a SPSS than I am. O O O O O 23 If I am good at statistics people will think I am a nerd. O O O O O People try to tell you that SPSS makes statistics easier to understand but it doesn't. I worry that I will cause irreparable damage because of my incomptence with computers. Computers have minds of their own and deliberately go wrong whenever I use them. I wake up under my duvet thinking that I am trapped under a normal distribution. 38
  • 39. Örnek KMO and Bartlett's Test ,930 19334,492 253 ,000 Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Approx. Chi-Square df Sig. Bartlett's Test of Sphericity KMO-measures >.9 are superb! KMO measures the ratio of the squared correlation between variables to the squared partial correlation between variables. KMO measures for individual factors are produced on the diagonal of the anti-image corr matrix The KMO-measures give us a hint at which variables should be excluded from the factor analysis Bartlett's test tests if the matrix is an identity matrix (matrix with only 1's in the diagonal and 0's off-diagonal). However, we want to have correlated variables, so the off-diagonal elements should NOT be 0. Thus, the test should be significant, i.e., the R-matrix should NOT be an identity matrix. 39
  • 40. Factor structure refers to the Intercorrelations among the variables being tested in the EFA Pattern Matrixa ,706 ,591 -,511 ,405 ,400 ,643 ,621 ,615 ,507 ,885 ,713 ,653 ,650 ,588 ,585 ,412 ,462 ,411 -,902 -,774 -,774 Q20 I can't sleep for thoughts of eigen vectors Q21 I wake up under my duvet thinking that I am trapped under a normal distribtion Q03 Standard deviations excite me Q04 I dream that Pearson is attacking me with correlation coefficients Q16 I weep openly at the mention of central tendency Q01 Statiscs makes me cry Q05 I don't understand statistics Q22 My friends are better at SPSS than I am Q09 My friends are better at statistics than me Q23 If I'm good at statistics my friends will think I'm a nerd Q02 My friends will think I'm stupid for not being able to cope with SPSS Q19 Everybody looks at me when I use SPSS Q06 I have little experience of computers Q18 SPSS always crashes when I try to use it Q07 All computers hate me Q13 I worry that I will cause irreparable damage because of my incompetenece with computers Q14 Computers have minds of their own and deliberately go wrong whenever I use them Q10 Computers are useful only for playing games Q12 People try to tell you that SPSS makes statistics easier to understand but it doesn't Q15 Computers are out to get me Q08 I have never been good at mathematics Q17 I slip into a coma whenever I see an equation Q11 I did badly at mathematics at school 1 2 3 4 Component Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization. Rotation converged in 29 iterations.a. F1: 'Fear of statistics' F2: 'Fear of peer evaluation' F3: 'Fear of computers' F4: ‘ Fear of mathemat 40
  • 41. Güvenirlik Belirleme Tekniklerine İlişkin Özet Bilgiler Güvenirlik Katsayısı Tipi Anlamı Gereken form sayısı Uygulama sayısı Hata varyansı kaynağı KUDER- RICHARSON KR - 20 ve KR - 21 İç tutarlık Bir Bir Kapsam örneklemi ve heterojenliği CRONBACH ALFA İç tutarlık Bir Bir Kapsam örneklemi ve heterojenliği İKİ YARI İç tutarlık Bir Bir Kapsam örneklemi TEST-TEKRAR TEST Kararlılık Bir İki Zaman örneklemi PARALEL FORMLAR Tutarlık İki İki Zaman ve kapsam 41
  • 42. Kaynaklar • Making Sense of Cronbach’s alpha, Article, MOHSEN TAVAKOL, REG DENNIC, 2011 • Handbook of Health Research Methods: Investigation Measurement and Analysis, SHAH EBRAHIM, ANN BOWLING. • Statistical Analysis in psychology and Education. George A.Ferguson. FIFTH EDITION. • Best Split-Half and Maximum Reliability Satyendra Nath Chakrabartty (Prof, Galgotias Business School, India). • Assessing Construct Validity: The Utility of Factor Analysis Cheng Hsiung Lu. • Reliability and validity testing of a new scale for measuring attitude towards learning statistics with technology, Article. Volume 4, November 1, 2011. • http://badmforum.blogspot.com.tr/2012/08/factor-analysis-kmo-bartletts-test.html. • ARAŞTIRMA YÖNTEMLERİ DERSİ ÖDEVİ. YRD. DOÇ. DR. HASAN HÜSEYİN AKSOY. Ankara Mayis 2006. • Ölçme Araçlarının Yapısal Nitelikleri, Dr. Fatih DERVENT. 42