2. • z ve t testleri parametrik testlerdir.
• Ki kare testi ise parametrik olmayan bir testtir.
• Parametrik olmayan testlerde hipotezler, toplumların dağılımlarıyla
ilgili olarak kurulurlar.
• Ki kare testinde, teste girecek olan değerler sayarak elde edilmiş
olgu sayısı gruplarıdır.
• Gruplar tek bir sıra halinde (bir yönlü) olabileceği gibi birden fazla
sıra ve sütunun (iki yönlü) oluşturduğu tablolar şeklinde de olabilir.
• Test, gruplardaki gözlenen değerler ile beklenen değerleri
karşılaştırır.
• Ki-kare testi ile öncekilerden farklı olarak iki ve daha fazla gruba
düşen değerlerin dağılımı aynı anda karşılaştırılabilmektedir.
3. • Ki kare testinde, teste girecek olan
değerler sayarak elde edilmiş olgu sayısı
gruplarıdır.
• Gruplar tek bir sıra halinde (bir yönlü)
olabileceği gibi birden fazla sıra ve
sütunun (iki yönlü) oluşturduğu tablolar
şeklinde de olabilir.
4. • Test, gruplardaki gözlenen değerler ile
beklenen değerleri karşılaştırır.
• Ki-kare testi ile iki ve daha fazla gruba
düşen değerlerin dağılımı aynı anda
karşılaştırılabilmektedir.
5. Ki Kare Dağılımının Fonksiyonu ve Eğrisi
Normal bir toplumdan seçilen bir birimin
x değeri için birim normal dağılımında
hesaplanacak olan Z değerinin karesi
bir ki-kare değeri olur.
Bu şekilde tek bir birimden elde edilen ki-karelerin
dağılımı bir serbestlik derecelidir.
Toplumdan aynı anda
υ tane birim seçip bunlara karşı gelen
υ tane Z2
'nin toplanmasıyla bulunan ki kare
değerlerinin dağılımı da υ serbestlik dereceli bir
dağılım olur.
7. Değişik υ değerleri için değişik dağılım fonksiyonları ve
bunlara bağlı olarak da değişik dağılım eğrileri
mevcuttur.
• υ ≤2 için eğri ters j şeklinde olup,
∀ υ>2 için artan değerlerine göre simetrik
∀ υ≥30 durumunda değerlerinin dağılımı, ortalaması ve
standart sapması 1 olan normal dağılıma yaklaşır. Bu
nedenle, bu koşulu sağlayan ki kare değerleri için
hipotez testi olarak z testi kullanılır.
P(x)
0
0,1
0,2
0,3
0,4
0,5
0 4 8 12 16 20 24 28 32 36 40
ν=2 ν=5 ν=10 ν=30
8. • Ki kare değerleri, serbestlik derecelerine bağımlı
olduklarından, verilirken serbestlik dereceleri de yanında
belirtilir. χ2
υ
• Olasılık fonksiyonu yardımıyla χ2
'nin bir değere eşit ve ondan
daha büyük olma olasılıkları hesaplanabilmektedir.
9. • Hipotez testleri için değişik serbestlik
derecelerinde bazı olasılık değerleri için
kritik ki-kare değerleri tablo olarak
hazırlanmıştır.
10. ∀ υ serbestlik dereceli bir eğri üzerinde, bir
değerinin dışında kalan alan (olasılık) α ise, bu
noktadaki ki kare değeri χ2
α,υ olarak gösterilir.
• Bunun anlamı, υ serbestlik dereceli bir ki kare
dağılımında χ2
α,υ 'nin sağ ucunda kalan alanın α
'ya eşit olduğudur.
• Bunu olasılık olarak değerlendirirsek,
∀ υ serbestlik dereceli bir ki-karedağılımında χ2
değerlerinin
χ2
α,υ 'ye eşit veya daha büyük olma olasılığı α 'ya eşittir.
αχχ να =≥ )( 2
;
2
P
13. Ki-kare Değeri
• Ki kare sayarak elde edilen verilere uygulandığı
için ki kare değerinin bulunuşunda oranlar için
kullanılan Z eşitliği kullanılacaktır.
• Binomial toplumlarda birimler bir özelliği
gösterip göstermemelerine göre iki kategoride
yer alır.
• İki kategorili ya da tek örneklem durumundaki bir
örnekte H0'a göre her iki kategori için de
beklenen oran değeri 1/2 dir.
14. Örnek
• n birimli bir örnekte iki kategorideki
değerleri x ve y ile gösterirsek (n=x+y) her
iki kategoride beklenen değerlerin oranı,
x/n=y/n=1/2 olacaktır.
• n tane yeni doğan bebeğin bir kısmı erkek
(x) ve bir kısmı da kız (y) olacaktır. Böyle
bir doğum olayı için hipotezler,
15. H0: Kızların ve erkeklerin oranı birbirlerine
eşittir.
(x/n=y/n=1/2=P)
H1: Oranlar birbirlerinden farklıdır.
(x/n≠y/n ya da x/n≠1/2, y/n≠1/2)
16. • Erkeklerin oranını =x/n ve P=Q=1/2 alarak
oranlara ilişkin Z formülünde bu değerleri
yerine koyup Z2
'yi yazarsak,
x ve y'ler her iki kategoride gözlenen frekans
değerlerini ve (1/2)n de beklenen frekans
değerlerini temsil etmektedir.
Z
x n
n
y n
n
2
2 21
2
1
2
1
2
1
2
=
−
+
−( ) ( )
Pˆ
17. • Gözlenen frekans değerlerini fgi ve beklenen
frekans değerlerini de fbi ile göstererek χ2
eşitliğini aşağıdaki şekilde yazabiliriz…
χ2 1 1
2
1
2 2
2
2
2
1
2
=
−
+
−
=
−
=
∑
( ) ( ) ( )fg fb
fb
fg fb
fb
fg fb
fb
i i
ii
18. • Dağılımın serbestlik derecesi, kategori
sayısının bir eksiği olmaktadır.
• Örnekte iki tane kategori ya da frekans
olduğundan, serbestlik derecesi
υ=2-1=1'dir.
χ2
0,05,1
=3.841
Z0.05=1.96
k=2 ise Z2
= χ2
19. Ki-karenin Özellikleri
• Dağılımın şekli serbestlik derecesine bağlı
olarak değişir. υ≤2 için ters j şeklinde ve
büyüdükçe dağılım simetrik bir şekil alır.
• Ki-kare 0≤χ²≤∞ aralığında değişir.
• Ki-kare dağılımı süreklidir.
• Ki kare değeri, frekans (göz sayısı) sayısı
ile doğru orantılı olarak değişir.
20. Ki Karenin Özellikleri
• Ki kare değerinin toplanabilirlik özelliği
vardır.
χ χ ν ν
2
2
1 1
= =
= =
∑ ∑i
i
k
i
i
k
ve
21. • Ki-kare testinin geçerli olabilmesi için
beklenen değerlerin 1’den büyük olmaları
ve en fazla %20’si 5'den küçük olabilir.
– Bu mümkün olmadığı zaman, gözlenen küçük
frekanslı iki veya daha fazla sıra-sütun
değerleri ile birleştirilerek beklenen değerlerin
büyük olmaları sağlanır.
22. Yates Düzeltmesi
• Sürekli olan ki-kare dağılımı kesikli örnek
verilerine uygulandığı zaman bir
düzeltmenin yapılması zorunludur. Bu
düzeltmeye Yates Düzeltmesi denir.
• Yates düzeltmesi yalnız υ=1 için yapılır.
• Büyük örnekler (N≥50) için Yates
düzeltmesine gerek yoktur.
23. • Ancak ki-kare değeri, kritik değere yakın çıktığı
zaman düzeltilmiş olan geçerlidir.
• Beklenen değerlerin 5-10 arasında bulunduğu
küçük örnekler için, düzeltilmiş ve düzeltilmemiş
olan ki kare değerlerinin her ikisinin de kabul ya
da ret bölgelerinde bulunmaları halinde sorun
olmaz. Ancak, bunlar ayrı bölgelerde
bulunurlarsa örnek büyüklüğünü artırmak
gerekir.
24. • Yates düzeltmesi, gözlenen ve beklenen
değerlerin farkının mutlak değerinden 0.5
çıkarılıp kareleri alınarak yapılır.
• Düzeltilmiş Ki kare değeri;
∑=
−−
=χ
v
i bi
bigi
f
).ff(
1
2
2
50
25. Hipotez Testi
• Ki kare testinde kurulacak olan H0 hipotezi,
gözlenen frekans değerleri ile beklenen
frekans değerlerinin birbirlerine eşitliği
şeklindedir (fgi=fbi).
• Dağılımla ilgili kurulan hipotezden sonra H0
hipotezine göre beklenen frekans
değerleri ve bunlar yardımıyla ki kare
değerleri bulunur.
26. • Bulunan değer kritik ki kare değerine eşit ya da
daha büyükse H0 hipotezi düzeyinde reddedilir.
Bunun anlamı, en az bir tane gözlenen frekans
ile beklenen frekans değeri birbirlerinden
farklıdır demektir.
χ ² ≥χ²α;υ
• Ki kare testi değişik amaçlarla kullanılmaktadır.
27. Uyum Testi
• Bir örneğin frekans dağılımının, parametresi bilinen bir
kuramsal dağılıma uygunluk gösterip göstermediğini test
etmek için kullanılır.
• Ffrekanslar, gözlenen frekans değerleri ve bunlara karşı gelen
kuramsal dağılım için hesaplanacak olan frekans değerleri de
beklenen değerler olarak alınır.
28. • Tek sıra ya da sütun şeklinde frekanslardan oluşan durumlar
için yapılan teste tek örneklem testi de denir. Bu testte eğer
frekans sayısı ya da kategori sayısı 2 olursa beklenen
değerlerin en az 5'e eşit ve daha büyük olmaları gerekir.
• Frekans sayısı ikiden fazla (k>2) olduğu zaman beklenen
değerlerin %20'sinden fazlasının 5'den küçük küçük olması
durumunda bu test uygulanamaz.
• Beklenen değerleri büyütmek için frekansları birleştirmek
gerekir. Eğer frekans sayısı 2'ye indiği halde hala beklenen
değer 5'den küçük ise ki kare testi yerine binomial test
uygulanır.
• Tek örneklem testinde, serbestlik derecesi, frekans sayısının
bir eksiğine eşittir.
29. Örnek16.1: Örnek alınan en çok 4 çocuğu olan 64 ailede erkek çocuk
sayıları aşağıda verilmiştir. Örneğe ait frekans dağılımı, aşağıda verilen
olasılık dağılımına uyar mı? Bu hipotezi α=0.05 için kontrol edelim.
Hipotez:
H0: Örnek dağılımı kuramsal dağılıma uyar.
(fg1=fb1,fg2=fb2, ....,fg5=fb5)
H1: Dağılımlar birbirlerinden farklıdır. H0'da verilen eşitliklerin en az bir tanesi
gerçekleşmez.
30. • 5 tane beklenen frekanstan 2 tanesi (%20'den
fazlası) 5'den az olduğu için küçük olan 0
sırasındaki 3 ile 1 sırasındaki 15 değerinin
birleştirilip tek göz olarak alınması gerekir.
• Yine, son sıradaki 5'den küçük beklenen değer,
oran olarak %20'den büyük olduğu (1/4) için son iki
sıranın da aşağıda görüldüğü gibi birleştirilmesi
gerekmektedir.
31. χ2
2 2 2
18 20
20
25 24
24
21 20
20
0 292=
−
+
−
+
−
=
( ) ( ) ( )
.
Serbestlik derecesi frekans sayısının bir eksiğidir.
υ=3-1=2'dir.
χ² < χ²0.05,2=5.991 Ho Kabul
Örnekteki frekans dağılımının, kuramsal dağılıma uymaktadır.
H0: Örnek dağılımı kuramsal dağılıma uyar.
(fg1=fb1,fg2=fb2, ....,fg5=fb5)
H1: Dağılımlar birbirlerinden farklıdır. H0'da verilen eşitliklerin en az bir tanesi
gerçekleşmez
32. • Tek örneklem durumunda, her zaman bir kuramsal
dağılıma uygunluk aranmaz.
• Bunun yerine, frekansların birbirlerine eşit olup olmadığı
da araştırılabilir.
• Bu durumda, her frekans için beklenen değerler
birbirlerine eşit olur.
• Eğer belirlenmiş bir beklenen değer belirtilmemişse,
verilen frekansların eşit olduğu varsayımına göre,
beklenen değer olarak frekansların ortalaması alınarak
işlem yapılır.
• Örneğin, bir polikliniğe gelen hasta sayılarının haftanın
günlerine dağılımı, doğum sayılarının, ölüm sayılarının
vb. aylara dağılımı durumunda beklenen değerler
birbirlerine eşit varsayılır.
33. Örnek 16.2: Bir bölgede, mevsimlere göre bebek ölümleri dağılımı
verilmiştir. Mevsimler arasında sayı bakımından bir fark olup olmadığını
α=0.05 düzeyinde kontrol edelim.
H0: Her mevsimde gözlenen değerler beklenen değerlere eşittir.
H1: En az bir mevsimde bu eşitlik sağlanmaz. H0'da verilen eşitliklerin en
az bir tanesi gerçekleşmez.
Ho: mevsimlere göre dağılımda fark yoktur
Hı: Mevsimlere göre dağılımda fark vardır.
χ2
2 2 2 2
20 25
25
15 25
25
30 25
25
35 25
25
10 00=
−
+
−
+
−
+
−
=
( ) ( ) ( ) ( )
.
υ=4-1=3 HoRED815.710 2
3;05.0
2
=>= χχ
34. İki Ya da Daha Fazla Grubun Dağılımlarının
Karşılaştırılması
• Kategori sayısı 2 ve daha fazla olan grupların
karşılaştırılmasında, gruplardaki frekans
dağılımlarının karşılaştırılması yapılır.
• Veriler aynı zamanda frekans kategorilerine ve
gruplarına göre dağıldığı için iki yönde
sınıflandırılmış olurlar. Bu şekildeki tablolar sıra
ve sütunlardan oluşur.
• Her sıra ve sütun birleşimi için bir frekans değeri
mevcuttur.
35. • Frekans dağılımları olarak sıralar karşılaştırılabildiği gibi sütunlar da
karşılaştırılabilir. Her ikisinde bulunacak olan toplam ki kare değeri
aynıdır.
• Hipotezin durumuna göre, sıraların mı yoksa sütunların mı
karşılaştırılacağına karar verilir.
• Test sonucunda, iki sıra arasındaki dağılım farklı çıkarsa, bu
farklılığın hangi sütun veya sütunlarda olduğunu anlamak için
sütunlar arasındaki dağılımı da karşılaştırmak gerekir.
• İki yönlü sınıflandırılmış tablolar, r sıra sayısını ve c de sütun sayısını
göstermek üzere rxc şeklinde gösterilir.
36. • Gözlenen frekanslar için beklenen frekans
değeri pratik olarak,
• Her sıra ve sütun içindeki beklenen değerlerin
toplamı o sıra ve sütundaki gözlenen frekans
değerlerinin toplamına eşittir.
• rxc tablolarında serbestlik derecesi,
ToplamGenel
)ToplamıSütunnin'GF()ToplamıSıra)GF(FrekansınGözlenen(
fb
×
=
ν = − −( )( )c r1 1
37. Örnek 16.3: Bir bölgeden seçilen üç köyün nüfusunun yaş gruplarına göre
dağılımı aşağıda verilmiştir. Nüfusun yaş gruplarına göre dağılımı bakımından
köyler arasında bir farklılık olup olmadığını α=0.05 düzeyinde test edelim
38. χ
χ
χ
χ
A
B
C
Toplam
2
2 2 2 2
2
2 2 2 2
2
2 2 2 2
2
15 19
19
500 503
503
650 600
600
200 243
243
12 636
20 15
15
400 394
394
500 470
470
150 191
191
12 473
25 26
26
650 653
653
700 780
780
400 316
316
30 586
=
−
+
−
+
−
+
−
=
=
−
+
−
+
−
+
−
=
=
−
+
−
+
−
+
−
=
( ) ( ) ( ) ( )
.
( ) ( ) ( ) ( )
.
( ) ( ) ( ) ( )
.
________________________________________________________
= 55 695.
ν = − − =( )( )3 1 4 1 6
χ²=55.695 > χ²0.05,6 =12.592 Ho Red
Farklı olan köyleri belirlemek için köyler birbirleriyle ikişerli olarak ayrı ayrı
karşılaştırılırlar.
Örneğimizde, bu karşılaştırmaların sonucunda;
A ve C köylerinin 0 ile 1-14, 0 ile 15-50 ve 1-14 ile 15-50 yaş gruplarında,
B ve C köylerinin de 0 ile 15-50,1-14 ile 15-50 yaş gruplarında
farklılık gösterdikleri belirlenmiştir.
39. Bağımsızlık Testi
• Sıralar bir değişkeni ve sütunlar da başka bir
değişkeni temsil etmek üzere oluşturulan bir rxc
tablosunda iki değişken arasında bir bağımlılığın
olup olmadığını kontrol etmek için kullanılan bir
testtir.
• Örneğin, eğitim durumu ile annelerin sahip
oldukları çocuk sayıları arasındaki ilişkiler
bağımsızlık testi ile kontrol edilirler.
• Değişkenlerin alt grupları olan kategorilerin bir
sıra içinde ya da üstünlük sırasına göre
sıralanmaları gerekmez. Bunların yerleri
değiştiği zaman da sonuç aynıdır.
40. • Bağımsızlık testi için hipotezler şu şekilde
kurulur.
H0: İki değişken arasında bir bağımlılık yoktur.
H1: İki değişken birbirleriyle bağımlıdır.
• Test için kullanılacak ki-kare değeri aynı
formülle ve aynı yolla hesaplanır.
• Ki kare değeri göz sayısı ile doğru orantılı
olarak değişebildiği için ki karenin büyük
ya da küçük çıkması bağımlılığın büyük ya
da küçük olduğunu göstermez.
41. • Bağımlılığın derecesini anlamak için, ki-kare ve
birim sayısına bağlı olarak bir değer hesaplanır.
• Bu değer uygunluk katsayısı olarak bilinir. n,
örnekteki birim sayısı olmak üzere uygunluk
katsayısı,
• 0<C<1 , C sıra ve sütun sayısına göre değişir.
• Sıra ve sütun sayısı eşit kxk tablosu için C'nin
maksimum alabileceği değer,
• Uygunluk katsayısının anlamlı olup olmadığını
kontrol eden bir test yoktur. Bunun anlamlılığı ki-
C
n
=
+
χ
χ
2
2
C
k
k
max =
−1
43. 2x2 Tablolarında Ki Kare Değeri
• 2x2’lik tablolarda, beklenen değer hesaplanmadan
gözlerdeki değerlere göre doğrudan ki- kare değeri
hesaplanabilmektedir.
44.
45. 2x2 Tablolarında Kesin Ki Kare Testi
(Fisher'in Kesin Ki Kare Testi )
• 2x2 tablolarında, gözlerden birinin
beklenen frekans değeri 5'den küçük
olduğu zaman uygulanan bir testtir.
46. • Test iki sıradaki birimlerin, iki sütuna,
belirli bir dağılımındaki olasılığını verir. Bu
olasılık P değeridir.
• P değeri ile karşılaştırılarak kurulan
hipotez hakkında karar verilir.
47.
48.
49. Bağımlı Gruplarda Ki Kare Testi ( Mc Nemar Testi)
• Kategorik özellikteki iki değişken bağımlılık
gösteriyorsa, ve değişkenlerin aldıkları
değerler iki kategoride toplanıyorsa (2x2)
bu değişkenlerin karşılaştırmasında
McNemar testi kullanılır.
50. • Örneğin;
– Bir grup insanın sahip oldukları
alışkanlıklarından, bir eğitimden sonra
vazgeçip vazgeçmediklerinin araştırılması
– Bir sağlık ocağı bölgesinde annelerin bebek
bakımında mevcut alışkanlıklarının eğitimle
değişip değişmediğinin araştırılması
51. • Mc Nemar testi olarak da bilinen bu testin
uygulanabilmesi için bir gruptan alınan
bilgiler
– bir işlemden önce-sonra
ya da
– değişik iki işleme göre, belirli bir özelliği
gösterenler (+) ve göstermeyenler (-) olarak
iki ayrı grup oluşturmak üzere,
biçiminde düzenlenebilir.
52. 1.İşlem
2.İşlem + -
+ A B
- C D
A, B, C, D, gözlere ait frekans değerleridir.
Böyle bir tabloda iki grup arasındaki farkı belirleyen değerler C ve B'dir.
Eğer iki grup arasında bir fark yoksa, her iki yönde grup değiştiren (+'dan -'ye ve -'den
+'ya) birimlerin sayısı eşit oranda olup bunlara ait beklenen değer de (B+C)/2 olacaktır.
Normal ki kare formülünde B ve C'ye ait gözlenen ve beklenen değerleri yerlerine koyup
gerekli sadeleştirme yapılırsa,
χ2
2
=
−
+
( )B C
B C
Küçük örneklerde süreklilik için bir düzeltme yapmak gerekir.
χ2
2
1
=
− −
+
( )B C
B C