Dokumen tersebut membahas analisis frekuensi kategori untuk satu variabel dan dua variabel. Terdapat penjelasan tentang tabel frekuensi, tabulasi silang, frekuensi yang diharapkan, uji khi-kuadrat untuk menguji hubungan antar variabel kategorik, dan koefisien kontingensi. Contoh-contoh diberikan untuk menerangkan konsep-konsep tersebut.
1. Materi 6:
ANALISIS FREKUENSI KATEGORI
A. Analisis untuk Variabel Tunggal
Seringkali kita meringkas atau menyajikan data dalam bentuk frekuensi. Lazimnya
hal ini dilakukan karena skala (pengukuran) data variabel yang diamati bersifat
kategorik, misalnya warna, agama, suku, bidang usaha, tingkat pendidikan, ukuran
(size) pakaian, peringkat kinerja/kualitas, dan sebagainya. Data frekuensi variabel
tunggal dianalisis dengan Tabel Frekuensi. Tabel ini meliputi jumlah (frekuensi) dan
distribusi frekuensi (persen) untuk setiap kategorinya.
Contoh 1: Tabel Frekuensi
Misalkan Y menyatakan respons setuju (1) atau tidak setuju (0) terhadap suatu
kebijakan ekonomi yang diajukan. Misalkan prediktor x menyatakan usia
dikelompokkan dalam dua kelompok usia: (0): 50-59, dan (1): 60-69. Diberikan data
tersebut pada Tabel 1 berikut:
Tabel 1
Data respons Y biner, X biner
Respon
den
X Y Responden X Y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
1
1
1
1
0
1
1
1
1
18
19
20
21
22
23
24
25
26
27
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
0
1
1
1
Tabel frekuensi untuk variabel X dan Y masing-masing adalah pada Tabel 2 dan
Tabel 3 di bawah ini. Tabel tersebut dapat diperoleh secara komputasi (misalnya
melalui program SPSS) atau dapat juga dihitung manual. Pada Tabel 2 terlihat
responden didominasi usia 50-59 (63%). Sementara itu pada Tabel 3 terlihat hanya
77% responden setuju kebijakan ekonomi yang diajukan. Tabel 2 dan 3 adalah contoh
output tabel frekuensi dari program SPSS.
2. Tabel 2: Tabel frekuensi X (usia responden)
X Frequency Percent
Cumulative
Percent
Valid 0 17 63,0 63,0
1 10 37,0 100,0
Total 27 100,0
Tabel 3: Tabel frekuensi Y (respon terhadap kebijakan ekonomi)
Y Frequency Percent
Cumulative
Percent
Valid 0 6 22,2 22,2
1 21 77,8 100,0
Total 27 100,0
B. Tabel Frekuensi untuk Dua Variabel Berpasangan
Penyajian data untuk dua variabel yang berpasangan juga dapat disajikan melalui
tabel frekuensi yang disebut Tabulasi Silang (crosstabulation). Tabel ini tetap
mengandung tabel-tabel frekuensi masing-masing variabel yaitu pada bagian kolom
total dan baris total. Hanya saja, analisis untuk crosstab ini lebih kompleks karena
kita ingin menguji apakah dua variabel tersebut menunjukkan adanya
hubungan/asosiasi atau tidak.
Contoh 2: Tabel frekuensi tabulasi silang
Perhatikan kembali kasus pada Contoh 1 dan data pada Tabel 1. Cosstab yang
dihasilkan disajikan pada Tabel 4, dan lebih detil pada Tabel 5. Perhatikan bahwa
kolom terkahir dan baris terakhir merupakan tabel-tabel frekuensi masing-masing
variabel Y dan X. Sedangkan pada sel-sel yang ditengah merupakan frekuensi
(distribusi) Y untuk suatu kategori X atau sebaliknya frekuensi (distribusi) X untuk
suatu kategori Y.
Tabel 4 : Tabulasi-silang respons Y terhadap X
Y X = 0 X = 1 Σ
Y = 0
Y = 1
Σ
4
13
17
2
8
10
6
21
27
3. Tabel 5 : Distribusi Y * X Crosstabulation
X
0 1 Total
Y 0 Count 4 2 6
% within Y 66,7% 33,3% 100,0%
% within X 23,5% 20,0% 22,2%
% of Total 14,8% 7,4% 22,2%
1 Count 13 8 21
% within Y 61,9% 38,1% 100,0%
% within X 76,5% 80,0% 77,8%
% of Total 48,1% 29,6% 77,8%
Total Count 17 10 27
% within Y 63,0% 37,0% 100,0%
% within X 100,0% 100,0% 100,0%
% of Total 63,0% 37,0% 100,0%
Bisa diamati bahwa:
Pada Y=0 perbandingan usia muda: tua, X(0) : X(1), adalah 67 : 33 persen, sementara
pada Y=1 perbandingannya 62 : 38 persen. Atau, pada X=0 perbandingan Y(0) : Y(1)
adalah 24 : 76 persen, sementara pada X=1 perbandingannya 20 : 80 persen.
Jadi, distribusi (proporsi) usia tua-muda relatif sama antara mereka yang setuju
dengan yang tidak. Atau, juga, kelompok tua atau muda mempunyai perbandingan
sikap yang sama terhadap isu kebijakan ekonomi yang diajukan. Artinya, tidak ada
indikasi bagi mereka usia kelompok tua atau muda untuk cenderung progresif atau
apatis terhadap kebijakan ekonomi yang diajukan, tidak ada indikasi hubungan X
dengan Y.
Contoh 3. Frekuensi yang diharapkan
Seandainya X dan Y tidak ada hubungan, bebas, maka frekuensi pada sel-sel tabulasi
silangnya dapat disusun sesuai dengan frekuensi masing-masing variabel (Tabel 2 dan
3). Frekuensi ini disebut frekuensi yang diharapkan. Frekuensi harapan untuk data
pada Tabel 4 adalah
Tabel 6: Frekuensi Observasi dan Frekuensi Diharapkan
X Total
0 1 0
Y 0 Count 4 2 6
Expected Count 3,8 2,2
1 Count 13 8 21
Expected Count 13,2 7,8
Total Count 17 10 27
Terlihat nilai-nilai frekuensi observasi dengan frekuensi yang diharapkan tidak
berbeda jauh, menunjukkan tidak ada indikasi hubungan X dengan Y.
4. Frekuensi yang diharapkan untuk sel-ij dihitung sebagai
totalkolomke-i totalbariske-j
ij
x
E
N
= [1]
Misalnya untuk sel Y=0, X=0, 00
17 6
3.8
27
x
E = = . Dst.
C. Analisis Hubungan dan Uji statistik data Tabulasi Silang
Apakah X dan Y berhubungan? Signifikansi hubungan dua variabel berpasangan
dalam analisis cosstab dapat diuji secara statistik. Hipotesis hubungan tersebut dapat
disusun sebagai berikut:
H0 : Tidak ada hubungan antara variabel I dengan variabel II
H1 : Ada hubungan
Untuk data tabulasi silang (variabel I dan II yang bersifat kategorik), salah satu
metode yang digunakan untuk uji hipotesis ini adalah uji khi-kuadrat ( 2
χ ). Statistik
ujinya adalah:
( )
2
2
,
k
ij ij
i j ij
f E
E
χ
−
= ∑ [2]
fij = frekuensi data pada sel-ij (baris ke-i dan kolom ke-j), i = 1, 2, ..., r., j = 1, 2, ..., c.
Eij = frekuensi yang diharapkan (seandainya tidak ada hubungan) pada sel-ij.
k = banyaknya sel = (r-1)(c-1).
Nilai 2
χ ini dibandingkan dengan nilan 2
χ tabel pada tingkat signifikansi α dan
derajat bebas k. Jika
2 2
tabelχ χ> maka tolak H0 dan dinyatakan bahwa ada hubungan
variabel I dengan variabel II.
Contoh 4: Uji 2
χ cosstabulation 2x2
Untuk data pada Tabel 4, dihitung
2 2 2 2
2 (4 3.8) (2 2.2) (13 13.2) (8 7.8)
0.045
3.8 2.2 13.2 7.8
χ
− − − −
= + + + =
2
tabelχ untuk α = 5% dan derajat bebas k=1 adalah 3.84. Jadi 2
χ tidak lebih besar dari
2
tabelχ (tidak signifikan), maka kesimpulan: tidak cukup fakta untuk menyatakan X
berhubungan dengan Y.
5. Contoh 5: Koefisien kontingensi
Derajat hubungan X dan Y disebut koefisien kontingensi yang dihitung sebagai
berikut
2
2
C
N
χ
χ
=
+
[3]
Untuk kasus ini adalah
0.045
0.041
0.045 27
C = =
+
Nilai koefisien tersebut kecil, hal ini bisa dipahami karena memang hubungan X dan
Y tidak signifikan.
LATIHAN
1. Misal respons Y = 1 menyatakan menderita kanker paru-paru dan Y = 0
menyatakan tidak menderita kanker paru-paru, dan X = 1 menyatakan merokok, dan
X = 0 menyatakan tidak merokok. Tabel 7 memperlihatkan tabulasi silang antara
respons Y dengan prediktor X.
Tabel 7
Tabulasi silang antara respons Y dan dengan prediktor X
Y x = 1 x = 0 Σ
Y=1
Y=0
Σ
21
6
27
22
51
73
43
57
100
Analisis apakah ada hubungan antara X dan Y, hitung koefisien kontingensi!
2. Berikut ini adalah output SPSS untuk pasangan data frekuensi kategori tingkat
pendidikan dengan daya adaptasi dalam perkawinan dari 400 orang yang sudah
menikah. Berdasarkan output tersebut tentukan:
(a) Proporsi tingkat pendidikan yang dominan
(b) Proporsi daya adaptasi yang berhasil (tinggi dan sangat tinggi)
(c) Apakah daya adaptasi dipengaruhi (berhubungan) dengan tingkat pendidikan
(d) Derajat asosiasinya
6. Frequency Table
Pendidikan
232 58,0 58,0 58,0
116 29,0 29,0 87,0
52 13,0 13,0 100,0
400 100,0 100,0
ST
SM
SD
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Daya adaptasi
46 11,5 11,5 11,5
67 16,8 16,8 28,3
111 27,8 27,8 56,0
176 44,0 44,0 100,0
400 100,0 100,0
Sangat Rendah
Rendah
Tinggi
Sangat Tinggi
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Crosstabs
Pendidikan * Daya adaptasi Crosstabulation
Count
18 29 70 115 232
17 28 30 41 116
11 10 11 20 52
46 67 111 176 400
ST
SM
SD
Pendidikan
Total
Sangat
Rendah Rendah Tinggi Sangat Tinggi
Daya adaptasi
Total
Chi-Square Tests
19,943a 6 ,003
19,319 6 ,004
13,620 1 ,000
400
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
0 cells (,0%) have expected count less than 5. The
minimum expected count is 5,98.
a.
Symmetric Measures
,218 ,003
400
Contingency CoefficientNominal by Nominal
N of Valid Cases
Value Approx. Sig.
Not assuming the null hypothesis.a.
Using the asymptotic standard error assuming the null hypothesis.b.
***
7. Frequency Table
Pendidikan
232 58,0 58,0 58,0
116 29,0 29,0 87,0
52 13,0 13,0 100,0
400 100,0 100,0
ST
SM
SD
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Daya adaptasi
46 11,5 11,5 11,5
67 16,8 16,8 28,3
111 27,8 27,8 56,0
176 44,0 44,0 100,0
400 100,0 100,0
Sangat Rendah
Rendah
Tinggi
Sangat Tinggi
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Crosstabs
Pendidikan * Daya adaptasi Crosstabulation
Count
18 29 70 115 232
17 28 30 41 116
11 10 11 20 52
46 67 111 176 400
ST
SM
SD
Pendidikan
Total
Sangat
Rendah Rendah Tinggi Sangat Tinggi
Daya adaptasi
Total
Chi-Square Tests
19,943a 6 ,003
19,319 6 ,004
13,620 1 ,000
400
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
0 cells (,0%) have expected count less than 5. The
minimum expected count is 5,98.
a.
Symmetric Measures
,218 ,003
400
Contingency CoefficientNominal by Nominal
N of Valid Cases
Value Approx. Sig.
Not assuming the null hypothesis.a.
Using the asymptotic standard error assuming the null hypothesis.b.
***