Lapres paper 5 nia indah

1
Pengelompokan Kabupaten/Kota di Provinsi
Jawa Barat Berdasarkan Indeks Pembangunan
Manusia (IPM) Tahun 2007 dengan Analisis
Cluster
Indah Tri Wulandari(1) dan Kurnia Dwi Inayati(2)
(1)(2)Jurusan Statistika, FMIPA, Institut Teknologi Sepuluh Nopember Surabaya (ITS)
Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia
e-mail : (1)indahwulan46@gmail.com; (2)rania.statistika@gmail.com
Abstrak— Program KB agaknya sudah terbilang
sukses khususnya untuk kota-kota besar. Banyak faktor
yang menyebabkan perbedaan keberhasilan KB. Nono
Cahyono, data tugas akhirnya menyertakan enam
variabel yang sekiranya menjadi tolok ukur berhasil
atau tidaknya program KB di suatu daerah. Oleh
karena itu terdorong keinginan untuk mengelompokkan
provinsi-provinsi di Indonesia berdasarkan variabel
penunjang program KB diantaranya rasio jumlah
petugas lapangan KB, rasio klinik KB, jumlah dokter,
persentase peserta baru, persentase peserta baru
kontrasepsi jangka panjang dan angka kelahiran total.
Pengelompokan menggunakan metode cluster baik
hirarki maupun non-hirarki. Pada cluster hirarki
digunakan metode single linkage, complete linkage, dan
average linkage di mana jumlah cluster yang dibentuk
minimal dua dan maksimal lima. Sementara itu, pada
analisis cluster hirarki akan diawali dengan analisis
diskriminan untuk mengetahui jenis metode hirarki dan
jumlah cluster yang akan dipakai untuk k-means
cluster. Namun, sebelumnya pengujian asumsi normal
multivariat dan homogenitas matriks varian kovarian
akan dilakukan pada masing-masing cluster pada setiap
metode hirarki dan diperoleh hasil bahwa kedua asumsi
tersebut tidak terpenuhi. Namun agar analisis lebih
lanjut dapat dilakukan maka dianggap kedua asumsi
tersebut telah terpenuhi. Dari analisis diskriminan
diperoleh bahwa ketepatan klasifikasi dengan nilai chi-squared
tertinggi terdapat pada metode average linkage
dengan lima cluster sehingga pada k-means jumlah
cluster yang terbentuk adalah lima.
Kata Kunci--- pencapaian gerakan KB, cluster, hirarki
dan non hirarki.
I. PENDAHULUAN
Program Keluarga Berencana (KB) telah lebih dari dua
dasawarsa dicanangkan. Jumlah penduduk khususnya
penduduk di Indonesia yang mencapai 259 juta jiwa (hasil
sensus 2010) menuntut agar program Keluarga Berencana
kembali digalakkan. Program KB selain bertujuan untuk
menekan laju pertumbuhan penduduk, juga bertujuan untuk
menurunkan angka kematian ibu saat melahirkan yang
biasanya dipicu oleh usia yang terbilang belum cukup umur
untuk hamil. Pada mulanya program KB agak sulit
berkembang karena mitos “banyak anak banyak rejeki” yang
masih menjadi mindset masyarakat dan adanya pertentangan
dari beberapa ulama. Akan tetapi lambat laun seiring
modernisasi yang menuntut seseorang untuk hidup praktis
dan minimalis secara natural menyadarkan masyarakat
bahwa rumah tangga yang kecil akan lebih terencana dan
lebih sejahtera. KB merupakan program yang berfungsi
untuk menunda kelahiran anak pertama (post poning),
menjarangkan anak (spacing) atau membatasi (limiting)
jumlah anak yang diinginkan sesuai dengan keamanan
medis serta kemungkinan kembalinya fase kesuburan
(ferundity). Dengan perencanaan yang matang dalam
menentukan jumlah anak dan mengatur jarak antar anak,
maka keluarga sejahtera tidak akan sulit untuk
direalisasikan.
Program KB ini agaknya sudah terbilang sukses
khususnya untuk kota-kota besar. Tetapi masih terdapat
beberapa daerah yang sosialisasi program KB-nya belum
terlalu berhasil. Banyak faktor yang menyebabkan
perbedaan keberhasilan KB. Nono Cahyono, data tugas
akhirnya menyertakan enam variabel yang sekiranya
menjadi tolok ukur berhasil atau tidaknya program KB di
suatu daerah. Oleh karena itu terdorong keinginan untuk
mengelompokkan provinsi-provinsi di Indonesia
berdasarkan variabel penunjang program KB diantaranya
rasio jumlah petugas lapangan KB, rasio klinik KB, jumlah
dokter, persentase peserta baru, persentase peserta baru
kontrasepsi jangka panjang dan angka kelahiran total.
Pengelompokan ini berdasarkan pengelompokan secara
clustering baik hirarki maupun non hirarki.
II. TINJAUAN PUSTAKA
A. Program Keluarga Berencana
Gerakan untuk membentuk keluarga yang sehat dan
sejahtera dengan membatasi kelahiran. Dengan kata lain
keluarga berencana adalah usaha untuk mengukur jumlah
dan jarak anak yang diinginkan. Untuk dapat mencapai
hal tersebut maka dibuatlah beberapa cara atau alternatif
untuk mencegah ataupun menunda kehamilan. Cara-cara
tersebut termasuk kontrasepsi atau pencegahan kehamilan
dan perencanaan keluarga[1].
B. Uji Normal Multivariat

2
Variabel random (x1, x2, ..., xp) berdistribusi normal
multivariat dengan parameter μ dan Σ jika mempunyai
probability density function berikut.
푓(풙) =
1
(2휋)
2
푝|횺|
1
2
푒푥푝−1
[(풙−흁)′횺−ퟏ(풙−흁)]
2
( 2.1 )
dimana
x = vektor variabel respon
μ = vektor rataan umum
p = banyaknya variabel respon
Pada p=2, pengujian normal multivariat dapat dilakukan
dengan menggunakan plot chi-squared. Square distance
dapat dihitung dengan rumus.
2 = (풙풋 − 풙̅)
푑푗
′
푺−ퟏ(풙푗 − 풙̅), i = 1, 2, 3, ..., n
dimana푆−1 merupakan invers matriks kovarians.
Selanjutnya masing-masing nilai
2dibandingkandengan휒2;0,5
푑푗
2 . Jika proporsi푑푗
2 ≤ 휒푝;훼
2 tidak
kurang dari 0,5 maka dapat dikatakan bahwa variabel
random xj berdistribusi normal multivariat.
Hipotesis pengujian asumsi distribusi normal multivariat
adalah sebagai berikut.
H0: Data pengamatan berdistribusi normal multivariat
H1: Data pengamatan tidak berdistribusi normal multivariat
Statistik uji diberikan oleh.
푟푄 =
2 −̅푑̅̅2̅)(푞(푗)−푞̅ 푛푗=1 )
Σ (푑(푗)
√Σ (푥(푗)−푥̅)2 푛푗=1 √(푞(푗)−푞̅)2
dimana q( j) dapat dihitung dengan rumus.
q( j) = χ2
p((n-j+0,5)/n)
Nilai koefisien korelasi tersebut dibandingkan dengan
nilai r(n,α). H0 akan ditolak apabila rQ<r(n,α)[3].
C. Uji Homogenitas Matriks Varian Kovarian
Pengujian homogenitas berfungsi untuk mengetahui
varians data bersifat homogen atau heterogen berdasarkan
faktor tertentu. Uji homogen data univariat dapat dilakukan
melalui uji Bartlet dan Lavene. Sedangkan untuk data
multivariat, pengujian homogenitas dilakukan dengan uji
Box’s M dengan hipotesis sebagai berikut.
H0 : Σ1 = Σ2 = ... = Σk
H1 : minimal satu Σi≠Σj untuk i ≠ j
Statistik uji yang digunakan adalah sebagai berikut.
퐶 = (1 − 푢)푀
dimana
푀 = [Σ (푛푙 − 1) 푙 ]푙푛|푆푝표표푙푒푑| − Σ [(푛푙 − 1)푙푛|푆푙|] 푙
푢 = [Σ
1
(푛푙 − 1)
−
1
Σ (푛푙 − 1) 푙
푙
] [
2푝2 + 3푝 − 1
6(푝 + 1)(푔 − 1)
]
(6)
Hipotesis awal (H0) akan ditolak bila C> χ2
p(p+1)(g-
1)/2(α)[3].
Pendekatan distribusi χ2pada uji Box’s M tersebut akan
valid apabila setiap nltidak melebihi 20, serta jumlah p dan g
tidak melebihi lima. Ketika syarat-syarat tersebut tidak
terpenuhi maka statistik uji Box’s M didekati oleh distribusi
F[2].
D. Analisis Diskriminan
Analisis diskriminan merupakan metode statistik yang
digunakan untuk mengelompokkan atau mengklasifikasi
sejumlah obyek ke dalam beberapa kelompok berdasarkan
beberapa variabel. Setiap objek yang diklasifikasikan tidak
akan menjadi anggota lebih dari satu kelomok. Proses
analisis diskriminan mengasumsikan data berdistribusi
normal multivariat dan matriks varians-kovarians
homogen[3].
Suatu kombinasi liner x menghasilkan nilai Y11, Y12,
…,Y1n1 untuk pengamatan dari populasi pertama dan nilai
Y21, Y22, ….Y2n2 untuk pengamatan dari populasi kedua.
Kombinasi linier dari variabel-variabel ini akan membentuk
suatu fungsi diskriminan sebagai berikut[3].
y ˆ  ( x 
x )' S  1
x 1 2
pooled dimana :
푦̂ = nilai fungsi diskriminan
푥̅1 = rata-rata pengamatan kelompok 1
푥̅2 = rata-rata pengamatan kelompok 2
 n    n
 
 1 1
1 1 1
S s s
     
         
( 1) ( 1) ( 1) ( 1) pooled
1 2
n n n n
1 2 1 2
Klasifikasi atau pengelompokan obyek, misal π1 adalah
kelompok pertama dan π2 adalah kelompok kedua. Berikut
ini adalah titik tengah mean populasi univariat:
m  x  x S  1
x 
x 2 pooled 1 2 1 2
1
ˆ ( ) ( )
dimana :
1
  ( ) ( ) 0
E Y 
m ˆ  x  x S  1
x  x  0 1 2
1 2 pooled 1 2
  1
1
2 pooled E Y  m x x S x x     
ˆ ( ) ( ) 0
0 2 1 2 1 2
Y0 diharapkan lebih besar dari titik tengah dan bila
X0dari π2, Y0 diharapkan lebih kecil dari titik tengah. Bila
Y0>m maka masuk kelompok 1 dan Y0≤m maka masuk
kelompok 2[3].
E. Analisis Kelompok (Cluster Analysis)
Analisis kelompok (Cluster Analysis) adalah analisis
statistika yang bertujuan untuk mengelompokkan data.
Dilihat dari apa yang dikelompokkan, maka analisis
kelompok dibagi menjadi dua yaitu pengelompokan
observasi dan pengelompokan variabel.
Secara umum ada dua metode di dalam analisis kelompok
yaitu :
a. Metode hirarki, hasil pengelompokkannya disajikan
secara hirarki atau berjenjang dari n, (n-1) sampai 1
kelompok. yang termasuk dalam metode ini adalah
single linkage, complete linkage, average linkage.
b. Metode non hirarki. Metode ini dipakai jika banyaknya
kelompok sudah diketahui dan biasanya metode ini
dipakai untuk mengelompokkan data yang berukuran
besar, yang termasuk dalam metode ini adalah metode
K-means.
Untuk menyatakan suatu observasi atau variabel menpunyai
sifat yang lebih dekat dengan observasi tertentu daripada
dengan observasi yang lain digunakan fungsi yang disebut
jarak (distance). Suatu fungsi disebut jarak jika bersifat.
a. Tak negatif  0 ij d dan  0 ij d jika i=j
b. Simetri ij ji d  d
c. ij ik jk d  d  d panjang salah satu sisi segitiga selalu
lebih kecil atau sama-dengan jumlah dua sisi yang lain
Beberapa macam jarak yang biasa dipakai di dalam
analisis kelompok[3].
Tabel 1 Formula Untuk Menghitung Jarak Dalam Analisis Kelompok
Nomor Jarak Formula
(1)
(2)
(3)
(4)
(5)
(7)
(8)
(9)
(10)
(11)
(12)

3
2
p
1 Euclidean  
1 
d  x 
x
ij ik jk k
p
2 Manhattan 
d  x 
x
ij ik jk k
1
3 Pearson
 
ik jk
ij x
  k
p
k
x x
d
var
2
1

 
4 Korelasi ij ij d  1 r
5
Mutlak
korelasi
ij ij r d   1
Metode pengelompokan hirarki dibedakan berdasarkan
konsep jarak antar kelompok, penentuan jarak antar
kelompok untuk metode tersebut adalah :
Tabel 2 Metode Penentuan Jarak Antar Kelompok
Nomor Metode Jarak antara kelompok (i,j) dengan k
1
Single
linkage
min( , ) (i , j )k ik jk d  d d
2
Complete
linkage
max( , ) (i , j )k ik jk d  d d
3
Average
linkage
( , ) (i , j )k ik jk d  average d d
4
Median
linkage
( , ) (i , j )k ik jk d  median d d
III. METODOLOGI PENELITIAN
A. Sumber Data
Data yang digunakan dalam laporan ini merupakan data
sekunder yang diperoleh dari Tugas Akhir dengan judul
“Studi Pengelompokan Provinsi di Indonesia Berdasarkan
Pencapaian Gerakan Reproduksi Keluarga Sejahtera Tahun
1997-1998” oleh Nono Cahyono (1395030039).
B. Variabel Penelitian
Variabel penelitian yang digunakan adalah sebagai
berikut.
Tabel 3 Variabel Penelit ian
Variabel Deskripsi
X1
Rasio jumlah petugas lapangan KB (PLKB) terhadap
100 pasangan usia subur
X2 Rasio klinik KB terhadap 100 pasangan usia subur
X3 Rasio jumlah dokter terhadap 100 pasangan usia subur
X4
Prosentase peserta baru KB terhadap perkiraan
permintaan masyarakat (PPM)
X5
Prosentase peserta baru KB pengguna metode
kontrasepsi efektif jangka panjang terhadap PPM
X6 Angka kelahiran total (AKT) / Total Fertility Rate
C. Metode Analisa Data
Metode analisis yang digunakan dalam penelitian adalah
sebagai berikut.
1. Melakukan analisis cluster hirarki metode single linkage,
complete linkage, dan average linkage pada data kasus
pengelompokan provinsi di Indonesia berdasarkan
pencapaian gerakan reproduksi keluarga sejahtera.
2. Melakukan uji normal multivariat.
3. Melakukan uji homogenitas matriks varian kovarian.
4. Melakukan analisis diskriminan pada data kasus
pengelompokan provinsi di Indonesia berdasarkan
pencapaian gerakan reproduksi keluarga sejahtera.
5. Melakukan analisis non hirarki metode cluster k-means
pada data kasus pengelompokan provinsi di Indonesia
berdasarkan pencapaian gerakan reproduksi keluarga
sejahtera.
IV. HASIL DAN PEMBAHASAN
A. Uji Normal Multivariat
Pengujian normal multivariat pada seluruh variable
penelitian yang meliputi Persentase penduduk yang tinggal
di perkotaan (X1), Persentase penduduk yang berpendidikan
di atas SLTP (X2), Rata-rata pendapatan per kapita (X3),
Rasio ketergantungan penduduk (X4), Peranan sektor
industri dalam PDRB (X5), dan Persentase penduduk miskin
(X6) bertujuan untuk mengetahui apakah asumsi normal
multivariat telah terpenuhi. Pengujian ini menggunakan
statistik uji nilai korelasi (rQ) yang kemudian dibandingkan
dengan rtabel.
Dari hasil penghitungan korelasi antara dj dan q(c,p)
didapatkan nilai korelasi (rQ) sebesar 0,989. Nilai tersebut
lebih besar dari nilai r(26;0,05) = 0,9612 sehingga hipotesis
awal (H0) gagal ditolak. Jadi dapat disimpulkan bahwa
dengan tingkat keyakinan 95%, data respon berdistribusi
normal multivariat.
B. Uji Homogenitas Varian
Hasil pengujian homogenitas varian adalah sebagai
berikut.
Tabel 1 Nilai Levene dan P-value
Levene df1 df2 P-value
0,133 5 150 0, 984
Berdasarkan Tabel 1 terlihat bahwa p-value yang
dihasilkan sebesar 0,984 sehingga gagal tolak H0 maka
dengan taraf signifikansi 5% dapat disimpulkan bahwa
varian dari variabel penelitian sudah homogen.
B. Cluster Metode Hirarki
Analisis cluster dengan metode hirarki dibedakan
menjadi tiga, diantaranya single linkage, complete linkage
dan Ward’s Methode. Berikut merupakan analisis dari
masing-masing metode.
1. Metode Single Linkage
Metode Single Linkage merupakan metode yang
didasarkan pada jarak minimum antar kedua titik.
Berdasarkan output agglomeration schedule (Lampiran 2A),
dapat dilakukan pengelompokan secara bertahap. Pada stage
1, cluster yang terbentuk adalah kabupaten/kota pada
nomor 3 dan 8 yaitu Kabupaten Cianjur dan Kabupaten
Kuningan karena kedua kabupaten tersebut memiliki
kemiripan atau jarak yang paling dekat yaitu 0,402 maka
kedua provinsi tersebut dikelompokkan terlebih dahulu.
Kemudian pada kolom next stage pada baris pertama,
kelanjutan stage untuk cluster berikutnya adalah stage 4.
Pada stage 12, cluster yang terbentuk adalah provinsi pada
nomor 3 dan 7, yaitu Kabupaten Cianjur dan Kabupaten
Ciamis dengan jarak 0,608. Pada Stage Cluster First
Appears kolom cluster 1, kabupaten pada nomor 2 yaitu
Cianjur telah muncul satu kali pada stage sebelumnya.

4
Demikian selanjutnya proses pembentukan cluster hingga
seluruh cluster terbentuk.
Berikut merupakan dendogram yang terbentuk
berdasarkan metode single linkage.
Gambar 1 Dendrogram Single Linkage
Berdasarkan dendogram di atas, dapat diketahui bahwa
dari 26 kabupaten/kota di provinsi Jawa Barat dapat
dikelompokkan menjadi 2 cluster dengan masing-masing
anggota cluster sebagai berikut.
Tabel 4 Pengelompokkan 2 Cluster
Cluster Provinsi
1 Bogor, Sukabumi, Cianjur, Bandung, Garut,
Tasikmalaya, Ciamis, Kuningan, Cirebon,
Majalengka, Sumedang, Indramayu, Subang,
Purwakarta, Karawang, Bekasi, Kab.Bandung
Barat, Kota Tasikmalaya dan Kota Banjar.
2 Kota Bogor, Kota Sukabumi, Kota Bandung, Kota
Cirebon, Kota Bekasi, Kota Depok dan Kota
Cimahi.
Berikut merupakan pengelompokkan 26 kabupaten/kota
di provinsi Jawa Barat menjadi 3 cluster berdasarkan
dendogram di atas dengan masing-masing anggota cluster
sebagai berikut.
Cluster Provinsi
Purwakarta, Karawang, Kab.Bandung Barat, Kota
Tasikmalaya dan Kota Banjar.
2 Bekasi
Cimahi.
sebagai berikut.
Cluster Provinsi
Purwakarta, Karawang, Kab.Bandung Barat, Kota
dan Kota Banjar.
2 Bekasi
Cimahi.
4 Kota Tasikmalaya
sebagai berikut.
Cluster Provinsi
1 Bogor, Sukabumi, Cianjur, Bandung, Tasikmalaya,
Ciamis, Kuningan, Cirebon, Majalengka,
Sumedang, Indramayu, Subang, Purwakarta,
Karawang, Kab.Bandung Barat dan Kota Banjar.
2 Garut
3 Bekasi
Cimahi.
5 Kota Tasikmalaya
Selanjutnya, untuk mengetahui apakah variabel-variabel
yang telah membentuk cluster tersebut merupakan variabel
pembeda dalam pengelompokan, maka dilakukan analisis
variansi sebagai berikut.
Tabel Hasil Analysis of Variance (ANOVA)
Jumlah
Cluster
P-Value
X1 X2 X3 X4 X5 X6
5 0,00 0,161 0,00 0,00 0,00 0,119
4 0,00 0,093 0,00 0,00 0,087 0,00
3 0,00 0,154 0,00 0,00 0,040 0,00
2 0,00 0,063 0,00 0,00 0,607 0,00
Berdasarkan Tabel dapat dilihat bahwa pada
pengelompokan 5 cluster terdapat 4 variabel yang
signifikan yaitu X1, X3, X4 dan X5. Pada pengelompokan 4
dan 2 cluster juga terdapat 4 variabel yang signifikan yaitu
X1, X3, X4 dan X6. Sedangkan pada pengelompokan 3
cluster terdapat 5 variabel yang signifikan yaitu X1, X3, X4,
X5 dan X6. Variabel-variabel yang signifikan ini mempunyai
arti bahwa variabel tersebut merupakan variabel pembeda
dalam pengelompokan. Dari analisis varinsi ini didapatkan
hasil bahwa pengelompokan 3 cluster dengan metode single
linkage merupakan hasil yang optimum karena terdapat 5
variabel yang signifikan.
2. Metode Complete Linkage
Metode Complete Linkage merupakan metode yang
didasarkan pada jarak maksimum antar kedua titik.
Berdasarkan output agglomeration schedule (Lampiran 2B),
dapat dilakukan pengelompokan secara bertahap. Pada stage
1, cluster yang terbentuk adalah provinsi pada nomor 3 dan
8 yaitu Kabupaten Cianjur dan Kuningan karena kedua

5
kabupaten memiliki kemiripan atau jarak yang paling dekat
yaitu 0,634 maka kedua provinsi tersebut dikelompokkan
terlebih dahulu. Kemudian pada kolom next stage pada baris
pertama, kelanjutan stage untuk cluster berikutnya adalah
stage 7. Pada stage 7, cluster yang terbentuk adalah
kabupaten pada nomor 2 dan 3, yaitu Kabupaten Sukabumi
dan Ciajur dengan jarak 1,176. Pada Stage Cluster First
Appears kolom cluster 2, kabupaten pada nomor 3 yaitu
kabupaten Cianjur telah muncul satu kali pada stage
sebelumnya. Demikian selanjutnya proses pembentukan
cluster hingga seluruh cluster terbentuk.
berdasarkan metode complete linkage.
Gambar 2 Dendrogram Complete Linkage
Berdasarkan dendogram di atas, dapat diketahui bahwa
dari 26 kabupaten/kota di Jawa Barat dapat dikelompokkan
menjadi 2 cluster dengan masing-masing anggota cluster
sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung, Bekasi, Kota Bogor, Kota
Sukabumi, Kota Bandung, Kota Cirebon, Kota
Bekasi, Kota Depok, Kota Cimahi, Kota
2 Sukabumi, Cianjur, Garut, Tasikmalaya, Ciamis,
Kuningan, Cirebon, Majalengka, Sumedang,
Indramayu, Subang, Purwakarta, Karawang dan
Kab.Bandung Barat.
di Jawa Barat menjadi 3 cluster berdasarkan dendogram di
atas dengan masing-masing anggota cluster sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung dan Bekasi
Kab.Bandung Barat.
Cirebon, Kota Bekasi, Kota Depok, Kota Cimahi,
Kota Tasikmalaya dan Kota Banjar.
di Jawa Barat menjadi 4 cluster berdasarkan dendogram di
atas dengan masing-masing anggota cluster sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung dan Bekasi
Kab.Bandung Barat.
3 Kota Bogor, Kota Sukabumi, Kota Cirebon, Kota
4 Kota Bandung, Kota Bekasi, Kota Depok dan Kota
Cimahi.
sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung dan Bekasi.
2 Sukabumi, Cianjur, Ciamis, Kuningan, Cirebon,
Purwakarta, Karawang dan Kab.Bandung Barat.
3 Garut dan Tasikmalaya,
4 Kota Bogor, Kota Sukabumi dan Kota Cirebon.
5 Kota Bandung, Kota Bekasi dan Kota Depok.
Jumlah
Cluster
P-Value
X1 X2 X3 X4 X5 X6
5 0,00 0,002 0,00 0,00 0,001 0,00
4 0,00 0,003 0,00 0,00 0,00 0,00
3 0,00 0,011 0,00 0,00 0,001 0,00
2 0,00 0,145 0,00 0,00 0,046 0,00
pengelompokan 5, 4 dan 3 cluster seluruh variabel
signifikan artinya seluruh variabel tersebut merupakan
variabel pembeda pada pengelompokan 5, 4, dan 3 cluster
dengan metode complete linkage, sehingga ke tiga cluster ini
baik digunakan untuk pengelompokan. Sedangkan pada
pengelompokan 2 cluster terdapat 1 variabel yang tidak
signifikan yaitu X5.
3. Metode Ward
Berdasarkan output agglomeration schedule (Lampiran
2C), dapat dilakukan pengelompokan secara bertahap. Pada
stage 1, cluster yang terbentuk adalah kabupaten pada
nomor 3 dan 8 yaitu Kabupaten Cianjur dan Kuningan
karena kedua provinsi memiliki kemiripan atau jarak yang
paling dekat yaitu 0,317 maka kedua provinsi tersebut
dikelompokkan terlebih dahulu. Kemudian pada kolom next
stage pada baris pertama, kelanjutan stage untuk cluster
berikutnya adalah stage 8. Pada stage 8, cluster yang
terbentuk adalah kabupaten pada nomor 2 dan 3, yaitu
Kabupaten Sukabumi dan Cianjur dengan jarak 3,685. Pada

6
Stage Cluster First Appears kolom cluster 2, kabupaten
pada nomor 3 yaitu kabupaten Cianjur telah muncul satu
kali pada stage sebelumnya. Demikian selanjutnya proses
pembentukan cluster hingga seluruh cluster terbentuk.
berdasarkan metode Ward.
Gambar 3 Dendrogram Metode Ward
Berdasarkan dendogram pada Gambar 3, dapat diketahui
bahwa dari 26 kabupaten/kota di provinsi Jawa Barat dapat
dikelompokkan menjadi 2 cluster dengan masing-masing
anggota cluster sebagai berikut.
Cluster Provinsi
Purwakarta, Karawang, Bekasi dan Kab.Bandung
Barat.
sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung, Sumedang, Indramayu,
Purwakarta, Karawang, Bekasi dan Kab.Bandung
Barat
2 Sukabumi, Cianjur Garut, Tasikmalaya, Ciamis,
Kuningan, Cirebon, Majalengka dan Subang
sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung
Kuningan, Cirebon, Majalengka dan Subang.
Cimahi.
sebagai berikut.
Cluster Provinsi
1 Bogor, Bandung
Kuningan, Cirebon, Majalengka dan Subang.
3 Sumedang, Indramayu, Karawang dan
Kab.Bandung Barat
Cimahi.
Jumlah
Cluster
P-Value
X1 X2 X3 X4 X5 X6
5 0,00 0,00 0,00 0,00 0,00 0,00
4 0,00 0,007 0,00 0,00 0,00 0,00
3 0,00 0,021 0,00 0,00 0,00 0,00
2 0,00 0,005 0,00 0,00 0,923 0,00
pengelompokan 5, 4 dan 3 cluster seluruh variabel
signifikan artinya seluruh variabel tersebut merupakan
variabel pembeda pada pengelompokan 5, 4, dan 3 cluster
dengan metode complete linkage, sehingga ke tiga cluster ini
baik digunakan untuk pengelompokan. Sedangkan pada
pengelompokan 2 cluster terdapat 1 variabel yang tidak
signifikan yaitu X5.
C. Cluster Metode Non Hirarki
Berdasarkan hasil Analysis of Variance (ANOVA) pada
metode single linkage pengelompokan 3 cluster merupakan
hasil yang optimum, sedangkan pada metode complete
linkage dan metode ward diperoleh 5, 4 dan 3 cluster
sebagai pengelompokan yang optimum, sehingga pada
metode non hirarki yaitu k-means cluster akan dibentuk 3
cluster. Hasil dari k-means cluster adalah sebagai berikut.
Tabel 18 Nilai Awal Tit ik Tengah Cluster
Cluster
1 2 3
X1 -0,37458 -0,72975 1,53729
X2 -0,77869 0,19926 1,33438
X3 -0,19746 2,58957 -0,49083
X4 0,83867 -1,18396 -0,40162

7
X5 2,28650 -1,01064 -0,66239
X6 -1,13358 1,18677 -0,64933
Tabel 18 merupakan tampilan pertama proses clustering
data sebelum dilakukan iterasi. Nilai-nilai dalam tabel
tersebut merupakan nilai awal dari pusat cluster untuk
proses iterasi. Misalkan untuk variabel X1 pada cluster 1
yang memiliki nilai awal pusat cluster sebesar -0,37458
sampai dengan variabel X6 pada cluster 3 yang memiliki
nilai awal pusat cluster sebesar -0,64933.
Untuk mendeteksi berapa kali proses iterasi yang
dilakukan dalam proses clustering dari 26 obyek yang
diteliti, dapat dilihat tampilan output berikut ini.
Tabel 19 Iteration History
Iterasi
Perubahan pada Pusat Cluster
1 2 3
1 1,838 2,032 1,705
2 0,000 0,286 0,610
3 0,000 0,000 0,000
Nampak pada Tabel 19 proses clustering yang dilakukan
membutuhkan tiga tahapan iterasi untuk mendapatkan
cluster yang tepat dengan jarak minimum antar pusat cluster
adalah 4,321. Pada iterasi pertama, cluster 1 mengalami
perubahan pusat cluster sebesar 1,838. Kemudian iterasi
berhenti pada tahap dua karena perubahan pada pusat cluster
sangat kecil atau mendekati nol.
Adapun hasil akhir dari proses clustering adalah sebagai
berikut.
Tabel 20 Hasil Akhir Pusat Cluster
Cluster
1 2 3
X1 -0,31826 -0,75329 1,36864
X2 -0,73616 -0,09196 0,69006
X3 0,36483 0,58486 -1,15092
X4 -0,08132 -0,74887 1,18430
X5 1,32766 -0,70833 0,06675
X6 0,00275 0,75663 -10,13702
Nampak pada Tabel 20 jumlah cluster yang terbentuk
adalah sebanyak lima. Misalkan untuk variabel X1, centroid
pada cluster 1 sampai dengan 3 berturut-turut adalah -
0,31826; -0,75329; dan 1,36864. Sementara untuk variabel X2,
centroid untuk cluster 1 adalah -0,73616 dan begitu
seterusnya untuk variabel X3 sampai dengan X6.
Tahapan selanjutnya yang perlu dilakukan yaitu melihat
signifikansi variabel pada cluster yang terbentuk. Dalam hal
ini dapat dilihat dari nilai F dan p-value masig-masing
variabel, seperti nampak dalam tabel berikut.
Tabel 21 ANOVA
Variabel
CLuster Error
F P-value
Mean Sq df1 Mean Sq df2
X1 11.201 2 0.113 23 99.18 0,000
X2 3.581 2 0.776 23 4.618 0.021
X3 7.75 2 0.413 23 18.76 0,000
X4 8.995 2 0.305 23 29.51 0,000
X5 8.316 2 0.364 23 22.86 0,000
X6 8.606 2 0.339 23 25.42 0,000
Berdasarkan Tabel dapat dilihat bahwa seluruh variabel
memiliki nilai p-value lebih kecil dari pada α (0,05) ,
sehingga keputusannya adalah tolak H0. Hal ini berarti
hanya seluruh variabel merupakan variabel pembeda dalam
pengelompokan 3 cluster.
Selanjutnya, untuk mengetahui jumlah anggota masing-masing
cluster yang terbentuk dapat dilihat pada tabel
berikut ini.
Tabel 22 Jumlah Anggota Masing-Masing Cluster
Cluster Anggota
1
Bogor, Bandung, Purwakarta, Karawang,
Bekasi dan Kab.Bandung Barat
2
Sukabumi, Cianjur, Garut, Tasikmalaya,
Ciamis, Kuningan, Cirebon, Majalengka,
Sumedang, Indramayu, Subang dan Kota
Banjar.
3
Kota Bogor, Kota Sukabumi, Kota Bandung,
Kota Cirebon, Kota Bekasi, Kota Depok, Kota
Cimahi dan Kota Tasikmalaya.
V. KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasarkan hasil analisis dan pembahasan maka
kesimpulan yang dapat diambil adalah sebagai berikut.
1. Pengujian asumsi normal multivariat diperoleh hasil
bahwa data ke-26 kabupaten/kota di provinsi Jawa Barat
dengan total enam varibel berdistribusi normal
multivariat.
2. Hasil pengujian homogenitas varians dengan uji Levene
didapatkan hasil bahwa variabel penelitian telah
homogen.
3. Pada metode single linkage diperoleh pengelompokkan
pada 2 cluster terbagi atas 19 provinsi (kelompok 1) dan
7 provinsi (kelompok 2), sedangkan untuk 3 cluster
terbagi atas 18 provinsi (kelompok 1), 1 provinsi
(kelompok 2) dan 7 provinsi (kelompok 3). Untuk 4
cluster terbagi atas 17 provinsi (kelompok 1), 1 provinsi
(kelompok 2), 7 provinsi (kelompok 3) dan 1 provinsi
(kelompok 4) dan untuk 5 cluster terbagi atas 16
provinsi (kelompok 1), 1 provinsi (kelompok 2 dan 3), 7
provinsi (kelompok 4), dan 1 provinsi (kelompok 5).
4. Pada metode complete linkage diperoleh
pengelompokkan 2 cluster yang terbagi atas 12 provinsi
(kelompok 1) dan 14 provinsi (kelompok 2), sedangkan
untuk 3 cluster terbagi atas 3 provinsi (kelompok 1), 14
provinsi (kelompok 2) dan 9 provinsi (kelompok 3).
Untuk 4 cluster terbagi atas 3 provinsi (kelompok 1), 14
provinsi (kelompok 2), 6 provinsi (kelompok 3) dan 4
provinsi (kelompok 4) dan untuk 5 cluster terbagi atas 3
provinsi (kelompok 1), 12 provinsi (kelompok 2), 2
provinsi (kelompok 3), 3 provinsi (kelompok 4), dan 3
provinsi (kelompok 5).
5. Pada metode ward diperoleh pengelompokkan 2 cluster
yang terbagi atas 17 provinsi (kelompok 1) dan 9
provinsi (kelompok 2), sedangkan untuk 3 cluster terbagi
atas 8 provinsi (kelompok 1), 8 provinsi (kelompok 2)
dan 10 provinsi (kelompok 3). Untuk 4 cluster terbagi
atas 2 provinsi (kelompok 1), 9 provinsi (kelompok 2), 5
provinsi (kelompok 3) dan 4 provinsi (kelompok 4) dan
untuk 5 cluster terbagi atas 2 provinsi (kelompok 1), 9
provinsi (kelompok 2), 4 provinsi (kelompok 3), 5
provinsi (kelompok 4), dan 4 provinsi (kelompok 5).
6. Berdasarkan metode hirarki, jumlah cluster yang
terbentuk pada k-means cluster adalah sebanyak 3.
7. Hasil k-means cluster diperoleh bahwa cluster 1 terdiri
atas 6 provinsi, cluster 2 sebanyak 12 provinsi, dan
cluster 3 sebanyak 8 provinsi.

8
B. Saran
Saran untuk penelitian selanjutnya sebaiknya peneliti
lebih teliti dalam pencarian data agar sesuai dengan analisis
yang akan digunakan, lebih memahami metode analisis yang
akan digunakan serta cara penyusunan kata atau penggunaan
kata-kata dalam pembuatan interpretasi, sehingga mudah
dipahami ketika oleh pembaca dan cukup menjelaskan
output hasil analisis yang disajikan dalam laporan.
DAFTAR PUSTAKA
[1] Cahyono, Nono. 1999. Studi Pengelompokan Provinsi di Indonesia
Berdasarkan Pencapaian Gerakan Reproduksi Keluarga Sejahtera
Tahun 1997-1998. Tugas Akhir Mahasiswa Jurusan Stat istika FMIPA-ITS.
Surabaya: ITS.
[2] Box, G. E. P. (1950). Problems in the Analysis of Growth and Wear
Curves. Biometrics, 6, 362-389.
[3] Johnson, Richard A., Wichern, Dean W. (2007).Applied Multivariate
Statistical Analysis (6th ed.). USA:Pearson Prent ice Hall.
[4] Sharma, S. (1996). Applied Multivariat Techniques. New York : John
Wiley & Sons, Inc.

LAMPIRAN
Lampiran 1 : Output Minitab
MTB > %E:multi1.txt c1-c6
Executing from file: E:multi1.txt
Answer = 5.8357
Answer = 3.2262
Answer = 2.2763
Answer = 5.2535
Answer = 13.9537
Answer = 4.2691
Answer = 4.1851
Answer = 2.7643
Answer = 4.2098
Answer = 2.9048
Answer = 2.4633
Answer = 7.2690
Answer = 3.9083
Answer = 7.4235
Answer = 4.1219
Answer = 9.1766
Answer = 3.9463
Answer = 5.9150
Answer = 7.0814
Answer = 3.7754
Answer = 6.0696
Answer = 6.6984
Answer = 5.5537
Answer = 5.6325
Answer = 10.9851
Answer = 11.1014
Data Display
t 0.500000
Row dd q
1 2.2763 1.1174
2 2.4633 1.7360
3 2.7643 2.1657
4 2.9048 2.5274
5 3.2262 2.8541
6 3.7754 3.1604
7 3.9083 3.4546
8 3.9463 3.7420
9 4.1219 4.0266
10 4.1851 4.3114
11 4.2098 4.5991
12 4.2691 4.8924
13 5.2535 5.1936
14 5.5537 5.5057
15 5.6325 5.8317
16 5.8357 6.1753
17 5.9150 6.5410
18 6.0696 6.9348
19 6.6984 7.3644
20 7.0814 7.8408
21 7.2690 8.3804
22 7.4235 9.0089
23 9.1766 9.7714
24 10.9851 10.7579
25 11.1014 12.1981
26 13.9537 15.1352
MTB > Correlation 'dd' 'q'.
Correlations: dd, q
Pearson correlation of dd and q =
0.989
P-Value = 0.000

Lampiran 2 : Output SPSS
A. Single Linkage
Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Cluster 1 Cluster 2 Cluster 1 Cluster 2 Next Stage
1 3 8 .402 0 0 4
2 7 13 .563 0 0 4
3 18 21 .576 0 0 18
4 3 7 .608 1 2 5
5 3 10 .652 4 0 7
6 20 23 .668 0 0 10
7 3 9 .759 5 0 8
8 2 3 .949 0 7 14
9 22 24 1.203 0 0 10
10 20 22 1.323 6 9 21
11 1 4 1.486 0 0 15
12 11 12 1.655 0 0 14
13 15 17 1.672 0 0 15
14 2 11 1.760 8 12 17
15 1 15 1.880 11 13 16
16 1 14 2.003 15 0 17
17 1 2 2.026 16 14 19
18 18 19 2.160 3 0 21
19 1 6 2.380 17 0 20
20 1 26 3.103 19 0 22
21 18 20 3.230 18 10 25
22 1 5 3.300 20 0 23
23 1 25 4.068 22 0 24
24 1 16 4.110 23 0 25
25 1 18 4.720 24 21 0

B. Complete Linkage
Stage
Cluster Combined
Coefficients
1 3 8 .634 0 0 7
2 7 13 .750 0 0 11
3 18 21 .759 0 0 14
4 20 23 .818 0 0 16
5 9 10 .871 0 0 13
6 22 24 1.097 0 0 16
7 2 3 1.176 0 1 11
8 1 4 1.219 0 0 18
9 11 12 1.287 0 0 12
10 15 17 1.293 0 0 12
11 2 7 1.314 7 2 13
12 11 15 1.570 9 10 20
13 2 9 1.733 11 5 19
14 18 19 1.766 3 0 21
15 5 6 1.998 0 0 22
16 20 22 2.000 4 6 23
17 25 26 2.017 0 0 21
18 1 16 2.103 8 0 24
19 2 14 2.785 13 0 20
20 2 11 3.270 19 12 22
21 18 25 3.435 14 17 23
22 2 5 3.999 20 15 25
23 18 20 4.102 21 16 24
24 1 18 4.873 18 23 25
25 1 2 6.769 24 22 0

C. Ward’s Methode
Stage
Cluster Combined
Coefficients
1 3 8 .317 0 0 8
2 7 13 .692 0 0 11
3 18 21 1.072 0 0 13
4 20 23 1.480 0 0 18
5 9 10 1.916 0 0 15
6 22 24 2.464 0 0 18
7 1 4 3.074 0 0 14
8 2 3 3.685 0 1 11
9 11 12 4.328 0 0 12
10 15 17 4.975 0 0 12
11 2 7 5.666 8 2 15
12 11 15 6.505 9 10 22
13 18 19 7.457 3 0 21
14 1 14 8.449 7 0 19
15 2 9 9.442 11 5 20
16 5 6 10.441 0 0 20
17 25 26 11.450 0 0 21
18 20 22 12.561 4 6 23
19 1 16 13.961 14 0 22
20 2 5 15.822 15 16 24
21 18 25 18.074 13 17 23
22 1 11 20.808 19 12 24
23 18 20 24.109 21 18 25
24 1 2 28.875 22 20 25
25 1 18 40.187 24 23 0

Lapres paper 5 nia indah

Recommended

Recommended

More Related Content

What's hot

What's hot (14)

Viewers also liked

Viewers also liked (11)

Similar to Lapres paper 5 nia indah

Similar to Lapres paper 5 nia indah (20)

Recently uploaded

Recently uploaded (7)

Lapres paper 5 nia indah