SlideShare a Scribd company logo
1 of 28
Download to read offline
PASCA SARJANA PERENCANAAN WILAYAH DAN KOTA
SEKOLAH ARSITEKTUR, PERENCANAAN DAN PENGEMBANGAN KEBIJAKAN
INSTITUT TEKNOLOGI BANDUNG
2017
ANDI IDHAM ASMAN 25417022
TRI WAHYUNINGSIH 25417061
TUGAS METODE ANALISIS PERENCANAAN
DEFINISI ANALISIS KLASTER
n objek diukur
berdasarkan variabel
Mengukur kemiripan
antar objek (matrix
similarity)
Membentuk klaster Profil klaster
Sumber: Dillon (1984:158)
• Menurut Dillon (1984), analisis klaster merupakan pengelompokkan objek/individu dikelompokkan ke
dalam k kelompok berdasarkan sifat-sifat yang diamati sehingga objek yang terletak dalam satu
kelompok memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam
kelompok lain
• Analisis klaster tidak menunjukkan tingkatan (ordinal) tetapi hanya menunjukkan perbedaan sifat objek
(nominal)
• Dalam terminologi SPSS, analisis klaster merupakan perlakuan terhadap baris
Analisis
Multivariat
Dependensi
Regresi
Regresi Logistik
Analisis
Diskriminan
Analisis Konjoin
Analisis Kanonikal
Analisis varian
Interdependensi
Analisis Faktor
Analisis klaster
KEDUDUKAN ANALISIS KLASTER
PERBEDAAN ANALISIS KLASTER DAN
ANALISIS FAKTOR
Analisi Klaster :
- Mengelompokkan objek
atau data berdasarkan
ukuran jarak (proximity)
- Pengelompokkan dilakukan
pada BARIS (objek)
Analisi Faktor :
- Mengelompokkan objek
berdasarkan pola dari
variasi (correlation)
- Pengelompokkan dilakukan
pada KOLOM (variabel)
ANALISIS
MULTIVARIAT
INTERDEPENDENSI
Tujuan Analisis klaster
Tujuan utama analisis klaster menururt Sutanto (2009:681) adalah mengelompokkan objek (elemen)
seperti orang, produk (barang), toko, atau organisasi, ke dalam kelompok-kelompok yang relatif
homogen, berdasarkan pada suatu set variabel yang dipertimbangkan untuk diteliti.
Ciri-ciri Analisis klaster
▪ Heterogenitas (perbedaan) yang tinggi antar-klaster yang satu dengan klaster yang lainnya (between
klaster)
▪ Homogenitas (kesamaan) yang tinggi antar-anggota dalam satu klaster (within-klaster)
UKURAN KEMIRIPAN OBJEK
• Digunakan untuk data metrik (interval-rasio)
• Jarak yang besar menunjukkan sedikit kesamaan, jarak kecil menunjukkan bahwa suatu objek semakin mirip
dengan objek lain
• Klaster berdasarkan jarak memiliki kesamaan nilai meski pola berbeda
• Ukuran jarak terbagi atas jarak euklidian, jarak city block, dan jarak mahalanobis
Digunakan untuk data non metrik (nominal atau ordinal)
• Digunakan untuk data metrik (interval-rasio)
• Kesamaan antarobjek dilihat dari koefisien korelasi antarpasangan objek yang diukur dengan beberapa variabel
• Jarang digunakan karena berfokus pada pola hubungan meski nilai berbeda, padahal titik berat analisis klaster
adalah besarnya nilai objek
Pengukuran Jarak (Distance-Type Measures)
Pengukuran Asosiasi (Matching-Type Measures)
Pengukuran Korelasi (Correlation Coefficient)
Pengukuran Jarak (Distance-Type Measures)
• Besarnya jarak suatu garis lurus
yang menghubungkan antarobjek
yang diamati
• Digunakan jika variabel amatan
saling bebas tidak berkorelasi satu
sama lain (tidak terjadi
multikolinearitas
Jarak Euklidian
d2
xy = σ 𝑗−1
𝑝
( 𝑋𝑗 − 𝑌𝑗) 2
Keterangan:
d2
xy = kuadrat jarak euklidian antara objek X dan Y
p = banyaknya variabel yang diamati
𝑋𝑗 = nilai j pada objek X
𝑌𝑗= nilai j pada objek Y
d(x,y) = σ 𝑖 ȁ 𝑋𝑖 − ȁ𝑌𝑖
d2
ij = 𝑋𝑖𝑘 − 𝑋𝑗𝑘
𝑡
𝑆−1 𝑥𝑖 − 𝑦𝑖
Penyederhanaan dari perbedaan rata-rata pada antar objek
Jarak City-Block
Digunakan Jika terjadi multikolineritas pada data yang diamati
Jarak Mahalanobis
Keterangan:
dxy = kuadrat jarak euklidian antara objek X dan Y
𝑋𝑖 = nilai pada objek X
𝑌𝑖= nilai j pada objek Y
Keterangan:
dij = kuadrat jarak mahalanobis
𝑋𝑖 𝑑𝑎𝑛 𝑋𝑗= vektor dari nilai objek i dan j
S = matriks kovarian
1
2 3
Bagaimana mengukur
tingkat kesamaan
(similarity)?
Bagaimana
membentuk klaster?
Berapa banyak klaster
yang terbentuk?
Pertanyaan yang harus
dijawab dalam analisis
klaster
METODE ANALISIS KLASTER
Menurut Dillon (1984), metode analisis klaster terbagi atas:
Metode Hirarki: metode pengelompokkan yang membentuk tingkatan tertentu seperti pada struktur pohon karena proses
pengklasterannya dilakukan secara bertahap
Metode Non Hirarki: metode pengelompokkan diawali dengan menentukan terlebih dahulu jumlah klaster yang diinginkan
(dua, tiga, atau yang lain). Setelah jumlah klaster ditentukan, maka proses klaster dilakukan dengan tanpa mengikuti proses
hirarki.
Proses Pengelompokkan
Hasil Pengelompokkan
• Kelompok terbentuk secara alami secara
bertahap
• Proses pembentukan klaster melihat
jarak tiap dua objek terdekat
• Jumlah klaster ditentukan kemudian
• Dikenal dengan metode k-means
• Jumlah klaster ditentukan terlebih
dahulu
• Membentuk klaster dengan melakukan
pengujian (trial and error, dalam SPSS
dikenal dengan istilah proses iterasi
• Hasil dapat dibaca menggunakan
dendogram dan icycle vertical
• Klaster yang terbentuk berupa
karakteristik nominal (perbedaan sifat)
bukan ordinal (tingkatan)
• Klaster yang terbentuk berupa
karakteristik nominal (perbedaan sifat)
bukan ordinal (tingkatan)
• Interpretasi hasil klaster menggunakan
rumus rata-rata sampel:
X = µ + Z . 𝜎
Keterangan:
X = rata-rata sampel (dalam hal ini rata-rata
variabel pada klaster tertentu)
𝜇 = rata-rata populasi
𝜎 = standar deviasi
Z = nilai standardisasi
METODE HIRARKI METODE NON HIRARKI
METODE ANALISIS KLASTER
Metode Hirarki
Tiap objek pada mulanya dianggap
sebagai klaster tersendiri, kemudian
dua klaster yang memiliki jarak
terdekat, bergabung menjadi satu
klaster. Demikian seterusnya hingga
kumpulan objek membentuk klaster
tunggal.
Metode pemecahan dimulai dengan
memisahkan satu objek terjauh sehingga
terbentuk grup splinter. Kemudian tiap
objek dalam grup utama dibandingkan
jaraknya ke grup utama dan grup splinter.
Apabila suatu objek ternyata lebih dekat
dengan group splinter maka objek
tersebut bergabung dengan group
splinter. Demikian seterusnya hingga
semua objek memiliki jarak yang lebih
dekat ke grup utama, maka clustering
berhenti.
Aglomeratif Divisif
Sumber: Everitt (2011:72)
Metode Hirarki: Aglomeratif
Jarak antar klaster ditentukan oleh jarak minimum antara dua objek
dalam klaster yang berbeda
Single Linkage
Jarak antar klaster ditentukan oleh jarak terjauh antara dua objek
dalam klaster yang berbeda
Complete Linkage
Average Linkage
Jarak antara dua klaster dianggap sebagai jarak rata-rata antara
semua anggota dalam satu klaster dengan semua anggota klaster lain
Ward’s Method
Jarak antara dua klaster yang terbentuk adalah jumlah kuadrat (sum
of square) di antara dua klaster tersebut
Centroid Method
• Jarak antara dua cluster adalah jarak antar centroid kluster tersebut
• Centroid kluster adalah nilai tengah observasi pada variabel dalam
suatu set variabel cluster
• Outlier hanya sedikit berpengaruh jika dibandingkan dengan
metode lain
   jiyxjisl CyCxyxdCCD  ,),(min, ,
   jiyxjicl CyCxyxdCCD  ,),(max, ,
  ),(, jijicentroids rrdCCD 
        

ijji Cx
ij
Cx
j
Cx
ijiw rxrxrxCCD
222
,
  

ji CyCxji
jiavg yxd
CC
CCD
,
),(
1
,
Nama Nilai Pelajaran Fisika
Nilai Pelajaran
Biologi
Idham (A) 90 85
Tri (B) 75 60
Aisyah (C) 80 80
Rina (D) 70 65
𝑑 𝐴𝐵 = 90 − 75 2 + (85 − 60)2= 850 = 29,15
𝑑 𝐴𝐶 = 90 − 80 2 + (85 − 80)2= 125 = 11,18
𝑑 𝐴𝐷 = 90 − 70 2 + (85 − 65)2= 800 = 28,28
𝑑 𝐵𝐶 = 75 − 80 2 + (60 − 80)2= 425 = 20,62
𝑑 𝐵𝐷 = 75 − 70 2 + (60 − 65)2= 50 = 7,07
𝑑 𝐶𝐷 = 80 − 70 2 + (80 − 65)2= 325 = 18,03
Menghitung jarak euclidian:1
Menyusun matriks similarity:2
Berdasarkan data di atas, dapat dilakukan
pengelompokkan (clustering) melalui tahap berikut
terlebih dahulu:
Metode Single LinkageA
D(BD)A = Min (DBA , DDA) = Min (29,15 ; 28,28 ) = DDA = 28,28
D(BD)C = Min (DBC , DDC) = Min (20,62; 18,03) = DDC = 18,03
B dan D memiliki jarak minimum
yaitu 7,07 sehingga membentuk
klaster 1
Dengan demikian, klaster 1 (BD) akan bergabung dengan klaster
2 (AC) menjadi klaster tunggal.
1. Mencari objek dengan jarak minimum
2. Menghitung jarak klaster BD dengan objek lainnya dengan
metode single linkage (jarak terdekat)
• Terbentuk matriks terbaru
• Jarak A ke C lebih kecil (11,18)
dibandingkan jarak BD ke objek
lainnya, sehingga A dan C
membentuk klaster 2
Aplikasi Metode Hirarki: Aglomeratif
Metode Complete LinkageB
D(BD)A = Max (DBA , DDA) = Max (29,15 ; 28,28 ) = DDA = 29,15
D(BD)C = Max (DBC , DDC) = Max (20,62; 18,03) = DDC = 20,62
B dan D memiliki jarak minimum
yaitu 7,07 sehingga membentuk
klaster 1
Dengan demikian, klaster 1 (BD) akan bergabung dengan klaster 2
(AC) menjadi klaster tunggal.
1. Mencari objek dengan jarak minimum
2. Menghitung jarak klaster BD dengan objek lainnya dengan
metode complete linkage (jarak terjauh)
• Terbentuk matriks terbaru
• Jarak A ke C lebih kecil (11,18)
dibandingkan jarak BD ke objek
lainnya, sehingga A dan C membentuk
klaster 2
Metode Average LinkageC
D(BD)A = ½ (DBA , DDA) = ½ (29,15 ; 28,28 ) = DDA = 28,27
D(BD)C = ½ (DBC , DDC) = ½ (20,62; 18,03) = DDC = 19,33
B dan D memiliki jarak minimum
yaitu 7,07 sehingga membentuk
klaster 1
Dengan demikian, klaster 1 (BD) akan bergabung dengan klaster
2 (AC) menjadi klaster tunggal.
1. Mencari objek dengan jarak minimum
2. Menghitung jarak klaster BD dengan objek lainnya dengan
metode average linkage (jarak rata-rata)
• Terbentuk matriks terbaru
• Jarak A ke C lebih kecil (11,18)
dibandingkan jarak BD ke objek
lainnya, sehingga A dan C
membentuk klaster 2
Aplikasi Metode Hirarki: Divisif
1. Menghitung jarak rata-rata antarobjek:
A = 1/3 (AB+AC+AD) = 1/3 (29,15+11,18+28,28) = 22,87
B = 1/3 (BA+BC+BD) = 1/3 (29,15+20,62+7,07) = 18,95
C = 1/3(CA+CB+CD) = 1/3 (11,18+20,62+18,03) = 16,61
D = 1/3(DA+DB+DC) = 1/3 (28,28+7,07+18,03) = 17,79
Objek A mempunyai jarak terjauh yaitu 22,87, maka A dipisahkan dari grup utama dan membentuk grup
splinter
2. Menghitung jarak rata-rata objek dengan grup induk dan grup splinter
Objek C mempunyai jarak lebih dekat ke grup
splinter dari pada grup utama, maka C bergabung
dengan A di grup splinter
3. Menghitung jarak rata-rata objek yang tersisa
dengan grup induk dan grup splinter
Jarak semua objek ke grup utama sudah lebih dekat
daripada jarak ke grup splinter, maka komposisinya
sudah stabil.
Metode Non Hirarki
Memilih satu cluster dan menempatkan semua objek yang
berada pada jarak terdekat ke dalam cluster tersebut
Kemudian cluster yang kedua dipilih dan menempatkan
semua objek yang berada pada jarak terdekat ke dalamnya
Sequential Threshold
Memilih beberapa objek awal cluster sekaligus dan kemudian
melakukan penggabungan objek ke dalamnya secara
bersamaan.
Pada saat proses berlangsung, jarak terdekat dapat ditentukan
untuk memasukkan beberapa objek ke dalam cluster-cluster
Parallel Threshold
Memungkinkan untuk menempatkan kembali objek-objek ke
dalam cluster yang lebih dekat atau dengan melakukan
optimasi pada penempatan objek yang ditukar untuk cluster
lainnya dengan pertimbangan kriteria optimasi
Optimizing Threshold
Tentukan k sebagai jumlah klaster yang ingin dibentuk
Bangkitkan k centroid (titik pusat klaster) awal secara
random
Hitung jarak setiap objek ke masing-masing centroid
dari masing-masing klaster, setiap objek memilih
centroid terdekat
Tentukan posisi centroid baru dengan menghitung
nilai rata-rata dari objek yang terletak pada centroid
yang sama
Pengecekan konvergensi, jika sudah konvergen maka
proses iterasi berhenti
𝑣 = ෍
𝑖=1
𝑛
𝑥𝑖 /𝑛
V = centroid pada klaster
Xi = objek ke-i
n = banyaknya objek
Tujuan analisis klaster: Deskripsi klasifikasi, Penyederhanaan data, dan Identifikasi hubungan,
Desain penelitian: Pendeteksian outlier (objek yang sangat berbeda dengan objek lainnya),
mengukur kesamaan objek (similarity), dan standardisasi data dengan Z-Score (jika terdapat
variasi satuan)
Asumsi-asumsi: sampel yang diambil harus representatif atau mewakili populasi dan tidak
terjadi multikolinearitas antarvariabel
Proses mendapatkan klaster: dilakukan dengan memilih metode klaster terlebih (metode
hirarki atau non hirarki)
Interpretasi terhadap klaster: interpretasi terhadap hasil klaster dilakukan dengan melihat nilai
rata-rata objek dalam tiap klaster. Hasil klaster dari metode hirarki maupun non hirarki
memiliki karakteristik nominal (menunjukkan perbedaan sifat) bukan ordinal (tingkatan)
Validasi dan pembuatan profil klaster: memastikan bahwa solusi dari analisis klaster dapat mewakili
populasi dan dapat digeneralisasi untuk objek yang lain
TAHAPAN ANALISIS KLASTER
STUDI KASUS
No Kecamatan
Kepadatan Penduduk
(jiwa/km2)
Jumlah
fasilitas (unit)
Luas lahan
terbangun (Ha)
1 Mangarabombang 379 108 379,88
2 Mappakasunggu 348 68 48,56
3 Sanrobone 469 48 12,06
4
Polombangkeng
Selatan
316 87 101,13
5 Pattallassang 1471 192 66,73
6 Polombangkeng Utara 227 150 149,41
7 Galesong Selatan 1016 77 12,08
8 Galesong 1524 96 62,76
9 Galesong Utara 2529 100 119,30
Sumber: Takalar dalam Angka (2015)
Kabupaten Takalar memiliki 9 kecamatan yang
selanjutnya akan diklasterkan berdasarkan 3 variabel
yaitu:
Objek: merupakan kumpulan populasi (bukan sampel)
terdiri atas 9 kecamatan
Variabel
V1 = Kepadatan penduduk
V2 = Jumlah fasilitas
V3 = Luas lahan terbangun
Proses klaster (pengelompokkan) akan dilakukan
dengan metode hirarki (aglomeratif dengan
pendekatan average linkage) dan metode non hirarki.
Standardisasi dilakukan karena adanya perbedaan
satuan dari tiap-tiap variabel. Standardisasi
menggunakan z_score
𝑧𝑠𝑐𝑜𝑟𝑒 =
𝑥 − ҧ𝑥
𝜎
Melakukan standardisasi data
A
SUB BWP
1
Ukuran kemiripan antar dua objek dihitung dengan menggunakan
rumus jarak euklidian:
Hasil pengukuran jarak akan disusun membentuk matriks similarity
Menentukan ukuran kemiripan (similarity)
A
SUB BWP
2
d2
xy = σ 𝑗−1
𝑝
( 𝑋𝑗 − 𝑌𝑗) 2
Berdasarkan perhitungan kemiripan dengan Euklidian, maka disusun matriks similarity, seperti yang ditunjukkan
pada tabel di bawah:
Proses clustering dimulai dengan melihat dua objek dengan jarak terkecil (similaritas yang tinggi), yaitu
d(2,3) = 0,337 sehingga terbentuk klaster pertama.
Menyusun matriks similarity
A
SUB BWP
3
Metode klaster yang digunakan yaitu metode hirarki. Metode tersebut secara bertahap membentuk klaster dari
dua objek yang memiliki similaritas yang tinggi dan seterusnya hingga, semua objek memiliki klaster.
Memilih metode pengelompokkan
A
SUB BWP
4
METODE HIRARKI
Stage 1:
Terbentuk cluster yang beranggotakan Kecamatan
Mappakasunggu (2) dan Sanrobone (3) dengan nilai koefisien
0,337 yang menunjukan jarak terdekat kedua objek.
Selanjutnya pada kolom next stage, terlihat angka 3. Hal ini
berarti clustering selanjutnya melihat stage 3.
Stage 3
Kecamatan Mappakasunggu bergabung dengan
Polongbangkeng Selatan. Dengan demikian, klaster sudah
terdiri 3 anggota. Jarak 0,931 merupakan jarak rata-rata objek
terakhir yang baru bergabung dengan 2 objek sebelumnya.
Metode aglomerasi average linkage D23(4):
Jarak objek 2 ke 4 = 0,407
Jarak objek 3 ke 4 = 1,454
D23(4) = ½ (0,407 + 1,454) = 0,931
Proses clustering menggunkan metode average linkage, yaitu clustering berdasarkan jarak rata-rata semua antar
pasangan objek. Proses clustering ditunjukkan pada stage-stage berikut:
Proses Pengelompokkan (Clustering)
A
SUB BWP
5
Proses pengelompokkan menghasilkan beberapa klaster dan masing-masing anggotanya, perincian ditunjukkan
pada tabel berikut:
Menentukan jumlah klaster dan anggota klaster
A
SUB BWP
6
Klaster Anggota Klaster
Klaster 1 Kecamatan Mangarabombang
Klaster 2
Kecamatan Mappakasunggu, Sanrobone,
Polombangkeng Selatan, Galesong Selatan,
Galesong, Galesong Utara
Klaster 3
Kecamatan Pattallassang dan Polongbangkeng
Utara
Tampilan vertical icicle plot Tampilan Dendogram
Berdasarkan icicle di atas, jika ditentukan 3
klaster, maka anggota yang terbentuk yaitu:
Hasil klaster yang ditunjukkan dengan dendogram menggunakan
berdasarkan jarak objek. Untuk anggota klaster pada jarak 10 yaitu:
Klaster Anggota Klaster
Klaster 1 Kecamatan Mangarabombang
Klaster 2
Kecamatan Mappakasunggu, Sanrobone,
Polombangkeng Selatan, Galesong Selatan, Galesong.
Klaster 3 Kecamatan Pattallassang dan Polongbangkeng Utara
Klaster 4 Kecamatan Galesong Utara
Interpretasi klaster dilakukan dengan memberikan label yang dapat menjelaskan kealamian klaster. Pada kasus di
atas, interpretasi klaster kecamatan dihitung berdasarkan rata-rata variabel pada tiap klaster:
Interpretasi hasil klaster
A
SUB BWP
7
Klaster Anggota Klaster Rata-Rata Variabel
Klaster 1 Mangarabombang 288,97
Rata-rata (ഥ𝑿 𝟏) 288,97
Klaster 2
Mappakasunggu 154,88
Sanrobone 176,31
Polombangkeng Selatan 168,09
Galesong Selatan 368,49
Galesong 561,02
Galesong Utara 915,94
Rata-rata (ഥ𝑿 𝟐) 390,79
Klaster 3
Pattallassang 576,46
Polombangkeng Utara 175,55
Rata-rata (ഥ𝑿 𝟑) 376,01
“dari klaster yang terbentuk dapat diinterpretasikan bahwa kecamatan yang berada dalam satu
klaster memiliki kemiripan berdasarkan ketiga variabel (kepadatan penduduk, jumlah fasilitas,
dan luas lahan terbangun)”
• Klaster 1 berisi kecamatan yang memiliki rata-rata
variabel (kepadatan penduduk, jumlah fasilitas,
dan luas lahan terbangun) yaitu 288,97
• Klaster 2 berisi kecamatan dengan rata-rata
variabel (kepadatan penduduk, jumlah fasilitas,
dan luas lahan terbangun) yaitu 390,79
• Klaster 3 berisi kecamatan dengan rata-rata
variabel (kepadatan penduduk, jumlah fasilitas,
dan luas lahan terbangun) yaitu 376,01
Hasil analisis klaster kecamatan di Kabupaten
Takalar secara spasial
No Kecamatan
Z _ Kepadatan
Penduduk
(jiwa/km2)
Z _ Jumlah
fasilitas (unit)
Z _ Luas lahan
terbangun (Ha)
1 Mangarabombang -0.68868 0.11651 2.43413
2 Mappakasunggu -0.72815 -0.79532 -0.50801
3 Sanrobone -0.57409 -1.25124 -0.83213
4
Polombangkeng
Selatan -0.76889 -0.36220 -0.04118
5 Pattallassang 0.70169 2.03137 -0.34666
6
Polombangkeng
Utara -0.88221 1.07394 0.38755
7 Galesong Selatan 0.12237 -0.59016 -0.83195
8 Galesong 0.76917 -0.15704 -0.38191
9 Galesong Utara 2.04878 -0.06585 0.12017
Standardisasi dilakukan karena adanya perbedaan satuan
dari tiap-tiap variabel. Standardisasi menggunakan z_score
𝑧𝑠𝑐𝑜𝑟𝑒 =
𝑥 − ҧ𝑥
𝜎
Melakukan standardisasi data
A
SUB BWP
1
Tahapan selanjutnya adalah menentukan jumlah klaster.
Misalnya ditentukan 3 klaster, selanjutnya dimulai proses
pembentukan klaster dengan mengubah-ubah klaster yang
ada (trial and error) sehingga menjadi lebih tepat dalam
pengelompokkan. Pada proses pengelompokkan terjadi 2
tahapan iterasi.
Proses Trial and Error (Iterasi)
A
SUB BWP
2
METODE NON HIRARKI (K-MEANS)
Hasil akhir clustering
A
SUB BWP
3
Angka pada tabel output tersebut terkait dengan
proses standarisasi data sebelumnya berdasarkan
pada angka z, dengan ketentuan:
- Angka Negatif: data di bawah rata-rata total
- Angka positif: data di atas rata-rata total
Tabel di samping menunjukkan Klaster yang
terbentuk dan jumlah objek pada masing-masing
klaster.
Klaster Anggota Klaster
Klaster 1 Kecamatan Mangarabombang
Klaster 2
Kecamatan Pattallassang, Polongbangkeng Utara, dan
Galesong Utara
Klaster 3
Kecamatan Mappakasunggu, Sanrobone, Polombangkeng
Selatan, Galesong Selatan, dan Galesong
Kecamatan QCL_1 QCL_2
Mangarabombang 1 0.00000
Mappakasunggu 3 0.51899
Sanrobone 3 0.77256
Polongbangkeng
Selatan 3 0.76470
Pattallassang 2 1.09694
Polongbangkeng Utara 2 1.54275
Galesong Selatan 3 0.47746
Galesong 3 1.11975
Galesong Utara 2 1.78947
Merupakan jarak objek ke pusat klaster
Anggota masing-masing klaster
JUMLAH
KLASTER DAN
ANGGOTA
KLASTER
Cluster
1 2 3
Zscore: Kepadatan
Penduduk
-.68868 .62275 -.23592
Zscore: Jumlah Fasilitas .11651 1.01315 -.63119
Zscore: Luas Lahan
Terbangun
2.43413 .05368 -.51904
Final Cluster Centres
Number of Cases in each
Cluster
Cluster 1 1.000
2 3.000
3 5.000
Valid 9.000
Missing .000
• Klaster 1: berisi kecamatan yang mempunyai kepadatan
penduduk di bawah rata-rata, jumlah fasilitas di atas rata-
rata, dan jumlah luas lahan terbangun di atas rata-rata
populasi.
• Klaster 2: berisi kecamatan yang mempunyai kepadatan
penduduk, jumlah fasilitas, dan jumlah luas lahan terbangun
di atas rata-rata populasi.
• Klaster 3: berisi kecamatan yang mempunyai kepadatan
penduduk dan jumlah fasilitas di bawah rata-rata serta luas
lahan terbangun di atas rata-rata.
Rata-rata
Kepadatan
Penduduk
Rata-rata
Jumlah
Fasilitas
Rata-rata Luas
Lahan
Terbangun
Mean 919.89 102.89 105.77
Klaster 1 378.99 108 379.56
Klaster 2 1408.99 147.33 111.81
Klaster 3 734.60 75.20 217.86
Di bawah rata-rata
Interpretasi hasil clustering
A
SUB BWP
4
Mean dan standart deviasi digunakan dalam
perhitungan rata-rata variabel pada kluster
tertentu. Rumus yang digunakan untuk
menghitung rata-rata variabel tersebut adalah:
𝑋 = 𝜇 + 𝑍 . 𝜎
X : rata-rata sampel (dalam hal ini rata-rata
variabel pada klaster tertentu )
µ : rata-rata populasi
Z : Nilai standarisasi yang didapat pada SPSS
𝜎: Standart deviasi
REFERENSI
Dillon, William R., and Matthew Goldstein. 1984. Multivariate analysis:
methods and applications. New York: John Wiley & Sons.
Everitt, Brian. 2011. klaster Analysis. Hoboken: Wiley.
Kachigan, Sam Kash. 1991. Multivariate statistical analysis: a conceptual
introduction. New York: Radius Press.
Gunawan, Imam. 2016. Pengantar Statistika Inferensial. Jakarta: Rajawali Pers.
TERIMA KASIH

More Related Content

What's hot

Melihat Disparitas dari Indeks Williamson di Kab. Banjarnegara
Melihat Disparitas dari Indeks Williamson di Kab. BanjarnegaraMelihat Disparitas dari Indeks Williamson di Kab. Banjarnegara
Melihat Disparitas dari Indeks Williamson di Kab. BanjarnegaraLaras Kun Rahmanti Putri
 
38 model multiple discriminant analysis (mda)
38  model multiple discriminant analysis (mda)38  model multiple discriminant analysis (mda)
38 model multiple discriminant analysis (mda)AminullahAssagaf3
 
Analisis LQ, DLQ, SS, dan klassen di provinsi riau
Analisis LQ, DLQ, SS, dan klassen di provinsi riauAnalisis LQ, DLQ, SS, dan klassen di provinsi riau
Analisis LQ, DLQ, SS, dan klassen di provinsi riauOpissen Yudisyus
 
Perumusan isu strategis
Perumusan isu strategisPerumusan isu strategis
Perumusan isu strategisardinmarL
 
Deret ukur geometri
Deret ukur geometriDeret ukur geometri
Deret ukur geometriyy rahmat
 
Essay Nasional, Lomba Essay LPM Paradigma
Essay Nasional, Lomba Essay LPM ParadigmaEssay Nasional, Lomba Essay LPM Paradigma
Essay Nasional, Lomba Essay LPM ParadigmaKhoerul Anwar Abdulloh
 
Analisis pusat pelayanan di kabupaten serang
Analisis pusat pelayanan di kabupaten serangAnalisis pusat pelayanan di kabupaten serang
Analisis pusat pelayanan di kabupaten serangArief Budiman
 
Analisis Kependudukan
Analisis KependudukanAnalisis Kependudukan
Analisis KependudukanSiti Sahati
 
Contoh RAB PADATI WEB
Contoh RAB PADATI WEBContoh RAB PADATI WEB
Contoh RAB PADATI WEBRina Wijaya
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.pptAdam Superman
 
Hubungan keuangan antar pemerintah
Hubungan keuangan antar pemerintahHubungan keuangan antar pemerintah
Hubungan keuangan antar pemerintahDahlan Tampubolon
 
PPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptx
PPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptxPPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptx
PPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptxHolipahNuraisah1
 
Kuesioner PODES 2014 - DESA
Kuesioner PODES 2014 - DESAKuesioner PODES 2014 - DESA
Kuesioner PODES 2014 - DESAjoihot
 
Analisis data dan interpretasi
Analisis data dan interpretasiAnalisis data dan interpretasi
Analisis data dan interpretasiKartika Lukitasari
 
Analisis data-spasial
Analisis data-spasialAnalisis data-spasial
Analisis data-spasialRiyadi Davit
 

What's hot (20)

Melihat Disparitas dari Indeks Williamson di Kab. Banjarnegara
Melihat Disparitas dari Indeks Williamson di Kab. BanjarnegaraMelihat Disparitas dari Indeks Williamson di Kab. Banjarnegara
Melihat Disparitas dari Indeks Williamson di Kab. Banjarnegara
 
38 model multiple discriminant analysis (mda)
38  model multiple discriminant analysis (mda)38  model multiple discriminant analysis (mda)
38 model multiple discriminant analysis (mda)
 
Proyeksi PDRB Kota Singkawang Tahun 2013-2017
Proyeksi PDRB Kota Singkawang Tahun 2013-2017Proyeksi PDRB Kota Singkawang Tahun 2013-2017
Proyeksi PDRB Kota Singkawang Tahun 2013-2017
 
Analisis LQ, DLQ, SS, dan klassen di provinsi riau
Analisis LQ, DLQ, SS, dan klassen di provinsi riauAnalisis LQ, DLQ, SS, dan klassen di provinsi riau
Analisis LQ, DLQ, SS, dan klassen di provinsi riau
 
06 analisis faktor
06 analisis faktor06 analisis faktor
06 analisis faktor
 
Perumusan isu strategis
Perumusan isu strategisPerumusan isu strategis
Perumusan isu strategis
 
Deret ukur geometri
Deret ukur geometriDeret ukur geometri
Deret ukur geometri
 
Essay Nasional, Lomba Essay LPM Paradigma
Essay Nasional, Lomba Essay LPM ParadigmaEssay Nasional, Lomba Essay LPM Paradigma
Essay Nasional, Lomba Essay LPM Paradigma
 
Contoh chi kuadrat
Contoh chi kuadratContoh chi kuadrat
Contoh chi kuadrat
 
Analisis pusat pelayanan di kabupaten serang
Analisis pusat pelayanan di kabupaten serangAnalisis pusat pelayanan di kabupaten serang
Analisis pusat pelayanan di kabupaten serang
 
Analisis Kependudukan
Analisis KependudukanAnalisis Kependudukan
Analisis Kependudukan
 
Contoh RAB PADATI WEB
Contoh RAB PADATI WEBContoh RAB PADATI WEB
Contoh RAB PADATI WEB
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
 
Desentralisasi Fiskal
Desentralisasi FiskalDesentralisasi Fiskal
Desentralisasi Fiskal
 
Hubungan keuangan antar pemerintah
Hubungan keuangan antar pemerintahHubungan keuangan antar pemerintah
Hubungan keuangan antar pemerintah
 
PPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptx
PPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptxPPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptx
PPt Statistika-Ukuran Gejala Pusat Data Belum Dikelompokkan.pptx
 
Teori pertumbuhan kota
Teori pertumbuhan kotaTeori pertumbuhan kota
Teori pertumbuhan kota
 
Kuesioner PODES 2014 - DESA
Kuesioner PODES 2014 - DESAKuesioner PODES 2014 - DESA
Kuesioner PODES 2014 - DESA
 
Analisis data dan interpretasi
Analisis data dan interpretasiAnalisis data dan interpretasi
Analisis data dan interpretasi
 
Analisis data-spasial
Analisis data-spasialAnalisis data-spasial
Analisis data-spasial
 

Similar to CLUSTERING

Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.pptPandeKadek3
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansilmuBiner
 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)Rani Nooraeni
 
Artikel Final Yan Yan G
Artikel Final Yan Yan GArtikel Final Yan Yan G
Artikel Final Yan Yan GYan Gustiana
 
APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)Rani Nooraeni
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfElvi Rahmi
 
Statistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.pptStatistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.pptAhmadSyajili
 
materi Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .pptmateri Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .pptashaby
 
Multivariate Analysis
Multivariate AnalysisMultivariate Analysis
Multivariate Analysisdyahanindita
 
Limit Fungsi di Ruang Metrik
Limit Fungsi di Ruang MetrikLimit Fungsi di Ruang Metrik
Limit Fungsi di Ruang MetrikNida Shafiyanti
 
Analisis Klaster (1)
Analisis Klaster (1)Analisis Klaster (1)
Analisis Klaster (1)Rani Nooraeni
 

Similar to CLUSTERING (20)

Clustering
ClusteringClustering
Clustering
 
Modul clustering data mining modul clustering
Modul clustering data mining modul clusteringModul clustering data mining modul clustering
Modul clustering data mining modul clustering
 
Analisis Cluster
Analisis ClusterAnalisis Cluster
Analisis Cluster
 
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
 
analisis kluster
analisis klusteranalisis kluster
analisis kluster
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)
 
Artikel Final Yan Yan G
Artikel Final Yan Yan GArtikel Final Yan Yan G
Artikel Final Yan Yan G
 
APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
 
8186 8 reduksi data
8186 8 reduksi data8186 8 reduksi data
8186 8 reduksi data
 
Statistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.pptStatistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.ppt
 
materi Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .pptmateri Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .ppt
 
Analisis cluster
Analisis clusterAnalisis cluster
Analisis cluster
 
Multivariate
MultivariateMultivariate
Multivariate
 
Multivariate Analysis
Multivariate AnalysisMultivariate Analysis
Multivariate Analysis
 
Limit Fungsi di Ruang Metrik
Limit Fungsi di Ruang MetrikLimit Fungsi di Ruang Metrik
Limit Fungsi di Ruang Metrik
 
DESKRIPSI DATA
DESKRIPSI DATADESKRIPSI DATA
DESKRIPSI DATA
 
Bab 4 ukuran dispersi data
Bab 4 ukuran dispersi dataBab 4 ukuran dispersi data
Bab 4 ukuran dispersi data
 
Analisis Klaster (1)
Analisis Klaster (1)Analisis Klaster (1)
Analisis Klaster (1)
 

Recently uploaded

Slide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open StudioSlide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open Studiossuser52d6bf
 
05 Sistem Perencanaan Pembangunan Nasional.ppt
05 Sistem Perencanaan Pembangunan Nasional.ppt05 Sistem Perencanaan Pembangunan Nasional.ppt
05 Sistem Perencanaan Pembangunan Nasional.pptSonyGobang1
 
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptxMuhararAhmad
 
Strategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaStrategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaRenaYunita2
 
MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++FujiAdam
 
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptxPembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptxmuhammadrizky331164
 

Recently uploaded (6)

Slide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open StudioSlide Transformasi dan Load Data Menggunakan Talend Open Studio
Slide Transformasi dan Load Data Menggunakan Talend Open Studio
 
05 Sistem Perencanaan Pembangunan Nasional.ppt
05 Sistem Perencanaan Pembangunan Nasional.ppt05 Sistem Perencanaan Pembangunan Nasional.ppt
05 Sistem Perencanaan Pembangunan Nasional.ppt
 
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
001. Ringkasan Lampiran Juknis DAK 2024_PAUD.pptx
 
Strategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaStrategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di Indonesia
 
MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++
 
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptxPembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
Pembangkit Listrik Tenaga Nuklir Kelompok 1.pptx
 

CLUSTERING

  • 1. PASCA SARJANA PERENCANAAN WILAYAH DAN KOTA SEKOLAH ARSITEKTUR, PERENCANAAN DAN PENGEMBANGAN KEBIJAKAN INSTITUT TEKNOLOGI BANDUNG 2017 ANDI IDHAM ASMAN 25417022 TRI WAHYUNINGSIH 25417061 TUGAS METODE ANALISIS PERENCANAAN
  • 2. DEFINISI ANALISIS KLASTER n objek diukur berdasarkan variabel Mengukur kemiripan antar objek (matrix similarity) Membentuk klaster Profil klaster Sumber: Dillon (1984:158) • Menurut Dillon (1984), analisis klaster merupakan pengelompokkan objek/individu dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang diamati sehingga objek yang terletak dalam satu kelompok memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam kelompok lain • Analisis klaster tidak menunjukkan tingkatan (ordinal) tetapi hanya menunjukkan perbedaan sifat objek (nominal) • Dalam terminologi SPSS, analisis klaster merupakan perlakuan terhadap baris
  • 3. Analisis Multivariat Dependensi Regresi Regresi Logistik Analisis Diskriminan Analisis Konjoin Analisis Kanonikal Analisis varian Interdependensi Analisis Faktor Analisis klaster KEDUDUKAN ANALISIS KLASTER
  • 4. PERBEDAAN ANALISIS KLASTER DAN ANALISIS FAKTOR Analisi Klaster : - Mengelompokkan objek atau data berdasarkan ukuran jarak (proximity) - Pengelompokkan dilakukan pada BARIS (objek) Analisi Faktor : - Mengelompokkan objek berdasarkan pola dari variasi (correlation) - Pengelompokkan dilakukan pada KOLOM (variabel) ANALISIS MULTIVARIAT INTERDEPENDENSI
  • 5. Tujuan Analisis klaster Tujuan utama analisis klaster menururt Sutanto (2009:681) adalah mengelompokkan objek (elemen) seperti orang, produk (barang), toko, atau organisasi, ke dalam kelompok-kelompok yang relatif homogen, berdasarkan pada suatu set variabel yang dipertimbangkan untuk diteliti. Ciri-ciri Analisis klaster ▪ Heterogenitas (perbedaan) yang tinggi antar-klaster yang satu dengan klaster yang lainnya (between klaster) ▪ Homogenitas (kesamaan) yang tinggi antar-anggota dalam satu klaster (within-klaster)
  • 6. UKURAN KEMIRIPAN OBJEK • Digunakan untuk data metrik (interval-rasio) • Jarak yang besar menunjukkan sedikit kesamaan, jarak kecil menunjukkan bahwa suatu objek semakin mirip dengan objek lain • Klaster berdasarkan jarak memiliki kesamaan nilai meski pola berbeda • Ukuran jarak terbagi atas jarak euklidian, jarak city block, dan jarak mahalanobis Digunakan untuk data non metrik (nominal atau ordinal) • Digunakan untuk data metrik (interval-rasio) • Kesamaan antarobjek dilihat dari koefisien korelasi antarpasangan objek yang diukur dengan beberapa variabel • Jarang digunakan karena berfokus pada pola hubungan meski nilai berbeda, padahal titik berat analisis klaster adalah besarnya nilai objek Pengukuran Jarak (Distance-Type Measures) Pengukuran Asosiasi (Matching-Type Measures) Pengukuran Korelasi (Correlation Coefficient)
  • 7. Pengukuran Jarak (Distance-Type Measures) • Besarnya jarak suatu garis lurus yang menghubungkan antarobjek yang diamati • Digunakan jika variabel amatan saling bebas tidak berkorelasi satu sama lain (tidak terjadi multikolinearitas Jarak Euklidian d2 xy = σ 𝑗−1 𝑝 ( 𝑋𝑗 − 𝑌𝑗) 2 Keterangan: d2 xy = kuadrat jarak euklidian antara objek X dan Y p = banyaknya variabel yang diamati 𝑋𝑗 = nilai j pada objek X 𝑌𝑗= nilai j pada objek Y d(x,y) = σ 𝑖 ȁ 𝑋𝑖 − ȁ𝑌𝑖 d2 ij = 𝑋𝑖𝑘 − 𝑋𝑗𝑘 𝑡 𝑆−1 𝑥𝑖 − 𝑦𝑖 Penyederhanaan dari perbedaan rata-rata pada antar objek Jarak City-Block Digunakan Jika terjadi multikolineritas pada data yang diamati Jarak Mahalanobis Keterangan: dxy = kuadrat jarak euklidian antara objek X dan Y 𝑋𝑖 = nilai pada objek X 𝑌𝑖= nilai j pada objek Y Keterangan: dij = kuadrat jarak mahalanobis 𝑋𝑖 𝑑𝑎𝑛 𝑋𝑗= vektor dari nilai objek i dan j S = matriks kovarian 1 2 3
  • 8. Bagaimana mengukur tingkat kesamaan (similarity)? Bagaimana membentuk klaster? Berapa banyak klaster yang terbentuk? Pertanyaan yang harus dijawab dalam analisis klaster
  • 9. METODE ANALISIS KLASTER Menurut Dillon (1984), metode analisis klaster terbagi atas: Metode Hirarki: metode pengelompokkan yang membentuk tingkatan tertentu seperti pada struktur pohon karena proses pengklasterannya dilakukan secara bertahap Metode Non Hirarki: metode pengelompokkan diawali dengan menentukan terlebih dahulu jumlah klaster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah klaster ditentukan, maka proses klaster dilakukan dengan tanpa mengikuti proses hirarki.
  • 10. Proses Pengelompokkan Hasil Pengelompokkan • Kelompok terbentuk secara alami secara bertahap • Proses pembentukan klaster melihat jarak tiap dua objek terdekat • Jumlah klaster ditentukan kemudian • Dikenal dengan metode k-means • Jumlah klaster ditentukan terlebih dahulu • Membentuk klaster dengan melakukan pengujian (trial and error, dalam SPSS dikenal dengan istilah proses iterasi • Hasil dapat dibaca menggunakan dendogram dan icycle vertical • Klaster yang terbentuk berupa karakteristik nominal (perbedaan sifat) bukan ordinal (tingkatan) • Klaster yang terbentuk berupa karakteristik nominal (perbedaan sifat) bukan ordinal (tingkatan) • Interpretasi hasil klaster menggunakan rumus rata-rata sampel: X = µ + Z . 𝜎 Keterangan: X = rata-rata sampel (dalam hal ini rata-rata variabel pada klaster tertentu) 𝜇 = rata-rata populasi 𝜎 = standar deviasi Z = nilai standardisasi METODE HIRARKI METODE NON HIRARKI METODE ANALISIS KLASTER
  • 11. Metode Hirarki Tiap objek pada mulanya dianggap sebagai klaster tersendiri, kemudian dua klaster yang memiliki jarak terdekat, bergabung menjadi satu klaster. Demikian seterusnya hingga kumpulan objek membentuk klaster tunggal. Metode pemecahan dimulai dengan memisahkan satu objek terjauh sehingga terbentuk grup splinter. Kemudian tiap objek dalam grup utama dibandingkan jaraknya ke grup utama dan grup splinter. Apabila suatu objek ternyata lebih dekat dengan group splinter maka objek tersebut bergabung dengan group splinter. Demikian seterusnya hingga semua objek memiliki jarak yang lebih dekat ke grup utama, maka clustering berhenti. Aglomeratif Divisif Sumber: Everitt (2011:72)
  • 12. Metode Hirarki: Aglomeratif Jarak antar klaster ditentukan oleh jarak minimum antara dua objek dalam klaster yang berbeda Single Linkage Jarak antar klaster ditentukan oleh jarak terjauh antara dua objek dalam klaster yang berbeda Complete Linkage Average Linkage Jarak antara dua klaster dianggap sebagai jarak rata-rata antara semua anggota dalam satu klaster dengan semua anggota klaster lain Ward’s Method Jarak antara dua klaster yang terbentuk adalah jumlah kuadrat (sum of square) di antara dua klaster tersebut Centroid Method • Jarak antara dua cluster adalah jarak antar centroid kluster tersebut • Centroid kluster adalah nilai tengah observasi pada variabel dalam suatu set variabel cluster • Outlier hanya sedikit berpengaruh jika dibandingkan dengan metode lain    jiyxjisl CyCxyxdCCD  ,),(min, ,    jiyxjicl CyCxyxdCCD  ,),(max, ,   ),(, jijicentroids rrdCCD            ijji Cx ij Cx j Cx ijiw rxrxrxCCD 222 ,     ji CyCxji jiavg yxd CC CCD , ),( 1 ,
  • 13. Nama Nilai Pelajaran Fisika Nilai Pelajaran Biologi Idham (A) 90 85 Tri (B) 75 60 Aisyah (C) 80 80 Rina (D) 70 65 𝑑 𝐴𝐵 = 90 − 75 2 + (85 − 60)2= 850 = 29,15 𝑑 𝐴𝐶 = 90 − 80 2 + (85 − 80)2= 125 = 11,18 𝑑 𝐴𝐷 = 90 − 70 2 + (85 − 65)2= 800 = 28,28 𝑑 𝐵𝐶 = 75 − 80 2 + (60 − 80)2= 425 = 20,62 𝑑 𝐵𝐷 = 75 − 70 2 + (60 − 65)2= 50 = 7,07 𝑑 𝐶𝐷 = 80 − 70 2 + (80 − 65)2= 325 = 18,03 Menghitung jarak euclidian:1 Menyusun matriks similarity:2 Berdasarkan data di atas, dapat dilakukan pengelompokkan (clustering) melalui tahap berikut terlebih dahulu: Metode Single LinkageA D(BD)A = Min (DBA , DDA) = Min (29,15 ; 28,28 ) = DDA = 28,28 D(BD)C = Min (DBC , DDC) = Min (20,62; 18,03) = DDC = 18,03 B dan D memiliki jarak minimum yaitu 7,07 sehingga membentuk klaster 1 Dengan demikian, klaster 1 (BD) akan bergabung dengan klaster 2 (AC) menjadi klaster tunggal. 1. Mencari objek dengan jarak minimum 2. Menghitung jarak klaster BD dengan objek lainnya dengan metode single linkage (jarak terdekat) • Terbentuk matriks terbaru • Jarak A ke C lebih kecil (11,18) dibandingkan jarak BD ke objek lainnya, sehingga A dan C membentuk klaster 2 Aplikasi Metode Hirarki: Aglomeratif
  • 14. Metode Complete LinkageB D(BD)A = Max (DBA , DDA) = Max (29,15 ; 28,28 ) = DDA = 29,15 D(BD)C = Max (DBC , DDC) = Max (20,62; 18,03) = DDC = 20,62 B dan D memiliki jarak minimum yaitu 7,07 sehingga membentuk klaster 1 Dengan demikian, klaster 1 (BD) akan bergabung dengan klaster 2 (AC) menjadi klaster tunggal. 1. Mencari objek dengan jarak minimum 2. Menghitung jarak klaster BD dengan objek lainnya dengan metode complete linkage (jarak terjauh) • Terbentuk matriks terbaru • Jarak A ke C lebih kecil (11,18) dibandingkan jarak BD ke objek lainnya, sehingga A dan C membentuk klaster 2 Metode Average LinkageC D(BD)A = ½ (DBA , DDA) = ½ (29,15 ; 28,28 ) = DDA = 28,27 D(BD)C = ½ (DBC , DDC) = ½ (20,62; 18,03) = DDC = 19,33 B dan D memiliki jarak minimum yaitu 7,07 sehingga membentuk klaster 1 Dengan demikian, klaster 1 (BD) akan bergabung dengan klaster 2 (AC) menjadi klaster tunggal. 1. Mencari objek dengan jarak minimum 2. Menghitung jarak klaster BD dengan objek lainnya dengan metode average linkage (jarak rata-rata) • Terbentuk matriks terbaru • Jarak A ke C lebih kecil (11,18) dibandingkan jarak BD ke objek lainnya, sehingga A dan C membentuk klaster 2
  • 15. Aplikasi Metode Hirarki: Divisif 1. Menghitung jarak rata-rata antarobjek: A = 1/3 (AB+AC+AD) = 1/3 (29,15+11,18+28,28) = 22,87 B = 1/3 (BA+BC+BD) = 1/3 (29,15+20,62+7,07) = 18,95 C = 1/3(CA+CB+CD) = 1/3 (11,18+20,62+18,03) = 16,61 D = 1/3(DA+DB+DC) = 1/3 (28,28+7,07+18,03) = 17,79 Objek A mempunyai jarak terjauh yaitu 22,87, maka A dipisahkan dari grup utama dan membentuk grup splinter 2. Menghitung jarak rata-rata objek dengan grup induk dan grup splinter Objek C mempunyai jarak lebih dekat ke grup splinter dari pada grup utama, maka C bergabung dengan A di grup splinter 3. Menghitung jarak rata-rata objek yang tersisa dengan grup induk dan grup splinter Jarak semua objek ke grup utama sudah lebih dekat daripada jarak ke grup splinter, maka komposisinya sudah stabil.
  • 16. Metode Non Hirarki Memilih satu cluster dan menempatkan semua objek yang berada pada jarak terdekat ke dalam cluster tersebut Kemudian cluster yang kedua dipilih dan menempatkan semua objek yang berada pada jarak terdekat ke dalamnya Sequential Threshold Memilih beberapa objek awal cluster sekaligus dan kemudian melakukan penggabungan objek ke dalamnya secara bersamaan. Pada saat proses berlangsung, jarak terdekat dapat ditentukan untuk memasukkan beberapa objek ke dalam cluster-cluster Parallel Threshold Memungkinkan untuk menempatkan kembali objek-objek ke dalam cluster yang lebih dekat atau dengan melakukan optimasi pada penempatan objek yang ditukar untuk cluster lainnya dengan pertimbangan kriteria optimasi Optimizing Threshold Tentukan k sebagai jumlah klaster yang ingin dibentuk Bangkitkan k centroid (titik pusat klaster) awal secara random Hitung jarak setiap objek ke masing-masing centroid dari masing-masing klaster, setiap objek memilih centroid terdekat Tentukan posisi centroid baru dengan menghitung nilai rata-rata dari objek yang terletak pada centroid yang sama Pengecekan konvergensi, jika sudah konvergen maka proses iterasi berhenti 𝑣 = ෍ 𝑖=1 𝑛 𝑥𝑖 /𝑛 V = centroid pada klaster Xi = objek ke-i n = banyaknya objek
  • 17. Tujuan analisis klaster: Deskripsi klasifikasi, Penyederhanaan data, dan Identifikasi hubungan, Desain penelitian: Pendeteksian outlier (objek yang sangat berbeda dengan objek lainnya), mengukur kesamaan objek (similarity), dan standardisasi data dengan Z-Score (jika terdapat variasi satuan) Asumsi-asumsi: sampel yang diambil harus representatif atau mewakili populasi dan tidak terjadi multikolinearitas antarvariabel Proses mendapatkan klaster: dilakukan dengan memilih metode klaster terlebih (metode hirarki atau non hirarki) Interpretasi terhadap klaster: interpretasi terhadap hasil klaster dilakukan dengan melihat nilai rata-rata objek dalam tiap klaster. Hasil klaster dari metode hirarki maupun non hirarki memiliki karakteristik nominal (menunjukkan perbedaan sifat) bukan ordinal (tingkatan) Validasi dan pembuatan profil klaster: memastikan bahwa solusi dari analisis klaster dapat mewakili populasi dan dapat digeneralisasi untuk objek yang lain TAHAPAN ANALISIS KLASTER
  • 18. STUDI KASUS No Kecamatan Kepadatan Penduduk (jiwa/km2) Jumlah fasilitas (unit) Luas lahan terbangun (Ha) 1 Mangarabombang 379 108 379,88 2 Mappakasunggu 348 68 48,56 3 Sanrobone 469 48 12,06 4 Polombangkeng Selatan 316 87 101,13 5 Pattallassang 1471 192 66,73 6 Polombangkeng Utara 227 150 149,41 7 Galesong Selatan 1016 77 12,08 8 Galesong 1524 96 62,76 9 Galesong Utara 2529 100 119,30 Sumber: Takalar dalam Angka (2015) Kabupaten Takalar memiliki 9 kecamatan yang selanjutnya akan diklasterkan berdasarkan 3 variabel yaitu: Objek: merupakan kumpulan populasi (bukan sampel) terdiri atas 9 kecamatan Variabel V1 = Kepadatan penduduk V2 = Jumlah fasilitas V3 = Luas lahan terbangun Proses klaster (pengelompokkan) akan dilakukan dengan metode hirarki (aglomeratif dengan pendekatan average linkage) dan metode non hirarki. Standardisasi dilakukan karena adanya perbedaan satuan dari tiap-tiap variabel. Standardisasi menggunakan z_score 𝑧𝑠𝑐𝑜𝑟𝑒 = 𝑥 − ҧ𝑥 𝜎 Melakukan standardisasi data A SUB BWP 1 Ukuran kemiripan antar dua objek dihitung dengan menggunakan rumus jarak euklidian: Hasil pengukuran jarak akan disusun membentuk matriks similarity Menentukan ukuran kemiripan (similarity) A SUB BWP 2 d2 xy = σ 𝑗−1 𝑝 ( 𝑋𝑗 − 𝑌𝑗) 2
  • 19. Berdasarkan perhitungan kemiripan dengan Euklidian, maka disusun matriks similarity, seperti yang ditunjukkan pada tabel di bawah: Proses clustering dimulai dengan melihat dua objek dengan jarak terkecil (similaritas yang tinggi), yaitu d(2,3) = 0,337 sehingga terbentuk klaster pertama. Menyusun matriks similarity A SUB BWP 3 Metode klaster yang digunakan yaitu metode hirarki. Metode tersebut secara bertahap membentuk klaster dari dua objek yang memiliki similaritas yang tinggi dan seterusnya hingga, semua objek memiliki klaster. Memilih metode pengelompokkan A SUB BWP 4 METODE HIRARKI
  • 20. Stage 1: Terbentuk cluster yang beranggotakan Kecamatan Mappakasunggu (2) dan Sanrobone (3) dengan nilai koefisien 0,337 yang menunjukan jarak terdekat kedua objek. Selanjutnya pada kolom next stage, terlihat angka 3. Hal ini berarti clustering selanjutnya melihat stage 3. Stage 3 Kecamatan Mappakasunggu bergabung dengan Polongbangkeng Selatan. Dengan demikian, klaster sudah terdiri 3 anggota. Jarak 0,931 merupakan jarak rata-rata objek terakhir yang baru bergabung dengan 2 objek sebelumnya. Metode aglomerasi average linkage D23(4): Jarak objek 2 ke 4 = 0,407 Jarak objek 3 ke 4 = 1,454 D23(4) = ½ (0,407 + 1,454) = 0,931 Proses clustering menggunkan metode average linkage, yaitu clustering berdasarkan jarak rata-rata semua antar pasangan objek. Proses clustering ditunjukkan pada stage-stage berikut: Proses Pengelompokkan (Clustering) A SUB BWP 5
  • 21. Proses pengelompokkan menghasilkan beberapa klaster dan masing-masing anggotanya, perincian ditunjukkan pada tabel berikut: Menentukan jumlah klaster dan anggota klaster A SUB BWP 6 Klaster Anggota Klaster Klaster 1 Kecamatan Mangarabombang Klaster 2 Kecamatan Mappakasunggu, Sanrobone, Polombangkeng Selatan, Galesong Selatan, Galesong, Galesong Utara Klaster 3 Kecamatan Pattallassang dan Polongbangkeng Utara Tampilan vertical icicle plot Tampilan Dendogram Berdasarkan icicle di atas, jika ditentukan 3 klaster, maka anggota yang terbentuk yaitu: Hasil klaster yang ditunjukkan dengan dendogram menggunakan berdasarkan jarak objek. Untuk anggota klaster pada jarak 10 yaitu: Klaster Anggota Klaster Klaster 1 Kecamatan Mangarabombang Klaster 2 Kecamatan Mappakasunggu, Sanrobone, Polombangkeng Selatan, Galesong Selatan, Galesong. Klaster 3 Kecamatan Pattallassang dan Polongbangkeng Utara Klaster 4 Kecamatan Galesong Utara
  • 22. Interpretasi klaster dilakukan dengan memberikan label yang dapat menjelaskan kealamian klaster. Pada kasus di atas, interpretasi klaster kecamatan dihitung berdasarkan rata-rata variabel pada tiap klaster: Interpretasi hasil klaster A SUB BWP 7 Klaster Anggota Klaster Rata-Rata Variabel Klaster 1 Mangarabombang 288,97 Rata-rata (ഥ𝑿 𝟏) 288,97 Klaster 2 Mappakasunggu 154,88 Sanrobone 176,31 Polombangkeng Selatan 168,09 Galesong Selatan 368,49 Galesong 561,02 Galesong Utara 915,94 Rata-rata (ഥ𝑿 𝟐) 390,79 Klaster 3 Pattallassang 576,46 Polombangkeng Utara 175,55 Rata-rata (ഥ𝑿 𝟑) 376,01 “dari klaster yang terbentuk dapat diinterpretasikan bahwa kecamatan yang berada dalam satu klaster memiliki kemiripan berdasarkan ketiga variabel (kepadatan penduduk, jumlah fasilitas, dan luas lahan terbangun)” • Klaster 1 berisi kecamatan yang memiliki rata-rata variabel (kepadatan penduduk, jumlah fasilitas, dan luas lahan terbangun) yaitu 288,97 • Klaster 2 berisi kecamatan dengan rata-rata variabel (kepadatan penduduk, jumlah fasilitas, dan luas lahan terbangun) yaitu 390,79 • Klaster 3 berisi kecamatan dengan rata-rata variabel (kepadatan penduduk, jumlah fasilitas, dan luas lahan terbangun) yaitu 376,01
  • 23. Hasil analisis klaster kecamatan di Kabupaten Takalar secara spasial
  • 24. No Kecamatan Z _ Kepadatan Penduduk (jiwa/km2) Z _ Jumlah fasilitas (unit) Z _ Luas lahan terbangun (Ha) 1 Mangarabombang -0.68868 0.11651 2.43413 2 Mappakasunggu -0.72815 -0.79532 -0.50801 3 Sanrobone -0.57409 -1.25124 -0.83213 4 Polombangkeng Selatan -0.76889 -0.36220 -0.04118 5 Pattallassang 0.70169 2.03137 -0.34666 6 Polombangkeng Utara -0.88221 1.07394 0.38755 7 Galesong Selatan 0.12237 -0.59016 -0.83195 8 Galesong 0.76917 -0.15704 -0.38191 9 Galesong Utara 2.04878 -0.06585 0.12017 Standardisasi dilakukan karena adanya perbedaan satuan dari tiap-tiap variabel. Standardisasi menggunakan z_score 𝑧𝑠𝑐𝑜𝑟𝑒 = 𝑥 − ҧ𝑥 𝜎 Melakukan standardisasi data A SUB BWP 1 Tahapan selanjutnya adalah menentukan jumlah klaster. Misalnya ditentukan 3 klaster, selanjutnya dimulai proses pembentukan klaster dengan mengubah-ubah klaster yang ada (trial and error) sehingga menjadi lebih tepat dalam pengelompokkan. Pada proses pengelompokkan terjadi 2 tahapan iterasi. Proses Trial and Error (Iterasi) A SUB BWP 2 METODE NON HIRARKI (K-MEANS)
  • 25. Hasil akhir clustering A SUB BWP 3 Angka pada tabel output tersebut terkait dengan proses standarisasi data sebelumnya berdasarkan pada angka z, dengan ketentuan: - Angka Negatif: data di bawah rata-rata total - Angka positif: data di atas rata-rata total Tabel di samping menunjukkan Klaster yang terbentuk dan jumlah objek pada masing-masing klaster. Klaster Anggota Klaster Klaster 1 Kecamatan Mangarabombang Klaster 2 Kecamatan Pattallassang, Polongbangkeng Utara, dan Galesong Utara Klaster 3 Kecamatan Mappakasunggu, Sanrobone, Polombangkeng Selatan, Galesong Selatan, dan Galesong Kecamatan QCL_1 QCL_2 Mangarabombang 1 0.00000 Mappakasunggu 3 0.51899 Sanrobone 3 0.77256 Polongbangkeng Selatan 3 0.76470 Pattallassang 2 1.09694 Polongbangkeng Utara 2 1.54275 Galesong Selatan 3 0.47746 Galesong 3 1.11975 Galesong Utara 2 1.78947 Merupakan jarak objek ke pusat klaster Anggota masing-masing klaster JUMLAH KLASTER DAN ANGGOTA KLASTER Cluster 1 2 3 Zscore: Kepadatan Penduduk -.68868 .62275 -.23592 Zscore: Jumlah Fasilitas .11651 1.01315 -.63119 Zscore: Luas Lahan Terbangun 2.43413 .05368 -.51904 Final Cluster Centres Number of Cases in each Cluster Cluster 1 1.000 2 3.000 3 5.000 Valid 9.000 Missing .000
  • 26. • Klaster 1: berisi kecamatan yang mempunyai kepadatan penduduk di bawah rata-rata, jumlah fasilitas di atas rata- rata, dan jumlah luas lahan terbangun di atas rata-rata populasi. • Klaster 2: berisi kecamatan yang mempunyai kepadatan penduduk, jumlah fasilitas, dan jumlah luas lahan terbangun di atas rata-rata populasi. • Klaster 3: berisi kecamatan yang mempunyai kepadatan penduduk dan jumlah fasilitas di bawah rata-rata serta luas lahan terbangun di atas rata-rata. Rata-rata Kepadatan Penduduk Rata-rata Jumlah Fasilitas Rata-rata Luas Lahan Terbangun Mean 919.89 102.89 105.77 Klaster 1 378.99 108 379.56 Klaster 2 1408.99 147.33 111.81 Klaster 3 734.60 75.20 217.86 Di bawah rata-rata Interpretasi hasil clustering A SUB BWP 4 Mean dan standart deviasi digunakan dalam perhitungan rata-rata variabel pada kluster tertentu. Rumus yang digunakan untuk menghitung rata-rata variabel tersebut adalah: 𝑋 = 𝜇 + 𝑍 . 𝜎 X : rata-rata sampel (dalam hal ini rata-rata variabel pada klaster tertentu ) µ : rata-rata populasi Z : Nilai standarisasi yang didapat pada SPSS 𝜎: Standart deviasi
  • 27. REFERENSI Dillon, William R., and Matthew Goldstein. 1984. Multivariate analysis: methods and applications. New York: John Wiley & Sons. Everitt, Brian. 2011. klaster Analysis. Hoboken: Wiley. Kachigan, Sam Kash. 1991. Multivariate statistical analysis: a conceptual introduction. New York: Radius Press. Gunawan, Imam. 2016. Pengantar Statistika Inferensial. Jakarta: Rajawali Pers.