SlideShare a Scribd company logo
CLUSTER ANALYSIS 
KELOMPOK 5 
1. GUSTI WIRA BAYUTAMA (2513204002) 
2. NATHANIA NIWEDYA (2513201004) 
3. SOFYAN MUZAKKI (2513204009) 
4. NI PUTU WANSRI SEPTI DEWI (2513201010) 
5. JAZILATUR RIZQIYAH DEVIABAHARI (2513203012) 
1
WHAT IS CLUSTER ANALYSIS? 
Analisis cluster adalah salah satu teknik multivariate untuk 
mengelompokkan obyek berdasarkan kesamaan 
karakteristik di antara obyek-obyek tersebut sehingga 
obyek-obyek yang berada dalam satu cluster akan 
Cimrie-cmipriunCylaui sketemrir iypaannsgatBuasaikma lain. 
• Homogenitas internal (within cluster) : kesamaan 
antar anggota dalam satu cluster. 
• Heterogenitas external (between cluster): perbedaan 
antara cluster yang satu dengan cluster yang lain. 
2 
Asusmsi 
• Representativeness of the sample : sampel yang 
diambil dapat mewakili populasi yang ada. 
•Multokolinieritas: Terdapat hubungan yang linier antar 
variabel .
CLUSTER ANALYSIS 
3 
Metode 
Pengelompokan 
Hirarchical 
Clustering 
Method 
Single Linkage 
Complete 
Linkage 
Average Linkage Ward’s Method Centroid Method 
Non Hirarchical 
Clustering 
Method 
K-Mean Method 
Tidak baik 
untuk 
mengolah 
sampel ukuran 
besar 
Untuk data sampel 
ukuran besar
HIRARCHICAL CLUSTERING METHOD 
4 
Single Linkage 
Complete Linkage 
Average Linkage Centroid Method
HIRARCHICAL CLUSTERING METHOD 
nearest neighbor 
5 
1. Single Linkage  didasarkan pada jarak minimum 
(nearest neighbor ). Dimulai dengan dua objek yang 
dipisahkan dengan jarak paling pendek maka keduanya 
akan ditempatkan pada cluster pertama, dan seterusnya. 
Example : 
Jarak antara 
Jarak yang Paling 
Minimum
HIRARCHICAL CLUSTERING METHOD CONT… 
Object 5 dan object 3 digabungkan, kemudian dicari terdekat 
menuju object berikutnya 
6 
Jarak yang 
paling minimum 
adalah dari 
object (3,5) ke 
object 1 
Object (5,3) digabungkan 
dengan object 1.
HIRARCHICAL CLUSTERING METHOD CONT… 
7 
Jarak yang 
paling minimum 
adalah dari 
object (1,3,5) ke 
object 4 
Jarak yang 
Paling 
Minimum 
Jarak 
antar 
cluster 
DENDOGRAM 
Cluster 1 Cluster 2
HIRARCHICAL CLUSTERING METHOD CONT… 
2. Complete linkage  dasarnya adalah jarak maksimum. 
Dalam metode ini seluruh objek dalam suatu cluster dikaitkan 
satu sama lain pada suatu jarak maksimuma atau dengan 
kesamaan minimum. 
Jarak antara most 
distance members 
8 
Example : 
dari cluster 
Awalnya dicari Jarak 
yang Paling Minimum  
3 dan 5 
didekatkan/digabungkan
HIRARCHICAL CLUSTERING METHOD CONT… 
Jarak paling 
minimum 
adalah dari 
object 4 ke 2 
9 
Jarak yang paling 
minimum. 
Sehingga (2,4) 
didekatkan 
dengan object 1 
DENDOGRAM 
Cluster 1 Cluster 2
HIRARCHICAL CLUSTERING METHOD CONT… 
10 
3. Average Linkage  Dasarnya adalah jarak rata-rata 
antar object. Dimana jarak antar cluster merupakan 
jarak rata-rata antar object Jarak antara object ke i 
dalam cluster (UV) dan 
object ke j dalam cluster 
(w) 
Banyaknya item di cluster 
(UV) dan W 
Example : 
Subject 
Id 
Income 
($ thous.) 
Educatio 
n (years) 
S1 5 5 
S2 6 6 
S3 15 14 
S4 16 15 
S5 25 20 
S6 30 19
HIRARCHICAL CLUSTERING METHOD CONT… 
Dengan menggunakan 
euclidean distance 
diperoleh jarak paling 
minimum yaitu S1 dan 
11 
S2 
Jarak paling 
minimum selanjutnya 
sehingga S3 dan S4 
digabungkan
HIRARCHICAL CLUSTERING METHOD CONT… 
12 
4. Centroid Method  mempertimbangkan jarak 
centroid pada cluster. 
dimana 
Jarak antara 
klaster A dan 
klaster B adalah 
jarak rata-rata 
data x dan y dari 
klaster A dan B 
Example : 
Subject 
nA dan nB masing-masing adalah 
banyaknya data dalam set A dan B 
Id 
Income 
($) 
Educati 
on 
(years) 
S1 5 5 
S2 6 6 
S3 15 14 
S4 16 15 
S5 25 20 
S6 30 19
HIRARCHICAL CLUSTERING METHOD CONT… 
13 
Dengan 
menggunakan 
euclidean distance 
dicari jarak paling 
minimum yaitu (S1, 
S2) 
S1&S2 digabungkan 
menjadi 1 klaster dengan 
rata-rata income : 
(5+6)/2 = 5,5 dan rata-rata 
education : (5+6)/2 = 
5,5
HIRARCHICAL CLUSTERING METHOD CONT… 
Rata-rata income dan 
education dari S3 dan 
14 
S4 
DENDOGRAM 
Cluster 1 Cluster 2
HIRARCHICAL CLUSTERING METHOD CONT… 
5. Ward’s Method  Dalam metode ini jarak antara dua 
15 
cluster adalah jumlah kuadrat antara dua cluster 
untuk seluruh variabel. 
dimana : 
nA dan nB masing-masing adalah banyaknya data 
dalam set A dan B 
s2 
AB adalah jarak antara klaster A dan B menggunakan 
centroid linkage 
Metode ini bertujuan untuk meminimasi jumlah 
kuadrat dalam cluster (within-cluster sum of square)
HIRARCHICAL CLUSTERING METHOD CONT… 
16 
Example : 
•ESS adalah error sum of square 
ESS untuk S1 dan S2 : 
(5-5,5)2+(6-5,5)2+(5-5,5)2+(6-5,5)2 = 1 
Metode ward ini menghitung 
kemungkinan tiap cluster 
DENDOGRAM 
Cluster 1 Cluster 2
NON HIRARCHICAL CLUSTERING 
METHOD 
• K-MEAN CLUSTERING METHOD 
: Dimulai dengan menentukan 
terlebih dahulu jumlah cluster yang 
diinginkan (dua, tiga, atau yang 
lain). Setelah jumlah cluster 
ditentukan, maka proses cluster 
dilakukan tanpa mengikuti proses 
hirarki. 
• KELEBIHAN : Cukup efisien, 
algoritma berhenti dalam kondisi 
optimum. 
• KELEMAHAN : Harus 
menentukan jumlah cluster yang 
dibentuk, tidak dapat menangani 
data yang mengalami 
penyimpangan (outlier). 
17 
Menentukan Banyaknya 
cluster (K) 
Menentukan pusat 
(centroid ) 
Menghitung jarak object 
ke pusat (centroid) 
Mengelompokan object 
berdasarkan jarak minimum 
Terdapat object yang harus 
dipindahkan 
ya 
Tidak 
Selesai
K-MEAN CLUSTERING METHOD CONT ... 
• ALGORITMA 1 
• ALGORITMA 2 
• ALGORITMA 3 
18 
DATA 
Subject 
Id 
Income 
($) 
Educati 
on 
(years) 
S1 5 5 
S2 6 6 
S3 15 14 
S4 16 15 
S5 25 20 
S6 30 19
ALGORITMA 1 
19 
1. Tentukan jumlah cluster 
(k) 
2. Tentukan observasi yang menjadi centroid 
sejumlah (k) 
3. Menghitung jarak dari Cluster Centroids 
D2 
Initial 
Cluster 
Centroid 
13= (5-15)2 + (5-14)2 = 181 
S3, S4, S5, & S6 
tergabung dalam 
satu cluster 
k = 3
ALGORITMA 1 CONT ... 
• ITERASI 1 
20 
a. Mengubah Cluster Centroids 
DATA 
Rata-rata 
b. Menghitung jarak dari Cluster 
Centroids 
D2 
13= (5-21,5)2 + (5-17)2 = 416,25 
Iterasi selesai karena 
Reassigment = Previous 
Assigment
ALGORITMA 1 VS ALGORITMA 2 
• ALGORITMA 1 : KITA BEBAS MENENTUKAN INITIAL 
CLUSTER CENTROID 
• ALGORITMA 2 : INITIAL CLUSTER CENTROID DIMODIFIKASI 
• LANGKAH SELANJUTNYA SAMA 
21
ALGORITMA 2 
22 
1. Tentukan jumlah cluster 
k = 3 
(k) 
2. Tentukan observasi yang menjadi centroid 
sejumlah (k) 
Initial 
Cluster 
Centroid 
3. Modifikasi Initial Cluster Centroid 
3.1 Tentukan jarak terkecil (selain nol) antar observasi 
Jarak terkecil : 
S1 & S2
23 
ALGORITMA 2 CONT... 
3.2 Menetukan replacement seeds 
S4 tidak dapat dijadikan replacement 
seed karena jarak S1 dan S2 tidak 
lebih kecil dari jarak S4 dengan seed 
terdekat (S3). 
S5 dijadikan replacement seed karena 
jarak S1 dan S2 lebih kecil dari jarak 
S5 dengan seed terdekat (S3). 
3.3 Cluster Centroid hasil modifikasi 
S5 menggantikan seed S2 
karena jarak S5 dan S2 lebih 
kecil daripada S5 dan S1. 
15 
25 
14 20
ALGORITMA 2 CONT ... 
• ITERASI 1 
24 
4. Menghitung jarak dari Cluster Centroids 
D2 
12= (5-15)2 + (5-14)2 = 181 D2 
13= (5-25)2 + (5-20)2 = 625 
a. Mengubah Cluster Centroids 
S1 & 
S2 
S3 & S4 S5 & S6 
b. Menghitung jarak dari Cluster Centroids 
D2 
13= (5-27,5)2 + (5-19,5)2 = 716,5 
Iterasi selesai karena 
Reassigment = Previous 
Assigment
ALGORITMA 3 
• Initial seeds (Ci) ditentukan dengan rumus 
25 
• Sum(i) : total nilai semua variable tiap observasi 
• Min : nilai terkecil sum(i) dari data 
• Max : nilai terbesar sum(i) dari data 
• K : jumlah cluster 
• Reassigment berdasarkan minimum Error Sum of 
Square (ESS)
26 
1. Menentukan Initial Cluster melalui rumus 
Ci 
Sum (1) = income (1) + Education 
(1) 
= 5 + 5 = 10 
퐶4 = 
(31 − 10)(3 − 0,0001) 
49 − 10 
+ 1 = 2,61 ≈ 2 
퐶2 = 
(12 − 10)(3 − 0,0001) 
49 − 10 
+ 1 = 1,15 ≈ 1 
ALGORITMA 3 CONT ...
27 
2. Reassignment cluster melalui ESS 
• S1 jika dipindah ke cluster 3 
Subject berpindah cluster menuju cluster 
dengan perubahan ESS yang paling 
negatif 
Cluster sudah 
optimal karena 
reassignment = 
previous 
assignment 
ALGORITMA 3 CONT ...
SIMILARITY MEASURES 
dengan j dan p adalah jumlah 
variable 
28 
• Similarity measures dapat 
diklasifikasikan menjadi tiga 
bentuk : 
1. Distance measures 
2. Association coefficient 
3. Correlation coefficient 
Distance Measures 
Terdapat beberapa metode dalam 
mengukur jarak, seperti 
Euclidean; Minkowski; City-block; 
Mahalanobis; dan lain 
sebagainya. 
1. Euclidean Distance  untuk 
mengukur similarity Jarak 
euclidean antara titik i dengan 
j dalam dimensi p : 
Dij adalah jarak antara titik i 
2. Minkowski Metric general 
metric dari Euclidean 
distance. 
Jika n = 2 akan menghasilkan 
euclidean distance, maka n = 1 
akan menghasilkan city-block 
distance
29 
SIMILARITY MEASURES CONT... 
3. City-block or manhattan 
distance  bentuk khusus dari 
minkowski metric dengan n = 1. 
Example 
: 
Menghitung Jarak Dengan 
menggunakan euclidean 
distance : 
D2 = (5-6)2 + (5-6)2 = 2 
12 
D12 = 1,41 
Dengan menggunakan city-block 
distance : 
D12 = I5-6I + I5-6I = 2
SIMILARITY MEASURES CONT... 
30 
4. Mahalanobis Distance 
menghitung korelasi diantara 
variabel. 
dimana Σ adalah covariance 
matrix 
Dalam hal Σ = 1, maka jarak ini 
menjadi Euclidean 
variable yang tidak berkorelasi  
mahalanobis distance mengurangi 
euclidean distance untuk 
unstandardized data. 
sehingga euclidean distance untuk 
standardized data merupakan bentuk 
khusus dari mahalanobis distance.
31 
CORRELATION COEFFICIENT 
• Untuk mengukur similarity juga 
dapat menggunakan pearson 
product moment correlation 
coefficient. 
• Baik correlation coefficient 
maupun association coefficient 
merupakan bentuk dissimilarity, 
dimana nilai tertinggi 
menunjukkan similarity dan 
kebalikannya. 
• Koefisien korelasi dapat dengan 
mudah dirubah ke bentuk 
similarity dengan menambahkan 
variabel satu dengan yang lain, 
namun tidak bisa untuk beberapa 
Association Coefficient 
digunakan untuk menunjukkan 
similarity untuk variabel biner. 
Untuk data biner dapat 
menggunakan ukuran seperti 
polychoric correlation atau 
simple matching coefficients 
atau variasi untuk 
menunjukkan similarity antar 
observasi. 
1 0 
1 a b 
0 c d 
a, b, c, d adalah frekuensi 
kejadian, similarity antara 2 
variabel tersebut adalah : 
a  
d 
   
a b c d 
Example 
:
RELIABILITY AND EXTERNAL VALIDITY 
32 
Reliability 
Salah satu indikator reliability adalah degree of 
agreement antara assignment dengan analisis klaster. 
External Validity diperoleh dengan 
membandingkan hasil dari analisis klaster dengan 
kriteria eksternal. 
Misalnya mengelompokkan perusahaan berdasarkan 
rasio keuangan sehingga diperoleh 2 klaster, yaitu 
perusahaan yang sehat secara finansial dan 
perusahaan yang tidak sehat secara finansial.
33 
Thank you 
for 
your attention

More Related Content

What's hot

Laporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhanaLaporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhana
gita Ta
 
Makalah ukuran penyebaran data
Makalah ukuran penyebaran dataMakalah ukuran penyebaran data
Makalah ukuran penyebaran data
Aisyah Turidho
 
Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)
Rani Nooraeni
 
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )Ruang Hasil kali Dalam ( Aljabar Linear Elementer )
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )
Kelinci Coklat
 
Kuliah pemilihan model_terbaik_m14_dan_15
Kuliah pemilihan model_terbaik_m14_dan_15Kuliah pemilihan model_terbaik_m14_dan_15
Kuliah pemilihan model_terbaik_m14_dan_15Roudlotul Jannah
 
Soal dan jawaban uci chi kuadrat dan regresi
Soal dan jawaban uci chi kuadrat dan regresiSoal dan jawaban uci chi kuadrat dan regresi
Soal dan jawaban uci chi kuadrat dan regresi
Vivin Dolpin
 
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
Jordan Drummer
 
APG Pertemuan 4 : Multivariate Normal Distribution
APG Pertemuan 4 : Multivariate Normal DistributionAPG Pertemuan 4 : Multivariate Normal Distribution
APG Pertemuan 4 : Multivariate Normal Distribution
Rani Nooraeni
 
Tabel distribusi peluang binomial
Tabel distribusi peluang binomialTabel distribusi peluang binomial
Tabel distribusi peluang binomialrumahbacazahra
 
Arima
ArimaArima
Tabel x2
Tabel x2Tabel x2
Tabel x2
dinnianggra
 
Algoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendekAlgoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendek
Laili Wahyunita
 
Matriks dan Operasinya ( Aljabar Linear Elementer )
Matriks dan Operasinya ( Aljabar Linear Elementer )Matriks dan Operasinya ( Aljabar Linear Elementer )
Matriks dan Operasinya ( Aljabar Linear Elementer )
Kelinci Coklat
 
Akt 4-anuitas-hidup
Akt 4-anuitas-hidupAkt 4-anuitas-hidup
Akt 4-anuitas-hidup
Faisyal Rufenclonndrecturr
 
Persamaan schroedinger bebas waktu
Persamaan schroedinger bebas waktuPersamaan schroedinger bebas waktu
Persamaan schroedinger bebas waktu
Fani Diamanti
 
Uji kolmogorov & chi square
Uji kolmogorov & chi squareUji kolmogorov & chi square
Uji kolmogorov & chi square
Chumairoh Azzahra
 
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Kelinci Coklat
 
Pemilihan Model Terbaik
Pemilihan Model TerbaikPemilihan Model Terbaik
Pemilihan Model Terbaikdessybudiyanti
 

What's hot (20)

Laporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhanaLaporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhana
 
Makalah ukuran penyebaran data
Makalah ukuran penyebaran dataMakalah ukuran penyebaran data
Makalah ukuran penyebaran data
 
Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)
 
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )Ruang Hasil kali Dalam ( Aljabar Linear Elementer )
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )
 
Kuliah pemilihan model_terbaik_m14_dan_15
Kuliah pemilihan model_terbaik_m14_dan_15Kuliah pemilihan model_terbaik_m14_dan_15
Kuliah pemilihan model_terbaik_m14_dan_15
 
Soal dan jawaban uci chi kuadrat dan regresi
Soal dan jawaban uci chi kuadrat dan regresiSoal dan jawaban uci chi kuadrat dan regresi
Soal dan jawaban uci chi kuadrat dan regresi
 
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
 
APG Pertemuan 4 : Multivariate Normal Distribution
APG Pertemuan 4 : Multivariate Normal DistributionAPG Pertemuan 4 : Multivariate Normal Distribution
APG Pertemuan 4 : Multivariate Normal Distribution
 
Tabel distribusi peluang binomial
Tabel distribusi peluang binomialTabel distribusi peluang binomial
Tabel distribusi peluang binomial
 
Arima
ArimaArima
Arima
 
Tabel x2
Tabel x2Tabel x2
Tabel x2
 
Algoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendekAlgoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendek
 
Akt 3-anuitas-tentu
Akt 3-anuitas-tentuAkt 3-anuitas-tentu
Akt 3-anuitas-tentu
 
Matriks dan Operasinya ( Aljabar Linear Elementer )
Matriks dan Operasinya ( Aljabar Linear Elementer )Matriks dan Operasinya ( Aljabar Linear Elementer )
Matriks dan Operasinya ( Aljabar Linear Elementer )
 
Tabel f-0-05
Tabel f-0-05Tabel f-0-05
Tabel f-0-05
 
Akt 4-anuitas-hidup
Akt 4-anuitas-hidupAkt 4-anuitas-hidup
Akt 4-anuitas-hidup
 
Persamaan schroedinger bebas waktu
Persamaan schroedinger bebas waktuPersamaan schroedinger bebas waktu
Persamaan schroedinger bebas waktu
 
Uji kolmogorov & chi square
Uji kolmogorov & chi squareUji kolmogorov & chi square
Uji kolmogorov & chi square
 
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
Fungsi Gamma dan Beta (Kalkulus Peubah Banyak)
 
Pemilihan Model Terbaik
Pemilihan Model TerbaikPemilihan Model Terbaik
Pemilihan Model Terbaik
 

Similar to analisis kluster

Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
ilmuBiner
 
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
PandeKadek3
 
Clusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdfClusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdf
FadlyFebriya2
 
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdf
Kimnur1
 
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
Institut Teknologi Bandung
 
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptxDM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
HilwinNisa1
 
PPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptx
AbdulMajid84127
 
Pertemuan 6 (ukuran penyebaran data)
Pertemuan 6 (ukuran penyebaran data)Pertemuan 6 (ukuran penyebaran data)
Pertemuan 6 (ukuran penyebaran data)
reno sutriono
 
Modul clustering data mining modul clustering
Modul clustering data mining modul clusteringModul clustering data mining modul clustering
Modul clustering data mining modul clustering
Universitas Bina Darma Palembang
 
Clustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptxClustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptx
nyomans1
 
LN s10-machine vision-s2
LN s10-machine vision-s2LN s10-machine vision-s2
LN s10-machine vision-s2
Binus Online Learning
 
PPT MTK KEL 1.ppt
PPT MTK  KEL 1.pptPPT MTK  KEL 1.ppt
PPT MTK KEL 1.ppt
Andini70675
 
Tugas statistik penelitian
Tugas statistik penelitianTugas statistik penelitian
Tugas statistik penelitian
Wenni Wewex
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)
Adam Mukharil Bachtiar
 
pembahasan dan contoh tentang data mining
pembahasan dan contoh tentang data miningpembahasan dan contoh tentang data mining
pembahasan dan contoh tentang data mining
eri299
 
ALGORITMA K-MEANS dan.pptx
ALGORITMA K-MEANS dan.pptxALGORITMA K-MEANS dan.pptx
ALGORITMA K-MEANS dan.pptx
DANIMULYOFEBRIANTO
 
Rini utami statistika
Rini utami statistikaRini utami statistika
5. presentasi ukuran penyebara data
5. presentasi ukuran penyebara data5. presentasi ukuran penyebara data
5. presentasi ukuran penyebara data
Hafiza .h
 
materi Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .pptmateri Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .ppt
ashaby
 
Statistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.pptStatistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.ppt
AhmadSyajili
 

Similar to analisis kluster (20)

Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
 
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
 
Clusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdfClusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdf
 
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdf
 
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
 
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptxDM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
 
PPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptx
 
Pertemuan 6 (ukuran penyebaran data)
Pertemuan 6 (ukuran penyebaran data)Pertemuan 6 (ukuran penyebaran data)
Pertemuan 6 (ukuran penyebaran data)
 
Modul clustering data mining modul clustering
Modul clustering data mining modul clusteringModul clustering data mining modul clustering
Modul clustering data mining modul clustering
 
Clustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptxClustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptx
 
LN s10-machine vision-s2
LN s10-machine vision-s2LN s10-machine vision-s2
LN s10-machine vision-s2
 
PPT MTK KEL 1.ppt
PPT MTK  KEL 1.pptPPT MTK  KEL 1.ppt
PPT MTK KEL 1.ppt
 
Tugas statistik penelitian
Tugas statistik penelitianTugas statistik penelitian
Tugas statistik penelitian
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)
 
pembahasan dan contoh tentang data mining
pembahasan dan contoh tentang data miningpembahasan dan contoh tentang data mining
pembahasan dan contoh tentang data mining
 
ALGORITMA K-MEANS dan.pptx
ALGORITMA K-MEANS dan.pptxALGORITMA K-MEANS dan.pptx
ALGORITMA K-MEANS dan.pptx
 
Rini utami statistika
Rini utami statistikaRini utami statistika
Rini utami statistika
 
5. presentasi ukuran penyebara data
5. presentasi ukuran penyebara data5. presentasi ukuran penyebara data
5. presentasi ukuran penyebara data
 
materi Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .pptmateri Statistik Sosial dan analisis data .ppt
materi Statistik Sosial dan analisis data .ppt
 
Statistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.pptStatistik-Sosial-pada kelas Pertemuan-4.ppt
Statistik-Sosial-pada kelas Pertemuan-4.ppt
 

Recently uploaded

JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
TeguhWinarno6
 
Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1
RizkyAji15
 
template undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docxtemplate undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docx
ansproduction72
 
Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan  (1).pptxPresentasi Luring (8JP)_ Refleksi Tahunan  (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
muhammadfauzi951
 
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.pptPPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
WewikAyuPrimaDewi
 
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptxBahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
dwiagus41
 
pemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdfpemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdf
fuji226200
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
WagKuza
 
PPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahirPPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahir
yardsport
 
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay..."Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
Muhammad Nur Hadi
 
Materi pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipaMateri pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipa
sarahshintia630
 
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptxTugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
SunakonSulistya
 

Recently uploaded (12)

JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
 
Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1
 
template undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docxtemplate undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docx
 
Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan  (1).pptxPresentasi Luring (8JP)_ Refleksi Tahunan  (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
 
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.pptPPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
 
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptxBahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
 
pemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdfpemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdf
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
 
PPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahirPPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahir
 
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay..."Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
 
Materi pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipaMateri pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipa
 
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptxTugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
 

analisis kluster

  • 1. CLUSTER ANALYSIS KELOMPOK 5 1. GUSTI WIRA BAYUTAMA (2513204002) 2. NATHANIA NIWEDYA (2513201004) 3. SOFYAN MUZAKKI (2513204009) 4. NI PUTU WANSRI SEPTI DEWI (2513201010) 5. JAZILATUR RIZQIYAH DEVIABAHARI (2513203012) 1
  • 2. WHAT IS CLUSTER ANALYSIS? Analisis cluster adalah salah satu teknik multivariate untuk mengelompokkan obyek berdasarkan kesamaan karakteristik di antara obyek-obyek tersebut sehingga obyek-obyek yang berada dalam satu cluster akan Cimrie-cmipriunCylaui sketemrir iypaannsgatBuasaikma lain. • Homogenitas internal (within cluster) : kesamaan antar anggota dalam satu cluster. • Heterogenitas external (between cluster): perbedaan antara cluster yang satu dengan cluster yang lain. 2 Asusmsi • Representativeness of the sample : sampel yang diambil dapat mewakili populasi yang ada. •Multokolinieritas: Terdapat hubungan yang linier antar variabel .
  • 3. CLUSTER ANALYSIS 3 Metode Pengelompokan Hirarchical Clustering Method Single Linkage Complete Linkage Average Linkage Ward’s Method Centroid Method Non Hirarchical Clustering Method K-Mean Method Tidak baik untuk mengolah sampel ukuran besar Untuk data sampel ukuran besar
  • 4. HIRARCHICAL CLUSTERING METHOD 4 Single Linkage Complete Linkage Average Linkage Centroid Method
  • 5. HIRARCHICAL CLUSTERING METHOD nearest neighbor 5 1. Single Linkage  didasarkan pada jarak minimum (nearest neighbor ). Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek maka keduanya akan ditempatkan pada cluster pertama, dan seterusnya. Example : Jarak antara Jarak yang Paling Minimum
  • 6. HIRARCHICAL CLUSTERING METHOD CONT… Object 5 dan object 3 digabungkan, kemudian dicari terdekat menuju object berikutnya 6 Jarak yang paling minimum adalah dari object (3,5) ke object 1 Object (5,3) digabungkan dengan object 1.
  • 7. HIRARCHICAL CLUSTERING METHOD CONT… 7 Jarak yang paling minimum adalah dari object (1,3,5) ke object 4 Jarak yang Paling Minimum Jarak antar cluster DENDOGRAM Cluster 1 Cluster 2
  • 8. HIRARCHICAL CLUSTERING METHOD CONT… 2. Complete linkage  dasarnya adalah jarak maksimum. Dalam metode ini seluruh objek dalam suatu cluster dikaitkan satu sama lain pada suatu jarak maksimuma atau dengan kesamaan minimum. Jarak antara most distance members 8 Example : dari cluster Awalnya dicari Jarak yang Paling Minimum  3 dan 5 didekatkan/digabungkan
  • 9. HIRARCHICAL CLUSTERING METHOD CONT… Jarak paling minimum adalah dari object 4 ke 2 9 Jarak yang paling minimum. Sehingga (2,4) didekatkan dengan object 1 DENDOGRAM Cluster 1 Cluster 2
  • 10. HIRARCHICAL CLUSTERING METHOD CONT… 10 3. Average Linkage  Dasarnya adalah jarak rata-rata antar object. Dimana jarak antar cluster merupakan jarak rata-rata antar object Jarak antara object ke i dalam cluster (UV) dan object ke j dalam cluster (w) Banyaknya item di cluster (UV) dan W Example : Subject Id Income ($ thous.) Educatio n (years) S1 5 5 S2 6 6 S3 15 14 S4 16 15 S5 25 20 S6 30 19
  • 11. HIRARCHICAL CLUSTERING METHOD CONT… Dengan menggunakan euclidean distance diperoleh jarak paling minimum yaitu S1 dan 11 S2 Jarak paling minimum selanjutnya sehingga S3 dan S4 digabungkan
  • 12. HIRARCHICAL CLUSTERING METHOD CONT… 12 4. Centroid Method  mempertimbangkan jarak centroid pada cluster. dimana Jarak antara klaster A dan klaster B adalah jarak rata-rata data x dan y dari klaster A dan B Example : Subject nA dan nB masing-masing adalah banyaknya data dalam set A dan B Id Income ($) Educati on (years) S1 5 5 S2 6 6 S3 15 14 S4 16 15 S5 25 20 S6 30 19
  • 13. HIRARCHICAL CLUSTERING METHOD CONT… 13 Dengan menggunakan euclidean distance dicari jarak paling minimum yaitu (S1, S2) S1&S2 digabungkan menjadi 1 klaster dengan rata-rata income : (5+6)/2 = 5,5 dan rata-rata education : (5+6)/2 = 5,5
  • 14. HIRARCHICAL CLUSTERING METHOD CONT… Rata-rata income dan education dari S3 dan 14 S4 DENDOGRAM Cluster 1 Cluster 2
  • 15. HIRARCHICAL CLUSTERING METHOD CONT… 5. Ward’s Method  Dalam metode ini jarak antara dua 15 cluster adalah jumlah kuadrat antara dua cluster untuk seluruh variabel. dimana : nA dan nB masing-masing adalah banyaknya data dalam set A dan B s2 AB adalah jarak antara klaster A dan B menggunakan centroid linkage Metode ini bertujuan untuk meminimasi jumlah kuadrat dalam cluster (within-cluster sum of square)
  • 16. HIRARCHICAL CLUSTERING METHOD CONT… 16 Example : •ESS adalah error sum of square ESS untuk S1 dan S2 : (5-5,5)2+(6-5,5)2+(5-5,5)2+(6-5,5)2 = 1 Metode ward ini menghitung kemungkinan tiap cluster DENDOGRAM Cluster 1 Cluster 2
  • 17. NON HIRARCHICAL CLUSTERING METHOD • K-MEAN CLUSTERING METHOD : Dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan tanpa mengikuti proses hirarki. • KELEBIHAN : Cukup efisien, algoritma berhenti dalam kondisi optimum. • KELEMAHAN : Harus menentukan jumlah cluster yang dibentuk, tidak dapat menangani data yang mengalami penyimpangan (outlier). 17 Menentukan Banyaknya cluster (K) Menentukan pusat (centroid ) Menghitung jarak object ke pusat (centroid) Mengelompokan object berdasarkan jarak minimum Terdapat object yang harus dipindahkan ya Tidak Selesai
  • 18. K-MEAN CLUSTERING METHOD CONT ... • ALGORITMA 1 • ALGORITMA 2 • ALGORITMA 3 18 DATA Subject Id Income ($) Educati on (years) S1 5 5 S2 6 6 S3 15 14 S4 16 15 S5 25 20 S6 30 19
  • 19. ALGORITMA 1 19 1. Tentukan jumlah cluster (k) 2. Tentukan observasi yang menjadi centroid sejumlah (k) 3. Menghitung jarak dari Cluster Centroids D2 Initial Cluster Centroid 13= (5-15)2 + (5-14)2 = 181 S3, S4, S5, & S6 tergabung dalam satu cluster k = 3
  • 20. ALGORITMA 1 CONT ... • ITERASI 1 20 a. Mengubah Cluster Centroids DATA Rata-rata b. Menghitung jarak dari Cluster Centroids D2 13= (5-21,5)2 + (5-17)2 = 416,25 Iterasi selesai karena Reassigment = Previous Assigment
  • 21. ALGORITMA 1 VS ALGORITMA 2 • ALGORITMA 1 : KITA BEBAS MENENTUKAN INITIAL CLUSTER CENTROID • ALGORITMA 2 : INITIAL CLUSTER CENTROID DIMODIFIKASI • LANGKAH SELANJUTNYA SAMA 21
  • 22. ALGORITMA 2 22 1. Tentukan jumlah cluster k = 3 (k) 2. Tentukan observasi yang menjadi centroid sejumlah (k) Initial Cluster Centroid 3. Modifikasi Initial Cluster Centroid 3.1 Tentukan jarak terkecil (selain nol) antar observasi Jarak terkecil : S1 & S2
  • 23. 23 ALGORITMA 2 CONT... 3.2 Menetukan replacement seeds S4 tidak dapat dijadikan replacement seed karena jarak S1 dan S2 tidak lebih kecil dari jarak S4 dengan seed terdekat (S3). S5 dijadikan replacement seed karena jarak S1 dan S2 lebih kecil dari jarak S5 dengan seed terdekat (S3). 3.3 Cluster Centroid hasil modifikasi S5 menggantikan seed S2 karena jarak S5 dan S2 lebih kecil daripada S5 dan S1. 15 25 14 20
  • 24. ALGORITMA 2 CONT ... • ITERASI 1 24 4. Menghitung jarak dari Cluster Centroids D2 12= (5-15)2 + (5-14)2 = 181 D2 13= (5-25)2 + (5-20)2 = 625 a. Mengubah Cluster Centroids S1 & S2 S3 & S4 S5 & S6 b. Menghitung jarak dari Cluster Centroids D2 13= (5-27,5)2 + (5-19,5)2 = 716,5 Iterasi selesai karena Reassigment = Previous Assigment
  • 25. ALGORITMA 3 • Initial seeds (Ci) ditentukan dengan rumus 25 • Sum(i) : total nilai semua variable tiap observasi • Min : nilai terkecil sum(i) dari data • Max : nilai terbesar sum(i) dari data • K : jumlah cluster • Reassigment berdasarkan minimum Error Sum of Square (ESS)
  • 26. 26 1. Menentukan Initial Cluster melalui rumus Ci Sum (1) = income (1) + Education (1) = 5 + 5 = 10 퐶4 = (31 − 10)(3 − 0,0001) 49 − 10 + 1 = 2,61 ≈ 2 퐶2 = (12 − 10)(3 − 0,0001) 49 − 10 + 1 = 1,15 ≈ 1 ALGORITMA 3 CONT ...
  • 27. 27 2. Reassignment cluster melalui ESS • S1 jika dipindah ke cluster 3 Subject berpindah cluster menuju cluster dengan perubahan ESS yang paling negatif Cluster sudah optimal karena reassignment = previous assignment ALGORITMA 3 CONT ...
  • 28. SIMILARITY MEASURES dengan j dan p adalah jumlah variable 28 • Similarity measures dapat diklasifikasikan menjadi tiga bentuk : 1. Distance measures 2. Association coefficient 3. Correlation coefficient Distance Measures Terdapat beberapa metode dalam mengukur jarak, seperti Euclidean; Minkowski; City-block; Mahalanobis; dan lain sebagainya. 1. Euclidean Distance  untuk mengukur similarity Jarak euclidean antara titik i dengan j dalam dimensi p : Dij adalah jarak antara titik i 2. Minkowski Metric general metric dari Euclidean distance. Jika n = 2 akan menghasilkan euclidean distance, maka n = 1 akan menghasilkan city-block distance
  • 29. 29 SIMILARITY MEASURES CONT... 3. City-block or manhattan distance  bentuk khusus dari minkowski metric dengan n = 1. Example : Menghitung Jarak Dengan menggunakan euclidean distance : D2 = (5-6)2 + (5-6)2 = 2 12 D12 = 1,41 Dengan menggunakan city-block distance : D12 = I5-6I + I5-6I = 2
  • 30. SIMILARITY MEASURES CONT... 30 4. Mahalanobis Distance menghitung korelasi diantara variabel. dimana Σ adalah covariance matrix Dalam hal Σ = 1, maka jarak ini menjadi Euclidean variable yang tidak berkorelasi  mahalanobis distance mengurangi euclidean distance untuk unstandardized data. sehingga euclidean distance untuk standardized data merupakan bentuk khusus dari mahalanobis distance.
  • 31. 31 CORRELATION COEFFICIENT • Untuk mengukur similarity juga dapat menggunakan pearson product moment correlation coefficient. • Baik correlation coefficient maupun association coefficient merupakan bentuk dissimilarity, dimana nilai tertinggi menunjukkan similarity dan kebalikannya. • Koefisien korelasi dapat dengan mudah dirubah ke bentuk similarity dengan menambahkan variabel satu dengan yang lain, namun tidak bisa untuk beberapa Association Coefficient digunakan untuk menunjukkan similarity untuk variabel biner. Untuk data biner dapat menggunakan ukuran seperti polychoric correlation atau simple matching coefficients atau variasi untuk menunjukkan similarity antar observasi. 1 0 1 a b 0 c d a, b, c, d adalah frekuensi kejadian, similarity antara 2 variabel tersebut adalah : a  d    a b c d Example :
  • 32. RELIABILITY AND EXTERNAL VALIDITY 32 Reliability Salah satu indikator reliability adalah degree of agreement antara assignment dengan analisis klaster. External Validity diperoleh dengan membandingkan hasil dari analisis klaster dengan kriteria eksternal. Misalnya mengelompokkan perusahaan berdasarkan rasio keuangan sehingga diperoleh 2 klaster, yaitu perusahaan yang sehat secara finansial dan perusahaan yang tidak sehat secara finansial.
  • 33. 33 Thank you for your attention