Laporan datamining CLUSTERING

LAPORAN TUGAS DATA MINING
PENERAPAN K-MEANS ALGORITM CLUSTERING
PADA DATA PRODUKSI GARAM SETIAP PROVINSI DI INDONESIA
Disusun Oleh :
Yogi Anggara [1500018073]
Rynto E. S. [1500018074]
Ridho Febrian [1500018083]
Mayang Notri.S [1500018102]
Vita Silvia [1500018114]
Indriyanto A.P [1500018118]
Prodi Teknik Informatika
Fakultas Teknologi Industri
Universitas Ahmad Dahlan
Yogyakarta
2017

Latar Belakang
garam adalah salah satu bahan poko dalam masakkan. Indonesia salah satu produksen garam yang masih terbatas
produksinya di karenakkan asih menggunakkan cara tradisional dalam produksinya, yaitu dengan cara penyinaran
sinar matahari. Produksi garam di Indonesia ini hanya mampu memenuhi kebutuhan garam dalam negeri, in juga
salah satu dampak dari masih tradisionalnya cara produksi garam. Bahkan pada waktu-waktu sebelumnya di
Indonesia di katakkan sedang krisis garam, sehingga pemerintah meimpor garam dari Australia untuk memenuhi
kebutuhan garam di Indonesia. Dengan adanya keputusan tersebut berdampak pada harga garam local yang bisa
merugikan petani garam di Indonesia.
Dengan adanya data set ini kami bisa menghitung dan memperkirakkan dengan luas lahan, tingkat produktifitas
dapat mengetahui seberapa banyak garam yang bisa di produksi. Sehingga data set ini bisa jadi acuhan
pemerintahan untuk mengembangkan system pembuatan garam dan impor garam luar negeri yang bisa membebani
ptani garam.
Tujuan
Dengan menghitungan data set “Data Produksi Garam Setiap Provinsi Di Indonesia Menggunakkan K-Means
Algoritm Clustering” :
1. Untuk mengetahui tingkat produktivitas pembuatan garam di setiap daerah
2. Untuk mengetahui tingkat produksi garam di setiap daerah
3. Untuk medapatkkan data yang telah dikelompokkan sehingga dapat menghasilkan informasi
4. Menjadikan acuhan pemerintah untuk menyikapi krisis garam di indonesia

Dasar teori
K-Means
K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan
tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan
sistem partisi. Metode k-means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana
data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik
yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, metode ini berusaha untuk
meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada
di cluster lainnya.
CLustering
Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clusteringadalah sebuah
proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam
satu cluster memiliki tingkat kemiripan yang maksimum dan data antarcluster memiliki kemiripan yang minimum.
Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut
dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda
dengan cluster yang lain. Partisi tidak dilakukan secara manual melainkan dengan suatu algoritma clustering. Oleh
karena itu, clustering sangat berguna dan bisa menemukan group atau kelompokyang tidak dikenal dalam
data. Clustering banyak digunakan dalam berbagai aplikasi seperti misalnya pada business inteligence, pengenalan
pola citra, web search, bidang ilmu biologi, dan untuk keamanan (security). Di dalam business
inteligence, clusteringbisa mengatur banyak customer ke dalam banyaknya kelompok. Contohnya
mengelompokan customer ke dalam beberapa cluster dengan kesamaan karakteristik yang kuat. Clustering juga
dikenal sebagai data segmentasi karena clustering mempartisi banyak data set ke dalam banyak group berdasarkan
kesamaannya. Selain itu clustering juga bisa sebagai outlier detection.

Data Produksi Garam
Terdapat 340 data dengan 8 atribut :
1. Id : varchar 5 auto increatmen
2. Kabupaten : varchar 25
3. Nama provinsi : varchar 25
4. Param garam : varchar 15
5. Tahun : date
6. Luas lahan : int 15
7. Produksi : int 15
8. Produktivitas : int 15

Data produksi garam setelah di filter
Data yang telah di clastering, yang awal 415 menjadi 340 data yang telah di filter, dengan 8 atribut : id,
kabupaten, nama provinsi, param garam, tahun, luas lahan produksi, produktivitas

Uji Coba Secara Manual
Gambar: contoh data dari data produksi garam di ambil 5 sempel data untuk di hitung
 Langkah pertama algoritma K-means Menanyakan kepada pemakai algoritma k-means,
catatan-catatan yang ada akan dibuat menjadi berapa kelompok. Jika diambil
pengkelompokannya dengan jumlah tiga, nilai k-nya adalah 3 atau k=3
Kabupaten Produksi Produktivitas
BIMA 10277.9 79
SUMBAWA 2719.08 78
KOTA BIMA 1972.5 75
LOMBOK TIMUR 3584.92 76
LOMBOK BARAT 1320 22
Gambar : table yang telah di kelompokkan
 Langkah Kedua algoritma K-Means
Pada langkah kedua algoritma ini, kita akan secara sembarang memilih k=3 buah titik pusat
(dari 5 data yang ada) sebagai pusat-pusat kelompok awal, misalnya:
a. Catatan B sebagai pusat kelompok 1 sehingga m1 = (2719.08 , 78),
b. Catatan C sebagai pusat kelompok 2 sehingga m2 = (1972.50 , 75),
c. Catatan E sebagai pusat kelompok 3 sehingga m3 = (1320 , 22),
A 10277.9 79
B 2719.08 78
C 1972.5 75
D 3584.92 76
E 1320 22
Gambar: yang telah di symbol data kabupaten, untuk mempermudah perhitungan
Catetan :
A : Bima
B : Sumbawa
C : Kota Bima
D : Lombok Timur
E : Lombok Barat
ID Kabupaten NamaProvinsi ParamGara
m
Tahu
n
LuasLaha
n
Produksi Produktivita
s
26 BIMA Nusa Tenggara
Barat
PUGAR 2011 130.1 10277.9 79
27 SUMBAWA Nusa Tenggara
Barat
PUGAR 2011 34.86 2719.08 78
28 KOTA
BIMA
Nusa Tenggara
Barat
PUGAR 2011 26.3 1972.5 75
29 LOMBOK
TIMUR
Nusa Tenggara
Barat
PUGAR 2011 47.17 3584.92 76
30 LOMBOK
BARAT
Nusa Tenggara
Barat
PUGAR 2011 60 1320 22
M1
M2
M3

Perhitungan rasio ke-1
 Langkah Ketiga algoritma K-Means kelompok
Pada langkah ini setiap data akan ditentukan pusat kelompok terdekatnya. Data tersebut akan ditetapkan
sebagai anggota kelompok yang terdekat pusat kelompoknya menggunakan rumus sebagai berikut:
A 10277.9 79
B 2719.08 78
C 1972.5 75
D 3584.92 76
E 1320 22
Contoh penghitungan:
a. A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (2719.08 , 78)
A1 = d (x,y) =√((10277.9 − 2719.08)2) + ((79 − 78)2) = √7558.822 + 12 = √57135760.79 = 7558.820066
b. A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (1972.50 , 75)
A2 = d (x,y) =√((10277.9 − 1972.5)2) + ((79 − 75)2) = √8305,42 + 42 = √68979685,16 = 8305.400963
a. A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22)
A3 = d (x,y) =√((10277.9 − 1320)2) + ((79 − 22)2) = √8957,92 + 572 = √80247221,41 = 8958.081346
Untuk penghitungan B1 sampai E3 dilakukan langkah yang sama seperti di atas. Dan Menghasilkan seperti yang
tampak dalam table dibawah ini:
Data
Kabupaten
Jarak Ke Pusat
M1 (2719.08 , 78)
Jarak Ke Pusat
M2(1972.50 , 75)
Jarak Ke Pusat
M3(1320 , 22)
A(10277.9 , 79) A1 7558.820066 A2 8305.400963 A3 8958.081346
B(2719.08 , 78) B1 746.5860275 B2 1400.200288 B3 2720.198531
C(1972.5 , 75) C1 654.6489517 C2 1973.925341 C3 1973.925341
D(3584.92 , 76) D1 3585.725506 D2 3585.725506 D3 3585.725506
E(1320, 22) E1 1320.183321 E2 1320.183321 E3 1320.183321
Gambar : table yang jarak pusat setiap data

Untuk setiap data akan ditentukan pusat kelompok terdekatnya dengan cara membandingkan nilai jarak setiap
data dengan pusat M, dengan mencari nilai paling terkecil. Sehingga di dapatkan table dibawah ini :
Jarak ke pusat
m1 (2719.08 , 78)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat
ke kelompok
A1 7558.820066 A2 8305.400963 A3 8958.081346 m1
B1 0 B2 746.5860275 B3 1400.200288 m1
C1 746.5860275 C2 0 C3 650.3439475 m2
D1 865.8423099 D2 1612.42031 D3 2265.56364 m1
E1 1400.200288 E2 654.6489517 E3 0 m3
Dari table 2 didapatkan keanggotaan sebagai berikut:
a. Kelompok 1 (atau m1) ={A, B, D}
b. Kelompok 2 (atau m2) = {C}, dan
c. Kelompok 3 (atau m3) = {E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan Within
Cluster Variation (WCV), seperti berikut:
a. Rumus untuk menghitung Between Cluster Variation (BCV) sebagai berikut:
BCV = ∑ d (mi ,mj)
𝑛
𝑖,𝑗=0
Dimana i dan j adalah pusat kelompok. Karena pusat kelompok ada 3 dan d(mi,mj)
Menyatakan jarak Euclidean dari mi ke mj, Maka penyelesaian BCV menjadi sebagai berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (2719.08 , 78), m2(1972.50 , 75), dan m3(1320 , 22), sehingga :
d (m1, m2) = √((2719,08 − 1972,75)2) + ((78 − 75)2) = √(746,33)2
+ (3)2
= √557390.6964 = 746.5860275
d (m1, m3) = √((2719.08 − 1320)2) + ((78 − 22)2) = √((1399.08)2) + ((56)2) = √1960560.846 =1400.200288
d (m2, m3) = √((1972.50 − 1320)2) + ((75 − 22)2) = √((652.5)2) + ((53)2) = √428565.25 = 654.6489517
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 746.5860275 + 1400.200288 + 654.6489517 = 2801.435267

b. Rumus untuk menghitung Within Cluster Variation (WCV) sebagai berikut:
𝑊𝐶𝑉 = ∑(𝐽𝑎𝑟𝑎𝑘 𝑡𝑒𝑟𝑘𝑒𝑐𝑖𝑙 𝑠𝑒𝑡𝑖𝑎𝑝 𝑛𝑎𝑠𝑎𝑏𝑎ℎ 𝑘𝑒 𝑖)2
𝑛
𝑖=1
Jarak ke pusat
m1 (2719.08 , 78)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat
ke kelompok
A1 7558.820066 A2 8305.400963 A3 8958.081346 m1
B1 0 B2 746.5860275 B3 1400.200288 m1
C1 746.5860275 C2 0 C3 650.3439475 m2
D1 865.8423099 D2 1612.42031 D3 2265.56364 m1
E1 1400.200288 E2 654.6489517 E3 0 m3
Dari table di atas didapatkan
Jarak terkecil A = 7558.820066
Jarak terkecil B = 0
Jarak terkecil C = 0
Jarak terkecil D = 865.8423099
Jarak terkecil E = 0
WCV = 7558.820066 + 0 + 0 + 865.8423099 + 0 = 8424.662376
Sehingga besarnya rasio adalah
𝑩𝑪𝑽
𝑾𝑪𝑽
=
𝟐𝟖𝟎𝟏.𝟒𝟑𝟓𝟐𝟔𝟕
𝟖𝟒𝟐𝟒.𝟔𝟔𝟐𝟑𝟕𝟔
= 0.332527897
Mengingat langkah sebelumnya belum mendapatkan rasio ini, maka perbandingan rasio belum dapat
dilakukan dan algoritma dilanjutkan ke langkah ke empat.

Perhitungan Rasio Ke-2
 Langkah keempat Algoritma K-means (iterasi ke1)
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
Jarak ke pusat
m1 (2719.08 , 78)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat
ke kelompok
A1 7558.820066 A2 8305.400963 A3 8958.081346 m1
B1 0 B2 746.5860275 B3 1400.200288 m1
C1 746.5860275 C2 0 C3 650.3439475 m2
D1 865.8423099 D2 1612.42031 D3 2265.56364 m1
E1 1400.200288 E2 654.6489517 E3 0 m3
a) m1 = rata-rata(mA,mB, mD) =
(10277.9 ,79)+(2719.08 ,78)+(3584.92 ,76)
3
= (5527.3 , 77.66666667)
b) m2 = rata-rata(mC) = (1972.5 , 75)
c) m3 = rata-rata(mE) = (1320, 22)
selanjutnya, kita akan kembali ke langkah 3 untuk mencari pembadingan
 Langkah ketiga Algoritma K-Means (iterasi-2)
A. Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara
seperti langkah 3 diatas)
.
a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 5527.3 , 77.66666667)
A1 = d (x,y) =√((10277.9 − 5527.3)2) + ((79 − 77.66666667)2) = √4750.62
+ 1.333333332
= √22568202.14 = 4750.600187
b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (1972.5 , 75)
A2 = d (x,y) =√((10277.9 − 1972.5)2) + ((79 − 75)2) = √8305,42
+ 42
= √68979685,16 = 8305.400963
c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22)
A3 = d (x,y) =√((10277.9 − 1320)2) + ((79 − 22)2) = √8957,92
+ 572
= √80247221,41 = 8958.081346
Jarak ke pusat
m1 (5527.3 , 77.66666667)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 4750.600187 A2 8305.400963 A3 8958.081346 m1
B1 2808.22002 B2 746.5860275 B3 1400.200288 m2
C1 3554.801 C2 0 C3 650.3439475 m2
D1 1942.380715 D2 1612.42031 D3 2265.56364 m2
E1 4207.668246 E2 654.6489517 E3 0 m3
Gambar : table jarak terdekat yang baru,

Dari table diatas didapatkan keanggotaan sebagai berikut:
a. Kelompok 1 (atau m1) ={A}
b. Kelompok 2 (atau m2) = {B, C, D}, dan
c. Kelompok 3 (atau m3) = {E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster
Variation (WCV), seperti berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (5527.3 , 77.66666667), m2(1972.50 , 75), dan m3(1320 , 22), sehingga :
d (m1, m2) = √(5527.3 − 1972.50)2 + (77.66666667 − 75)2 = √((12636603.04)) + ((7.111111111))
= √12636610.15 = 3554.801
d (m1, m3) =√((5527.3 − 1320)2) + ((77.66666667 − 22)2) = √((17701373.29)) + ((3098.777778))
= √17704472.07 = 4207.668246
d (m2, m3)=√((1972.5 − 1320)2) + ((75 − 22)2) = √(652.5)2 + (53)2 = √425756.25 + 2809
= √428565.25 = 654.6489517
Jarak ke pusat
m1 (5527.3 , 77.66666667)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 4750.600187 A2 8305.400963 A3 8958.081346 m1
B1 2808.22002 B2 746.5860275 B3 1400.200288 m2
C1 3554.801 C2 0 C3 650.3439475 m2
D1 1942.380715 D2 1612.42031 D3 2265.56364 m2
E1 4207.668246 E2 654.6489517 E3 0 m3
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 3554.801 + 4207.668246 + 654.6489517 = 8417.118198
B. Besar Rasio 2
WCV = 4750.600187 + 746.5860275 + 0 + 1612.42031 + 0 = 7109.606525
𝐵𝐶𝑉
𝑊𝐶𝑉
=
8417.118198
7109.606525
= 1.183907741

 Langkah keempat Algoritma K-means (iterasi ke1)
m1 = rata-rata(mA) = (10277.9, 79)
m2 = rata-rata(, mB, mC , mD) =
(2719.08 ,78)+ (1972.5 ,75)+(3584 .92 ,76)
3
= (2758.833333 , 76.33333333)
m3 = rata-rata(mE) = (1320, 22)
Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
.
a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (2758.833333 , 76.33333333)
A2 = d (x,y)=√((10277.9 − 2758.833333)2) + ((79 − 76.33333333)2) = √56536363.54+ 7.111111111 = 56536370.65
c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22)
A3 = d (x,y)=√((10277.9 − 1320)2) + ((79 − 22)2) = √8957.9 − 57 = √80247221.41 = 8958.081346
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
Jarak ke pusat
m1 (5527.3 , 77.66666667)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 4750.600187 A2 8305.400963 A3 8958.081346 m1
B1 2808.22002 B2 746.5860275 B3 1400.200288 m2
C1 3554.801 C2 0 C3 650.3439475 m2
D1 1942.380715 D2 1612.42031 D3 2265.56364 m2
E1 4207.668246 E2 654.6489517 E3 0 m3

a) Kelompok 1 (atau m1) ={A}
b) Kelompok 2 (atau m2) = {B, D}, dan
c) Kelompok 3 (atau m3) = { C, E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (10277.9, 79), m2(2758.833333 ,76.33333333) dan m3(1320 , 22), sehingga :
d (m1, m2) =√((10277.9 − 2758.833333)2) + (79 − 76.33333333)2)
= √56536363.54 + 7.111111111 = 7519.06714
d (m1, m3) =√((10277.9 − 1320)2) − ((79 − 22)2)
= √80243972.41 + 3249 = 8958.081346
d (m2, m3) =√((2758.833333 − 1320)2) + ((76.33333333 − 22)2)
= √2070241.361 + 2952.111111 = 1439.858838
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7519.06714 + 8958.081346 + 1439.858838 = 17917.00732
C. Besar Rasio 3
WCV = 0 + 39.78825567+ 654.6489517 + 826.0867339+ 0 = 1520.523941
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟗𝟏𝟕.𝟎𝟎𝟕𝟑𝟐
7109.606525
= 11.78344309

 Langkah keempat Algoritma K-means (iterasi ke1)
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
m1 = rata-rata(mA) = (10277.9, 79)
m2 = rata-rata(mB ,mD) =
(2719.08 ,78)+ (3584.92 ,76)
2
= (3152 , 77)
m3 = rata-rata(mC ,mE) =
(1972.5 ,75)+(1320,22)
2
= (1646.25 , 48.5)
.
a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77)
A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281
c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5)
A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke kelompok
A1 0 A2 7125.900281 A3 8631.703886 m1
B1 7558.820066 B2 432.9211549 B3 1073.23551 m2
C1 8305.400963 C2 1179.501696 C3 327.3244759 m3
D1 6692.980672 D2 432.9211549 D3 1938.865034 m2
E1 8958.081346 E2 1832.825414 E3 327.3244759 m3

d) Kelompok 1 (atau m1) ={A}
e) Kelompok 2 (atau m2) = {B, D}, dan
f) Kelompok 3 (atau m3) = { C, E}.
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga :
d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2)
= √50778450.81 + 4 = 7125.900281
d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2)
= √74505381.72 + 930.25 = 8631.703886
d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2)
= √2267283.063 + 812.25 = 1506.019692
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386
Besar Rasio 4
WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔
1520.491262
= 11.35397769

Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
m1 = rata-rata(mA) = (10277.9, 79)
(2719.08 ,78)+ (3584.92 ,76)
2
= (3152 , 77)
(1972.5 ,75)+(1320,22)
2
= (1646.25 , 48.5)
.
d) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
e) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77)
A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281
f) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5)
A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
A1 0 A2 7125.900281 A3 8631.703886 m1
B1 7558.820066 B2 432.9211549 B3 1073.23551 m2
C1 8305.400963 C2 1179.501696 C3 327.3244759 m3
D1 6692.980672 D2 432.9211549 D3 1938.865034 m2
E1 8958.081346 E2 1832.825414 E3 327.3244759 m3

g) Kelompok 1 (atau m1) ={A}
h) Kelompok 2 (atau m2) = {B, D}, dan
i) Kelompok 3 (atau m3) = { C, E}.
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2)
= √50778450.81 + 4 = 7125.900281
d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2)
= √74505381.72 + 930.25 = 8631.703886
d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2)
= √2267283.063 + 812.25 = 1506.019692
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386
Besar Rasio 5
WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔
1520.491262
=11.35397769

Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
m1 = rata-rata(mA) = (10277.9, 79)
(2719.08 ,78)+ (3584.92 ,76)
2
= (3152 , 77)
(1972.5 ,75)+(1320,22)
2
= (1646.25 , 48.5)
.
g) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
h) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77)
A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281
i) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5)
A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
A1 0 A2 7125.900281 A3 8631.703886 m1
B1 7558.820066 B2 432.9211549 B3 1073.23551 m2
C1 8305.400963 C2 1179.501696 C3 327.3244759 m3
D1 6692.980672 D2 432.9211549 D3 1938.865034 m2
E1 8958.081346 E2 1832.825414 E3 327.3244759 m3

j) Kelompok 1 (atau m1) ={A}
k) Kelompok 2 (atau m2) = {B, D}, dan
l) Kelompok 3 (atau m3) = { C, E}.
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2)
= √50778450.81 + 4 = 7125.900281
d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2)
= √74505381.72 + 930.25 = 8631.703886
d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2)
= √2267283.063 + 812.25 = 1506.019692
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386
Besar Rasio 6
WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔
1520.491262
=11.35397769

Kesimpulan
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
Pada perhitungan ke 4, 5 , 6 memiliki nilai batas yang sama dan nilai rasio yang sama maka perhitungan di
hentikan. Sebab nilai batas telah di temukan, yaitu :
m1 = rata-rata(mA) =C1 = (10277.9 , 79)
m2 = rata-rata(mB ,mD) =C2 = (3152 , 77)
m3 = rata-rata(mC ,mE) =C3 = (1646.25 ,48.5)
sehingga nilai batas tersebut di jadikkan sebagaiacuhan data untuk menentukan pengelompokkan data setiap
claster.

Laporan datamining CLUSTERING

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Laporan datamining CLUSTERING

Similar to Laporan datamining CLUSTERING (20)

Laporan datamining CLUSTERING