SlideShare a Scribd company logo
1 of 20
LAPORAN TUGAS DATA MINING
PENERAPAN K-MEANS ALGORITM CLUSTERING
PADA DATA PRODUKSI GARAM SETIAP PROVINSI DI INDONESIA
Disusun Oleh :
Yogi Anggara [1500018073]
Rynto E. S. [1500018074]
Ridho Febrian [1500018083]
Mayang Notri.S [1500018102]
Vita Silvia [1500018114]
Indriyanto A.P [1500018118]
Prodi Teknik Informatika
Fakultas Teknologi Industri
Universitas Ahmad Dahlan
Yogyakarta
2017
Latar Belakang
garam adalah salah satu bahan poko dalam masakkan. Indonesia salah satu produksen garam yang masih terbatas
produksinya di karenakkan asih menggunakkan cara tradisional dalam produksinya, yaitu dengan cara penyinaran
sinar matahari. Produksi garam di Indonesia ini hanya mampu memenuhi kebutuhan garam dalam negeri, in juga
salah satu dampak dari masih tradisionalnya cara produksi garam. Bahkan pada waktu-waktu sebelumnya di
Indonesia di katakkan sedang krisis garam, sehingga pemerintah meimpor garam dari Australia untuk memenuhi
kebutuhan garam di Indonesia. Dengan adanya keputusan tersebut berdampak pada harga garam local yang bisa
merugikan petani garam di Indonesia.
Dengan adanya data set ini kami bisa menghitung dan memperkirakkan dengan luas lahan, tingkat produktifitas
dapat mengetahui seberapa banyak garam yang bisa di produksi. Sehingga data set ini bisa jadi acuhan
pemerintahan untuk mengembangkan system pembuatan garam dan impor garam luar negeri yang bisa membebani
ptani garam.
Tujuan
Dengan menghitungan data set “Data Produksi Garam Setiap Provinsi Di Indonesia Menggunakkan K-Means
Algoritm Clustering” :
1. Untuk mengetahui tingkat produktivitas pembuatan garam di setiap daerah
2. Untuk mengetahui tingkat produksi garam di setiap daerah
3. Untuk medapatkkan data yang telah dikelompokkan sehingga dapat menghasilkan informasi
4. Menjadikan acuhan pemerintah untuk menyikapi krisis garam di indonesia
Dasar teori
K-Means
K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan
tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan
sistem partisi. Metode k-means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana
data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik
yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, metode ini berusaha untuk
meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada
di cluster lainnya.
CLustering
Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clusteringadalah sebuah
proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam
satu cluster memiliki tingkat kemiripan yang maksimum dan data antarcluster memiliki kemiripan yang minimum.
Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut
dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda
dengan cluster yang lain. Partisi tidak dilakukan secara manual melainkan dengan suatu algoritma clustering. Oleh
karena itu, clustering sangat berguna dan bisa menemukan group atau kelompokyang tidak dikenal dalam
data. Clustering banyak digunakan dalam berbagai aplikasi seperti misalnya pada business inteligence, pengenalan
pola citra, web search, bidang ilmu biologi, dan untuk keamanan (security). Di dalam business
inteligence, clusteringbisa mengatur banyak customer ke dalam banyaknya kelompok. Contohnya
mengelompokan customer ke dalam beberapa cluster dengan kesamaan karakteristik yang kuat. Clustering juga
dikenal sebagai data segmentasi karena clustering mempartisi banyak data set ke dalam banyak group berdasarkan
kesamaannya. Selain itu clustering juga bisa sebagai outlier detection.
Data Produksi Garam
Terdapat 340 data dengan 8 atribut :
1. Id : varchar 5 auto increatmen
2. Kabupaten : varchar 25
3. Nama provinsi : varchar 25
4. Param garam : varchar 15
5. Tahun : date
6. Luas lahan : int 15
7. Produksi : int 15
8. Produktivitas : int 15
Data produksi garam setelah di filter
Data yang telah di clastering, yang awal 415 menjadi 340 data yang telah di filter, dengan 8 atribut : id,
kabupaten, nama provinsi, param garam, tahun, luas lahan produksi, produktivitas
Uji Coba Secara Manual
Gambar: contoh data dari data produksi garam di ambil 5 sempel data untuk di hitung
 Langkah pertama algoritma K-means Menanyakan kepada pemakai algoritma k-means,
catatan-catatan yang ada akan dibuat menjadi berapa kelompok. Jika diambil
pengkelompokannya dengan jumlah tiga, nilai k-nya adalah 3 atau k=3
Kabupaten Produksi Produktivitas
BIMA 10277.9 79
SUMBAWA 2719.08 78
KOTA BIMA 1972.5 75
LOMBOK TIMUR 3584.92 76
LOMBOK BARAT 1320 22
Gambar : table yang telah di kelompokkan
 Langkah Kedua algoritma K-Means
Pada langkah kedua algoritma ini, kita akan secara sembarang memilih k=3 buah titik pusat
(dari 5 data yang ada) sebagai pusat-pusat kelompok awal, misalnya:
a. Catatan B sebagai pusat kelompok 1 sehingga m1 = (2719.08 , 78),
b. Catatan C sebagai pusat kelompok 2 sehingga m2 = (1972.50 , 75),
c. Catatan E sebagai pusat kelompok 3 sehingga m3 = (1320 , 22),
Kabupaten Produksi Produktivitas
A 10277.9 79
B 2719.08 78
C 1972.5 75
D 3584.92 76
E 1320 22
Gambar: yang telah di symbol data kabupaten, untuk mempermudah perhitungan
Catetan :
A : Bima
B : Sumbawa
C : Kota Bima
D : Lombok Timur
E : Lombok Barat
ID Kabupaten NamaProvinsi ParamGara
m
Tahu
n
LuasLaha
n
Produksi Produktivita
s
26 BIMA Nusa Tenggara
Barat
PUGAR 2011 130.1 10277.9 79
27 SUMBAWA Nusa Tenggara
Barat
PUGAR 2011 34.86 2719.08 78
28 KOTA
BIMA
Nusa Tenggara
Barat
PUGAR 2011 26.3 1972.5 75
29 LOMBOK
TIMUR
Nusa Tenggara
Barat
PUGAR 2011 47.17 3584.92 76
30 LOMBOK
BARAT
Nusa Tenggara
Barat
PUGAR 2011 60 1320 22
M1
M2
M3
Perhitungan rasio ke-1
 Langkah Ketiga algoritma K-Means kelompok
Pada langkah ini setiap data akan ditentukan pusat kelompok terdekatnya. Data tersebut akan ditetapkan
sebagai anggota kelompok yang terdekat pusat kelompoknya menggunakan rumus sebagai berikut:
Kabupaten Produksi Produktivitas
A 10277.9 79
B 2719.08 78
C 1972.5 75
D 3584.92 76
E 1320 22
Contoh penghitungan:
a. A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (2719.08 , 78)
A1 = d (x,y) =√((10277.9 − 2719.08)2) + ((79 − 78)2) = √7558.822 + 12 = √57135760.79 = 7558.820066
b. A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (1972.50 , 75)
A2 = d (x,y) =√((10277.9 − 1972.5)2) + ((79 − 75)2) = √8305,42 + 42 = √68979685,16 = 8305.400963
a. A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22)
A3 = d (x,y) =√((10277.9 − 1320)2) + ((79 − 22)2) = √8957,92 + 572 = √80247221,41 = 8958.081346
Untuk penghitungan B1 sampai E3 dilakukan langkah yang sama seperti di atas. Dan Menghasilkan seperti yang
tampak dalam table dibawah ini:
Data
Kabupaten
Jarak Ke Pusat
M1 (2719.08 , 78)
Jarak Ke Pusat
M2(1972.50 , 75)
Jarak Ke Pusat
M3(1320 , 22)
A(10277.9 , 79) A1 7558.820066 A2 8305.400963 A3 8958.081346
B(2719.08 , 78) B1 746.5860275 B2 1400.200288 B3 2720.198531
C(1972.5 , 75) C1 654.6489517 C2 1973.925341 C3 1973.925341
D(3584.92 , 76) D1 3585.725506 D2 3585.725506 D3 3585.725506
E(1320, 22) E1 1320.183321 E2 1320.183321 E3 1320.183321
Gambar : table yang jarak pusat setiap data
Untuk setiap data akan ditentukan pusat kelompok terdekatnya dengan cara membandingkan nilai jarak setiap
data dengan pusat M, dengan mencari nilai paling terkecil. Sehingga di dapatkan table dibawah ini :
Jarak ke pusat
m1 (2719.08 , 78)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat
ke kelompok
A1 7558.820066 A2 8305.400963 A3 8958.081346 m1
B1 0 B2 746.5860275 B3 1400.200288 m1
C1 746.5860275 C2 0 C3 650.3439475 m2
D1 865.8423099 D2 1612.42031 D3 2265.56364 m1
E1 1400.200288 E2 654.6489517 E3 0 m3
Dari table 2 didapatkan keanggotaan sebagai berikut:
a. Kelompok 1 (atau m1) ={A, B, D}
b. Kelompok 2 (atau m2) = {C}, dan
c. Kelompok 3 (atau m3) = {E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan Within
Cluster Variation (WCV), seperti berikut:
a. Rumus untuk menghitung Between Cluster Variation (BCV) sebagai berikut:
BCV = ∑ d (mi ,mj)
𝑛
𝑖,𝑗=0
Dimana i dan j adalah pusat kelompok. Karena pusat kelompok ada 3 dan d(mi,mj)
Menyatakan jarak Euclidean dari mi ke mj, Maka penyelesaian BCV menjadi sebagai berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (2719.08 , 78), m2(1972.50 , 75), dan m3(1320 , 22), sehingga :
d (m1, m2) = √((2719,08 − 1972,75)2) + ((78 − 75)2) = √(746,33)2
+ (3)2
= √557390.6964 = 746.5860275
d (m1, m3) = √((2719.08 − 1320)2) + ((78 − 22)2) = √((1399.08)2) + ((56)2) = √1960560.846 =1400.200288
d (m2, m3) = √((1972.50 − 1320)2) + ((75 − 22)2) = √((652.5)2) + ((53)2) = √428565.25 = 654.6489517
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 746.5860275 + 1400.200288 + 654.6489517 = 2801.435267
b. Rumus untuk menghitung Within Cluster Variation (WCV) sebagai berikut:
𝑊𝐶𝑉 = ∑(𝐽𝑎𝑟𝑎𝑘 𝑡𝑒𝑟𝑘𝑒𝑐𝑖𝑙 𝑠𝑒𝑡𝑖𝑎𝑝 𝑛𝑎𝑠𝑎𝑏𝑎ℎ 𝑘𝑒 𝑖)2
𝑛
𝑖=1
Jarak ke pusat
m1 (2719.08 , 78)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat
ke kelompok
A1 7558.820066 A2 8305.400963 A3 8958.081346 m1
B1 0 B2 746.5860275 B3 1400.200288 m1
C1 746.5860275 C2 0 C3 650.3439475 m2
D1 865.8423099 D2 1612.42031 D3 2265.56364 m1
E1 1400.200288 E2 654.6489517 E3 0 m3
Dari table di atas didapatkan
Jarak terkecil A = 7558.820066
Jarak terkecil B = 0
Jarak terkecil C = 0
Jarak terkecil D = 865.8423099
Jarak terkecil E = 0
Sehingga didapatkan hasil sebagaiberikut :
WCV = 7558.820066 + 0 + 0 + 865.8423099 + 0 = 8424.662376
Sehingga besarnya rasio adalah
𝑩𝑪𝑽
𝑾𝑪𝑽
=
𝟐𝟖𝟎𝟏.𝟒𝟑𝟓𝟐𝟔𝟕
𝟖𝟒𝟐𝟒.𝟔𝟔𝟐𝟑𝟕𝟔
= 0.332527897
Mengingat langkah sebelumnya belum mendapatkan rasio ini, maka perbandingan rasio belum dapat
dilakukan dan algoritma dilanjutkan ke langkah ke empat.
Perhitungan Rasio Ke-2
 Langkah keempat Algoritma K-means (iterasi ke1)
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
Jarak ke pusat
m1 (2719.08 , 78)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat
ke kelompok
A1 7558.820066 A2 8305.400963 A3 8958.081346 m1
B1 0 B2 746.5860275 B3 1400.200288 m1
C1 746.5860275 C2 0 C3 650.3439475 m2
D1 865.8423099 D2 1612.42031 D3 2265.56364 m1
E1 1400.200288 E2 654.6489517 E3 0 m3
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
a) m1 = rata-rata(mA,mB, mD) =
(10277.9 ,79)+(2719.08 ,78)+(3584.92 ,76)
3
= (5527.3 , 77.66666667)
b) m2 = rata-rata(mC) = (1972.5 , 75)
c) m3 = rata-rata(mE) = (1320, 22)
selanjutnya, kita akan kembali ke langkah 3 untuk mencari pembadingan
 Langkah ketiga Algoritma K-Means (iterasi-2)
A. Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara
seperti langkah 3 diatas)
.
Contoh penghitungan:
a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 5527.3 , 77.66666667)
A1 = d (x,y) =√((10277.9 − 5527.3)2) + ((79 − 77.66666667)2) = √4750.62
+ 1.333333332
= √22568202.14 = 4750.600187
b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (1972.5 , 75)
A2 = d (x,y) =√((10277.9 − 1972.5)2) + ((79 − 75)2) = √8305,42
+ 42
= √68979685,16 = 8305.400963
c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22)
A3 = d (x,y) =√((10277.9 − 1320)2) + ((79 − 22)2) = √8957,92
+ 572
= √80247221,41 = 8958.081346
Jarak ke pusat
m1 (5527.3 , 77.66666667)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 4750.600187 A2 8305.400963 A3 8958.081346 m1
B1 2808.22002 B2 746.5860275 B3 1400.200288 m2
C1 3554.801 C2 0 C3 650.3439475 m2
D1 1942.380715 D2 1612.42031 D3 2265.56364 m2
E1 4207.668246 E2 654.6489517 E3 0 m3
Gambar : table jarak terdekat yang baru,
Dari table diatas didapatkan keanggotaan sebagai berikut:
a. Kelompok 1 (atau m1) ={A}
b. Kelompok 2 (atau m2) = {B, C, D}, dan
c. Kelompok 3 (atau m3) = {E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster
Variation (WCV), seperti berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (5527.3 , 77.66666667), m2(1972.50 , 75), dan m3(1320 , 22), sehingga :
d (m1, m2) = √(5527.3 − 1972.50)2 + (77.66666667 − 75)2 = √((12636603.04)) + ((7.111111111))
= √12636610.15 = 3554.801
d (m1, m3) =√((5527.3 − 1320)2) + ((77.66666667 − 22)2) = √((17701373.29)) + ((3098.777778))
= √17704472.07 = 4207.668246
d (m2, m3)=√((1972.5 − 1320)2) + ((75 − 22)2) = √(652.5)2 + (53)2 = √425756.25 + 2809
= √428565.25 = 654.6489517
Jarak ke pusat
m1 (5527.3 , 77.66666667)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 4750.600187 A2 8305.400963 A3 8958.081346 m1
B1 2808.22002 B2 746.5860275 B3 1400.200288 m2
C1 3554.801 C2 0 C3 650.3439475 m2
D1 1942.380715 D2 1612.42031 D3 2265.56364 m2
E1 4207.668246 E2 654.6489517 E3 0 m3
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 3554.801 + 4207.668246 + 654.6489517 = 8417.118198
B. Besar Rasio 2
WCV = 4750.600187 + 746.5860275 + 0 + 1612.42031 + 0 = 7109.606525
Sehingga besarnya rasio adalah
𝐵𝐶𝑉
𝑊𝐶𝑉
=
8417.118198
7109.606525
= 1.183907741
Perhitungan Rasio Ke-3
 Langkah keempat Algoritma K-means (iterasi ke1)
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
m1 = rata-rata(mA) = (10277.9, 79)
m2 = rata-rata(, mB, mC , mD) =
(2719.08 ,78)+ (1972.5 ,75)+(3584 .92 ,76)
3
= (2758.833333 , 76.33333333)
m3 = rata-rata(mE) = (1320, 22)
 Langkah ketiga Algoritma K-Means (iterasi-2)
Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara
seperti langkah 3 diatas)
.
Contoh penghitungan:
a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (2758.833333 , 76.33333333)
A2 = d (x,y)=√((10277.9 − 2758.833333)2) + ((79 − 76.33333333)2) = √56536363.54+ 7.111111111 = 56536370.65
c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22)
A3 = d (x,y)=√((10277.9 − 1320)2) + ((79 − 22)2) = √8957.9 − 57 = √80247221.41 = 8958.081346
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
Gambar : table jarak terdekat yang baru,
Jarak ke pusat
m1 (5527.3 , 77.66666667)
jarak ke pusat
m2(1972.50 , 75)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 4750.600187 A2 8305.400963 A3 8958.081346 m1
B1 2808.22002 B2 746.5860275 B3 1400.200288 m2
C1 3554.801 C2 0 C3 650.3439475 m2
D1 1942.380715 D2 1612.42031 D3 2265.56364 m2
E1 4207.668246 E2 654.6489517 E3 0 m3
Dari table diatas didapatkan keanggotaan sebagai berikut:
a) Kelompok 1 (atau m1) ={A}
b) Kelompok 2 (atau m2) = {B, D}, dan
c) Kelompok 3 (atau m3) = { C, E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within
Cluster Variation (WCV), seperti berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (10277.9, 79), m2(2758.833333 ,76.33333333) dan m3(1320 , 22), sehingga :
d (m1, m2) =√((10277.9 − 2758.833333)2) + (79 − 76.33333333)2)
= √56536363.54 + 7.111111111 = 7519.06714
d (m1, m3) =√((10277.9 − 1320)2) − ((79 − 22)2)
= √80243972.41 + 3249 = 8958.081346
d (m2, m3) =√((2758.833333 − 1320)2) + ((76.33333333 − 22)2)
= √2070241.361 + 2952.111111 = 1439.858838
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7519.06714 + 8958.081346 + 1439.858838 = 17917.00732
C. Besar Rasio 3
WCV = 0 + 39.78825567+ 654.6489517 + 826.0867339+ 0 = 1520.523941
Sehingga besarnya rasio adalah
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟗𝟏𝟕.𝟎𝟎𝟕𝟑𝟐
7109.606525
= 11.78344309
Perhitungan Rasio Ke-4
 Langkah keempat Algoritma K-means (iterasi ke1)
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
m1 = rata-rata(mA) = (10277.9, 79)
m2 = rata-rata(mB ,mD) =
(2719.08 ,78)+ (3584.92 ,76)
2
= (3152 , 77)
m3 = rata-rata(mC ,mE) =
(1972.5 ,75)+(1320,22)
2
= (1646.25 , 48.5)
 Langkah ketiga Algoritma K-Means (iterasi-2)
Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara
seperti langkah 3 diatas)
.
Contoh penghitungan:
a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77)
A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281
c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5)
A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke kelompok
A1 0 A2 7125.900281 A3 8631.703886 m1
B1 7558.820066 B2 432.9211549 B3 1073.23551 m2
C1 8305.400963 C2 1179.501696 C3 327.3244759 m3
D1 6692.980672 D2 432.9211549 D3 1938.865034 m2
E1 8958.081346 E2 1832.825414 E3 327.3244759 m3
Gambar : table jarak terdekat yang baru,
Dari table diatas didapatkan keanggotaan sebagai berikut:
d) Kelompok 1 (atau m1) ={A}
e) Kelompok 2 (atau m2) = {B, D}, dan
f) Kelompok 3 (atau m3) = { C, E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within
Cluster Variation (WCV), seperti berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga :
d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2)
= √50778450.81 + 4 = 7125.900281
d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2)
= √74505381.72 + 930.25 = 8631.703886
d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2)
= √2267283.063 + 812.25 = 1506.019692
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386
Besar Rasio 4
WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262
Sehingga besarnya rasio adalah
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔
1520.491262
= 11.35397769
Perhitungan Rasio Ke-5
 Langkah keempat Algoritma K-means (iterasi ke1)
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
m1 = rata-rata(mA) = (10277.9, 79)
m2 = rata-rata(mB ,mD) =
(2719.08 ,78)+ (3584.92 ,76)
2
= (3152 , 77)
m3 = rata-rata(mC ,mE) =
(1972.5 ,75)+(1320,22)
2
= (1646.25 , 48.5)
 Langkah ketiga Algoritma K-Means (iterasi-2)
Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara
seperti langkah 3 diatas)
.
Contoh penghitungan:
d) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
e) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77)
A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281
f) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5)
A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke kelompok
A1 0 A2 7125.900281 A3 8631.703886 m1
B1 7558.820066 B2 432.9211549 B3 1073.23551 m2
C1 8305.400963 C2 1179.501696 C3 327.3244759 m3
D1 6692.980672 D2 432.9211549 D3 1938.865034 m2
E1 8958.081346 E2 1832.825414 E3 327.3244759 m3
Gambar : table jarak terdekat yang baru,
Dari table diatas didapatkan keanggotaan sebagai berikut:
g) Kelompok 1 (atau m1) ={A}
h) Kelompok 2 (atau m2) = {B, D}, dan
i) Kelompok 3 (atau m3) = { C, E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within
Cluster Variation (WCV), seperti berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga :
d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2)
= √50778450.81 + 4 = 7125.900281
d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2)
= √74505381.72 + 930.25 = 8631.703886
d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2)
= √2267283.063 + 812.25 = 1506.019692
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386
Besar Rasio 5
WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262
Sehingga besarnya rasio adalah
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔
1520.491262
=11.35397769
Perhitungan Rasio Ke-6
 Langkah keempat Algoritma K-means (iterasi ke1)
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
Jarak ke pusat
m1(10277.9, 79)
jarak ke pusat
m2(2758.833333 , 76.33333333)
jarak ke pusat
m3(1320 , 22)
Jarak terdekat ke
kelompok
A1 0 A2 7519.06714 A3 8958.081346 m1
B1 7558.820066 B2 39.78825567 B3 1400.200288 m2
C1 8305.400963 C2 786.3344638 C3 654.6489517 m3
D1 6692.980672 D2 826.0867339 D3 2265.56364 m2
E1 8958.081346 E2 1439.858838 E3 0 m3
Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut:
m1 = rata-rata(mA) = (10277.9, 79)
m2 = rata-rata(mB ,mD) =
(2719.08 ,78)+ (3584.92 ,76)
2
= (3152 , 77)
m3 = rata-rata(mC ,mE) =
(1972.5 ,75)+(1320,22)
2
= (1646.25 , 48.5)
 Langkah ketiga Algoritma K-Means (iterasi-2)
Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut
akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara
seperti langkah 3 diatas)
.
Contoh penghitungan:
g) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79)
A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0
h) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77)
A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281
i) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5)
A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke kelompok
A1 0 A2 7125.900281 A3 8631.703886 m1
B1 7558.820066 B2 432.9211549 B3 1073.23551 m2
C1 8305.400963 C2 1179.501696 C3 327.3244759 m3
D1 6692.980672 D2 432.9211549 D3 1938.865034 m2
E1 8958.081346 E2 1832.825414 E3 327.3244759 m3
Gambar : table jarak terdekat yang baru,
Dari table diatas didapatkan keanggotaan sebagai berikut:
j) Kelompok 1 (atau m1) ={A}
k) Kelompok 2 (atau m2) = {B, D}, dan
l) Kelompok 3 (atau m3) = { C, E}.
Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within
Cluster Variation (WCV), seperti berikut:
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga :
d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2)
= √50778450.81 + 4 = 7125.900281
d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2)
= √74505381.72 + 930.25 = 8631.703886
d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2)
= √2267283.063 + 812.25 = 1506.019692
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
Sehingga didapatkan hasil sebagaiberikut :
BCV= d(m1,m2) + d(m1,m3) + d(m2,m3)
BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386
Besar Rasio 6
WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262
Sehingga besarnya rasio adalah
𝐵𝐶𝑉
𝑊𝐶𝑉
=
𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔
1520.491262
=11.35397769
Kesimpulan
Jarak ke pusat
m1(10277.9 , 79)
jarak ke pusat
m2(3152 , 77)
jarak ke pusat
m3(1646.25 , 48.5)
Jarak terdekat ke
kelompok
A1
0
A2
7125.900281
A3
8631.703886 m1
B1
7558.820066
B2
432.9211549
B3
1073.23551 m2
C1
8305.400963
C2
1179.501696
C3
327.3244759 m3
D1
6692.980672
D2
432.9211549
D3
1938.865034 m2
E1
8958.081346
E2
1832.825414
E3
327.3244759 m3
Pada perhitungan ke 4, 5 , 6 memiliki nilai batas yang sama dan nilai rasio yang sama maka perhitungan di
hentikan. Sebab nilai batas telah di temukan, yaitu :
m1 = rata-rata(mA) =C1 = (10277.9 , 79)
m2 = rata-rata(mB ,mD) =C2 = (3152 , 77)
m3 = rata-rata(mC ,mE) =C3 = (1646.25 ,48.5)
sehingga nilai batas tersebut di jadikkan sebagaiacuhan data untuk menentukan pengelompokkan data setiap
claster.

More Related Content

What's hot

Interaksi manusia dan komputer
Interaksi manusia dan komputerInteraksi manusia dan komputer
Interaksi manusia dan komputerMiftahul Khair N
 
Evolusi perkembangan rekayasa perangkat lunak
Evolusi perkembangan rekayasa perangkat lunakEvolusi perkembangan rekayasa perangkat lunak
Evolusi perkembangan rekayasa perangkat lunakFebry San
 
Langkah - Langkah Perencanaan Sistem
Langkah - Langkah Perencanaan SistemLangkah - Langkah Perencanaan Sistem
Langkah - Langkah Perencanaan SistemRetrina Deskara
 
Proposal Proyek Aplikasi Web Percetakan
Proposal Proyek Aplikasi Web PercetakanProposal Proyek Aplikasi Web Percetakan
Proposal Proyek Aplikasi Web Percetakansubhan
 
Analisa dan Perancangan Sistem Informasi
Analisa dan Perancangan Sistem InformasiAnalisa dan Perancangan Sistem Informasi
Analisa dan Perancangan Sistem InformasiFarichah Riha
 
Analisis Algoritma - Langkah Desain Algoritma
Analisis Algoritma - Langkah Desain AlgoritmaAnalisis Algoritma - Langkah Desain Algoritma
Analisis Algoritma - Langkah Desain AlgoritmaAdam Mukharil Bachtiar
 
Cara menggambar graf sederhana matematika diskrit
Cara menggambar graf sederhana matematika diskritCara menggambar graf sederhana matematika diskrit
Cara menggambar graf sederhana matematika diskritOka Ambalie
 
Laporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhanaLaporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhanagita Ta
 
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQLLaporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQLShofura Kamal
 
Rpl 10-perancangan user interface
Rpl 10-perancangan user interfaceRpl 10-perancangan user interface
Rpl 10-perancangan user interfacef' yagami
 
Aljabar boolean(1)
Aljabar boolean(1)Aljabar boolean(1)
Aljabar boolean(1)tafrikan
 
Pertemuan 7 camera
Pertemuan 7 cameraPertemuan 7 camera
Pertemuan 7 cameraheriakj
 
Konsep Dasar Grafika
Konsep Dasar GrafikaKonsep Dasar Grafika
Konsep Dasar GrafikaAgylRahmadi
 
Kisi kisi UTS Sistem Pakar
Kisi kisi UTS Sistem PakarKisi kisi UTS Sistem Pakar
Kisi kisi UTS Sistem PakarDwi Mardianti
 
Analisis regresi linier sederhana dengan menggunakan spss
Analisis regresi linier sederhana dengan menggunakan spssAnalisis regresi linier sederhana dengan menggunakan spss
Analisis regresi linier sederhana dengan menggunakan spssojan88
 

What's hot (20)

Interaksi manusia dan komputer
Interaksi manusia dan komputerInteraksi manusia dan komputer
Interaksi manusia dan komputer
 
[PBO] Pertemuan 6 - Interface
[PBO] Pertemuan 6 - Interface[PBO] Pertemuan 6 - Interface
[PBO] Pertemuan 6 - Interface
 
Evolusi perkembangan rekayasa perangkat lunak
Evolusi perkembangan rekayasa perangkat lunakEvolusi perkembangan rekayasa perangkat lunak
Evolusi perkembangan rekayasa perangkat lunak
 
Langkah - Langkah Perencanaan Sistem
Langkah - Langkah Perencanaan SistemLangkah - Langkah Perencanaan Sistem
Langkah - Langkah Perencanaan Sistem
 
Proposal Proyek Aplikasi Web Percetakan
Proposal Proyek Aplikasi Web PercetakanProposal Proyek Aplikasi Web Percetakan
Proposal Proyek Aplikasi Web Percetakan
 
Bab 4 aljabar boolean
Bab 4 aljabar booleanBab 4 aljabar boolean
Bab 4 aljabar boolean
 
Analisa dan Perancangan Sistem Informasi
Analisa dan Perancangan Sistem InformasiAnalisa dan Perancangan Sistem Informasi
Analisa dan Perancangan Sistem Informasi
 
Analisis Algoritma - Langkah Desain Algoritma
Analisis Algoritma - Langkah Desain AlgoritmaAnalisis Algoritma - Langkah Desain Algoritma
Analisis Algoritma - Langkah Desain Algoritma
 
UTS JST 2014/2015
UTS JST 2014/2015UTS JST 2014/2015
UTS JST 2014/2015
 
Kuliah SPK : Metode TOPSIS
Kuliah SPK : Metode TOPSISKuliah SPK : Metode TOPSIS
Kuliah SPK : Metode TOPSIS
 
Cara menggambar graf sederhana matematika diskrit
Cara menggambar graf sederhana matematika diskritCara menggambar graf sederhana matematika diskrit
Cara menggambar graf sederhana matematika diskrit
 
Array dan Contoh
Array dan ContohArray dan Contoh
Array dan Contoh
 
Laporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhanaLaporan Pratikum analisis regresi linier sederhana
Laporan Pratikum analisis regresi linier sederhana
 
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQLLaporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
 
Rpl 10-perancangan user interface
Rpl 10-perancangan user interfaceRpl 10-perancangan user interface
Rpl 10-perancangan user interface
 
Aljabar boolean(1)
Aljabar boolean(1)Aljabar boolean(1)
Aljabar boolean(1)
 
Pertemuan 7 camera
Pertemuan 7 cameraPertemuan 7 camera
Pertemuan 7 camera
 
Konsep Dasar Grafika
Konsep Dasar GrafikaKonsep Dasar Grafika
Konsep Dasar Grafika
 
Kisi kisi UTS Sistem Pakar
Kisi kisi UTS Sistem PakarKisi kisi UTS Sistem Pakar
Kisi kisi UTS Sistem Pakar
 
Analisis regresi linier sederhana dengan menggunakan spss
Analisis regresi linier sederhana dengan menggunakan spssAnalisis regresi linier sederhana dengan menggunakan spss
Analisis regresi linier sederhana dengan menggunakan spss
 

Similar to Laporan datamining CLUSTERING

Pengambilan Citra Desa Gis .. Tugas 2
Pengambilan Citra Desa Gis .. Tugas 2Pengambilan Citra Desa Gis .. Tugas 2
Pengambilan Citra Desa Gis .. Tugas 2Ivul Varel Fu
 
Sistem Kendali Suhu Ruangan dengan Metode PID Menggunakan LM35 dan Triac Be...
Sistem Kendali  Suhu Ruangan dengan Metode PID  Menggunakan LM35 dan Triac Be...Sistem Kendali  Suhu Ruangan dengan Metode PID  Menggunakan LM35 dan Triac Be...
Sistem Kendali Suhu Ruangan dengan Metode PID Menggunakan LM35 dan Triac Be...RizkiMoci
 
B300 - WATER LEVEL CONTROLLER WITH PID
B300 - WATER LEVEL CONTROLLER WITH PIDB300 - WATER LEVEL CONTROLLER WITH PID
B300 - WATER LEVEL CONTROLLER WITH PIDRangga Vega
 
3.8 perhitungan debit rencana
3.8 perhitungan debit rencana3.8 perhitungan debit rencana
3.8 perhitungan debit rencanavieta_ressang
 
SOF Jaring Kontrol Geodesi
SOF Jaring Kontrol GeodesiSOF Jaring Kontrol Geodesi
SOF Jaring Kontrol GeodesiAvrilina Hadi
 
Sidang Skripsi Ary.pptx
Sidang Skripsi Ary.pptxSidang Skripsi Ary.pptx
Sidang Skripsi Ary.pptxBellaTangian1
 
3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis
3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis
3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axisRegiAdriana1
 
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdfKimnur1
 
Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)
Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)
Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)Siti Julaiha
 
Pengolahan landsat arcgis
Pengolahan landsat  arcgisPengolahan landsat  arcgis
Pengolahan landsat arcgisSetia Kasih
 
Bab 1 fisika sistem satuan
Bab 1 fisika sistem satuanBab 1 fisika sistem satuan
Bab 1 fisika sistem satuanAndy Muson
 
Prediksi Tingkat Pengangguran Kota Makassar 2011-2015
Prediksi Tingkat Pengangguran Kota Makassar 2011-2015Prediksi Tingkat Pengangguran Kota Makassar 2011-2015
Prediksi Tingkat Pengangguran Kota Makassar 2011-2015bryanartika
 

Similar to Laporan datamining CLUSTERING (20)

Besaran dan Satuan.pptx
Besaran dan Satuan.pptxBesaran dan Satuan.pptx
Besaran dan Satuan.pptx
 
Besaran dan Satuan.pptx
Besaran dan Satuan.pptxBesaran dan Satuan.pptx
Besaran dan Satuan.pptx
 
Pengambilan Citra Desa Gis .. Tugas 2
Pengambilan Citra Desa Gis .. Tugas 2Pengambilan Citra Desa Gis .. Tugas 2
Pengambilan Citra Desa Gis .. Tugas 2
 
Tugas 1 PSDA
Tugas 1 PSDATugas 1 PSDA
Tugas 1 PSDA
 
adoc.pub_no-title.pdf
adoc.pub_no-title.pdfadoc.pub_no-title.pdf
adoc.pub_no-title.pdf
 
Sistem Kendali Suhu Ruangan dengan Metode PID Menggunakan LM35 dan Triac Be...
Sistem Kendali  Suhu Ruangan dengan Metode PID  Menggunakan LM35 dan Triac Be...Sistem Kendali  Suhu Ruangan dengan Metode PID  Menggunakan LM35 dan Triac Be...
Sistem Kendali Suhu Ruangan dengan Metode PID Menggunakan LM35 dan Triac Be...
 
B300 - WATER LEVEL CONTROLLER WITH PID
B300 - WATER LEVEL CONTROLLER WITH PIDB300 - WATER LEVEL CONTROLLER WITH PID
B300 - WATER LEVEL CONTROLLER WITH PID
 
03311540000005 pja tugas2
03311540000005 pja tugas203311540000005 pja tugas2
03311540000005 pja tugas2
 
3.8 perhitungan debit rencana
3.8 perhitungan debit rencana3.8 perhitungan debit rencana
3.8 perhitungan debit rencana
 
02 penyajian data 13
02 penyajian data 1302 penyajian data 13
02 penyajian data 13
 
SOF Jaring Kontrol Geodesi
SOF Jaring Kontrol GeodesiSOF Jaring Kontrol Geodesi
SOF Jaring Kontrol Geodesi
 
Sidang Skripsi Ary.pptx
Sidang Skripsi Ary.pptxSidang Skripsi Ary.pptx
Sidang Skripsi Ary.pptx
 
3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis
3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis
3 c skd-b500_regi adriana saputra_stabilizer kamera 2-axis
 
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdf
 
Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)
Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)
Aplikasi jaringan syaraf tiruan dengan program matlab (bp, ga, dan som)
 
A176346 TugasanPisahRagaman.pptx
A176346 TugasanPisahRagaman.pptxA176346 TugasanPisahRagaman.pptx
A176346 TugasanPisahRagaman.pptx
 
Pengolahan landsat arcgis
Pengolahan landsat  arcgisPengolahan landsat  arcgis
Pengolahan landsat arcgis
 
Bab 1 fisika sistem satuan
Bab 1 fisika sistem satuanBab 1 fisika sistem satuan
Bab 1 fisika sistem satuan
 
Jurnal cathrine0806083206
Jurnal cathrine0806083206Jurnal cathrine0806083206
Jurnal cathrine0806083206
 
Prediksi Tingkat Pengangguran Kota Makassar 2011-2015
Prediksi Tingkat Pengangguran Kota Makassar 2011-2015Prediksi Tingkat Pengangguran Kota Makassar 2011-2015
Prediksi Tingkat Pengangguran Kota Makassar 2011-2015
 

Laporan datamining CLUSTERING

  • 1. LAPORAN TUGAS DATA MINING PENERAPAN K-MEANS ALGORITM CLUSTERING PADA DATA PRODUKSI GARAM SETIAP PROVINSI DI INDONESIA Disusun Oleh : Yogi Anggara [1500018073] Rynto E. S. [1500018074] Ridho Febrian [1500018083] Mayang Notri.S [1500018102] Vita Silvia [1500018114] Indriyanto A.P [1500018118] Prodi Teknik Informatika Fakultas Teknologi Industri Universitas Ahmad Dahlan Yogyakarta 2017
  • 2. Latar Belakang garam adalah salah satu bahan poko dalam masakkan. Indonesia salah satu produksen garam yang masih terbatas produksinya di karenakkan asih menggunakkan cara tradisional dalam produksinya, yaitu dengan cara penyinaran sinar matahari. Produksi garam di Indonesia ini hanya mampu memenuhi kebutuhan garam dalam negeri, in juga salah satu dampak dari masih tradisionalnya cara produksi garam. Bahkan pada waktu-waktu sebelumnya di Indonesia di katakkan sedang krisis garam, sehingga pemerintah meimpor garam dari Australia untuk memenuhi kebutuhan garam di Indonesia. Dengan adanya keputusan tersebut berdampak pada harga garam local yang bisa merugikan petani garam di Indonesia. Dengan adanya data set ini kami bisa menghitung dan memperkirakkan dengan luas lahan, tingkat produktifitas dapat mengetahui seberapa banyak garam yang bisa di produksi. Sehingga data set ini bisa jadi acuhan pemerintahan untuk mengembangkan system pembuatan garam dan impor garam luar negeri yang bisa membebani ptani garam. Tujuan Dengan menghitungan data set “Data Produksi Garam Setiap Provinsi Di Indonesia Menggunakkan K-Means Algoritm Clustering” : 1. Untuk mengetahui tingkat produktivitas pembuatan garam di setiap daerah 2. Untuk mengetahui tingkat produksi garam di setiap daerah 3. Untuk medapatkkan data yang telah dikelompokkan sehingga dapat menghasilkan informasi 4. Menjadikan acuhan pemerintah untuk menyikapi krisis garam di indonesia
  • 3. Dasar teori K-Means K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi. Metode k-means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya. CLustering Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clusteringadalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antarcluster memiliki kemiripan yang minimum. Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang lain. Partisi tidak dilakukan secara manual melainkan dengan suatu algoritma clustering. Oleh karena itu, clustering sangat berguna dan bisa menemukan group atau kelompokyang tidak dikenal dalam data. Clustering banyak digunakan dalam berbagai aplikasi seperti misalnya pada business inteligence, pengenalan pola citra, web search, bidang ilmu biologi, dan untuk keamanan (security). Di dalam business inteligence, clusteringbisa mengatur banyak customer ke dalam banyaknya kelompok. Contohnya mengelompokan customer ke dalam beberapa cluster dengan kesamaan karakteristik yang kuat. Clustering juga dikenal sebagai data segmentasi karena clustering mempartisi banyak data set ke dalam banyak group berdasarkan kesamaannya. Selain itu clustering juga bisa sebagai outlier detection.
  • 4. Data Produksi Garam Terdapat 340 data dengan 8 atribut : 1. Id : varchar 5 auto increatmen 2. Kabupaten : varchar 25 3. Nama provinsi : varchar 25 4. Param garam : varchar 15 5. Tahun : date 6. Luas lahan : int 15 7. Produksi : int 15 8. Produktivitas : int 15
  • 5. Data produksi garam setelah di filter Data yang telah di clastering, yang awal 415 menjadi 340 data yang telah di filter, dengan 8 atribut : id, kabupaten, nama provinsi, param garam, tahun, luas lahan produksi, produktivitas
  • 6. Uji Coba Secara Manual Gambar: contoh data dari data produksi garam di ambil 5 sempel data untuk di hitung  Langkah pertama algoritma K-means Menanyakan kepada pemakai algoritma k-means, catatan-catatan yang ada akan dibuat menjadi berapa kelompok. Jika diambil pengkelompokannya dengan jumlah tiga, nilai k-nya adalah 3 atau k=3 Kabupaten Produksi Produktivitas BIMA 10277.9 79 SUMBAWA 2719.08 78 KOTA BIMA 1972.5 75 LOMBOK TIMUR 3584.92 76 LOMBOK BARAT 1320 22 Gambar : table yang telah di kelompokkan  Langkah Kedua algoritma K-Means Pada langkah kedua algoritma ini, kita akan secara sembarang memilih k=3 buah titik pusat (dari 5 data yang ada) sebagai pusat-pusat kelompok awal, misalnya: a. Catatan B sebagai pusat kelompok 1 sehingga m1 = (2719.08 , 78), b. Catatan C sebagai pusat kelompok 2 sehingga m2 = (1972.50 , 75), c. Catatan E sebagai pusat kelompok 3 sehingga m3 = (1320 , 22), Kabupaten Produksi Produktivitas A 10277.9 79 B 2719.08 78 C 1972.5 75 D 3584.92 76 E 1320 22 Gambar: yang telah di symbol data kabupaten, untuk mempermudah perhitungan Catetan : A : Bima B : Sumbawa C : Kota Bima D : Lombok Timur E : Lombok Barat ID Kabupaten NamaProvinsi ParamGara m Tahu n LuasLaha n Produksi Produktivita s 26 BIMA Nusa Tenggara Barat PUGAR 2011 130.1 10277.9 79 27 SUMBAWA Nusa Tenggara Barat PUGAR 2011 34.86 2719.08 78 28 KOTA BIMA Nusa Tenggara Barat PUGAR 2011 26.3 1972.5 75 29 LOMBOK TIMUR Nusa Tenggara Barat PUGAR 2011 47.17 3584.92 76 30 LOMBOK BARAT Nusa Tenggara Barat PUGAR 2011 60 1320 22 M1 M2 M3
  • 7. Perhitungan rasio ke-1  Langkah Ketiga algoritma K-Means kelompok Pada langkah ini setiap data akan ditentukan pusat kelompok terdekatnya. Data tersebut akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompoknya menggunakan rumus sebagai berikut: Kabupaten Produksi Produktivitas A 10277.9 79 B 2719.08 78 C 1972.5 75 D 3584.92 76 E 1320 22 Contoh penghitungan: a. A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (2719.08 , 78) A1 = d (x,y) =√((10277.9 − 2719.08)2) + ((79 − 78)2) = √7558.822 + 12 = √57135760.79 = 7558.820066 b. A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (1972.50 , 75) A2 = d (x,y) =√((10277.9 − 1972.5)2) + ((79 − 75)2) = √8305,42 + 42 = √68979685,16 = 8305.400963 a. A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22) A3 = d (x,y) =√((10277.9 − 1320)2) + ((79 − 22)2) = √8957,92 + 572 = √80247221,41 = 8958.081346 Untuk penghitungan B1 sampai E3 dilakukan langkah yang sama seperti di atas. Dan Menghasilkan seperti yang tampak dalam table dibawah ini: Data Kabupaten Jarak Ke Pusat M1 (2719.08 , 78) Jarak Ke Pusat M2(1972.50 , 75) Jarak Ke Pusat M3(1320 , 22) A(10277.9 , 79) A1 7558.820066 A2 8305.400963 A3 8958.081346 B(2719.08 , 78) B1 746.5860275 B2 1400.200288 B3 2720.198531 C(1972.5 , 75) C1 654.6489517 C2 1973.925341 C3 1973.925341 D(3584.92 , 76) D1 3585.725506 D2 3585.725506 D3 3585.725506 E(1320, 22) E1 1320.183321 E2 1320.183321 E3 1320.183321 Gambar : table yang jarak pusat setiap data
  • 8. Untuk setiap data akan ditentukan pusat kelompok terdekatnya dengan cara membandingkan nilai jarak setiap data dengan pusat M, dengan mencari nilai paling terkecil. Sehingga di dapatkan table dibawah ini : Jarak ke pusat m1 (2719.08 , 78) jarak ke pusat m2(1972.50 , 75) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 7558.820066 A2 8305.400963 A3 8958.081346 m1 B1 0 B2 746.5860275 B3 1400.200288 m1 C1 746.5860275 C2 0 C3 650.3439475 m2 D1 865.8423099 D2 1612.42031 D3 2265.56364 m1 E1 1400.200288 E2 654.6489517 E3 0 m3 Dari table 2 didapatkan keanggotaan sebagai berikut: a. Kelompok 1 (atau m1) ={A, B, D} b. Kelompok 2 (atau m2) = {C}, dan c. Kelompok 3 (atau m3) = {E}. Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan Within Cluster Variation (WCV), seperti berikut: a. Rumus untuk menghitung Between Cluster Variation (BCV) sebagai berikut: BCV = ∑ d (mi ,mj) 𝑛 𝑖,𝑗=0 Dimana i dan j adalah pusat kelompok. Karena pusat kelompok ada 3 dan d(mi,mj) Menyatakan jarak Euclidean dari mi ke mj, Maka penyelesaian BCV menjadi sebagai berikut: BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) Dengan m1 (2719.08 , 78), m2(1972.50 , 75), dan m3(1320 , 22), sehingga : d (m1, m2) = √((2719,08 − 1972,75)2) + ((78 − 75)2) = √(746,33)2 + (3)2 = √557390.6964 = 746.5860275 d (m1, m3) = √((2719.08 − 1320)2) + ((78 − 22)2) = √((1399.08)2) + ((56)2) = √1960560.846 =1400.200288 d (m2, m3) = √((1972.50 − 1320)2) + ((75 − 22)2) = √((652.5)2) + ((53)2) = √428565.25 = 654.6489517 Sehingga didapatkan hasil sebagaiberikut : BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) BCV = 746.5860275 + 1400.200288 + 654.6489517 = 2801.435267
  • 9. b. Rumus untuk menghitung Within Cluster Variation (WCV) sebagai berikut: 𝑊𝐶𝑉 = ∑(𝐽𝑎𝑟𝑎𝑘 𝑡𝑒𝑟𝑘𝑒𝑐𝑖𝑙 𝑠𝑒𝑡𝑖𝑎𝑝 𝑛𝑎𝑠𝑎𝑏𝑎ℎ 𝑘𝑒 𝑖)2 𝑛 𝑖=1 Jarak ke pusat m1 (2719.08 , 78) jarak ke pusat m2(1972.50 , 75) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 7558.820066 A2 8305.400963 A3 8958.081346 m1 B1 0 B2 746.5860275 B3 1400.200288 m1 C1 746.5860275 C2 0 C3 650.3439475 m2 D1 865.8423099 D2 1612.42031 D3 2265.56364 m1 E1 1400.200288 E2 654.6489517 E3 0 m3 Dari table di atas didapatkan Jarak terkecil A = 7558.820066 Jarak terkecil B = 0 Jarak terkecil C = 0 Jarak terkecil D = 865.8423099 Jarak terkecil E = 0 Sehingga didapatkan hasil sebagaiberikut : WCV = 7558.820066 + 0 + 0 + 865.8423099 + 0 = 8424.662376 Sehingga besarnya rasio adalah 𝑩𝑪𝑽 𝑾𝑪𝑽 = 𝟐𝟖𝟎𝟏.𝟒𝟑𝟓𝟐𝟔𝟕 𝟖𝟒𝟐𝟒.𝟔𝟔𝟐𝟑𝟕𝟔 = 0.332527897 Mengingat langkah sebelumnya belum mendapatkan rasio ini, maka perbandingan rasio belum dapat dilakukan dan algoritma dilanjutkan ke langkah ke empat.
  • 10. Perhitungan Rasio Ke-2  Langkah keempat Algoritma K-means (iterasi ke1) Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: Jarak ke pusat m1 (2719.08 , 78) jarak ke pusat m2(1972.50 , 75) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 7558.820066 A2 8305.400963 A3 8958.081346 m1 B1 0 B2 746.5860275 B3 1400.200288 m1 C1 746.5860275 C2 0 C3 650.3439475 m2 D1 865.8423099 D2 1612.42031 D3 2265.56364 m1 E1 1400.200288 E2 654.6489517 E3 0 m3 Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: a) m1 = rata-rata(mA,mB, mD) = (10277.9 ,79)+(2719.08 ,78)+(3584.92 ,76) 3 = (5527.3 , 77.66666667) b) m2 = rata-rata(mC) = (1972.5 , 75) c) m3 = rata-rata(mE) = (1320, 22) selanjutnya, kita akan kembali ke langkah 3 untuk mencari pembadingan  Langkah ketiga Algoritma K-Means (iterasi-2) A. Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara seperti langkah 3 diatas) . Contoh penghitungan: a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 5527.3 , 77.66666667) A1 = d (x,y) =√((10277.9 − 5527.3)2) + ((79 − 77.66666667)2) = √4750.62 + 1.333333332 = √22568202.14 = 4750.600187 b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (1972.5 , 75) A2 = d (x,y) =√((10277.9 − 1972.5)2) + ((79 − 75)2) = √8305,42 + 42 = √68979685,16 = 8305.400963 c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22) A3 = d (x,y) =√((10277.9 − 1320)2) + ((79 − 22)2) = √8957,92 + 572 = √80247221,41 = 8958.081346 Jarak ke pusat m1 (5527.3 , 77.66666667) jarak ke pusat m2(1972.50 , 75) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 4750.600187 A2 8305.400963 A3 8958.081346 m1 B1 2808.22002 B2 746.5860275 B3 1400.200288 m2 C1 3554.801 C2 0 C3 650.3439475 m2 D1 1942.380715 D2 1612.42031 D3 2265.56364 m2 E1 4207.668246 E2 654.6489517 E3 0 m3 Gambar : table jarak terdekat yang baru,
  • 11. Dari table diatas didapatkan keanggotaan sebagai berikut: a. Kelompok 1 (atau m1) ={A} b. Kelompok 2 (atau m2) = {B, C, D}, dan c. Kelompok 3 (atau m3) = {E}. Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster Variation (WCV), seperti berikut: BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) Dengan m1 (5527.3 , 77.66666667), m2(1972.50 , 75), dan m3(1320 , 22), sehingga : d (m1, m2) = √(5527.3 − 1972.50)2 + (77.66666667 − 75)2 = √((12636603.04)) + ((7.111111111)) = √12636610.15 = 3554.801 d (m1, m3) =√((5527.3 − 1320)2) + ((77.66666667 − 22)2) = √((17701373.29)) + ((3098.777778)) = √17704472.07 = 4207.668246 d (m2, m3)=√((1972.5 − 1320)2) + ((75 − 22)2) = √(652.5)2 + (53)2 = √425756.25 + 2809 = √428565.25 = 654.6489517 Jarak ke pusat m1 (5527.3 , 77.66666667) jarak ke pusat m2(1972.50 , 75) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 4750.600187 A2 8305.400963 A3 8958.081346 m1 B1 2808.22002 B2 746.5860275 B3 1400.200288 m2 C1 3554.801 C2 0 C3 650.3439475 m2 D1 1942.380715 D2 1612.42031 D3 2265.56364 m2 E1 4207.668246 E2 654.6489517 E3 0 m3 Sehingga didapatkan hasil sebagaiberikut : BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) BCV = 3554.801 + 4207.668246 + 654.6489517 = 8417.118198 B. Besar Rasio 2 WCV = 4750.600187 + 746.5860275 + 0 + 1612.42031 + 0 = 7109.606525 Sehingga besarnya rasio adalah 𝐵𝐶𝑉 𝑊𝐶𝑉 = 8417.118198 7109.606525 = 1.183907741
  • 12. Perhitungan Rasio Ke-3  Langkah keempat Algoritma K-means (iterasi ke1) Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: m1 = rata-rata(mA) = (10277.9, 79) m2 = rata-rata(, mB, mC , mD) = (2719.08 ,78)+ (1972.5 ,75)+(3584 .92 ,76) 3 = (2758.833333 , 76.33333333) m3 = rata-rata(mE) = (1320, 22)  Langkah ketiga Algoritma K-Means (iterasi-2) Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara seperti langkah 3 diatas) . Contoh penghitungan: a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79) A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0 b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (2758.833333 , 76.33333333) A2 = d (x,y)=√((10277.9 − 2758.833333)2) + ((79 − 76.33333333)2) = √56536363.54+ 7.111111111 = 56536370.65 c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1320 , 22) A3 = d (x,y)=√((10277.9 − 1320)2) + ((79 − 22)2) = √8957.9 − 57 = √80247221.41 = 8958.081346 Jarak ke pusat m1(10277.9, 79) jarak ke pusat m2(2758.833333 , 76.33333333) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 0 A2 7519.06714 A3 8958.081346 m1 B1 7558.820066 B2 39.78825567 B3 1400.200288 m2 C1 8305.400963 C2 786.3344638 C3 654.6489517 m3 D1 6692.980672 D2 826.0867339 D3 2265.56364 m2 E1 8958.081346 E2 1439.858838 E3 0 m3 Gambar : table jarak terdekat yang baru, Jarak ke pusat m1 (5527.3 , 77.66666667) jarak ke pusat m2(1972.50 , 75) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 4750.600187 A2 8305.400963 A3 8958.081346 m1 B1 2808.22002 B2 746.5860275 B3 1400.200288 m2 C1 3554.801 C2 0 C3 650.3439475 m2 D1 1942.380715 D2 1612.42031 D3 2265.56364 m2 E1 4207.668246 E2 654.6489517 E3 0 m3
  • 13. Dari table diatas didapatkan keanggotaan sebagai berikut: a) Kelompok 1 (atau m1) ={A} b) Kelompok 2 (atau m2) = {B, D}, dan c) Kelompok 3 (atau m3) = { C, E}. Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster Variation (WCV), seperti berikut: BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) Dengan m1 (10277.9, 79), m2(2758.833333 ,76.33333333) dan m3(1320 , 22), sehingga : d (m1, m2) =√((10277.9 − 2758.833333)2) + (79 − 76.33333333)2) = √56536363.54 + 7.111111111 = 7519.06714 d (m1, m3) =√((10277.9 − 1320)2) − ((79 − 22)2) = √80243972.41 + 3249 = 8958.081346 d (m2, m3) =√((2758.833333 − 1320)2) + ((76.33333333 − 22)2) = √2070241.361 + 2952.111111 = 1439.858838 Jarak ke pusat m1(10277.9, 79) jarak ke pusat m2(2758.833333 , 76.33333333) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 0 A2 7519.06714 A3 8958.081346 m1 B1 7558.820066 B2 39.78825567 B3 1400.200288 m2 C1 8305.400963 C2 786.3344638 C3 654.6489517 m3 D1 6692.980672 D2 826.0867339 D3 2265.56364 m2 E1 8958.081346 E2 1439.858838 E3 0 m3 Sehingga didapatkan hasil sebagaiberikut : BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) BCV = 7519.06714 + 8958.081346 + 1439.858838 = 17917.00732 C. Besar Rasio 3 WCV = 0 + 39.78825567+ 654.6489517 + 826.0867339+ 0 = 1520.523941 Sehingga besarnya rasio adalah 𝐵𝐶𝑉 𝑊𝐶𝑉 = 𝟏𝟕𝟗𝟏𝟕.𝟎𝟎𝟕𝟑𝟐 7109.606525 = 11.78344309
  • 14. Perhitungan Rasio Ke-4  Langkah keempat Algoritma K-means (iterasi ke1) Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: Jarak ke pusat m1(10277.9, 79) jarak ke pusat m2(2758.833333 , 76.33333333) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 0 A2 7519.06714 A3 8958.081346 m1 B1 7558.820066 B2 39.78825567 B3 1400.200288 m2 C1 8305.400963 C2 786.3344638 C3 654.6489517 m3 D1 6692.980672 D2 826.0867339 D3 2265.56364 m2 E1 8958.081346 E2 1439.858838 E3 0 m3 Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: m1 = rata-rata(mA) = (10277.9, 79) m2 = rata-rata(mB ,mD) = (2719.08 ,78)+ (3584.92 ,76) 2 = (3152 , 77) m3 = rata-rata(mC ,mE) = (1972.5 ,75)+(1320,22) 2 = (1646.25 , 48.5)  Langkah ketiga Algoritma K-Means (iterasi-2) Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara seperti langkah 3 diatas) . Contoh penghitungan: a) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79) A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0 b) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77) A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281 c) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5) A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886 Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Gambar : table jarak terdekat yang baru,
  • 15. Dari table diatas didapatkan keanggotaan sebagai berikut: d) Kelompok 1 (atau m1) ={A} e) Kelompok 2 (atau m2) = {B, D}, dan f) Kelompok 3 (atau m3) = { C, E}. Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster Variation (WCV), seperti berikut: BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga : d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2) = √50778450.81 + 4 = 7125.900281 d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886 d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2) = √2267283.063 + 812.25 = 1506.019692 Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Sehingga didapatkan hasil sebagaiberikut : BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386 Besar Rasio 4 WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262 Sehingga besarnya rasio adalah 𝐵𝐶𝑉 𝑊𝐶𝑉 = 𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔 1520.491262 = 11.35397769
  • 16. Perhitungan Rasio Ke-5  Langkah keempat Algoritma K-means (iterasi ke1) Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: Jarak ke pusat m1(10277.9, 79) jarak ke pusat m2(2758.833333 , 76.33333333) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 0 A2 7519.06714 A3 8958.081346 m1 B1 7558.820066 B2 39.78825567 B3 1400.200288 m2 C1 8305.400963 C2 786.3344638 C3 654.6489517 m3 D1 6692.980672 D2 826.0867339 D3 2265.56364 m2 E1 8958.081346 E2 1439.858838 E3 0 m3 Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: m1 = rata-rata(mA) = (10277.9, 79) m2 = rata-rata(mB ,mD) = (2719.08 ,78)+ (3584.92 ,76) 2 = (3152 , 77) m3 = rata-rata(mC ,mE) = (1972.5 ,75)+(1320,22) 2 = (1646.25 , 48.5)  Langkah ketiga Algoritma K-Means (iterasi-2) Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara seperti langkah 3 diatas) . Contoh penghitungan: d) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79) A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0 e) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77) A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281 f) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5) A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886 Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Gambar : table jarak terdekat yang baru,
  • 17. Dari table diatas didapatkan keanggotaan sebagai berikut: g) Kelompok 1 (atau m1) ={A} h) Kelompok 2 (atau m2) = {B, D}, dan i) Kelompok 3 (atau m3) = { C, E}. Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster Variation (WCV), seperti berikut: BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga : d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2) = √50778450.81 + 4 = 7125.900281 d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886 d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2) = √2267283.063 + 812.25 = 1506.019692 Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Sehingga didapatkan hasil sebagaiberikut : BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386 Besar Rasio 5 WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262 Sehingga besarnya rasio adalah 𝐵𝐶𝑉 𝑊𝐶𝑉 = 𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔 1520.491262 =11.35397769
  • 18. Perhitungan Rasio Ke-6  Langkah keempat Algoritma K-means (iterasi ke1) Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: Jarak ke pusat m1(10277.9, 79) jarak ke pusat m2(2758.833333 , 76.33333333) jarak ke pusat m3(1320 , 22) Jarak terdekat ke kelompok A1 0 A2 7519.06714 A3 8958.081346 m1 B1 7558.820066 B2 39.78825567 B3 1400.200288 m2 C1 8305.400963 C2 786.3344638 C3 654.6489517 m3 D1 6692.980672 D2 826.0867339 D3 2265.56364 m2 E1 8958.081346 E2 1439.858838 E3 0 m3 Pada langkah ini, pembaruan pusat-pusat kelompok yang baru akan dilakukan seperti berikut: m1 = rata-rata(mA) = (10277.9, 79) m2 = rata-rata(mB ,mD) = (2719.08 ,78)+ (3584.92 ,76) 2 = (3152 , 77) m3 = rata-rata(mC ,mE) = (1972.5 ,75)+(1320,22) 2 = (1646.25 , 48.5)  Langkah ketiga Algoritma K-Means (iterasi-2) Pada langkah ini setiap nasabah akan ditentukan pusat kelompok terdekatnya. Nasabah tersebut akan ditetapkan sebagai anggota kelompok yang terdekat pusat kelompok yang baru (cara seperti langkah 3 diatas) . Contoh penghitungan: g) A1 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m1 (10277.9, 79) A1 = d (x,y)=√((10277.9 − 10277.9)2) + ((79 − 79)2) = √0 + 0 = 0 h) A2 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m2 (3152 , 77) A2 = d (x,y)=√((10277.9 − 3152)2) + ((79 − 77)2) = √50778450.81 + 4 = 7125.900281 i) A3 didapatkan dari titik nasabah A(10277.9 , 79) dengan titik pusat m3 (1646.25 , 48.5) A3 = d (x,y)=√((10277.9 − 1646.25)2) + ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886 Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Gambar : table jarak terdekat yang baru,
  • 19. Dari table diatas didapatkan keanggotaan sebagai berikut: j) Kelompok 1 (atau m1) ={A} k) Kelompok 2 (atau m2) = {B, D}, dan l) Kelompok 3 (atau m3) = { C, E}. Pada langkah ini dihitung pula rasio antara besaran Between Cluster Variation (BCV) dengan within Cluster Variation (WCV), seperti berikut: BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) Dengan m1 (10277.9, 79), m2(3152 ,77) dan m3(1646.25 , 48.5)sehingga : d (m1, m2) =√((10277.9 − 3152)2) + (79 − 77)2) = √50778450.81 + 4 = 7125.900281 d (m1, m3) =√((10277.9 − 1646.25)2) − ((79 − 48.5)2) = √74505381.72 + 930.25 = 8631.703886 d (m2, m3) =√((3152 − 1646.25)2) + ((77 − 48.5)2) = √2267283.063 + 812.25 = 1506.019692 Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Sehingga didapatkan hasil sebagaiberikut : BCV= d(m1,m2) + d(m1,m3) + d(m2,m3) BCV = 7125.900281 + 8631.703886 + 1506.019692 = 17263.62386 Besar Rasio 6 WCV = 0 + 432.9211549 + 327.3244759 + 432.9211549 + 327.3244759 = 1520.491262 Sehingga besarnya rasio adalah 𝐵𝐶𝑉 𝑊𝐶𝑉 = 𝟏𝟕𝟐𝟔𝟑.𝟔𝟐𝟑𝟖𝟔 1520.491262 =11.35397769
  • 20. Kesimpulan Jarak ke pusat m1(10277.9 , 79) jarak ke pusat m2(3152 , 77) jarak ke pusat m3(1646.25 , 48.5) Jarak terdekat ke kelompok A1 0 A2 7125.900281 A3 8631.703886 m1 B1 7558.820066 B2 432.9211549 B3 1073.23551 m2 C1 8305.400963 C2 1179.501696 C3 327.3244759 m3 D1 6692.980672 D2 432.9211549 D3 1938.865034 m2 E1 8958.081346 E2 1832.825414 E3 327.3244759 m3 Pada perhitungan ke 4, 5 , 6 memiliki nilai batas yang sama dan nilai rasio yang sama maka perhitungan di hentikan. Sebab nilai batas telah di temukan, yaitu : m1 = rata-rata(mA) =C1 = (10277.9 , 79) m2 = rata-rata(mB ,mD) =C2 = (3152 , 77) m3 = rata-rata(mC ,mE) =C3 = (1646.25 ,48.5) sehingga nilai batas tersebut di jadikkan sebagaiacuhan data untuk menentukan pengelompokkan data setiap claster.