CLUSTERING

CLUSTERING ANALISYS
PENGELOMPKKAN DATA RECORD
LAPORAN HASIL UNGKAP KASUS NARKOBA PADA POLRES JAKARTA PUSAT
PERIODE 2007-2009
Diajukan untuk Memenuhi Sebagian Tugas
Mata Kuliah Analisis Peubah Ganda
Disusun Oleh :
Puti Febriani Nurjanah (3125111204)
PROGRAM STUDI MATEMATIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI JAKARTA
2014

BAB I. PENDAHULUAN
A. Latar Belakang
Selama ini masih belum diterapkannya sebuah metode dalam pengelolaan data
mengenai kasus narkona, sehingga masih belum diperolehnya informasi yang berkaitan
dengan laporan hasil ungkap kasus narkoba. Terbatasnya teknologi dalam hal ini
membuat para pihak yang terkait sulit untuk memanfaatkan secara maksimal potensi dari
data-data tersebut, padahal dari data tersebut tersimpan banyak sekali informasi berharga
yang berguna.
Oleh karena itu, hal ini memerlukan suatu teknologi yang dapat melahirkan
pengetahuan-pengetahuan baru sehingga dapat membantu pihak-pihak yang terkait. Maka
metode pengelompokkan data hadir sebagai salah satu solusi untuk pengelolaan data
secara efektif dan efisien dan bakan dapat menghasilkan informasi yang berguna bagi
para pembuat keputusan.
Dalam penelitian ini akan dilakukan analisis secara ilmiah dengan menerapkan
metode clustering analisys untuk melakukukan pengelompokkan data-data record
laporan hasil ungkap kasus narkoba periode 2007-2009 berdasarkan informasi yang
diambil dari Polres Jakarta Pusat.
B. Kajian Teori
Analisis multivariat merupakan analisis statistika yang berkaitan dengan
pendiskripsian ataupun interpretasi data yang melibatkan banyak peubah dan objek secara
bersama-sama. Salah satu interpretasi yang dimaksud adalah pengelompokan data.
Pengelompokan data merupakan pengorganisasian sekumpulan data yang besar dengan
cara membagi data tersebut kedalam beberapa gerombol (kelompok). Gerombol-
gerombol yang terbentuk akan mampu menjelaskan adanya persamaan maupun
perbedaan dari keseluruhan data yang diteliti. Tujuan dari pengelompokan data adalah
untuk mempermudah proses analisis dan interpretasi dari data besar dengan membagi
data tersebut menjadi beberapa gerombol.
Terdapat beberapa teknik dalam pengelompokan suatu data. Namun dalam tulisan
ini, pengelompokan data yang dimaksudkan adalah pengelompokan data yang didasarkan
pada objek dari data tersebut. Salah satu analisis yang sering digunakan untuk
pengelompokan ini adalah analisis gerombol (cluster). Analisis gerombol merupakan

analisis multivariat yang bertujuan untuk mengelompokkan objek-objek dari data yang
diteliti berdasarkan kesamaan karakteristik yang dimilikinya. Kesamaan karakteristik ini
biasanya diukur menggunakan ukuran kedekatan antarobjek yang dapat berupa ukuran
kemiripan atau ketakmiripannya. Analisis gerombol mampu digunakan dalam
mengelompokkan data dalam jumlah objek yang besar serta dengan skala pengukuran
peubah yang berbeda mulai dari nominal sampai interval.
Ciri-ciri suatu cluster yang baik yaitu mepunyai:
 Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu
cluster
 Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu
dengan cluster yang lain
Langkah pengelompokan dalam analisis cluster mencakup 3 hal berikut:
1. Mengukur kesamaan jarak.
2. Membentuk cluster secara hierarki.
3. Menentukan jumlah cluster.
Adapun metode pengelompokan dalam analisis cluster meliputi:
 Metode Hierarki; memulai pengelompokan dengan dua atau lebih obyek yang
mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan
seterusnya hingga cluster akan membentuk semacam „pohon‟ dimana terdapat
tingkatan (hirarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling
tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut
“dendogram”
 Metode Non-Hierarki; dimulai dengan menentukan terlebih dahulu jumlah cluster
yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka
proses cluster dilakukan dengan tanpa mengikuti proses hierarki. Metode ini biasa
disebut “K-Means Cluster”
Asumsi yang harus dipenuhi dalam Analisis Cluster yaitu:
 Sampel yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample)
 Multikolinieritas

BAB III. PEMBAHASAN
Dalam bab ini, akan diterapkan metode analisis penggerombolan atau cluster analisys
untuk mengelompokkan data record Laporan Hasil Ungkap Kasus Narkoba pada Polres
Jakarta Pusat Periode 2007-2009 sebagai berikut:
Data
Record
Heroin Ganja Shabu Ekstasi
Gol
IV
Data
Record
Heroin Ganja Shabu Ekstasi
Gol
IV
record 1 27 18 23 7 3 record 19 34 26 19 12 2
record 2 22 19 14 10 3 record 20 39 23 18 13 2
record 3 21 22 11 8 2 record 21 11 13 13 3 3
record 4 16 21 15 16 2 record 22 24 17 26 11 3
record 5 23 28 15 22 4 record 23 19 28 14 9 7
record 6 23 35 19 9 1 record 24 19 27 27 14 5
record 7 33 32 12 15 5 record 25 15 20 37 11 7
record 8 17 27 20 13 1 record 26 14 32 21 11 5
record 9 21 12 9 4 7 record 27 12 25 29 8 3
record 10 11 16 11 3 2 record 28 12 25 27 5 2
record 11 42 31 11 13 2 record 29 10 26 23 16 5
record 12 40 22 12 14 4 record 30 11 38 26 3 3
record 13 32 20 20 14 1 record 31 7 22 39 7 2
record 14 36 33 11 8 5 record 32 15 35 20 4 2
record 15 38 10 26 26 4 record 33 14 32 23 4 2
record 16 39 17 28 15 2 record 34 16 33 40 2 1
record 17 36 15 28 19 3 record 35 8 25 28 12 1
record 18 32 26 20 7 3 record 36 19 21 30 12 1
Tabel 1. Data Record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat
Periode 2007-2009
Dari data di atas, ingin diketahui pengelompokkan data-data record tersebut berdasarkan
instrumen 5 variabel, yaitu:
1. Jumlah pemakai narkoba jenis heroin
2. Jumlah pengguna narkoba jenis ganja
3. Jumlah pengguna narkoba jenis shabu
4. Jumlah pengguna narkoba jenis ekstasi
5. Jumlah pengguna narkoba jenis gol IV

Berikut langkah-langkahnya:
1. Standardisasi/Transformasi
Mengingat data yang terkumpul mempunyai variabilitas satuan, maka perlu dilakukan
langkah standardisasi atau transformasi terhadap variabel yang relevan ke bentuk z-score,
sebagai berikut:
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
Heroin 36 7.00 42.00 22.4444 10.58151
Ganja 36 10.00 38.00 24.2222 7.03506
Shabu 36 9.00 40.00 21.2500 8.19538
Ekstasi 36 2.00 26.00 10.5556 5.52110
Gol IV 36 1.00 7.00 3.0556 1.73937
Valid N (listwise) 36
Tabel 2. Statistik Deskriptif Data Record
Zheroin ZGanja ZShabu Zekstasi ZGol IV
0.43052 -0.88446 0.21353 -0.64399 -0.03194
-0.042 -0.74231 -0.88464 -0.10062 -0.03194
-0.13651 -0.31588 -1.2507 -0.46287 -0.60686
-0.60903 -0.45802 -0.76262 0.98612 -0.60686
0.0525 0.53699 -0.76262 2.07286 0.54298
0.0525 1.53201 -0.27454 -0.28175 -1.18178
0.99755 1.10557 -1.12868 0.80499 1.1179
-0.51452 0.39485 -0.15252 0.44275 -1.18178
-0.13651 -1.73733 -1.49474 -1.18736 2.26775
-1.08155 -1.16875 -1.2507 -1.36849 -0.60686
1.84809 0.96343 -1.2507 0.44275 -0.60686
1.65908 -0.31588 -1.12868 0.62387 0.54298
0.90304 -0.60017 -0.15252 0.62387 -1.18178

1.28106 1.24772 -1.2507 -0.46287 1.1179
1.47007 -2.02162 0.57959 2.79735 0.54298
1.56457 -1.0266 0.82363 0.80499 -0.60686
1.28106 -1.31089 0.82363 1.52949 -0.03194
0.90304 0.2527 -0.15252 -0.64399 -0.03194
1.09205 0.2527 -0.27454 0.26162 -0.60686
1.56457 -0.17373 -0.39656 0.44275 -0.60686
-1.08155 -1.59519 -1.00666 -1.36849 -0.03194
0.14701 -1.0266 0.57959 0.0805 -0.03194
-0.32552 0.53699 -0.88464 -0.28175 2.26775
-0.32552 0.39485 0.70161 0.62387 1.1179
-0.70353 -0.60017 1.92181 0.0805 2.26775
-0.79804 1.10557 -0.0305 0.0805 1.1179
-0.98705 0.11056 0.94565 -0.46287 -0.03194
-0.98705 0.11056 0.70161 -1.00624 -0.60686
-1.17606 0.2527 0.21353 0.98612 1.1179
-1.08155 1.95845 0.57959 -1.36849 -0.03194
-1.45957 -0.31588 2.16585 -0.64399 -0.60686
-0.70353 1.53201 -0.15252 -1.18736 -0.60686
-0.79804 1.10557 0.21353 -1.18736 -0.60686
-0.60903 1.24772 2.28787 -1.54961 -1.18178
-1.36507 0.11056 0.82363 0.26162 -1.18178
-0.32552 -0.45802 1.06767 0.26162 -1.18178
Tabel 3. Nilai Standardisasi Data Record
Untuk selanjutnya, hasil z-score inilah yang akan dipakai dasar analisis
penggerombolan. Namun apabila data yang terkumpul tidak mempunyai variabilitas
satuan, maka prose analisis penggerombolan dapat langsung dilakukan tanpa terlebih
dahulu melakukan transformasi atau standardisasi.

2. Analisis Penggerombolan
A. Metode K-Means Cluster (Non-Hierarki)
Untuk metode ini, jumlah kelompok atau gerombol sudah ditentukan. Misal k = 3,
maka didapat:
Initial Cluster Centers
Cluster
1 2 3
Zscore: Heroin -.13651 1.47007 -.60903
Zscore: Ganja -1.73733 -2.02162 1.24772
Zscore: Shabu -1.49474 .57959 2.28787
Zscore: Ekstasi -1.18736 2.79735 -1.54961
Zscore: Gol IV 2.26775 .54298 -1.18178
Tabel 4. Penggerombolan Data Record Sebelum Iterasi
Tabel diatas merupakan tampilan pertama proses penggerombolan data sebelum
dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam
proses penggerombolan dari 36 obyek yang diteliti, dapat dilihat dari tampilan output
berikut ini:
Iteration Historya
Iteration
Change in Cluster Centers
1 2 3
1 2.345 2.674 2.198
2 .277 .000 .401
3 .000 .000 .000
a. Convergence achieved due to no or small change in cluster
centers. The maximum absolute coordinate change for any center is
,000. The current iteration is 3. The minimum distance between
initial centers is 5,081.
Tabel 5. Proses Iterasi Penggerombolan Data Record

Ternyata proses penggerombolan yang dilakukan melalui 3 tahapan iterasi untuk
mendapatkan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum
antar pusat cluster yang terjadi dari hasil iterasi adalah 5,081. Adapun hasil akhir dari
proses penggerombolan digambarkan berikut ini:
Final Cluster Centers
Cluster
1 2 3
Zscore: Heroin -.15676 .99755 -.79804
Zscore: Ganja -.15343 -.47095 .66622
Zscore: Shabu -.44886 -.17471 .74599
Zscore: Ekstasi -.28175 .96965 -.61106
Zscore: Gol IV .78938 -.24100 -.76366
Tabel 6. Proses Akhir Penggerombolan Data Record
Output Final Cluster Centers tersebut diatas masih terkait dengan proses
standardisasi data sebelumnya, yang mengacu pada z-score dengan ketentuan sebagai
berikut :
 Nilai negatif (-) berarti data berada di bawah rata-rata total
 Nilai positif (+) berarti data berada di atas rata-rata total
Rumus umum yang digunakan yaitu :
Dimana :
: rata-rata sampel (variabel dalam cluster)
: rata-rata populasi
: nilai standardisasi
: standar deviasi

Sebagai contoh, apabila ingin diketahui rata-rata jumlah pengguna narkoba jenis
heroin di cluster-1 yaitu:
(rata-rata pengguna narkoba jenis heroin) + (-0.15676 x standar deviasi rata-rata
pendapatan)
Jadi rata-rata jumlah pengguna narkoba jenis heroin yang berada di cluster-1
adalah 20,78564. Demikian seterusnya dapat diketahui rata-rata nilai masing-masing
variabel dalam tiap cluster. Dari tabel output Final Cluster Centers, dengan ketentuan
yang telah dijabarkan diatas pula, dapat didefinisikan sebagai berikut:
 Cluster-1
Dalam cluster-1 ini berisikan data record yang mempunyai jumlah pengguna
narkoba yang kurang dari rata-rata populasi data record yang diteliti, hanya rata-rata
jumlah pengguna narkoba jenis Gol IV yang melebihi rata-rata. Dengan demikian,
dapat diduga bahwa cluster-1 ini merupakan pengelompokan dari data record dari
periode waktu yang tingkat penggunaan narkobanya rendah.
 Cluster-2
Karakteristik data record yang masuk dalam pengelompokan cluster-2 yaitu
memiliki rata-rata jumlah pengguna narkoba jenis heroin dan ekstasi yang melebihi
rata-rata populasi data record yang diteliti. Untuk instrumen variabel yang lain data
record di cluster-2 ini berada di bawah ratarata populasi. Dengan demikian, dapat
diduga bahwa cluster-2 ini merupakan pengelompokan dari data record dari periode
waktu yang tingkat penggunaan narkobanya sedang.
 Cluster-3
Karakteristik data record yang masuk dalam pengelompokan cluster-3 mirip
dengan karakteristik pada pengelompokan cluster-2, terdapat 2 variabel yang
melebihi rata-rata populasi data record yang diteliti, yaitu rata-rata jumlah pengguna
narkoba jenis ganja dan shabu. Untuk instrumen variabel yang lain data record di
cluster-3 ini berada di bawah ratarata populasi. Dengan demikian, dapat diduga
bahwa cluster-3 ini merupakan pengelompokan dari data record dari periode waktu
yang tingkat penggunaan narkobanya sedang.

Tahapan selanjutnya yang perlu dilakukan yaitu melihat perbedaan variabel pada
cluster yang terbentuk. Dalam hal ini dapat dilihat dari nilai F dan nilai probabilitas
(sig) masing-masing variabel, seperti tampak dalam tabel berikut:
ANOVA
Cluster Error
F Sig.Mean Square Df Mean Square df
Zscore: Heroin 9.148 2 .506 33 18.072 .000
Zscore: Ganja 3.826 2 .829 33 4.616 .017
Zscore: Shabu 4.639 2 .779 33 5.951 .006
Zscore: Ekstasi 7.781 2 .589 33 13.209 .000
Zscore: Gol IV 7.889 2 .583 33 13.543 .000
The F tests should be used only for descriptive purposes because the clusters have been
chosen to maximize the differences among cases in different clusters. The observed
significance levels are not corrected for this and thus cannot be interpreted as tests of
the hypothesis that the cluster means are equal.
Tabel 7. ANOVA Data Record
Rumus nilai F:
Dimana dalam tabel ANOVA di atas MS Between ditunjukkan oleh Means Square
dalam kolom Cluster, sedangkan MS Within ditunjukkan oleh Means Square dalam
kolom Error.
Catatan: Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada cluster yang terbentuk.

Hasil analisis dari tabel ANOVA:
Dengan demikian hasil cluster yang didapat dalam penelitian ini bahwa untuk
instrumen jumlah pengguna narkoba jenis heroin yang paling menunjukkan adanya
perbedaan diantara kota-kota pada ketiga cluster yang terbentuk. Hal ini dengan
ditunjukkannya nilai F = 18,072 dan sig = 0,000.Urutan perbedaan variabel dari yang
terbesar hingga terkecil yaitu jumlah pengguna narkoba jenis heroin, gol IV, ekstasi,
shabu dan ganja. Selanjutnya untuk mengetahui jumlah anggota masing-masing cluster
yang terbentuk dapat dilihat pada tabel output berikut ini:
Number of Cases in each Cluster
Cluster 1 14.000
2 11.000
3 11.000
Valid 36.000
Missing .000
Tabel 8. Jumlah Anggota Gerombol Data Record
Nampak jelas bahwa cluster-1 beranggotakan 12 data record, cluster-2 berisi 11
data record, dan pada cluster-3 terdapat 11 data record yang mengelompok.
Selanjutnya untuk mengetahui data record mana saja yang masuk dalam kategori tiap-
tiap cluster dapat kembali dibuka tampilan berikut ini:
Data Record QCL_1 QCL_2 Data Record QCL_1 QCL_2
record 1 1 1.45734 record 19 2 1.08523
record 2 1 1.12126 record 20 2 0.93304
record 3 1 1.62851 record 21 1 2.25846
record 4 2 1.74958 record 22 2 1.56059
record 5 2 2.02148 record 23 1 1.69725
record 6 3 1.67266 record 24 1 1.60647

record 7 1 2.16069 record 25 1 2.90438
record 8 3 1.49889 record 26 1 1.55258
record 9 1 2.57075 record 27 3 0.97042
record 10 1 2.37898 record 28 3 0.72609
record 11 2 2.08569 record 29 1 1.83251
record 12 2 1.45118 record 30 3 1.69913
record 13 2 1.01526 record 31 3 1.85576
record 14 1 2.19413 record 32 3 1.38656
record 15 2 2.67432 record 33 3 0.91282
record 16 2 1.33714 record 34 3 1.95115
record 17 2 1.46277 record 35 3 1.25408
record 18 1 1.47706 record 36 3 1.58968
Tabel 9. Anggota dari Tiap Gerombol
Perhatikan bahwa “QCL_1” menunjukkan nomor cluster dari keberadaan data
record dan “QCL_2” merupakan jarak antara obyek dengan pusat cluster. Dengan
demikian, dapat ditafsirkan sebagai berikut:
 Cluster-1:
berisikan data record ke-1, 2, 3, 7, 9, 10, 14, 18, 21, 23, 24, 25, 26, 29 dengan
masing-masing jarak terhadap pusat cluster-1 adalah 1.45734; 1.12126; 1.62851;
2.16069; 2.57075; 2.37898; 2.19413; 1.47706; 2.25846; 1.69725; 1.60647; 2.90438;
1.55258 dan 1.83251
 Cluster-2:
berisikan data record ke-4, 5, 11, 12, 13, 15, 16, 17, 19, 20, 22 dengan masing-
masing jarak terhadap pusat cluster-2 adalah 1.74958; 2.02148; 2.08569; 1.45118;
1.01526; 2.67432; 1.33714; 1.46277; 1.08523; 0.93304 dan 1.56059
 Cluster-3:
berisikan data record ke-6, 8, 27, 28, 30, 31, 32, 33, 34, 35, 36 dengan masing-
masing jarak terhadap pusat cluster-3 adalah 1.67266; 1.49889; 0.97042; 0.72609;
1.69913; 1.85576; 1.38656; 0.91282; 1.95115; 1.25408 dan 1.58968.

B. Metode Hierarchical Cluster (Hierarki)
Konsep dari metode hierarki ini dimulai dengan menggabungkan 2 obyek yang
paling mirip, kemudian gabungan 2 obyek tersebut akan bergabung lagi dengan satu
atau lebih obyek yang paling mirip lainnya. Proses clustering ini pada akhirnya akan
„menggumpal‟ menjadi satu cluster besar yang mencakup semua obyek. Metode ini
disebut juga sebagai “metode aglomerativ” yang digambarkan dengan dendogram.
Contoh kasus di atas akan dicoba untuk diselesaikan pula dengan metode aglomerativ.
Case Processing Summarya
Cases
Valid Missing Total
N Percent N Percent N Percent
36 100.0% 0 .0% 36 100.0%
a. Squared Euclidean Distance used
Tabel 10. Informasi Pemrosesan Data Record
Tabel output di atas menunjukkan bahwa semua data sejumlah 36 obyek telah
diproses tanpa ada data yang hilang.
Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record
Tabel tersebut menujukkan matriks jarak antara variabel satu dengan variabel yang
lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut
sehingga akan membentuk kelompok (cluster).

Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 32 33 .325 0 0 10
2 19 20 .453 0 0 9
3 10 21 .572 0 0 30
4 27 28 .685 0 0 16
5 1 22 .759 0 0 21
6 2 3 .787 0 0 17
7 16 17 1.017 0 0 25
8 24 29 1.113 0 0 12
9 13 19 1.141 0 2 15
10 30 32 1.265 0 1 18
11 35 36 1.464 0 0 16
12 24 26 1.655 8 0 24
13 7 14 1.723 0 0 22
14 4 8 1.734 0 0 17
15 13 18 2.350 9 0 21
16 27 35 2.389 4 11 19
17 2 4 2.796 6 14 23
18 6 30 2.911 0 10 28
19 27 31 2.936 16 0 27
20 11 12 3.042 0 0 22
21 1 13 3.220 5 15 23
22 7 11 3.749 13 20 29
23 1 2 3.842 21 17 29
24 23 24 4.116 0 12 26
25 15 16 4.444 0 7 34
26 5 23 5.838 0 24 31

27 27 34 5.940 19 0 28
28 6 27 6.067 18 27 32
29 1 7 6.861 23 22 31
30 9 10 8.023 0 3 33
31 1 5 8.097 29 26 32
32 1 6 10.275 31 28 33
33 1 9 13.097 32 30 34
34 1 15 14.625 33 25 35
35 1 25 14.975 34 0 0
Tabel 12. Proses Penggerombolan Data Record Secara Bertingkat
Tabel di atas merupakan hasil proses clustering dengan metode Between Group
Linkage. Setelah jarak anatar varaibel diukur dengan jarak euclidean, maka dilakukan
pengelompokan, yang dilakukan secara bertingkat.
 Stage 1:
terbentuk 1 cluster yang beranggotakan data record 32 dan data record 33 dengan
jarak 0,325. Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka
jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 36 obyek yang ada.
Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 4. Hal ini berarti
clustering selanjutnya dilakukan dengan melihat stage 10, dengan penjelasan
berikut.
 Baris ke-10 (stage 10) terlihat obyek ke-30 (data record 30) membentuk cluster
dengan obyek ke-32 (data record 32). Dengan demikian, sekarang cluster terdiri
dari 3 obyek yaitu data record 30, data record 32 dan data record 33. Sedangkan
jarak sebesar 1.265 merupakan jarak rata-rata obyek terakhir yang bergabung
dengan 2 obyek sebelumnya, seperti tampak dalam Tabel 11 dan dapat dihitung
sebagai berikut:
- Jarak data record 30 dan data record 32 = 1,224
- Jarak Kota record 30 dan data record 33 = 1,305
- Jarak rata-rata = (1,224 + 1,305) / 2 = 1,2645 ~ 1.265 (dalam tabel di atas)

 Stage 2:
terjadi pembentukan cluster dara record 19 dan data record 20 yang berjarak 0,453),
yang kemudian berlanjut ke stage 9.
Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai ke stage terakhir.
Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang
melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya
akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya
dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah
cluster yang dibentuk. Perincian jumlah cluster dengan anggota yang terbentuk dapat
dilihat pada tabel output berikut ini:
Cluster Membership
Case 4 Clusters 3 Clusters 2 Clusters
1:record 1 1 1 1
2:record 2 1 1 1
3:record 3 1 1 1
4:record 4 1 1 1
5:record 5 1 1 1
6:record 6 1 1 1
7:record 7 1 1 1
8:record 8 1 1 1
9:record 9 2 1 1
10:record 10 2 1 1
11:record 11 1 1 1
12:record 12 1 1 1
13:record 13 1 1 1
14:record 14 1 1 1
15:record 15 3 2 1

16:record 16 3 2 1
17:record 17 3 2 1
18:record 18 1 1 1
19:record 19 1 1 1
20:record 20 1 1 1
21:record 21 2 1 1
22:record 22 1 1 1
23:record 23 1 1 1
24:record 24 1 1 1
25:record 25 4 3 2
26:record 26 1 1 1
27:record 27 1 1 1
28:record 28 1 1 1
29:record 29 1 1 1
30:record 30 1 1 1
31:record 31 1 1 1
32:record 32 1 1 1
33:record 33 1 1 1
34:record 34 1 1 1
35:record 35 1 1 1
36:record 36 1 1 1
Tabel 13. Penggerombolan Data Record Berdasarkan Jumlah Gerombol
Dari tabel diatas dapat dijabarkan bahwa:
1.Apabila diinginkan dibentuk 4 cluster, maka:
 Anggota cluster 1 adalah data record 1 s.d. 8, 11 s.d. 14, 18 s.d. 20, 22 s.d. 24
dan 26 s.d. 36
 Anggota cluster 2 adalah data record 9, 10 dan 21
 Anggota cluster 3 adalah data record 15 s.d. 17
 Anggota cluster 4 adalah data record 25

2.Apabila ditentukan dibentuk 3 cluster, maka:
 Anggota cluster 1 adalah data record 1 s.d. 14, 18 s.d. 20, 21 s.d. 24 dan 26 s.d.
36
 Anggota cluster 2 adalah data record 15 s.d. 17
3.Apabila ditentukan dibentuk 2 cluster, maka:
 Anggota cluster 1 adalah data record 1 s.d. 24 dan 26 s.d. 36
Lampiran 2: Dendogram Data Record
Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan
ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat
dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan data
record 32 s.d. data record 11 (sesuai urutan dalam dendogram); dan cluster 2
beranggotakan data record 12 s.d. data record 25. Apabila akan dibentuk 3 cluster,
maka cluster 1 beranggotakan data record 32 s.d. data record 29, cluster 2
beranggotakan data record 26 s.d. data record 1 dan cluster 3 beranggotakan data
record 22 s.d. data record 25. Apabila akan dibentuk 4 cluster, maka cluster 1
beranggotakan data record 32 s.d. data record 31, cluster 2 beranggotakan data record
32 s.d. data record 11, cluster 3 beranggotakan data record 12 s.d. data record 20 dan
cluster 4beranggotakan data record 13 s.d. data record 25.

BAB IV. KESIMPULAN
Terdapat dua metode dalam analisis gerombol. Pertama, metode non-hierarki yang
dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau
yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa
mengikuti proses heirarki, dan metode ini biasa disebut “K-Means Cluster”. Kedua, metode
hierarki yang memulai pengelompokan dengan dua atau lebih obyek yang mempunyai
kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga
cluster akan membentuk semacam „pohon‟ dimana terdapat tingkatan (hirarkie) yang jelas
antar obyek, dari yang paling mirip hingga yang paling tidak mirip.
Berdasarkan metode non-hierarki, kesimpulan yang dapat diambil yaitu bahwa data
record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009
berasal dari periode waktu yang tingkat penggunaan narkobanya rendah karena pada 3 cluster
yang terbentuk, cluster-1 merupakan cluster terbesar yang beranggotakan 14 data record,
sedangkan cluster-2 dan cluster-3 memiliki jumlah anggota data record yang sama, yaitu 11.
Sedangkan berdasarkan metode hierarki, kesimpulan yang bahwa data record Laporan
Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 sebaiknya
dibentuk 2 cluster yang didasarkan pada karakteristik data record 25 pada cluster-2 berbeda
dengan data record lainnya.

DAFTAR PUSTAKA
Ariawan, I Made Anom, dkk. 2013. “KOMPARASI ANALISIS GEROMBOL (CLUSTER)
DAN BIPLOT DALAM PENGELOMPOKAN”. E-Jurnal Matematika Vol. 2, No.4,
Nopember 2013, 17- 22. [ONLINE] Tersedia:
(http://ojs.unud.ac.id/index.php/mtk/article/download/7838/5914)
“MODUL 6 ANALISIS CLUSTER”. [ONLINE] Tersedia:
(http://file.upi.edu/Direktori/FPIPS/LAINNYA/MEITRI_HENING/Modul/Modul_Clus
ter.pdf)
[ONLINE] Tersedia:
(http://www.library.upnvj.ac.id/pdf/2s1teknikinformasi/206511014/sk206511014.pdf)

Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record
Proximity Matrix
Squared Euclidean Distance
Case
1:
record
1
2:
record
2
3:
record
3
4:
record
4
5:
record
5
6:
record
6
7:
record
7
8:
record
8
9
:record
9
10:
record
10
11:
record
11
12:
record
12
1: record 1 0 1.745 3.152 5.203 10.828 7.674 9.505 5.167 9.551 5.367 9.08 5.572
2: record 2 1.745 0 0.787 1.929 6.715 6.909 6.697 3.67 7.841 3.335 7.242 3.991
3: record 3 3.152 0.787 0 2.581 8.753 4.767 7.904 3.005 10.868 2.441 6.395 5.742
4: record 4 5.203 1.929 2.581 0 3.931 6.574 8.168 1.734 15.383 6.511 8.591 6.752
5: record 5 10.828 6.715 8.753 3.931 0 9.747 3.288 6.346 19.348 17.599 7.624 5.542
6: record 6 7.674 6.909 4.767 6.574 9.747 0 8.274 2.154 24.933 11.045 5.356 10.52
7: record 7 9.505 6.697 7.904 8.168 3.288 8.274 0 9.164 14.794 17.209 3.865 2.821
8: record 8 5.167 3.67 3.005 1.734 6.346 2.154 9.164 0 21.047 7.583 7.442 9.19
9: record 9 9.551 7.841 10.868 15.383 19.348 24.933 14.794 21.047 0 9.572 22.213 11.634
10: record 10 5.367 3.335 2.441 6.511 17.599 11.045 17.209 7.583 9.572 0 16.41 13.545
11: record 11 9.08 7.242 6.395 8.591 7.624 5.356 3.865 7.442 22.213 16.41 0 3.042
12: record 12 5.572 3.991 5.742 6.752 5.542 10.52 2.821 9.19 11.634 13.545 3.042 0
13: record 13 3.368 3.296 3.879 3.141 7.463 6.105 9.193 3.032 19.355 9.768 4.907 4.58
14: record 14 8.769 7.298 7.429 11.795 9.013 7.864 1.723 11.266 12.827 15.216 4.197 4.114
15: record 15 14.681 14.796 20.792 13.172 10.882 27.823 17.221 18.833 25.818 29.264 19.27 10.588
16: record 16 4.109 6.731 9.309 7.597 10.177 11.55 11.654 7.758 21.007 16.049 8.475 5.681
17: record 17 6.002 7.649 11.602 7.442 8.066 15.4 11.578 9.59 20.236 18.634 11.308 6.095
18: record 18 1.65 2.714 2.973 6.152 8.888 3.828 5.111 4.533 12.426 8.021 4.116 3.786
19: record 19 3.12 3.11 3.31 4.162 6.002 3.343 4.736 2.98 17.321 10.355 2.062 2.828
20: record 20 3.675 3.768 4.464 5.235 6.905 6.066 5.6 5.036 17.465 12.002 2.103 1.92
21: record 21 4.805 3.43 3.74 7.451 18.065 14.105 17.678 9.614 6.473 0.572 18.8 13.463
22: record 22 0.759 2.293 4.561 3.847 8.555 8.738 10.035 4.448 11.784 7.31 10.666 6.335
23: record 23 9.218 7.038 9.193 10.956 8.677 13.404 4.636 13.016 6.401 13.06 13.829 8.521
24: record 24 5.376 5.737 8.508 6.058 4.737 8.498 5.638 6.087 14.009 13.772 11.867 8.124
25: record 25 10.099 13.655 19.026 16.319 16.015 21.972 16.956 17.359 14.895 20.894 27.415 18.238
26: record 26 7.376 6.071 7.217 6.812 5.883 6.385 4.955 6.02 13.593 11.816 11.617 9.89
27: record 27 3.568 5.102 6.06 5.814 10.941 5.945 12.161 3.652 15.907 7.62 14.74 12.998
28: record 28 3.7 5.287 5.012 6.58 14.209 4.91 14.534 3.464 17.258 5.588 14.676 14.513
29: record 29 7.854 5.985 8.622 4.754 4.055 10.28 7.286 6.176 14.005 12.692 15.065 10.625
30: record 30 11.027 12.126 10.566 13.739 17.282 4.701 14.014 7.905 24.176 13.46 16.534 19.902
31: record 31 8.038 12.123 13.456 11.977 20.293 12.118 23.986 8.285 25.73 13.068 25.431 23.51
32: record 32 7.885 7.658 5.467 9.065 13.885 1.737 10.973 4.317 21.075 8.676 10.697 14.552
33: record 33 6.095 6.704 5.127 8.157 13.951 2.294 11.97 3.707 19.701 7.43 11.823 14.462
34: record 34 12.072 17.768 16.701 18.976 26.345 8.692 25.107 10.661 35.472 18.947 22.94 26.961
35: record 35 6.729 6.849 6.85 4.267 10.963 5.531 15.967 1.79 24.298 9.008 15.718 16.245
36: record 36 3.625 5.426 6.286 4.286 10.738 6.2 14.603 2.285 22.237 9.439 12.483 11.889
This is a dissimilarity matrix

Proximity Matrix
Case
13:
record
13
14:
record
14
15:
record
15
16:
record
16
17:
record
17
18:
record
18
19:
record
19
20:
record
20
21:
record
21
22:
record
22
23:
record
23
24:
record
24
1: record 1 3.368 8.769 14.681 4.109 6.002 1.65 3.12 3.675 4.805 0.759 9.218 5.376
2: record 2 3.296 7.298 14.796 6.731 7.649 2.714 3.11 3.768 3.43 2.293 7.038 5.737
3: record 3 3.879 7.429 20.792 9.309 11.602 2.973 3.31 4.464 3.74 4.561 9.193 8.508
4: record 4 3.141 11.795 13.172 7.597 7.442 6.152 4.162 5.235 7.451 3.847 10.956 6.058
5: record 5 7.463 9.013 10.882 10.177 8.066 8.888 6.002 6.905 18.065 8.555 8.677 4.737
6: record 6 6.105 7.864 27.823 11.55 15.4 3.828 3.343 6.066 14.105 8.738 13.404 8.498
7: record 7 9.193 1.723 17.221 11.654 11.578 5.111 4.736 5.6 17.678 10.035 4.636 5.638
8: record 8 3.032 11.266 18.833 7.758 9.59 4.533 2.98 5.036 9.614 4.448 13.016 6.087
9: record 9 19.355 12.827 25.818 21.007 20.236 12.426 17.321 17.465 6.473 11.784 6.401 14.009
10: record 10 9.768 15.216 29.264 16.049 18.634 8.021 10.355 12.002 0.572 7.31 13.06 13.772
11: record 11 4.907 4.197 19.27 8.475 11.308 4.116 2.062 2.103 18.8 10.666 13.829 11.867
12: record 12 4.58 4.114 10.588 5.681 6.095 3.786 2.828 1.92 13.463 6.335 8.521 8.124
13: record 13 0 11.233 10.577 1.936 3.743 3.657 1.24 1.042 10.95 2.907 16.058 8.518
14: record 14 11.233 0 25.034 14.138 16.141 3.694 5.478 6.625 15.866 11.426 4.575 8.301
15: record 15 10.577 25.034 0 6.35 2.538 18.203 13.797 11.243 26.894 10.452 24.37 14.133
16: record 16 1.936 14.138 6.35 0 1.017 5.457 3.361 2.347 15.73 2.924 18.38 8.615
17: record 17 3.743 16.141 2.538 1.017 0 8.265 5.625 4.374 17.411 3.526 17.483 7.648
18: record 18 3.657 3.694 18.203 5.457 8.265 0 1.201 2.191 8.608 3.269 7.546 5.189
19: record 19 1.24 5.478 13.797 3.361 5.625 1.201 0 0.453 11.663 3.623 11.021 6.089
20: record 20 1.042 6.625 11.243 2.347 4.374 2.191 0.453 0 13.006 4.152 13.104 8.109
21: record 21 10.95 15.866 26.894 15.73 17.411 8.608 11.663 13.006 0 6.448 11.602 12.742
22: record 22 2.907 11.426 10.452 2.924 3.526 3.269 3.623 4.152 6.448 0 10.232 3.876
23: record 23 16.058 4.575 24.37 18.38 17.483 7.546 11.021 13.104 11.602 10.232 0 4.679
24: record 24 8.518 8.301 14.133 8.615 7.648 5.189 6.089 8.109 12.742 3.876 4.679 0
25: record 25 19.078 19.036 18.903 15.32 13.038 13.425 17.072 19.096 17.097 7.995 9.443 4.239
26: record 26 11.402 6.127 23.008 14.357 14.313 5.483 7.367 10.459 11.749 7.134 2.729 1.56
27: record 27 7.787 12.584 21.677 9.757 11.149 4.831 6.687 9.544 7.55 3.008 9.291 3.081
28: record 28 7.795 13.519 26.388 11.099 13.94 4.784 6.903 9.897 6.298 4.106 11.924 6.151
29: record 29 10.604 11.271 15.92 12.528 10.472 8.436 8.882 11.335 11.779 5.663 4.94 1.113
30: record 30 16.313 11.579 40.036 21.027 24.728 7.909 11.351 16.112 15.145 12.519 11.206 8.323
31: record 31 12.976 24.636 27.174 13.552 15.357 11.611 13.61 16.913 12.7 6.458 19.714 8.518
32: record 32 10.738 8.725 35.089 16.613 20.685 4.844 6.975 10.771 11.015 9.744 10.752 8.421
33: record 33 9.548 9.987 32.258 14.47 18.246 4.381 6.638 10.248 9.227 7.511 10.836 7.222
34: record 34 16.381 22.564 39.8 17.916 23.066 11.374 14.061 18.251 20.514 12.642 24.157 13.337
35: record 35 6.734 18.411 22.048 10.502 11.952 8.26 7.594 10.516 10.319 4.994 16.375 6.596
36: record 36 3.15 16.679 15.312 4.581 6.298 5.646 4.647 6.161 10.147 2.14 16.996 6.281

Proximity Matrix
Case
25:
record
25
26:
record
26
27:
record
27
28:
record
28
29:
record
29
30:
record
30
31:
record
31
32:
record
32
33:
record
33
34:
record
34
35:
record
35
36:
record
36
1: record 1 10.099 7.376 3.568 3.7 7.854 11.027 8.038 7.885 6.095 12.072 6.729 3.625
2: record 2 13.655 6.071 5.102 5.287 5.985 12.126 12.123 7.658 6.704 17.768 6.849 5.426
3: record 3 19.026 7.217 6.06 5.012 8.622 10.566 13.456 5.467 5.127 16.701 6.85 6.286
4: record 4 16.319 6.812 5.814 6.58 4.754 13.739 11.977 9.065 8.157 18.976 4.267 4.286
5: record 5 16.015 5.883 10.941 14.209 4.055 17.282 20.293 13.885 13.951 26.345 10.963 10.738
6: record 6 21.972 6.385 5.945 4.91 10.28 4.701 12.118 1.737 2.294 8.692 5.531 6.2
7: record 7 16.956 4.955 12.161 14.534 7.286 14.014 23.986 10.973 11.97 25.107 15.967 14.603
8: record 8 17.359 6.02 3.652 3.464 6.176 7.905 8.285 4.317 3.707 10.661 1.79 2.285
9: record 9 14.895 13.593 15.907 17.258 14.005 24.176 25.73 21.075 19.701 35.472 24.298 22.237
10: record 10 20.894 11.816 7.62 5.588 12.692 13.46 13.068 8.676 7.43 18.947 9.008 9.439
11: record 11 27.415 11.617 14.74 14.676 15.065 16.534 25.431 10.697 11.823 22.94 15.718 12.483
12: record 12 18.238 9.89 12.998 14.513 10.625 19.902 23.51 14.552 14.462 26.961 16.245 11.889
13: record 13 19.078 11.402 7.787 7.795 10.604 16.313 12.976 10.738 9.548 16.381 6.734 3.15
14: record 14 19.036 6.127 12.584 13.519 11.271 11.579 24.636 8.725 9.987 22.564 18.411 16.679
15: record 15 18.903 23.008 21.677 26.388 15.92 40.036 27.174 35.089 32.258 39.8 22.048 15.312
16: record 16 15.32 14.357 9.757 11.099 12.528 21.027 13.552 16.613 14.47 17.916 10.502 4.581
17: record 17 13.038 14.313 11.149 13.94 10.472 24.728 15.357 20.685 18.246 23.066 11.952 6.298
18: record 18 13.425 5.483 4.831 4.784 8.436 7.909 11.611 4.844 4.381 11.374 8.26 5.646
19: record 19 17.072 7.367 6.687 6.903 8.882 11.351 13.61 6.975 6.638 14.061 7.594 4.647
20: record 20 19.096 10.459 9.544 9.897 11.335 16.112 16.913 10.771 10.248 18.251 10.516 6.161
21: record 21 17.097 11.749 7.55 6.298 11.779 15.145 12.7 11.015 9.227 20.514 10.319 10.147
22: record 22 7.995 7.134 3.008 4.106 5.663 12.519 6.458 9.744 7.511 12.642 4.994 2.14
23: record 23 9.443 2.729 9.291 11.924 4.94 11.206 19.714 10.752 10.836 24.157 16.375 16.996
24: record 24 4.239 1.56 3.081 6.151 1.113 8.323 8.518 8.421 7.222 13.337 6.596 6.281
25: record 25 0 8.052 7.122 11.519 6.011 15.879 9.5 18.72 15.708 18.114 14.081 12.825
26: record 26 8.052 0 3.596 5.718 1.75 4.602 10.782 4.788 4.642 13.377 7.362 9.195
27: record 27 7.122 3.596 0 0.685 4.014 4.378 2.257 4.162 2.417 5.741 2.005 2.623
28: record 28 11.519 5.718 0.685 0 7.238 3.9 2.68 2.863 1.297 4.578 2.096 2.833
29: record 29 6.011 1.75 4.014 7.238 0 9.919 9.847 9.693 8.569 17.333 6.242 7.772
30: record 30 15.879 4.602 4.378 3.9 9.919 0 8.687 1.224 1.305 5.002 7.534 10.629
31: record 31 9.5 10.782 2.257 2.68 9.847 8.687 0 9.656 6.565 4.334 3.143 3.663
32: record 32 18.72 4.788 4.162 2.863 9.693 1.224 9.656 0 0.325 6.507 5.841 8.022
33: record 33 15.708 4.642 2.417 1.297 8.569 1.305 6.565 0.325 0 4.821 4.114 5.828
34: record 34 18.114 13.377 5.741 4.578 17.333 5.002 4.334 6.507 4.821 0 7.289 7.759
35: record 35 14.081 7.362 2.005 2.096 6.242 7.534 3.143 5.841 4.114 7.289 0 1.464
36: record 36 12.825 9.195 2.623 2.833 7.772 10.629 3.663 8.022 5.828 7.759 1.464 0

Lampiran 2:
Dendogram Data Record
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E
R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
record 32 32 -+-+
record 33 33 -+ +-----+
record 30 30 ---+ +---------+
record 6 6 ---------+ |
record 27 27 -+-----+ +-------------+
record 28 28 -+ +-+ | |
record 35 35 ---+---+ +---------+ |
record 36 36 ---+ | | |
record 31 31 ---------+ | |
record 34 34 -------------------+ |
record 24 24 ---+-+ +---------+
record 29 29 ---+ +-------+ | |
record 26 26 -----+ +-----+ | |
record 23 23 -------------+ +-------+ | |
record 5 5 -------------------+ | | |
record 7 7 -----+-----+ | | |
record 14 14 -----+ +-----------+ +-----+ |
record 11 11 ---------+-+ | | |
record 12 12 ---------+ | | |
record 2 2 -+-------+ +---+ |
record 3 3 -+ +---+ | +-----+
record 4 4 -----+---+ | | | |
record 8 8 -----+ +---------+ | |
record 1 1 -+-------+ | | |
record 22 22 -+ | | | |
record 19 19 -+-+ +---+ | |
record 20 20 -+ +---+ | | |
record 13 13 ---+ +-+ | |
record 18 18 -------+ | |
record 10 10 -+-------------------------+ | |
record 21 21 -+ +---------------+ |
record 9 9 ---------------------------+ |
record 16 16 ---+-----------+ |
record 17 17 ---+ +---------------------------------+
record 15 15 ---------------+ |
record 25 25 -------------------------------------------------+

CLUSTERING

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (11)

Similar to CLUSTERING

Similar to CLUSTERING (20)

CLUSTERING