SlideShare a Scribd company logo
1 of 24
Download to read offline
CLUSTERING ANALISYS
PENGELOMPKKAN DATA RECORD
LAPORAN HASIL UNGKAP KASUS NARKOBA PADA POLRES JAKARTA PUSAT
PERIODE 2007-2009
Diajukan untuk Memenuhi Sebagian Tugas
Mata Kuliah Analisis Peubah Ganda
Disusun Oleh :
Puti Febriani Nurjanah (3125111204)
PROGRAM STUDI MATEMATIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI JAKARTA
2014
BAB I. PENDAHULUAN
A. Latar Belakang
Selama ini masih belum diterapkannya sebuah metode dalam pengelolaan data
mengenai kasus narkona, sehingga masih belum diperolehnya informasi yang berkaitan
dengan laporan hasil ungkap kasus narkoba. Terbatasnya teknologi dalam hal ini
membuat para pihak yang terkait sulit untuk memanfaatkan secara maksimal potensi dari
data-data tersebut, padahal dari data tersebut tersimpan banyak sekali informasi berharga
yang berguna.
Oleh karena itu, hal ini memerlukan suatu teknologi yang dapat melahirkan
pengetahuan-pengetahuan baru sehingga dapat membantu pihak-pihak yang terkait. Maka
metode pengelompokkan data hadir sebagai salah satu solusi untuk pengelolaan data
secara efektif dan efisien dan bakan dapat menghasilkan informasi yang berguna bagi
para pembuat keputusan.
Dalam penelitian ini akan dilakukan analisis secara ilmiah dengan menerapkan
metode clustering analisys untuk melakukukan pengelompokkan data-data record
laporan hasil ungkap kasus narkoba periode 2007-2009 berdasarkan informasi yang
diambil dari Polres Jakarta Pusat.
B. Kajian Teori
Analisis multivariat merupakan analisis statistika yang berkaitan dengan
pendiskripsian ataupun interpretasi data yang melibatkan banyak peubah dan objek secara
bersama-sama. Salah satu interpretasi yang dimaksud adalah pengelompokan data.
Pengelompokan data merupakan pengorganisasian sekumpulan data yang besar dengan
cara membagi data tersebut kedalam beberapa gerombol (kelompok). Gerombol-
gerombol yang terbentuk akan mampu menjelaskan adanya persamaan maupun
perbedaan dari keseluruhan data yang diteliti. Tujuan dari pengelompokan data adalah
untuk mempermudah proses analisis dan interpretasi dari data besar dengan membagi
data tersebut menjadi beberapa gerombol.
Terdapat beberapa teknik dalam pengelompokan suatu data. Namun dalam tulisan
ini, pengelompokan data yang dimaksudkan adalah pengelompokan data yang didasarkan
pada objek dari data tersebut. Salah satu analisis yang sering digunakan untuk
pengelompokan ini adalah analisis gerombol (cluster). Analisis gerombol merupakan
analisis multivariat yang bertujuan untuk mengelompokkan objek-objek dari data yang
diteliti berdasarkan kesamaan karakteristik yang dimilikinya. Kesamaan karakteristik ini
biasanya diukur menggunakan ukuran kedekatan antarobjek yang dapat berupa ukuran
kemiripan atau ketakmiripannya. Analisis gerombol mampu digunakan dalam
mengelompokkan data dalam jumlah objek yang besar serta dengan skala pengukuran
peubah yang berbeda mulai dari nominal sampai interval.
Ciri-ciri suatu cluster yang baik yaitu mepunyai:
 Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu
cluster
 Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu
dengan cluster yang lain
Langkah pengelompokan dalam analisis cluster mencakup 3 hal berikut:
1. Mengukur kesamaan jarak.
2. Membentuk cluster secara hierarki.
3. Menentukan jumlah cluster.
Adapun metode pengelompokan dalam analisis cluster meliputi:
 Metode Hierarki; memulai pengelompokan dengan dua atau lebih obyek yang
mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan
seterusnya hingga cluster akan membentuk semacam „pohon‟ dimana terdapat
tingkatan (hirarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling
tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut
“dendogram”
 Metode Non-Hierarki; dimulai dengan menentukan terlebih dahulu jumlah cluster
yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka
proses cluster dilakukan dengan tanpa mengikuti proses hierarki. Metode ini biasa
disebut “K-Means Cluster”
Asumsi yang harus dipenuhi dalam Analisis Cluster yaitu:
 Sampel yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample)
 Multikolinieritas
BAB III. PEMBAHASAN
Dalam bab ini, akan diterapkan metode analisis penggerombolan atau cluster analisys
untuk mengelompokkan data record Laporan Hasil Ungkap Kasus Narkoba pada Polres
Jakarta Pusat Periode 2007-2009 sebagai berikut:
Data
Record
Heroin Ganja Shabu Ekstasi
Gol
IV
Data
Record
Heroin Ganja Shabu Ekstasi
Gol
IV
record 1 27 18 23 7 3 record 19 34 26 19 12 2
record 2 22 19 14 10 3 record 20 39 23 18 13 2
record 3 21 22 11 8 2 record 21 11 13 13 3 3
record 4 16 21 15 16 2 record 22 24 17 26 11 3
record 5 23 28 15 22 4 record 23 19 28 14 9 7
record 6 23 35 19 9 1 record 24 19 27 27 14 5
record 7 33 32 12 15 5 record 25 15 20 37 11 7
record 8 17 27 20 13 1 record 26 14 32 21 11 5
record 9 21 12 9 4 7 record 27 12 25 29 8 3
record 10 11 16 11 3 2 record 28 12 25 27 5 2
record 11 42 31 11 13 2 record 29 10 26 23 16 5
record 12 40 22 12 14 4 record 30 11 38 26 3 3
record 13 32 20 20 14 1 record 31 7 22 39 7 2
record 14 36 33 11 8 5 record 32 15 35 20 4 2
record 15 38 10 26 26 4 record 33 14 32 23 4 2
record 16 39 17 28 15 2 record 34 16 33 40 2 1
record 17 36 15 28 19 3 record 35 8 25 28 12 1
record 18 32 26 20 7 3 record 36 19 21 30 12 1
Tabel 1. Data Record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat
Periode 2007-2009
Dari data di atas, ingin diketahui pengelompokkan data-data record tersebut berdasarkan
instrumen 5 variabel, yaitu:
1. Jumlah pemakai narkoba jenis heroin
2. Jumlah pengguna narkoba jenis ganja
3. Jumlah pengguna narkoba jenis shabu
4. Jumlah pengguna narkoba jenis ekstasi
5. Jumlah pengguna narkoba jenis gol IV
Berikut langkah-langkahnya:
1. Standardisasi/Transformasi
Mengingat data yang terkumpul mempunyai variabilitas satuan, maka perlu dilakukan
langkah standardisasi atau transformasi terhadap variabel yang relevan ke bentuk z-score,
sebagai berikut:
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
Heroin 36 7.00 42.00 22.4444 10.58151
Ganja 36 10.00 38.00 24.2222 7.03506
Shabu 36 9.00 40.00 21.2500 8.19538
Ekstasi 36 2.00 26.00 10.5556 5.52110
Gol IV 36 1.00 7.00 3.0556 1.73937
Valid N (listwise) 36
Tabel 2. Statistik Deskriptif Data Record
Zheroin ZGanja ZShabu Zekstasi ZGol IV
0.43052 -0.88446 0.21353 -0.64399 -0.03194
-0.042 -0.74231 -0.88464 -0.10062 -0.03194
-0.13651 -0.31588 -1.2507 -0.46287 -0.60686
-0.60903 -0.45802 -0.76262 0.98612 -0.60686
0.0525 0.53699 -0.76262 2.07286 0.54298
0.0525 1.53201 -0.27454 -0.28175 -1.18178
0.99755 1.10557 -1.12868 0.80499 1.1179
-0.51452 0.39485 -0.15252 0.44275 -1.18178
-0.13651 -1.73733 -1.49474 -1.18736 2.26775
-1.08155 -1.16875 -1.2507 -1.36849 -0.60686
1.84809 0.96343 -1.2507 0.44275 -0.60686
1.65908 -0.31588 -1.12868 0.62387 0.54298
0.90304 -0.60017 -0.15252 0.62387 -1.18178
1.28106 1.24772 -1.2507 -0.46287 1.1179
1.47007 -2.02162 0.57959 2.79735 0.54298
1.56457 -1.0266 0.82363 0.80499 -0.60686
1.28106 -1.31089 0.82363 1.52949 -0.03194
0.90304 0.2527 -0.15252 -0.64399 -0.03194
1.09205 0.2527 -0.27454 0.26162 -0.60686
1.56457 -0.17373 -0.39656 0.44275 -0.60686
-1.08155 -1.59519 -1.00666 -1.36849 -0.03194
0.14701 -1.0266 0.57959 0.0805 -0.03194
-0.32552 0.53699 -0.88464 -0.28175 2.26775
-0.32552 0.39485 0.70161 0.62387 1.1179
-0.70353 -0.60017 1.92181 0.0805 2.26775
-0.79804 1.10557 -0.0305 0.0805 1.1179
-0.98705 0.11056 0.94565 -0.46287 -0.03194
-0.98705 0.11056 0.70161 -1.00624 -0.60686
-1.17606 0.2527 0.21353 0.98612 1.1179
-1.08155 1.95845 0.57959 -1.36849 -0.03194
-1.45957 -0.31588 2.16585 -0.64399 -0.60686
-0.70353 1.53201 -0.15252 -1.18736 -0.60686
-0.79804 1.10557 0.21353 -1.18736 -0.60686
-0.60903 1.24772 2.28787 -1.54961 -1.18178
-1.36507 0.11056 0.82363 0.26162 -1.18178
-0.32552 -0.45802 1.06767 0.26162 -1.18178
Tabel 3. Nilai Standardisasi Data Record
Untuk selanjutnya, hasil z-score inilah yang akan dipakai dasar analisis
penggerombolan. Namun apabila data yang terkumpul tidak mempunyai variabilitas
satuan, maka prose analisis penggerombolan dapat langsung dilakukan tanpa terlebih
dahulu melakukan transformasi atau standardisasi.
2. Analisis Penggerombolan
A. Metode K-Means Cluster (Non-Hierarki)
Untuk metode ini, jumlah kelompok atau gerombol sudah ditentukan. Misal k = 3,
maka didapat:
Initial Cluster Centers
Cluster
1 2 3
Zscore: Heroin -.13651 1.47007 -.60903
Zscore: Ganja -1.73733 -2.02162 1.24772
Zscore: Shabu -1.49474 .57959 2.28787
Zscore: Ekstasi -1.18736 2.79735 -1.54961
Zscore: Gol IV 2.26775 .54298 -1.18178
Tabel 4. Penggerombolan Data Record Sebelum Iterasi
Tabel diatas merupakan tampilan pertama proses penggerombolan data sebelum
dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam
proses penggerombolan dari 36 obyek yang diteliti, dapat dilihat dari tampilan output
berikut ini:
Iteration Historya
Iteration
Change in Cluster Centers
1 2 3
1 2.345 2.674 2.198
2 .277 .000 .401
3 .000 .000 .000
a. Convergence achieved due to no or small change in cluster
centers. The maximum absolute coordinate change for any center is
,000. The current iteration is 3. The minimum distance between
initial centers is 5,081.
Tabel 5. Proses Iterasi Penggerombolan Data Record
Ternyata proses penggerombolan yang dilakukan melalui 3 tahapan iterasi untuk
mendapatkan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum
antar pusat cluster yang terjadi dari hasil iterasi adalah 5,081. Adapun hasil akhir dari
proses penggerombolan digambarkan berikut ini:
Final Cluster Centers
Cluster
1 2 3
Zscore: Heroin -.15676 .99755 -.79804
Zscore: Ganja -.15343 -.47095 .66622
Zscore: Shabu -.44886 -.17471 .74599
Zscore: Ekstasi -.28175 .96965 -.61106
Zscore: Gol IV .78938 -.24100 -.76366
Tabel 6. Proses Akhir Penggerombolan Data Record
Output Final Cluster Centers tersebut diatas masih terkait dengan proses
standardisasi data sebelumnya, yang mengacu pada z-score dengan ketentuan sebagai
berikut :
 Nilai negatif (-) berarti data berada di bawah rata-rata total
 Nilai positif (+) berarti data berada di atas rata-rata total
Rumus umum yang digunakan yaitu :
Dimana :
: rata-rata sampel (variabel dalam cluster)
: rata-rata populasi
: nilai standardisasi
: standar deviasi
Sebagai contoh, apabila ingin diketahui rata-rata jumlah pengguna narkoba jenis
heroin di cluster-1 yaitu:
(rata-rata pengguna narkoba jenis heroin) + (-0.15676 x standar deviasi rata-rata
pendapatan)
Jadi rata-rata jumlah pengguna narkoba jenis heroin yang berada di cluster-1
adalah 20,78564. Demikian seterusnya dapat diketahui rata-rata nilai masing-masing
variabel dalam tiap cluster. Dari tabel output Final Cluster Centers, dengan ketentuan
yang telah dijabarkan diatas pula, dapat didefinisikan sebagai berikut:
 Cluster-1
Dalam cluster-1 ini berisikan data record yang mempunyai jumlah pengguna
narkoba yang kurang dari rata-rata populasi data record yang diteliti, hanya rata-rata
jumlah pengguna narkoba jenis Gol IV yang melebihi rata-rata. Dengan demikian,
dapat diduga bahwa cluster-1 ini merupakan pengelompokan dari data record dari
periode waktu yang tingkat penggunaan narkobanya rendah.
 Cluster-2
Karakteristik data record yang masuk dalam pengelompokan cluster-2 yaitu
memiliki rata-rata jumlah pengguna narkoba jenis heroin dan ekstasi yang melebihi
rata-rata populasi data record yang diteliti. Untuk instrumen variabel yang lain data
record di cluster-2 ini berada di bawah ratarata populasi. Dengan demikian, dapat
diduga bahwa cluster-2 ini merupakan pengelompokan dari data record dari periode
waktu yang tingkat penggunaan narkobanya sedang.
 Cluster-3
Karakteristik data record yang masuk dalam pengelompokan cluster-3 mirip
dengan karakteristik pada pengelompokan cluster-2, terdapat 2 variabel yang
melebihi rata-rata populasi data record yang diteliti, yaitu rata-rata jumlah pengguna
narkoba jenis ganja dan shabu. Untuk instrumen variabel yang lain data record di
cluster-3 ini berada di bawah ratarata populasi. Dengan demikian, dapat diduga
bahwa cluster-3 ini merupakan pengelompokan dari data record dari periode waktu
yang tingkat penggunaan narkobanya sedang.
Tahapan selanjutnya yang perlu dilakukan yaitu melihat perbedaan variabel pada
cluster yang terbentuk. Dalam hal ini dapat dilihat dari nilai F dan nilai probabilitas
(sig) masing-masing variabel, seperti tampak dalam tabel berikut:
ANOVA
Cluster Error
F Sig.Mean Square Df Mean Square df
Zscore: Heroin 9.148 2 .506 33 18.072 .000
Zscore: Ganja 3.826 2 .829 33 4.616 .017
Zscore: Shabu 4.639 2 .779 33 5.951 .006
Zscore: Ekstasi 7.781 2 .589 33 13.209 .000
Zscore: Gol IV 7.889 2 .583 33 13.543 .000
The F tests should be used only for descriptive purposes because the clusters have been
chosen to maximize the differences among cases in different clusters. The observed
significance levels are not corrected for this and thus cannot be interpreted as tests of
the hypothesis that the cluster means are equal.
Tabel 7. ANOVA Data Record
Rumus nilai F:
Dimana dalam tabel ANOVA di atas MS Between ditunjukkan oleh Means Square
dalam kolom Cluster, sedangkan MS Within ditunjukkan oleh Means Square dalam
kolom Error.
Catatan: Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada cluster yang terbentuk.
Hasil analisis dari tabel ANOVA:
Dengan demikian hasil cluster yang didapat dalam penelitian ini bahwa untuk
instrumen jumlah pengguna narkoba jenis heroin yang paling menunjukkan adanya
perbedaan diantara kota-kota pada ketiga cluster yang terbentuk. Hal ini dengan
ditunjukkannya nilai F = 18,072 dan sig = 0,000.Urutan perbedaan variabel dari yang
terbesar hingga terkecil yaitu jumlah pengguna narkoba jenis heroin, gol IV, ekstasi,
shabu dan ganja. Selanjutnya untuk mengetahui jumlah anggota masing-masing cluster
yang terbentuk dapat dilihat pada tabel output berikut ini:
Number of Cases in each Cluster
Cluster 1 14.000
2 11.000
3 11.000
Valid 36.000
Missing .000
Tabel 8. Jumlah Anggota Gerombol Data Record
Nampak jelas bahwa cluster-1 beranggotakan 12 data record, cluster-2 berisi 11
data record, dan pada cluster-3 terdapat 11 data record yang mengelompok.
Selanjutnya untuk mengetahui data record mana saja yang masuk dalam kategori tiap-
tiap cluster dapat kembali dibuka tampilan berikut ini:
Data Record QCL_1 QCL_2 Data Record QCL_1 QCL_2
record 1 1 1.45734 record 19 2 1.08523
record 2 1 1.12126 record 20 2 0.93304
record 3 1 1.62851 record 21 1 2.25846
record 4 2 1.74958 record 22 2 1.56059
record 5 2 2.02148 record 23 1 1.69725
record 6 3 1.67266 record 24 1 1.60647
record 7 1 2.16069 record 25 1 2.90438
record 8 3 1.49889 record 26 1 1.55258
record 9 1 2.57075 record 27 3 0.97042
record 10 1 2.37898 record 28 3 0.72609
record 11 2 2.08569 record 29 1 1.83251
record 12 2 1.45118 record 30 3 1.69913
record 13 2 1.01526 record 31 3 1.85576
record 14 1 2.19413 record 32 3 1.38656
record 15 2 2.67432 record 33 3 0.91282
record 16 2 1.33714 record 34 3 1.95115
record 17 2 1.46277 record 35 3 1.25408
record 18 1 1.47706 record 36 3 1.58968
Tabel 9. Anggota dari Tiap Gerombol
Perhatikan bahwa “QCL_1” menunjukkan nomor cluster dari keberadaan data
record dan “QCL_2” merupakan jarak antara obyek dengan pusat cluster. Dengan
demikian, dapat ditafsirkan sebagai berikut:
 Cluster-1:
berisikan data record ke-1, 2, 3, 7, 9, 10, 14, 18, 21, 23, 24, 25, 26, 29 dengan
masing-masing jarak terhadap pusat cluster-1 adalah 1.45734; 1.12126; 1.62851;
2.16069; 2.57075; 2.37898; 2.19413; 1.47706; 2.25846; 1.69725; 1.60647; 2.90438;
1.55258 dan 1.83251
 Cluster-2:
berisikan data record ke-4, 5, 11, 12, 13, 15, 16, 17, 19, 20, 22 dengan masing-
masing jarak terhadap pusat cluster-2 adalah 1.74958; 2.02148; 2.08569; 1.45118;
1.01526; 2.67432; 1.33714; 1.46277; 1.08523; 0.93304 dan 1.56059
 Cluster-3:
berisikan data record ke-6, 8, 27, 28, 30, 31, 32, 33, 34, 35, 36 dengan masing-
masing jarak terhadap pusat cluster-3 adalah 1.67266; 1.49889; 0.97042; 0.72609;
1.69913; 1.85576; 1.38656; 0.91282; 1.95115; 1.25408 dan 1.58968.
B. Metode Hierarchical Cluster (Hierarki)
Konsep dari metode hierarki ini dimulai dengan menggabungkan 2 obyek yang
paling mirip, kemudian gabungan 2 obyek tersebut akan bergabung lagi dengan satu
atau lebih obyek yang paling mirip lainnya. Proses clustering ini pada akhirnya akan
„menggumpal‟ menjadi satu cluster besar yang mencakup semua obyek. Metode ini
disebut juga sebagai “metode aglomerativ” yang digambarkan dengan dendogram.
Contoh kasus di atas akan dicoba untuk diselesaikan pula dengan metode aglomerativ.
Case Processing Summarya
Cases
Valid Missing Total
N Percent N Percent N Percent
36 100.0% 0 .0% 36 100.0%
a. Squared Euclidean Distance used
Tabel 10. Informasi Pemrosesan Data Record
Tabel output di atas menunjukkan bahwa semua data sejumlah 36 obyek telah
diproses tanpa ada data yang hilang.
Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record
Tabel tersebut menujukkan matriks jarak antara variabel satu dengan variabel yang
lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut
sehingga akan membentuk kelompok (cluster).
Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2
1 32 33 .325 0 0 10
2 19 20 .453 0 0 9
3 10 21 .572 0 0 30
4 27 28 .685 0 0 16
5 1 22 .759 0 0 21
6 2 3 .787 0 0 17
7 16 17 1.017 0 0 25
8 24 29 1.113 0 0 12
9 13 19 1.141 0 2 15
10 30 32 1.265 0 1 18
11 35 36 1.464 0 0 16
12 24 26 1.655 8 0 24
13 7 14 1.723 0 0 22
14 4 8 1.734 0 0 17
15 13 18 2.350 9 0 21
16 27 35 2.389 4 11 19
17 2 4 2.796 6 14 23
18 6 30 2.911 0 10 28
19 27 31 2.936 16 0 27
20 11 12 3.042 0 0 22
21 1 13 3.220 5 15 23
22 7 11 3.749 13 20 29
23 1 2 3.842 21 17 29
24 23 24 4.116 0 12 26
25 15 16 4.444 0 7 34
26 5 23 5.838 0 24 31
27 27 34 5.940 19 0 28
28 6 27 6.067 18 27 32
29 1 7 6.861 23 22 31
30 9 10 8.023 0 3 33
31 1 5 8.097 29 26 32
32 1 6 10.275 31 28 33
33 1 9 13.097 32 30 34
34 1 15 14.625 33 25 35
35 1 25 14.975 34 0 0
Tabel 12. Proses Penggerombolan Data Record Secara Bertingkat
Tabel di atas merupakan hasil proses clustering dengan metode Between Group
Linkage. Setelah jarak anatar varaibel diukur dengan jarak euclidean, maka dilakukan
pengelompokan, yang dilakukan secara bertingkat.
 Stage 1:
terbentuk 1 cluster yang beranggotakan data record 32 dan data record 33 dengan
jarak 0,325. Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka
jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 36 obyek yang ada.
Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 4. Hal ini berarti
clustering selanjutnya dilakukan dengan melihat stage 10, dengan penjelasan
berikut.
 Baris ke-10 (stage 10) terlihat obyek ke-30 (data record 30) membentuk cluster
dengan obyek ke-32 (data record 32). Dengan demikian, sekarang cluster terdiri
dari 3 obyek yaitu data record 30, data record 32 dan data record 33. Sedangkan
jarak sebesar 1.265 merupakan jarak rata-rata obyek terakhir yang bergabung
dengan 2 obyek sebelumnya, seperti tampak dalam Tabel 11 dan dapat dihitung
sebagai berikut:
- Jarak data record 30 dan data record 32 = 1,224
- Jarak Kota record 30 dan data record 33 = 1,305
- Jarak rata-rata = (1,224 + 1,305) / 2 = 1,2645 ~ 1.265 (dalam tabel di atas)
 Stage 2:
terjadi pembentukan cluster dara record 19 dan data record 20 yang berjarak 0,453),
yang kemudian berlanjut ke stage 9.
Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai ke stage terakhir.
Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang
melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya
akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya
dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah
cluster yang dibentuk. Perincian jumlah cluster dengan anggota yang terbentuk dapat
dilihat pada tabel output berikut ini:
Cluster Membership
Case 4 Clusters 3 Clusters 2 Clusters
1:record 1 1 1 1
2:record 2 1 1 1
3:record 3 1 1 1
4:record 4 1 1 1
5:record 5 1 1 1
6:record 6 1 1 1
7:record 7 1 1 1
8:record 8 1 1 1
9:record 9 2 1 1
10:record 10 2 1 1
11:record 11 1 1 1
12:record 12 1 1 1
13:record 13 1 1 1
14:record 14 1 1 1
15:record 15 3 2 1
16:record 16 3 2 1
17:record 17 3 2 1
18:record 18 1 1 1
19:record 19 1 1 1
20:record 20 1 1 1
21:record 21 2 1 1
22:record 22 1 1 1
23:record 23 1 1 1
24:record 24 1 1 1
25:record 25 4 3 2
26:record 26 1 1 1
27:record 27 1 1 1
28:record 28 1 1 1
29:record 29 1 1 1
30:record 30 1 1 1
31:record 31 1 1 1
32:record 32 1 1 1
33:record 33 1 1 1
34:record 34 1 1 1
35:record 35 1 1 1
36:record 36 1 1 1
Tabel 13. Penggerombolan Data Record Berdasarkan Jumlah Gerombol
Dari tabel diatas dapat dijabarkan bahwa:
1.Apabila diinginkan dibentuk 4 cluster, maka:
 Anggota cluster 1 adalah data record 1 s.d. 8, 11 s.d. 14, 18 s.d. 20, 22 s.d. 24
dan 26 s.d. 36
 Anggota cluster 2 adalah data record 9, 10 dan 21
 Anggota cluster 3 adalah data record 15 s.d. 17
 Anggota cluster 4 adalah data record 25
2.Apabila ditentukan dibentuk 3 cluster, maka:
 Anggota cluster 1 adalah data record 1 s.d. 14, 18 s.d. 20, 21 s.d. 24 dan 26 s.d.
36
 Anggota cluster 2 adalah data record 15 s.d. 17
 Anggota cluster 3 adalah data record 25
3.Apabila ditentukan dibentuk 2 cluster, maka:
 Anggota cluster 1 adalah data record 1 s.d. 24 dan 26 s.d. 36
 Anggota cluster 2 adalah data record 25
Lampiran 2: Dendogram Data Record
Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan
ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat
dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan data
record 32 s.d. data record 11 (sesuai urutan dalam dendogram); dan cluster 2
beranggotakan data record 12 s.d. data record 25. Apabila akan dibentuk 3 cluster,
maka cluster 1 beranggotakan data record 32 s.d. data record 29, cluster 2
beranggotakan data record 26 s.d. data record 1 dan cluster 3 beranggotakan data
record 22 s.d. data record 25. Apabila akan dibentuk 4 cluster, maka cluster 1
beranggotakan data record 32 s.d. data record 31, cluster 2 beranggotakan data record
32 s.d. data record 11, cluster 3 beranggotakan data record 12 s.d. data record 20 dan
cluster 4beranggotakan data record 13 s.d. data record 25.
BAB IV. KESIMPULAN
Terdapat dua metode dalam analisis gerombol. Pertama, metode non-hierarki yang
dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau
yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa
mengikuti proses heirarki, dan metode ini biasa disebut “K-Means Cluster”. Kedua, metode
hierarki yang memulai pengelompokan dengan dua atau lebih obyek yang mempunyai
kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga
cluster akan membentuk semacam „pohon‟ dimana terdapat tingkatan (hirarkie) yang jelas
antar obyek, dari yang paling mirip hingga yang paling tidak mirip.
Berdasarkan metode non-hierarki, kesimpulan yang dapat diambil yaitu bahwa data
record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009
berasal dari periode waktu yang tingkat penggunaan narkobanya rendah karena pada 3 cluster
yang terbentuk, cluster-1 merupakan cluster terbesar yang beranggotakan 14 data record,
sedangkan cluster-2 dan cluster-3 memiliki jumlah anggota data record yang sama, yaitu 11.
Sedangkan berdasarkan metode hierarki, kesimpulan yang bahwa data record Laporan
Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 sebaiknya
dibentuk 2 cluster yang didasarkan pada karakteristik data record 25 pada cluster-2 berbeda
dengan data record lainnya.
DAFTAR PUSTAKA
Ariawan, I Made Anom, dkk. 2013. “KOMPARASI ANALISIS GEROMBOL (CLUSTER)
DAN BIPLOT DALAM PENGELOMPOKAN”. E-Jurnal Matematika Vol. 2, No.4,
Nopember 2013, 17- 22. [ONLINE] Tersedia:
(http://ojs.unud.ac.id/index.php/mtk/article/download/7838/5914)
“MODUL 6 ANALISIS CLUSTER”. [ONLINE] Tersedia:
(http://file.upi.edu/Direktori/FPIPS/LAINNYA/MEITRI_HENING/Modul/Modul_Clus
ter.pdf)
[ONLINE] Tersedia:
(http://www.library.upnvj.ac.id/pdf/2s1teknikinformasi/206511014/sk206511014.pdf)
Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record
Proximity Matrix
Squared Euclidean Distance
Case
1:
record
1
2:
record
2
3:
record
3
4:
record
4
5:
record
5
6:
record
6
7:
record
7
8:
record
8
9
:record
9
10:
record
10
11:
record
11
12:
record
12
1: record 1 0 1.745 3.152 5.203 10.828 7.674 9.505 5.167 9.551 5.367 9.08 5.572
2: record 2 1.745 0 0.787 1.929 6.715 6.909 6.697 3.67 7.841 3.335 7.242 3.991
3: record 3 3.152 0.787 0 2.581 8.753 4.767 7.904 3.005 10.868 2.441 6.395 5.742
4: record 4 5.203 1.929 2.581 0 3.931 6.574 8.168 1.734 15.383 6.511 8.591 6.752
5: record 5 10.828 6.715 8.753 3.931 0 9.747 3.288 6.346 19.348 17.599 7.624 5.542
6: record 6 7.674 6.909 4.767 6.574 9.747 0 8.274 2.154 24.933 11.045 5.356 10.52
7: record 7 9.505 6.697 7.904 8.168 3.288 8.274 0 9.164 14.794 17.209 3.865 2.821
8: record 8 5.167 3.67 3.005 1.734 6.346 2.154 9.164 0 21.047 7.583 7.442 9.19
9: record 9 9.551 7.841 10.868 15.383 19.348 24.933 14.794 21.047 0 9.572 22.213 11.634
10: record 10 5.367 3.335 2.441 6.511 17.599 11.045 17.209 7.583 9.572 0 16.41 13.545
11: record 11 9.08 7.242 6.395 8.591 7.624 5.356 3.865 7.442 22.213 16.41 0 3.042
12: record 12 5.572 3.991 5.742 6.752 5.542 10.52 2.821 9.19 11.634 13.545 3.042 0
13: record 13 3.368 3.296 3.879 3.141 7.463 6.105 9.193 3.032 19.355 9.768 4.907 4.58
14: record 14 8.769 7.298 7.429 11.795 9.013 7.864 1.723 11.266 12.827 15.216 4.197 4.114
15: record 15 14.681 14.796 20.792 13.172 10.882 27.823 17.221 18.833 25.818 29.264 19.27 10.588
16: record 16 4.109 6.731 9.309 7.597 10.177 11.55 11.654 7.758 21.007 16.049 8.475 5.681
17: record 17 6.002 7.649 11.602 7.442 8.066 15.4 11.578 9.59 20.236 18.634 11.308 6.095
18: record 18 1.65 2.714 2.973 6.152 8.888 3.828 5.111 4.533 12.426 8.021 4.116 3.786
19: record 19 3.12 3.11 3.31 4.162 6.002 3.343 4.736 2.98 17.321 10.355 2.062 2.828
20: record 20 3.675 3.768 4.464 5.235 6.905 6.066 5.6 5.036 17.465 12.002 2.103 1.92
21: record 21 4.805 3.43 3.74 7.451 18.065 14.105 17.678 9.614 6.473 0.572 18.8 13.463
22: record 22 0.759 2.293 4.561 3.847 8.555 8.738 10.035 4.448 11.784 7.31 10.666 6.335
23: record 23 9.218 7.038 9.193 10.956 8.677 13.404 4.636 13.016 6.401 13.06 13.829 8.521
24: record 24 5.376 5.737 8.508 6.058 4.737 8.498 5.638 6.087 14.009 13.772 11.867 8.124
25: record 25 10.099 13.655 19.026 16.319 16.015 21.972 16.956 17.359 14.895 20.894 27.415 18.238
26: record 26 7.376 6.071 7.217 6.812 5.883 6.385 4.955 6.02 13.593 11.816 11.617 9.89
27: record 27 3.568 5.102 6.06 5.814 10.941 5.945 12.161 3.652 15.907 7.62 14.74 12.998
28: record 28 3.7 5.287 5.012 6.58 14.209 4.91 14.534 3.464 17.258 5.588 14.676 14.513
29: record 29 7.854 5.985 8.622 4.754 4.055 10.28 7.286 6.176 14.005 12.692 15.065 10.625
30: record 30 11.027 12.126 10.566 13.739 17.282 4.701 14.014 7.905 24.176 13.46 16.534 19.902
31: record 31 8.038 12.123 13.456 11.977 20.293 12.118 23.986 8.285 25.73 13.068 25.431 23.51
32: record 32 7.885 7.658 5.467 9.065 13.885 1.737 10.973 4.317 21.075 8.676 10.697 14.552
33: record 33 6.095 6.704 5.127 8.157 13.951 2.294 11.97 3.707 19.701 7.43 11.823 14.462
34: record 34 12.072 17.768 16.701 18.976 26.345 8.692 25.107 10.661 35.472 18.947 22.94 26.961
35: record 35 6.729 6.849 6.85 4.267 10.963 5.531 15.967 1.79 24.298 9.008 15.718 16.245
36: record 36 3.625 5.426 6.286 4.286 10.738 6.2 14.603 2.285 22.237 9.439 12.483 11.889
This is a dissimilarity matrix
Proximity Matrix
Squared Euclidean Distance
Case
13:
record
13
14:
record
14
15:
record
15
16:
record
16
17:
record
17
18:
record
18
19:
record
19
20:
record
20
21:
record
21
22:
record
22
23:
record
23
24:
record
24
1: record 1 3.368 8.769 14.681 4.109 6.002 1.65 3.12 3.675 4.805 0.759 9.218 5.376
2: record 2 3.296 7.298 14.796 6.731 7.649 2.714 3.11 3.768 3.43 2.293 7.038 5.737
3: record 3 3.879 7.429 20.792 9.309 11.602 2.973 3.31 4.464 3.74 4.561 9.193 8.508
4: record 4 3.141 11.795 13.172 7.597 7.442 6.152 4.162 5.235 7.451 3.847 10.956 6.058
5: record 5 7.463 9.013 10.882 10.177 8.066 8.888 6.002 6.905 18.065 8.555 8.677 4.737
6: record 6 6.105 7.864 27.823 11.55 15.4 3.828 3.343 6.066 14.105 8.738 13.404 8.498
7: record 7 9.193 1.723 17.221 11.654 11.578 5.111 4.736 5.6 17.678 10.035 4.636 5.638
8: record 8 3.032 11.266 18.833 7.758 9.59 4.533 2.98 5.036 9.614 4.448 13.016 6.087
9: record 9 19.355 12.827 25.818 21.007 20.236 12.426 17.321 17.465 6.473 11.784 6.401 14.009
10: record 10 9.768 15.216 29.264 16.049 18.634 8.021 10.355 12.002 0.572 7.31 13.06 13.772
11: record 11 4.907 4.197 19.27 8.475 11.308 4.116 2.062 2.103 18.8 10.666 13.829 11.867
12: record 12 4.58 4.114 10.588 5.681 6.095 3.786 2.828 1.92 13.463 6.335 8.521 8.124
13: record 13 0 11.233 10.577 1.936 3.743 3.657 1.24 1.042 10.95 2.907 16.058 8.518
14: record 14 11.233 0 25.034 14.138 16.141 3.694 5.478 6.625 15.866 11.426 4.575 8.301
15: record 15 10.577 25.034 0 6.35 2.538 18.203 13.797 11.243 26.894 10.452 24.37 14.133
16: record 16 1.936 14.138 6.35 0 1.017 5.457 3.361 2.347 15.73 2.924 18.38 8.615
17: record 17 3.743 16.141 2.538 1.017 0 8.265 5.625 4.374 17.411 3.526 17.483 7.648
18: record 18 3.657 3.694 18.203 5.457 8.265 0 1.201 2.191 8.608 3.269 7.546 5.189
19: record 19 1.24 5.478 13.797 3.361 5.625 1.201 0 0.453 11.663 3.623 11.021 6.089
20: record 20 1.042 6.625 11.243 2.347 4.374 2.191 0.453 0 13.006 4.152 13.104 8.109
21: record 21 10.95 15.866 26.894 15.73 17.411 8.608 11.663 13.006 0 6.448 11.602 12.742
22: record 22 2.907 11.426 10.452 2.924 3.526 3.269 3.623 4.152 6.448 0 10.232 3.876
23: record 23 16.058 4.575 24.37 18.38 17.483 7.546 11.021 13.104 11.602 10.232 0 4.679
24: record 24 8.518 8.301 14.133 8.615 7.648 5.189 6.089 8.109 12.742 3.876 4.679 0
25: record 25 19.078 19.036 18.903 15.32 13.038 13.425 17.072 19.096 17.097 7.995 9.443 4.239
26: record 26 11.402 6.127 23.008 14.357 14.313 5.483 7.367 10.459 11.749 7.134 2.729 1.56
27: record 27 7.787 12.584 21.677 9.757 11.149 4.831 6.687 9.544 7.55 3.008 9.291 3.081
28: record 28 7.795 13.519 26.388 11.099 13.94 4.784 6.903 9.897 6.298 4.106 11.924 6.151
29: record 29 10.604 11.271 15.92 12.528 10.472 8.436 8.882 11.335 11.779 5.663 4.94 1.113
30: record 30 16.313 11.579 40.036 21.027 24.728 7.909 11.351 16.112 15.145 12.519 11.206 8.323
31: record 31 12.976 24.636 27.174 13.552 15.357 11.611 13.61 16.913 12.7 6.458 19.714 8.518
32: record 32 10.738 8.725 35.089 16.613 20.685 4.844 6.975 10.771 11.015 9.744 10.752 8.421
33: record 33 9.548 9.987 32.258 14.47 18.246 4.381 6.638 10.248 9.227 7.511 10.836 7.222
34: record 34 16.381 22.564 39.8 17.916 23.066 11.374 14.061 18.251 20.514 12.642 24.157 13.337
35: record 35 6.734 18.411 22.048 10.502 11.952 8.26 7.594 10.516 10.319 4.994 16.375 6.596
36: record 36 3.15 16.679 15.312 4.581 6.298 5.646 4.647 6.161 10.147 2.14 16.996 6.281
This is a dissimilarity matrix
Proximity Matrix
Squared Euclidean Distance
Case
25:
record
25
26:
record
26
27:
record
27
28:
record
28
29:
record
29
30:
record
30
31:
record
31
32:
record
32
33:
record
33
34:
record
34
35:
record
35
36:
record
36
1: record 1 10.099 7.376 3.568 3.7 7.854 11.027 8.038 7.885 6.095 12.072 6.729 3.625
2: record 2 13.655 6.071 5.102 5.287 5.985 12.126 12.123 7.658 6.704 17.768 6.849 5.426
3: record 3 19.026 7.217 6.06 5.012 8.622 10.566 13.456 5.467 5.127 16.701 6.85 6.286
4: record 4 16.319 6.812 5.814 6.58 4.754 13.739 11.977 9.065 8.157 18.976 4.267 4.286
5: record 5 16.015 5.883 10.941 14.209 4.055 17.282 20.293 13.885 13.951 26.345 10.963 10.738
6: record 6 21.972 6.385 5.945 4.91 10.28 4.701 12.118 1.737 2.294 8.692 5.531 6.2
7: record 7 16.956 4.955 12.161 14.534 7.286 14.014 23.986 10.973 11.97 25.107 15.967 14.603
8: record 8 17.359 6.02 3.652 3.464 6.176 7.905 8.285 4.317 3.707 10.661 1.79 2.285
9: record 9 14.895 13.593 15.907 17.258 14.005 24.176 25.73 21.075 19.701 35.472 24.298 22.237
10: record 10 20.894 11.816 7.62 5.588 12.692 13.46 13.068 8.676 7.43 18.947 9.008 9.439
11: record 11 27.415 11.617 14.74 14.676 15.065 16.534 25.431 10.697 11.823 22.94 15.718 12.483
12: record 12 18.238 9.89 12.998 14.513 10.625 19.902 23.51 14.552 14.462 26.961 16.245 11.889
13: record 13 19.078 11.402 7.787 7.795 10.604 16.313 12.976 10.738 9.548 16.381 6.734 3.15
14: record 14 19.036 6.127 12.584 13.519 11.271 11.579 24.636 8.725 9.987 22.564 18.411 16.679
15: record 15 18.903 23.008 21.677 26.388 15.92 40.036 27.174 35.089 32.258 39.8 22.048 15.312
16: record 16 15.32 14.357 9.757 11.099 12.528 21.027 13.552 16.613 14.47 17.916 10.502 4.581
17: record 17 13.038 14.313 11.149 13.94 10.472 24.728 15.357 20.685 18.246 23.066 11.952 6.298
18: record 18 13.425 5.483 4.831 4.784 8.436 7.909 11.611 4.844 4.381 11.374 8.26 5.646
19: record 19 17.072 7.367 6.687 6.903 8.882 11.351 13.61 6.975 6.638 14.061 7.594 4.647
20: record 20 19.096 10.459 9.544 9.897 11.335 16.112 16.913 10.771 10.248 18.251 10.516 6.161
21: record 21 17.097 11.749 7.55 6.298 11.779 15.145 12.7 11.015 9.227 20.514 10.319 10.147
22: record 22 7.995 7.134 3.008 4.106 5.663 12.519 6.458 9.744 7.511 12.642 4.994 2.14
23: record 23 9.443 2.729 9.291 11.924 4.94 11.206 19.714 10.752 10.836 24.157 16.375 16.996
24: record 24 4.239 1.56 3.081 6.151 1.113 8.323 8.518 8.421 7.222 13.337 6.596 6.281
25: record 25 0 8.052 7.122 11.519 6.011 15.879 9.5 18.72 15.708 18.114 14.081 12.825
26: record 26 8.052 0 3.596 5.718 1.75 4.602 10.782 4.788 4.642 13.377 7.362 9.195
27: record 27 7.122 3.596 0 0.685 4.014 4.378 2.257 4.162 2.417 5.741 2.005 2.623
28: record 28 11.519 5.718 0.685 0 7.238 3.9 2.68 2.863 1.297 4.578 2.096 2.833
29: record 29 6.011 1.75 4.014 7.238 0 9.919 9.847 9.693 8.569 17.333 6.242 7.772
30: record 30 15.879 4.602 4.378 3.9 9.919 0 8.687 1.224 1.305 5.002 7.534 10.629
31: record 31 9.5 10.782 2.257 2.68 9.847 8.687 0 9.656 6.565 4.334 3.143 3.663
32: record 32 18.72 4.788 4.162 2.863 9.693 1.224 9.656 0 0.325 6.507 5.841 8.022
33: record 33 15.708 4.642 2.417 1.297 8.569 1.305 6.565 0.325 0 4.821 4.114 5.828
34: record 34 18.114 13.377 5.741 4.578 17.333 5.002 4.334 6.507 4.821 0 7.289 7.759
35: record 35 14.081 7.362 2.005 2.096 6.242 7.534 3.143 5.841 4.114 7.289 0 1.464
36: record 36 12.825 9.195 2.623 2.833 7.772 10.629 3.663 8.022 5.828 7.759 1.464 0
This is a dissimilarity matrix
Lampiran 2:
Dendogram Data Record
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E
R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
record 32 32 -+-+
record 33 33 -+ +-----+
record 30 30 ---+ +---------+
record 6 6 ---------+ |
record 27 27 -+-----+ +-------------+
record 28 28 -+ +-+ | |
record 35 35 ---+---+ +---------+ |
record 36 36 ---+ | | |
record 31 31 ---------+ | |
record 34 34 -------------------+ |
record 24 24 ---+-+ +---------+
record 29 29 ---+ +-------+ | |
record 26 26 -----+ +-----+ | |
record 23 23 -------------+ +-------+ | |
record 5 5 -------------------+ | | |
record 7 7 -----+-----+ | | |
record 14 14 -----+ +-----------+ +-----+ |
record 11 11 ---------+-+ | | |
record 12 12 ---------+ | | |
record 2 2 -+-------+ +---+ |
record 3 3 -+ +---+ | +-----+
record 4 4 -----+---+ | | | |
record 8 8 -----+ +---------+ | |
record 1 1 -+-------+ | | |
record 22 22 -+ | | | |
record 19 19 -+-+ +---+ | |
record 20 20 -+ +---+ | | |
record 13 13 ---+ +-+ | |
record 18 18 -------+ | |
record 10 10 -+-------------------------+ | |
record 21 21 -+ +---------------+ |
record 9 9 ---------------------------+ |
record 16 16 ---+-----------+ |
record 17 17 ---+ +---------------------------------+
record 15 15 ---------------+ |
record 25 25 -------------------------------------------------+

More Related Content

What's hot

Contoh soal Metode Simpleks
Contoh soal Metode SimpleksContoh soal Metode Simpleks
Contoh soal Metode SimpleksReza Mahendra
 
Median, Modus dan mean data berkelompok.ppt
Median, Modus dan mean data berkelompok.pptMedian, Modus dan mean data berkelompok.ppt
Median, Modus dan mean data berkelompok.pptZuLfiyahArdiansyah
 
(Jst)hebb dan delta rule
(Jst)hebb dan delta rule(Jst)hebb dan delta rule
(Jst)hebb dan delta ruleJunior Iqfar
 
Pengertian field, record, table, file, data dan basis data lengkap pengerti...
Pengertian field, record, table, file, data dan basis data lengkap   pengerti...Pengertian field, record, table, file, data dan basis data lengkap   pengerti...
Pengertian field, record, table, file, data dan basis data lengkap pengerti...ym.ygrex@comp
 
linear programming metode simplex
linear programming metode simplexlinear programming metode simplex
linear programming metode simplexBambang Kristiono
 
Pengolahan Data MS. Access
Pengolahan Data MS. AccessPengolahan Data MS. Access
Pengolahan Data MS. AccessIAIN PEKALONGAN
 
Bab iv hasil penelitian dan pembahasan
Bab iv hasil penelitian dan pembahasanBab iv hasil penelitian dan pembahasan
Bab iv hasil penelitian dan pembahasanLulu Nurul
 
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data miningaiiniR
 
Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...
Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...
Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...Sarminto S.Kom
 
Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...
Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...
Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...Wulandari Rima Kumari
 
Peubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinuPeubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinuAnderzend Awuy
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forestIrwansyahSaputra1
 
Ukuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan dataUkuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan dataSriwijaya University
 

What's hot (20)

Contoh soal Metode Simpleks
Contoh soal Metode SimpleksContoh soal Metode Simpleks
Contoh soal Metode Simpleks
 
Median, Modus dan mean data berkelompok.ppt
Median, Modus dan mean data berkelompok.pptMedian, Modus dan mean data berkelompok.ppt
Median, Modus dan mean data berkelompok.ppt
 
Uji tukey & Uji scheffe
Uji tukey & Uji scheffeUji tukey & Uji scheffe
Uji tukey & Uji scheffe
 
1 pengantar statistik
1 pengantar statistik1 pengantar statistik
1 pengantar statistik
 
Jaringan hebb
Jaringan hebbJaringan hebb
Jaringan hebb
 
(Jst)hebb dan delta rule
(Jst)hebb dan delta rule(Jst)hebb dan delta rule
(Jst)hebb dan delta rule
 
Pengertian field, record, table, file, data dan basis data lengkap pengerti...
Pengertian field, record, table, file, data dan basis data lengkap   pengerti...Pengertian field, record, table, file, data dan basis data lengkap   pengerti...
Pengertian field, record, table, file, data dan basis data lengkap pengerti...
 
Tabel uji-wilcoxon
Tabel uji-wilcoxonTabel uji-wilcoxon
Tabel uji-wilcoxon
 
Uji-T
Uji-TUji-T
Uji-T
 
linear programming metode simplex
linear programming metode simplexlinear programming metode simplex
linear programming metode simplex
 
Pengolahan Data MS. Access
Pengolahan Data MS. AccessPengolahan Data MS. Access
Pengolahan Data MS. Access
 
Bab iv hasil penelitian dan pembahasan
Bab iv hasil penelitian dan pembahasanBab iv hasil penelitian dan pembahasan
Bab iv hasil penelitian dan pembahasan
 
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
 
Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...
Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...
Presentation Sidang Skripsi Teknik Informatika "Aplikasi Pembelajaran Bahasa ...
 
Pertemuan 4
Pertemuan 4Pertemuan 4
Pertemuan 4
 
Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...
Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...
Contoh Review Jurnal Ilmiah (PENGARUH KEPEMIMPINAN, BUDAYA ORGANISASI DAN LIN...
 
Peubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinuPeubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinu
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forest
 
Ukuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan dataUkuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan data
 
Kisi kisi sbp
Kisi kisi sbpKisi kisi sbp
Kisi kisi sbp
 

Viewers also liked

Kp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasional
Kp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasionalKp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasional
Kp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasionalYanggi Herdiana
 
Analisis cluster
Analisis clusterAnalisis cluster
Analisis clusternissa syifa
 
Aplikasi spss pada statistik multivariat
Aplikasi spss pada statistik multivariatAplikasi spss pada statistik multivariat
Aplikasi spss pada statistik multivariatAyu Febriyanti
 
Iv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtr
Iv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtrIv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtr
Iv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtrGusti Rusmayadi
 
Beberapa model analisis data
Beberapa model analisis dataBeberapa model analisis data
Beberapa model analisis dataIr. Zakaria, M.M
 
ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...
ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...
ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...Uofa_Unsada
 

Viewers also liked (11)

Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
 
Kp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasional
Kp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasionalKp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasional
Kp 414-tahun-2013-ttg-rencana-induk-pelabuhan-nasional
 
analisis kluster
analisis klusteranalisis kluster
analisis kluster
 
Analisis cluster
Analisis clusterAnalisis cluster
Analisis cluster
 
Analisis Cluster
Analisis ClusterAnalisis Cluster
Analisis Cluster
 
Analisis cluster
Analisis clusterAnalisis cluster
Analisis cluster
 
Aplikasi spss pada statistik multivariat
Aplikasi spss pada statistik multivariatAplikasi spss pada statistik multivariat
Aplikasi spss pada statistik multivariat
 
Analisis faktor
Analisis faktorAnalisis faktor
Analisis faktor
 
Iv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtr
Iv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtrIv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtr
Iv curah hujan, analisis data hilang, peluang hujan dan evapotranspirasi gtr
 
Beberapa model analisis data
Beberapa model analisis dataBeberapa model analisis data
Beberapa model analisis data
 
ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...
ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...
ANALISIS FAKTOR MOTIVASI KERJA PEGAWAI NEGERI SIPIL (PNS) DI KANTOR SUKU DINA...
 

Similar to CLUSTERING

Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...
Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...
Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...dafdimas
 
kiki andriani , 5 metode sorting
kiki andriani , 5 metode sortingkiki andriani , 5 metode sorting
kiki andriani , 5 metode sortingkiki andriani
 
Pertemuan 11 (uji normalitas dan homogenitas)
Pertemuan 11 (uji normalitas dan homogenitas)Pertemuan 11 (uji normalitas dan homogenitas)
Pertemuan 11 (uji normalitas dan homogenitas)reno sutriono
 
Laporan praktikum teori peluang 3
Laporan praktikum teori peluang 3 Laporan praktikum teori peluang 3
Laporan praktikum teori peluang 3 zenardjov
 
STATISTIK DAN PROBABILITAS TEKNIK ANALISA DATA
STATISTIK DAN PROBABILITAS TEKNIK ANALISA DATASTATISTIK DAN PROBABILITAS TEKNIK ANALISA DATA
STATISTIK DAN PROBABILITAS TEKNIK ANALISA DATASeptianDanu2
 
Dasar Dasar Statistika
Dasar Dasar StatistikaDasar Dasar Statistika
Dasar Dasar Statistikaformatik
 
Statistika presentasi: untuk mahasiswa PKN LPKIA
Statistika presentasi: untuk mahasiswa PKN LPKIAStatistika presentasi: untuk mahasiswa PKN LPKIA
Statistika presentasi: untuk mahasiswa PKN LPKIAguest232a662
 
Analisis Statistik
Analisis StatistikAnalisis Statistik
Analisis Statistikrianjuanda
 
Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...
Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...
Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...Sally Indah N
 
Laporan praktikum teori peluang 6
Laporan praktikum teori peluang 6Laporan praktikum teori peluang 6
Laporan praktikum teori peluang 6zenardjov
 
Probabilitas
ProbabilitasProbabilitas
Probabilitasprihase
 
Tm aljabar linear matriks
Tm aljabar linear matriksTm aljabar linear matriks
Tm aljabar linear matriksEno Mandala
 
4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx
4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx
4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptxAminullah Assagaf
 
Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021Aminullah Assagaf
 
Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021Aminullah Assagaf
 
Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...
Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...
Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...Aminullah Assagaf
 

Similar to CLUSTERING (20)

Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...
Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...
Klasifikasi Data Indian Liver Patient dengan Metode Logistic Regression, k- N...
 
kiki andriani , 5 metode sorting
kiki andriani , 5 metode sortingkiki andriani , 5 metode sorting
kiki andriani , 5 metode sorting
 
STATISTIK 1.ppt
STATISTIK 1.pptSTATISTIK 1.ppt
STATISTIK 1.ppt
 
Pertemuan 11 (uji normalitas dan homogenitas)
Pertemuan 11 (uji normalitas dan homogenitas)Pertemuan 11 (uji normalitas dan homogenitas)
Pertemuan 11 (uji normalitas dan homogenitas)
 
Laporan praktikum teori peluang 3
Laporan praktikum teori peluang 3 Laporan praktikum teori peluang 3
Laporan praktikum teori peluang 3
 
STATISTIK DAN PROBABILITAS TEKNIK ANALISA DATA
STATISTIK DAN PROBABILITAS TEKNIK ANALISA DATASTATISTIK DAN PROBABILITAS TEKNIK ANALISA DATA
STATISTIK DAN PROBABILITAS TEKNIK ANALISA DATA
 
STATISTIK DESKRIPTIF
STATISTIK DESKRIPTIFSTATISTIK DESKRIPTIF
STATISTIK DESKRIPTIF
 
Dasar Dasar Statistika
Dasar Dasar StatistikaDasar Dasar Statistika
Dasar Dasar Statistika
 
Resti hapriyanti 1830106114 statistika
Resti hapriyanti 1830106114 statistikaResti hapriyanti 1830106114 statistika
Resti hapriyanti 1830106114 statistika
 
Statistika presentasi: untuk mahasiswa PKN LPKIA
Statistika presentasi: untuk mahasiswa PKN LPKIAStatistika presentasi: untuk mahasiswa PKN LPKIA
Statistika presentasi: untuk mahasiswa PKN LPKIA
 
Analisis Statistik
Analisis StatistikAnalisis Statistik
Analisis Statistik
 
Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...
Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...
Laporan praktikum analisis cluster (tipologi kinerja sarana dan prasarana kec...
 
Laporan praktikum teori peluang 6
Laporan praktikum teori peluang 6Laporan praktikum teori peluang 6
Laporan praktikum teori peluang 6
 
Probabilitas
ProbabilitasProbabilitas
Probabilitas
 
Tm aljabar linear matriks
Tm aljabar linear matriksTm aljabar linear matriks
Tm aljabar linear matriks
 
Tahapan tahapan Penelitian.pdf
Tahapan tahapan Penelitian.pdfTahapan tahapan Penelitian.pdf
Tahapan tahapan Penelitian.pdf
 
4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx
4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx
4_Aminullah Assagaf_IMPLEMENTASI SOFTWARE STATISTIK & ANALISIS_27 Juni 2020.pptx
 
Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021
 
Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021Aminullah assagaf p9 12-metode penelitian_14 ags 2021
Aminullah assagaf p9 12-metode penelitian_14 ags 2021
 
Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...
Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...
Aminullah assagaf revisi implementasi software statistik &amp; analisis 27 ju...
 

CLUSTERING

  • 1. CLUSTERING ANALISYS PENGELOMPKKAN DATA RECORD LAPORAN HASIL UNGKAP KASUS NARKOBA PADA POLRES JAKARTA PUSAT PERIODE 2007-2009 Diajukan untuk Memenuhi Sebagian Tugas Mata Kuliah Analisis Peubah Ganda Disusun Oleh : Puti Febriani Nurjanah (3125111204) PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI JAKARTA 2014
  • 2. BAB I. PENDAHULUAN A. Latar Belakang Selama ini masih belum diterapkannya sebuah metode dalam pengelolaan data mengenai kasus narkona, sehingga masih belum diperolehnya informasi yang berkaitan dengan laporan hasil ungkap kasus narkoba. Terbatasnya teknologi dalam hal ini membuat para pihak yang terkait sulit untuk memanfaatkan secara maksimal potensi dari data-data tersebut, padahal dari data tersebut tersimpan banyak sekali informasi berharga yang berguna. Oleh karena itu, hal ini memerlukan suatu teknologi yang dapat melahirkan pengetahuan-pengetahuan baru sehingga dapat membantu pihak-pihak yang terkait. Maka metode pengelompokkan data hadir sebagai salah satu solusi untuk pengelolaan data secara efektif dan efisien dan bakan dapat menghasilkan informasi yang berguna bagi para pembuat keputusan. Dalam penelitian ini akan dilakukan analisis secara ilmiah dengan menerapkan metode clustering analisys untuk melakukukan pengelompokkan data-data record laporan hasil ungkap kasus narkoba periode 2007-2009 berdasarkan informasi yang diambil dari Polres Jakarta Pusat. B. Kajian Teori Analisis multivariat merupakan analisis statistika yang berkaitan dengan pendiskripsian ataupun interpretasi data yang melibatkan banyak peubah dan objek secara bersama-sama. Salah satu interpretasi yang dimaksud adalah pengelompokan data. Pengelompokan data merupakan pengorganisasian sekumpulan data yang besar dengan cara membagi data tersebut kedalam beberapa gerombol (kelompok). Gerombol- gerombol yang terbentuk akan mampu menjelaskan adanya persamaan maupun perbedaan dari keseluruhan data yang diteliti. Tujuan dari pengelompokan data adalah untuk mempermudah proses analisis dan interpretasi dari data besar dengan membagi data tersebut menjadi beberapa gerombol. Terdapat beberapa teknik dalam pengelompokan suatu data. Namun dalam tulisan ini, pengelompokan data yang dimaksudkan adalah pengelompokan data yang didasarkan pada objek dari data tersebut. Salah satu analisis yang sering digunakan untuk pengelompokan ini adalah analisis gerombol (cluster). Analisis gerombol merupakan
  • 3. analisis multivariat yang bertujuan untuk mengelompokkan objek-objek dari data yang diteliti berdasarkan kesamaan karakteristik yang dimilikinya. Kesamaan karakteristik ini biasanya diukur menggunakan ukuran kedekatan antarobjek yang dapat berupa ukuran kemiripan atau ketakmiripannya. Analisis gerombol mampu digunakan dalam mengelompokkan data dalam jumlah objek yang besar serta dengan skala pengukuran peubah yang berbeda mulai dari nominal sampai interval. Ciri-ciri suatu cluster yang baik yaitu mepunyai:  Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu cluster  Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu dengan cluster yang lain Langkah pengelompokan dalam analisis cluster mencakup 3 hal berikut: 1. Mengukur kesamaan jarak. 2. Membentuk cluster secara hierarki. 3. Menentukan jumlah cluster. Adapun metode pengelompokan dalam analisis cluster meliputi:  Metode Hierarki; memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga cluster akan membentuk semacam „pohon‟ dimana terdapat tingkatan (hirarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut “dendogram”  Metode Non-Hierarki; dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses hierarki. Metode ini biasa disebut “K-Means Cluster” Asumsi yang harus dipenuhi dalam Analisis Cluster yaitu:  Sampel yang diambil benar-benar dapat mewakili populasi yang ada (representativeness of the sample)  Multikolinieritas
  • 4. BAB III. PEMBAHASAN Dalam bab ini, akan diterapkan metode analisis penggerombolan atau cluster analisys untuk mengelompokkan data record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 sebagai berikut: Data Record Heroin Ganja Shabu Ekstasi Gol IV Data Record Heroin Ganja Shabu Ekstasi Gol IV record 1 27 18 23 7 3 record 19 34 26 19 12 2 record 2 22 19 14 10 3 record 20 39 23 18 13 2 record 3 21 22 11 8 2 record 21 11 13 13 3 3 record 4 16 21 15 16 2 record 22 24 17 26 11 3 record 5 23 28 15 22 4 record 23 19 28 14 9 7 record 6 23 35 19 9 1 record 24 19 27 27 14 5 record 7 33 32 12 15 5 record 25 15 20 37 11 7 record 8 17 27 20 13 1 record 26 14 32 21 11 5 record 9 21 12 9 4 7 record 27 12 25 29 8 3 record 10 11 16 11 3 2 record 28 12 25 27 5 2 record 11 42 31 11 13 2 record 29 10 26 23 16 5 record 12 40 22 12 14 4 record 30 11 38 26 3 3 record 13 32 20 20 14 1 record 31 7 22 39 7 2 record 14 36 33 11 8 5 record 32 15 35 20 4 2 record 15 38 10 26 26 4 record 33 14 32 23 4 2 record 16 39 17 28 15 2 record 34 16 33 40 2 1 record 17 36 15 28 19 3 record 35 8 25 28 12 1 record 18 32 26 20 7 3 record 36 19 21 30 12 1 Tabel 1. Data Record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 Dari data di atas, ingin diketahui pengelompokkan data-data record tersebut berdasarkan instrumen 5 variabel, yaitu: 1. Jumlah pemakai narkoba jenis heroin 2. Jumlah pengguna narkoba jenis ganja 3. Jumlah pengguna narkoba jenis shabu 4. Jumlah pengguna narkoba jenis ekstasi 5. Jumlah pengguna narkoba jenis gol IV
  • 5. Berikut langkah-langkahnya: 1. Standardisasi/Transformasi Mengingat data yang terkumpul mempunyai variabilitas satuan, maka perlu dilakukan langkah standardisasi atau transformasi terhadap variabel yang relevan ke bentuk z-score, sebagai berikut: Descriptive Statistics N Minimum Maximum Mean Std. Deviation Heroin 36 7.00 42.00 22.4444 10.58151 Ganja 36 10.00 38.00 24.2222 7.03506 Shabu 36 9.00 40.00 21.2500 8.19538 Ekstasi 36 2.00 26.00 10.5556 5.52110 Gol IV 36 1.00 7.00 3.0556 1.73937 Valid N (listwise) 36 Tabel 2. Statistik Deskriptif Data Record Zheroin ZGanja ZShabu Zekstasi ZGol IV 0.43052 -0.88446 0.21353 -0.64399 -0.03194 -0.042 -0.74231 -0.88464 -0.10062 -0.03194 -0.13651 -0.31588 -1.2507 -0.46287 -0.60686 -0.60903 -0.45802 -0.76262 0.98612 -0.60686 0.0525 0.53699 -0.76262 2.07286 0.54298 0.0525 1.53201 -0.27454 -0.28175 -1.18178 0.99755 1.10557 -1.12868 0.80499 1.1179 -0.51452 0.39485 -0.15252 0.44275 -1.18178 -0.13651 -1.73733 -1.49474 -1.18736 2.26775 -1.08155 -1.16875 -1.2507 -1.36849 -0.60686 1.84809 0.96343 -1.2507 0.44275 -0.60686 1.65908 -0.31588 -1.12868 0.62387 0.54298 0.90304 -0.60017 -0.15252 0.62387 -1.18178
  • 6. 1.28106 1.24772 -1.2507 -0.46287 1.1179 1.47007 -2.02162 0.57959 2.79735 0.54298 1.56457 -1.0266 0.82363 0.80499 -0.60686 1.28106 -1.31089 0.82363 1.52949 -0.03194 0.90304 0.2527 -0.15252 -0.64399 -0.03194 1.09205 0.2527 -0.27454 0.26162 -0.60686 1.56457 -0.17373 -0.39656 0.44275 -0.60686 -1.08155 -1.59519 -1.00666 -1.36849 -0.03194 0.14701 -1.0266 0.57959 0.0805 -0.03194 -0.32552 0.53699 -0.88464 -0.28175 2.26775 -0.32552 0.39485 0.70161 0.62387 1.1179 -0.70353 -0.60017 1.92181 0.0805 2.26775 -0.79804 1.10557 -0.0305 0.0805 1.1179 -0.98705 0.11056 0.94565 -0.46287 -0.03194 -0.98705 0.11056 0.70161 -1.00624 -0.60686 -1.17606 0.2527 0.21353 0.98612 1.1179 -1.08155 1.95845 0.57959 -1.36849 -0.03194 -1.45957 -0.31588 2.16585 -0.64399 -0.60686 -0.70353 1.53201 -0.15252 -1.18736 -0.60686 -0.79804 1.10557 0.21353 -1.18736 -0.60686 -0.60903 1.24772 2.28787 -1.54961 -1.18178 -1.36507 0.11056 0.82363 0.26162 -1.18178 -0.32552 -0.45802 1.06767 0.26162 -1.18178 Tabel 3. Nilai Standardisasi Data Record Untuk selanjutnya, hasil z-score inilah yang akan dipakai dasar analisis penggerombolan. Namun apabila data yang terkumpul tidak mempunyai variabilitas satuan, maka prose analisis penggerombolan dapat langsung dilakukan tanpa terlebih dahulu melakukan transformasi atau standardisasi.
  • 7. 2. Analisis Penggerombolan A. Metode K-Means Cluster (Non-Hierarki) Untuk metode ini, jumlah kelompok atau gerombol sudah ditentukan. Misal k = 3, maka didapat: Initial Cluster Centers Cluster 1 2 3 Zscore: Heroin -.13651 1.47007 -.60903 Zscore: Ganja -1.73733 -2.02162 1.24772 Zscore: Shabu -1.49474 .57959 2.28787 Zscore: Ekstasi -1.18736 2.79735 -1.54961 Zscore: Gol IV 2.26775 .54298 -1.18178 Tabel 4. Penggerombolan Data Record Sebelum Iterasi Tabel diatas merupakan tampilan pertama proses penggerombolan data sebelum dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam proses penggerombolan dari 36 obyek yang diteliti, dapat dilihat dari tampilan output berikut ini: Iteration Historya Iteration Change in Cluster Centers 1 2 3 1 2.345 2.674 2.198 2 .277 .000 .401 3 .000 .000 .000 a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,000. The current iteration is 3. The minimum distance between initial centers is 5,081. Tabel 5. Proses Iterasi Penggerombolan Data Record
  • 8. Ternyata proses penggerombolan yang dilakukan melalui 3 tahapan iterasi untuk mendapatkan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari hasil iterasi adalah 5,081. Adapun hasil akhir dari proses penggerombolan digambarkan berikut ini: Final Cluster Centers Cluster 1 2 3 Zscore: Heroin -.15676 .99755 -.79804 Zscore: Ganja -.15343 -.47095 .66622 Zscore: Shabu -.44886 -.17471 .74599 Zscore: Ekstasi -.28175 .96965 -.61106 Zscore: Gol IV .78938 -.24100 -.76366 Tabel 6. Proses Akhir Penggerombolan Data Record Output Final Cluster Centers tersebut diatas masih terkait dengan proses standardisasi data sebelumnya, yang mengacu pada z-score dengan ketentuan sebagai berikut :  Nilai negatif (-) berarti data berada di bawah rata-rata total  Nilai positif (+) berarti data berada di atas rata-rata total Rumus umum yang digunakan yaitu : Dimana : : rata-rata sampel (variabel dalam cluster) : rata-rata populasi : nilai standardisasi : standar deviasi
  • 9. Sebagai contoh, apabila ingin diketahui rata-rata jumlah pengguna narkoba jenis heroin di cluster-1 yaitu: (rata-rata pengguna narkoba jenis heroin) + (-0.15676 x standar deviasi rata-rata pendapatan) Jadi rata-rata jumlah pengguna narkoba jenis heroin yang berada di cluster-1 adalah 20,78564. Demikian seterusnya dapat diketahui rata-rata nilai masing-masing variabel dalam tiap cluster. Dari tabel output Final Cluster Centers, dengan ketentuan yang telah dijabarkan diatas pula, dapat didefinisikan sebagai berikut:  Cluster-1 Dalam cluster-1 ini berisikan data record yang mempunyai jumlah pengguna narkoba yang kurang dari rata-rata populasi data record yang diteliti, hanya rata-rata jumlah pengguna narkoba jenis Gol IV yang melebihi rata-rata. Dengan demikian, dapat diduga bahwa cluster-1 ini merupakan pengelompokan dari data record dari periode waktu yang tingkat penggunaan narkobanya rendah.  Cluster-2 Karakteristik data record yang masuk dalam pengelompokan cluster-2 yaitu memiliki rata-rata jumlah pengguna narkoba jenis heroin dan ekstasi yang melebihi rata-rata populasi data record yang diteliti. Untuk instrumen variabel yang lain data record di cluster-2 ini berada di bawah ratarata populasi. Dengan demikian, dapat diduga bahwa cluster-2 ini merupakan pengelompokan dari data record dari periode waktu yang tingkat penggunaan narkobanya sedang.  Cluster-3 Karakteristik data record yang masuk dalam pengelompokan cluster-3 mirip dengan karakteristik pada pengelompokan cluster-2, terdapat 2 variabel yang melebihi rata-rata populasi data record yang diteliti, yaitu rata-rata jumlah pengguna narkoba jenis ganja dan shabu. Untuk instrumen variabel yang lain data record di cluster-3 ini berada di bawah ratarata populasi. Dengan demikian, dapat diduga bahwa cluster-3 ini merupakan pengelompokan dari data record dari periode waktu yang tingkat penggunaan narkobanya sedang.
  • 10. Tahapan selanjutnya yang perlu dilakukan yaitu melihat perbedaan variabel pada cluster yang terbentuk. Dalam hal ini dapat dilihat dari nilai F dan nilai probabilitas (sig) masing-masing variabel, seperti tampak dalam tabel berikut: ANOVA Cluster Error F Sig.Mean Square Df Mean Square df Zscore: Heroin 9.148 2 .506 33 18.072 .000 Zscore: Ganja 3.826 2 .829 33 4.616 .017 Zscore: Shabu 4.639 2 .779 33 5.951 .006 Zscore: Ekstasi 7.781 2 .589 33 13.209 .000 Zscore: Gol IV 7.889 2 .583 33 13.543 .000 The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal. Tabel 7. ANOVA Data Record Rumus nilai F: Dimana dalam tabel ANOVA di atas MS Between ditunjukkan oleh Means Square dalam kolom Cluster, sedangkan MS Within ditunjukkan oleh Means Square dalam kolom Error. Catatan: Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan variabel pada cluster yang terbentuk.
  • 11. Hasil analisis dari tabel ANOVA: Dengan demikian hasil cluster yang didapat dalam penelitian ini bahwa untuk instrumen jumlah pengguna narkoba jenis heroin yang paling menunjukkan adanya perbedaan diantara kota-kota pada ketiga cluster yang terbentuk. Hal ini dengan ditunjukkannya nilai F = 18,072 dan sig = 0,000.Urutan perbedaan variabel dari yang terbesar hingga terkecil yaitu jumlah pengguna narkoba jenis heroin, gol IV, ekstasi, shabu dan ganja. Selanjutnya untuk mengetahui jumlah anggota masing-masing cluster yang terbentuk dapat dilihat pada tabel output berikut ini: Number of Cases in each Cluster Cluster 1 14.000 2 11.000 3 11.000 Valid 36.000 Missing .000 Tabel 8. Jumlah Anggota Gerombol Data Record Nampak jelas bahwa cluster-1 beranggotakan 12 data record, cluster-2 berisi 11 data record, dan pada cluster-3 terdapat 11 data record yang mengelompok. Selanjutnya untuk mengetahui data record mana saja yang masuk dalam kategori tiap- tiap cluster dapat kembali dibuka tampilan berikut ini: Data Record QCL_1 QCL_2 Data Record QCL_1 QCL_2 record 1 1 1.45734 record 19 2 1.08523 record 2 1 1.12126 record 20 2 0.93304 record 3 1 1.62851 record 21 1 2.25846 record 4 2 1.74958 record 22 2 1.56059 record 5 2 2.02148 record 23 1 1.69725 record 6 3 1.67266 record 24 1 1.60647
  • 12. record 7 1 2.16069 record 25 1 2.90438 record 8 3 1.49889 record 26 1 1.55258 record 9 1 2.57075 record 27 3 0.97042 record 10 1 2.37898 record 28 3 0.72609 record 11 2 2.08569 record 29 1 1.83251 record 12 2 1.45118 record 30 3 1.69913 record 13 2 1.01526 record 31 3 1.85576 record 14 1 2.19413 record 32 3 1.38656 record 15 2 2.67432 record 33 3 0.91282 record 16 2 1.33714 record 34 3 1.95115 record 17 2 1.46277 record 35 3 1.25408 record 18 1 1.47706 record 36 3 1.58968 Tabel 9. Anggota dari Tiap Gerombol Perhatikan bahwa “QCL_1” menunjukkan nomor cluster dari keberadaan data record dan “QCL_2” merupakan jarak antara obyek dengan pusat cluster. Dengan demikian, dapat ditafsirkan sebagai berikut:  Cluster-1: berisikan data record ke-1, 2, 3, 7, 9, 10, 14, 18, 21, 23, 24, 25, 26, 29 dengan masing-masing jarak terhadap pusat cluster-1 adalah 1.45734; 1.12126; 1.62851; 2.16069; 2.57075; 2.37898; 2.19413; 1.47706; 2.25846; 1.69725; 1.60647; 2.90438; 1.55258 dan 1.83251  Cluster-2: berisikan data record ke-4, 5, 11, 12, 13, 15, 16, 17, 19, 20, 22 dengan masing- masing jarak terhadap pusat cluster-2 adalah 1.74958; 2.02148; 2.08569; 1.45118; 1.01526; 2.67432; 1.33714; 1.46277; 1.08523; 0.93304 dan 1.56059  Cluster-3: berisikan data record ke-6, 8, 27, 28, 30, 31, 32, 33, 34, 35, 36 dengan masing- masing jarak terhadap pusat cluster-3 adalah 1.67266; 1.49889; 0.97042; 0.72609; 1.69913; 1.85576; 1.38656; 0.91282; 1.95115; 1.25408 dan 1.58968.
  • 13. B. Metode Hierarchical Cluster (Hierarki) Konsep dari metode hierarki ini dimulai dengan menggabungkan 2 obyek yang paling mirip, kemudian gabungan 2 obyek tersebut akan bergabung lagi dengan satu atau lebih obyek yang paling mirip lainnya. Proses clustering ini pada akhirnya akan „menggumpal‟ menjadi satu cluster besar yang mencakup semua obyek. Metode ini disebut juga sebagai “metode aglomerativ” yang digambarkan dengan dendogram. Contoh kasus di atas akan dicoba untuk diselesaikan pula dengan metode aglomerativ. Case Processing Summarya Cases Valid Missing Total N Percent N Percent N Percent 36 100.0% 0 .0% 36 100.0% a. Squared Euclidean Distance used Tabel 10. Informasi Pemrosesan Data Record Tabel output di atas menunjukkan bahwa semua data sejumlah 36 obyek telah diproses tanpa ada data yang hilang. Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record Tabel tersebut menujukkan matriks jarak antara variabel satu dengan variabel yang lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut sehingga akan membentuk kelompok (cluster).
  • 14. Agglomeration Schedule Stage Cluster Combined Coefficients Stage Cluster First Appears Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2 1 32 33 .325 0 0 10 2 19 20 .453 0 0 9 3 10 21 .572 0 0 30 4 27 28 .685 0 0 16 5 1 22 .759 0 0 21 6 2 3 .787 0 0 17 7 16 17 1.017 0 0 25 8 24 29 1.113 0 0 12 9 13 19 1.141 0 2 15 10 30 32 1.265 0 1 18 11 35 36 1.464 0 0 16 12 24 26 1.655 8 0 24 13 7 14 1.723 0 0 22 14 4 8 1.734 0 0 17 15 13 18 2.350 9 0 21 16 27 35 2.389 4 11 19 17 2 4 2.796 6 14 23 18 6 30 2.911 0 10 28 19 27 31 2.936 16 0 27 20 11 12 3.042 0 0 22 21 1 13 3.220 5 15 23 22 7 11 3.749 13 20 29 23 1 2 3.842 21 17 29 24 23 24 4.116 0 12 26 25 15 16 4.444 0 7 34 26 5 23 5.838 0 24 31
  • 15. 27 27 34 5.940 19 0 28 28 6 27 6.067 18 27 32 29 1 7 6.861 23 22 31 30 9 10 8.023 0 3 33 31 1 5 8.097 29 26 32 32 1 6 10.275 31 28 33 33 1 9 13.097 32 30 34 34 1 15 14.625 33 25 35 35 1 25 14.975 34 0 0 Tabel 12. Proses Penggerombolan Data Record Secara Bertingkat Tabel di atas merupakan hasil proses clustering dengan metode Between Group Linkage. Setelah jarak anatar varaibel diukur dengan jarak euclidean, maka dilakukan pengelompokan, yang dilakukan secara bertingkat.  Stage 1: terbentuk 1 cluster yang beranggotakan data record 32 dan data record 33 dengan jarak 0,325. Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 36 obyek yang ada. Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 4. Hal ini berarti clustering selanjutnya dilakukan dengan melihat stage 10, dengan penjelasan berikut.  Baris ke-10 (stage 10) terlihat obyek ke-30 (data record 30) membentuk cluster dengan obyek ke-32 (data record 32). Dengan demikian, sekarang cluster terdiri dari 3 obyek yaitu data record 30, data record 32 dan data record 33. Sedangkan jarak sebesar 1.265 merupakan jarak rata-rata obyek terakhir yang bergabung dengan 2 obyek sebelumnya, seperti tampak dalam Tabel 11 dan dapat dihitung sebagai berikut: - Jarak data record 30 dan data record 32 = 1,224 - Jarak Kota record 30 dan data record 33 = 1,305 - Jarak rata-rata = (1,224 + 1,305) / 2 = 1,2645 ~ 1.265 (dalam tabel di atas)
  • 16.  Stage 2: terjadi pembentukan cluster dara record 19 dan data record 20 yang berjarak 0,453), yang kemudian berlanjut ke stage 9. Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai ke stage terakhir. Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah cluster yang dibentuk. Perincian jumlah cluster dengan anggota yang terbentuk dapat dilihat pada tabel output berikut ini: Cluster Membership Case 4 Clusters 3 Clusters 2 Clusters 1:record 1 1 1 1 2:record 2 1 1 1 3:record 3 1 1 1 4:record 4 1 1 1 5:record 5 1 1 1 6:record 6 1 1 1 7:record 7 1 1 1 8:record 8 1 1 1 9:record 9 2 1 1 10:record 10 2 1 1 11:record 11 1 1 1 12:record 12 1 1 1 13:record 13 1 1 1 14:record 14 1 1 1 15:record 15 3 2 1
  • 17. 16:record 16 3 2 1 17:record 17 3 2 1 18:record 18 1 1 1 19:record 19 1 1 1 20:record 20 1 1 1 21:record 21 2 1 1 22:record 22 1 1 1 23:record 23 1 1 1 24:record 24 1 1 1 25:record 25 4 3 2 26:record 26 1 1 1 27:record 27 1 1 1 28:record 28 1 1 1 29:record 29 1 1 1 30:record 30 1 1 1 31:record 31 1 1 1 32:record 32 1 1 1 33:record 33 1 1 1 34:record 34 1 1 1 35:record 35 1 1 1 36:record 36 1 1 1 Tabel 13. Penggerombolan Data Record Berdasarkan Jumlah Gerombol Dari tabel diatas dapat dijabarkan bahwa: 1.Apabila diinginkan dibentuk 4 cluster, maka:  Anggota cluster 1 adalah data record 1 s.d. 8, 11 s.d. 14, 18 s.d. 20, 22 s.d. 24 dan 26 s.d. 36  Anggota cluster 2 adalah data record 9, 10 dan 21  Anggota cluster 3 adalah data record 15 s.d. 17  Anggota cluster 4 adalah data record 25
  • 18. 2.Apabila ditentukan dibentuk 3 cluster, maka:  Anggota cluster 1 adalah data record 1 s.d. 14, 18 s.d. 20, 21 s.d. 24 dan 26 s.d. 36  Anggota cluster 2 adalah data record 15 s.d. 17  Anggota cluster 3 adalah data record 25 3.Apabila ditentukan dibentuk 2 cluster, maka:  Anggota cluster 1 adalah data record 1 s.d. 24 dan 26 s.d. 36  Anggota cluster 2 adalah data record 25 Lampiran 2: Dendogram Data Record Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan data record 32 s.d. data record 11 (sesuai urutan dalam dendogram); dan cluster 2 beranggotakan data record 12 s.d. data record 25. Apabila akan dibentuk 3 cluster, maka cluster 1 beranggotakan data record 32 s.d. data record 29, cluster 2 beranggotakan data record 26 s.d. data record 1 dan cluster 3 beranggotakan data record 22 s.d. data record 25. Apabila akan dibentuk 4 cluster, maka cluster 1 beranggotakan data record 32 s.d. data record 31, cluster 2 beranggotakan data record 32 s.d. data record 11, cluster 3 beranggotakan data record 12 s.d. data record 20 dan cluster 4beranggotakan data record 13 s.d. data record 25.
  • 19. BAB IV. KESIMPULAN Terdapat dua metode dalam analisis gerombol. Pertama, metode non-hierarki yang dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses heirarki, dan metode ini biasa disebut “K-Means Cluster”. Kedua, metode hierarki yang memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga cluster akan membentuk semacam „pohon‟ dimana terdapat tingkatan (hirarkie) yang jelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip. Berdasarkan metode non-hierarki, kesimpulan yang dapat diambil yaitu bahwa data record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 berasal dari periode waktu yang tingkat penggunaan narkobanya rendah karena pada 3 cluster yang terbentuk, cluster-1 merupakan cluster terbesar yang beranggotakan 14 data record, sedangkan cluster-2 dan cluster-3 memiliki jumlah anggota data record yang sama, yaitu 11. Sedangkan berdasarkan metode hierarki, kesimpulan yang bahwa data record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 sebaiknya dibentuk 2 cluster yang didasarkan pada karakteristik data record 25 pada cluster-2 berbeda dengan data record lainnya.
  • 20. DAFTAR PUSTAKA Ariawan, I Made Anom, dkk. 2013. “KOMPARASI ANALISIS GEROMBOL (CLUSTER) DAN BIPLOT DALAM PENGELOMPOKAN”. E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 17- 22. [ONLINE] Tersedia: (http://ojs.unud.ac.id/index.php/mtk/article/download/7838/5914) “MODUL 6 ANALISIS CLUSTER”. [ONLINE] Tersedia: (http://file.upi.edu/Direktori/FPIPS/LAINNYA/MEITRI_HENING/Modul/Modul_Clus ter.pdf) [ONLINE] Tersedia: (http://www.library.upnvj.ac.id/pdf/2s1teknikinformasi/206511014/sk206511014.pdf)
  • 21. Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record Proximity Matrix Squared Euclidean Distance Case 1: record 1 2: record 2 3: record 3 4: record 4 5: record 5 6: record 6 7: record 7 8: record 8 9 :record 9 10: record 10 11: record 11 12: record 12 1: record 1 0 1.745 3.152 5.203 10.828 7.674 9.505 5.167 9.551 5.367 9.08 5.572 2: record 2 1.745 0 0.787 1.929 6.715 6.909 6.697 3.67 7.841 3.335 7.242 3.991 3: record 3 3.152 0.787 0 2.581 8.753 4.767 7.904 3.005 10.868 2.441 6.395 5.742 4: record 4 5.203 1.929 2.581 0 3.931 6.574 8.168 1.734 15.383 6.511 8.591 6.752 5: record 5 10.828 6.715 8.753 3.931 0 9.747 3.288 6.346 19.348 17.599 7.624 5.542 6: record 6 7.674 6.909 4.767 6.574 9.747 0 8.274 2.154 24.933 11.045 5.356 10.52 7: record 7 9.505 6.697 7.904 8.168 3.288 8.274 0 9.164 14.794 17.209 3.865 2.821 8: record 8 5.167 3.67 3.005 1.734 6.346 2.154 9.164 0 21.047 7.583 7.442 9.19 9: record 9 9.551 7.841 10.868 15.383 19.348 24.933 14.794 21.047 0 9.572 22.213 11.634 10: record 10 5.367 3.335 2.441 6.511 17.599 11.045 17.209 7.583 9.572 0 16.41 13.545 11: record 11 9.08 7.242 6.395 8.591 7.624 5.356 3.865 7.442 22.213 16.41 0 3.042 12: record 12 5.572 3.991 5.742 6.752 5.542 10.52 2.821 9.19 11.634 13.545 3.042 0 13: record 13 3.368 3.296 3.879 3.141 7.463 6.105 9.193 3.032 19.355 9.768 4.907 4.58 14: record 14 8.769 7.298 7.429 11.795 9.013 7.864 1.723 11.266 12.827 15.216 4.197 4.114 15: record 15 14.681 14.796 20.792 13.172 10.882 27.823 17.221 18.833 25.818 29.264 19.27 10.588 16: record 16 4.109 6.731 9.309 7.597 10.177 11.55 11.654 7.758 21.007 16.049 8.475 5.681 17: record 17 6.002 7.649 11.602 7.442 8.066 15.4 11.578 9.59 20.236 18.634 11.308 6.095 18: record 18 1.65 2.714 2.973 6.152 8.888 3.828 5.111 4.533 12.426 8.021 4.116 3.786 19: record 19 3.12 3.11 3.31 4.162 6.002 3.343 4.736 2.98 17.321 10.355 2.062 2.828 20: record 20 3.675 3.768 4.464 5.235 6.905 6.066 5.6 5.036 17.465 12.002 2.103 1.92 21: record 21 4.805 3.43 3.74 7.451 18.065 14.105 17.678 9.614 6.473 0.572 18.8 13.463 22: record 22 0.759 2.293 4.561 3.847 8.555 8.738 10.035 4.448 11.784 7.31 10.666 6.335 23: record 23 9.218 7.038 9.193 10.956 8.677 13.404 4.636 13.016 6.401 13.06 13.829 8.521 24: record 24 5.376 5.737 8.508 6.058 4.737 8.498 5.638 6.087 14.009 13.772 11.867 8.124 25: record 25 10.099 13.655 19.026 16.319 16.015 21.972 16.956 17.359 14.895 20.894 27.415 18.238 26: record 26 7.376 6.071 7.217 6.812 5.883 6.385 4.955 6.02 13.593 11.816 11.617 9.89 27: record 27 3.568 5.102 6.06 5.814 10.941 5.945 12.161 3.652 15.907 7.62 14.74 12.998 28: record 28 3.7 5.287 5.012 6.58 14.209 4.91 14.534 3.464 17.258 5.588 14.676 14.513 29: record 29 7.854 5.985 8.622 4.754 4.055 10.28 7.286 6.176 14.005 12.692 15.065 10.625 30: record 30 11.027 12.126 10.566 13.739 17.282 4.701 14.014 7.905 24.176 13.46 16.534 19.902 31: record 31 8.038 12.123 13.456 11.977 20.293 12.118 23.986 8.285 25.73 13.068 25.431 23.51 32: record 32 7.885 7.658 5.467 9.065 13.885 1.737 10.973 4.317 21.075 8.676 10.697 14.552 33: record 33 6.095 6.704 5.127 8.157 13.951 2.294 11.97 3.707 19.701 7.43 11.823 14.462 34: record 34 12.072 17.768 16.701 18.976 26.345 8.692 25.107 10.661 35.472 18.947 22.94 26.961 35: record 35 6.729 6.849 6.85 4.267 10.963 5.531 15.967 1.79 24.298 9.008 15.718 16.245 36: record 36 3.625 5.426 6.286 4.286 10.738 6.2 14.603 2.285 22.237 9.439 12.483 11.889 This is a dissimilarity matrix
  • 22. Proximity Matrix Squared Euclidean Distance Case 13: record 13 14: record 14 15: record 15 16: record 16 17: record 17 18: record 18 19: record 19 20: record 20 21: record 21 22: record 22 23: record 23 24: record 24 1: record 1 3.368 8.769 14.681 4.109 6.002 1.65 3.12 3.675 4.805 0.759 9.218 5.376 2: record 2 3.296 7.298 14.796 6.731 7.649 2.714 3.11 3.768 3.43 2.293 7.038 5.737 3: record 3 3.879 7.429 20.792 9.309 11.602 2.973 3.31 4.464 3.74 4.561 9.193 8.508 4: record 4 3.141 11.795 13.172 7.597 7.442 6.152 4.162 5.235 7.451 3.847 10.956 6.058 5: record 5 7.463 9.013 10.882 10.177 8.066 8.888 6.002 6.905 18.065 8.555 8.677 4.737 6: record 6 6.105 7.864 27.823 11.55 15.4 3.828 3.343 6.066 14.105 8.738 13.404 8.498 7: record 7 9.193 1.723 17.221 11.654 11.578 5.111 4.736 5.6 17.678 10.035 4.636 5.638 8: record 8 3.032 11.266 18.833 7.758 9.59 4.533 2.98 5.036 9.614 4.448 13.016 6.087 9: record 9 19.355 12.827 25.818 21.007 20.236 12.426 17.321 17.465 6.473 11.784 6.401 14.009 10: record 10 9.768 15.216 29.264 16.049 18.634 8.021 10.355 12.002 0.572 7.31 13.06 13.772 11: record 11 4.907 4.197 19.27 8.475 11.308 4.116 2.062 2.103 18.8 10.666 13.829 11.867 12: record 12 4.58 4.114 10.588 5.681 6.095 3.786 2.828 1.92 13.463 6.335 8.521 8.124 13: record 13 0 11.233 10.577 1.936 3.743 3.657 1.24 1.042 10.95 2.907 16.058 8.518 14: record 14 11.233 0 25.034 14.138 16.141 3.694 5.478 6.625 15.866 11.426 4.575 8.301 15: record 15 10.577 25.034 0 6.35 2.538 18.203 13.797 11.243 26.894 10.452 24.37 14.133 16: record 16 1.936 14.138 6.35 0 1.017 5.457 3.361 2.347 15.73 2.924 18.38 8.615 17: record 17 3.743 16.141 2.538 1.017 0 8.265 5.625 4.374 17.411 3.526 17.483 7.648 18: record 18 3.657 3.694 18.203 5.457 8.265 0 1.201 2.191 8.608 3.269 7.546 5.189 19: record 19 1.24 5.478 13.797 3.361 5.625 1.201 0 0.453 11.663 3.623 11.021 6.089 20: record 20 1.042 6.625 11.243 2.347 4.374 2.191 0.453 0 13.006 4.152 13.104 8.109 21: record 21 10.95 15.866 26.894 15.73 17.411 8.608 11.663 13.006 0 6.448 11.602 12.742 22: record 22 2.907 11.426 10.452 2.924 3.526 3.269 3.623 4.152 6.448 0 10.232 3.876 23: record 23 16.058 4.575 24.37 18.38 17.483 7.546 11.021 13.104 11.602 10.232 0 4.679 24: record 24 8.518 8.301 14.133 8.615 7.648 5.189 6.089 8.109 12.742 3.876 4.679 0 25: record 25 19.078 19.036 18.903 15.32 13.038 13.425 17.072 19.096 17.097 7.995 9.443 4.239 26: record 26 11.402 6.127 23.008 14.357 14.313 5.483 7.367 10.459 11.749 7.134 2.729 1.56 27: record 27 7.787 12.584 21.677 9.757 11.149 4.831 6.687 9.544 7.55 3.008 9.291 3.081 28: record 28 7.795 13.519 26.388 11.099 13.94 4.784 6.903 9.897 6.298 4.106 11.924 6.151 29: record 29 10.604 11.271 15.92 12.528 10.472 8.436 8.882 11.335 11.779 5.663 4.94 1.113 30: record 30 16.313 11.579 40.036 21.027 24.728 7.909 11.351 16.112 15.145 12.519 11.206 8.323 31: record 31 12.976 24.636 27.174 13.552 15.357 11.611 13.61 16.913 12.7 6.458 19.714 8.518 32: record 32 10.738 8.725 35.089 16.613 20.685 4.844 6.975 10.771 11.015 9.744 10.752 8.421 33: record 33 9.548 9.987 32.258 14.47 18.246 4.381 6.638 10.248 9.227 7.511 10.836 7.222 34: record 34 16.381 22.564 39.8 17.916 23.066 11.374 14.061 18.251 20.514 12.642 24.157 13.337 35: record 35 6.734 18.411 22.048 10.502 11.952 8.26 7.594 10.516 10.319 4.994 16.375 6.596 36: record 36 3.15 16.679 15.312 4.581 6.298 5.646 4.647 6.161 10.147 2.14 16.996 6.281 This is a dissimilarity matrix
  • 23. Proximity Matrix Squared Euclidean Distance Case 25: record 25 26: record 26 27: record 27 28: record 28 29: record 29 30: record 30 31: record 31 32: record 32 33: record 33 34: record 34 35: record 35 36: record 36 1: record 1 10.099 7.376 3.568 3.7 7.854 11.027 8.038 7.885 6.095 12.072 6.729 3.625 2: record 2 13.655 6.071 5.102 5.287 5.985 12.126 12.123 7.658 6.704 17.768 6.849 5.426 3: record 3 19.026 7.217 6.06 5.012 8.622 10.566 13.456 5.467 5.127 16.701 6.85 6.286 4: record 4 16.319 6.812 5.814 6.58 4.754 13.739 11.977 9.065 8.157 18.976 4.267 4.286 5: record 5 16.015 5.883 10.941 14.209 4.055 17.282 20.293 13.885 13.951 26.345 10.963 10.738 6: record 6 21.972 6.385 5.945 4.91 10.28 4.701 12.118 1.737 2.294 8.692 5.531 6.2 7: record 7 16.956 4.955 12.161 14.534 7.286 14.014 23.986 10.973 11.97 25.107 15.967 14.603 8: record 8 17.359 6.02 3.652 3.464 6.176 7.905 8.285 4.317 3.707 10.661 1.79 2.285 9: record 9 14.895 13.593 15.907 17.258 14.005 24.176 25.73 21.075 19.701 35.472 24.298 22.237 10: record 10 20.894 11.816 7.62 5.588 12.692 13.46 13.068 8.676 7.43 18.947 9.008 9.439 11: record 11 27.415 11.617 14.74 14.676 15.065 16.534 25.431 10.697 11.823 22.94 15.718 12.483 12: record 12 18.238 9.89 12.998 14.513 10.625 19.902 23.51 14.552 14.462 26.961 16.245 11.889 13: record 13 19.078 11.402 7.787 7.795 10.604 16.313 12.976 10.738 9.548 16.381 6.734 3.15 14: record 14 19.036 6.127 12.584 13.519 11.271 11.579 24.636 8.725 9.987 22.564 18.411 16.679 15: record 15 18.903 23.008 21.677 26.388 15.92 40.036 27.174 35.089 32.258 39.8 22.048 15.312 16: record 16 15.32 14.357 9.757 11.099 12.528 21.027 13.552 16.613 14.47 17.916 10.502 4.581 17: record 17 13.038 14.313 11.149 13.94 10.472 24.728 15.357 20.685 18.246 23.066 11.952 6.298 18: record 18 13.425 5.483 4.831 4.784 8.436 7.909 11.611 4.844 4.381 11.374 8.26 5.646 19: record 19 17.072 7.367 6.687 6.903 8.882 11.351 13.61 6.975 6.638 14.061 7.594 4.647 20: record 20 19.096 10.459 9.544 9.897 11.335 16.112 16.913 10.771 10.248 18.251 10.516 6.161 21: record 21 17.097 11.749 7.55 6.298 11.779 15.145 12.7 11.015 9.227 20.514 10.319 10.147 22: record 22 7.995 7.134 3.008 4.106 5.663 12.519 6.458 9.744 7.511 12.642 4.994 2.14 23: record 23 9.443 2.729 9.291 11.924 4.94 11.206 19.714 10.752 10.836 24.157 16.375 16.996 24: record 24 4.239 1.56 3.081 6.151 1.113 8.323 8.518 8.421 7.222 13.337 6.596 6.281 25: record 25 0 8.052 7.122 11.519 6.011 15.879 9.5 18.72 15.708 18.114 14.081 12.825 26: record 26 8.052 0 3.596 5.718 1.75 4.602 10.782 4.788 4.642 13.377 7.362 9.195 27: record 27 7.122 3.596 0 0.685 4.014 4.378 2.257 4.162 2.417 5.741 2.005 2.623 28: record 28 11.519 5.718 0.685 0 7.238 3.9 2.68 2.863 1.297 4.578 2.096 2.833 29: record 29 6.011 1.75 4.014 7.238 0 9.919 9.847 9.693 8.569 17.333 6.242 7.772 30: record 30 15.879 4.602 4.378 3.9 9.919 0 8.687 1.224 1.305 5.002 7.534 10.629 31: record 31 9.5 10.782 2.257 2.68 9.847 8.687 0 9.656 6.565 4.334 3.143 3.663 32: record 32 18.72 4.788 4.162 2.863 9.693 1.224 9.656 0 0.325 6.507 5.841 8.022 33: record 33 15.708 4.642 2.417 1.297 8.569 1.305 6.565 0.325 0 4.821 4.114 5.828 34: record 34 18.114 13.377 5.741 4.578 17.333 5.002 4.334 6.507 4.821 0 7.289 7.759 35: record 35 14.081 7.362 2.005 2.096 6.242 7.534 3.143 5.841 4.114 7.289 0 1.464 36: record 36 12.825 9.195 2.623 2.833 7.772 10.629 3.663 8.022 5.828 7.759 1.464 0 This is a dissimilarity matrix
  • 24. Lampiran 2: Dendogram Data Record * * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ record 32 32 -+-+ record 33 33 -+ +-----+ record 30 30 ---+ +---------+ record 6 6 ---------+ | record 27 27 -+-----+ +-------------+ record 28 28 -+ +-+ | | record 35 35 ---+---+ +---------+ | record 36 36 ---+ | | | record 31 31 ---------+ | | record 34 34 -------------------+ | record 24 24 ---+-+ +---------+ record 29 29 ---+ +-------+ | | record 26 26 -----+ +-----+ | | record 23 23 -------------+ +-------+ | | record 5 5 -------------------+ | | | record 7 7 -----+-----+ | | | record 14 14 -----+ +-----------+ +-----+ | record 11 11 ---------+-+ | | | record 12 12 ---------+ | | | record 2 2 -+-------+ +---+ | record 3 3 -+ +---+ | +-----+ record 4 4 -----+---+ | | | | record 8 8 -----+ +---------+ | | record 1 1 -+-------+ | | | record 22 22 -+ | | | | record 19 19 -+-+ +---+ | | record 20 20 -+ +---+ | | | record 13 13 ---+ +-+ | | record 18 18 -------+ | | record 10 10 -+-------------------------+ | | record 21 21 -+ +---------------+ | record 9 9 ---------------------------+ | record 16 16 ---+-----------+ | record 17 17 ---+ +---------------------------------+ record 15 15 ---------------+ | record 25 25 -------------------------------------------------+