Aminullah assagaf revisi implementasi software statistik & analisis 27 ju...
CLUSTERING
1. CLUSTERING ANALISYS
PENGELOMPKKAN DATA RECORD
LAPORAN HASIL UNGKAP KASUS NARKOBA PADA POLRES JAKARTA PUSAT
PERIODE 2007-2009
Diajukan untuk Memenuhi Sebagian Tugas
Mata Kuliah Analisis Peubah Ganda
Disusun Oleh :
Puti Febriani Nurjanah (3125111204)
PROGRAM STUDI MATEMATIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI JAKARTA
2014
2. BAB I. PENDAHULUAN
A. Latar Belakang
Selama ini masih belum diterapkannya sebuah metode dalam pengelolaan data
mengenai kasus narkona, sehingga masih belum diperolehnya informasi yang berkaitan
dengan laporan hasil ungkap kasus narkoba. Terbatasnya teknologi dalam hal ini
membuat para pihak yang terkait sulit untuk memanfaatkan secara maksimal potensi dari
data-data tersebut, padahal dari data tersebut tersimpan banyak sekali informasi berharga
yang berguna.
Oleh karena itu, hal ini memerlukan suatu teknologi yang dapat melahirkan
pengetahuan-pengetahuan baru sehingga dapat membantu pihak-pihak yang terkait. Maka
metode pengelompokkan data hadir sebagai salah satu solusi untuk pengelolaan data
secara efektif dan efisien dan bakan dapat menghasilkan informasi yang berguna bagi
para pembuat keputusan.
Dalam penelitian ini akan dilakukan analisis secara ilmiah dengan menerapkan
metode clustering analisys untuk melakukukan pengelompokkan data-data record
laporan hasil ungkap kasus narkoba periode 2007-2009 berdasarkan informasi yang
diambil dari Polres Jakarta Pusat.
B. Kajian Teori
Analisis multivariat merupakan analisis statistika yang berkaitan dengan
pendiskripsian ataupun interpretasi data yang melibatkan banyak peubah dan objek secara
bersama-sama. Salah satu interpretasi yang dimaksud adalah pengelompokan data.
Pengelompokan data merupakan pengorganisasian sekumpulan data yang besar dengan
cara membagi data tersebut kedalam beberapa gerombol (kelompok). Gerombol-
gerombol yang terbentuk akan mampu menjelaskan adanya persamaan maupun
perbedaan dari keseluruhan data yang diteliti. Tujuan dari pengelompokan data adalah
untuk mempermudah proses analisis dan interpretasi dari data besar dengan membagi
data tersebut menjadi beberapa gerombol.
Terdapat beberapa teknik dalam pengelompokan suatu data. Namun dalam tulisan
ini, pengelompokan data yang dimaksudkan adalah pengelompokan data yang didasarkan
pada objek dari data tersebut. Salah satu analisis yang sering digunakan untuk
pengelompokan ini adalah analisis gerombol (cluster). Analisis gerombol merupakan
3. analisis multivariat yang bertujuan untuk mengelompokkan objek-objek dari data yang
diteliti berdasarkan kesamaan karakteristik yang dimilikinya. Kesamaan karakteristik ini
biasanya diukur menggunakan ukuran kedekatan antarobjek yang dapat berupa ukuran
kemiripan atau ketakmiripannya. Analisis gerombol mampu digunakan dalam
mengelompokkan data dalam jumlah objek yang besar serta dengan skala pengukuran
peubah yang berbeda mulai dari nominal sampai interval.
Ciri-ciri suatu cluster yang baik yaitu mepunyai:
Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu
cluster
Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu
dengan cluster yang lain
Langkah pengelompokan dalam analisis cluster mencakup 3 hal berikut:
1. Mengukur kesamaan jarak.
2. Membentuk cluster secara hierarki.
3. Menentukan jumlah cluster.
Adapun metode pengelompokan dalam analisis cluster meliputi:
Metode Hierarki; memulai pengelompokan dengan dua atau lebih obyek yang
mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan
seterusnya hingga cluster akan membentuk semacam „pohon‟ dimana terdapat
tingkatan (hirarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling
tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut
“dendogram”
Metode Non-Hierarki; dimulai dengan menentukan terlebih dahulu jumlah cluster
yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka
proses cluster dilakukan dengan tanpa mengikuti proses hierarki. Metode ini biasa
disebut “K-Means Cluster”
Asumsi yang harus dipenuhi dalam Analisis Cluster yaitu:
Sampel yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample)
Multikolinieritas
4. BAB III. PEMBAHASAN
Dalam bab ini, akan diterapkan metode analisis penggerombolan atau cluster analisys
untuk mengelompokkan data record Laporan Hasil Ungkap Kasus Narkoba pada Polres
Jakarta Pusat Periode 2007-2009 sebagai berikut:
Data
Record
Heroin Ganja Shabu Ekstasi
Gol
IV
Data
Record
Heroin Ganja Shabu Ekstasi
Gol
IV
record 1 27 18 23 7 3 record 19 34 26 19 12 2
record 2 22 19 14 10 3 record 20 39 23 18 13 2
record 3 21 22 11 8 2 record 21 11 13 13 3 3
record 4 16 21 15 16 2 record 22 24 17 26 11 3
record 5 23 28 15 22 4 record 23 19 28 14 9 7
record 6 23 35 19 9 1 record 24 19 27 27 14 5
record 7 33 32 12 15 5 record 25 15 20 37 11 7
record 8 17 27 20 13 1 record 26 14 32 21 11 5
record 9 21 12 9 4 7 record 27 12 25 29 8 3
record 10 11 16 11 3 2 record 28 12 25 27 5 2
record 11 42 31 11 13 2 record 29 10 26 23 16 5
record 12 40 22 12 14 4 record 30 11 38 26 3 3
record 13 32 20 20 14 1 record 31 7 22 39 7 2
record 14 36 33 11 8 5 record 32 15 35 20 4 2
record 15 38 10 26 26 4 record 33 14 32 23 4 2
record 16 39 17 28 15 2 record 34 16 33 40 2 1
record 17 36 15 28 19 3 record 35 8 25 28 12 1
record 18 32 26 20 7 3 record 36 19 21 30 12 1
Tabel 1. Data Record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat
Periode 2007-2009
Dari data di atas, ingin diketahui pengelompokkan data-data record tersebut berdasarkan
instrumen 5 variabel, yaitu:
1. Jumlah pemakai narkoba jenis heroin
2. Jumlah pengguna narkoba jenis ganja
3. Jumlah pengguna narkoba jenis shabu
4. Jumlah pengguna narkoba jenis ekstasi
5. Jumlah pengguna narkoba jenis gol IV
5. Berikut langkah-langkahnya:
1. Standardisasi/Transformasi
Mengingat data yang terkumpul mempunyai variabilitas satuan, maka perlu dilakukan
langkah standardisasi atau transformasi terhadap variabel yang relevan ke bentuk z-score,
sebagai berikut:
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
Heroin 36 7.00 42.00 22.4444 10.58151
Ganja 36 10.00 38.00 24.2222 7.03506
Shabu 36 9.00 40.00 21.2500 8.19538
Ekstasi 36 2.00 26.00 10.5556 5.52110
Gol IV 36 1.00 7.00 3.0556 1.73937
Valid N (listwise) 36
Tabel 2. Statistik Deskriptif Data Record
Zheroin ZGanja ZShabu Zekstasi ZGol IV
0.43052 -0.88446 0.21353 -0.64399 -0.03194
-0.042 -0.74231 -0.88464 -0.10062 -0.03194
-0.13651 -0.31588 -1.2507 -0.46287 -0.60686
-0.60903 -0.45802 -0.76262 0.98612 -0.60686
0.0525 0.53699 -0.76262 2.07286 0.54298
0.0525 1.53201 -0.27454 -0.28175 -1.18178
0.99755 1.10557 -1.12868 0.80499 1.1179
-0.51452 0.39485 -0.15252 0.44275 -1.18178
-0.13651 -1.73733 -1.49474 -1.18736 2.26775
-1.08155 -1.16875 -1.2507 -1.36849 -0.60686
1.84809 0.96343 -1.2507 0.44275 -0.60686
1.65908 -0.31588 -1.12868 0.62387 0.54298
0.90304 -0.60017 -0.15252 0.62387 -1.18178
6. 1.28106 1.24772 -1.2507 -0.46287 1.1179
1.47007 -2.02162 0.57959 2.79735 0.54298
1.56457 -1.0266 0.82363 0.80499 -0.60686
1.28106 -1.31089 0.82363 1.52949 -0.03194
0.90304 0.2527 -0.15252 -0.64399 -0.03194
1.09205 0.2527 -0.27454 0.26162 -0.60686
1.56457 -0.17373 -0.39656 0.44275 -0.60686
-1.08155 -1.59519 -1.00666 -1.36849 -0.03194
0.14701 -1.0266 0.57959 0.0805 -0.03194
-0.32552 0.53699 -0.88464 -0.28175 2.26775
-0.32552 0.39485 0.70161 0.62387 1.1179
-0.70353 -0.60017 1.92181 0.0805 2.26775
-0.79804 1.10557 -0.0305 0.0805 1.1179
-0.98705 0.11056 0.94565 -0.46287 -0.03194
-0.98705 0.11056 0.70161 -1.00624 -0.60686
-1.17606 0.2527 0.21353 0.98612 1.1179
-1.08155 1.95845 0.57959 -1.36849 -0.03194
-1.45957 -0.31588 2.16585 -0.64399 -0.60686
-0.70353 1.53201 -0.15252 -1.18736 -0.60686
-0.79804 1.10557 0.21353 -1.18736 -0.60686
-0.60903 1.24772 2.28787 -1.54961 -1.18178
-1.36507 0.11056 0.82363 0.26162 -1.18178
-0.32552 -0.45802 1.06767 0.26162 -1.18178
Tabel 3. Nilai Standardisasi Data Record
Untuk selanjutnya, hasil z-score inilah yang akan dipakai dasar analisis
penggerombolan. Namun apabila data yang terkumpul tidak mempunyai variabilitas
satuan, maka prose analisis penggerombolan dapat langsung dilakukan tanpa terlebih
dahulu melakukan transformasi atau standardisasi.
7. 2. Analisis Penggerombolan
A. Metode K-Means Cluster (Non-Hierarki)
Untuk metode ini, jumlah kelompok atau gerombol sudah ditentukan. Misal k = 3,
maka didapat:
Initial Cluster Centers
Cluster
1 2 3
Zscore: Heroin -.13651 1.47007 -.60903
Zscore: Ganja -1.73733 -2.02162 1.24772
Zscore: Shabu -1.49474 .57959 2.28787
Zscore: Ekstasi -1.18736 2.79735 -1.54961
Zscore: Gol IV 2.26775 .54298 -1.18178
Tabel 4. Penggerombolan Data Record Sebelum Iterasi
Tabel diatas merupakan tampilan pertama proses penggerombolan data sebelum
dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam
proses penggerombolan dari 36 obyek yang diteliti, dapat dilihat dari tampilan output
berikut ini:
Iteration Historya
Iteration
Change in Cluster Centers
1 2 3
1 2.345 2.674 2.198
2 .277 .000 .401
3 .000 .000 .000
a. Convergence achieved due to no or small change in cluster
centers. The maximum absolute coordinate change for any center is
,000. The current iteration is 3. The minimum distance between
initial centers is 5,081.
Tabel 5. Proses Iterasi Penggerombolan Data Record
8. Ternyata proses penggerombolan yang dilakukan melalui 3 tahapan iterasi untuk
mendapatkan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum
antar pusat cluster yang terjadi dari hasil iterasi adalah 5,081. Adapun hasil akhir dari
proses penggerombolan digambarkan berikut ini:
Final Cluster Centers
Cluster
1 2 3
Zscore: Heroin -.15676 .99755 -.79804
Zscore: Ganja -.15343 -.47095 .66622
Zscore: Shabu -.44886 -.17471 .74599
Zscore: Ekstasi -.28175 .96965 -.61106
Zscore: Gol IV .78938 -.24100 -.76366
Tabel 6. Proses Akhir Penggerombolan Data Record
Output Final Cluster Centers tersebut diatas masih terkait dengan proses
standardisasi data sebelumnya, yang mengacu pada z-score dengan ketentuan sebagai
berikut :
Nilai negatif (-) berarti data berada di bawah rata-rata total
Nilai positif (+) berarti data berada di atas rata-rata total
Rumus umum yang digunakan yaitu :
Dimana :
: rata-rata sampel (variabel dalam cluster)
: rata-rata populasi
: nilai standardisasi
: standar deviasi
9. Sebagai contoh, apabila ingin diketahui rata-rata jumlah pengguna narkoba jenis
heroin di cluster-1 yaitu:
(rata-rata pengguna narkoba jenis heroin) + (-0.15676 x standar deviasi rata-rata
pendapatan)
Jadi rata-rata jumlah pengguna narkoba jenis heroin yang berada di cluster-1
adalah 20,78564. Demikian seterusnya dapat diketahui rata-rata nilai masing-masing
variabel dalam tiap cluster. Dari tabel output Final Cluster Centers, dengan ketentuan
yang telah dijabarkan diatas pula, dapat didefinisikan sebagai berikut:
Cluster-1
Dalam cluster-1 ini berisikan data record yang mempunyai jumlah pengguna
narkoba yang kurang dari rata-rata populasi data record yang diteliti, hanya rata-rata
jumlah pengguna narkoba jenis Gol IV yang melebihi rata-rata. Dengan demikian,
dapat diduga bahwa cluster-1 ini merupakan pengelompokan dari data record dari
periode waktu yang tingkat penggunaan narkobanya rendah.
Cluster-2
Karakteristik data record yang masuk dalam pengelompokan cluster-2 yaitu
memiliki rata-rata jumlah pengguna narkoba jenis heroin dan ekstasi yang melebihi
rata-rata populasi data record yang diteliti. Untuk instrumen variabel yang lain data
record di cluster-2 ini berada di bawah ratarata populasi. Dengan demikian, dapat
diduga bahwa cluster-2 ini merupakan pengelompokan dari data record dari periode
waktu yang tingkat penggunaan narkobanya sedang.
Cluster-3
Karakteristik data record yang masuk dalam pengelompokan cluster-3 mirip
dengan karakteristik pada pengelompokan cluster-2, terdapat 2 variabel yang
melebihi rata-rata populasi data record yang diteliti, yaitu rata-rata jumlah pengguna
narkoba jenis ganja dan shabu. Untuk instrumen variabel yang lain data record di
cluster-3 ini berada di bawah ratarata populasi. Dengan demikian, dapat diduga
bahwa cluster-3 ini merupakan pengelompokan dari data record dari periode waktu
yang tingkat penggunaan narkobanya sedang.
10. Tahapan selanjutnya yang perlu dilakukan yaitu melihat perbedaan variabel pada
cluster yang terbentuk. Dalam hal ini dapat dilihat dari nilai F dan nilai probabilitas
(sig) masing-masing variabel, seperti tampak dalam tabel berikut:
ANOVA
Cluster Error
F Sig.Mean Square Df Mean Square df
Zscore: Heroin 9.148 2 .506 33 18.072 .000
Zscore: Ganja 3.826 2 .829 33 4.616 .017
Zscore: Shabu 4.639 2 .779 33 5.951 .006
Zscore: Ekstasi 7.781 2 .589 33 13.209 .000
Zscore: Gol IV 7.889 2 .583 33 13.543 .000
The F tests should be used only for descriptive purposes because the clusters have been
chosen to maximize the differences among cases in different clusters. The observed
significance levels are not corrected for this and thus cannot be interpreted as tests of
the hypothesis that the cluster means are equal.
Tabel 7. ANOVA Data Record
Rumus nilai F:
Dimana dalam tabel ANOVA di atas MS Between ditunjukkan oleh Means Square
dalam kolom Cluster, sedangkan MS Within ditunjukkan oleh Means Square dalam
kolom Error.
Catatan: Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada cluster yang terbentuk.
11. Hasil analisis dari tabel ANOVA:
Dengan demikian hasil cluster yang didapat dalam penelitian ini bahwa untuk
instrumen jumlah pengguna narkoba jenis heroin yang paling menunjukkan adanya
perbedaan diantara kota-kota pada ketiga cluster yang terbentuk. Hal ini dengan
ditunjukkannya nilai F = 18,072 dan sig = 0,000.Urutan perbedaan variabel dari yang
terbesar hingga terkecil yaitu jumlah pengguna narkoba jenis heroin, gol IV, ekstasi,
shabu dan ganja. Selanjutnya untuk mengetahui jumlah anggota masing-masing cluster
yang terbentuk dapat dilihat pada tabel output berikut ini:
Number of Cases in each Cluster
Cluster 1 14.000
2 11.000
3 11.000
Valid 36.000
Missing .000
Tabel 8. Jumlah Anggota Gerombol Data Record
Nampak jelas bahwa cluster-1 beranggotakan 12 data record, cluster-2 berisi 11
data record, dan pada cluster-3 terdapat 11 data record yang mengelompok.
Selanjutnya untuk mengetahui data record mana saja yang masuk dalam kategori tiap-
tiap cluster dapat kembali dibuka tampilan berikut ini:
Data Record QCL_1 QCL_2 Data Record QCL_1 QCL_2
record 1 1 1.45734 record 19 2 1.08523
record 2 1 1.12126 record 20 2 0.93304
record 3 1 1.62851 record 21 1 2.25846
record 4 2 1.74958 record 22 2 1.56059
record 5 2 2.02148 record 23 1 1.69725
record 6 3 1.67266 record 24 1 1.60647
12. record 7 1 2.16069 record 25 1 2.90438
record 8 3 1.49889 record 26 1 1.55258
record 9 1 2.57075 record 27 3 0.97042
record 10 1 2.37898 record 28 3 0.72609
record 11 2 2.08569 record 29 1 1.83251
record 12 2 1.45118 record 30 3 1.69913
record 13 2 1.01526 record 31 3 1.85576
record 14 1 2.19413 record 32 3 1.38656
record 15 2 2.67432 record 33 3 0.91282
record 16 2 1.33714 record 34 3 1.95115
record 17 2 1.46277 record 35 3 1.25408
record 18 1 1.47706 record 36 3 1.58968
Tabel 9. Anggota dari Tiap Gerombol
Perhatikan bahwa “QCL_1” menunjukkan nomor cluster dari keberadaan data
record dan “QCL_2” merupakan jarak antara obyek dengan pusat cluster. Dengan
demikian, dapat ditafsirkan sebagai berikut:
Cluster-1:
berisikan data record ke-1, 2, 3, 7, 9, 10, 14, 18, 21, 23, 24, 25, 26, 29 dengan
masing-masing jarak terhadap pusat cluster-1 adalah 1.45734; 1.12126; 1.62851;
2.16069; 2.57075; 2.37898; 2.19413; 1.47706; 2.25846; 1.69725; 1.60647; 2.90438;
1.55258 dan 1.83251
Cluster-2:
berisikan data record ke-4, 5, 11, 12, 13, 15, 16, 17, 19, 20, 22 dengan masing-
masing jarak terhadap pusat cluster-2 adalah 1.74958; 2.02148; 2.08569; 1.45118;
1.01526; 2.67432; 1.33714; 1.46277; 1.08523; 0.93304 dan 1.56059
Cluster-3:
berisikan data record ke-6, 8, 27, 28, 30, 31, 32, 33, 34, 35, 36 dengan masing-
masing jarak terhadap pusat cluster-3 adalah 1.67266; 1.49889; 0.97042; 0.72609;
1.69913; 1.85576; 1.38656; 0.91282; 1.95115; 1.25408 dan 1.58968.
13. B. Metode Hierarchical Cluster (Hierarki)
Konsep dari metode hierarki ini dimulai dengan menggabungkan 2 obyek yang
paling mirip, kemudian gabungan 2 obyek tersebut akan bergabung lagi dengan satu
atau lebih obyek yang paling mirip lainnya. Proses clustering ini pada akhirnya akan
„menggumpal‟ menjadi satu cluster besar yang mencakup semua obyek. Metode ini
disebut juga sebagai “metode aglomerativ” yang digambarkan dengan dendogram.
Contoh kasus di atas akan dicoba untuk diselesaikan pula dengan metode aglomerativ.
Case Processing Summarya
Cases
Valid Missing Total
N Percent N Percent N Percent
36 100.0% 0 .0% 36 100.0%
a. Squared Euclidean Distance used
Tabel 10. Informasi Pemrosesan Data Record
Tabel output di atas menunjukkan bahwa semua data sejumlah 36 obyek telah
diproses tanpa ada data yang hilang.
Lampiran 1: Tabel 11. Matriks Jarak Tiap Data Record
Tabel tersebut menujukkan matriks jarak antara variabel satu dengan variabel yang
lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut
sehingga akan membentuk kelompok (cluster).
15. 27 27 34 5.940 19 0 28
28 6 27 6.067 18 27 32
29 1 7 6.861 23 22 31
30 9 10 8.023 0 3 33
31 1 5 8.097 29 26 32
32 1 6 10.275 31 28 33
33 1 9 13.097 32 30 34
34 1 15 14.625 33 25 35
35 1 25 14.975 34 0 0
Tabel 12. Proses Penggerombolan Data Record Secara Bertingkat
Tabel di atas merupakan hasil proses clustering dengan metode Between Group
Linkage. Setelah jarak anatar varaibel diukur dengan jarak euclidean, maka dilakukan
pengelompokan, yang dilakukan secara bertingkat.
Stage 1:
terbentuk 1 cluster yang beranggotakan data record 32 dan data record 33 dengan
jarak 0,325. Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka
jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 36 obyek yang ada.
Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 4. Hal ini berarti
clustering selanjutnya dilakukan dengan melihat stage 10, dengan penjelasan
berikut.
Baris ke-10 (stage 10) terlihat obyek ke-30 (data record 30) membentuk cluster
dengan obyek ke-32 (data record 32). Dengan demikian, sekarang cluster terdiri
dari 3 obyek yaitu data record 30, data record 32 dan data record 33. Sedangkan
jarak sebesar 1.265 merupakan jarak rata-rata obyek terakhir yang bergabung
dengan 2 obyek sebelumnya, seperti tampak dalam Tabel 11 dan dapat dihitung
sebagai berikut:
- Jarak data record 30 dan data record 32 = 1,224
- Jarak Kota record 30 dan data record 33 = 1,305
- Jarak rata-rata = (1,224 + 1,305) / 2 = 1,2645 ~ 1.265 (dalam tabel di atas)
16. Stage 2:
terjadi pembentukan cluster dara record 19 dan data record 20 yang berjarak 0,453),
yang kemudian berlanjut ke stage 9.
Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai ke stage terakhir.
Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang
melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya
akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya
dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah
cluster yang dibentuk. Perincian jumlah cluster dengan anggota yang terbentuk dapat
dilihat pada tabel output berikut ini:
Cluster Membership
Case 4 Clusters 3 Clusters 2 Clusters
1:record 1 1 1 1
2:record 2 1 1 1
3:record 3 1 1 1
4:record 4 1 1 1
5:record 5 1 1 1
6:record 6 1 1 1
7:record 7 1 1 1
8:record 8 1 1 1
9:record 9 2 1 1
10:record 10 2 1 1
11:record 11 1 1 1
12:record 12 1 1 1
13:record 13 1 1 1
14:record 14 1 1 1
15:record 15 3 2 1
17. 16:record 16 3 2 1
17:record 17 3 2 1
18:record 18 1 1 1
19:record 19 1 1 1
20:record 20 1 1 1
21:record 21 2 1 1
22:record 22 1 1 1
23:record 23 1 1 1
24:record 24 1 1 1
25:record 25 4 3 2
26:record 26 1 1 1
27:record 27 1 1 1
28:record 28 1 1 1
29:record 29 1 1 1
30:record 30 1 1 1
31:record 31 1 1 1
32:record 32 1 1 1
33:record 33 1 1 1
34:record 34 1 1 1
35:record 35 1 1 1
36:record 36 1 1 1
Tabel 13. Penggerombolan Data Record Berdasarkan Jumlah Gerombol
Dari tabel diatas dapat dijabarkan bahwa:
1.Apabila diinginkan dibentuk 4 cluster, maka:
Anggota cluster 1 adalah data record 1 s.d. 8, 11 s.d. 14, 18 s.d. 20, 22 s.d. 24
dan 26 s.d. 36
Anggota cluster 2 adalah data record 9, 10 dan 21
Anggota cluster 3 adalah data record 15 s.d. 17
Anggota cluster 4 adalah data record 25
18. 2.Apabila ditentukan dibentuk 3 cluster, maka:
Anggota cluster 1 adalah data record 1 s.d. 14, 18 s.d. 20, 21 s.d. 24 dan 26 s.d.
36
Anggota cluster 2 adalah data record 15 s.d. 17
Anggota cluster 3 adalah data record 25
3.Apabila ditentukan dibentuk 2 cluster, maka:
Anggota cluster 1 adalah data record 1 s.d. 24 dan 26 s.d. 36
Anggota cluster 2 adalah data record 25
Lampiran 2: Dendogram Data Record
Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan
ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat
dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan data
record 32 s.d. data record 11 (sesuai urutan dalam dendogram); dan cluster 2
beranggotakan data record 12 s.d. data record 25. Apabila akan dibentuk 3 cluster,
maka cluster 1 beranggotakan data record 32 s.d. data record 29, cluster 2
beranggotakan data record 26 s.d. data record 1 dan cluster 3 beranggotakan data
record 22 s.d. data record 25. Apabila akan dibentuk 4 cluster, maka cluster 1
beranggotakan data record 32 s.d. data record 31, cluster 2 beranggotakan data record
32 s.d. data record 11, cluster 3 beranggotakan data record 12 s.d. data record 20 dan
cluster 4beranggotakan data record 13 s.d. data record 25.
19. BAB IV. KESIMPULAN
Terdapat dua metode dalam analisis gerombol. Pertama, metode non-hierarki yang
dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau
yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa
mengikuti proses heirarki, dan metode ini biasa disebut “K-Means Cluster”. Kedua, metode
hierarki yang memulai pengelompokan dengan dua atau lebih obyek yang mempunyai
kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga
cluster akan membentuk semacam „pohon‟ dimana terdapat tingkatan (hirarkie) yang jelas
antar obyek, dari yang paling mirip hingga yang paling tidak mirip.
Berdasarkan metode non-hierarki, kesimpulan yang dapat diambil yaitu bahwa data
record Laporan Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009
berasal dari periode waktu yang tingkat penggunaan narkobanya rendah karena pada 3 cluster
yang terbentuk, cluster-1 merupakan cluster terbesar yang beranggotakan 14 data record,
sedangkan cluster-2 dan cluster-3 memiliki jumlah anggota data record yang sama, yaitu 11.
Sedangkan berdasarkan metode hierarki, kesimpulan yang bahwa data record Laporan
Hasil Ungkap Kasus Narkoba pada Polres Jakarta Pusat Periode 2007-2009 sebaiknya
dibentuk 2 cluster yang didasarkan pada karakteristik data record 25 pada cluster-2 berbeda
dengan data record lainnya.
20. DAFTAR PUSTAKA
Ariawan, I Made Anom, dkk. 2013. “KOMPARASI ANALISIS GEROMBOL (CLUSTER)
DAN BIPLOT DALAM PENGELOMPOKAN”. E-Jurnal Matematika Vol. 2, No.4,
Nopember 2013, 17- 22. [ONLINE] Tersedia:
(http://ojs.unud.ac.id/index.php/mtk/article/download/7838/5914)
“MODUL 6 ANALISIS CLUSTER”. [ONLINE] Tersedia:
(http://file.upi.edu/Direktori/FPIPS/LAINNYA/MEITRI_HENING/Modul/Modul_Clus
ter.pdf)
[ONLINE] Tersedia:
(http://www.library.upnvj.ac.id/pdf/2s1teknikinformasi/206511014/sk206511014.pdf)
24. Lampiran 2:
Dendogram Data Record
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E
R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
record 32 32 -+-+
record 33 33 -+ +-----+
record 30 30 ---+ +---------+
record 6 6 ---------+ |
record 27 27 -+-----+ +-------------+
record 28 28 -+ +-+ | |
record 35 35 ---+---+ +---------+ |
record 36 36 ---+ | | |
record 31 31 ---------+ | |
record 34 34 -------------------+ |
record 24 24 ---+-+ +---------+
record 29 29 ---+ +-------+ | |
record 26 26 -----+ +-----+ | |
record 23 23 -------------+ +-------+ | |
record 5 5 -------------------+ | | |
record 7 7 -----+-----+ | | |
record 14 14 -----+ +-----------+ +-----+ |
record 11 11 ---------+-+ | | |
record 12 12 ---------+ | | |
record 2 2 -+-------+ +---+ |
record 3 3 -+ +---+ | +-----+
record 4 4 -----+---+ | | | |
record 8 8 -----+ +---------+ | |
record 1 1 -+-------+ | | |
record 22 22 -+ | | | |
record 19 19 -+-+ +---+ | |
record 20 20 -+ +---+ | | |
record 13 13 ---+ +-+ | |
record 18 18 -------+ | |
record 10 10 -+-------------------------+ | |
record 21 21 -+ +---------------+ |
record 9 9 ---------------------------+ |
record 16 16 ---+-----------+ |
record 17 17 ---+ +---------------------------------+
record 15 15 ---------------+ |
record 25 25 -------------------------------------------------+