Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
SIDANG LUCKY G14120041
1. PENGGEROMBOLAN KOTA/KABUPATEN
DI INDONESIA BERDASARKAN ENAM INDIKATOR
ZONA BIAYA HAK PENGGUNA FREKUENSI RADIO DENGAN
METODE PARTIAL DISTANCE STRATEGY
Oleh :
Lucky Abdurahman
G14120041
Pembimbing :
Dr Ir Erfiani, MSi
Dr Ir Budi Susetyo, MS
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTIUT PERTANIAN BOGOR
BOGOR
2. 1 • Latar Belakang
• Tujuan
PENDAHULUAN
• Data
• Metode
METODOLOGI
Simpulan
Penelitian
SIMPULAN
Deskripsi Data
Hasil Penggerombolan
Perbandingan Jumlah
Gerombol Sebanyak Lima
dan Enam
HASIL DAN PEMBAHASAN
OUTLINE
23
4
4. LATAR BELAKANG
Sifat frekuensi yang
strategis dan ekonomis.
Penggunaanya harus
efektif dan optimal guna
mewujudkan kesejahteraan
bangsa
Peraturan Pemerintah RI No. 28
tahun 2005 tentang rumusan
perhitungan harga biaya hak
pengguna frekuensi yang berlaku
di Kemkominfo RI
Zona yang merupakan cerminan
dari minat pasar layanan pita
frekuensi suatu wilayah,
semakin tinggi zona maka
semakin besar biaya BHP.
Dalam data mining,
Zona = Gerombol
Pada dasarnya masih banyak faktor-
faktor dalam penentuan zona BHP,
seperti kondisi spasial, kondisi
politik Negara Indonesia, kebijakan
pemerintah, dan lain-lain. Sehingga
penelitian ini hanya
menggerombolkan saja.
5. LATAR BELAKANG
Sifat frekuensi yang
strategis dan ekonomis.
Penggunaanya harus
efektif dan optimal guna
mewujudkan kesejahteraan
bangsa
Peraturan Pemerintah RI No. 28
tahun 2005 tentang rumusan
perhitungan harga biaya hak
pengguna frekuensi yang berlaku
di Kemkominfo RI
Zona yang merupakan cerminan
dari minat pasar layanan pita
frekuensi suatu wilayah,
semakin tinggi zona maka
semakin besar biaya BHP.
Dalam data mining,
Zona = Gerombol
Pada dasarnya masih banyak faktor-
faktor dalam penentuan zona BHP,
seperti kondisi spasial, kondisi
politik Negara Indonesia, kebijakan
pemerintah, dan lain-lain. Sehingga
penelitian ini hanya
menggerombolkan saja.
Penelitian ini merupakan penelitian lanjutan dari
penelitian Sifaldi Lafery (2015).
Data yang digunakan
Metode penggerombolan yang digunakan
Tahap preprocessing of data
6. LATAR BELAKANG
Tahap Preprocessing of Data
Marjinalisasi (penghapusan) data yang tidak lengkap
Inputasi (menduga nilai data) : nol, mean, median, dll
Algoritma Khusus
Preprocessing adalah suatu proses yang
dilakukan untuk menyelesaikan masalah data
tidak lengkap dengan menerapkan hasilnya pada
metode data lengkap yang umum digunakan
(Grzymała dan Hu 2001)
Sederhana, namun menyebabkan berkurangnya informasi yang
didapat dari data set
Data tidak lengkap yang diperhitungkan dengan metode inputasi
tidak teruji kehandalannya dan menghasilkan informasi yang
tidak akurat (Troyanskaya et al. 2001)
LATAR BELAKANG
Penelitian ini merupakan penelitian lanjutan dari
penelitian Sifaldi Lafery (2015).
Data yang digunakan
Metode penggerombolan yang digunakan
Tahap preprocessing of data
Salah satu penggerombolan data menggunakan algoritma khusus
ialah metode partial distance strategy
7. LATAR BELAKANG
Penelitian ini merupakan penelitian lanjutan dari
penelitian Sifaldi Lafery (2015).
Data yang digunakan
Metode penggerombolan yang digunakan
Tahap preprocessing of data
Tahap Preprocessing of Data
Marjinalisasi (penghapusan) data yang tidak lengkap
Inputasi (menduga nilai data) : nol, mean, median, dll
Algoritma Khusus
Preprocessing adalah suatu proses yang
dilakukan untuk menyelesaikan masalah data
tidak lengkap dengan menerapkan hasilnya pada
metode data lengkap yang umum digunakan
(Grzymała dan Hu 2001)
Sederhana, namun menyebabkan berkurangnya informasi yang
didapat dari data set
Data tidak lengkap yang diperhitungkan dengan metode inputasi
tidak teruji kehandalannya dan menghasilkan informasi yang
tidak akurat (Troyanskaya et al. 2001)
Menurut Winny Dian Safitri (2015) dalam tesisnya
menjelaskan bahwa metode PDS ialah metode
yang paling efisien dalam menggerombolkan
data dengan kondisi data tidak lengkap
Salah satu penggerombolan data menggunakan algoritma khusus
ialah metode partial distance strategy
10. DATA
Peubah Keterangan
X1 Produk Domestik Regional Bruto (PDRB) 2014 (Miliar Rupiah)
X2 Kepadatan Penduduk 2014 (Jiwa / Km2)
X3 Jumlah Angkatan Kerja 2014 (Ribuan Jiwa)
X4 Persentase Pertumbuhan Ekonomi 2014 (%)
X5 Pendapatan BHP 2014 (Juta Rupiah)
X6 Jumlah Base Transceiver Station (BTS) 2014 (Unit)
X7 Indeks Harga Konsumen 2014
• Peubah yang menjadi atribut amatan merupakan peubah numerik.
• Data pada penelitian ini merupakan data sekunder yang berasal dari Badan Pusat Statistik dan
Kementerian Komunikasi dan Informatika RI tahun 2014.
• Penelitian ini dilakukan terhadap seluruh kota/kabupaten di Indonesia sebanyak 514 daerah pada
tahun 2014 dengan menggunakan peubah-peubah berdasarkan Peraturan Kementerian Komunikasi
dan Informatika RI.
16. DESKRIPSI DATA
0 data hilang (0.00%)
Jumlah Data Kosong pada Peubah X1-X6
5 data hilang (0.97%)
33 data hilang (6.42%)
3 data hilang (0.58%)
35 data hilang (6.81%)
35 data hilang (6.81%)
X1
X2
X3
X4
X5
X6
17. DESKRIPSI DATA
84.05% data hilang
432 kota/kabupaten tidak mempunyai nilai
IHK pada data set
82 nilai IHK
Mewakili 82 kota besar di Indonesia
Jumlah Data pada Peubah X7
18. Menurut Winny Dian Safitri (2015) dalam
tesisnya menjelaskan bahwa semakin besar
persentase data hilang maka dapat
menurunkan ketepatan hasil
penggerombolan pada metode PDS.
84.05% data hilang
432 kota/kabupaten tidak mempunyai nilai IHK pada data set
82 nilai IHK
Mewakili 82 kota besar di Indonesia
DESKRIPSI DATA
Jumlah Data pada Peubah X7
84.05% data hilang
432 kota/kabupaten tidak mempunyai nilai
IHK pada data set
82 nilai IHK
Mewakili 82 kota besar di Indonesia
19. Dalam menanggulangi hal tersebut, pada penelitian sebelumnya akan dilihat
korelasi antar peubah IHK (X7) terhadap peubah lainnya untuk data tahun 2012
Peubah X1 X2 X3 X4 X5 X6
X7
R -0.464 -0.378 -0.618 0.037 -0.514 -0.522
P-value 0 0 0 0.422 0 0
Peubah X7 mempunyai nilai p-value yang lebih rendah dari taraf nyata sebesar 0.05
saat dibandingkan dengan peubah X1, X2, X3, X5, dan X6. P-value tersebut
menandakan bahwa peubah X7 mempunyai korelasi yang signifikan pada taraf nyata
0.05 untuk sebagian besar peubah yang digunakan, sehingga dapat dikatakan bahwa
peubah X7 dapat diakomodir oleh sebagian besar peubah lainnya
DESKRIPSI DATA
20. Tabel Deskriptif 6 Peubah
Peubah Mean Max Min Data Hilang
Persentase
Data Hilang
X1 20 816.07 428 655.83 133.86 0 0.00%
X2 1 045.30 18 915.04 0.32 5 0.97%
X3 227.36 2 315.18 0.48 33 6.42%
X4 0.06 0.16 -0.10 3 0.58%
X5 82.42 1 378.56 0.00 35 6.81%
X6 230.25 3 467.00 1.00 35 6.81%
DESKRIPSI DATA
21. Nilai IDB Jumlah Gerombol
0.6803 2
0.93094 6
0.98952 5
1.01751 8
1.02205 9
1.05401 4
1.18429 3
1.22613 7
Nilai IDB
HASIL PENGGEROMBOLAN
22. Nilai IDB Jumlah Gerombol
0.6803 2
0.93094 6
0.98952 5
1.01751 8
1.02205 9
1.05401 4
1.18429 3
1.22613 7
Tidak sesuai dalam menggerombolkan 514
kota/kabupaten di Indonesia hanya kedalam 2
gerombol saja
Nilai IDB Jumlah Gerombol
0.6803 2
0.93094 6
0.98952 5
1.01751 8
1.02205 9
1.05401 4
1.18429 3
1.22613 7
HASIL PENGGEROMBOLAN
Nilai IDB
23. Nilai IDB Jumlah Gerombol
0.6803 2
0.93094 6
0.98952 5
1.01751 8
1.02205 9
1.05401 4
1.18429 3
1.22613 7
Pada penelitian sebelumnya oleh Sifaldy Lafery (2015)
menghasilkan jumlah gerombol optimal sebanyak
empat dengan nilai IDB sebesar 0.705 untuk data
tahun 2012.
Namun pada data tahun 2014 yang digunakan dalam
penelitian ini, jumlah gerombol sebanyak empat tidak
sesuai bila dilihat dari nilai IDB pada jumlah gerombol
tersebut yang menduduki posisi ke enam
berdasarkan nilai IDB mulai dari terkecil hingga
terbesar
Tidak sesuai dalam menggerombolkan 514
kota/kabupaten di Indonesia hanya kedalam 2
gerombol saja
HASIL PENGGEROMBOLAN
Nilai IDB
24. Nilai IDB Jumlah Gerombol
0.6803 2
0.93094 6
0.98952 5
1.01751 8
1.02205 9
1.05401 4
1.18429 3
1.22613 7
Sehingga Jumlah Gerombol
Sebanyak 5 Dan 6 Akan Dibahas
Lebih Lanjut Sebagai Solusi Jumlah
Gerombol Optimal
Jumlah gerombol sebanyak lima dan enam terlihat lebih ideal
untuk mengerombolkan 514 kota/kabupaten di Indonesia.
Selisih nilai IDB dari kedua jumlah gerombol tersebut tidak
jauh berbeda.
Pada penelitian sebelumnya oleh Sifaldy Lafery (2015)
menghasilkan jumlah gerombol optimal sebanyak
empat dengan nilai IDB sebesar 0.705 untuk data
tahun 2012.
Namun pada data tahun 2014 yang digunakan dalam
penelitian ini, jumlah gerombol sebanyak empat tidak
sesuai bila dilihat dari nilai IDB pada jumlah gerombol
sebanyak empat tersebut yang menduduki posisi ke
enam berdasarkan nilai IDB mulai dari terkecil hingga
terbesar
HASIL PENGGEROMBOLAN
Nilai IDB
26. 26 ANGGOTA
PADA GEROMBOL 1
13 ANGGOTA
PADA GEROMBOL 2
70 ANGGOTA
PADA GEROMBOL 3
105 ANGGOTA
PADA GEROMBOL 5
300 ANGGOTA
PADA GEROMBOL 4PETA HASIL PENGGEROMBOLAN
DENGAN METODE PDS UNTUK JUMLAH GEROMBOL SEBANYAK LIMA
HASIL PENGGEROMBOLAN
27. KARAKTERISTIK GEROMBOL
Jumlah Observasi Tidak Lengkap Tiap Gerombol
Gerombol 1
4%
Gerombol 2
0% Gerombol 3
0%
Gerombol 4
43%
Gerombol 5
53%
49 Observasi dengan data tak lengkap
Untuk Keseluruhan Data
35. KARAKTERISTIK GEROMBOL
Posisi Gerombol Berdasarkan Rataan Tiap Peubah
Rataan
Peubah
Gerombol
I II III IV V
X1 3 1 2 4 5
X2 4 1 2 3 5
X3 5 1 2 3 4
X4 5 2 3 4 1
X5 4 1 2 3 5
X6 3 1 2 4 5
Rataan
Peubah
Gerombol
I II III IV V
X1 3 1 2 4 5
X2 4 1 2 3 5
X3 5 1 2 3 4
X4 5 2 3 4 1
X5 4 1 2 3 5
X6 3 1 2 4 5
36. PETA HASIL PENGGEROMBOLAN
DENGAN METODE PDS UNTUK JUMLAH GEROMBOL SEBANYAK ENAM
HASIL PENGGEROMBOLAN
Gerombol 1 Gerombol 2 Gerombol 3
Gerombol 4 Gerombol 5 Gerombol 6
37. PETA HASIL PENGGEROMBOLAN
DENGAN METODE PDS UNTUK JUMLAH GEROMBOL SEBANYAK ENAM
HASIL PENGGEROMBOLAN
102 ANGGOTA 268 ANGGOTA 27 ANGGOTA
25 ANGGOTA
76 ANGGOTA
16 ANGGOTA
Gerombol 1 Gerombol 2 Gerombol 3
Gerombol 4 Gerombol 5 Gerombol 6
PADA GEROMBOL 2
PADA GEROMBOL 1
PADA GEROMBOL 3
PADA GEROMBOL 4PADA GEROMBOL 5PADA GEROMBOL 6
38. KARAKTERISTIK GEROMBOL
Jumlah Observasi Tidak Lengkap Tiap Gerombol
Gerombol 1
4%
Gerombol 2
0%
Gerombol 3
0%
Gerombol 4
0%
Gerombol 5
43%
Gerombol 6
53%
49 Observasi dengan data tak lengkap
Untuk Keseluruhan Data
45. KARAKTERISTIK GEROMBOL
Posisi Gerombol Berdasarkan Rataan Tiap Peubah
Rataan
Peubah
Gerombol
I II III IV V VI
X1 3 2 1 4 5 6
X2 4 3 1 2 5 6
X3 6 2 1 3 4 5
X4 6 4 2 3 5 1
X5 5 2 1 3 6 4
X6 4 2 1 3 6 5
46. KARAKTERISTIK GEROMBOL
Posisi Gerombol Berdasarkan Rataan Tiap Peubah
Rataan
Peubah
Gerombol
I II III IV V VI
X1 3 2 1 4 5 6
X2 4 3 1 2 5 6
X3 6 2 1 3 4 5
X4 6 4 2 3 5 1
X5 5 2 1 3 6 4
X6 4 2 1 3 6 5
Rataan
Peubah
Gerombol
I II III IV V VI
X1 3 2 1 4 5 6
X2 4 3 1 2 5 6
X3 6 2 1 3 4 5
X4 6 4 2 3 5 1
X5 5 2 1 3 6 4
X6 4 2 1 3 6 5
47. PERBANDINGAN JUMLAH GEROMBOL
SEBANYAK LIMA DAN ENAM
Rataan
Peubah
Jumlah Gerombol Sebanyak Enam
I II III IV V VI
X1 3 2 1 4 5 6
X2 4 3 1 2 5 6
X3 6 2 1 3 4 5
X4 6 4 2 3 5 1
X5 5 2 1 3 6 4
X6 4 2 1 3 6 5
Rataan
Peubah
Jumlah Gerombol Sebanyak Lima
I II III IV V
X1 3 1 2 4 5
X2 4 1 2 3 5
X3 5 1 2 3 4
X4 5 2 3 4 1
X5 4 1 2 3 5
X6 3 1 2 4 5
48. PERBANDINGAN JUMLAH GEROMBOL
SEBANYAK LIMA DAN ENAM
Rataan
Peubah
Jumlah Gerombol Sebanyak Lima
I II III IV V
X1 3 1 2 4 5
X2 4 1 2 3 5
X3 5 1 2 3 4
X4 5 2 3 4 1
X5 4 1 2 3 5
X6 3 1 2 4 5
Cenderung lebih mudah dalam menentukan
zona atau minat pasar tertinggi hingga minat
pasar terendah yang terbentuk dari hasil
penggerombolan dengan metode PDS
Zona Gerombol
Zona 1 Gerombol 2
Zona 2 Gerombol 3
Zona 3 Gerombol 4
Zona 4 Gerombol 1
Zona 5 Gerombol 5
Rataan
Peubah
Jumlah Gerombol Sebanyak Enam
I II III IV V VI
X1 3 2 1 4 5 6
X2 4 3 1 2 5 6
X3 6 2 1 3 4 5
X4 6 4 2 3 5 1
X5 5 2 1 3 6 4
X6 4 2 1 3 6 5
49. PERBANDINGAN JUMLAH GEROMBOL
SEBANYAK LIMA DAN ENAM
Sedikit lebih rumit untuk ditentukan, karena
ada beberapa gerombol yang mempunyai
kondisi peringkat setiap peubah yang lebih
fluktuatif atau tidak berpola
Rataan
Peubah
Jumlah Gerombol Sebanyak Enam
I II III IV V VI
X1 3 2 1 4 5 6
X2 4 3 1 2 5 6
X3 6 2 1 3 4 5
X4 6 4 2 3 5 1
X5 5 2 1 3 6 4
X6 4 2 1 3 6 5
Rataan
Peubah
Jumlah Germbol Sebanyak Lima
I II III IV V
X1 3 1 2 4 5
X2 4 1 2 3 5
X3 5 1 2 3 4
X4 5 2 3 4 1
X5 4 1 2 3 5
X6 3 1 2 4 5
Cenderung lebih mudah dalam menentukan
zona atau minat pasar tertinggi hingga minat
pasar terendah yang terbentuk dari hasil
penggerombolan dengan metode PDS
Zona Gerombol
Zona 1 Gerombol 2
Zona 2 Gerombol 3
Zona 3 Gerombol 4
Zona 4 Gerombol 1
Zona 5 Gerombol 5
50. PETA HASIL PENGGEROMBOLAN
DENGAN METODE PDS UNTUK JUMLAH GEROMBOL SEBANYAK LIMA
PERBANDINGAN JUMLAH GEROMBOL
SEBANYAK LIMA DAN ENAM
52. Jumlah gerombol paling optimal dari hasil penggerombolan
kota/kabupaten di Indonesia berdasarkan enam indakator
penentuan BHP frekuensi dengan metode partial distance
strategy ialah sebanyak lima gerombol.
Pada indeks penentuan gerombol optimal, data yang
digunakan ialah data yang lengkap, sehingga dibutuhkan
penjabaran lebih lanjut dalam menentukan jumlah
gerombol optimal untuk kasus data tidak lengkap.
SIMPULAN
53. Tahap preprocessing data sangat mempengaruhi hasil
penggerombolan karena bila terjadi perbedaan pada tahap
preprocessing data, kemungkinan besar akan
menghasilkan penggerombolan yang berbeda.
SIMPULAN
54. “
◇Garson DG. 2012. Cluster Analysis. Blue Book Series. North Carolina (US): North Carolina State
University.
◇Grzymała B. J., Hu M. 2001. A Comparison of Several Approaches to Missing Attribute Values in Data
Mining. USA.
◇[BPS] Badan Pusat Statistik. 2010. DKI Jakarta Dalam Angka. Jakarta: BPS.
◇[BPS] Badan Pusat Statistik. 2010. Papua Dalam Angka. Jakarta: BPS.
◇[Kominfo] Kementrian Komunikasi dan Informatika. 2005. Peraturan Menteri Komunikasi dan Informatika
Nomor :19/PER.KOMINFO/10/2005 tentang Petunjuk Pelaksanaan Tarif Atas Penerimaan Negara Bukan
Pajak Dari Biaya Penggunaan Spektrum Frekuensi Radio. Jakarta (ID): Kominfo.
◇[Kominfo] Kementrian Komunikasi dan Informatika. 2015. Data Statistik. Jakarta: Kominfo.
◇Larose, Daniel T. 2006. Data Mining Methods and Models .John Willey & Sons, inc.
◇Mattjik, Ahmad Ansori & Sumertajaya, I Made. 2011. Sidik Peubah Ganda dengan Menggunakan SAS.
Bogor (ID): IPB Press.
◇Matyja A., Simiński K. 2014. Comparison of algorithms for clustering incomplete data. Journal
Foundations of Computing and Decision Sciences 39 : 107–127.
◇Safitri, Winny D. 2015. Kajian Penggerombolan Data Tidak Lengkap Dengan Algoritma Khusus Tanpa
Inputasi [tesis]. Bogor (ID): Departemen Statistika, Institut Pertanian Bogor.
◇Troyanskaya O., Cantor M., Sherlock G., Brown P., Hastie T., Tibshirani R., Botstein D., Altman RB. 2001.
Missing value estimation methods for DNA microarrays. Journal Bioinformatics 17 : 520–525. USA.
◇Wagstaff K., Laidler V. 2005. Making the most of missing values: Object clustering with partial data in
astronomy. Proceedings of Astronomical Data Analysis Software and Systems XIV 347: 172–176.
California,USA.
◇Yatkiv, irina. dan Gusarova, Lada. 2004. The Method of Cluster Analysis Result Validation.Proceedings of
International Conference RelStat’04part 1: 75-80.
DAFTAR PUSTAKA
55. Hatur Nuhun!
Any questions?
You can find me at:
◇ luckyabdurahman12@gmail.com
◇ Facebook : Lucky Abdurahman
◇ LINE ID : durbinwatson