SlideShare a Scribd company logo
1 of 33
Download to read offline
Klasterisasi
Elvi Rahmi, S.T., M.Kom.
elvizasri@gmail.com
Data Mining
Algoritma K-Means
Clustering
Diberikan data profil pelanggan, bagaimana memilih data pelanggan yang potensial untuk
ditawarkan produk tertentu?
Diberikan data profil pelanggan, bagaimana memilih data pelanggan yang potensial
untuk ditawarkan produk tertentu?
Kita diminta untuk
mengelompokkan data
customer di samping
berdasarkan kesamaan
profil pelanggan.
Customer Segmentation
Clustering
Setiap pelanggan berhasil
dikelompokkan.
Contoh hasil clustering/segmentasi pelanggan
Klasterisasi
Klasterisasi mengelompokkan data secara otomatis tanpa perlu diberitahu label
kelasnya.
Klasterisasi atau clustering adalah proses pengelompokan himpunan data ke dalam
beberapa group atau klaster sedemikian hingga objek-objek dalam suatu klaster
memiliki kemiripan yang tinggi, namun sangat berbeda (memiliki ketidakmiripan yang
tinggi) dengan objek-objek di klaster-klaster lainnya (J Han et al. 2012).
Kemiripan (similarities) dan ketidakmiripan (dissimilarities) dihitung berdasarkan
nilai-nilai atribut yang menggambarkan objek-objek tersebut dan seringkali
melibatkan ukuran jarak.
Data Mining
Penerapan Klasterisasi
Retail/Marketing
Analisis pola transaksi yang dilakukan pelanggan
Rekomendasi buku, film, atau produk baru untuk pelanggan
baru
Perbankan
Deteksi fraud dalam transaksi perbankan
Pengelompokan nasabah (program loyalitas
nasabah)
Asuransi
Deteksi fraud dalam klaim asuransi
Analisis risiko asuransi bagi pelanggan
Berita dan Penerbitan
Kategorisasi berita secara otomatis
Rekomendasi artikel/berita baru
Penggunaan
Algoritma Clustering
Exploratory Data Analysis
Generate Rangkuman (summary generation)
Deteksi Pencilan (outlier detection)
Mencari duplikat (finding duplicates)
Tahap pra-pemrosesan data
Kompresi data/image
Optimasi algoritma k-NN
dll
Kategori Metode
Klasterisasi
k-Means
k-Modes
k-Medoids
Fuzzy c-Means
dll
Metode berbasis partisi
(partitioning methods)
Ukuran Jarak
BIRCH (Balanced Iterative
Reducing and Clustering)
Chameleon
Agglomerative
Divisive, dll
Metode berbasis hirarki
(hierarchical methods)
DBSCAN
OPTICS
DENCLUE
dll
Metode berbasis kepadatan
(density-based methods)
STING
CLIQUE
dll
Metode berbasis kisi
(grid-based methods)
Algoritma K-Means Clustering
Klasterisasi
K-Means merupakan algoritma klasterisasi yang paling tua dan paling banyak digunakan.
Algoritma K-Means bersifat iteratif yang mencoba untuk mempartisi dataset menjadi
subkelompok nonoverlapping berbeda yang ditentukan oleh K (cluster) di mana setiap titik
data hanya dimiliki oleh satu kelompok.
K-Means mencoba membuat titik data intracluster semirip mungkin dengan titik data yang
lain pada satu cluster.
K-Means menetapkan poin data ke cluster sedemikian rupa sehingga jumlah jarak kuadrat
antara titik data dan pusat data cluster (centroid) adalah minimal.
Ide dasar algoritma K-Means adalah meminimalkan Sum of Squared Error (SSE) antara objek-
objek data dengan sejumlah k centroid.
Langkah Algoritma K-Means Clustering
Klasterisasi
Tentukan jumlah klaster (nilai K)
1.
Ditentukan dengan melihat kebutuhan atau tujuan klastering, melakukan pengujian jumlah k
yang tepat.
2. Inisialisasi nilai centroid awal setiap klaster secara acak
3. Hitung jarak setiap titik data dengan setiap centroid
4. Masukkan setiap titik data ke dalam klaster berdasarkan jarak terdekat dengan pusat klaster
5. Untuk setiap klaster, tentukan nilai centroid baru berdasarkan rerata (means) dari setiap data di
dalam klaster
6. Ulangi langkah 3-5 hingga tidak ada perubahan anggota klaster
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Data Pelanggan
Diketahui terdapat data pelanggan. Kita diminta
untuk mengelompokkan data pelanggan menjadi
dua kelompok.
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Tentukan Jumlah Klaster
1.
Dalam contoh kasus ini, klaster berjumlah 2.
Klaster 1 Klaster 2
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
2. Inisialisasi nilai centroid awal setiap klaster secara acak
Cara penentuan centroid awal:
Memilih salah satu data untuk atribut "Age"
dan "Income" secara acak.
Membangkitkan bilangan acak sesuai rentang
nilai "Age" dan "Income".
1.
2.
Misal, kita menentukan centroid awal
berdasarkan cara 1. Kita tentukan C1 = (41,19)
dan C2 = (47,100).
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
2. Inisialisasi nilai centroid awal setiap klaster secara acak
Misal, kita menentukan centroid awal berdasarkan
cara 1. Kita tentukan C1 = (41,19) dan C2 = (47,100).
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
3. Hitung jarak setiap titik data dengan setiap centroid.
Misal: menggunakan Euclidean Distance
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
4. Masukkan setiap titik data ke dalam klaster berdasarkan jarak terdekat dengan centroid
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
4. Masukkan setiap titik data ke dalam klaster berdasarkan jarak terdekat dengan centroid
Klaster 1 Klaster 2
Cust 1
Cust 3
Cust 4
Cust 7
Cust 9
Cust 2
Cust 5
Cust 6
Cust 8
Cust 10
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di
dalam klaster
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di
dalam klaster
Nilai centroid baru C1?
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di
dalam klaster
Centroid baru C1= (mean(41;33;29;38;26), mean(19;57;19;56;18)) = (33,4; 33,8)
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di
dalam klaster
Nilai centroid baru C2?
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di
dalam klaster
Centroid baru C2 = (mean(47;47;40;42;47), mean(100;253;81;64;115)) = (44,6; 122,6)
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Pergeseran centroid setiap klaster. C1 = (33,4; 33,8) dan C2 = (44,6; 122,6)
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
6. Ulangi langkah 3-5 menggunakan centroid baru
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
6. Ulangi langkah 3-5 menggunakan centroid baru
Apakah hasil klasterisasinya sama dengan tahap sebelumnya?
Jika sama, hentikan proses klasterisasi
Jika belum sama, ulangi langkah 3-5
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Contoh Kasus: Klasterisasi Pelanggan
Klasterisasi
Optimasi Nilai k pada K-Means
Klasterisasi
Jumlah klaster (nilai k) merupakan salah satu faktor krusial baik atau tidaknya metode K-
Means. Hasil pengelompokan akan menghasilkan analisa yang berbeda untuk jumlah klaster
yang berbeda.
Semakin kecil nilai k, maka pembagian kluster menjadi cepat. Namun, mungkin ada informasi
tersembunyi yang tidak terungkap.
Semakin besar nilai k, maka akan terbentuk banyak klaster. Mungkin akan terlalu sulit untuk
membuat analisa atau memilih dukungan keputusan dari hasil klaster.
Optimasi Nilai k pada K-Means
Klasterisasi
Penentuan nilai k terbaik dapat dilakukan berdasarkan ukuran kualitas hasil klasterisasi.
Beberapa ukuran kualitas klaster:
Sum Square Error (SSE)
Davies Bouldin Index (DBI)
Silhoutte Coefficient
Rand Index
Mutual Information
Calinski-Harabasz Index (C-H Index)
Dunn Index
1.
2.
3.
4.
5.
6.
7.
Penentuan Nilai k Terbaik dengan Metode Elbow
Klasterisasi
Untuk mengetahui jumlah klaster yang
paling baik adalah dengan cara melihat
perbandingan kualitas klaster untuk
setiap pilihan nilai k (Misal: k=2,3,4,5, ...).
Nilai k yang dipilih adalah nilai k yang
memiliki perubahan kualitas signifikan,
seperti sebuah siku (elbow).
Referensi
Klasterisasi
Suyanto. 2019. Data Mining: Untuk Klasifikasi dan Klasterisasi Data. Bandung. Informatika
Achmad Solichin. 2021. Algoritma K-Means Clustering: Konsep dan Contoh Perhitungannya |
Unsupervised Learning. https://www.youtube.com/watch?v=oO0Wn_h8fe8. Diakses
November 2022.

More Related Content

What's hot

Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxAdam Superman
 
5 ta-2021-05-business-understanding-modul-ariw-2021-07-17
5 ta-2021-05-business-understanding-modul-ariw-2021-07-175 ta-2021-05-business-understanding-modul-ariw-2021-07-17
5 ta-2021-05-business-understanding-modul-ariw-2021-07-17ArdianDwiPraba
 
Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...
Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...
Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...Devi Apriansyah
 
Algoritma dan Struktur Data - Binary Search
Algoritma dan Struktur Data - Binary SearchAlgoritma dan Struktur Data - Binary Search
Algoritma dan Struktur Data - Binary SearchKuliahKita
 
K MEANS CLUSTERING
K MEANS CLUSTERINGK MEANS CLUSTERING
K MEANS CLUSTERINGsingh7599
 
Nearest Neighbor Algorithm Zaffar Ahmed
Nearest Neighbor Algorithm  Zaffar AhmedNearest Neighbor Algorithm  Zaffar Ahmed
Nearest Neighbor Algorithm Zaffar AhmedZaffar Ahmed Shaikh
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Adam Mukharil Bachtiar
 
Dimensional Modelling
Dimensional ModellingDimensional Modelling
Dimensional Modellingdedidarwis
 
Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)Mustafa Sherazi
 
Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5ilmuBiner
 
Materi Data Mining - C4.5
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5dedidarwis
 
Permainan strategi campuran
Permainan strategi campuranPermainan strategi campuran
Permainan strategi campurangleebelle
 
K means Clustering
K means ClusteringK means Clustering
K means ClusteringEdureka!
 

What's hot (20)

Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
 
5 ta-2021-05-business-understanding-modul-ariw-2021-07-17
5 ta-2021-05-business-understanding-modul-ariw-2021-07-175 ta-2021-05-business-understanding-modul-ariw-2021-07-17
5 ta-2021-05-business-understanding-modul-ariw-2021-07-17
 
Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...
Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...
Laporan praktikum modul 2 (membuat table, primary key,foreign key menggunakan...
 
Algoritma dan Struktur Data - Binary Search
Algoritma dan Struktur Data - Binary SearchAlgoritma dan Struktur Data - Binary Search
Algoritma dan Struktur Data - Binary Search
 
K MEANS CLUSTERING
K MEANS CLUSTERINGK MEANS CLUSTERING
K MEANS CLUSTERING
 
Data Preprocessing
Data PreprocessingData Preprocessing
Data Preprocessing
 
Kmeans
KmeansKmeans
Kmeans
 
My8clst
My8clstMy8clst
My8clst
 
Nearest Neighbor Algorithm Zaffar Ahmed
Nearest Neighbor Algorithm  Zaffar AhmedNearest Neighbor Algorithm  Zaffar Ahmed
Nearest Neighbor Algorithm Zaffar Ahmed
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)
 
Decision Tree Learning
Decision Tree LearningDecision Tree Learning
Decision Tree Learning
 
Dimensional Modelling
Dimensional ModellingDimensional Modelling
Dimensional Modelling
 
Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)
 
Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5
 
Materi Data Mining - C4.5
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5
 
2700 3 data preprocessing
2700 3 data preprocessing2700 3 data preprocessing
2700 3 data preprocessing
 
Materi statistika-smp
Materi statistika-smpMateri statistika-smp
Materi statistika-smp
 
Permainan strategi campuran
Permainan strategi campuranPermainan strategi campuran
Permainan strategi campuran
 
K means Clustering
K means ClusteringK means Clustering
K means Clustering
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 

Similar to Klasterisasi Pelanggan

Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.pptPandeKadek3
 
Machine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdfMachine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdfHendroGunawan8
 
APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningDEDE IRYAWAN
 
Machine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfHendroGunawan8
 
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptxDM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptxHilwinNisa1
 
CUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdf
CUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdfCUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdf
CUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdfRahmatTaufiqSigit
 
Tm aljabar linear matriks
Tm aljabar linear matriksTm aljabar linear matriks
Tm aljabar linear matriksEno Mandala
 
Metode statistik multivariat
Metode statistik multivariatMetode statistik multivariat
Metode statistik multivariatkartiko edhi
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansilmuBiner
 
Data mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaData mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaUniversitas Gadjah Mada
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriAndika Dwi Hadiri
 

Similar to Klasterisasi Pelanggan (20)

Data mining 7
Data mining 7Data mining 7
Data mining 7
 
K-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptxK-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptx
 
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
 
LN s10-machine vision-s2
LN s10-machine vision-s2LN s10-machine vision-s2
LN s10-machine vision-s2
 
Machine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdfMachine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdf
 
k-mean_clustering.pptx
k-mean_clustering.pptxk-mean_clustering.pptx
k-mean_clustering.pptx
 
APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data Mining
 
Machine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdf
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptxDM_P11_Unsupervised Learning (K-Means Clustering).pptx
DM_P11_Unsupervised Learning (K-Means Clustering).pptx
 
1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
 
CUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdf
CUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdfCUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdf
CUSTOMER SEGMENTATION ANALYSIS WITH PYTHON.pdf
 
Tm aljabar linear matriks
Tm aljabar linear matriksTm aljabar linear matriks
Tm aljabar linear matriks
 
Metode statistik multivariat
Metode statistik multivariatMetode statistik multivariat
Metode statistik multivariat
 
Cara pemakaian weka
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
 
6015 15 clustering
6015 15 clustering6015 15 clustering
6015 15 clustering
 
clustering
clusteringclustering
clustering
 
Data mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaData mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannya
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
 

More from Elvi Rahmi

06 - Machine Learning .pdf
06 - Machine Learning .pdf06 - Machine Learning .pdf
06 - Machine Learning .pdfElvi Rahmi
 
Algoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfAlgoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfElvi Rahmi
 
05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdfElvi Rahmi
 
03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdfElvi Rahmi
 
02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdfElvi Rahmi
 
01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdfElvi Rahmi
 
07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdfElvi Rahmi
 
05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdfElvi Rahmi
 
Teknik Sampling
Teknik SamplingTeknik Sampling
Teknik SamplingElvi Rahmi
 
04 - Teori Peluang.pdf
04 - Teori Peluang.pdf04 - Teori Peluang.pdf
04 - Teori Peluang.pdfElvi Rahmi
 
Quiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfQuiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfElvi Rahmi
 
03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdfElvi Rahmi
 
02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdfElvi Rahmi
 
01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdfElvi Rahmi
 
Mastering the master of ceremony
Mastering the master of ceremonyMastering the master of ceremony
Mastering the master of ceremonyElvi Rahmi
 
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukImplementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukElvi Rahmi
 
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Elvi Rahmi
 

More from Elvi Rahmi (17)

06 - Machine Learning .pdf
06 - Machine Learning .pdf06 - Machine Learning .pdf
06 - Machine Learning .pdf
 
Algoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfAlgoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdf
 
05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf
 
03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf
 
02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf
 
01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf
 
07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf
 
05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf
 
Teknik Sampling
Teknik SamplingTeknik Sampling
Teknik Sampling
 
04 - Teori Peluang.pdf
04 - Teori Peluang.pdf04 - Teori Peluang.pdf
04 - Teori Peluang.pdf
 
Quiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfQuiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdf
 
03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf
 
02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf
 
01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf
 
Mastering the master of ceremony
Mastering the master of ceremonyMastering the master of ceremony
Mastering the master of ceremony
 
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukImplementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
 
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
 

Recently uploaded

Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Surveikustiyantidew94
 

Recently uploaded (9)

Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptx
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptx
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Survei
 

Klasterisasi Pelanggan

  • 1. Klasterisasi Elvi Rahmi, S.T., M.Kom. elvizasri@gmail.com Data Mining Algoritma K-Means Clustering
  • 2. Diberikan data profil pelanggan, bagaimana memilih data pelanggan yang potensial untuk ditawarkan produk tertentu?
  • 3. Diberikan data profil pelanggan, bagaimana memilih data pelanggan yang potensial untuk ditawarkan produk tertentu? Kita diminta untuk mengelompokkan data customer di samping berdasarkan kesamaan profil pelanggan. Customer Segmentation Clustering
  • 4. Setiap pelanggan berhasil dikelompokkan. Contoh hasil clustering/segmentasi pelanggan
  • 5. Klasterisasi Klasterisasi mengelompokkan data secara otomatis tanpa perlu diberitahu label kelasnya. Klasterisasi atau clustering adalah proses pengelompokan himpunan data ke dalam beberapa group atau klaster sedemikian hingga objek-objek dalam suatu klaster memiliki kemiripan yang tinggi, namun sangat berbeda (memiliki ketidakmiripan yang tinggi) dengan objek-objek di klaster-klaster lainnya (J Han et al. 2012). Kemiripan (similarities) dan ketidakmiripan (dissimilarities) dihitung berdasarkan nilai-nilai atribut yang menggambarkan objek-objek tersebut dan seringkali melibatkan ukuran jarak. Data Mining
  • 6. Penerapan Klasterisasi Retail/Marketing Analisis pola transaksi yang dilakukan pelanggan Rekomendasi buku, film, atau produk baru untuk pelanggan baru Perbankan Deteksi fraud dalam transaksi perbankan Pengelompokan nasabah (program loyalitas nasabah) Asuransi Deteksi fraud dalam klaim asuransi Analisis risiko asuransi bagi pelanggan Berita dan Penerbitan Kategorisasi berita secara otomatis Rekomendasi artikel/berita baru
  • 7. Penggunaan Algoritma Clustering Exploratory Data Analysis Generate Rangkuman (summary generation) Deteksi Pencilan (outlier detection) Mencari duplikat (finding duplicates) Tahap pra-pemrosesan data Kompresi data/image Optimasi algoritma k-NN dll
  • 8. Kategori Metode Klasterisasi k-Means k-Modes k-Medoids Fuzzy c-Means dll Metode berbasis partisi (partitioning methods) Ukuran Jarak BIRCH (Balanced Iterative Reducing and Clustering) Chameleon Agglomerative Divisive, dll Metode berbasis hirarki (hierarchical methods) DBSCAN OPTICS DENCLUE dll Metode berbasis kepadatan (density-based methods) STING CLIQUE dll Metode berbasis kisi (grid-based methods)
  • 9. Algoritma K-Means Clustering Klasterisasi K-Means merupakan algoritma klasterisasi yang paling tua dan paling banyak digunakan. Algoritma K-Means bersifat iteratif yang mencoba untuk mempartisi dataset menjadi subkelompok nonoverlapping berbeda yang ditentukan oleh K (cluster) di mana setiap titik data hanya dimiliki oleh satu kelompok. K-Means mencoba membuat titik data intracluster semirip mungkin dengan titik data yang lain pada satu cluster. K-Means menetapkan poin data ke cluster sedemikian rupa sehingga jumlah jarak kuadrat antara titik data dan pusat data cluster (centroid) adalah minimal. Ide dasar algoritma K-Means adalah meminimalkan Sum of Squared Error (SSE) antara objek- objek data dengan sejumlah k centroid.
  • 10. Langkah Algoritma K-Means Clustering Klasterisasi Tentukan jumlah klaster (nilai K) 1. Ditentukan dengan melihat kebutuhan atau tujuan klastering, melakukan pengujian jumlah k yang tepat. 2. Inisialisasi nilai centroid awal setiap klaster secara acak 3. Hitung jarak setiap titik data dengan setiap centroid 4. Masukkan setiap titik data ke dalam klaster berdasarkan jarak terdekat dengan pusat klaster 5. Untuk setiap klaster, tentukan nilai centroid baru berdasarkan rerata (means) dari setiap data di dalam klaster 6. Ulangi langkah 3-5 hingga tidak ada perubahan anggota klaster
  • 11. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi Data Pelanggan Diketahui terdapat data pelanggan. Kita diminta untuk mengelompokkan data pelanggan menjadi dua kelompok.
  • 12. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi Tentukan Jumlah Klaster 1. Dalam contoh kasus ini, klaster berjumlah 2. Klaster 1 Klaster 2
  • 13. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 2. Inisialisasi nilai centroid awal setiap klaster secara acak Cara penentuan centroid awal: Memilih salah satu data untuk atribut "Age" dan "Income" secara acak. Membangkitkan bilangan acak sesuai rentang nilai "Age" dan "Income". 1. 2. Misal, kita menentukan centroid awal berdasarkan cara 1. Kita tentukan C1 = (41,19) dan C2 = (47,100).
  • 14. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 2. Inisialisasi nilai centroid awal setiap klaster secara acak Misal, kita menentukan centroid awal berdasarkan cara 1. Kita tentukan C1 = (41,19) dan C2 = (47,100).
  • 15. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 3. Hitung jarak setiap titik data dengan setiap centroid. Misal: menggunakan Euclidean Distance
  • 16. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 4. Masukkan setiap titik data ke dalam klaster berdasarkan jarak terdekat dengan centroid
  • 17. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 4. Masukkan setiap titik data ke dalam klaster berdasarkan jarak terdekat dengan centroid Klaster 1 Klaster 2 Cust 1 Cust 3 Cust 4 Cust 7 Cust 9 Cust 2 Cust 5 Cust 6 Cust 8 Cust 10
  • 18. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di dalam klaster
  • 19. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di dalam klaster Nilai centroid baru C1?
  • 20. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di dalam klaster Centroid baru C1= (mean(41;33;29;38;26), mean(19;57;19;56;18)) = (33,4; 33,8)
  • 21. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di dalam klaster Nilai centroid baru C2?
  • 22. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 5. Untuk setiap klaster, hitung nilai centroid baru berdasarkan rerata (means) dari setiap data di dalam klaster Centroid baru C2 = (mean(47;47;40;42;47), mean(100;253;81;64;115)) = (44,6; 122,6)
  • 23. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi Pergeseran centroid setiap klaster. C1 = (33,4; 33,8) dan C2 = (44,6; 122,6)
  • 24. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 6. Ulangi langkah 3-5 menggunakan centroid baru
  • 25. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi 6. Ulangi langkah 3-5 menggunakan centroid baru Apakah hasil klasterisasinya sama dengan tahap sebelumnya? Jika sama, hentikan proses klasterisasi Jika belum sama, ulangi langkah 3-5
  • 26. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi
  • 27. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi
  • 28. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi
  • 29. Contoh Kasus: Klasterisasi Pelanggan Klasterisasi
  • 30. Optimasi Nilai k pada K-Means Klasterisasi Jumlah klaster (nilai k) merupakan salah satu faktor krusial baik atau tidaknya metode K- Means. Hasil pengelompokan akan menghasilkan analisa yang berbeda untuk jumlah klaster yang berbeda. Semakin kecil nilai k, maka pembagian kluster menjadi cepat. Namun, mungkin ada informasi tersembunyi yang tidak terungkap. Semakin besar nilai k, maka akan terbentuk banyak klaster. Mungkin akan terlalu sulit untuk membuat analisa atau memilih dukungan keputusan dari hasil klaster.
  • 31. Optimasi Nilai k pada K-Means Klasterisasi Penentuan nilai k terbaik dapat dilakukan berdasarkan ukuran kualitas hasil klasterisasi. Beberapa ukuran kualitas klaster: Sum Square Error (SSE) Davies Bouldin Index (DBI) Silhoutte Coefficient Rand Index Mutual Information Calinski-Harabasz Index (C-H Index) Dunn Index 1. 2. 3. 4. 5. 6. 7.
  • 32. Penentuan Nilai k Terbaik dengan Metode Elbow Klasterisasi Untuk mengetahui jumlah klaster yang paling baik adalah dengan cara melihat perbandingan kualitas klaster untuk setiap pilihan nilai k (Misal: k=2,3,4,5, ...). Nilai k yang dipilih adalah nilai k yang memiliki perubahan kualitas signifikan, seperti sebuah siku (elbow).
  • 33. Referensi Klasterisasi Suyanto. 2019. Data Mining: Untuk Klasifikasi dan Klasterisasi Data. Bandung. Informatika Achmad Solichin. 2021. Algoritma K-Means Clustering: Konsep dan Contoh Perhitungannya | Unsupervised Learning. https://www.youtube.com/watch?v=oO0Wn_h8fe8. Diakses November 2022.