SlideShare a Scribd company logo
1 of 16
K-Mean Clustering
Silahkan browsing
• Clustering document
• K-mean clustering algorithm
Preprocessing
Text Preprocessing
VSM (TF-IDF)
(TW-IDF)
Seleksi fitur
Modelling
Preprocessing
Text Preprocessing
VSM (TF-IDF)
(TW-IDF)
Clustering
(k-mean clustering)
Definisi
• proses untuk mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga data
dalam satu cluster memiliki tingkat kemiripan
yang maksimum dan data antar cluster
memiliki kemiripan yang minimum
• Clustering juga dikenal sebagai data
segmentasi karena clustering mempartisi
banyak data set ke dalam banyak group
berdasarkan kemiripan.
Implementasi
• Segmentasi citra
• Outlier detection
• Clusterring dokumen berita
• dll
Jarak Euclidian Distance
Algoritma k-mean
• Langkah 1 – Menentukan secara acak K titik data
sebagai pusat cluster yang disebut centroid.
• Langkah 2 – Menandai masing masing 𝑥𝑖 masuk ke ke
cluster tertentu, dengan cara menghitung jarak 𝑥𝑖 ke
masing masing pusat cluster (centroid) dan
memasukkan 𝑥𝑖 anggota pusat cluster tertentu
tersebut jika memiliki jarak terdekat.
• Langkah 3 – Menentukan pusat cluster baru dengan
menghitungya rata rata dari anggota cluster
• Langkah 4 – Ulangai langkah 2 dan 3 sampai tidak
tidak ada dari anggota setiap cluster berubah tempat
kelompoknya
Flow chart
A Simple example showing the implementation of
k-means algorithm
(using K=2)
Step 1:
Ininialisasi: Secara acak dipilih dua centroid (k=2) untuk 2
cluster .
Misal 2 centroid adalah: m1=(1.0,1.0) and m2=(5.0,7.0).
Step 2:
• Sehingga, Kita dapatkan dua
cluster dengan anggotanya:
{1,2,3} and {4,5,6,7}.
• Centroid baru adalah:
Step 3:
• Sekarang kita gunakan
centroid baru ini untuk
menghitung jarak euclidian
dari masing masing objek
• Sehingga dapatkan cluster
baru yaitu:
{1,2} and {3,4,5,6,7}
• Centroid berikutnya adalah
yaitu: m1=(1.25,1.5) dan m2
= (3.9,5.1)
• Step 4 :
Cluster baru diperoleh
diperoleh dengan masing
masing anggotanya yaitu:
{1,2} dan {3,4,5,6,7}
• Selanjutnya , karena tidak
ada perubahan anggota dari
cluster.
• Sehingga hasil akhir dari 2
cluster adalah {1,2} dan
{3,4,5,6,7}.
PLOT
• Menentukan jumlah kluster
• Jarak Intra cluster = 𝑖=1
𝑘
𝑥∈𝑐𝑖
𝑥 − 𝑧𝑖
2
• Jarak Inter-cluster = min (zi –zj)2
• i=1,2,3…K-1
• J=i+1,…K
intra
Validity=
inter
16

More Related Content

Similar to k-mean_clustering.pptx

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
Machine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfHendroGunawan8
 
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.pptPandeKadek3
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansilmuBiner
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxArwansyahDipanegara
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.pptPutrifitriasari1
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.pptJurnalJTIM
 
Presentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data MiningPresentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data MiningMatlubulKhairi
 
Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsHendro Subagyo
 
PPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxAbdulMajid84127
 

Similar to k-mean_clustering.pptx (13)

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
K-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptxK-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptx
 
Machine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdf
 
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
 
Cara pemakaian weka
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
 
Presentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data MiningPresentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data Mining
 
teknik-teknik data mining
teknik-teknik data miningteknik-teknik data mining
teknik-teknik data mining
 
Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan Netlytics
 
PPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptx
 

Recently uploaded

Pengukuran Topografi menggunakan GPS Geodetik
Pengukuran Topografi menggunakan GPS GeodetikPengukuran Topografi menggunakan GPS Geodetik
Pengukuran Topografi menggunakan GPS Geodetikzulmushawir2
 
Metode_Sampling bahan galian mineral.pptx
Metode_Sampling bahan galian mineral.pptxMetode_Sampling bahan galian mineral.pptx
Metode_Sampling bahan galian mineral.pptxHeriGeologist
 
Perencanaan Pelabuhan perikanan id.pptx
Perencanaan Pelabuhan perikanan  id.pptxPerencanaan Pelabuhan perikanan  id.pptx
Perencanaan Pelabuhan perikanan id.pptxNadhifMuhammad5
 
703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx
703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx
703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptxarisvanrush
 
PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptx
PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptxPROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptx
PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptxadista7
 
2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx
2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx
2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptxRahmanTaufiq4
 
STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptx
STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptxSTRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptx
STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptxanggawatmaja
 

Recently uploaded (15)

Pengukuran Topografi menggunakan GPS Geodetik
Pengukuran Topografi menggunakan GPS GeodetikPengukuran Topografi menggunakan GPS Geodetik
Pengukuran Topografi menggunakan GPS Geodetik
 
Metode_Sampling bahan galian mineral.pptx
Metode_Sampling bahan galian mineral.pptxMetode_Sampling bahan galian mineral.pptx
Metode_Sampling bahan galian mineral.pptx
 
Klinik Obat Aborsi Di Depok Wa 082223109953 Klinik Aborsi Di Depok
Klinik Obat Aborsi Di Depok Wa 082223109953 Klinik Aborsi Di DepokKlinik Obat Aborsi Di Depok Wa 082223109953 Klinik Aborsi Di Depok
Klinik Obat Aborsi Di Depok Wa 082223109953 Klinik Aborsi Di Depok
 
Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jual Ob...
Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jual Ob...Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jual Ob...
Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jual Ob...
 
Obat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli Di Sungai Penuh
Obat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli Di Sungai PenuhObat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli Di Sungai Penuh
Obat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli Di Sungai Penuh
 
Obat Aborsi jakarta WA 082223109953 Jual Obat Aborsi Cytotec Asli Di jakarta
Obat Aborsi jakarta WA 082223109953  Jual Obat Aborsi Cytotec Asli Di jakartaObat Aborsi jakarta WA 082223109953  Jual Obat Aborsi Cytotec Asli Di jakarta
Obat Aborsi jakarta WA 082223109953 Jual Obat Aborsi Cytotec Asli Di jakarta
 
Perencanaan Pelabuhan perikanan id.pptx
Perencanaan Pelabuhan perikanan  id.pptxPerencanaan Pelabuhan perikanan  id.pptx
Perencanaan Pelabuhan perikanan id.pptx
 
Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...
Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...
Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...
 
obat aborsi Pangkal pinang Wa 082223109953 Jual obat aborsi Cytotec asli Di P...
obat aborsi Pangkal pinang Wa 082223109953 Jual obat aborsi Cytotec asli Di P...obat aborsi Pangkal pinang Wa 082223109953 Jual obat aborsi Cytotec asli Di P...
obat aborsi Pangkal pinang Wa 082223109953 Jual obat aborsi Cytotec asli Di P...
 
703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx
703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx
703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx
 
PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptx
PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptxPROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptx
PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptx
 
Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...
Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...
Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...
 
2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx
2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx
2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx
 
Jual Obat Aborsi Samarinda ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jua...
Jual Obat Aborsi Samarinda ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jua...Jual Obat Aborsi Samarinda ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jua...
Jual Obat Aborsi Samarinda ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jua...
 
STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptx
STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptxSTRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptx
STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptx
 

k-mean_clustering.pptx

  • 2. Silahkan browsing • Clustering document • K-mean clustering algorithm Preprocessing Text Preprocessing VSM (TF-IDF) (TW-IDF) Seleksi fitur Modelling Preprocessing Text Preprocessing VSM (TF-IDF) (TW-IDF) Clustering (k-mean clustering)
  • 3. Definisi • proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum • Clustering juga dikenal sebagai data segmentasi karena clustering mempartisi banyak data set ke dalam banyak group berdasarkan kemiripan.
  • 4. Implementasi • Segmentasi citra • Outlier detection • Clusterring dokumen berita • dll
  • 6.
  • 7. Algoritma k-mean • Langkah 1 – Menentukan secara acak K titik data sebagai pusat cluster yang disebut centroid. • Langkah 2 – Menandai masing masing 𝑥𝑖 masuk ke ke cluster tertentu, dengan cara menghitung jarak 𝑥𝑖 ke masing masing pusat cluster (centroid) dan memasukkan 𝑥𝑖 anggota pusat cluster tertentu tersebut jika memiliki jarak terdekat. • Langkah 3 – Menentukan pusat cluster baru dengan menghitungya rata rata dari anggota cluster • Langkah 4 – Ulangai langkah 2 dan 3 sampai tidak tidak ada dari anggota setiap cluster berubah tempat kelompoknya
  • 9.
  • 10. A Simple example showing the implementation of k-means algorithm (using K=2)
  • 11. Step 1: Ininialisasi: Secara acak dipilih dua centroid (k=2) untuk 2 cluster . Misal 2 centroid adalah: m1=(1.0,1.0) and m2=(5.0,7.0).
  • 12. Step 2: • Sehingga, Kita dapatkan dua cluster dengan anggotanya: {1,2,3} and {4,5,6,7}. • Centroid baru adalah:
  • 13. Step 3: • Sekarang kita gunakan centroid baru ini untuk menghitung jarak euclidian dari masing masing objek • Sehingga dapatkan cluster baru yaitu: {1,2} and {3,4,5,6,7} • Centroid berikutnya adalah yaitu: m1=(1.25,1.5) dan m2 = (3.9,5.1)
  • 14. • Step 4 : Cluster baru diperoleh diperoleh dengan masing masing anggotanya yaitu: {1,2} dan {3,4,5,6,7} • Selanjutnya , karena tidak ada perubahan anggota dari cluster. • Sehingga hasil akhir dari 2 cluster adalah {1,2} dan {3,4,5,6,7}.
  • 15. PLOT
  • 16. • Menentukan jumlah kluster • Jarak Intra cluster = 𝑖=1 𝑘 𝑥∈𝑐𝑖 𝑥 − 𝑧𝑖 2 • Jarak Inter-cluster = min (zi –zj)2 • i=1,2,3…K-1 • J=i+1,…K intra Validity= inter 16

Editor's Notes

  1. intra minimize the sum of squared distances from all points to their cluster centers. inter separate the differences between clusters …. bigger the better. 越大表越分散,故可用較少的點便可分群