k-mean_clustering.pptx

•Download as PPTX, PDF•

0 likes•5 views

BCodeigniterShohibun

k-mean clustering ppt

Engineering

Silahkan browsing
• Clustering document
• K-mean clustering algorithm
Preprocessing
Text Preprocessing
VSM (TF-IDF)
(TW-IDF)
Seleksi fitur
Modelling
Preprocessing
Text Preprocessing
VSM (TF-IDF)
(TW-IDF)
Clustering
(k-mean clustering)

Definisi
• proses untuk mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga data
dalam satu cluster memiliki tingkat kemiripan
yang maksimum dan data antar cluster
memiliki kemiripan yang minimum
• Clustering juga dikenal sebagai data
segmentasi karena clustering mempartisi
banyak data set ke dalam banyak group
berdasarkan kemiripan.

Implementasi
• Segmentasi citra
• Outlier detection
• Clusterring dokumen berita
• dll

Algoritma k-mean
• Langkah 1 – Menentukan secara acak K titik data
sebagai pusat cluster yang disebut centroid.
• Langkah 2 – Menandai masing masing 𝑥𝑖 masuk ke ke
cluster tertentu, dengan cara menghitung jarak 𝑥𝑖 ke
masing masing pusat cluster (centroid) dan
memasukkan 𝑥𝑖 anggota pusat cluster tertentu
tersebut jika memiliki jarak terdekat.
• Langkah 3 – Menentukan pusat cluster baru dengan
menghitungya rata rata dari anggota cluster
• Langkah 4 – Ulangai langkah 2 dan 3 sampai tidak
tidak ada dari anggota setiap cluster berubah tempat
kelompoknya

A Simple example showing the implementation of
k-means algorithm
(using K=2)

Step 1:
Ininialisasi: Secara acak dipilih dua centroid (k=2) untuk 2
cluster .
Misal 2 centroid adalah: m1=(1.0,1.0) and m2=(5.0,7.0).

Step 2:
• Sehingga, Kita dapatkan dua
cluster dengan anggotanya:
{1,2,3} and {4,5,6,7}.
• Centroid baru adalah:

Step 3:
• Sekarang kita gunakan
centroid baru ini untuk
menghitung jarak euclidian
dari masing masing objek
• Sehingga dapatkan cluster
baru yaitu:
{1,2} and {3,4,5,6,7}
• Centroid berikutnya adalah
yaitu: m1=(1.25,1.5) dan m2
= (3.9,5.1)

• Step 4 :
Cluster baru diperoleh
diperoleh dengan masing
masing anggotanya yaitu:
{1,2} dan {3,4,5,6,7}
• Selanjutnya , karena tidak
ada perubahan anggota dari
cluster.
• Sehingga hasil akhir dari 2
cluster adalah {1,2} dan
{3,4,5,6,7}.

• Menentukan jumlah kluster
• Jarak Intra cluster = 𝑖=1
𝑘
𝑥∈𝑐𝑖
𝑥 − 𝑧𝑖
2
• Jarak Inter-cluster = min (zi –zj)2
• i=1,2,3…K-1
• J=i+1,…K
intra
Validity=
inter
16

Similar to k-mean_clustering.pptx

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest

K-MEANS CLUSTERING.pptxGemmaDwiPrasetya

Machine Learning Diskusi 10.pdfHendroGunawan8

Clustering _IgedeAris.pptPandeKadek3

Belajar mudah algoritma data mining k meansilmuBiner

Cara pemakaian wekaNurdin Sumantri

Pertemuan 3 Model Data Mining.pptxArwansyahDipanegara

04-cara-pemakaian-weka.pptPutrifitriasari1

Tutorial WEKA.pptJurnalJTIM

Presentasi Pemakaian WEKA pada Data MiningMatlubulKhairi

teknik-teknik data miningUniversitas Bina Darma Palembang

Visualisasi Data Kualitatif dengan NetlyticsHendro Subagyo

PPT_Data_Mining_Kel_3.pptxAbdulMajid84127

Similar to k-mean_clustering.pptx (13)

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...

K-MEANS CLUSTERING.pptx

Machine Learning Diskusi 10.pdf

Clustering _IgedeAris.ppt

Belajar mudah algoritma data mining k means

Cara pemakaian weka

Pertemuan 3 Model Data Mining.pptx

04-cara-pemakaian-weka.ppt

Tutorial WEKA.ppt

Presentasi Pemakaian WEKA pada Data Mining

teknik-teknik data mining

Visualisasi Data Kualitatif dengan Netlytics

PPT_Data_Mining_Kel_3.pptx

Recently uploaded

Pengukuran Topografi menggunakan GPS Geodetikzulmushawir2

Metode_Sampling bahan galian mineral.pptxHeriGeologist

Klinik Obat Aborsi Di Depok Wa 082223109953 Klinik Aborsi Di DepokKlinik Obat Aborsi Di Depok Wa 082223109953

Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jual Ob...Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953

Obat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli Di Sungai PenuhObat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli

Obat Aborsi jakarta WA 082223109953 Jual Obat Aborsi Cytotec Asli Di jakartaObat Aborsi jakarta WA 082223109953 Cytotec Asli Di jakarta

Perencanaan Pelabuhan perikanan id.pptxNadhifMuhammad5

Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...Obat Aborsi Jakarta ( Ampuh _ No. 1 ) Kandungan Jakarta

obat aborsi Pangkal pinang Wa 082223109953 Jual obat aborsi Cytotec asli Di P...obat aborsi Pangkal pinang 082223109953 Jual obat aborsi

703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptxarisvanrush

PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptxadista7

Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...Obat Aborsi Jakarta ( Ampuh _ No. 1 ) Kandungan Jakarta

2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptxRahmanTaufiq4

Jual Obat Aborsi Samarinda ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jua... Obat Aborsi Samarinda ( Asli Ampuh No.1 ) Samarinda

STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptxanggawatmaja

Recently uploaded (15)

Pengukuran Topografi menggunakan GPS Geodetik

Metode_Sampling bahan galian mineral.pptx

Klinik Obat Aborsi Di Depok Wa 082223109953 Klinik Aborsi Di Depok

Jual Obat Aborsi Batam ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jual Ob...

Obat Aborsi Sungai Penuh 082223109953 Jual Cytotec Asli Di Sungai Penuh

Obat Aborsi jakarta WA 082223109953 Jual Obat Aborsi Cytotec Asli Di jakarta

Perencanaan Pelabuhan perikanan id.pptx

Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...

obat aborsi Pangkal pinang Wa 082223109953 Jual obat aborsi Cytotec asli Di P...

703618627-PPT-INVESTIGASI-KECELAKAAN-KERJA.pptx

PROSEDUR DALAM MELAKUKAN PERHITUNGAN PEKERJAAN PINTU.pptx

Jual Obat Aborsi Jakarta Selatan 0822 2310 9953 Klinik Jual Obat Cytotec Asli...

2. Bp. Suwardi-MATERI RAKOR DITJEN PLANOLOGI DAN TL.pptx

Jual Obat Aborsi Samarinda ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik Jua...

STRUKTUR KONSTRUKSI BANGUNAN TINGGI -.pptx

k-mean_clustering.pptx

1. K-Mean Clustering

2. Silahkan browsing • Clustering document • K-mean clustering algorithm Preprocessing Text Preprocessing VSM (TF-IDF) (TW-IDF) Seleksi fitur Modelling Preprocessing Text Preprocessing VSM (TF-IDF) (TW-IDF) Clustering (k-mean clustering)

3. Definisi • proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum • Clustering juga dikenal sebagai data segmentasi karena clustering mempartisi banyak data set ke dalam banyak group berdasarkan kemiripan.

4. Implementasi • Segmentasi citra • Outlier detection • Clusterring dokumen berita • dll

5. Jarak Euclidian Distance

7. Algoritma k-mean • Langkah 1 – Menentukan secara acak K titik data sebagai pusat cluster yang disebut centroid. • Langkah 2 – Menandai masing masing 𝑥𝑖 masuk ke ke cluster tertentu, dengan cara menghitung jarak 𝑥𝑖 ke masing masing pusat cluster (centroid) dan memasukkan 𝑥𝑖 anggota pusat cluster tertentu tersebut jika memiliki jarak terdekat. • Langkah 3 – Menentukan pusat cluster baru dengan menghitungya rata rata dari anggota cluster • Langkah 4 – Ulangai langkah 2 dan 3 sampai tidak tidak ada dari anggota setiap cluster berubah tempat kelompoknya

8. Flow chart

10. A Simple example showing the implementation of k-means algorithm (using K=2)

11. Step 1: Ininialisasi: Secara acak dipilih dua centroid (k=2) untuk 2 cluster . Misal 2 centroid adalah: m1=(1.0,1.0) and m2=(5.0,7.0).

12. Step 2: • Sehingga, Kita dapatkan dua cluster dengan anggotanya: {1,2,3} and {4,5,6,7}. • Centroid baru adalah:

13. Step 3: • Sekarang kita gunakan centroid baru ini untuk menghitung jarak euclidian dari masing masing objek • Sehingga dapatkan cluster baru yaitu: {1,2} and {3,4,5,6,7} • Centroid berikutnya adalah yaitu: m1=(1.25,1.5) dan m2 = (3.9,5.1)

14. • Step 4 : Cluster baru diperoleh diperoleh dengan masing masing anggotanya yaitu: {1,2} dan {3,4,5,6,7} • Selanjutnya , karena tidak ada perubahan anggota dari cluster. • Sehingga hasil akhir dari 2 cluster adalah {1,2} dan {3,4,5,6,7}.

15. PLOT

16. • Menentukan jumlah kluster • Jarak Intra cluster = 𝑖=1 𝑘 𝑥∈𝑐𝑖 𝑥 − 𝑧𝑖 2 • Jarak Inter-cluster = min (zi –zj)2 • i=1,2,3…K-1 • J=i+1,…K intra Validity= inter 16

Editor's Notes

intra minimize the sum of squared distances from all points to their cluster centers. inter separate the differences between clusters …. bigger the better. 越大表越分散，故可用較少的點便可分群

k-mean_clustering.pptx

Recommended

Recommended

More Related Content

Similar to k-mean_clustering.pptx

Similar to k-mean_clustering.pptx (13)

Recently uploaded

Recently uploaded (15)

k-mean_clustering.pptx

Editor's Notes