SlideShare a Scribd company logo
1 of 10
Download to read offline
1
Machine Learning
Pertemuan 9
Unsupervised Learning: K Mean Clustering
9.1 Pendahuluan
K-Means merupakan algoritma clustering paling populer dan sering digunakan, karena cara
kerja dan perhitungannya mudah dilakukan. Algoritme K-Mean merupakan salah satu metode
data clustering non hirarki yang mempartisi data ke dalam bentuk satu atau lebih cluster atau
kelompok . Pada K Means, setiap data yang mempunyai karakteristik yang mirip atau sama
akan dikelompokkan ke dalam satu cluster dan data yang memiliki karakteristik yang berbeda
akan dikelompokkan ke dalam cluster yang lain.
Gambar 1. Perbedaan data sebelum dan sesudah menggunakan K Means
Secara umum, teknik clustering menggunakan metode K-Means dilakukan dengan langkah
sebagai berikut:
1. Menentukan jumlah K (cluster)
2. Inisialisasikan cluster centroids (rata-rata) atau “mean” secara acak. Centroid adalah titik
pusat setiap cluster.
3. Menghitung jarak antara data dan centroid dengan menggunakan persamaan Euclidean
Distance:
D (P,Q) = 𝑃𝑖- 𝑄𝑖 = √∑ (𝑝𝑖 − 𝑞𝑖)2
𝑛
𝑖=1
4. Kelompokkan data ke dalam cluster dengan jarak yang paling dekat atau minimum dari dari
setiap data dengan centroid.
1
2
5. Menghitung nilai centroid yang baru menggunakan rumus:
Centroid baru =
𝒎𝒆𝒏𝒋𝒖𝒎𝒍𝒂𝒉𝒌𝒂𝒏 𝒔𝒆𝒎𝒖𝒂 𝒏𝒊𝒍𝒂𝒊 𝒑𝒂𝒅𝒂 𝒔𝒆𝒕𝒊𝒂𝒑 𝒄𝒍𝒖𝒔𝒕𝒆𝒓 𝒚𝒂𝒏𝒈 𝒔𝒂𝒎𝒂
𝑱𝒖𝒎𝒍𝒂𝒉 𝒅𝒂𝒕𝒂 𝒚𝒂𝒏𝒈 𝒂𝒅𝒂 𝒑𝒂𝒅𝒂 𝒄𝒍𝒖𝒔𝒕𝒆𝒓 𝒕𝒆𝒓𝒔𝒆𝒃𝒖𝒕
6. Ulangi langkah ke tiga sampai kelima sehingga sudah tidak ada lagi data yang berpindah ke
cluster lain.
9.2 Apa itu Clustering?
• Juga disebut pembelajaran tanpa pengawasan, kadang-kadang disebut klasifikasi oleh ahli
statistik dan penyortiran oleh psikolog dan segmentasi oleh orang-orang dalam pemasaran.
• Mengelompokkan data-data menjadi beberapa cluster berdasarkan kesamaannya.
9.3 Apa Pengelompokan Alami Diantara Benda-benda ini?
Gambar 2. Tokoh-tokoh dalam film Simpson
Gambar 3. Pengelompokan berdasarkan Clustering
Karyawan sekolah
Keluarga Simpson Laki-Laki
Perempuan
Clustering adalah Subjek
3
9.4 Dua Jenis Clustering
1. Partitional algorithm: Membuat beberapa partisi dan mengelompokkan objek berdasarkan
kriteria tertentu.
2. Hierarchical algorithm: Membuat dekomposisi pengelompokan objek berdasarkan kriteria
tertentu. Misal = tua-muda, tuamuda(merokok-tidak merokok).
Gambar 4. Dua jenis clustering
9.5 Apa itu Kesamaan?
Kualitas atau keadaan serupa, rupa , kemiripan, seperti, kesamaan fitur. (Kamus webmaster)
Gambar 5. Apa itu kesamaan?
Kesamaan sulit untuk didefinisikan, tapi….”Kami mengetahuinya ketika kami melihatnya”.
9.6 Jarak (Distance)
• Distance: adalah ukuran kesamaan antar objek yang dihitung berdasarkan rumusan tertentu.
Hierarchical
Partitional
4
Tabel 1. Jarak (distance)
D ( , ) = 8
D ( , ) = 1
9.7 Partitional Clustering
• Nonhierarchical: setiap objek ditempatkan di salah satu cluster.
• Non-overlapping cluster: jumlah cluster yang akan dibentuk ditentukan sejak awal.
Gambar 6. Partitional clustering
9.8 Algoritma K-Means
0
0
0
0
0
8 8 7 7
2 4 4
3 3
1
5
1. Tentukan berapa cluster k yang mau dibuat.
2. Inisialisasi centroid dari tiap cluster (randomly, if necessary).
3. Tentukan keanggotaan objek-objek yang lain dengan mengklasifikasikannya sesuai
centroid terdekat (berdasarkan distance ke centroid).
4. Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai
centroid baru.
5. Jika centroid baru tidak sama dengan centroid lama, maka perlu diaupdate lagi
keanggotaan objek-objeknya (balik ke-3). Sebaliknya, jika centroid baru sama dengan
yang lama maka selesai.
9.9 K-Means Clustering: Step 1-2
• Tentukan beberapa cluster k yang mau dibuat.
• Inisialisasi centroid dari tiap cluster (randomly, if necessary)
Gambar 7. Clustering step 1-2
9.10 K-Means Clustering: Step 3
k
k
k
1 2 3 4 5
0
1
2
3
4
5
6
Gambar 8. Clustering step 3
9.11 K-Means Clustering: Step 4
• Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai
centroid baru.
Gambar 9. Clustering step 4
9.12 K-Means Clustering: Step 5
• Jika centroid baru tidak sama dengan centroid lama, maka perlu diupdate lagi
keanggotaan objek-objeknya.
𝑘1
𝑘2
𝑘3
3
2
1
0 4 5
1
2
3
4
5
𝑘1
𝑘2 𝑘3
0 1 2 3 4 5
1
2
3
4
5
7
Gambar 10. Clustering step 5
9.13 K-Means Clustering: Finish
• Lakukan iterasi step 3-5 sampai tak ada lagi perubahan centroid dan tak ada lagi objek
yang berpindah kelas.
Gambar 11. Clustering finish
9.14 Komentar pada Metode K-Means
1. Kelebihan
• Relatif efisien: O (tkn), di mana n adalah # objek, k adalah # cluster, dan t adalah #
iterasi. Biasanya, k, t << n.
0 1 2 3 4 5
1
2
3
4
5
𝑘1
𝑘2
𝑘3
8
• Seringkali berakhir pada optimalisasi lokal. Optimum global dapat ditemukan dengan
menggunakan teknik seperti: anealling determinatik dan algoritma genetika.
2. Kelemahan
• Hanya berlaku ketika mean didefinisikan, lalu bagaimana dengan data kategoris?
• Perlu menentukan k, jumlah cluster, terlebih dahulu.
• Tidak dapat menangani data dan pencilan yang berisik.
Pertanyaan diskusi:
Jelaskan secara singkat apa yang membedakan clustering dengan klasifikasi menurut
pemahaman anda.
Jawaban:
Clustering dan klasifikasi adalah dua pendekatan yang berbeda dalam analisis data dan
pembelajaran mesin. Berikut adalah perbedaan singkat antara clustering dan klasifikasi:
1. Tujuan:
• Clustering: Tujuan clustering adalah mengelompokkan data ke dalam
kelompok-kelompok atau kluster berdasarkan kesamaan karakteristik atau pola
yang ditemukan dalam data. Tujuan utama clustering adalah untuk
mengidentifikasi struktur tersembunyi dalam data tanpa label sebelumnya.
• Klasifikasi: Tujuan klasifikasi adalah membangun model prediktif yang dapat
mengklasifikasikan data ke dalam kelas atau label yang sudah ditentukan
sebelumnya berdasarkan contoh latihan yang berlabel. Tujuan utama klasifikasi
adalah untuk membuat prediksi atau memberikan label kepada data baru
berdasarkan pembelajaran dari data latihan yang berlabel.
2. Pendekatan:
• Clustering: Clustering menggunakan pendekatan unsupervised learning, yang
berarti tidak memerlukan label atau kelas terdefinisi sebelumnya dalam data.
Algoritma clustering mencari pola, kesamaan, atau perbedaan dalam data untuk
membentuk kelompok-kelompok.
• Klasifikasi: Klasifikasi menggunakan pendekatan supervised learning, yang
berarti memerlukan data latihan yang sudah berlabel sebelumnya. Algoritma
klasifikasi mempelajari hubungan antara fitur-fitur pada data dan label yang
sesuai untuk membangun model yang dapat digunakan untuk memprediksi label
pada data baru.
3. Hasil:
9
• Clustering: Hasil dari clustering adalah kelompok-kelompok atau kluster. Data
dalam satu kelompok memiliki kesamaan yang tinggi dalam hal karakteristik
atau pola tertentu, sedangkan data di kelompok yang berbeda memiliki
perbedaan yang signifikan.
• Klasifikasi: Hasil dari klasifikasi adalah model yang dapat memprediksi label
atau kelas dari data baru. Model ini dilatih menggunakan data latihan yang
berlabel dan kemudian digunakan untuk memberikan prediksi pada data baru
yang belum diketahui labelnya.
Meskipun terdapat perbedaan signifikan antara clustering dan klasifikasi, keduanya adalah
teknik penting dalam analisis data dan pembelajaran mesin yang memiliki aplikasi yang
berbeda tergantung pada jenis masalah yang dihadapi dan jenis data yang digunakan.
Referensi
Syahid Abdullah, S. M. (2023). Machine Learning. Dalam S. M. Syahid Abdullah, Sesi 9-Unsupervised
Learning: K-Means Clustering (hal. 1 - 16). Jakarta: Informatika UNSIA.
Irwansyah Saputra, D. A. (2022). MACHINE LEARNING UNTUK PEMULA. Bandung:
INFORMATIKA
File PDF: https://docs.google.com/document/d/1WKow8RSbhp2RB9-V5k-
u8U_9eJ5cI9yd/edit?usp=sharing&ouid=101456110840209175777&rtpof=true&sd=true
10
Terima kasih

More Related Content

Similar to Machine Learning Diskusi 9.pdf

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
butest
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
DeiHart DeiHart
 

Similar to Machine Learning Diskusi 9.pdf (20)

Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
 
teknik-teknik data mining
teknik-teknik data miningteknik-teknik data mining
teknik-teknik data mining
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdf
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
 
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
 
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-meansJurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
 
Modul clustering data mining modul clustering
Modul clustering data mining modul clusteringModul clustering data mining modul clustering
Modul clustering data mining modul clustering
 
1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
 
PPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
 
Cara pemakaian weka
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
 
k-mean_clustering.pptx
k-mean_clustering.pptxk-mean_clustering.pptx
k-mean_clustering.pptx
 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
 
clustering
clusteringclustering
clustering
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
 
Data mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaData mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannya
 

More from HendroGunawan8

More from HendroGunawan8 (20)

Pengolahan Citra Diskusi Pertemuan Ke-7.pdf
Pengolahan Citra Diskusi Pertemuan Ke-7.pdfPengolahan Citra Diskusi Pertemuan Ke-7.pdf
Pengolahan Citra Diskusi Pertemuan Ke-7.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-7.pdf
Diskusi Modul Sistem Pakar Sesi Ke-7.pdfDiskusi Modul Sistem Pakar Sesi Ke-7.pdf
Diskusi Modul Sistem Pakar Sesi Ke-7.pdf
 
Estetika Humanisme Diskusi Modul Part Ke-7.pdf
Estetika Humanisme Diskusi Modul Part Ke-7.pdfEstetika Humanisme Diskusi Modul Part Ke-7.pdf
Estetika Humanisme Diskusi Modul Part Ke-7.pdf
 
Estetika Humanisme Diskusi Video Sesi Ke-7.pdf
Estetika Humanisme Diskusi Video Sesi Ke-7.pdfEstetika Humanisme Diskusi Video Sesi Ke-7.pdf
Estetika Humanisme Diskusi Video Sesi Ke-7.pdf
 
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdfJaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
 
Pengolahan Citra Diskusi Pertemuan Ke-6.pdf
Pengolahan Citra Diskusi Pertemuan Ke-6.pdfPengolahan Citra Diskusi Pertemuan Ke-6.pdf
Pengolahan Citra Diskusi Pertemuan Ke-6.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdfDiskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
 
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
 
Estetika Humanisme Diskusi Modul Ke-6.pdf
Estetika Humanisme Diskusi Modul Ke-6.pdfEstetika Humanisme Diskusi Modul Ke-6.pdf
Estetika Humanisme Diskusi Modul Ke-6.pdf
 
Estetika Humanisme Diskusi Modul Part Ke-6.pdf
Estetika Humanisme Diskusi Modul Part Ke-6.pdfEstetika Humanisme Diskusi Modul Part Ke-6.pdf
Estetika Humanisme Diskusi Modul Part Ke-6.pdf
 
Pengolahan Citra Diskusi Pertemuan Ke-5.pdf
Pengolahan Citra Diskusi Pertemuan Ke-5.pdfPengolahan Citra Diskusi Pertemuan Ke-5.pdf
Pengolahan Citra Diskusi Pertemuan Ke-5.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfDiskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfDiskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
 
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docxEstetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
 
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdfJaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
 
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdfEstetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
 
Estetika Humanisme Diskusi Video Sesi Ke-4.pdf
Estetika Humanisme Diskusi Video Sesi Ke-4.pdfEstetika Humanisme Diskusi Video Sesi Ke-4.pdf
Estetika Humanisme Diskusi Video Sesi Ke-4.pdf
 
Pengolahan Citra Diskusi Pertemuan Ke-4.pdf
Pengolahan Citra Diskusi Pertemuan Ke-4.pdfPengolahan Citra Diskusi Pertemuan Ke-4.pdf
Pengolahan Citra Diskusi Pertemuan Ke-4.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-4.pdf
Diskusi Modul Sistem Pakar Sesi Ke-4.pdfDiskusi Modul Sistem Pakar Sesi Ke-4.pdf
Diskusi Modul Sistem Pakar Sesi Ke-4.pdf
 
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdfDiskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
 

Recently uploaded

kerajaan-kerajaan hindu-budha di indonesia.ppt
kerajaan-kerajaan hindu-budha di indonesia.pptkerajaan-kerajaan hindu-budha di indonesia.ppt
kerajaan-kerajaan hindu-budha di indonesia.ppt
putrisari631
 
Power point materi IPA pada materi unsur
Power point materi IPA pada materi unsurPower point materi IPA pada materi unsur
Power point materi IPA pada materi unsur
DoddiKELAS7A
 
PPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptx
PPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptxPPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptx
PPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptx
iwidyastama85
 
perwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptx
perwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptxperwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptx
perwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptx
Mas PauLs
 
Materi Bid PPM Bappeda Sos Pemutakhiran IDM 2024 di kec Plumbon.pptx
Materi Bid PPM Bappeda Sos Pemutakhiran  IDM 2024 di kec Plumbon.pptxMateri Bid PPM Bappeda Sos Pemutakhiran  IDM 2024 di kec Plumbon.pptx
Materi Bid PPM Bappeda Sos Pemutakhiran IDM 2024 di kec Plumbon.pptx
AvivThea
 
Penyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkung
Penyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkungPenyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkung
Penyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkung
SemediGiri2
 

Recently uploaded (20)

kerajaan-kerajaan hindu-budha di indonesia.ppt
kerajaan-kerajaan hindu-budha di indonesia.pptkerajaan-kerajaan hindu-budha di indonesia.ppt
kerajaan-kerajaan hindu-budha di indonesia.ppt
 
MODUL AJAR PENDIDIKAN AGAMA ISLAM & BUDI PEKERTI (PAIBP) KELAS 6.pdf
MODUL AJAR PENDIDIKAN AGAMA ISLAM & BUDI PEKERTI (PAIBP) KELAS 6.pdfMODUL AJAR PENDIDIKAN AGAMA ISLAM & BUDI PEKERTI (PAIBP) KELAS 6.pdf
MODUL AJAR PENDIDIKAN AGAMA ISLAM & BUDI PEKERTI (PAIBP) KELAS 6.pdf
 
UAS Matematika kelas IX 2024 HK_2024.pdf
UAS Matematika kelas IX 2024 HK_2024.pdfUAS Matematika kelas IX 2024 HK_2024.pdf
UAS Matematika kelas IX 2024 HK_2024.pdf
 
Modul 5 Simetri (simetri lipat, simetri putar)
Modul 5 Simetri (simetri lipat, simetri putar)Modul 5 Simetri (simetri lipat, simetri putar)
Modul 5 Simetri (simetri lipat, simetri putar)
 
Materi Kimfar Asam,Basa,Buffer dan Garam
Materi Kimfar Asam,Basa,Buffer dan GaramMateri Kimfar Asam,Basa,Buffer dan Garam
Materi Kimfar Asam,Basa,Buffer dan Garam
 
Variasi dan Gaya Mengajar, Mata Kuliah Strategi Belajar Mengajar
Variasi dan Gaya Mengajar, Mata Kuliah Strategi Belajar MengajarVariasi dan Gaya Mengajar, Mata Kuliah Strategi Belajar Mengajar
Variasi dan Gaya Mengajar, Mata Kuliah Strategi Belajar Mengajar
 
Power point materi IPA pada materi unsur
Power point materi IPA pada materi unsurPower point materi IPA pada materi unsur
Power point materi IPA pada materi unsur
 
PPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptx
PPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptxPPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptx
PPt-Juknis-PPDB-2024 (TerbarU) kabupaten GIanyar.pptx
 
perwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptx
perwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptxperwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptx
perwalian IKLIM SEKOLAH AMAN Mencegah Intoleransi.pptx
 
MODUL AJAR PENDIDIKAN PANCASILA KELAS 2 KURIKULUM MERDEKA.pdf
MODUL AJAR PENDIDIKAN PANCASILA KELAS 2 KURIKULUM MERDEKA.pdfMODUL AJAR PENDIDIKAN PANCASILA KELAS 2 KURIKULUM MERDEKA.pdf
MODUL AJAR PENDIDIKAN PANCASILA KELAS 2 KURIKULUM MERDEKA.pdf
 
Materi Penggolongan Obat Undang-Undang Kesehatan
Materi Penggolongan Obat Undang-Undang KesehatanMateri Penggolongan Obat Undang-Undang Kesehatan
Materi Penggolongan Obat Undang-Undang Kesehatan
 
Materi Bid PPM Bappeda Sos Pemutakhiran IDM 2024 di kec Plumbon.pptx
Materi Bid PPM Bappeda Sos Pemutakhiran  IDM 2024 di kec Plumbon.pptxMateri Bid PPM Bappeda Sos Pemutakhiran  IDM 2024 di kec Plumbon.pptx
Materi Bid PPM Bappeda Sos Pemutakhiran IDM 2024 di kec Plumbon.pptx
 
Obat pada masa kehamilan: uteretonik dan tokolitik
Obat pada masa kehamilan: uteretonik dan tokolitikObat pada masa kehamilan: uteretonik dan tokolitik
Obat pada masa kehamilan: uteretonik dan tokolitik
 
Penyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkung
Penyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkungPenyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkung
Penyuluhan_pHIV_AIDS (1).ppt pada tahun 2024 di klungkung
 
Modul Ajar Matematika Kelas 5 Fase C Kurikulum Merdeka [abdiera.com]
Modul Ajar Matematika Kelas 5 Fase C Kurikulum Merdeka [abdiera.com]Modul Ajar Matematika Kelas 5 Fase C Kurikulum Merdeka [abdiera.com]
Modul Ajar Matematika Kelas 5 Fase C Kurikulum Merdeka [abdiera.com]
 
Lokakarya tentang Kepemimpinan Sekolah 1.pptx
Lokakarya tentang Kepemimpinan Sekolah 1.pptxLokakarya tentang Kepemimpinan Sekolah 1.pptx
Lokakarya tentang Kepemimpinan Sekolah 1.pptx
 
MODUL AJAR MATEMATIKA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 5 KURIKULUM MERDEKA.pdf
 
METODE PENGEMBANGAN MORAL DAN NILAI-NILAI AGAMA.pptx
METODE PENGEMBANGAN MORAL DAN NILAI-NILAI AGAMA.pptxMETODE PENGEMBANGAN MORAL DAN NILAI-NILAI AGAMA.pptx
METODE PENGEMBANGAN MORAL DAN NILAI-NILAI AGAMA.pptx
 
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxcontoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
 
E-modul materi Ekosistem Kelas 10 SMA (Preview)
E-modul materi Ekosistem Kelas 10 SMA (Preview)E-modul materi Ekosistem Kelas 10 SMA (Preview)
E-modul materi Ekosistem Kelas 10 SMA (Preview)
 

Machine Learning Diskusi 9.pdf

  • 1. 1 Machine Learning Pertemuan 9 Unsupervised Learning: K Mean Clustering 9.1 Pendahuluan K-Means merupakan algoritma clustering paling populer dan sering digunakan, karena cara kerja dan perhitungannya mudah dilakukan. Algoritme K-Mean merupakan salah satu metode data clustering non hirarki yang mempartisi data ke dalam bentuk satu atau lebih cluster atau kelompok . Pada K Means, setiap data yang mempunyai karakteristik yang mirip atau sama akan dikelompokkan ke dalam satu cluster dan data yang memiliki karakteristik yang berbeda akan dikelompokkan ke dalam cluster yang lain. Gambar 1. Perbedaan data sebelum dan sesudah menggunakan K Means Secara umum, teknik clustering menggunakan metode K-Means dilakukan dengan langkah sebagai berikut: 1. Menentukan jumlah K (cluster) 2. Inisialisasikan cluster centroids (rata-rata) atau “mean” secara acak. Centroid adalah titik pusat setiap cluster. 3. Menghitung jarak antara data dan centroid dengan menggunakan persamaan Euclidean Distance: D (P,Q) = 𝑃𝑖- 𝑄𝑖 = √∑ (𝑝𝑖 − 𝑞𝑖)2 𝑛 𝑖=1 4. Kelompokkan data ke dalam cluster dengan jarak yang paling dekat atau minimum dari dari setiap data dengan centroid. 1
  • 2. 2 5. Menghitung nilai centroid yang baru menggunakan rumus: Centroid baru = 𝒎𝒆𝒏𝒋𝒖𝒎𝒍𝒂𝒉𝒌𝒂𝒏 𝒔𝒆𝒎𝒖𝒂 𝒏𝒊𝒍𝒂𝒊 𝒑𝒂𝒅𝒂 𝒔𝒆𝒕𝒊𝒂𝒑 𝒄𝒍𝒖𝒔𝒕𝒆𝒓 𝒚𝒂𝒏𝒈 𝒔𝒂𝒎𝒂 𝑱𝒖𝒎𝒍𝒂𝒉 𝒅𝒂𝒕𝒂 𝒚𝒂𝒏𝒈 𝒂𝒅𝒂 𝒑𝒂𝒅𝒂 𝒄𝒍𝒖𝒔𝒕𝒆𝒓 𝒕𝒆𝒓𝒔𝒆𝒃𝒖𝒕 6. Ulangi langkah ke tiga sampai kelima sehingga sudah tidak ada lagi data yang berpindah ke cluster lain. 9.2 Apa itu Clustering? • Juga disebut pembelajaran tanpa pengawasan, kadang-kadang disebut klasifikasi oleh ahli statistik dan penyortiran oleh psikolog dan segmentasi oleh orang-orang dalam pemasaran. • Mengelompokkan data-data menjadi beberapa cluster berdasarkan kesamaannya. 9.3 Apa Pengelompokan Alami Diantara Benda-benda ini? Gambar 2. Tokoh-tokoh dalam film Simpson Gambar 3. Pengelompokan berdasarkan Clustering Karyawan sekolah Keluarga Simpson Laki-Laki Perempuan Clustering adalah Subjek
  • 3. 3 9.4 Dua Jenis Clustering 1. Partitional algorithm: Membuat beberapa partisi dan mengelompokkan objek berdasarkan kriteria tertentu. 2. Hierarchical algorithm: Membuat dekomposisi pengelompokan objek berdasarkan kriteria tertentu. Misal = tua-muda, tuamuda(merokok-tidak merokok). Gambar 4. Dua jenis clustering 9.5 Apa itu Kesamaan? Kualitas atau keadaan serupa, rupa , kemiripan, seperti, kesamaan fitur. (Kamus webmaster) Gambar 5. Apa itu kesamaan? Kesamaan sulit untuk didefinisikan, tapi….”Kami mengetahuinya ketika kami melihatnya”. 9.6 Jarak (Distance) • Distance: adalah ukuran kesamaan antar objek yang dihitung berdasarkan rumusan tertentu. Hierarchical Partitional
  • 4. 4 Tabel 1. Jarak (distance) D ( , ) = 8 D ( , ) = 1 9.7 Partitional Clustering • Nonhierarchical: setiap objek ditempatkan di salah satu cluster. • Non-overlapping cluster: jumlah cluster yang akan dibentuk ditentukan sejak awal. Gambar 6. Partitional clustering 9.8 Algoritma K-Means 0 0 0 0 0 8 8 7 7 2 4 4 3 3 1
  • 5. 5 1. Tentukan berapa cluster k yang mau dibuat. 2. Inisialisasi centroid dari tiap cluster (randomly, if necessary). 3. Tentukan keanggotaan objek-objek yang lain dengan mengklasifikasikannya sesuai centroid terdekat (berdasarkan distance ke centroid). 4. Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru. 5. Jika centroid baru tidak sama dengan centroid lama, maka perlu diaupdate lagi keanggotaan objek-objeknya (balik ke-3). Sebaliknya, jika centroid baru sama dengan yang lama maka selesai. 9.9 K-Means Clustering: Step 1-2 • Tentukan beberapa cluster k yang mau dibuat. • Inisialisasi centroid dari tiap cluster (randomly, if necessary) Gambar 7. Clustering step 1-2 9.10 K-Means Clustering: Step 3 k k k 1 2 3 4 5 0 1 2 3 4 5
  • 6. 6 Gambar 8. Clustering step 3 9.11 K-Means Clustering: Step 4 • Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru. Gambar 9. Clustering step 4 9.12 K-Means Clustering: Step 5 • Jika centroid baru tidak sama dengan centroid lama, maka perlu diupdate lagi keanggotaan objek-objeknya. 𝑘1 𝑘2 𝑘3 3 2 1 0 4 5 1 2 3 4 5 𝑘1 𝑘2 𝑘3 0 1 2 3 4 5 1 2 3 4 5
  • 7. 7 Gambar 10. Clustering step 5 9.13 K-Means Clustering: Finish • Lakukan iterasi step 3-5 sampai tak ada lagi perubahan centroid dan tak ada lagi objek yang berpindah kelas. Gambar 11. Clustering finish 9.14 Komentar pada Metode K-Means 1. Kelebihan • Relatif efisien: O (tkn), di mana n adalah # objek, k adalah # cluster, dan t adalah # iterasi. Biasanya, k, t << n. 0 1 2 3 4 5 1 2 3 4 5 𝑘1 𝑘2 𝑘3
  • 8. 8 • Seringkali berakhir pada optimalisasi lokal. Optimum global dapat ditemukan dengan menggunakan teknik seperti: anealling determinatik dan algoritma genetika. 2. Kelemahan • Hanya berlaku ketika mean didefinisikan, lalu bagaimana dengan data kategoris? • Perlu menentukan k, jumlah cluster, terlebih dahulu. • Tidak dapat menangani data dan pencilan yang berisik. Pertanyaan diskusi: Jelaskan secara singkat apa yang membedakan clustering dengan klasifikasi menurut pemahaman anda. Jawaban: Clustering dan klasifikasi adalah dua pendekatan yang berbeda dalam analisis data dan pembelajaran mesin. Berikut adalah perbedaan singkat antara clustering dan klasifikasi: 1. Tujuan: • Clustering: Tujuan clustering adalah mengelompokkan data ke dalam kelompok-kelompok atau kluster berdasarkan kesamaan karakteristik atau pola yang ditemukan dalam data. Tujuan utama clustering adalah untuk mengidentifikasi struktur tersembunyi dalam data tanpa label sebelumnya. • Klasifikasi: Tujuan klasifikasi adalah membangun model prediktif yang dapat mengklasifikasikan data ke dalam kelas atau label yang sudah ditentukan sebelumnya berdasarkan contoh latihan yang berlabel. Tujuan utama klasifikasi adalah untuk membuat prediksi atau memberikan label kepada data baru berdasarkan pembelajaran dari data latihan yang berlabel. 2. Pendekatan: • Clustering: Clustering menggunakan pendekatan unsupervised learning, yang berarti tidak memerlukan label atau kelas terdefinisi sebelumnya dalam data. Algoritma clustering mencari pola, kesamaan, atau perbedaan dalam data untuk membentuk kelompok-kelompok. • Klasifikasi: Klasifikasi menggunakan pendekatan supervised learning, yang berarti memerlukan data latihan yang sudah berlabel sebelumnya. Algoritma klasifikasi mempelajari hubungan antara fitur-fitur pada data dan label yang sesuai untuk membangun model yang dapat digunakan untuk memprediksi label pada data baru. 3. Hasil:
  • 9. 9 • Clustering: Hasil dari clustering adalah kelompok-kelompok atau kluster. Data dalam satu kelompok memiliki kesamaan yang tinggi dalam hal karakteristik atau pola tertentu, sedangkan data di kelompok yang berbeda memiliki perbedaan yang signifikan. • Klasifikasi: Hasil dari klasifikasi adalah model yang dapat memprediksi label atau kelas dari data baru. Model ini dilatih menggunakan data latihan yang berlabel dan kemudian digunakan untuk memberikan prediksi pada data baru yang belum diketahui labelnya. Meskipun terdapat perbedaan signifikan antara clustering dan klasifikasi, keduanya adalah teknik penting dalam analisis data dan pembelajaran mesin yang memiliki aplikasi yang berbeda tergantung pada jenis masalah yang dihadapi dan jenis data yang digunakan. Referensi Syahid Abdullah, S. M. (2023). Machine Learning. Dalam S. M. Syahid Abdullah, Sesi 9-Unsupervised Learning: K-Means Clustering (hal. 1 - 16). Jakarta: Informatika UNSIA. Irwansyah Saputra, D. A. (2022). MACHINE LEARNING UNTUK PEMULA. Bandung: INFORMATIKA File PDF: https://docs.google.com/document/d/1WKow8RSbhp2RB9-V5k- u8U_9eJ5cI9yd/edit?usp=sharing&ouid=101456110840209175777&rtpof=true&sd=true