1. Penerapan Algoritma K-Medoids (Clustering)
Anggota Kelompok :
Cahyanti (2113161018)
Hendri Aprianto (2113227001)
Ali Wandanu (2113181051)
2. Apa itu Data Mining?
• Data mining adalah suatu proses pengumpulan informasi dan
data yang penting dalam jumlah yang besar atau big data.
• Dalam proses ini seringkali memanfaatkan beberapa metode,
seperti matematika, statistika dan pemanfaatan teknologi
artificial intelligence (AI).
3. Teknik pada Proses Data Mining
• Predictive modeling: Memiliki 2 teknik, yakni value
prediction dan classification.
• Database segmentation: Melakukan database partitioning
menjadi beberapa segmen, record, atau cluster yang selaras.
• Link analysis: Teknik membuat hubungan dari sekumpulan
record pada database dengan record pada individu.
• Deviation detection: Teknik mengidentifikasi outlier atau
data asing yang mengekspresikan suatu deviasi terhadap
ekspektasi yang sebelumnya telah diketahui.
4. Teknik pada Proses Data Mining
• Clustering: Teknik mengklasifikasikan data sesuai
kriterianya.
• Decision tree: teknik generasi selanjutnya yang mana
merupakan model predictive yang bisa digambarkan
menyerupai pohon. Setiap simpul atau node pada struktur
pohon tersebut merujuk pada suatu pertanyaan yang dipakai
untuk mengelompokkan data.
• Nearest neighbour: Teknik memprediksi pengelompokan
yang merupakan teknik paling tua dalam aktivitas data
mining.
5. K-Medoids Clustering
• K-Medoids adalah Algoritma cluster non hirarki yang
merupakan varian dari algoritma K-Means dan diciptakan
untuk mengatasi kelemahan K-Means yang sensitif terhadap
outlier.
• K-Medoids menggunakan metode pengelompokan partisi
untuk mengelompokan sekumpulan n objek menjadi sejumlah
k cluster, algoritma ini menggunakan objek yang mewakili
sebuah cluster, objek yang mewakilinya disebut medoids.
10. Tahap 2. Transformasi Data
• Kita akan mengubah data-data yang akan kita olah menjadi
angka, karena dalam memproses menggunakan algoritma K-
Medoids menggunakan data numerik.
14. Normalisasi Data: Rumus Normalisasi Data
• Menggunakan rumus =(data-min)/(max-min)
• Lalu kita memberi nilai absolute untuk mempermudah dan
mempercepat normalisasi data.
22. 3. Hitung Jarak Objek ke Medoid Sementara
• Menghitung jarak menggunakan rumus dibawah:
=SQRT((Medoid Ket.Tanaman-Obj Ket.Tanaman)^2 +
Medoid Jenis.Tanaman-Obj Jenis.Tanaman)^2 + Medoid
JmlStok-Obj JumlahStok)^2)
• Absolute-kan nilai medoid
32. Kesimpulan
• Karena hasil pengurangan cost pada percobaan ini sudah
lebih dari nol, maka proses clustering berhenti pada tahap ini.
• Jika selisih yang didapatkan kurang dari nol, maka harus
mencari medoid baru lagi hingga mendapatkan selisih
kedekatan antara medoid baru dan medoid lama lebih dari
nol.
• Hasil cluster adalah pada percobaan pertama.