tugas1-kelompok-K-Medoids-dataMining.pptx

Penerapan Algoritma K-Medoids (Clustering)
Anggota Kelompok :
Cahyanti (2113161018)
Hendri Aprianto (2113227001)
Ali Wandanu (2113181051)

Apa itu Data Mining?
• Data mining adalah suatu proses pengumpulan informasi dan
data yang penting dalam jumlah yang besar atau big data.
• Dalam proses ini seringkali memanfaatkan beberapa metode,
seperti matematika, statistika dan pemanfaatan teknologi
artificial intelligence (AI).

Teknik pada Proses Data Mining
• Predictive modeling: Memiliki 2 teknik, yakni value
prediction dan classification.
• Database segmentation: Melakukan database partitioning
menjadi beberapa segmen, record, atau cluster yang selaras.
• Link analysis: Teknik membuat hubungan dari sekumpulan
record pada database dengan record pada individu.
• Deviation detection: Teknik mengidentifikasi outlier atau
data asing yang mengekspresikan suatu deviasi terhadap
ekspektasi yang sebelumnya telah diketahui.

Teknik pada Proses Data Mining
• Clustering: Teknik mengklasifikasikan data sesuai
kriterianya.
• Decision tree: teknik generasi selanjutnya yang mana
merupakan model predictive yang bisa digambarkan
menyerupai pohon. Setiap simpul atau node pada struktur
pohon tersebut merujuk pada suatu pertanyaan yang dipakai
untuk mengelompokkan data.
• Nearest neighbour: Teknik memprediksi pengelompokan
yang merupakan teknik paling tua dalam aktivitas data
mining.

K-Medoids Clustering
• K-Medoids adalah Algoritma cluster non hirarki yang
merupakan varian dari algoritma K-Means dan diciptakan
untuk mengatasi kelemahan K-Means yang sensitif terhadap
outlier.
• K-Medoids menggunakan metode pengelompokan partisi
untuk mengelompokan sekumpulan n objek menjadi sejumlah
k cluster, algoritma ini menggunakan objek yang mewakili
sebuah cluster, objek yang mewakilinya disebut medoids.

Contoh Penerapan
Metode K-Medoids

Tahap 1. Cleaning Data
• Kita akan menghapus data-data yang tidak relevan atau tidak
valid

Tahap 2. Transformasi Data
• Kita akan mengubah data-data yang akan kita olah menjadi
angka, karena dalam memproses menggunakan algoritma K-
Medoids menggunakan data numerik.

Normalisasi Data: Mencari Nilai Min Max
• Menggunakan rumus MIN(keseluruhan data)
• Menggunakan rumus MAX(keseluruhan data)

Normalisasi Data: Mencari Nilai Min Max

Normalisasi Data: Rumus Normalisasi Data
• Menggunakan rumus =(data-min)/(max-min)
• Lalu kita memberi nilai absolute untuk mempermudah dan
mempercepat normalisasi data.

Perhitungan manual
//Tidak menggunakan tools bantuan seperti Rapidminer dsb

Memindahkan Data ke Sheet Baru
• Memindahkan data hasil normalisasi ke sheet baru untuk
memulai perhitungan manual.

1. Menentukan Jumlah Cluster
Pada video ini kelompok kita akan menggunakan k2

2. Pilih Medoid awal sebanyak k dari n data
Kita akan menggunakan objek 18 dan 19

2. Pilih Medoid awal sebanyak k dari n data

3. Hitung Jarak Objek ke Medoid Sementara
• Menghitung jarak menggunakan rumus dibawah:
=SQRT((Medoid Ket.Tanaman-Obj Ket.Tanaman)^2 +
Medoid Jenis.Tanaman-Obj Jenis.Tanaman)^2 + Medoid
JmlStok-Obj JumlahStok)^2)
• Absolute-kan nilai medoid

3. Hitung Jarak Objek ke Medoid Sementara

4. Jarak Terdekat Objek ke Medoid,
Hitung Totalnya
• Menghitung jarak terdekat menggunakan rumus dibawah:
=MIN(Jarak awal : Jarak akhir)

4. Jarak Terdekat Objek ke Medoid,
Hitung Totalnya

5. Penentuan anggota cluster terhadap Medoid
Sementara
• Menghitung jarak menggunakan rumus dibawah:
=IF(Cost1=MIN(Cost1:Cost2);1;2)

5. Penentuan anggota cluster terhadap Medoid
Sementara

6. Lakukan Iterasi Medoid
• Pilih Medoid sementara
• Divideo kali ini, kita menggunakan objek 1 dan 2 untuk
medoid sementara yang baru

7. Hitung Total Simpangan
• Mencari selisih antara Jumlah kedekatan Medoid baru
dengan jumlah kedekatan Medoid lama

Kesimpulan
• Karena hasil pengurangan cost pada percobaan ini sudah
lebih dari nol, maka proses clustering berhenti pada tahap ini.
• Jika selisih yang didapatkan kurang dari nol, maka harus
mencari medoid baru lagi hingga mendapatkan selisih
kedekatan antara medoid baru dan medoid lama lebih dari
nol.
• Hasil cluster adalah pada percobaan pertama.

tugas1-kelompok-K-Medoids-dataMining.pptx

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to tugas1-kelompok-K-Medoids-dataMining.pptx

Similar to tugas1-kelompok-K-Medoids-dataMining.pptx (20)

tugas1-kelompok-K-Medoids-dataMining.pptx