SlideShare a Scribd company logo
1 of 33
Penerapan Algoritma K-Medoids (Clustering)
Anggota Kelompok :
Cahyanti (2113161018)
Hendri Aprianto (2113227001)
Ali Wandanu (2113181051)
Apa itu Data Mining?
• Data mining adalah suatu proses pengumpulan informasi dan
data yang penting dalam jumlah yang besar atau big data.
• Dalam proses ini seringkali memanfaatkan beberapa metode,
seperti matematika, statistika dan pemanfaatan teknologi
artificial intelligence (AI).
Teknik pada Proses Data Mining
• Predictive modeling: Memiliki 2 teknik, yakni value
prediction dan classification.
• Database segmentation: Melakukan database partitioning
menjadi beberapa segmen, record, atau cluster yang selaras.
• Link analysis: Teknik membuat hubungan dari sekumpulan
record pada database dengan record pada individu.
• Deviation detection: Teknik mengidentifikasi outlier atau
data asing yang mengekspresikan suatu deviasi terhadap
ekspektasi yang sebelumnya telah diketahui.
Teknik pada Proses Data Mining
• Clustering: Teknik mengklasifikasikan data sesuai
kriterianya.
• Decision tree: teknik generasi selanjutnya yang mana
merupakan model predictive yang bisa digambarkan
menyerupai pohon. Setiap simpul atau node pada struktur
pohon tersebut merujuk pada suatu pertanyaan yang dipakai
untuk mengelompokkan data.
• Nearest neighbour: Teknik memprediksi pengelompokan
yang merupakan teknik paling tua dalam aktivitas data
mining.
K-Medoids Clustering
• K-Medoids adalah Algoritma cluster non hirarki yang
merupakan varian dari algoritma K-Means dan diciptakan
untuk mengatasi kelemahan K-Means yang sensitif terhadap
outlier.
• K-Medoids menggunakan metode pengelompokan partisi
untuk mengelompokan sekumpulan n objek menjadi sejumlah
k cluster, algoritma ini menggunakan objek yang mewakili
sebuah cluster, objek yang mewakilinya disebut medoids.
Contoh Penerapan
Metode K-Medoids
Data awal yang akan digunakan
Tahap 1. Cleaning Data
• Kita akan menghapus data-data yang tidak relevan atau tidak
valid
Cleaning Data
Tahap 2. Transformasi Data
• Kita akan mengubah data-data yang akan kita olah menjadi
angka, karena dalam memproses menggunakan algoritma K-
Medoids menggunakan data numerik.
Transformasi Data
Normalisasi Data: Mencari Nilai Min Max
• Menggunakan rumus MIN(keseluruhan data)
• Menggunakan rumus MAX(keseluruhan data)
Normalisasi Data: Mencari Nilai Min Max
Normalisasi Data: Rumus Normalisasi Data
• Menggunakan rumus =(data-min)/(max-min)
• Lalu kita memberi nilai absolute untuk mempermudah dan
mempercepat normalisasi data.
Normalisasi Data: Mencari Nilai Min Max
Perhitungan manual
//Tidak menggunakan tools bantuan seperti Rapidminer dsb
Memindahkan Data ke Sheet Baru
• Memindahkan data hasil normalisasi ke sheet baru untuk
memulai perhitungan manual.
Perhitungan manual
1. Menentukan Jumlah Cluster
Pada video ini kelompok kita akan menggunakan k2
2. Pilih Medoid awal sebanyak k dari n data
Kita akan menggunakan objek 18 dan 19
2. Pilih Medoid awal sebanyak k dari n data
3. Hitung Jarak Objek ke Medoid Sementara
• Menghitung jarak menggunakan rumus dibawah:
=SQRT((Medoid Ket.Tanaman-Obj Ket.Tanaman)^2 +
Medoid Jenis.Tanaman-Obj Jenis.Tanaman)^2 + Medoid
JmlStok-Obj JumlahStok)^2)
• Absolute-kan nilai medoid
3. Hitung Jarak Objek ke Medoid Sementara
4. Jarak Terdekat Objek ke Medoid,
Hitung Totalnya
• Menghitung jarak terdekat menggunakan rumus dibawah:
=MIN(Jarak awal : Jarak akhir)
4. Jarak Terdekat Objek ke Medoid,
Hitung Totalnya
5. Penentuan anggota cluster terhadap Medoid
Sementara
• Menghitung jarak menggunakan rumus dibawah:
=IF(Cost1=MIN(Cost1:Cost2);1;2)
5. Penentuan anggota cluster terhadap Medoid
Sementara
6. Lakukan Iterasi Medoid
• Pilih Medoid sementara
• Divideo kali ini, kita menggunakan objek 1 dan 2 untuk
medoid sementara yang baru
6. Lakukan Iterasi Medoid
7. Hitung Total Simpangan
• Mencari selisih antara Jumlah kedekatan Medoid baru
dengan jumlah kedekatan Medoid lama
7. Hitung Total Simpangan
Kesimpulan
• Karena hasil pengurangan cost pada percobaan ini sudah
lebih dari nol, maka proses clustering berhenti pada tahap ini.
• Jika selisih yang didapatkan kurang dari nol, maka harus
mencari medoid baru lagi hingga mendapatkan selisih
kedekatan antara medoid baru dan medoid lama lebih dari
nol.
• Hasil cluster adalah pada percobaan pertama.
Sekian dan Terima Kasih

More Related Content

What's hot

Ukuran Pemusatan dan Letak Data
Ukuran Pemusatan dan Letak DataUkuran Pemusatan dan Letak Data
Ukuran Pemusatan dan Letak DataAisyah Turidho
 
Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)ahmad haidaroh
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayesdedidarwis
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.pptAdam Superman
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining fullMunajat ( Munjob )
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxAdam Superman
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfElvi Rahmi
 
Machine Learning dengan R
Machine Learning dengan RMachine Learning dengan R
Machine Learning dengan RMuhammad Rifqi
 
Perbandingan algoritma brute force , divide and conquer
Perbandingan algoritma brute force , divide and conquerPerbandingan algoritma brute force , divide and conquer
Perbandingan algoritma brute force , divide and conquerohohervin
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasiIrwansyahSaputra1
 
membuat function dalam mysql
membuat function dalam mysqlmembuat function dalam mysql
membuat function dalam mysqlsukangimpi
 
Materi 3 Finite State Automata
Materi 3   Finite State AutomataMateri 3   Finite State Automata
Materi 3 Finite State Automataahmad haidaroh
 

What's hot (20)

Ukuran Pemusatan dan Letak Data
Ukuran Pemusatan dan Letak DataUkuran Pemusatan dan Letak Data
Ukuran Pemusatan dan Letak Data
 
Data mining 1 pengantar
Data mining 1   pengantarData mining 1   pengantar
Data mining 1 pengantar
 
Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Struktur Data Tree
Struktur Data TreeStruktur Data Tree
Struktur Data Tree
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
2700 3 data preprocessing
2700 3 data preprocessing2700 3 data preprocessing
2700 3 data preprocessing
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
 
Jaringan hebb
Jaringan hebbJaringan hebb
Jaringan hebb
 
Machine Learning dengan R
Machine Learning dengan RMachine Learning dengan R
Machine Learning dengan R
 
Perbandingan algoritma brute force , divide and conquer
Perbandingan algoritma brute force , divide and conquerPerbandingan algoritma brute force , divide and conquer
Perbandingan algoritma brute force , divide and conquer
 
Bab 12-kode-huffman
Bab 12-kode-huffmanBab 12-kode-huffman
Bab 12-kode-huffman
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasi
 
membuat function dalam mysql
membuat function dalam mysqlmembuat function dalam mysql
membuat function dalam mysql
 
struktur data
struktur datastruktur data
struktur data
 
Data Mining Clustering
Data Mining ClusteringData Mining Clustering
Data Mining Clustering
 
Materi 3 Finite State Automata
Materi 3   Finite State AutomataMateri 3   Finite State Automata
Materi 3 Finite State Automata
 

Similar to tugas1-kelompok-K-Medoids-dataMining.pptx

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxArwansyahDipanegara
 
Topik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.pptTopik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.pptwidisalendra1
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxSuraClips
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)ArianDerida
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Arif Rahman
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfHendroGunawan8
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxRidwanTI
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganBimastyaji Surya
 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCcastakaagussugianto
 
data mining
data miningdata mining
data miningdewi2093
 
CyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docx
CyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docxCyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docx
CyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docxAkbarHidayatullah11
 
01 pengantar kdd
01 pengantar kdd01 pengantar kdd
01 pengantar kddAslam Janto
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MININGNanzalXIV
 

Similar to tugas1-kelompok-K-Medoids-dataMining.pptx (20)

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
 
1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
 
Topik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.pptTopik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.ppt
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 
teknik-teknik data mining
teknik-teknik data miningteknik-teknik data mining
teknik-teknik data mining
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik Lingkungan
 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDC
 
data mining
data miningdata mining
data mining
 
CyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docx
CyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docxCyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docx
CyPIRAL_2040221038_M Akbar Hidayatullah_Laporan Probabilitas dan Statistik.docx
 
26813 9 arsitektur data mining
26813 9 arsitektur data mining26813 9 arsitektur data mining
26813 9 arsitektur data mining
 
10
1010
10
 
Data mining
Data miningData mining
Data mining
 
01 pengantar kdd
01 pengantar kdd01 pengantar kdd
01 pengantar kdd
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
 

tugas1-kelompok-K-Medoids-dataMining.pptx

  • 1. Penerapan Algoritma K-Medoids (Clustering) Anggota Kelompok : Cahyanti (2113161018) Hendri Aprianto (2113227001) Ali Wandanu (2113181051)
  • 2. Apa itu Data Mining? • Data mining adalah suatu proses pengumpulan informasi dan data yang penting dalam jumlah yang besar atau big data. • Dalam proses ini seringkali memanfaatkan beberapa metode, seperti matematika, statistika dan pemanfaatan teknologi artificial intelligence (AI).
  • 3. Teknik pada Proses Data Mining • Predictive modeling: Memiliki 2 teknik, yakni value prediction dan classification. • Database segmentation: Melakukan database partitioning menjadi beberapa segmen, record, atau cluster yang selaras. • Link analysis: Teknik membuat hubungan dari sekumpulan record pada database dengan record pada individu. • Deviation detection: Teknik mengidentifikasi outlier atau data asing yang mengekspresikan suatu deviasi terhadap ekspektasi yang sebelumnya telah diketahui.
  • 4. Teknik pada Proses Data Mining • Clustering: Teknik mengklasifikasikan data sesuai kriterianya. • Decision tree: teknik generasi selanjutnya yang mana merupakan model predictive yang bisa digambarkan menyerupai pohon. Setiap simpul atau node pada struktur pohon tersebut merujuk pada suatu pertanyaan yang dipakai untuk mengelompokkan data. • Nearest neighbour: Teknik memprediksi pengelompokan yang merupakan teknik paling tua dalam aktivitas data mining.
  • 5. K-Medoids Clustering • K-Medoids adalah Algoritma cluster non hirarki yang merupakan varian dari algoritma K-Means dan diciptakan untuk mengatasi kelemahan K-Means yang sensitif terhadap outlier. • K-Medoids menggunakan metode pengelompokan partisi untuk mengelompokan sekumpulan n objek menjadi sejumlah k cluster, algoritma ini menggunakan objek yang mewakili sebuah cluster, objek yang mewakilinya disebut medoids.
  • 7. Data awal yang akan digunakan
  • 8. Tahap 1. Cleaning Data • Kita akan menghapus data-data yang tidak relevan atau tidak valid
  • 10. Tahap 2. Transformasi Data • Kita akan mengubah data-data yang akan kita olah menjadi angka, karena dalam memproses menggunakan algoritma K- Medoids menggunakan data numerik.
  • 12. Normalisasi Data: Mencari Nilai Min Max • Menggunakan rumus MIN(keseluruhan data) • Menggunakan rumus MAX(keseluruhan data)
  • 13. Normalisasi Data: Mencari Nilai Min Max
  • 14. Normalisasi Data: Rumus Normalisasi Data • Menggunakan rumus =(data-min)/(max-min) • Lalu kita memberi nilai absolute untuk mempermudah dan mempercepat normalisasi data.
  • 15. Normalisasi Data: Mencari Nilai Min Max
  • 16. Perhitungan manual //Tidak menggunakan tools bantuan seperti Rapidminer dsb
  • 17. Memindahkan Data ke Sheet Baru • Memindahkan data hasil normalisasi ke sheet baru untuk memulai perhitungan manual.
  • 19. 1. Menentukan Jumlah Cluster Pada video ini kelompok kita akan menggunakan k2
  • 20. 2. Pilih Medoid awal sebanyak k dari n data Kita akan menggunakan objek 18 dan 19
  • 21. 2. Pilih Medoid awal sebanyak k dari n data
  • 22. 3. Hitung Jarak Objek ke Medoid Sementara • Menghitung jarak menggunakan rumus dibawah: =SQRT((Medoid Ket.Tanaman-Obj Ket.Tanaman)^2 + Medoid Jenis.Tanaman-Obj Jenis.Tanaman)^2 + Medoid JmlStok-Obj JumlahStok)^2) • Absolute-kan nilai medoid
  • 23. 3. Hitung Jarak Objek ke Medoid Sementara
  • 24. 4. Jarak Terdekat Objek ke Medoid, Hitung Totalnya • Menghitung jarak terdekat menggunakan rumus dibawah: =MIN(Jarak awal : Jarak akhir)
  • 25. 4. Jarak Terdekat Objek ke Medoid, Hitung Totalnya
  • 26. 5. Penentuan anggota cluster terhadap Medoid Sementara • Menghitung jarak menggunakan rumus dibawah: =IF(Cost1=MIN(Cost1:Cost2);1;2)
  • 27. 5. Penentuan anggota cluster terhadap Medoid Sementara
  • 28. 6. Lakukan Iterasi Medoid • Pilih Medoid sementara • Divideo kali ini, kita menggunakan objek 1 dan 2 untuk medoid sementara yang baru
  • 30. 7. Hitung Total Simpangan • Mencari selisih antara Jumlah kedekatan Medoid baru dengan jumlah kedekatan Medoid lama
  • 31. 7. Hitung Total Simpangan
  • 32. Kesimpulan • Karena hasil pengurangan cost pada percobaan ini sudah lebih dari nol, maka proses clustering berhenti pada tahap ini. • Jika selisih yang didapatkan kurang dari nol, maka harus mencari medoid baru lagi hingga mendapatkan selisih kedekatan antara medoid baru dan medoid lama lebih dari nol. • Hasil cluster adalah pada percobaan pertama.