SlideShare a Scribd company logo

Klasifikasi - Algoritma Naive Bayes

Klasifikasi - Algoritma Naive Bayes

1 of 41
Download to read offline
Klasifikasi
Elvi Rahmi, S.T., M.Kom.
elvizasri@gmail.com
Data Mining
Klasifikasi
Carolus Linnaeus.
Dikenal sebagai bapak klasifikasi.
Orang yang pertama kali
mengklasifikasikan spesies
berdasarkan karakteristik fisik.
Carolus von Linne
(Carolus Linnaeus)
Mempelajari sekumpulan data sehingga dihasilkan aturan
yang bisa mengklasifikasi atau mengenali data-data baru
yang belum pernah dipelajari.
Proses untuk menyatakan suatu objek data sebagai salah
satu kategori (kelas) yang telah didefinisikan sebelumnya
(Zaki et al. 2013).
Klasifikasi
Definisi
Klasifikasi banyak digunakan dalam berbagai aplikasi, misal:
klasifikasi profil pelanggan, deteksi kecurangan (fraud
detection), diagnosis medis, prediksi penjualan, dan
sebagainya.
Komponen Utama
Proses Klasifikasi
Variabel bebas suatu model berdasarkan dari karakteristik
atribut data yang diklasifikasi.
Misal: merokok, minum-minuman beralkohol, tekanan
darah, status perkawinan.
Prediktor
Variabel tidak bebas yang merupakan label dari hasil
klasifikasi.
Misal: kelas loyalitas pelanggan.
Kelas
Sekumpulan data lengkap yang berisi kelas dan prediktor
untuk dilatih agar model dapat mengelompokkan ke dalam
kelas yang tepat.
Misal: grup pasien yang telah ditest terhadap serangan
jantung, grup pelanggan di suatu supermarket.
Set Data Pelatihan
Berisi data-data baru yang akan dikelompokkan oleh model
guna mengetahui akurasi dari model yang telah dibuat.
Set Data Uji
1
2
3
4
Teknik Klasifikasi
Teknik Klasifikasi Lokal
Hanya memperhitungkan sebagian
data latih.
Teknik Klasifikasi Global
Memperhitungkan semua data
latih.
Berdasarkan pengetahuan seorang pakar
(ahli).
Menggunakan teknik pembelajaran dalam
bidang machine learning.
Bagaimana cara
membangun model
klasifikasi (classifier)?

Recommended

Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfElvi Rahmi
 
Klasterisasi - Algoritma K-Means Clustering.pdf
Klasterisasi - Algoritma K-Means Clustering.pdfKlasterisasi - Algoritma K-Means Clustering.pdf
Klasterisasi - Algoritma K-Means Clustering.pdfElvi Rahmi
 
13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdfElvi Rahmi
 
01 - Introduction to Data Mining - Original.pdf
01 - Introduction to Data Mining - Original.pdf01 - Introduction to Data Mining - Original.pdf
01 - Introduction to Data Mining - Original.pdfElvi Rahmi
 
02 - Preprocessing Data.pdf
02 - Preprocessing Data.pdf02 - Preprocessing Data.pdf
02 - Preprocessing Data.pdfElvi Rahmi
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.pptAdam Superman
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasiIrwansyahSaputra1
 

More Related Content

What's hot

Penjelasan indexing database
Penjelasan indexing databasePenjelasan indexing database
Penjelasan indexing databaseSamsul Arifin
 
Bab 2 Aljabar Relasional
Bab 2   Aljabar RelasionalBab 2   Aljabar Relasional
Bab 2 Aljabar RelasionalRatzman III
 
Presentasi -004_-_materi_audit_aplikasi_-_aud_si
Presentasi  -004_-_materi_audit_aplikasi_-_aud_siPresentasi  -004_-_materi_audit_aplikasi_-_aud_si
Presentasi -004_-_materi_audit_aplikasi_-_aud_siAbrianto Nugraha
 
Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)Mustafa Sherazi
 
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQLKelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQLDejiko Chaem
 
Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)
Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)
Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)difa febri
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Miningdedidarwis
 
Fp Kelompok7
Fp Kelompok7Fp Kelompok7
Fp Kelompok7chepz84
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxAdam Superman
 
1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian data1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian dataNanda Reda
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Adam Mukharil Bachtiar
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayesdedidarwis
 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)Rani Nooraeni
 
Power point sidang skripsi
Power point sidang skripsiPower point sidang skripsi
Power point sidang skripsiYunitha Rahmah
 
Kebutuhan Data Warehouse
Kebutuhan Data WarehouseKebutuhan Data Warehouse
Kebutuhan Data Warehousededidarwis
 
Pertemuan 4 Pemodelan Data Multi Dimensi
Pertemuan 4 Pemodelan Data Multi DimensiPertemuan 4 Pemodelan Data Multi Dimensi
Pertemuan 4 Pemodelan Data Multi DimensiEndang Retnoningsih
 
Analisis varian satu jalan krukal wallis
Analisis varian satu jalan krukal wallisAnalisis varian satu jalan krukal wallis
Analisis varian satu jalan krukal wallisBAIDILAH Baidilah
 

What's hot (20)

Pertemuan 11 Kualitas Data
Pertemuan 11 Kualitas DataPertemuan 11 Kualitas Data
Pertemuan 11 Kualitas Data
 
Penjelasan indexing database
Penjelasan indexing databasePenjelasan indexing database
Penjelasan indexing database
 
Bab 2 Aljabar Relasional
Bab 2   Aljabar RelasionalBab 2   Aljabar Relasional
Bab 2 Aljabar Relasional
 
Presentasi -004_-_materi_audit_aplikasi_-_aud_si
Presentasi  -004_-_materi_audit_aplikasi_-_aud_siPresentasi  -004_-_materi_audit_aplikasi_-_aud_si
Presentasi -004_-_materi_audit_aplikasi_-_aud_si
 
Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)Clustering in data Mining (Data Mining)
Clustering in data Mining (Data Mining)
 
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQLKelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
 
Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)
Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)
Penggunaan SUBQUERY SQL SERVER (USING SUBQUERIES)
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
 
Fp Kelompok7
Fp Kelompok7Fp Kelompok7
Fp Kelompok7
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
 
Topik 9 Prosedur
Topik 9 ProsedurTopik 9 Prosedur
Topik 9 Prosedur
 
1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian data1. peranan statistik dan penyajian data
1. peranan statistik dan penyajian data
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)
 
Power point sidang skripsi
Power point sidang skripsiPower point sidang skripsi
Power point sidang skripsi
 
Pengantar database
Pengantar databasePengantar database
Pengantar database
 
Kebutuhan Data Warehouse
Kebutuhan Data WarehouseKebutuhan Data Warehouse
Kebutuhan Data Warehouse
 
Pertemuan 4 Pemodelan Data Multi Dimensi
Pertemuan 4 Pemodelan Data Multi DimensiPertemuan 4 Pemodelan Data Multi Dimensi
Pertemuan 4 Pemodelan Data Multi Dimensi
 
Analisis varian satu jalan krukal wallis
Analisis varian satu jalan krukal wallisAnalisis varian satu jalan krukal wallis
Analisis varian satu jalan krukal wallis
 

Similar to Klasifikasi - Algoritma Naive Bayes

Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian dataKacung Abdullah
 
Materi Data Mining.pptx
Materi Data Mining.pptxMateri Data Mining.pptx
Materi Data Mining.pptxvinduatia
 
Aplikasi spss dan anates
Aplikasi spss dan anatesAplikasi spss dan anates
Aplikasi spss dan anatesSoni Gunners
 
analisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatifanalisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatifJonathan Andreas Saragih
 
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapPertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapAbrianto Nugraha
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfHendroGunawan8
 
Modul non parametrik
Modul non parametrikModul non parametrik
Modul non parametrikSyafie ALin
 
data preparation presentation data preparation presentation
data preparation presentation data preparation presentationdata preparation presentation data preparation presentation
data preparation presentation data preparation presentationnoviyanti sagala
 
Statistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab IIStatistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab IIAndreas Jiman
 
Presentasi Analytic Hierarchy Process (AHP)
Presentasi Analytic Hierarchy Process (AHP)Presentasi Analytic Hierarchy Process (AHP)
Presentasi Analytic Hierarchy Process (AHP)Dex Gunt
 
Modul spss non par utk psikologi
Modul spss non par utk psikologiModul spss non par utk psikologi
Modul spss non par utk psikologiSMA UNGGUL SIGLI
 

Similar to Klasifikasi - Algoritma Naive Bayes (20)

PPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
fuzzyShp
fuzzyShpfuzzyShp
fuzzyShp
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
 
Materi Data Mining.pptx
Materi Data Mining.pptxMateri Data Mining.pptx
Materi Data Mining.pptx
 
Pengantar spss
Pengantar spssPengantar spss
Pengantar spss
 
Aplikasi spss dan anates
Aplikasi spss dan anatesAplikasi spss dan anates
Aplikasi spss dan anates
 
1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
 
analisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatifanalisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatif
 
tgsdm3_ kelompok 7
 tgsdm3_ kelompok 7 tgsdm3_ kelompok 7
tgsdm3_ kelompok 7
 
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapPertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
 
Modul non parametrik
Modul non parametrikModul non parametrik
Modul non parametrik
 
Algoritma Decision Tree - ID3
Algoritma Decision Tree - ID3Algoritma Decision Tree - ID3
Algoritma Decision Tree - ID3
 
data preparation presentation data preparation presentation
data preparation presentation data preparation presentationdata preparation presentation data preparation presentation
data preparation presentation data preparation presentation
 
Statistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab IIStatistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab II
 
belajar-spss.pdf
belajar-spss.pdfbelajar-spss.pdf
belajar-spss.pdf
 
Presentasi Analytic Hierarchy Process (AHP)
Presentasi Analytic Hierarchy Process (AHP)Presentasi Analytic Hierarchy Process (AHP)
Presentasi Analytic Hierarchy Process (AHP)
 
Bab 6
Bab 6Bab 6
Bab 6
 
Modul spss non par utk psikologi
Modul spss non par utk psikologiModul spss non par utk psikologi
Modul spss non par utk psikologi
 

More from Elvi Rahmi

06 - Machine Learning .pdf
06 - Machine Learning .pdf06 - Machine Learning .pdf
06 - Machine Learning .pdfElvi Rahmi
 
Algoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfAlgoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfElvi Rahmi
 
05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdfElvi Rahmi
 
03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdfElvi Rahmi
 
02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdfElvi Rahmi
 
01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdfElvi Rahmi
 
07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdfElvi Rahmi
 
05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdfElvi Rahmi
 
Teknik Sampling
Teknik SamplingTeknik Sampling
Teknik SamplingElvi Rahmi
 
04 - Teori Peluang.pdf
04 - Teori Peluang.pdf04 - Teori Peluang.pdf
04 - Teori Peluang.pdfElvi Rahmi
 
Quiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfQuiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfElvi Rahmi
 
03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdfElvi Rahmi
 
02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdfElvi Rahmi
 
01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdfElvi Rahmi
 
Mastering the master of ceremony
Mastering the master of ceremonyMastering the master of ceremony
Mastering the master of ceremonyElvi Rahmi
 
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukImplementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukElvi Rahmi
 
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Elvi Rahmi
 

More from Elvi Rahmi (17)

06 - Machine Learning .pdf
06 - Machine Learning .pdf06 - Machine Learning .pdf
06 - Machine Learning .pdf
 
Algoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfAlgoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdf
 
05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf
 
03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf
 
02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf
 
01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf
 
07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf
 
05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf
 
Teknik Sampling
Teknik SamplingTeknik Sampling
Teknik Sampling
 
04 - Teori Peluang.pdf
04 - Teori Peluang.pdf04 - Teori Peluang.pdf
04 - Teori Peluang.pdf
 
Quiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfQuiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdf
 
03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf
 
02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf
 
01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf
 
Mastering the master of ceremony
Mastering the master of ceremonyMastering the master of ceremony
Mastering the master of ceremony
 
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukImplementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
 
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
 

Klasifikasi - Algoritma Naive Bayes

  • 1. Klasifikasi Elvi Rahmi, S.T., M.Kom. elvizasri@gmail.com Data Mining
  • 2. Klasifikasi Carolus Linnaeus. Dikenal sebagai bapak klasifikasi. Orang yang pertama kali mengklasifikasikan spesies berdasarkan karakteristik fisik. Carolus von Linne (Carolus Linnaeus)
  • 3. Mempelajari sekumpulan data sehingga dihasilkan aturan yang bisa mengklasifikasi atau mengenali data-data baru yang belum pernah dipelajari. Proses untuk menyatakan suatu objek data sebagai salah satu kategori (kelas) yang telah didefinisikan sebelumnya (Zaki et al. 2013). Klasifikasi Definisi Klasifikasi banyak digunakan dalam berbagai aplikasi, misal: klasifikasi profil pelanggan, deteksi kecurangan (fraud detection), diagnosis medis, prediksi penjualan, dan sebagainya.
  • 4. Komponen Utama Proses Klasifikasi Variabel bebas suatu model berdasarkan dari karakteristik atribut data yang diklasifikasi. Misal: merokok, minum-minuman beralkohol, tekanan darah, status perkawinan. Prediktor Variabel tidak bebas yang merupakan label dari hasil klasifikasi. Misal: kelas loyalitas pelanggan. Kelas Sekumpulan data lengkap yang berisi kelas dan prediktor untuk dilatih agar model dapat mengelompokkan ke dalam kelas yang tepat. Misal: grup pasien yang telah ditest terhadap serangan jantung, grup pelanggan di suatu supermarket. Set Data Pelatihan Berisi data-data baru yang akan dikelompokkan oleh model guna mengetahui akurasi dari model yang telah dibuat. Set Data Uji 1 2 3 4
  • 5. Teknik Klasifikasi Teknik Klasifikasi Lokal Hanya memperhitungkan sebagian data latih. Teknik Klasifikasi Global Memperhitungkan semua data latih.
  • 6. Berdasarkan pengetahuan seorang pakar (ahli). Menggunakan teknik pembelajaran dalam bidang machine learning. Bagaimana cara membangun model klasifikasi (classifier)?
  • 7. Pembelajaran Terpandu (supervised learning) Memprediksi keluaran dari masukan tertentu. Pembelajaran tak Terpandu (supervised learning) Mengelompokkan kelas-kelas dalam pola-pola tertentu
  • 8. Bagaimana menentukan suatu model baik atau buruk? Akurasi Prediksi, menentukan seberapa akurat suatu model dalam memprediksi keluaran. Kecepatan, menentukan seberapa cepat suatu model dalam memproses data masukan. Robustness, menggambarkan kemampuan suatu model melakukan prediksi yang akurat walau dalam kondisi ekstrim dan banyak gangguan yang terjadi. Skalabilitas, kemampuan suatu model memproses data baik dalam ukuran yang lebih besar maupun data dari bidang lain yang berbeda. Interpretability, menggambarkan kemudahan suatu model untuk dipahami dan diinterpretasikan. Kesederhanaan, merupakan sifat yang cenderung dipilih untuk menyelesaikan suatu permasalahan.
  • 9. Pohon Keputusan Pengklasifikasi Bayes /Naive Bayes Jaringan Syaraf Tiruan Analisis Statistik Algoritma Genetik Metode/Model untuk Menyelesaikan Kasus Klasifikasi (Sumathi, 2006) Rough Sets Pengklasifikasi KNN Mode Berbasis Aturan Memory Based Reasoning Support Vector Machine
  • 10. Pohon keputusan tool yang populer untuk klasifikasi dan prediksi. Pohon keputusan adalah struktur pohon seperti diagram alur, di mana setiap simpul internal menunjukkan pengujian pada atribut, setiap cabang mewakili hasil pengujian, dan setiap simpul daun (simpul terminal) memegang label kelas. Pohon Keputusan untuk konsep bermain tenis Pohon Keputusan (Decision Tree)
  • 11. Pohon Keputusan untuk konsep bermain tenis
  • 12. Konstruksi Pohon Keputusan Sebuah pohon dapat "dipelajari" dengan membagi set sumber menjadi subset berdasarkan tes nilai atribut. Proses ini diulang pada setiap subset turunan secara rekursif yang disebut partisi rekursif (recursive partitioning). Rekursi selesai ketika subset pada node semua memiliki nilai variabel target yang sama, atau ketika dilakukan pemisahan tidak lagi menambah nilai prediksi. Konstruksi pengklasifikasi pohon keputusan tidak memerlukan pengetahuan domain atau pengaturan parameter, dan oleh karena itu sesuai untuk penemuan pengetahuan eksplorasi. Pohon keputusan dapat menangani data berdimensi tinggi. Secara umum pengklasifikasi pohon keputusan memiliki akurasi yang baik. Induksi pohon keputusan adalah pendekatan induktif yang khas untuk mempelajari pengetahuan tentang klasifikasi.
  • 13. Pohon Keputusan untuk konsep bermain tenis Pohon keputusan pada gambar di samping mengklasifikasikan pagi tertentu berdasarkan cuaca apakah cocok untuk bermain tenis dan mengembalikan klasifikasi yang terkait dengan daun tertentu. (dalam hal ini Ya atau Tidak).
  • 14. Representasi Pohon Keputusan Instance (Outlook = Sunny, Temperature = Hot, Humidity = High, Wind = Strong ) diurutkan ke bawah cabang paling kiri dari pohon keputusan dan diklasifikasikan sebagai negative instance (tidak mencukung pada data).
  • 15. Pohon Keputusan untuk konsep bermain tenis (Outlook = Sunny ^ Humidity = Normal) v (Outlook = Overcast) v (Outlook = Rain ^ Wind = Weak)
  • 16. Gini Index Indeks Gini adalah skor yang mengevaluasi seberapa akurat pemisahan di antara kelompok yang diklasifikasikan. Indeks Gini mengevaluasi skor dalam kisaran antara 0 dan 1, di mana 0 adalah ketika semua pengamatan termasuk dalam satu kelas, dan 1 adalah distribusi acak dari elemen-elemen dalam kelas. Indeks Gini adalah metrik evaluasi yang akan kita gunakan untuk mengevaluasi Model Pohon Keputusan kita.
  • 17. Kekuatan Pendekatan Pohon Keputusan Pohon keputusan mampu menghasilkan aturan yang dapat dimengerti. Pohon keputusan melakukan klasifikasi tanpa memerlukan banyak perhitungan. Pohon keputusan mampu menangani variabel kontinu dan kategorikal. Pohon keputusan memberikan indikasi yang jelas tentang bidang mana yang paling penting untuk prediksi atau klasifikasi.
  • 18. Kelemahan Pendekatan Pohon Keputusan Pohon keputusan kurang tepat untuk tugas estimasi di mana tujuannya adalah untuk memprediksi nilai atribut kontinu. Pohon keputusan rentan terhadap kesalahan dalam masalah klasifikasi dengan banyak kelas dan jumlah contoh pelatihan yang relatif kecil. Proses menumbuhkan pohon keputusan secara komputasi mahal. Algoritma pemangkasan (pruning algorithm) juga bisa mahal karena banyak kandidat subpohon harus dibentuk dan dibandingkan.
  • 19. Do you have any questions?
  • 20. Naive Bayes Classifier Klasifikasi D A T A M I N I N G - 2 0 2 2
  • 21. Alur Kerja Klasifikasi Classifier melatih modelnya pada dataset yang diberikan Fase Pembelajaran Menguji kinerja classifier Fase Evaluasi Kinerja dievaluasi berdasarkan berbagai parameter seperti: akurasi, kesalahan, presisi, dan ingatan.
  • 23. Naive Bayes Classifier 01 02 03 Teknik klasifikasi statistik berdasarkan Teorema Bayes. Salah satu algoritma supervised yang paling sederhana. PresentaNaive Bayes adalah algoritma klasifikasi yang paling mudah dan cepat, yang cocok untuk sejumlah besar data. Pengklasifikasi Naive Bayes berhasil digunakan di berbagai aplikasi seperti penyaringan spam, klasifikasi teks, analisis sentimen, dan sistem pemberi rekomendasi. Pengklasifikasi Naive Bayes mengasumsikan bahwa efek dari fitur tertentu dalam sebuah kelas tidak bergantung pada fitur lainnya. Misalnya, seorang pemohon pinjaman yang diinginkan atau tidak tergantung pada pendapatannya, pinjaman sebelumnya dan riwayat transaksi, usia, dan lokasi. Sekalipun fitur-fitur ini saling bergantung, fitur-fitur ini tetap dianggap independen. Asumsi ini menyederhanakan perhitungan, dan karena itu dianggap naif.
  • 25. Cara Naïve Bayes Classifier Bekerja Diberikan contoh kondisi cuaca dan berolahraga. Anda perlu menghitung probabilitas berolahraga. Sekarang, Anda perlu mengklasifikasikan apakah pemain akan bermain atau tidak berdasarkan kondisi cuaca.
  • 26. Menghitung probabilitas bermain saat cuaca mendung. Hitung prior probability untuk label kelas yang diberikan. Temukan probabilitas Kemungkinan dengan setiap atribut untuk setiap kelas. Masukkan nilai ini ke dalam Formula Bayes dan hitung probabilitas posterior. Lihat kelas mana yang memiliki probabilitas lebih tinggi, mengingat inputnya milik kelas probabilitas lebih tinggi.
  • 27. Pendekatan Pertama (Dalam hal fitur tunggal) 1. Hitung prior probability 2. Hitung probabilitas posterior 3. Masukkan probabilitas Prior dan Posterior dalam persamaan Kemungkinan bermain: P(Yes|Overcast)=P(Overcast|Yes)P(Yes)/P(Overcast) P (Overcast) = 4/14 = 0,29 P (Yes) = 9/14 = 0,64 P (Overcast | Yes) = 4/9 = 0,44 P (Yes | Overcast) = 0.44 * 0.64 / 0.29 = 0.97
  • 28. Pendekatan Pertama (Dalam hal fitur tunggal) 1. Hitung prior probability 2. Hitung probabilitas posterior 3. Masukkan probabilitas Prior dan Posterior dalam persamaan Kemungkinan tidak bermain: P(No|Overcast)=P(Overcast|No)P(No)/P(Overcast) P (Overcast) = 4/14 = 0,29 P (No) = 5/14 = 0.36 P (Overcast | No) = 0/9 = 0 P (No | Overcast) = 0 * 0.36/ 0.29 = 0 Probabilitas kelas 'Ya' lebihtinggi. Jadi Anda bisa menentukan di sini jika cuaca mendung maka pemain akan memainkan olahraga tersebut.
  • 29. Pendekatan Kedua (Dalam hal beberapa fitur) Menghitung probabilitas bermain saat cuaca mendung, dan suhu sedang.
  • 30. Pendekatan Kedua (Dalam hal beberapa fitur) Kemungkinan bermain: P(Play= Yes | Weather=Overcast, Temp=Mild) = P(Weather=Overcast, Temp=Mild | Play=Yes)P(Play=Yes)..........(1) P(Weather=Overcast,Temp=Mild|Play=Yes)=P(Overcast|Yes)P(Mild|Yes)………..(2) 1. Hitung prior probability P (Yes) = 9/14 = 0.64 2. Hitung probabilitas posterior P (Overcast | Yes) = 4/9 = 0.44 P(Mild |Yes) = 4/9 = 0.44 3. Masukkan probabilitas Prior dan Posterior dalam persamaan 2 P(Weather=Overcast, Temp=Mild | Play= Yes) = 0.44 * 0.44 = 0.1936 4. Masukkan probabilitas Prior dan Posterior dalam persamaan 1 P(Play= Yes | Weather=Overcast, Temp=Mild) = 0.1936*0.64 = 0.124
  • 31. Pendekatan Kedua (Dalam hal beberapa fitur) Kemungkinantidakbermain?
  • 32. Pendekatan Kedua -(Dalam hal beberapa fitur) Kemungkinantidakbermain: P(Play= No | Weather=Overcast, Temp=Mild) = P(Weather=Overcast, Temp=Mild | Play= No)P(Play=No) ..........(3) P(Weather=Overcast, Temp=Mild | Play= No)= P(Weather=Overcast |Play=No) P(Temp=Mild | Play=No) ………..(4) 1. Hitung prior probability P (No) = 5/14 = 0.36 2. Hitung probabilitas posterior P (Overcast | No) = 0/9 = 0 P(Temp=Mild | Play=No)=2/5=0.4 3. Masukkan probabilitas Prior dan Posterior dalam persamaan 4 P(Weather=Overcast, Temp=Mild | Play= No) = 0 * 0.4= 0 4. Masukkan probabilitas Prior dan Posterior dalam persamaan 3 P(Play= No | Weather=Overcast, Temp=Mild) = 0*0.36=0
  • 33. Dataset Terdapat data baru: X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair) Apakah dia harus membeli komputer atau tidak?
  • 34. Dataset P(Yes) = 9/14 = 0.64 P(No) = 5/14 = 0.36 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 35. Dataset P(umur<=30 | beli_komputer=ya) = 2/9 = 0.22 P(umur<=30| beli_komputer=tdk)= 3/5 = 0.6 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 36. Dataset P(pendapatan=sedang| beli_komputer=ya) = 4/9= 0.44 P(pendapatan=sedang| beli_komputer=tdk) = 2/5=0.4 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 37. Dataset P(mhs=ya | beli_komputer=ya) = 6/9 = 0.67 P(mhs=ya | beli_komputer=tdk) = 1/5 = 0.2 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 38. Dataset P(rating kredit=fair | beli_komputer=ya) = 6/9 = 0.67 P(rating kredit=fair | beli_komputer=tdk) =2/5 = 0.4 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 39. Dataset P(X|beli_computer = “ya”) = 0.222 X 0.444 X 0.667 X 0.667 = 0.044 P(X|beli_computer = “tdk”) = 0.600 x 0.400 x 0.200 x 0.400 = 0.019
  • 40. Dataset P(X|beli_computer = “ya”) = 0.222 X 0.444 X 0.667 X 0.667 = 0.044 P(X|beli_computer = “tdk”) = 0.600 x 0.400 x 0.200 x 0.400 = 0.019 P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028 P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007
  • 41. Dataset P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028 P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007