SlideShare a Scribd company logo
Klasifikasi
Elvi Rahmi, S.T., M.Kom.
elvizasri@gmail.com
Data Mining
Klasifikasi
Carolus Linnaeus.
Dikenal sebagai bapak klasifikasi.
Orang yang pertama kali
mengklasifikasikan spesies
berdasarkan karakteristik fisik.
Carolus von Linne
(Carolus Linnaeus)
Mempelajari sekumpulan data sehingga dihasilkan aturan
yang bisa mengklasifikasi atau mengenali data-data baru
yang belum pernah dipelajari.
Proses untuk menyatakan suatu objek data sebagai salah
satu kategori (kelas) yang telah didefinisikan sebelumnya
(Zaki et al. 2013).
Klasifikasi
Definisi
Klasifikasi banyak digunakan dalam berbagai aplikasi, misal:
klasifikasi profil pelanggan, deteksi kecurangan (fraud
detection), diagnosis medis, prediksi penjualan, dan
sebagainya.
Komponen Utama
Proses Klasifikasi
Variabel bebas suatu model berdasarkan dari karakteristik
atribut data yang diklasifikasi.
Misal: merokok, minum-minuman beralkohol, tekanan
darah, status perkawinan.
Prediktor
Variabel tidak bebas yang merupakan label dari hasil
klasifikasi.
Misal: kelas loyalitas pelanggan.
Kelas
Sekumpulan data lengkap yang berisi kelas dan prediktor
untuk dilatih agar model dapat mengelompokkan ke dalam
kelas yang tepat.
Misal: grup pasien yang telah ditest terhadap serangan
jantung, grup pelanggan di suatu supermarket.
Set Data Pelatihan
Berisi data-data baru yang akan dikelompokkan oleh model
guna mengetahui akurasi dari model yang telah dibuat.
Set Data Uji
1
2
3
4
Teknik Klasifikasi
Teknik Klasifikasi Lokal
Hanya memperhitungkan sebagian
data latih.
Teknik Klasifikasi Global
Memperhitungkan semua data
latih.
Berdasarkan pengetahuan seorang pakar
(ahli).
Menggunakan teknik pembelajaran dalam
bidang machine learning.
Bagaimana cara
membangun model
klasifikasi (classifier)?
Pembelajaran Terpandu (supervised learning)
Memprediksi keluaran dari masukan tertentu.
Pembelajaran tak Terpandu (supervised learning)
Mengelompokkan kelas-kelas
dalam pola-pola tertentu
Bagaimana menentukan suatu
model baik atau buruk?
Akurasi Prediksi, menentukan seberapa akurat suatu model dalam
memprediksi keluaran.
Kecepatan, menentukan seberapa cepat suatu model dalam memproses
data masukan.
Robustness, menggambarkan kemampuan suatu model melakukan
prediksi yang akurat walau dalam kondisi ekstrim dan banyak gangguan
yang terjadi.
Skalabilitas, kemampuan suatu model memproses data baik dalam
ukuran yang lebih besar maupun data dari bidang lain yang berbeda.
Interpretability, menggambarkan kemudahan suatu model untuk
dipahami dan diinterpretasikan.
Kesederhanaan, merupakan sifat yang cenderung dipilih untuk
menyelesaikan suatu permasalahan.
Pohon Keputusan
Pengklasifikasi Bayes /Naive Bayes
Jaringan Syaraf Tiruan
Analisis Statistik
Algoritma Genetik
Metode/Model untuk Menyelesaikan Kasus Klasifikasi
(Sumathi, 2006)
Rough Sets
Pengklasifikasi KNN
Mode Berbasis Aturan
Memory Based Reasoning
Support Vector Machine
Pohon keputusan tool yang populer untuk
klasifikasi dan prediksi. Pohon keputusan
adalah struktur pohon seperti diagram alur,
di mana setiap simpul internal
menunjukkan pengujian pada atribut, setiap
cabang mewakili hasil pengujian, dan setiap
simpul daun (simpul terminal) memegang
label kelas.
Pohon Keputusan untuk konsep bermain tenis
Pohon Keputusan (Decision Tree)
Pohon Keputusan untuk konsep bermain tenis
Konstruksi Pohon Keputusan
Sebuah pohon dapat "dipelajari" dengan membagi set sumber menjadi subset berdasarkan tes
nilai atribut. Proses ini diulang pada setiap subset turunan secara rekursif yang disebut partisi
rekursif (recursive partitioning).
Rekursi selesai ketika subset pada node semua memiliki nilai variabel target yang sama, atau
ketika dilakukan pemisahan tidak lagi menambah nilai prediksi.
Konstruksi pengklasifikasi pohon keputusan tidak memerlukan pengetahuan domain atau
pengaturan parameter, dan oleh karena itu sesuai untuk penemuan pengetahuan eksplorasi.
Pohon keputusan dapat menangani data berdimensi tinggi.
Secara umum pengklasifikasi pohon keputusan memiliki akurasi yang baik. Induksi pohon
keputusan adalah pendekatan induktif yang khas untuk mempelajari pengetahuan tentang
klasifikasi.
Pohon Keputusan untuk konsep bermain tenis
Pohon keputusan pada gambar di
samping mengklasifikasikan pagi
tertentu berdasarkan cuaca apakah
cocok untuk bermain tenis dan
mengembalikan klasifikasi yang
terkait dengan daun tertentu. (dalam
hal ini Ya atau Tidak).
Representasi
Pohon Keputusan
Instance
(Outlook = Sunny, Temperature = Hot, Humidity = High,
Wind = Strong )
diurutkan ke bawah cabang paling kiri dari pohon
keputusan dan diklasifikasikan sebagai negative
instance (tidak mencukung pada data).
Pohon Keputusan untuk konsep bermain tenis
(Outlook = Sunny ^ Humidity = Normal) v (Outlook = Overcast) v (Outlook = Rain ^ Wind = Weak)
Gini Index
Indeks Gini adalah skor yang mengevaluasi seberapa akurat pemisahan di antara
kelompok yang diklasifikasikan. Indeks Gini mengevaluasi skor dalam kisaran antara 0
dan 1, di mana 0 adalah ketika semua pengamatan termasuk dalam satu kelas, dan 1
adalah distribusi acak dari elemen-elemen dalam kelas.
Indeks Gini adalah metrik evaluasi yang akan kita gunakan untuk mengevaluasi Model
Pohon Keputusan kita.
Kekuatan Pendekatan Pohon Keputusan
Pohon keputusan mampu menghasilkan aturan yang
dapat dimengerti.
Pohon keputusan melakukan klasifikasi tanpa
memerlukan banyak perhitungan.
Pohon keputusan mampu menangani variabel kontinu
dan kategorikal.
Pohon keputusan memberikan indikasi yang jelas tentang
bidang mana yang paling penting untuk prediksi atau
klasifikasi.
Kelemahan Pendekatan Pohon Keputusan
Pohon keputusan kurang tepat untuk tugas estimasi di
mana tujuannya adalah untuk memprediksi nilai atribut
kontinu.
Pohon keputusan rentan terhadap kesalahan dalam
masalah klasifikasi dengan banyak kelas dan jumlah
contoh pelatihan yang relatif kecil.
Proses menumbuhkan pohon keputusan secara
komputasi mahal. Algoritma pemangkasan (pruning
algorithm) juga bisa mahal karena banyak kandidat
subpohon harus dibentuk dan dibandingkan.
Do you have
any questions?
Naive Bayes
Classifier
Klasifikasi
D A T A M I N I N G - 2 0 2 2
Alur Kerja Klasifikasi
Classifier melatih
modelnya pada
dataset yang diberikan
Fase Pembelajaran
Menguji kinerja classifier
Fase Evaluasi
Kinerja dievaluasi berdasarkan berbagai parameter seperti:
akurasi, kesalahan, presisi, dan ingatan.
Alur Kerja Klasifikasi
Naive Bayes Classifier
01
02
03
Teknik klasifikasi statistik berdasarkan Teorema Bayes.
Salah satu algoritma supervised yang paling sederhana.
PresentaNaive Bayes adalah algoritma klasifikasi yang paling mudah dan
cepat, yang cocok untuk sejumlah besar data.
Pengklasifikasi Naive Bayes berhasil digunakan di berbagai aplikasi seperti
penyaringan spam, klasifikasi teks, analisis sentimen, dan sistem pemberi
rekomendasi.
Pengklasifikasi Naive Bayes mengasumsikan bahwa efek dari fitur tertentu
dalam sebuah kelas tidak bergantung pada fitur lainnya.
Misalnya, seorang pemohon pinjaman yang diinginkan atau tidak tergantung pada
pendapatannya, pinjaman sebelumnya dan riwayat transaksi, usia, dan lokasi. Sekalipun
fitur-fitur ini saling bergantung, fitur-fitur ini tetap dianggap independen. Asumsi ini
menyederhanakan perhitungan, dan karena itu dianggap naif.
Naive Bayes Classifier
Cara Naïve Bayes
Classifier Bekerja
Diberikan contoh kondisi cuaca dan
berolahraga. Anda perlu menghitung
probabilitas berolahraga. Sekarang,
Anda perlu mengklasifikasikan apakah
pemain akan bermain atau tidak
berdasarkan kondisi cuaca.
Menghitung probabilitas bermain saat
cuaca mendung.
Hitung prior probability untuk label kelas yang diberikan.
Temukan probabilitas Kemungkinan dengan setiap atribut untuk setiap kelas.
Masukkan nilai ini ke dalam Formula Bayes dan hitung probabilitas posterior.
Lihat kelas mana yang memiliki probabilitas lebih tinggi, mengingat inputnya milik
kelas probabilitas lebih tinggi.
Pendekatan Pertama
(Dalam hal fitur tunggal)
1. Hitung prior probability
2. Hitung probabilitas posterior
3. Masukkan probabilitas Prior dan Posterior dalam persamaan
Kemungkinan bermain:
P(Yes|Overcast)=P(Overcast|Yes)P(Yes)/P(Overcast)
P (Overcast) = 4/14 = 0,29
P (Yes) = 9/14 = 0,64
P (Overcast | Yes) = 4/9 = 0,44
P (Yes | Overcast) = 0.44 * 0.64 / 0.29 = 0.97
Pendekatan Pertama
(Dalam hal fitur tunggal)
1. Hitung prior probability
2. Hitung probabilitas posterior
3. Masukkan probabilitas Prior dan Posterior dalam persamaan
Kemungkinan tidak bermain:
P(No|Overcast)=P(Overcast|No)P(No)/P(Overcast)
P (Overcast) = 4/14 = 0,29
P (No) = 5/14 = 0.36
P (Overcast | No) = 0/9 = 0
P (No | Overcast) = 0 * 0.36/ 0.29 = 0
Probabilitas kelas 'Ya' lebihtinggi. Jadi Anda bisa menentukan di sini
jika cuaca mendung maka pemain akan memainkan olahraga tersebut.
Pendekatan Kedua
(Dalam hal
beberapa fitur)
Menghitung probabilitas bermain saat
cuaca mendung, dan suhu sedang.
Pendekatan Kedua
(Dalam hal beberapa fitur)
Kemungkinan bermain:
P(Play= Yes | Weather=Overcast, Temp=Mild) = P(Weather=Overcast, Temp=Mild |
Play=Yes)P(Play=Yes)..........(1)
P(Weather=Overcast,Temp=Mild|Play=Yes)=P(Overcast|Yes)P(Mild|Yes)………..(2)
1. Hitung prior probability
P (Yes) = 9/14 = 0.64
2. Hitung probabilitas posterior
P (Overcast | Yes) = 4/9 = 0.44 P(Mild |Yes) = 4/9 = 0.44
3. Masukkan probabilitas Prior dan Posterior dalam persamaan 2
P(Weather=Overcast, Temp=Mild | Play= Yes) = 0.44 * 0.44 = 0.1936
4. Masukkan probabilitas Prior dan Posterior dalam persamaan 1
P(Play= Yes | Weather=Overcast, Temp=Mild) = 0.1936*0.64 = 0.124
Pendekatan Kedua
(Dalam hal beberapa fitur)
Kemungkinantidakbermain?
Pendekatan Kedua -(Dalam hal beberapa fitur)
Kemungkinantidakbermain:
P(Play= No | Weather=Overcast, Temp=Mild) = P(Weather=Overcast, Temp=Mild | Play=
No)P(Play=No) ..........(3)
P(Weather=Overcast, Temp=Mild | Play= No)= P(Weather=Overcast |Play=No) P(Temp=Mild |
Play=No) ………..(4)
1. Hitung prior probability
P (No) = 5/14 = 0.36
2. Hitung probabilitas posterior
P (Overcast | No) = 0/9 = 0 P(Temp=Mild | Play=No)=2/5=0.4
3. Masukkan probabilitas Prior dan Posterior dalam persamaan 4
P(Weather=Overcast, Temp=Mild | Play= No) = 0 * 0.4= 0
4. Masukkan probabilitas Prior dan Posterior dalam persamaan 3
P(Play= No | Weather=Overcast, Temp=Mild) = 0*0.36=0
Dataset
Terdapat data baru:
X =(umur<=30, Pendapatan = sedang,
Mhs = ya, Rating kredit = Fair)
Apakah dia harus membeli komputer
atau tidak?
Dataset
P(Yes) = 9/14 = 0.64
P(No) = 5/14 = 0.36
X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
Dataset
P(umur<=30 | beli_komputer=ya) = 2/9
= 0.22
P(umur<=30| beli_komputer=tdk)= 3/5
= 0.6
X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
Dataset
P(pendapatan=sedang|
beli_komputer=ya) = 4/9= 0.44
P(pendapatan=sedang|
beli_komputer=tdk) = 2/5=0.4
X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
Dataset
P(mhs=ya | beli_komputer=ya) = 6/9 =
0.67
P(mhs=ya | beli_komputer=tdk) = 1/5 =
0.2
X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
Dataset
P(rating kredit=fair | beli_komputer=ya)
= 6/9 = 0.67
P(rating kredit=fair | beli_komputer=tdk)
=2/5 = 0.4
X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
Dataset
P(X|beli_computer = “ya”) = 0.222 X 0.444 X 0.667 X 0.667 = 0.044
P(X|beli_computer = “tdk”) = 0.600 x 0.400 x 0.200 x 0.400 = 0.019
Dataset
P(X|beli_computer = “ya”) = 0.222 X 0.444 X 0.667 X 0.667 = 0.044
P(X|beli_computer = “tdk”) = 0.600 x 0.400 x 0.200 x 0.400 = 0.019
P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028
P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007
Dataset
P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028
P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007

More Related Content

What's hot

Materi Data Mining - C4.5
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5
dedidarwis
 
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
Data mining 7   klasifikasi k nearest neighbor and pseudo k nnData mining 7   klasifikasi k nearest neighbor and pseudo k nn
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
IrwansyahSaputra1
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forest
IrwansyahSaputra1
 
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
aiiniR
 
Pertemuan 11 Kualitas Data
Pertemuan 11 Kualitas DataPertemuan 11 Kualitas Data
Pertemuan 11 Kualitas Data
Endang Retnoningsih
 
Kuliah SPK : Metode TOPSIS
Kuliah SPK : Metode TOPSISKuliah SPK : Metode TOPSIS
Kuliah SPK : Metode TOPSIS
Mutmainnah Muchtar
 
Penerapan Machine Learning di Industri
Penerapan Machine Learning di IndustriPenerapan Machine Learning di Industri
Penerapan Machine Learning di Industri
Bayu Aldi Yansyah
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
IrwansyahSaputra1
 
Machine learning
Machine learningMachine learning
Machine learning
Oemar Ahmad
 
01_PENGANTAR DATA DATA SCIENCE.pptx
01_PENGANTAR DATA DATA SCIENCE.pptx01_PENGANTAR DATA DATA SCIENCE.pptx
01_PENGANTAR DATA DATA SCIENCE.pptx
melrideswina
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
Adam Superman
 
20731 21 visualisasi data
20731 21 visualisasi data20731 21 visualisasi data
20731 21 visualisasi data
Universitas Bina Darma Palembang
 
Data Mining - KNN
Data Mining - KNNData Mining - KNN
Data Mining - KNN
dedidarwis
 
Modul 5 Metode Inferensi dan Penalaran
Modul 5   Metode Inferensi dan PenalaranModul 5   Metode Inferensi dan Penalaran
Modul 5 Metode Inferensi dan Penalaran
ahmad haidaroh
 
Machine Learning dengan R
Machine Learning dengan RMachine Learning dengan R
Machine Learning dengan R
Muhammad Rifqi
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
Universitas Bina Darma Palembang
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Mining
dedidarwis
 
Analisa Website Traveloka - Makalah IMK
Analisa Website Traveloka - Makalah IMKAnalisa Website Traveloka - Makalah IMK
Analisa Website Traveloka - Makalah IMK
Miftahul Muttaqin
 

What's hot (20)

Materi Data Mining - C4.5
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5
 
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
Data mining 7   klasifikasi k nearest neighbor and pseudo k nnData mining 7   klasifikasi k nearest neighbor and pseudo k nn
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forest
 
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
 
Pertemuan 11 Kualitas Data
Pertemuan 11 Kualitas DataPertemuan 11 Kualitas Data
Pertemuan 11 Kualitas Data
 
Kuliah SPK : Metode TOPSIS
Kuliah SPK : Metode TOPSISKuliah SPK : Metode TOPSIS
Kuliah SPK : Metode TOPSIS
 
Penerapan Machine Learning di Industri
Penerapan Machine Learning di IndustriPenerapan Machine Learning di Industri
Penerapan Machine Learning di Industri
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
 
Cara pemakaian weka
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
 
Machine learning
Machine learningMachine learning
Machine learning
 
01_PENGANTAR DATA DATA SCIENCE.pptx
01_PENGANTAR DATA DATA SCIENCE.pptx01_PENGANTAR DATA DATA SCIENCE.pptx
01_PENGANTAR DATA DATA SCIENCE.pptx
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
 
20731 21 visualisasi data
20731 21 visualisasi data20731 21 visualisasi data
20731 21 visualisasi data
 
Data Mining - KNN
Data Mining - KNNData Mining - KNN
Data Mining - KNN
 
Modul 5 Metode Inferensi dan Penalaran
Modul 5   Metode Inferensi dan PenalaranModul 5   Metode Inferensi dan Penalaran
Modul 5 Metode Inferensi dan Penalaran
 
Machine Learning dengan R
Machine Learning dengan RMachine Learning dengan R
Machine Learning dengan R
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Mining
 
Analisa Website Traveloka - Makalah IMK
Analisa Website Traveloka - Makalah IMKAnalisa Website Traveloka - Makalah IMK
Analisa Website Traveloka - Makalah IMK
 

Similar to Klasifikasi - Algoritma Naive Bayes

PPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
StevenAdiSantoso
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
Universitas Bina Darma Palembang
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
Kacung Abdullah
 
Materi Data Mining.pptx
Materi Data Mining.pptxMateri Data Mining.pptx
Materi Data Mining.pptx
vinduatia
 
Pengantar spss
Pengantar spssPengantar spss
Pengantar spss
Gunadarma University
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
Adam Superman
 
Aplikasi spss dan anates
Aplikasi spss dan anatesAplikasi spss dan anates
Aplikasi spss dan anates
Soni Gunners
 
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfPertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
allucanbuyyy
 
1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
BambangWijiatmoko
 
analisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatifanalisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatif
Jonathan Andreas Saragih
 
tgsdm3_ kelompok 7
 tgsdm3_ kelompok 7 tgsdm3_ kelompok 7
tgsdm3_ kelompok 7
Alvian yudha Prawira
 
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapPertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Abrianto Nugraha
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
HendroGunawan8
 
ppt.pertemuan 1.pptx ffffffffffffffffffffffffff
ppt.pertemuan 1.pptx ffffffffffffffffffffffffffppt.pertemuan 1.pptx ffffffffffffffffffffffffff
ppt.pertemuan 1.pptx ffffffffffffffffffffffffff
cylenverenaide
 
Modul non parametrik
Modul non parametrikModul non parametrik
Modul non parametrikSyafie ALin
 
Algoritma Decision Tree - ID3
Algoritma Decision Tree - ID3Algoritma Decision Tree - ID3
Algoritma Decision Tree - ID3
AhmadWahyuRosyadi1
 
data preparation presentation data preparation presentation
data preparation presentation data preparation presentationdata preparation presentation data preparation presentation
data preparation presentation data preparation presentation
noviyanti sagala
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
YudaPerwira5
 
Statistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab IIStatistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab II
Andreas Jiman
 

Similar to Klasifikasi - Algoritma Naive Bayes (20)

PPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
fuzzyShp
fuzzyShpfuzzyShp
fuzzyShp
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
 
Materi Data Mining.pptx
Materi Data Mining.pptxMateri Data Mining.pptx
Materi Data Mining.pptx
 
Pengantar spss
Pengantar spssPengantar spss
Pengantar spss
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
 
Aplikasi spss dan anates
Aplikasi spss dan anatesAplikasi spss dan anates
Aplikasi spss dan anates
 
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfPertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
 
1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
 
analisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatifanalisis-dan-interpretasi-data-kuantitatif
analisis-dan-interpretasi-data-kuantitatif
 
tgsdm3_ kelompok 7
 tgsdm3_ kelompok 7 tgsdm3_ kelompok 7
tgsdm3_ kelompok 7
 
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapPertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
 
ppt.pertemuan 1.pptx ffffffffffffffffffffffffff
ppt.pertemuan 1.pptx ffffffffffffffffffffffffffppt.pertemuan 1.pptx ffffffffffffffffffffffffff
ppt.pertemuan 1.pptx ffffffffffffffffffffffffff
 
Modul non parametrik
Modul non parametrikModul non parametrik
Modul non parametrik
 
Algoritma Decision Tree - ID3
Algoritma Decision Tree - ID3Algoritma Decision Tree - ID3
Algoritma Decision Tree - ID3
 
data preparation presentation data preparation presentation
data preparation presentation data preparation presentationdata preparation presentation data preparation presentation
data preparation presentation data preparation presentation
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
 
Statistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab IIStatistik BIsnis Bab I dan Bab II
Statistik BIsnis Bab I dan Bab II
 

More from Elvi Rahmi

06 - Machine Learning .pdf
06 - Machine Learning .pdf06 - Machine Learning .pdf
06 - Machine Learning .pdf
Elvi Rahmi
 
Algoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfAlgoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdf
Elvi Rahmi
 
05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf
Elvi Rahmi
 
03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf
Elvi Rahmi
 
02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf
Elvi Rahmi
 
01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf
Elvi Rahmi
 
07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf
Elvi Rahmi
 
13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf
Elvi Rahmi
 
05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf
Elvi Rahmi
 
Teknik Sampling
Teknik SamplingTeknik Sampling
Teknik Sampling
Elvi Rahmi
 
04 - Teori Peluang.pdf
04 - Teori Peluang.pdf04 - Teori Peluang.pdf
04 - Teori Peluang.pdf
Elvi Rahmi
 
Quiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfQuiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdf
Elvi Rahmi
 
03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf
Elvi Rahmi
 
02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf
Elvi Rahmi
 
01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf
Elvi Rahmi
 
Mastering the master of ceremony
Mastering the master of ceremonyMastering the master of ceremony
Mastering the master of ceremony
Elvi Rahmi
 
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukImplementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Elvi Rahmi
 
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Elvi Rahmi
 

More from Elvi Rahmi (18)

06 - Machine Learning .pdf
06 - Machine Learning .pdf06 - Machine Learning .pdf
06 - Machine Learning .pdf
 
Algoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdfAlgoritma Support Vector Machine.pdf
Algoritma Support Vector Machine.pdf
 
05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf05 - Teknik Dasar AI - Planning.pdf
05 - Teknik Dasar AI - Planning.pdf
 
03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf03 - Teknik Dasar AI - Reasoning.pdf
03 - Teknik Dasar AI - Reasoning.pdf
 
02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf02 - Teknik Dasar AI - Searching.pdf
02 - Teknik Dasar AI - Searching.pdf
 
01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf01 - AI - Pengantar AI.pdf
01 - AI - Pengantar AI.pdf
 
07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf07 - Pengujian Hipotesis.pdf
07 - Pengujian Hipotesis.pdf
 
13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf
 
05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf05 - Variabel Random dan Distribusi Peluang.pdf
05 - Variabel Random dan Distribusi Peluang.pdf
 
Teknik Sampling
Teknik SamplingTeknik Sampling
Teknik Sampling
 
04 - Teori Peluang.pdf
04 - Teori Peluang.pdf04 - Teori Peluang.pdf
04 - Teori Peluang.pdf
 
Quiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdfQuiz - Statistika dan Probabilitas.pdf
Quiz - Statistika dan Probabilitas.pdf
 
03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf03 - Ukuran Lokasi dan Dispersi.pdf
03 - Ukuran Lokasi dan Dispersi.pdf
 
02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf02 - Penyajian Data (Distribusi Frekuensi).pdf
02 - Penyajian Data (Distribusi Frekuensi).pdf
 
01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf01 - Pengantar Statistika.pdf
01 - Pengantar Statistika.pdf
 
Mastering the master of ceremony
Mastering the master of ceremonyMastering the master of ceremony
Mastering the master of ceremony
 
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar ProdukImplementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
Implementasi Algoritma FP - Growth Menentukan Asosiasi Antar Produk
 
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
Identifikasi dan Pencegahan Keylogging Pada Android Menggunakan Customized Vi...
 

Recently uploaded

Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdfPulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
MRoyanzainuddin9A
 
Konsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balitaKonsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balita
Dilasambong
 
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdfModul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
MiliaSumendap
 
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
mtsarridho
 
manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6
MhdFadliansyah1
 
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
idoer11
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
WagKuza
 
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIPPERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
Pemdes Wonoyoso
 

Recently uploaded (8)

Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdfPulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
 
Konsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balitaKonsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balita
 
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdfModul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
 
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
 
manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6
 
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
 
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIPPERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
 

Klasifikasi - Algoritma Naive Bayes

  • 1. Klasifikasi Elvi Rahmi, S.T., M.Kom. elvizasri@gmail.com Data Mining
  • 2. Klasifikasi Carolus Linnaeus. Dikenal sebagai bapak klasifikasi. Orang yang pertama kali mengklasifikasikan spesies berdasarkan karakteristik fisik. Carolus von Linne (Carolus Linnaeus)
  • 3. Mempelajari sekumpulan data sehingga dihasilkan aturan yang bisa mengklasifikasi atau mengenali data-data baru yang belum pernah dipelajari. Proses untuk menyatakan suatu objek data sebagai salah satu kategori (kelas) yang telah didefinisikan sebelumnya (Zaki et al. 2013). Klasifikasi Definisi Klasifikasi banyak digunakan dalam berbagai aplikasi, misal: klasifikasi profil pelanggan, deteksi kecurangan (fraud detection), diagnosis medis, prediksi penjualan, dan sebagainya.
  • 4. Komponen Utama Proses Klasifikasi Variabel bebas suatu model berdasarkan dari karakteristik atribut data yang diklasifikasi. Misal: merokok, minum-minuman beralkohol, tekanan darah, status perkawinan. Prediktor Variabel tidak bebas yang merupakan label dari hasil klasifikasi. Misal: kelas loyalitas pelanggan. Kelas Sekumpulan data lengkap yang berisi kelas dan prediktor untuk dilatih agar model dapat mengelompokkan ke dalam kelas yang tepat. Misal: grup pasien yang telah ditest terhadap serangan jantung, grup pelanggan di suatu supermarket. Set Data Pelatihan Berisi data-data baru yang akan dikelompokkan oleh model guna mengetahui akurasi dari model yang telah dibuat. Set Data Uji 1 2 3 4
  • 5. Teknik Klasifikasi Teknik Klasifikasi Lokal Hanya memperhitungkan sebagian data latih. Teknik Klasifikasi Global Memperhitungkan semua data latih.
  • 6. Berdasarkan pengetahuan seorang pakar (ahli). Menggunakan teknik pembelajaran dalam bidang machine learning. Bagaimana cara membangun model klasifikasi (classifier)?
  • 7. Pembelajaran Terpandu (supervised learning) Memprediksi keluaran dari masukan tertentu. Pembelajaran tak Terpandu (supervised learning) Mengelompokkan kelas-kelas dalam pola-pola tertentu
  • 8. Bagaimana menentukan suatu model baik atau buruk? Akurasi Prediksi, menentukan seberapa akurat suatu model dalam memprediksi keluaran. Kecepatan, menentukan seberapa cepat suatu model dalam memproses data masukan. Robustness, menggambarkan kemampuan suatu model melakukan prediksi yang akurat walau dalam kondisi ekstrim dan banyak gangguan yang terjadi. Skalabilitas, kemampuan suatu model memproses data baik dalam ukuran yang lebih besar maupun data dari bidang lain yang berbeda. Interpretability, menggambarkan kemudahan suatu model untuk dipahami dan diinterpretasikan. Kesederhanaan, merupakan sifat yang cenderung dipilih untuk menyelesaikan suatu permasalahan.
  • 9. Pohon Keputusan Pengklasifikasi Bayes /Naive Bayes Jaringan Syaraf Tiruan Analisis Statistik Algoritma Genetik Metode/Model untuk Menyelesaikan Kasus Klasifikasi (Sumathi, 2006) Rough Sets Pengklasifikasi KNN Mode Berbasis Aturan Memory Based Reasoning Support Vector Machine
  • 10. Pohon keputusan tool yang populer untuk klasifikasi dan prediksi. Pohon keputusan adalah struktur pohon seperti diagram alur, di mana setiap simpul internal menunjukkan pengujian pada atribut, setiap cabang mewakili hasil pengujian, dan setiap simpul daun (simpul terminal) memegang label kelas. Pohon Keputusan untuk konsep bermain tenis Pohon Keputusan (Decision Tree)
  • 11. Pohon Keputusan untuk konsep bermain tenis
  • 12. Konstruksi Pohon Keputusan Sebuah pohon dapat "dipelajari" dengan membagi set sumber menjadi subset berdasarkan tes nilai atribut. Proses ini diulang pada setiap subset turunan secara rekursif yang disebut partisi rekursif (recursive partitioning). Rekursi selesai ketika subset pada node semua memiliki nilai variabel target yang sama, atau ketika dilakukan pemisahan tidak lagi menambah nilai prediksi. Konstruksi pengklasifikasi pohon keputusan tidak memerlukan pengetahuan domain atau pengaturan parameter, dan oleh karena itu sesuai untuk penemuan pengetahuan eksplorasi. Pohon keputusan dapat menangani data berdimensi tinggi. Secara umum pengklasifikasi pohon keputusan memiliki akurasi yang baik. Induksi pohon keputusan adalah pendekatan induktif yang khas untuk mempelajari pengetahuan tentang klasifikasi.
  • 13. Pohon Keputusan untuk konsep bermain tenis Pohon keputusan pada gambar di samping mengklasifikasikan pagi tertentu berdasarkan cuaca apakah cocok untuk bermain tenis dan mengembalikan klasifikasi yang terkait dengan daun tertentu. (dalam hal ini Ya atau Tidak).
  • 14. Representasi Pohon Keputusan Instance (Outlook = Sunny, Temperature = Hot, Humidity = High, Wind = Strong ) diurutkan ke bawah cabang paling kiri dari pohon keputusan dan diklasifikasikan sebagai negative instance (tidak mencukung pada data).
  • 15. Pohon Keputusan untuk konsep bermain tenis (Outlook = Sunny ^ Humidity = Normal) v (Outlook = Overcast) v (Outlook = Rain ^ Wind = Weak)
  • 16. Gini Index Indeks Gini adalah skor yang mengevaluasi seberapa akurat pemisahan di antara kelompok yang diklasifikasikan. Indeks Gini mengevaluasi skor dalam kisaran antara 0 dan 1, di mana 0 adalah ketika semua pengamatan termasuk dalam satu kelas, dan 1 adalah distribusi acak dari elemen-elemen dalam kelas. Indeks Gini adalah metrik evaluasi yang akan kita gunakan untuk mengevaluasi Model Pohon Keputusan kita.
  • 17. Kekuatan Pendekatan Pohon Keputusan Pohon keputusan mampu menghasilkan aturan yang dapat dimengerti. Pohon keputusan melakukan klasifikasi tanpa memerlukan banyak perhitungan. Pohon keputusan mampu menangani variabel kontinu dan kategorikal. Pohon keputusan memberikan indikasi yang jelas tentang bidang mana yang paling penting untuk prediksi atau klasifikasi.
  • 18. Kelemahan Pendekatan Pohon Keputusan Pohon keputusan kurang tepat untuk tugas estimasi di mana tujuannya adalah untuk memprediksi nilai atribut kontinu. Pohon keputusan rentan terhadap kesalahan dalam masalah klasifikasi dengan banyak kelas dan jumlah contoh pelatihan yang relatif kecil. Proses menumbuhkan pohon keputusan secara komputasi mahal. Algoritma pemangkasan (pruning algorithm) juga bisa mahal karena banyak kandidat subpohon harus dibentuk dan dibandingkan.
  • 19. Do you have any questions?
  • 20. Naive Bayes Classifier Klasifikasi D A T A M I N I N G - 2 0 2 2
  • 21. Alur Kerja Klasifikasi Classifier melatih modelnya pada dataset yang diberikan Fase Pembelajaran Menguji kinerja classifier Fase Evaluasi Kinerja dievaluasi berdasarkan berbagai parameter seperti: akurasi, kesalahan, presisi, dan ingatan.
  • 23. Naive Bayes Classifier 01 02 03 Teknik klasifikasi statistik berdasarkan Teorema Bayes. Salah satu algoritma supervised yang paling sederhana. PresentaNaive Bayes adalah algoritma klasifikasi yang paling mudah dan cepat, yang cocok untuk sejumlah besar data. Pengklasifikasi Naive Bayes berhasil digunakan di berbagai aplikasi seperti penyaringan spam, klasifikasi teks, analisis sentimen, dan sistem pemberi rekomendasi. Pengklasifikasi Naive Bayes mengasumsikan bahwa efek dari fitur tertentu dalam sebuah kelas tidak bergantung pada fitur lainnya. Misalnya, seorang pemohon pinjaman yang diinginkan atau tidak tergantung pada pendapatannya, pinjaman sebelumnya dan riwayat transaksi, usia, dan lokasi. Sekalipun fitur-fitur ini saling bergantung, fitur-fitur ini tetap dianggap independen. Asumsi ini menyederhanakan perhitungan, dan karena itu dianggap naif.
  • 25. Cara Naïve Bayes Classifier Bekerja Diberikan contoh kondisi cuaca dan berolahraga. Anda perlu menghitung probabilitas berolahraga. Sekarang, Anda perlu mengklasifikasikan apakah pemain akan bermain atau tidak berdasarkan kondisi cuaca.
  • 26. Menghitung probabilitas bermain saat cuaca mendung. Hitung prior probability untuk label kelas yang diberikan. Temukan probabilitas Kemungkinan dengan setiap atribut untuk setiap kelas. Masukkan nilai ini ke dalam Formula Bayes dan hitung probabilitas posterior. Lihat kelas mana yang memiliki probabilitas lebih tinggi, mengingat inputnya milik kelas probabilitas lebih tinggi.
  • 27. Pendekatan Pertama (Dalam hal fitur tunggal) 1. Hitung prior probability 2. Hitung probabilitas posterior 3. Masukkan probabilitas Prior dan Posterior dalam persamaan Kemungkinan bermain: P(Yes|Overcast)=P(Overcast|Yes)P(Yes)/P(Overcast) P (Overcast) = 4/14 = 0,29 P (Yes) = 9/14 = 0,64 P (Overcast | Yes) = 4/9 = 0,44 P (Yes | Overcast) = 0.44 * 0.64 / 0.29 = 0.97
  • 28. Pendekatan Pertama (Dalam hal fitur tunggal) 1. Hitung prior probability 2. Hitung probabilitas posterior 3. Masukkan probabilitas Prior dan Posterior dalam persamaan Kemungkinan tidak bermain: P(No|Overcast)=P(Overcast|No)P(No)/P(Overcast) P (Overcast) = 4/14 = 0,29 P (No) = 5/14 = 0.36 P (Overcast | No) = 0/9 = 0 P (No | Overcast) = 0 * 0.36/ 0.29 = 0 Probabilitas kelas 'Ya' lebihtinggi. Jadi Anda bisa menentukan di sini jika cuaca mendung maka pemain akan memainkan olahraga tersebut.
  • 29. Pendekatan Kedua (Dalam hal beberapa fitur) Menghitung probabilitas bermain saat cuaca mendung, dan suhu sedang.
  • 30. Pendekatan Kedua (Dalam hal beberapa fitur) Kemungkinan bermain: P(Play= Yes | Weather=Overcast, Temp=Mild) = P(Weather=Overcast, Temp=Mild | Play=Yes)P(Play=Yes)..........(1) P(Weather=Overcast,Temp=Mild|Play=Yes)=P(Overcast|Yes)P(Mild|Yes)………..(2) 1. Hitung prior probability P (Yes) = 9/14 = 0.64 2. Hitung probabilitas posterior P (Overcast | Yes) = 4/9 = 0.44 P(Mild |Yes) = 4/9 = 0.44 3. Masukkan probabilitas Prior dan Posterior dalam persamaan 2 P(Weather=Overcast, Temp=Mild | Play= Yes) = 0.44 * 0.44 = 0.1936 4. Masukkan probabilitas Prior dan Posterior dalam persamaan 1 P(Play= Yes | Weather=Overcast, Temp=Mild) = 0.1936*0.64 = 0.124
  • 31. Pendekatan Kedua (Dalam hal beberapa fitur) Kemungkinantidakbermain?
  • 32. Pendekatan Kedua -(Dalam hal beberapa fitur) Kemungkinantidakbermain: P(Play= No | Weather=Overcast, Temp=Mild) = P(Weather=Overcast, Temp=Mild | Play= No)P(Play=No) ..........(3) P(Weather=Overcast, Temp=Mild | Play= No)= P(Weather=Overcast |Play=No) P(Temp=Mild | Play=No) ………..(4) 1. Hitung prior probability P (No) = 5/14 = 0.36 2. Hitung probabilitas posterior P (Overcast | No) = 0/9 = 0 P(Temp=Mild | Play=No)=2/5=0.4 3. Masukkan probabilitas Prior dan Posterior dalam persamaan 4 P(Weather=Overcast, Temp=Mild | Play= No) = 0 * 0.4= 0 4. Masukkan probabilitas Prior dan Posterior dalam persamaan 3 P(Play= No | Weather=Overcast, Temp=Mild) = 0*0.36=0
  • 33. Dataset Terdapat data baru: X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair) Apakah dia harus membeli komputer atau tidak?
  • 34. Dataset P(Yes) = 9/14 = 0.64 P(No) = 5/14 = 0.36 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 35. Dataset P(umur<=30 | beli_komputer=ya) = 2/9 = 0.22 P(umur<=30| beli_komputer=tdk)= 3/5 = 0.6 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 36. Dataset P(pendapatan=sedang| beli_komputer=ya) = 4/9= 0.44 P(pendapatan=sedang| beli_komputer=tdk) = 2/5=0.4 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 37. Dataset P(mhs=ya | beli_komputer=ya) = 6/9 = 0.67 P(mhs=ya | beli_komputer=tdk) = 1/5 = 0.2 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 38. Dataset P(rating kredit=fair | beli_komputer=ya) = 6/9 = 0.67 P(rating kredit=fair | beli_komputer=tdk) =2/5 = 0.4 X =(umur<=30, Pendapatan = sedang, Mhs = ya, Rating kredit = Fair)
  • 39. Dataset P(X|beli_computer = “ya”) = 0.222 X 0.444 X 0.667 X 0.667 = 0.044 P(X|beli_computer = “tdk”) = 0.600 x 0.400 x 0.200 x 0.400 = 0.019
  • 40. Dataset P(X|beli_computer = “ya”) = 0.222 X 0.444 X 0.667 X 0.667 = 0.044 P(X|beli_computer = “tdk”) = 0.600 x 0.400 x 0.200 x 0.400 = 0.019 P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028 P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007
  • 41. Dataset P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028 P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007