2. Naive Bayes
Simple Naïve Bayesian
Classifier merupakan salah satu
metode pengklasifikasi
berpeluang sederhana yang
berdasarkan pada penerapan
Teorema Bayes dengan asumsi
antar variabel penjelas saling
bebas (independen).
4. ...
• Dua kelompok peneliti, satu oleh Pantel dan
Lin, dan yang lain oleh Microsoft Research
memperkenalkan metode statistik Bayesian
ini pada teknologi anti spam filter.
• Tetapi yang membuat algoritma Bayesian
filtering ini popular adalah pendekatan yang
dilakukan oleh Paul Graham. Dasar dari
teorema naive digunakan dalam
pemrograman adalah rumus Bayes berikut
ini:
P (A|B) = (P(B|A) * P(A))/P(B)
Artinya Peluang kejadian A sebagai B
ditentukan dari peluang B saat A, peluang A,
dan peluang B.
7. 1. Menentukan Probabilitas Class
Jumlah data = 14
a. Jumlah Class “Ya” = 10
b. Jumlah Class “Tidak = 4
Maka probabilitas
P (Main|Ya ) = 10/14 = 0.71
P (Main|Tidak) = 4/14 = 0.29
18. Fakta data Faktual dari Tabel
Klasifikasi
• Membandingkan data “Ya” dengan “Tidak”
Contoh
No.1
Ya = 0.00514
Tidak = 0.05357
Jika “Tidak” lebih besar maka klasifikasi “Tidak”
Jika “Ya” lebih besar maka klasifikasi “ Ya”
19. Pengujian
Misalnya ada Data Baru yaitu
Cuaca = Hujan
Suhu = Panas
Kelembaban = Tinggi
Berangin = Benar
Apakah data diatas Klasifikasi “Ya” atau “Tidak”
P(Main|Ya) =0.71*(0.4*0.2*0.3*0.4) =
0.00686
P(Main|Tidak)=0.29*(0.25*0.5*1*0.5) =
0.01786
Karena Klasifikasi “Tidak” Lebih besar
Maka Klasifikasinya adalah “ Tidak”
20. Latihan
Misalnya terdapat ingin diketahui
apakah suatu objek masuk dalam
ketegori dipilih untuk perumahan
atau tidak dengan algoritma Naive
Bayes Classifier. Untuk
menetapkan suatu daerah akan
dipilih sebagai lokasi untuk
mendirikan perumahan, telah
dihimpun 10 aturan.
21. Ada 4 atribut yang digunakan, yaitu:
• harga tanah per meter persegi (C1),
• jarak daerah tersebut dari pusat kota
(C2),
• ada atau tidaknya angkutan umum di
daerah tersebut (C3), dan
• keputusan untuk memilih daerah
tersebut sebagai lokasi perumahan
(C4).
23. ...
• Test Set:
Berdasarkan data tersebut, apabila diketahui
suatu daerah dengan
• harga tanah MAHAL,
• jarak dari pusat kota SEDANG,
• dan ADA angkutan umum,
• Bagaimana kategori data diatas apakah Dipilih
untuk Perumahan atau Tidak…