SlideShare a Scribd company logo
1 of 24
Klasifikasi dengan
Naive Bayes
Sardo P Sipayung, M.Kom
Naive Bayes
Simple Naïve Bayesian
Classifier merupakan salah satu
metode pengklasifikasi
berpeluang sederhana yang
berdasarkan pada penerapan
Teorema Bayes dengan asumsi
antar variabel penjelas saling
bebas (independen).
Algoritma ini
memanfaatkan metode
probabilitas dan statistik
yang dikemukakan oleh
ilmuwan Inggris Thomas
Bayes, yaitu memprediksi
probabilitas di masa depan
berdasarkan pengalaman di
...
• Dua kelompok peneliti, satu oleh Pantel dan
Lin, dan yang lain oleh Microsoft Research
memperkenalkan metode statistik Bayesian
ini pada teknologi anti spam filter.
• Tetapi yang membuat algoritma Bayesian
filtering ini popular adalah pendekatan yang
dilakukan oleh Paul Graham. Dasar dari
teorema naive digunakan dalam
pemrograman adalah rumus Bayes berikut
ini:
P (A|B) = (P(B|A) * P(A))/P(B)
Artinya Peluang kejadian A sebagai B
ditentukan dari peluang B saat A, peluang A,
dan peluang B.
Penerapan Naive Bayes
•Untuk klasifikasi Dokumen
•Untuk deteksi SPAM atau
fitering SPAM
ContohKasus
• Menentukan Pertandingan Tennis dimainkan atau tidak
1. Menentukan Probabilitas Class
Jumlah data = 14
a. Jumlah Class “Ya” = 10
b. Jumlah Class “Tidak = 4
Maka probabilitas
P (Main|Ya ) = 10/14 = 0.71
P (Main|Tidak) = 4/14 = 0.29
2. Menentukan Probabilitas Kategori/Atribut
a. CUACA
Cuaca = Ya
P(Cuaca = Cerah|Ya) = 2/10 = 0.20
P(Cuaca = Berawan|Ya) = 4/10 = 0.40
P(Cuaca = Hujan|Ya) = 4/10 = 0.40
Cuaca = Tidak
P(Cuaca = Cerah|Tidak) = 3/4 = 0.75
P(Cuaca = Berawan|Tidak) = 0/4 = 0
P(Cuaca = Hujan|Tidak) = 1/4 = 0.25
2. Menentukan Probabilitas Kategori/Atribut
b. SUHU
Suhu = Ya
P(Suhu = Panas|Ya) = 2/10 = 0.20
P(Suhu = Sejuk|Ya) = 4/10 = 0.40
P(Suhu = Dingin|Ya) = 4/10 = 0.40
Cuaca = Tidak
P(Suhu = Panas|Tidak) = 2/4 = 0.50
P(Suhu = Sejuk|Tidak) = 2/4 = 0.50
P(Suhu = Dingin|Tidak) = 0/4 = 0
2. Menentukan Probabilitas Kategori/Atribut
c. KELEMBABAN
kelembaban = Ya
P(kelembaban = Tinggi|Ya) = 3/10 = 0.30
P(kelembaban = Normal|Ya) = 7/10 = 0.70
kelembaban = Tidak
P(kelembaban = Tinggi|Tidak) = 4/4 = 1
P(kelembaban = Normal|Tidak) = 0/4 = 0
2. Menentukan Probabilitas Kategori/Atribut
d. BERANGIN
Berangin= Ya
P(Berangin = Salah|Ya) = 6/10 = 0.60
P(Berangin = Benar|Ya) = 4/10 = 0.40
Berangin = Tidak
P(Berangin = Salah|Tidak) = 2/4 = 0.50
P(Berangin = Benar|Tidak) = 2/4 = 0.50
Kategori/
Atrribut
Subset Ya Tidak
CUACA Cerah 0.20 0.75
Berawan 0.40 0
Hujan 0.40 0.25
SUHU Panas 0.20 0.50
Sejuk 0.40 0.50
Dingin 0.40 0
KELEMBABAN Tinggi 0.30 1
Normal 0.70 0
BERANGIN Salah 0.60 0.50
Benar 0.40 0.50
3. Menentukan Hasil Klasifikasi NBC
DATA NO 1
YA =
P(Main|Ya)=P(Main|Ya)*(P(Cuaca=Cerah)*
P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin=
Salah))
P(Main|Ya) = 0.71
P(Cuaca=Cerah) = 0.20
P(Suhu=Panas) = 0.20
P(Kelembaban=Tinggi) = 0.30
P(Berangin=Salah) = 0.60
= 0.71 *(0.20*0.20*0.30*0.60) = 0.005112
3. Menentukan Hasil Klasifikasi NBC
DATA NO 1
TIDAK =
P(Main|Tidak)=P(Main|Tidak)*(P(Cuaca=Cerah)*
P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin=
Salah))
P(Main|Ya) = 0.29
P(Cuaca=Cerah) = 0.75
P(Suhu=Panas) = 0.50
P(Kelembaban=Tinggi) = 1
P(Berangin=Salah) = 0.50
= 0.29 *(0.75*0.50*1*0.50) = 0.054375
3. Menentukan Hasil Klasifikasi NBC
DATA NO 2
Ya =
P(Main|Ya)=P(Main|Ya)*(P(Cuaca=Cerah)*
P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin=
Benar))
P(Main|Ya) = 0.71
P(Cuaca=Cerah) = 0.20
P(Suhu=Panas) = 0.20
P(Kelembaban=Tinggi) = 0.30
P(Berangin=Salah) = 0.40
= 0.71 *(0.20*0.20*30*0.40) = 0.003408
3. Menentukan Hasil Klasifikasi NBC
DATA NO 2
Tidak =
P(Main|Tidak)=P(Main|Tidak)*(P(Cuaca=Cerah)*
P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin=
Benar))
P(Main|Ya) = 0.29
P(Cuaca=Cerah) = 0.75
P(Suhu=Panas) = 0.50
P(Kelembaban=Tinggi) = 1
P(Berangin=Salah) = 0.50
= 0.29 *(0.75*0.50*1*0.50) = 0.054375
DihitungsampaiData14,sehinggadiperolehhasilsebagaiberikut:
Fakta data Faktual dari Tabel
Klasifikasi
• Membandingkan data “Ya” dengan “Tidak”
Contoh
No.1
Ya = 0.00514
Tidak = 0.05357
Jika “Tidak” lebih besar maka klasifikasi “Tidak”
Jika “Ya” lebih besar maka klasifikasi “ Ya”
Pengujian
Misalnya ada Data Baru yaitu
Cuaca = Hujan
Suhu = Panas
Kelembaban = Tinggi
Berangin = Benar
Apakah data diatas Klasifikasi “Ya” atau “Tidak”
P(Main|Ya) =0.71*(0.4*0.2*0.3*0.4) =
0.00686
P(Main|Tidak)=0.29*(0.25*0.5*1*0.5) =
0.01786
Karena Klasifikasi “Tidak” Lebih besar
Maka Klasifikasinya adalah “ Tidak”
Latihan
Misalnya terdapat ingin diketahui
apakah suatu objek masuk dalam
ketegori dipilih untuk perumahan
atau tidak dengan algoritma Naive
Bayes Classifier. Untuk
menetapkan suatu daerah akan
dipilih sebagai lokasi untuk
mendirikan perumahan, telah
dihimpun 10 aturan.
Ada 4 atribut yang digunakan, yaitu:
• harga tanah per meter persegi (C1),
• jarak daerah tersebut dari pusat kota
(C2),
• ada atau tidaknya angkutan umum di
daerah tersebut (C3), dan
• keputusan untuk memilih daerah
tersebut sebagai lokasi perumahan
(C4).
...
...
• Test Set:
Berdasarkan data tersebut, apabila diketahui
suatu daerah dengan
• harga tanah MAHAL,
• jarak dari pusat kota SEDANG,
• dan ADA angkutan umum,
• Bagaimana kategori data diatas apakah Dipilih
untuk Perumahan atau Tidak…
Terima Kasih 

More Related Content

What's hot

Statistika Uji Rerata 2 Berpasangan
Statistika Uji Rerata 2 BerpasanganStatistika Uji Rerata 2 Berpasangan
Statistika Uji Rerata 2 BerpasanganSiti Sahati
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Adam Mukharil Bachtiar
 
ukuran kemiringan dan keruncingan
ukuran kemiringan dan keruncinganukuran kemiringan dan keruncingan
ukuran kemiringan dan keruncinganArini Dyah
 
Momen kemiringan dan_keruncingan(7)
Momen kemiringan dan_keruncingan(7)Momen kemiringan dan_keruncingan(7)
Momen kemiringan dan_keruncingan(7)rizka_safa
 
P10_penyebaran data simpangan baku (standar deviasi)
P10_penyebaran data simpangan baku (standar deviasi)P10_penyebaran data simpangan baku (standar deviasi)
P10_penyebaran data simpangan baku (standar deviasi)M. Jainuri, S.Pd., M.Pd
 
Koefisien binomial
Koefisien binomialKoefisien binomial
Koefisien binomialoilandgas24
 
Matematika - Koordinat Kartesius & Koordinat Kutub
Matematika - Koordinat Kartesius & Koordinat KutubMatematika - Koordinat Kartesius & Koordinat Kutub
Matematika - Koordinat Kartesius & Koordinat KutubRamadhani Sardiman
 
Pemilihan Model Terbaik
Pemilihan Model TerbaikPemilihan Model Terbaik
Pemilihan Model Terbaikdessybudiyanti
 
Refleksi (pencerminan)
Refleksi (pencerminan)Refleksi (pencerminan)
Refleksi (pencerminan)indrialfizah
 
Peluang dan Distribusi Peluang
Peluang dan Distribusi PeluangPeluang dan Distribusi Peluang
Peluang dan Distribusi Peluangbagus222
 
BAB 1 Transformasi
BAB 1 Transformasi BAB 1 Transformasi
BAB 1 Transformasi Nia Matus
 
12.analisa regresi
12.analisa regresi12.analisa regresi
12.analisa regresiHafiza .h
 
Stat prob06 probabilitytheory_samplespace
Stat prob06 probabilitytheory_samplespaceStat prob06 probabilitytheory_samplespace
Stat prob06 probabilitytheory_samplespaceArif Rahman
 
Power Point Induksi Matematika
Power Point Induksi MatematikaPower Point Induksi Matematika
Power Point Induksi Matematikananasaf
 

What's hot (20)

Statistika Uji Rerata 2 Berpasangan
Statistika Uji Rerata 2 BerpasanganStatistika Uji Rerata 2 Berpasangan
Statistika Uji Rerata 2 Berpasangan
 
ukuran letak persentil
ukuran letak persentilukuran letak persentil
ukuran letak persentil
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)
 
ukuran kemiringan dan keruncingan
ukuran kemiringan dan keruncinganukuran kemiringan dan keruncingan
ukuran kemiringan dan keruncingan
 
Momen kemiringan dan_keruncingan(7)
Momen kemiringan dan_keruncingan(7)Momen kemiringan dan_keruncingan(7)
Momen kemiringan dan_keruncingan(7)
 
P10_penyebaran data simpangan baku (standar deviasi)
P10_penyebaran data simpangan baku (standar deviasi)P10_penyebaran data simpangan baku (standar deviasi)
P10_penyebaran data simpangan baku (standar deviasi)
 
Koefisien binomial
Koefisien binomialKoefisien binomial
Koefisien binomial
 
Matematika - Koordinat Kartesius & Koordinat Kutub
Matematika - Koordinat Kartesius & Koordinat KutubMatematika - Koordinat Kartesius & Koordinat Kutub
Matematika - Koordinat Kartesius & Koordinat Kutub
 
Stat d3 7
Stat d3 7Stat d3 7
Stat d3 7
 
Pemilihan Model Terbaik
Pemilihan Model TerbaikPemilihan Model Terbaik
Pemilihan Model Terbaik
 
Met num 8
Met num 8Met num 8
Met num 8
 
Refleksi (pencerminan)
Refleksi (pencerminan)Refleksi (pencerminan)
Refleksi (pencerminan)
 
Modul 8 nilai eigen
Modul 8 nilai eigenModul 8 nilai eigen
Modul 8 nilai eigen
 
Peluang dan Distribusi Peluang
Peluang dan Distribusi PeluangPeluang dan Distribusi Peluang
Peluang dan Distribusi Peluang
 
BAB 1 Transformasi
BAB 1 Transformasi BAB 1 Transformasi
BAB 1 Transformasi
 
12.analisa regresi
12.analisa regresi12.analisa regresi
12.analisa regresi
 
Deret Fourier
Deret FourierDeret Fourier
Deret Fourier
 
Power point statistik anava
Power point statistik anavaPower point statistik anava
Power point statistik anava
 
Stat prob06 probabilitytheory_samplespace
Stat prob06 probabilitytheory_samplespaceStat prob06 probabilitytheory_samplespace
Stat prob06 probabilitytheory_samplespace
 
Power Point Induksi Matematika
Power Point Induksi MatematikaPower Point Induksi Matematika
Power Point Induksi Matematika
 

More from smk methodist-8

Pertemuan 3. Arsitektur jaringan Hebb.pptx
Pertemuan 3. Arsitektur jaringan Hebb.pptxPertemuan 3. Arsitektur jaringan Hebb.pptx
Pertemuan 3. Arsitektur jaringan Hebb.pptxsmk methodist-8
 
memahami dan menganalisa Keamanan jaringan Komputer
memahami dan menganalisa Keamanan jaringan Komputermemahami dan menganalisa Keamanan jaringan Komputer
memahami dan menganalisa Keamanan jaringan Komputersmk methodist-8
 
KONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.ppt
KONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.pptKONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.ppt
KONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.pptsmk methodist-8
 
1-Pengantar_Sistem_Pendukung_Keputusan.ppt
1-Pengantar_Sistem_Pendukung_Keputusan.ppt1-Pengantar_Sistem_Pendukung_Keputusan.ppt
1-Pengantar_Sistem_Pendukung_Keputusan.pptsmk methodist-8
 
Silsilah Sipayung (1).doc
Silsilah Sipayung (1).docSilsilah Sipayung (1).doc
Silsilah Sipayung (1).docsmk methodist-8
 
Kisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docx
Kisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docxKisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docx
Kisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docxsmk methodist-8
 
Strategi Pengujian Perangkat Lunak.ppt
Strategi Pengujian Perangkat Lunak.pptStrategi Pengujian Perangkat Lunak.ppt
Strategi Pengujian Perangkat Lunak.pptsmk methodist-8
 
P7-ROUTING DINAMIS-OSPF.pptx
P7-ROUTING DINAMIS-OSPF.pptxP7-ROUTING DINAMIS-OSPF.pptx
P7-ROUTING DINAMIS-OSPF.pptxsmk methodist-8
 
Natal Methodist-8 2016.ppt
Natal Methodist-8 2016.pptNatal Methodist-8 2016.ppt
Natal Methodist-8 2016.pptsmk methodist-8
 
RPS BASISDATA II - TEKNIK INFORMATIKA.doc
RPS BASISDATA II - TEKNIK INFORMATIKA.docRPS BASISDATA II - TEKNIK INFORMATIKA.doc
RPS BASISDATA II - TEKNIK INFORMATIKA.docsmk methodist-8
 

More from smk methodist-8 (11)

Pertemuan 3. Arsitektur jaringan Hebb.pptx
Pertemuan 3. Arsitektur jaringan Hebb.pptxPertemuan 3. Arsitektur jaringan Hebb.pptx
Pertemuan 3. Arsitektur jaringan Hebb.pptx
 
memahami dan menganalisa Keamanan jaringan Komputer
memahami dan menganalisa Keamanan jaringan Komputermemahami dan menganalisa Keamanan jaringan Komputer
memahami dan menganalisa Keamanan jaringan Komputer
 
KONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.ppt
KONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.pptKONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.ppt
KONSEP DASAR SISTEM & INFORMASI ANALISA PERANCANGAN SISTEM INFORMASI.ppt
 
1-Pengantar_Sistem_Pendukung_Keputusan.ppt
1-Pengantar_Sistem_Pendukung_Keputusan.ppt1-Pengantar_Sistem_Pendukung_Keputusan.ppt
1-Pengantar_Sistem_Pendukung_Keputusan.ppt
 
Silsilah Sipayung (1).doc
Silsilah Sipayung (1).docSilsilah Sipayung (1).doc
Silsilah Sipayung (1).doc
 
Kisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docx
Kisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docxKisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docx
Kisi Penyusunan Soal AIJ XII TKJ PAS GENAP TP. 2022-2023.docx
 
PERTEMUAN 6 BSC.ppt
PERTEMUAN 6 BSC.pptPERTEMUAN 6 BSC.ppt
PERTEMUAN 6 BSC.ppt
 
Strategi Pengujian Perangkat Lunak.ppt
Strategi Pengujian Perangkat Lunak.pptStrategi Pengujian Perangkat Lunak.ppt
Strategi Pengujian Perangkat Lunak.ppt
 
P7-ROUTING DINAMIS-OSPF.pptx
P7-ROUTING DINAMIS-OSPF.pptxP7-ROUTING DINAMIS-OSPF.pptx
P7-ROUTING DINAMIS-OSPF.pptx
 
Natal Methodist-8 2016.ppt
Natal Methodist-8 2016.pptNatal Methodist-8 2016.ppt
Natal Methodist-8 2016.ppt
 
RPS BASISDATA II - TEKNIK INFORMATIKA.doc
RPS BASISDATA II - TEKNIK INFORMATIKA.docRPS BASISDATA II - TEKNIK INFORMATIKA.doc
RPS BASISDATA II - TEKNIK INFORMATIKA.doc
 

Pertemuan 6- NAVIE BAYES.ppt

  • 2. Naive Bayes Simple Naïve Bayesian Classifier merupakan salah satu metode pengklasifikasi berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen).
  • 3. Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di
  • 4. ... • Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang lain oleh Microsoft Research memperkenalkan metode statistik Bayesian ini pada teknologi anti spam filter. • Tetapi yang membuat algoritma Bayesian filtering ini popular adalah pendekatan yang dilakukan oleh Paul Graham. Dasar dari teorema naive digunakan dalam pemrograman adalah rumus Bayes berikut ini: P (A|B) = (P(B|A) * P(A))/P(B) Artinya Peluang kejadian A sebagai B ditentukan dari peluang B saat A, peluang A, dan peluang B.
  • 5. Penerapan Naive Bayes •Untuk klasifikasi Dokumen •Untuk deteksi SPAM atau fitering SPAM
  • 6. ContohKasus • Menentukan Pertandingan Tennis dimainkan atau tidak
  • 7. 1. Menentukan Probabilitas Class Jumlah data = 14 a. Jumlah Class “Ya” = 10 b. Jumlah Class “Tidak = 4 Maka probabilitas P (Main|Ya ) = 10/14 = 0.71 P (Main|Tidak) = 4/14 = 0.29
  • 8. 2. Menentukan Probabilitas Kategori/Atribut a. CUACA Cuaca = Ya P(Cuaca = Cerah|Ya) = 2/10 = 0.20 P(Cuaca = Berawan|Ya) = 4/10 = 0.40 P(Cuaca = Hujan|Ya) = 4/10 = 0.40 Cuaca = Tidak P(Cuaca = Cerah|Tidak) = 3/4 = 0.75 P(Cuaca = Berawan|Tidak) = 0/4 = 0 P(Cuaca = Hujan|Tidak) = 1/4 = 0.25
  • 9. 2. Menentukan Probabilitas Kategori/Atribut b. SUHU Suhu = Ya P(Suhu = Panas|Ya) = 2/10 = 0.20 P(Suhu = Sejuk|Ya) = 4/10 = 0.40 P(Suhu = Dingin|Ya) = 4/10 = 0.40 Cuaca = Tidak P(Suhu = Panas|Tidak) = 2/4 = 0.50 P(Suhu = Sejuk|Tidak) = 2/4 = 0.50 P(Suhu = Dingin|Tidak) = 0/4 = 0
  • 10. 2. Menentukan Probabilitas Kategori/Atribut c. KELEMBABAN kelembaban = Ya P(kelembaban = Tinggi|Ya) = 3/10 = 0.30 P(kelembaban = Normal|Ya) = 7/10 = 0.70 kelembaban = Tidak P(kelembaban = Tinggi|Tidak) = 4/4 = 1 P(kelembaban = Normal|Tidak) = 0/4 = 0
  • 11. 2. Menentukan Probabilitas Kategori/Atribut d. BERANGIN Berangin= Ya P(Berangin = Salah|Ya) = 6/10 = 0.60 P(Berangin = Benar|Ya) = 4/10 = 0.40 Berangin = Tidak P(Berangin = Salah|Tidak) = 2/4 = 0.50 P(Berangin = Benar|Tidak) = 2/4 = 0.50
  • 12. Kategori/ Atrribut Subset Ya Tidak CUACA Cerah 0.20 0.75 Berawan 0.40 0 Hujan 0.40 0.25 SUHU Panas 0.20 0.50 Sejuk 0.40 0.50 Dingin 0.40 0 KELEMBABAN Tinggi 0.30 1 Normal 0.70 0 BERANGIN Salah 0.60 0.50 Benar 0.40 0.50
  • 13. 3. Menentukan Hasil Klasifikasi NBC DATA NO 1 YA = P(Main|Ya)=P(Main|Ya)*(P(Cuaca=Cerah)* P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin= Salah)) P(Main|Ya) = 0.71 P(Cuaca=Cerah) = 0.20 P(Suhu=Panas) = 0.20 P(Kelembaban=Tinggi) = 0.30 P(Berangin=Salah) = 0.60 = 0.71 *(0.20*0.20*0.30*0.60) = 0.005112
  • 14. 3. Menentukan Hasil Klasifikasi NBC DATA NO 1 TIDAK = P(Main|Tidak)=P(Main|Tidak)*(P(Cuaca=Cerah)* P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin= Salah)) P(Main|Ya) = 0.29 P(Cuaca=Cerah) = 0.75 P(Suhu=Panas) = 0.50 P(Kelembaban=Tinggi) = 1 P(Berangin=Salah) = 0.50 = 0.29 *(0.75*0.50*1*0.50) = 0.054375
  • 15. 3. Menentukan Hasil Klasifikasi NBC DATA NO 2 Ya = P(Main|Ya)=P(Main|Ya)*(P(Cuaca=Cerah)* P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin= Benar)) P(Main|Ya) = 0.71 P(Cuaca=Cerah) = 0.20 P(Suhu=Panas) = 0.20 P(Kelembaban=Tinggi) = 0.30 P(Berangin=Salah) = 0.40 = 0.71 *(0.20*0.20*30*0.40) = 0.003408
  • 16. 3. Menentukan Hasil Klasifikasi NBC DATA NO 2 Tidak = P(Main|Tidak)=P(Main|Tidak)*(P(Cuaca=Cerah)* P(Suhu=Panas)*P(Kelembaban=Tinggi)*P(Berangin= Benar)) P(Main|Ya) = 0.29 P(Cuaca=Cerah) = 0.75 P(Suhu=Panas) = 0.50 P(Kelembaban=Tinggi) = 1 P(Berangin=Salah) = 0.50 = 0.29 *(0.75*0.50*1*0.50) = 0.054375
  • 18. Fakta data Faktual dari Tabel Klasifikasi • Membandingkan data “Ya” dengan “Tidak” Contoh No.1 Ya = 0.00514 Tidak = 0.05357 Jika “Tidak” lebih besar maka klasifikasi “Tidak” Jika “Ya” lebih besar maka klasifikasi “ Ya”
  • 19. Pengujian Misalnya ada Data Baru yaitu Cuaca = Hujan Suhu = Panas Kelembaban = Tinggi Berangin = Benar Apakah data diatas Klasifikasi “Ya” atau “Tidak” P(Main|Ya) =0.71*(0.4*0.2*0.3*0.4) = 0.00686 P(Main|Tidak)=0.29*(0.25*0.5*1*0.5) = 0.01786 Karena Klasifikasi “Tidak” Lebih besar Maka Klasifikasinya adalah “ Tidak”
  • 20. Latihan Misalnya terdapat ingin diketahui apakah suatu objek masuk dalam ketegori dipilih untuk perumahan atau tidak dengan algoritma Naive Bayes Classifier. Untuk menetapkan suatu daerah akan dipilih sebagai lokasi untuk mendirikan perumahan, telah dihimpun 10 aturan.
  • 21. Ada 4 atribut yang digunakan, yaitu: • harga tanah per meter persegi (C1), • jarak daerah tersebut dari pusat kota (C2), • ada atau tidaknya angkutan umum di daerah tersebut (C3), dan • keputusan untuk memilih daerah tersebut sebagai lokasi perumahan (C4).
  • 22. ...
  • 23. ... • Test Set: Berdasarkan data tersebut, apabila diketahui suatu daerah dengan • harga tanah MAHAL, • jarak dari pusat kota SEDANG, • dan ADA angkutan umum, • Bagaimana kategori data diatas apakah Dipilih untuk Perumahan atau Tidak…