SlideShare a Scribd company logo
1 of 40
KONSEP DATA MINING
Universitas Gunadarma
Logo Seminar
Disusun Oleh : Dr Lily Wulandari
KLASIFIKASI: NAIVE BAYES
Naive Bayes
• Simple Naive Bayesian Classifier merupakan salah
satu metode klasifikasi berpeluang sederhana yang
berdasarkan pada penerapan Teorema Bayes dengan
asumsi antar variabel penjelas saling bebas
(independen).
• Algoritma ini memanfaatkan metode probabilitas dan
statistik yang dikemukakan oleh ilmuwan Inggris
Thomas Bayes, yaitu memprediksi probabilitas di masa
depan berdasarkan pengalaman di masa sebelumnya.
Naive Bayes
• Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang
lain oleh Microsoft Research memperkenalkan metode
statistik Bayesian ini pada teknologi anti spam filter.
• Tetapi yang membuat algoritma Bayesian filtering ini
popular adalah pendekatan yang dilakukan oleh Paul
Graham. Dasar dari teorema naive digunakan dalam
pemrograman adalah rumus Bayes berikut ini:
P (A|B) = (P(B|A) * P(A))/P(B)
Artinya Peluang kejadian A sebagai B ditentukan dari
peluang B saat A, peluang A, dan peluang B.
Penerapan Naive Bayes
• Untuk klasifikasi Dokumen
• Untuk deteksi SPAM atau fitering SPAM
Mengapa Naive Bayes?
• Penggolong statistik: melakukan prediksi probabilistik,
mis., Memprediksi probabilitas keanggotaan kelas
• Foundation: Berdasarkan teorema Bayes.
• Kinerja: Pengklasifikasi Bayesian sederhana,
Pengklasifikasi naïve Bayesian, memiliki kinerja yang
sebanding dengan pohon keputusan dan
pengklasifikasi neural network terpilih
1. Baca Data Training
2. Hitung jumlah class
3. Hitung jumlah kasus yang sama dengan class
yang sama
4. Kalikan semua nilai hasil sesuai dengan data X
yang dicari class-nya
Tahapan Algoritma Naïve Bayes
8
1. Baca Data Training
– X  Data dengan class yang belum diketahui
– H  Hipotesis data X yang merupakan suatu class yang lebih
spesifik
– P (H|X)  Probabilitas hipotesis H berdasarkan kondisi X
(posteriori probability)
– P (H)  Probabilitas hipotesis H (prior probability)
– P (X|H)  Probabilitas X berdasarkan kondisi pada hipotesis H
– P (X)  Probabilitas X
Teorema Bayes
)
(
/
)
(
)
|
(
)
(
)
(
)
|
(
)
|
( X
X
X
X
X P
H
P
H
P
P
H
P
H
P
H
P 


• Terdapat 2 class dari data training tersebut, yaitu:
– C1 (Class 1) Play = yes  9 record
– C2 (Class 2) Play = no  5 record
– Total = 14 record
• Maka:
– P (C1) = 9/14 = 0.642857143
– P (C2) = 5/14 = 0.357142857
• Pertanyaan:
– Data X = (outlook=rainy, temperature=cool, humidity=high,
windy=true)
– Main golf atau tidak?
2. Hitung jumlah class/label
• Untuk P(Ci) yaitu P(C1) dan P(C2) sudah diketahui
hasilnya di langkah sebelumnya.
• Selanjutnya Hitung P(X|Ci) untuk i = 1 dan 2
– P(outlook=“sunny”|play=“yes”)=2/9=0.222222222
– P(outlook=“sunny”|play=“no”)=3/5=0.6
– P(outlook=“overcast”|play=“yes”)=4/9=0.444444444
– P(outlook=“overcast”|play=“no”)=0/5=0
– P(outlook=“rainy”|play=“yes”)=3/9=0.333333333
– P(outlook=“rainy”|play=“no”)=2/5=0.4
3. Hitung jumlah kasus yang sama dengan
class yang sama
• Jika semua atribut dihitung, maka didapat hasil
akhirnya seperti berikut ini:
3. Hitung jumlah kasus yang sama dengan
class yang sama
Atribute Parameter No Yes
Outlook value=sunny 0.6 0.2222222222222222
Outlook value=cloudy 0.0 0.4444444444444444
Outlook value=rainy 0.4 0.3333333333333333
Temperature value=hot 0.4 0.2222222222222222
Temperature value=mild 0.4 0.4444444444444444
Temperature value=cool 0.2 0.3333333333333333
Humidity value=high 0.8 0.3333333333333333
Humidity value=normal 0.2 0.6666666666666666
Windy value=false 0.4 0.6666666666666666
Windy value=true 0.6 0.3333333333333333
• Pertanyaan:
– Data X = (outlook=rainy, temperature=cool, humidity=high,
windy=true) ; Main Golf atau tidak?
• Kalikan semua nilai hasil dari data X
– P(X|play=“yes”) = 0.333333333 * 0.333333333 * 0.333333333 *
0.333333333 = 0.012345679
– P(X|play=“no”) = 0.4*0.2*0.8*0.6 = 0.0384
– P(X|play=“yes”)*P(C1) = 0.012345679 * 0.642857143 = 0.007936508
– P(X|play=“no”)*P(C2) = 0.0384 * 0.357142857 = 0.013714286
• Nilai “no” lebih besar dari nilai “yes” maka class dari data X
tersebut adalah “No” 13
4. Kalikan semua nilai hasil sesuai dengan
data X yang dicari class-nya
Contoh Kasus (1)
• Misalnya ingin diketahui apakah suatu objek
masuk dalam ketegori dipilih untuk perumahan
atau tidak dengan algoritma Naive Bayes
Classifier. Untuk menetapkan suatu daerah
akan dipilih sebagai lokasi untuk mendirikan
perumahan, telah dihimpun 10 aturan.
Contoh Kasus (1)
• Ada 4 atribut yang digunakan, yaitu:
– harga tanah per meter persegi (C1),
– jarak daerah tersebut dari pusat kota (C2),
– ada atau tidaknya angkutan umum di daerah
tersebut (C3), dan
– keputusan untuk memilih daerah tersebut sebagai
lokasi perumahan (C4).
Contoh Kasus (1)
Contoh kasus (1)
• Probabilitas kemunculan setiap nilai untuk atribut
Harga Tanah (C1)
Contoh Kasus (1)
• Probabilitas kemunculan setiap nilai untuk atribut Jarak
dari Pusat Kota (C2)
Contoh Kasus (1)
• Probabilitas kemunculan setiap nilai untuk atribut Ada
Angkutan Umum (C3)
Contoh Kasus (1)
• Probabilitas kemunculan setiap nilai untuk atribut
Dipilih untuk perumahan (C4)
Contoh Kasus (1)
• Test Set: Berdasarkan data tersebut, apabila diketahui
suatu daerah dengan harga tanah MAHAL, jarak dari
pusat kota SEDANG, dan ADA angkutan umum, maka
dapat dihitung:
YA = P(Ya|Tanah = MAHAL) . P(Ya|Jarak = SEDANG)
.P(Ya|Angkutan = ADA). P(Ya)= 1/5 x 2/5 x 1/5 x 5/10 =
2/125 = 0,008
TIDAK = P(Tidak| Tanah = MAHAL) . P(Tidak|Jarak =
SEDANG) .P(Tidak|Angkutan = ADA) . P(Tidak)= 3/5 x 1/5
x 3/5 x 5/10 = 2/125 = 0,036
Contoh Kasus (1)
• Nilai probabilitas dapat dihitung dengan melakukan
normalisasi terhadap likelihood tersebut sehingga
jumlah nilai yang diperoleh = 1
Contoh Kasus (2)
• Untuk jenis data harga tanah dan jarak pusat kota
yang kontinue, misalnya :
Contoh Kasus (2)
• Namun jika atribut ke-i bersifat kontinu, maka P(xi|C)
diestimasi dengan fungsi densitas Gauss.Distribusi
normal adalah distribusi dari variabel acak kontinu.
Kadang-kadang distribusi normal disebut juga dengan
distribusi Gauss. Distribusi ini merupakan distribusi
yang paling penting dan paling banyak digunakan di
bidang statistika.e = 2,7183
Contoh Kasus (2)
• Probabilitas kemunculan setiap nilai untuk atribut
Harga Tanah (C1)
Contoh Kasus (2)
• Probabilitas kemunculan setiap nilai untuk atribut Jarak
dari Pusat Kota (C2)
Contoh Kasus (2)
• Probabilitas kemunculan setiap nilai untuk atribut
Angkutan Umum (C3)
Contoh Kasus (2)
• Probabilitas kemunculan setiap nilai untuk atribut
Dipilih untuk Perumahan (C4)
Contoh Kasus (2)
• Apabila diberikan C1 = 300, C2 = 17, C3 = Tidak,
maka:
Contoh Kasus (2)
• Likelihood Ya = (0,0021) x (0,0009) x 4/5 x 5/10 = 0,000000756
• Likelihood Tidak = (0,0013) x (0,0633) x 2/5 x 5/10 =
0,000016458
• Nilai probabilitas dapat dihitung dengan melakukan normalisasi
terhadap likelihood tersebut sehingga jumlah nilai yang
diperoleh = 1
Menghindari Masalah Probabilitas-Nol
• Prediksi Naïve Bayesian membutuhkan masing-
masing prob bersyarat yang tidak nol. Jika tidak, prob
yang diprediksi akan menjadi nol.
• Misalkan dataset dengan 1000 tupel, income = rendah
(0), income = sedang (990), dan income = tinggi (10)



n
k
Ci
xk
P
Ci
X
P
1
)
|
(
)
|
(
Menghindari Masalah Probabilitas-Nol
• Gunakan koreksi Laplacian (atau estimator Laplacian)
Menambahkan 1 ke setiap kasing
Prob (penghasilan = rendah) = 1/1003
Prob (penghasilan = sedang) = 991/1003
Prob (penghasilan = tinggi) = 11/1003
Perkiraan probabilitas yang “dikoreksi” dekat dengan
probabilitas lainnya yang "tidak dikoreksi“.
Naïve Bayes Classifier: Komentar
• Keuntungan
– Mudah diimplementasikan
– Hasil yang baik diperoleh di sebagian besar kasus
• Kekurangan
– Asumsi: kelas bebas bersyarat, oleh karena itu kehilangan
keakuratan
– Secara praktis, ketergantungan ada di antara variabel. Misal:
• Profil Pasien Rumah Sakit: usia, riwayat keluarga, dll
• Gejala: demam, batuk dll.,
• Penyakit: kanker paru-paru, diabetes, dll.
Naïve Bayes Classifier: Komentar
• Kekurangan (lanjutan)
– Ketergantungan di antara ini tidak dapat dimodelkan
oleh Naïve Bayes Classifier
• Bagaimana cara mengatasi ketergantungan ini?
Bayesian Belief Networks
Bayesian Belief Network
• Bayesian Belief Network, suatu metode dalam machine
learning yang masuk ke dalam kategori supervised
learning.
• Pada dasarnya belief network mengambil teori dasar
bayessian, yang memanfaatkan distribusi probabilitas pada
setiap features yang diketahui. Namun yang membedakan
adalah dalam belief network menggunakan suatu network
yang merepresentasikan kondisi pengetahuan dependensi
dan in-dependensi setiap features yang ada dalam suatu
kasus atau dataset.
Bayesian Belief Network
• Berbeda dengan naive bayes yang tidak melihat
kemungkinan dependensi dan in-dependensi setiap
features (attributes), dan itu dapat dilihat dari
representasi metode yang digunakan naive bayes.
• Tentunya dengan melihat model yang dihasilkan
adalah berupa inferences yaitu distribusi probabilitas
setiap features dalam network maka belief network
dapat menjadi alternatif metode yang lebih baik
dibanding naive bayes yang tidak melihat
kemungkinan tersebut.
Bayesian Belief Network
• Contohnya adalah jika kita memiliki 6 atribut yang
dapat menentukan berbagai kondisi, seperti lightning,
thunder, atau kebakaran hutan seperti di bawah ini:
Bayesian Belief Network
• Misalkan untuk Lightning atau petir akan terjadi
jika terdapat probabilitas yang besar untuk
storm atau kilat akan terjadi ketika badai, dan
thunder atau gemuruh guntur akan terjadi ketika
petir sudah terjadi, atau jika kita memiliki
probabilitas lightning yang cukup besar maka
probabilitas thunder pun akan meningkat.
Bayesian Belief Network
• Bagitu juga kebakaran hutan, jika terjadi petir
dan badai ditambah ada yang membuat api
unggun, maka probabilitas terjadinya kebakaran
hutan akan meningkat.
• Artinya network tersebut merupakan
representasi distribusi probabilitas (joint
distribution) antar setiap variable.
NB.ppt

More Related Content

What's hot

Bintang
BintangBintang
Bintang
syahronirpl
 
Presentasi distribusi poisson
Presentasi distribusi poissonPresentasi distribusi poisson
Presentasi distribusi poisson
Wulan_Ari_K
 

What's hot (20)

Analisis Diskriminan (2)
Analisis Diskriminan (2)Analisis Diskriminan (2)
Analisis Diskriminan (2)
 
Stat matematika II (7)
Stat matematika II (7)Stat matematika II (7)
Stat matematika II (7)
 
DISTRIBUSI PROBABILITAS
DISTRIBUSI PROBABILITASDISTRIBUSI PROBABILITAS
DISTRIBUSI PROBABILITAS
 
Bintang
BintangBintang
Bintang
 
proses poisson
proses poissonproses poisson
proses poisson
 
Presentasi distribusi poisson
Presentasi distribusi poissonPresentasi distribusi poisson
Presentasi distribusi poisson
 
Data mining 3 similarity and disimilarity
Data mining 3   similarity and disimilarityData mining 3   similarity and disimilarity
Data mining 3 similarity and disimilarity
 
Teknik Counting 2
Teknik Counting 2Teknik Counting 2
Teknik Counting 2
 
Tutorial histogram
Tutorial histogramTutorial histogram
Tutorial histogram
 
Analisis spasial
Analisis spasialAnalisis spasial
Analisis spasial
 
Pendugaan parameter
Pendugaan parameterPendugaan parameter
Pendugaan parameter
 
Analisis cluster
Analisis clusterAnalisis cluster
Analisis cluster
 
Nilai harapan
Nilai harapanNilai harapan
Nilai harapan
 
Teori peluang
Teori peluangTeori peluang
Teori peluang
 
APG Pertemuan 5 : Inferensia Vektor Rata-rata 1 Populasi
APG Pertemuan 5 : Inferensia Vektor Rata-rata 1 PopulasiAPG Pertemuan 5 : Inferensia Vektor Rata-rata 1 Populasi
APG Pertemuan 5 : Inferensia Vektor Rata-rata 1 Populasi
 
20731 21 visualisasi data
20731 21 visualisasi data20731 21 visualisasi data
20731 21 visualisasi data
 
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Konsep dasar probabilitas.ppt
Konsep dasar probabilitas.pptKonsep dasar probabilitas.ppt
Konsep dasar probabilitas.ppt
 

Similar to NB.ppt

OK08-klasifikasi-dgn-naive-bayes gra.ppt
OK08-klasifikasi-dgn-naive-bayes gra.pptOK08-klasifikasi-dgn-naive-bayes gra.ppt
OK08-klasifikasi-dgn-naive-bayes gra.ppt
ssuser71321a
 
naive-bayes.ppt
naive-bayes.pptnaive-bayes.ppt
naive-bayes.ppt
nyomans1
 
Webinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdf
Webinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdfWebinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdf
Webinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdf
labudaraBinalab
 
Chapter 3 maximum likelihood and bayesian estimation-fix
Chapter 3   maximum likelihood and bayesian estimation-fixChapter 3   maximum likelihood and bayesian estimation-fix
Chapter 3 maximum likelihood and bayesian estimation-fix
jelli123
 
6_dan_7._teori_peluang_nerisa.ppt
6_dan_7._teori_peluang_nerisa.ppt6_dan_7._teori_peluang_nerisa.ppt
6_dan_7._teori_peluang_nerisa.ppt
YandiChaniago
 
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfPertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
allucanbuyyy
 
001 konsep hitung_kuadrat_terkecil
001 konsep hitung_kuadrat_terkecil001 konsep hitung_kuadrat_terkecil
001 konsep hitung_kuadrat_terkecil
leonardo onar
 

Similar to NB.ppt (20)

OK08-klasifikasi-dgn-naive-bayes.ppt
OK08-klasifikasi-dgn-naive-bayes.pptOK08-klasifikasi-dgn-naive-bayes.ppt
OK08-klasifikasi-dgn-naive-bayes.ppt
 
OK08-klasifikasi-dgn-naive-bayes gra.ppt
OK08-klasifikasi-dgn-naive-bayes gra.pptOK08-klasifikasi-dgn-naive-bayes gra.ppt
OK08-klasifikasi-dgn-naive-bayes gra.ppt
 
naive-bayes.ppt
naive-bayes.pptnaive-bayes.ppt
naive-bayes.ppt
 
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdfDiskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
 
Webinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdf
Webinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdfWebinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdf
Webinar Peran Statistika dalam Analisis Lingkungan EcoEdu.id.pdf
 
Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)
 
Clustering
ClusteringClustering
Clustering
 
Statdas fis-01 45
Statdas fis-01 45Statdas fis-01 45
Statdas fis-01 45
 
Cara pemakaian weka
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
 
12611132 muthia khaerunnisa
12611132 muthia khaerunnisa12611132 muthia khaerunnisa
12611132 muthia khaerunnisa
 
Chapter 3 maximum likelihood and bayesian estimation-fix
Chapter 3   maximum likelihood and bayesian estimation-fixChapter 3   maximum likelihood and bayesian estimation-fix
Chapter 3 maximum likelihood and bayesian estimation-fix
 
Definisi Statistika dan Penyajian Data
Definisi Statistika dan Penyajian DataDefinisi Statistika dan Penyajian Data
Definisi Statistika dan Penyajian Data
 
6_dan_7._teori_peluang_nerisa.ppt
6_dan_7._teori_peluang_nerisa.ppt6_dan_7._teori_peluang_nerisa.ppt
6_dan_7._teori_peluang_nerisa.ppt
 
Metode Analisis Data Kuantitatif
Metode Analisis Data KuantitatifMetode Analisis Data Kuantitatif
Metode Analisis Data Kuantitatif
 
Ukuran_Pemusatan_s1.ppt
Ukuran_Pemusatan_s1.pptUkuran_Pemusatan_s1.ppt
Ukuran_Pemusatan_s1.ppt
 
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfPertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
 
001 konsep hitung_kuadrat_terkecil
001 konsep hitung_kuadrat_terkecil001 konsep hitung_kuadrat_terkecil
001 konsep hitung_kuadrat_terkecil
 
Simulasi2
Simulasi2Simulasi2
Simulasi2
 
simplerandomsampling-140609083046-phpapp02.pdf
simplerandomsampling-140609083046-phpapp02.pdfsimplerandomsampling-140609083046-phpapp02.pdf
simplerandomsampling-140609083046-phpapp02.pdf
 
Simple random sampling
Simple random samplingSimple random sampling
Simple random sampling
 

More from nyomans1

PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.pptPPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
nyomans1
 
Template Pertemuan 1 All MK - Copy.pptx
Template Pertemuan 1 All MK - Copy.pptxTemplate Pertemuan 1 All MK - Copy.pptx
Template Pertemuan 1 All MK - Copy.pptx
nyomans1
 
Clustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptxClustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptx
nyomans1
 
slide 7_olap_example.ppt
slide 7_olap_example.pptslide 7_olap_example.ppt
slide 7_olap_example.ppt
nyomans1
 
PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.pptPPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
nyomans1
 
Minggu_1_Matriks_dan_Operasinya.pptx
Minggu_1_Matriks_dan_Operasinya.pptxMinggu_1_Matriks_dan_Operasinya.pptx
Minggu_1_Matriks_dan_Operasinya.pptx
nyomans1
 
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
nyomans1
 
10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx
nyomans1
 
08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx
nyomans1
 
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
nyomans1
 
04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx
nyomans1
 
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
nyomans1
 
03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx
nyomans1
 
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptxQ-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
nyomans1
 
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptxBAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
nyomans1
 
Support-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptxSupport-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptx
nyomans1
 
06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx
nyomans1
 
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
nyomans1
 

More from nyomans1 (20)

PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.pptPPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
 
Template Pertemuan 1 All MK - Copy.pptx
Template Pertemuan 1 All MK - Copy.pptxTemplate Pertemuan 1 All MK - Copy.pptx
Template Pertemuan 1 All MK - Copy.pptx
 
Clustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptxClustering_hirarki (tanpa narasi) (1).pptx
Clustering_hirarki (tanpa narasi) (1).pptx
 
slide 7_olap_example.ppt
slide 7_olap_example.pptslide 7_olap_example.ppt
slide 7_olap_example.ppt
 
PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.pptPPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
PPT-UEU-Keamanan-Informasi-Pertemuan-5.ppt
 
Security Requirement.pptx
Security Requirement.pptxSecurity Requirement.pptx
Security Requirement.pptx
 
Minggu_1_Matriks_dan_Operasinya.pptx
Minggu_1_Matriks_dan_Operasinya.pptxMinggu_1_Matriks_dan_Operasinya.pptx
Minggu_1_Matriks_dan_Operasinya.pptx
 
Matriks suplemen.ppt
Matriks suplemen.pptMatriks suplemen.ppt
Matriks suplemen.ppt
 
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
fdokumen.com_muh1g3-matriks-dan-ruang-vektor-3-312017-muh1g3-matriks-dan-ruan...
 
10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx10-Image-Enhancement-Bagian3-2021.pptx
10-Image-Enhancement-Bagian3-2021.pptx
 
08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx08-Image-Enhancement-Bagian1.pptx
08-Image-Enhancement-Bagian1.pptx
 
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
03-Pembentukan-Citra-dan-Digitalisasi-Citra.pptx
 
04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx04-Format-citra-dan-struktur-data-citra-2021.pptx
04-Format-citra-dan-struktur-data-citra-2021.pptx
 
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
02-Pengantar-Pengolahan-Citra-Bag2-2021.pptx
 
03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx03spatialfiltering-130424050639-phpapp02.pptx
03spatialfiltering-130424050639-phpapp02.pptx
 
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptxQ-Step_WS_02102019_Practical_introduction_to_Python.pptx
Q-Step_WS_02102019_Practical_introduction_to_Python.pptx
 
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptxBAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
BAB 2_TIPE DATA, VARIABEL, DAN OPERATOR (1) (1).pptx
 
Support-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptxSupport-Vector-Machines_EJ_v5.06.pptx
Support-Vector-Machines_EJ_v5.06.pptx
 
06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx06-Image-Histogram-2021.pptx
06-Image-Histogram-2021.pptx
 
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
05-Operasi-dasar-pengolahan-citra-2021 (1).pptx
 

Recently uploaded

Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerjaContoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
IniiiHeru
 
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptxRESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
mirzagozali2
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Riyadh +966572737505 get cytotec
 
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
sonyaawitan
 
Diac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponenDiac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponen
BangMahar
 
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
TaufikTito
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
DosenBernard
 
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.pptKeracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
DIGGIVIO2
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Riyadh +966572737505 get cytotec
 

Recently uploaded (20)

Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerjaContoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesia
 
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptxRESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
 
Diac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponenDiac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponen
 
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
 
contoh judul tesis untuk mahasiswa pascasarjana
contoh judul tesis untuk mahasiswa pascasarjanacontoh judul tesis untuk mahasiswa pascasarjana
contoh judul tesis untuk mahasiswa pascasarjana
 
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 
Hasil wawancara usaha lumpia basah tugas PKWU
Hasil wawancara usaha lumpia basah tugas PKWUHasil wawancara usaha lumpia basah tugas PKWU
Hasil wawancara usaha lumpia basah tugas PKWU
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.pptKeracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
 
Bimbingan Teknis Penyusunan Soal Pilihan Berganda 2024.pptx
Bimbingan Teknis Penyusunan Soal Pilihan Berganda  2024.pptxBimbingan Teknis Penyusunan Soal Pilihan Berganda  2024.pptx
Bimbingan Teknis Penyusunan Soal Pilihan Berganda 2024.pptx
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
 
materi konsep dan Model TRIASE Bencana.pptx
materi konsep dan Model TRIASE Bencana.pptxmateri konsep dan Model TRIASE Bencana.pptx
materi konsep dan Model TRIASE Bencana.pptx
 

NB.ppt

  • 1. KONSEP DATA MINING Universitas Gunadarma Logo Seminar Disusun Oleh : Dr Lily Wulandari
  • 3. Naive Bayes • Simple Naive Bayesian Classifier merupakan salah satu metode klasifikasi berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). • Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya.
  • 4. Naive Bayes • Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang lain oleh Microsoft Research memperkenalkan metode statistik Bayesian ini pada teknologi anti spam filter. • Tetapi yang membuat algoritma Bayesian filtering ini popular adalah pendekatan yang dilakukan oleh Paul Graham. Dasar dari teorema naive digunakan dalam pemrograman adalah rumus Bayes berikut ini: P (A|B) = (P(B|A) * P(A))/P(B) Artinya Peluang kejadian A sebagai B ditentukan dari peluang B saat A, peluang A, dan peluang B.
  • 5. Penerapan Naive Bayes • Untuk klasifikasi Dokumen • Untuk deteksi SPAM atau fitering SPAM
  • 6. Mengapa Naive Bayes? • Penggolong statistik: melakukan prediksi probabilistik, mis., Memprediksi probabilitas keanggotaan kelas • Foundation: Berdasarkan teorema Bayes. • Kinerja: Pengklasifikasi Bayesian sederhana, Pengklasifikasi naïve Bayesian, memiliki kinerja yang sebanding dengan pohon keputusan dan pengklasifikasi neural network terpilih
  • 7. 1. Baca Data Training 2. Hitung jumlah class 3. Hitung jumlah kasus yang sama dengan class yang sama 4. Kalikan semua nilai hasil sesuai dengan data X yang dicari class-nya Tahapan Algoritma Naïve Bayes
  • 8. 8 1. Baca Data Training
  • 9. – X  Data dengan class yang belum diketahui – H  Hipotesis data X yang merupakan suatu class yang lebih spesifik – P (H|X)  Probabilitas hipotesis H berdasarkan kondisi X (posteriori probability) – P (H)  Probabilitas hipotesis H (prior probability) – P (X|H)  Probabilitas X berdasarkan kondisi pada hipotesis H – P (X)  Probabilitas X Teorema Bayes ) ( / ) ( ) | ( ) ( ) ( ) | ( ) | ( X X X X X P H P H P P H P H P H P   
  • 10. • Terdapat 2 class dari data training tersebut, yaitu: – C1 (Class 1) Play = yes  9 record – C2 (Class 2) Play = no  5 record – Total = 14 record • Maka: – P (C1) = 9/14 = 0.642857143 – P (C2) = 5/14 = 0.357142857 • Pertanyaan: – Data X = (outlook=rainy, temperature=cool, humidity=high, windy=true) – Main golf atau tidak? 2. Hitung jumlah class/label
  • 11. • Untuk P(Ci) yaitu P(C1) dan P(C2) sudah diketahui hasilnya di langkah sebelumnya. • Selanjutnya Hitung P(X|Ci) untuk i = 1 dan 2 – P(outlook=“sunny”|play=“yes”)=2/9=0.222222222 – P(outlook=“sunny”|play=“no”)=3/5=0.6 – P(outlook=“overcast”|play=“yes”)=4/9=0.444444444 – P(outlook=“overcast”|play=“no”)=0/5=0 – P(outlook=“rainy”|play=“yes”)=3/9=0.333333333 – P(outlook=“rainy”|play=“no”)=2/5=0.4 3. Hitung jumlah kasus yang sama dengan class yang sama
  • 12. • Jika semua atribut dihitung, maka didapat hasil akhirnya seperti berikut ini: 3. Hitung jumlah kasus yang sama dengan class yang sama Atribute Parameter No Yes Outlook value=sunny 0.6 0.2222222222222222 Outlook value=cloudy 0.0 0.4444444444444444 Outlook value=rainy 0.4 0.3333333333333333 Temperature value=hot 0.4 0.2222222222222222 Temperature value=mild 0.4 0.4444444444444444 Temperature value=cool 0.2 0.3333333333333333 Humidity value=high 0.8 0.3333333333333333 Humidity value=normal 0.2 0.6666666666666666 Windy value=false 0.4 0.6666666666666666 Windy value=true 0.6 0.3333333333333333
  • 13. • Pertanyaan: – Data X = (outlook=rainy, temperature=cool, humidity=high, windy=true) ; Main Golf atau tidak? • Kalikan semua nilai hasil dari data X – P(X|play=“yes”) = 0.333333333 * 0.333333333 * 0.333333333 * 0.333333333 = 0.012345679 – P(X|play=“no”) = 0.4*0.2*0.8*0.6 = 0.0384 – P(X|play=“yes”)*P(C1) = 0.012345679 * 0.642857143 = 0.007936508 – P(X|play=“no”)*P(C2) = 0.0384 * 0.357142857 = 0.013714286 • Nilai “no” lebih besar dari nilai “yes” maka class dari data X tersebut adalah “No” 13 4. Kalikan semua nilai hasil sesuai dengan data X yang dicari class-nya
  • 14. Contoh Kasus (1) • Misalnya ingin diketahui apakah suatu objek masuk dalam ketegori dipilih untuk perumahan atau tidak dengan algoritma Naive Bayes Classifier. Untuk menetapkan suatu daerah akan dipilih sebagai lokasi untuk mendirikan perumahan, telah dihimpun 10 aturan.
  • 15. Contoh Kasus (1) • Ada 4 atribut yang digunakan, yaitu: – harga tanah per meter persegi (C1), – jarak daerah tersebut dari pusat kota (C2), – ada atau tidaknya angkutan umum di daerah tersebut (C3), dan – keputusan untuk memilih daerah tersebut sebagai lokasi perumahan (C4).
  • 17. Contoh kasus (1) • Probabilitas kemunculan setiap nilai untuk atribut Harga Tanah (C1)
  • 18. Contoh Kasus (1) • Probabilitas kemunculan setiap nilai untuk atribut Jarak dari Pusat Kota (C2)
  • 19. Contoh Kasus (1) • Probabilitas kemunculan setiap nilai untuk atribut Ada Angkutan Umum (C3)
  • 20. Contoh Kasus (1) • Probabilitas kemunculan setiap nilai untuk atribut Dipilih untuk perumahan (C4)
  • 21. Contoh Kasus (1) • Test Set: Berdasarkan data tersebut, apabila diketahui suatu daerah dengan harga tanah MAHAL, jarak dari pusat kota SEDANG, dan ADA angkutan umum, maka dapat dihitung: YA = P(Ya|Tanah = MAHAL) . P(Ya|Jarak = SEDANG) .P(Ya|Angkutan = ADA). P(Ya)= 1/5 x 2/5 x 1/5 x 5/10 = 2/125 = 0,008 TIDAK = P(Tidak| Tanah = MAHAL) . P(Tidak|Jarak = SEDANG) .P(Tidak|Angkutan = ADA) . P(Tidak)= 3/5 x 1/5 x 3/5 x 5/10 = 2/125 = 0,036
  • 22. Contoh Kasus (1) • Nilai probabilitas dapat dihitung dengan melakukan normalisasi terhadap likelihood tersebut sehingga jumlah nilai yang diperoleh = 1
  • 23. Contoh Kasus (2) • Untuk jenis data harga tanah dan jarak pusat kota yang kontinue, misalnya :
  • 24. Contoh Kasus (2) • Namun jika atribut ke-i bersifat kontinu, maka P(xi|C) diestimasi dengan fungsi densitas Gauss.Distribusi normal adalah distribusi dari variabel acak kontinu. Kadang-kadang distribusi normal disebut juga dengan distribusi Gauss. Distribusi ini merupakan distribusi yang paling penting dan paling banyak digunakan di bidang statistika.e = 2,7183
  • 25. Contoh Kasus (2) • Probabilitas kemunculan setiap nilai untuk atribut Harga Tanah (C1)
  • 26. Contoh Kasus (2) • Probabilitas kemunculan setiap nilai untuk atribut Jarak dari Pusat Kota (C2)
  • 27. Contoh Kasus (2) • Probabilitas kemunculan setiap nilai untuk atribut Angkutan Umum (C3)
  • 28. Contoh Kasus (2) • Probabilitas kemunculan setiap nilai untuk atribut Dipilih untuk Perumahan (C4)
  • 29. Contoh Kasus (2) • Apabila diberikan C1 = 300, C2 = 17, C3 = Tidak, maka:
  • 30. Contoh Kasus (2) • Likelihood Ya = (0,0021) x (0,0009) x 4/5 x 5/10 = 0,000000756 • Likelihood Tidak = (0,0013) x (0,0633) x 2/5 x 5/10 = 0,000016458 • Nilai probabilitas dapat dihitung dengan melakukan normalisasi terhadap likelihood tersebut sehingga jumlah nilai yang diperoleh = 1
  • 31. Menghindari Masalah Probabilitas-Nol • Prediksi Naïve Bayesian membutuhkan masing- masing prob bersyarat yang tidak nol. Jika tidak, prob yang diprediksi akan menjadi nol. • Misalkan dataset dengan 1000 tupel, income = rendah (0), income = sedang (990), dan income = tinggi (10)    n k Ci xk P Ci X P 1 ) | ( ) | (
  • 32. Menghindari Masalah Probabilitas-Nol • Gunakan koreksi Laplacian (atau estimator Laplacian) Menambahkan 1 ke setiap kasing Prob (penghasilan = rendah) = 1/1003 Prob (penghasilan = sedang) = 991/1003 Prob (penghasilan = tinggi) = 11/1003 Perkiraan probabilitas yang “dikoreksi” dekat dengan probabilitas lainnya yang "tidak dikoreksi“.
  • 33. Naïve Bayes Classifier: Komentar • Keuntungan – Mudah diimplementasikan – Hasil yang baik diperoleh di sebagian besar kasus • Kekurangan – Asumsi: kelas bebas bersyarat, oleh karena itu kehilangan keakuratan – Secara praktis, ketergantungan ada di antara variabel. Misal: • Profil Pasien Rumah Sakit: usia, riwayat keluarga, dll • Gejala: demam, batuk dll., • Penyakit: kanker paru-paru, diabetes, dll.
  • 34. Naïve Bayes Classifier: Komentar • Kekurangan (lanjutan) – Ketergantungan di antara ini tidak dapat dimodelkan oleh Naïve Bayes Classifier • Bagaimana cara mengatasi ketergantungan ini? Bayesian Belief Networks
  • 35. Bayesian Belief Network • Bayesian Belief Network, suatu metode dalam machine learning yang masuk ke dalam kategori supervised learning. • Pada dasarnya belief network mengambil teori dasar bayessian, yang memanfaatkan distribusi probabilitas pada setiap features yang diketahui. Namun yang membedakan adalah dalam belief network menggunakan suatu network yang merepresentasikan kondisi pengetahuan dependensi dan in-dependensi setiap features yang ada dalam suatu kasus atau dataset.
  • 36. Bayesian Belief Network • Berbeda dengan naive bayes yang tidak melihat kemungkinan dependensi dan in-dependensi setiap features (attributes), dan itu dapat dilihat dari representasi metode yang digunakan naive bayes. • Tentunya dengan melihat model yang dihasilkan adalah berupa inferences yaitu distribusi probabilitas setiap features dalam network maka belief network dapat menjadi alternatif metode yang lebih baik dibanding naive bayes yang tidak melihat kemungkinan tersebut.
  • 37. Bayesian Belief Network • Contohnya adalah jika kita memiliki 6 atribut yang dapat menentukan berbagai kondisi, seperti lightning, thunder, atau kebakaran hutan seperti di bawah ini:
  • 38. Bayesian Belief Network • Misalkan untuk Lightning atau petir akan terjadi jika terdapat probabilitas yang besar untuk storm atau kilat akan terjadi ketika badai, dan thunder atau gemuruh guntur akan terjadi ketika petir sudah terjadi, atau jika kita memiliki probabilitas lightning yang cukup besar maka probabilitas thunder pun akan meningkat.
  • 39. Bayesian Belief Network • Bagitu juga kebakaran hutan, jika terjadi petir dan badai ditambah ada yang membuat api unggun, maka probabilitas terjadinya kebakaran hutan akan meningkat. • Artinya network tersebut merupakan representasi distribusi probabilitas (joint distribution) antar setiap variable.