SlideShare a Scribd company logo
1 of 15
Perbandingan Nilai Akurasi Algoritma
Klasifikasi Data Mining pada Mammographic
Mass Dataset UCI Machine Learning
Maila S. Baladina 06211540000120
Dosen :
Novri Suhermi, S.Si., M.Sc.
Dr. Dra. Kartika Fithriarsari, M.Si.
Layout
1
2
3
4
Pendahuluan
Metodologi Penelitian
Analisis dan Pembahasan
Kesimpulan dan Saran
BAB 1
PENDAHULUAN
Pendahuluan
40.290 440
Tahun
2
0
1
5
meninggal karena penyakit kanker payudara
MAMOGRAFI  salah satu metode yang paling efek
tif digunakan untuk mendeteksi jenis kanker payudara
Umur
Bentuk Gumpalan
Garis Tepi Gumpalan
BI-RADS
Tingkat Keparahan
Kepadatan Gumpalan
Dicari nilai akurasi terbaik
dalam memprediksi tingkat
keparahan menggunakan
metode algoritma klasifikasi
data mining
BAB 2
METODOLOGI PENELITIAN
SUMBER DAN VARIABEL PENELITIAN
diambil dari UCI Machine Learning Repository
Mammographic Mass Data Set
diunduh  hari Selasa 04 Desember 2018
Data Sekunder
BI-RADS
assessment
Umur
Bentuk
Gumpalan
Garis Pinggir
Gumpalan
Kepadatan
Gumpalan
Tingkat
Keparahan
Variabel Penelitian
lima
Manarik
kesimpulan
dan saran
tiga
Melakukan preprocessing
data kemudian
mengeksplor dan melihat
karakteristik data
satu
Mengumpulkan
dan merapikan
data sekunder
Menginstal package
dan mengimport
dataset ke dalam
Jupiter Notebook
dua
Menghitung nilai akurasi menggunakan
algoritma klasifikasi data mining (Knn, SVM,
random forest, naive bayes, dan regresi
logistik yang kemudian diperoleh metode
klasifikasi terbaik
empat
LANGKAH ANALISIS
BAB 3
ANALISIS DAN PEMBAHASAN
Prepocessing Data
Add Text
Simple PowerPoint
Variabel
Persentase
Missing value
BI-RADS
assessment
0,2%
Age 0,5%
Shape 3,2%
Margin 4,5%
Density 7,9%
Severity 0%
Variabel Imputasi
Persentase
Missing value
Setelah
Imputasi
BI-RADS
assessment
Modus = 4 0%
Age Median = 57 0%
Shape Modus = 4 0%
Margin Modus =1 0%
Density Modus =3 0%
Semua variabel memiliki
missing value kecuali variabel
severity
IMPUTASI MISSING VALUE
Variabel numerik  nilai median
Variabel kategorik  nilai modus
Karakteristik dan
Eksplorasi Data
HEATMAP
BOXPLOT
DENSITY PLOT
FEATURE IMPORTANCE PLOT
Algoritma Klasifikasi
Metode Holdout
Metode Klasifikasi Akurasi Sensitivity Specificity
k-Nearest Neighbor 80,97% 84,81% 76,34%
Support Vector Machine 83,05% 86,08% 76,34%
Random Forest 79,58% 83,54% 74,81%
Naive Bayes 80,97% 82,91% 78,63%
Regresi Logistik 83,74% 83,54% 83,97%
kemampuan pendeteksian
gumpalan kanker payudara
menggunakan mammografi
untuk memberikan hasil
negatif bagi mereka yang
tidak menderita penyakit
kanker payudara
Akurasi
83,74%
Sensitivitas
83,74%
Spesifitas
83,97%
kemampuan pendeteksi
gumpalan kanker payudara
secara dini menggunakan
mammografi untuk
memberikan hasil positif
bagi mereka yang menderita
kanker payudara
ketepatan atau
kebenaran
mammographic
dalam menskrining
gumpalan
Algoritma Klasifikasi
Metode Cross Validation
k-Nearest Neighbor Support Vector Machine Random Forest
Naive Bayes Regresi Logistik
80,02% 81,06% 79,09%
80,03% 81,27%
13
Satu
untuk memperoleh nilai akurasi yang tinggi dengan tu
juan ingin mengetahui seberapa akuratnya pendeteks
ian gumpalan kanker payudara menggunakan mamm
ografik langkah awalnya adalah dengan melakukan pr
eprocessing data yang meliputi deteksi dan imputasi
missing value, sebagaimana diketahui dari semua vari
abel yang digunakan kecuali variabel tingkat keparaha
n (severity) semuanya memiliki data yang missing sehi
ngga dapat diatas dengan imputasi nilai modus untuk
variabel BI-RADS assessment, shape, margin, dan den
sity. Sedangkan untuk variabel age diimputasi dengan
nilai median
Kesimpulan
Dua
dilakukan eksplorasi data guna mengetahui hubungan a
ntar variabel, pencilan data, distribusi dan sebaran data
, serta ranking kepentingan variabel berdasarkan nilai e
ntropy. Kemudian yang terakhir adalah menghitung nil
ai akurasi dengan beberapa metode klasifikasi melalui c
ara holdout dan k-fold cross validation. Pada pengguna
an cara holdout maupun cross validation diperoleh met
ode klasifikasi terbaik yaitu dengan metode klasifikasi r
egresi logistik dimana masing-masing secara urut diper
oleh sebesar 83,74 persen dan 81,27 persen, nilai akur
asi tersebut yang berarti bahwa kemampuan mammog
raphic untuk mendeteksi gumpalan kanker payudara se
cara benar seluruh subjek yang diuji yaitu sebesar 83,7
4 persen jika menggunakan cara holdout dan 81,27 per
sen jika menggunakan cara k-fold cross validation.
SaranSebaiknya data yang digunakan lebih banyak agar dapat dianalisis lebih dalam, se
perti misalnya jika variabel yang digunakan semakin banyak maka dapat dilakuka
n feature engeenering yang sekiranya dapat menaikkan nilai akurasi dalam ketep
atan klasifikasi model. Selain itu sebaiknya peneliti lebih berhati-hati dalam meng
hitung nilai akurasi karena jika nilai akurasi yang diperoleh kurang tepat maka has
il analisis dalam memprediksi model menjadi kurang representatif.
14
Thank you

More Related Content

Similar to [PPT] Final Project Data Mining A (Maila 06211540000120)

Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...
Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...
Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...astridwiswand
 
critical appraisal biomarker adn diagnosis appendicitis
critical appraisal biomarker adn diagnosis appendicitiscritical appraisal biomarker adn diagnosis appendicitis
critical appraisal biomarker adn diagnosis appendicitisssuser34c25f1
 
Pemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra Biomedis
Pemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra BiomedisPemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra Biomedis
Pemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra BiomedisSetiawan Hadi
 
Clustering kualitas-beras-dengan-k-means
Clustering kualitas-beras-dengan-k-meansClustering kualitas-beras-dengan-k-means
Clustering kualitas-beras-dengan-k-meansichal palawa
 
Kaedah penyelidikan rekabentuk kajian korelasi
Kaedah penyelidikan rekabentuk kajian korelasiKaedah penyelidikan rekabentuk kajian korelasi
Kaedah penyelidikan rekabentuk kajian korelasiSITIAISYAHMOHDAKAHSA
 
Publication oportunity for medicinal research.pptx
Publication oportunity for medicinal research.pptxPublication oportunity for medicinal research.pptx
Publication oportunity for medicinal research.pptxakrom5787
 
Bab i metlit eva a
Bab i metlit eva aBab i metlit eva a
Bab i metlit eva aEvaArfi
 
Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.
Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.
Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.Maryo Flo Rap
 
Metode penelitian 5+6
Metode penelitian 5+6Metode penelitian 5+6
Metode penelitian 5+6anugrahwati
 
Tugas Akhir statistika Trisana Murti
Tugas Akhir statistika Trisana MurtiTugas Akhir statistika Trisana Murti
Tugas Akhir statistika Trisana MurtiTrisanaMurti
 
22031063-elisa aulia-tugas terstruktur topik 2.pdf
22031063-elisa aulia-tugas terstruktur topik 2.pdf22031063-elisa aulia-tugas terstruktur topik 2.pdf
22031063-elisa aulia-tugas terstruktur topik 2.pdfImeldaYanti4
 
Analisis+Kuantitatif.pdf
Analisis+Kuantitatif.pdfAnalisis+Kuantitatif.pdf
Analisis+Kuantitatif.pdfRuriAlca
 
ANALISA DATA PENELITIAN.ppt
ANALISA DATA PENELITIAN.pptANALISA DATA PENELITIAN.ppt
ANALISA DATA PENELITIAN.pptNurulLaili25
 

Similar to [PPT] Final Project Data Mining A (Maila 06211540000120) (20)

Populasi dan sampel
Populasi dan sampelPopulasi dan sampel
Populasi dan sampel
 
Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...
Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...
Analisis Klasifikasi pada Data Breast Cancer Coimbra Menggunakan Metode Machi...
 
critical appraisal biomarker adn diagnosis appendicitis
critical appraisal biomarker adn diagnosis appendicitiscritical appraisal biomarker adn diagnosis appendicitis
critical appraisal biomarker adn diagnosis appendicitis
 
Pemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra Biomedis
Pemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra BiomedisPemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra Biomedis
Pemanfaatan Dewa Framework untuk Deteksi Dini Kanker Kulit pada CItra Biomedis
 
2007 2-00543 bab 3
2007 2-00543 bab 32007 2-00543 bab 3
2007 2-00543 bab 3
 
Clustering kualitas-beras-dengan-k-means
Clustering kualitas-beras-dengan-k-meansClustering kualitas-beras-dengan-k-means
Clustering kualitas-beras-dengan-k-means
 
Jurnal ERICK 2014
Jurnal ERICK 2014Jurnal ERICK 2014
Jurnal ERICK 2014
 
Kaedah penyelidikan rekabentuk kajian korelasi
Kaedah penyelidikan rekabentuk kajian korelasiKaedah penyelidikan rekabentuk kajian korelasi
Kaedah penyelidikan rekabentuk kajian korelasi
 
Publication oportunity for medicinal research.pptx
Publication oportunity for medicinal research.pptxPublication oportunity for medicinal research.pptx
Publication oportunity for medicinal research.pptx
 
Skripsi
SkripsiSkripsi
Skripsi
 
Bab i metlit eva a
Bab i metlit eva aBab i metlit eva a
Bab i metlit eva a
 
Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.
Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.
Hubungan Umur Dengan Kejadian Kanker Payudara di RSUD Labuang Baji Makassar”.
 
Metode penelitian 5+6
Metode penelitian 5+6Metode penelitian 5+6
Metode penelitian 5+6
 
Bab i
Bab iBab i
Bab i
 
Analisis data dan interpretasi 2
Analisis data dan interpretasi 2Analisis data dan interpretasi 2
Analisis data dan interpretasi 2
 
Analisis+kuantitatif
Analisis+kuantitatifAnalisis+kuantitatif
Analisis+kuantitatif
 
Tugas Akhir statistika Trisana Murti
Tugas Akhir statistika Trisana MurtiTugas Akhir statistika Trisana Murti
Tugas Akhir statistika Trisana Murti
 
22031063-elisa aulia-tugas terstruktur topik 2.pdf
22031063-elisa aulia-tugas terstruktur topik 2.pdf22031063-elisa aulia-tugas terstruktur topik 2.pdf
22031063-elisa aulia-tugas terstruktur topik 2.pdf
 
Analisis+Kuantitatif.pdf
Analisis+Kuantitatif.pdfAnalisis+Kuantitatif.pdf
Analisis+Kuantitatif.pdf
 
ANALISA DATA PENELITIAN.ppt
ANALISA DATA PENELITIAN.pptANALISA DATA PENELITIAN.ppt
ANALISA DATA PENELITIAN.ppt
 

Recently uploaded

Contoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxContoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxIvvatulAini
 
Bioteknologi Konvensional dan Modern kelas 9 SMP
Bioteknologi Konvensional dan Modern  kelas 9 SMPBioteknologi Konvensional dan Modern  kelas 9 SMP
Bioteknologi Konvensional dan Modern kelas 9 SMPNiPutuDewikAgustina
 
Prov.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdf
Prov.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdfProv.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdf
Prov.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdfIwanSumantri7
 
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdfAndiCoc
 
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfAndiCoc
 
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
Laporan RHK PMM Observasi Target Perilaku.docx
Laporan RHK PMM Observasi Target Perilaku.docxLaporan RHK PMM Observasi Target Perilaku.docx
Laporan RHK PMM Observasi Target Perilaku.docxJajang Sulaeman
 
Aksi Nyata profil pelajar pancasila.pptx
Aksi Nyata profil pelajar pancasila.pptxAksi Nyata profil pelajar pancasila.pptx
Aksi Nyata profil pelajar pancasila.pptxTekiMulyani
 
Webinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdf
Webinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdfWebinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdf
Webinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdfTeukuEriSyahputra
 
Materi Modul 1.4_Fitriani Program guru penggerak
Materi Modul 1.4_Fitriani Program guru penggerakMateri Modul 1.4_Fitriani Program guru penggerak
Materi Modul 1.4_Fitriani Program guru penggerakAjiFauzi8
 
BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024
BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024
BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024ssuser0bf64e
 
Program Kerja Public Relations - Perencanaan
Program Kerja Public Relations - PerencanaanProgram Kerja Public Relations - Perencanaan
Program Kerja Public Relations - PerencanaanAdePutraTunggali
 
Penyuluhan DM Tipe II Kegiatan Prolanis.ppt
Penyuluhan DM Tipe II Kegiatan Prolanis.pptPenyuluhan DM Tipe II Kegiatan Prolanis.ppt
Penyuluhan DM Tipe II Kegiatan Prolanis.pptpalagoro17
 
Skenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru PenggerakSkenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru Penggerakputus34
 
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxcontoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxdedyfirgiawan
 
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...luqmanhakimkhairudin
 
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdfSurat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdfEirinELS
 
sistem digesti dan ekskresi pada unggas ppt
sistem digesti dan ekskresi pada unggas pptsistem digesti dan ekskresi pada unggas ppt
sistem digesti dan ekskresi pada unggas ppthidayatn24
 
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docxKISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docxDewiUmbar
 
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMASBAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMASNursKitchen
 

Recently uploaded (20)

Contoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxContoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptx
 
Bioteknologi Konvensional dan Modern kelas 9 SMP
Bioteknologi Konvensional dan Modern  kelas 9 SMPBioteknologi Konvensional dan Modern  kelas 9 SMP
Bioteknologi Konvensional dan Modern kelas 9 SMP
 
Prov.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdf
Prov.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdfProv.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdf
Prov.Jabar_1504_Pengumuman Seleksi Tahap 2_CGP A11 (2).pdf
 
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
 
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
 
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
 
Laporan RHK PMM Observasi Target Perilaku.docx
Laporan RHK PMM Observasi Target Perilaku.docxLaporan RHK PMM Observasi Target Perilaku.docx
Laporan RHK PMM Observasi Target Perilaku.docx
 
Aksi Nyata profil pelajar pancasila.pptx
Aksi Nyata profil pelajar pancasila.pptxAksi Nyata profil pelajar pancasila.pptx
Aksi Nyata profil pelajar pancasila.pptx
 
Webinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdf
Webinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdfWebinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdf
Webinar 1_Pendidikan Berjenjang Pendidikan Inklusif.pdf
 
Materi Modul 1.4_Fitriani Program guru penggerak
Materi Modul 1.4_Fitriani Program guru penggerakMateri Modul 1.4_Fitriani Program guru penggerak
Materi Modul 1.4_Fitriani Program guru penggerak
 
BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024
BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024
BAHAN PAPARAN UU DESA NOMOR 3 TAHUN 2024
 
Program Kerja Public Relations - Perencanaan
Program Kerja Public Relations - PerencanaanProgram Kerja Public Relations - Perencanaan
Program Kerja Public Relations - Perencanaan
 
Penyuluhan DM Tipe II Kegiatan Prolanis.ppt
Penyuluhan DM Tipe II Kegiatan Prolanis.pptPenyuluhan DM Tipe II Kegiatan Prolanis.ppt
Penyuluhan DM Tipe II Kegiatan Prolanis.ppt
 
Skenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru PenggerakSkenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru Penggerak
 
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxcontoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
 
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
 
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdfSurat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdf
 
sistem digesti dan ekskresi pada unggas ppt
sistem digesti dan ekskresi pada unggas pptsistem digesti dan ekskresi pada unggas ppt
sistem digesti dan ekskresi pada unggas ppt
 
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docxKISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
 
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMASBAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
 

[PPT] Final Project Data Mining A (Maila 06211540000120)

  • 1. Perbandingan Nilai Akurasi Algoritma Klasifikasi Data Mining pada Mammographic Mass Dataset UCI Machine Learning Maila S. Baladina 06211540000120 Dosen : Novri Suhermi, S.Si., M.Sc. Dr. Dra. Kartika Fithriarsari, M.Si.
  • 4. Pendahuluan 40.290 440 Tahun 2 0 1 5 meninggal karena penyakit kanker payudara MAMOGRAFI  salah satu metode yang paling efek tif digunakan untuk mendeteksi jenis kanker payudara Umur Bentuk Gumpalan Garis Tepi Gumpalan BI-RADS Tingkat Keparahan Kepadatan Gumpalan Dicari nilai akurasi terbaik dalam memprediksi tingkat keparahan menggunakan metode algoritma klasifikasi data mining
  • 6. SUMBER DAN VARIABEL PENELITIAN diambil dari UCI Machine Learning Repository Mammographic Mass Data Set diunduh  hari Selasa 04 Desember 2018 Data Sekunder BI-RADS assessment Umur Bentuk Gumpalan Garis Pinggir Gumpalan Kepadatan Gumpalan Tingkat Keparahan Variabel Penelitian
  • 7. lima Manarik kesimpulan dan saran tiga Melakukan preprocessing data kemudian mengeksplor dan melihat karakteristik data satu Mengumpulkan dan merapikan data sekunder Menginstal package dan mengimport dataset ke dalam Jupiter Notebook dua Menghitung nilai akurasi menggunakan algoritma klasifikasi data mining (Knn, SVM, random forest, naive bayes, dan regresi logistik yang kemudian diperoleh metode klasifikasi terbaik empat LANGKAH ANALISIS
  • 8. BAB 3 ANALISIS DAN PEMBAHASAN
  • 9. Prepocessing Data Add Text Simple PowerPoint Variabel Persentase Missing value BI-RADS assessment 0,2% Age 0,5% Shape 3,2% Margin 4,5% Density 7,9% Severity 0% Variabel Imputasi Persentase Missing value Setelah Imputasi BI-RADS assessment Modus = 4 0% Age Median = 57 0% Shape Modus = 4 0% Margin Modus =1 0% Density Modus =3 0% Semua variabel memiliki missing value kecuali variabel severity IMPUTASI MISSING VALUE Variabel numerik  nilai median Variabel kategorik  nilai modus
  • 11. Algoritma Klasifikasi Metode Holdout Metode Klasifikasi Akurasi Sensitivity Specificity k-Nearest Neighbor 80,97% 84,81% 76,34% Support Vector Machine 83,05% 86,08% 76,34% Random Forest 79,58% 83,54% 74,81% Naive Bayes 80,97% 82,91% 78,63% Regresi Logistik 83,74% 83,54% 83,97% kemampuan pendeteksian gumpalan kanker payudara menggunakan mammografi untuk memberikan hasil negatif bagi mereka yang tidak menderita penyakit kanker payudara Akurasi 83,74% Sensitivitas 83,74% Spesifitas 83,97% kemampuan pendeteksi gumpalan kanker payudara secara dini menggunakan mammografi untuk memberikan hasil positif bagi mereka yang menderita kanker payudara ketepatan atau kebenaran mammographic dalam menskrining gumpalan
  • 12. Algoritma Klasifikasi Metode Cross Validation k-Nearest Neighbor Support Vector Machine Random Forest Naive Bayes Regresi Logistik 80,02% 81,06% 79,09% 80,03% 81,27%
  • 13. 13 Satu untuk memperoleh nilai akurasi yang tinggi dengan tu juan ingin mengetahui seberapa akuratnya pendeteks ian gumpalan kanker payudara menggunakan mamm ografik langkah awalnya adalah dengan melakukan pr eprocessing data yang meliputi deteksi dan imputasi missing value, sebagaimana diketahui dari semua vari abel yang digunakan kecuali variabel tingkat keparaha n (severity) semuanya memiliki data yang missing sehi ngga dapat diatas dengan imputasi nilai modus untuk variabel BI-RADS assessment, shape, margin, dan den sity. Sedangkan untuk variabel age diimputasi dengan nilai median Kesimpulan Dua dilakukan eksplorasi data guna mengetahui hubungan a ntar variabel, pencilan data, distribusi dan sebaran data , serta ranking kepentingan variabel berdasarkan nilai e ntropy. Kemudian yang terakhir adalah menghitung nil ai akurasi dengan beberapa metode klasifikasi melalui c ara holdout dan k-fold cross validation. Pada pengguna an cara holdout maupun cross validation diperoleh met ode klasifikasi terbaik yaitu dengan metode klasifikasi r egresi logistik dimana masing-masing secara urut diper oleh sebesar 83,74 persen dan 81,27 persen, nilai akur asi tersebut yang berarti bahwa kemampuan mammog raphic untuk mendeteksi gumpalan kanker payudara se cara benar seluruh subjek yang diuji yaitu sebesar 83,7 4 persen jika menggunakan cara holdout dan 81,27 per sen jika menggunakan cara k-fold cross validation.
  • 14. SaranSebaiknya data yang digunakan lebih banyak agar dapat dianalisis lebih dalam, se perti misalnya jika variabel yang digunakan semakin banyak maka dapat dilakuka n feature engeenering yang sekiranya dapat menaikkan nilai akurasi dalam ketep atan klasifikasi model. Selain itu sebaiknya peneliti lebih berhati-hati dalam meng hitung nilai akurasi karena jika nilai akurasi yang diperoleh kurang tepat maka has il analisis dalam memprediksi model menjadi kurang representatif. 14