Tugas ini menganalisis data mahasiswa menggunakan logistik regresi, Naive Bayes, C4.5, dan K-NN untuk memprediksi kelulusan tepat waktu. C4.5 memiliki akurasi tertinggi pada tahap eksperimen sedangkan logistik regresi pada tahap prediksi.
Jual Obat Cytotec Di Palembang 0823.2222.3014 Pusat Pelancar Haid Ampuh Berga...
ANALISIS DATA MENGGUNAKAN NEURAL NETWORK
1. TUGAS INDIVIDU DATA MINING
ANALISIS DATA DENGAN MENGGUNAKAN LOGISTIK REGRESSION, NAÏVE
BAYES, C4.5 DAN K-NN
N.P.M : P31.2013.01533
NAMA : MOH. EFENDI LASULIKA
ANGKATAN / KELAS : GORONTALO XXIIV /REGULER
MATA KULIAH : DATA MINING
UNIVERSITAS DIAN NUSWANTORO
PROGRAM PASCASARJANA
MAGISTER TEKNIK INFORMATIKA
SEMARANG
2013
2. Analisis Data dengan menggunakan Logistik regression, Naïve Bayes, C4.5 dan K-NN
A. Deskripsi Data
Sebuah Dataset Mahasiswa dengan Deskripsi antara lain Umur (usia), Indeks Prestasi
Semester 1, Indeks Prestasi Semester 2, Indeks Prestasi Semester 3, indeks Prestasi
Semester 4, dan Performance tentang kelulusan tepat waktu dan tidak
B. Eksperimen
Dalam eksperimen ini dengan menggukan tool rapidminri maka telah didapatkan
informasi sebagai berikut :
Tabel 1.1 Eksperimen, K-Fold=10
Logistic
Regression
Naïve Bayes C4.5 K-NN
Accuracy 86.00% 89.00% 91.00% 82.00%
AUC 0.942 0.917 0.852 0.500
Precision 88.24% 83.72% 89.74% 77.50%
Recall 75.00% 90.00% 87.50% 77.50%
MSE
C. Perbandingan
Setelah melakukan eksperimen dengan beberapa model tersebut di atas maka hasilnya
adalah sebagai berikut :
Tabel 1.2, C4.5 sebagai Model Terbaik
Logistic
Regression
Naïve Bayes C4.5 K-NN
Accuracy 86.00% 89.00% 91.00% 82.00%
AUC 0.942 0.917 0.852 0.500
Precision 88.24% 83.72% 89.74% 77.50%
Recall 75.00% 90.00% 87.50% 77.50%
MSE
Dari hasil perbandingan pada tabel 1.2 dengan menggunakan K-Fold = 10 maka
didapatkan C.45 sebagai model terbaik dengan nilai accuracy sebesar 91.00 %.
3. D. Prediksi, dalam melakukan prediksi kali ini adalah jumlah data keseluruhan adalah 100
record ,dengan data testing 10 record dan 90 record sebagai data training.
Gambar 1.2 Model Data Training
Gambar 1.3 Model Data Testing
4. Tabel 1.3 Hasil Prediksi, K-Fold=10,
Logistic
Regression
Naïve Bayes C4.5 K-NN
Accuracy 90.00% 90.00% 82.00% 88.00%
AUC 1.000 0.996 0.812 0.500
Precision 83.33% 83.33% 82.35% 82.76%
Recall 100.00% 100.00% 84.00% 96.00%
MSE
Dari hasil prediksi yang ada pada gambar 1.3 di dapatkan logistic regression adalah yang
terbaik dengan tingkat accuracy sebesar 90.00 %, AUC 1.000.
E. Kesimpulan
Setelah melakukan eksperimen maka perbandingan untuk model yang terbaik adalah
sebagai berikut
Tabel 1.4. Hasil Eksperimen
Hasil Eksperimen
Model terbaik Prediction
C4.5 Logistic Regression
Accuracy 91.00% 90.00%
AUC 0.852 1.000
Precision 89.74% 83.33%
Recall 87.50% 100.00%
MSE
Dari hasil eksperimen didapatkan model terbaik adalah menggunakan C.45 dengan
accuracy 91.00 %, sedangkan untuk prediksinya yaitu menggunakan Logistic regression dengan
K-fold = 10 didapatkan accuracy 90.00 %