Perbandingan Klasifikasi Data NBA Rookies dengan Menggunakan Decision Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression
Klasifikasi Data NBA rookie dengan hold out dan cross validation. Klasifikasi ini disertai dengan hyperparameter tuning dan dipilih berdasarkan akurasi terbaik.
Perbandingan Klasifikasi Data NBA Rookies dengan Menggunakan Decision Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression
1. Oleh:
Fraschiska Rizky R
06211540000022
Dosen Pengampu:
Dr. Dra. Kartika Fithriasari, M.Si
Novri Suhermi, S.Si, M.Sc
Kelas Data Mining A
2018
Perbandingan Klasifikasi Data NBA Rookies dengan Menggunakan Decision
Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer
Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression
1
4. 4
NBA Rookie
“Basket tidak hanya bersifat
sebagai sebuah permainan biasa,
akan tetapi berubah menjadi
sebuah permainan profesional “
Statistik pemain dalam setiap
pertandingan sangat penting
Klasifikasi Pemain NBA Rookie
dengan Decision Tree, Random Forest, Gradient
Boosting, Adaptive Boosting, Multilayer
Perceptron, K-Nearest Neighbor, Naive Bayes
dan Logistic Regression
6. 6
Data sekunder : Data NBA Rookies sebanyak 1340
data yang diperoleh dari Data World diakses
tanggal 5 Desember 2018 pukul 19.00. Data terdiri
dari dua kelas dengan kelas 0 berjumlah 509 data
dan kelas 1 berjumlah 831 data
Sumber Data
7. 7
VARIABEL PENELITIAN
No Variabel Keterangan Jenis Variabel
1. Nama Nama pemain rookie Independen
2. GP
Jumlah pertandingan yang telah dialami pemain dalam 1 musim
kompetisi
Independen
3. MIN Durasi waktu pemain bermain selama pertandingan. Independen
4. PTS Skor yang diperoleh untuk setiap kali bertanding Independen
5. FGM Poin yang dicetak pemain selama pertandingan Independen
6. FGA Peluang dalam mencetak poin selama pertandingan Independen
7. FG%
Persentase keberhasilan seorang pemain untuk mencetak poin
selama pertandingan
Independen
8. 3P Made
Poin yang dicetak pemain melalui tembakan 3 angka selama
pertandingan
Independen
9. 3PA
Peluang dalam mencetak poin melalui tembakan 3 angka selama
pertandingan
Independen
10. 3P%
Persentase keberhasilan seorang pemain untuk mencetak poin
melalui tembakan 3 angka selama pertandingan
Independen
11. FTM
Tembakan bebas atau tembakan hukuman yang dapat dieskekusi
pemain selama pertandingan
Independen
12. FTA
Peluang seorang pemain mengeksekusi tembakan bebas atau
tembakan hukuman selama pertandingan
Independen
8. 8
VARIABEL PENELITIAN
No Variabel Keterangan Jenis Variabel
13. FT%
Persentase keberhasilan seorang pemain dalam mengeksekusi
tembakan bebas atau tembakan hukuman selama pertandingan
Independen
14. OREB
Perolehan bola netral atau bola mentah
hasil tembakan tim serang pada saat
posisi menyerang selama pertandingan
Independen
15. DREB
Perolehan bola netral atau bola mentah
hasil tembakan tim serang pada saat
posisi menyerang selama pertandingan
Independen
16. REB
Jumlah perolehan bola netral atau bola mentah
selama pertandingan
Independen
17. AST
Hasil passing atau operan bola yang membuahkan poin dalam
pertandingan
Independen
18. STL Pencurian bola dari tangan tim lawan dalam pertandingan Independen
19. BLK
Hasil menggagalkan tembakan pemain dari tim lawan dalam
pertandingan
Independen
20. TOV Kesalahan yang dilakukan pemain selama pertandingan Independen
21. TARGET_5Yrs
Karir pemain rookie
0 : karir kurang dari 5 tahun
1 : karir lebih dari atau sama dengan 5 tahun
Dependen
23. 23
Kesimpulan
• Terdapat missing value pada variabel 3P%
• Terdapat data duplikat sebanyak 12 data
• Jumlah variabel yang banyak perlu dilakukan feature selection
• Hasil eksplorasi menunjukkan masih terdapat data berkorelasi tinggi maka
perlu dilakukan PCA
• Sebaran data tidak normal sehingga perlu dilakukan normalisasi
• Klasifikasi data NBA rookies dengan metode Hold Out dan Cross Validation
menghasilkan akurasi tertinggi pada metode klasifikasi Logistic Regression
24. 24
Saran
Pada penelitian selanjutnya perlu dilakukan penelitian
lebih lanjut mengenai penyebab akurasi yang tidak terlalu
tinggi pada hasil klasifikasi, baik dari cara memanajemen
data, pre-processing data ataupun faktor-faktor lain yang
mempengaruhi sehingga diperoleh hasil klasifikasi yang
semakin baik