5. G OALS
ONE
SECOND
THIRD
5Departemen Statistika 2018
TUJUAN PENELITIAN
Hasil Klasifikasi dengan Metode
Machine Learning
Deskripsi Data Autism Screening
Adult
Hasil Ketepatan Klasifikasi dengan
Metode Machine Learning
6. Departemen Statistika 2018 6
MANFAAT PENELITIAN
Sebagai referensi penelitian selanjutnya terkait analisis
klasifikasi pada Autism Screening Adult.
1
Memberikan informasi tambahan kepada publik mengenai
Autism Screening Adult.
2
8. Departemen Statistika 2018 8
Data yang digunakan dalam penelitian ini adalah data Autism
Screening Adult. Data tersebut merupakan data sekunder
yang diunduh dari website UCI Machine Learning pada
tanggal 4 Desember 2018.
SUMBER DATA
9. Variabel yang digunakan dalam penelitian ini adalah
Variabel Respon, yaitu CLass Autism Screening Adult dan
18 Variabel Prediktor.
Departemen Statistika 2018 9
VARIABEL PENELITIAN Variabel Skala
A1_Score Katagorik
A2_Score Katagorik
A3_Score Katagorik
A4_Score Katagorik
A5_Score Katagorik
A6_Score Katagorik
A7_Score Katagorik
A8_Score Katagorik
A9_Score Katagorik
A10_Score Katagorik
Age Numerik
Gender Katagorik
Ethnicity Katagorik
Jaundice Katagorik
Autism Katagorik
Country of Residence Katagorik
Used App Before Katagorik
Relation Katagorik
Class Katagorik
10. Departemen Statistika 2018
Mulai
Merumuskan Masalah
Pre-processing Data
Mendeskripsikan Data
Feature Engineering
Feature Selection
Melakukan Klasifikasi
Cross-Validation
Feature Importances
Kesimpulan
LANGKAH
ANALISIS
10
11. ANALISIS &
PEMBAHASAN
11Departemen Statistika 2018
FEATURE
IMPORTANCES
HASIL AKHIR
PRE-PROCESSING
DATA
KARAKTERISTIK
DATA
FEATURE
ENGINEERING
FEATURE
SELECTION
CROSS
VALIDATION
KLASIFIKASI
12. Departemen Statistika 2018 12
PRE-PROCESSING
DATA
Variabel Jumlah
A1_Score 0
A2_Score 0
A3_Score 0
A4_Score 0
A5_Score 0
A6_Score 0
A7_Score 0
A8_Score 0
A9_Score 0
A10_Score 0
Age 2
Gender 0
Ethnicity 95
Jaundice 0
Autism 0
Country of Res 0
Used App Before 0
Relation 95
Class 0
Mean
Modus
Missing Value
Imputasi
19. Departemen Statistika 2018 19
FEATURE
ENGINEERING
datakategori =
['Gender','Ethnicity','Jaundice','Autism','Country_of_Res','Used_App_Before',
'Relation','Class']
for feature in datakategori:
if feature in data.columns.values:
data[feature] = LabelEncoder().fit_transform(data[feature])
20. Departemen Statistika 2018 20
FEATURE SELECTION
No Variabel Score
8 A9_Score 192.2833
5 A6_Score 176.6881
4 A5_Score 101.7959
3 A4_Score 78.40121
2 A3_Score 74.31658
6 A7_Score 50.63585
9 A10_Score 44.6796
10 Age 39.02296
1 A2_Score 37.32905
12 Ethnicity 34.0818
No Variabel Score
14 Autism 19.29479
0 A1_Score 17.36211
7 A8_Score 13.89255
13 Jaundice 6.626188
11 Gender 2.177226
15
Country of
Residence
1.695038
16
Used App
Before
1.342018
17 Relation 0.013827
Tetap digunakan semua variabel karena masih
diduga berpengaruh signifikan
29. Departemen Statistika 2018 29
Metode terbaik untuk mengklasifikasikan Autism Screening Adult adalah
metode Adaptive Boosting dengan 10 variabel pertanyaan perilaku
dewasa saja baik secara biasa maupun dilakukan 10-cross validation
menghasilkan akurasi, presisi, dan recall sebesar 1 atau 100%
KESIMPULAN
30. Departemen Statistika 2018 30
Sebagai salah satu cara untuk mengklasifikasikan penyakit
autis pada penderita dewasa (>18 tahun) sebaiknya
mengeksplor variabel lebih banyak agar hasil penelitian lebih
valid dan sesuai dengan kondisi sebenarnya.
SARAN