Dokumen ini membahas analisis diskriminan untuk membedakan dua jenis bunga (A dan B) berdasarkan tiga variabel (lebar kelopak, lebar daun, dan sensitivitas pH). Dilakukan pengukuran pada 10 sampel setiap jenis bunga, kemudian data dianalisis menggunakan analisis diskriminan linier untuk membedakan kedua kelompok. Disediakan contoh soal untuk melakukan analisis diskriminan pada data karakteristik bunga terse
2. Anggota
Afika Choirrun Nisa
Alvi Nur Laily
Inas Labibah Asahy
Lego Sekar Sari
M. Yogie Pratama Putra
Muh Faishal Nur Kamal
Risnawati
Sepliana Nur Santi
Susanti Eka Rahayu
2
3. Konten
Definisi
Fungsi Diskriminan Linier
Asumsi Model Diskriminan
Estimasi Model Diskriminan
Cutting Score dan Prior Probability
Skor diskriminan
Misclassification
Matriks confusion
Statistik APER
Contoh Soal
3
4. Definisi
Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan
pada hubungan dependensi (hubungan antar variabel dimana sudah bisa
dibedakan mana variabel respons dan variabel penjelas).
Atau lebih jelasnya variabel responsnya berupa data kategorik, dan variabel
penjelasnya berupa data nonkategorik.
4
5. Tujuan
1. Membuat suatu fungsi diskriminan atau kombinasi linier dari prediktor atau
variabel bebas yang bisa membedakan kategori variabel tak bebas.
2. Menentukan variabel bebas yang mana yang memberikan sumbangan
terbesar terhadap terjadinya perbedaan antar kelompok.
3. Membuat prosedur untuk mengklasifikasi objek (individu, perusahaan,
produk, dan sebagainya) ke dalam kelompok atas dasar nilai mereka di
set independent variables.
5
6. Asumsi Analisis Diskriminan
Variabel bebas berdistribusi normal
Matriks varians kovarians sama untuk semua variabel bebas.
Tidak terjadi multikolinieritas antar variable bebas.
Tidak terdapat data ekstrem (outlier).
6
7. Fungsi Diskriminan Linier Fisher
Fungsi diskriminan linier didefinisikan sebagai:
dan a′ = (Χ1 − Χ2)′𝑆−1
Yjk = a1 X1k + a2 X2k + ...... + an Xnk
Dimana:
Yjk = diskriminan Z score dalam fungsi discriminan j untuk objek k yang
kemudian di-dummy-kan
ai = discriminan weight untuk variabel independen i
Xjk = Variabel pembeda i untuk objek k
7
8. Estimasi Model Diskriminan
Pada prinsipnya terdapat dua metode dasar untuk membuat fungsi
diskriminan, yakni:
Simultaneus estimation, semua variabel independen dimasukkan secara
bersama-sama kemudian dilakukan proses diskriminan.
Stepwise estimation, variabel independen dimasukkan satu per satu ke
dalam model diskriminan. Pada proses ini akan ada variabel yang tetap ada
dalam model dan ada variabel yang dibuang dari model.
8
9. Aturan Klasifikasi
Aturan pengelompokkan pada analisis Diskriminan:
1. Cutting Score
2. Prior Probability (untuk meminumkan misklasifikasi)
3. Memininumkan biaya misklasifikasi
4. Jarak Mahalanobis (Mahalanobis Distant)
9
12. Prior Probability
Prior probability adalah peluang suatu observasi untuk masuk dalam suatu
kelompok sebelum data terkumpul. Jika suatu observasi tidak diketahui nilai
prior probability-nya maka nilai 𝑝𝑖 antar kelompok dikatakan sama.
Contoh:
Suatu observasi diketahui memiliki persentase jenis kelamin wanita (𝜋2)
sebesar 60% dari populasi, maka prior probability jenis kelamin wanita (𝑝2)
adalah sebesar 0,6.
Prior probability (𝑝𝑖) digunakan dalam metode untuk meminumkan
misklasifikasi.
12
13. Skor Diskriminan
Skor diskriminan juga dikenal sebagai nilai Z. Nilai Z Skor dapat dihitung
untuk setiap objek.
Perbandingan kelompok berarti pada Z skor menyediakan satu ukuran
diskriminan antar kelompok atau menentukan cutting score.
13
14. Misclassification
Misclasification atau misklasifikasi adalah kesalahan dalam pengklasifikasian
P(1|2) adalah peluang suatu observasi dari 𝜋2 yang misklasifikasi sebagai 𝜋1
P(2|1) adalah peluang suatu observasi dari 𝜋1 yang misklasifikasi sebagai 𝜋2
14
15. Misclassification (2)
Total Probability Misclassification (TPM)
Nilai minimum dari TPM disebut OER (Optimum Error Rate).
Biaya dari misklasifikasi dapat dilihat dalam matriks biaya:
Expected Cost of Misclassification (ECM)
ECM = c(2|1)P(2|1) 𝒑 𝟏+ c(1|2)P(1|2) 𝒑 𝟐
15
16. Statistik APER
Ada sebuah ukuran yang tidak bergantung pada bentuk populasi induk dan
bisa dihitung untuk berbagai prosedur klasifikasi. Ukuran ini disebut apparent
error rate (APER)
APER adalah pembagian dari observasi yang misklasifkasi dari fungsi
klasifikasi sampel.
APER bisa dihitung dari matriks confusion yang menunjukkan nilai asli
dibandingkan dengan keanggotaan dari kelompok yang diprediksi.
16
18. APER
Dari matriks confusion, dapat dihitung satistik APER
Statistik APER ini dikenal sebagai proporsi dari item data yang misklasifikasi
18
19. Contoh
Berikut ini merupakan matriks confusion yang dibentuk dari contoh riding-
mower data
APER yang didapat sebesar 16.7 persen yang artinya ketidaktepatan
klasifikasi sebesar 16.7%. Sementara ketepatan klasifikasi disebut Hit Ratio
sebesar (1-APER)= (1-0.167)x100%= 83.3%
19
20. Contoh Soal
Di sebuah laboratorium dilakukan penelitian untuk mengetahui apa saja yang
membedakan bunga A dan bunga B yang masih satu species. Untuk itu,
diambil sampel bunga A dan B masing-masing sebanyak 10 buah. Kedua
bunga dihitung lebar kelopaknya (X1)dan lebar daunnya (X2). Diketahui juga
bahwa kedua bunga dapat dijadikan indikator derajat keasaman suatu zat
(pH), maka diteliti juga pada trayek pH berapa saja kedua bunga sensitif
untuk mendeteksinya(X3). Data yang telah diperoleh akan dianalisis dengan
menggunakan analisis diskriminan.
20
22. Contoh Soal (3)
1. Pada menu Analyze, pilih submenu Classify, lalu pilih Discriminant
22
23. Contoh Soal (4)
2. Kotak dialog Discriminant Analysis, pindahkan y ke dalam Grouping Variable, lalu klik
Define Range, bagian minimum diisi dengan kode terkecil dan maximum diisi dengan
kode terbesar dari variabel respon. Lalu pindahkan x1, x2, dan x3 ke Independents.
Pilih Use stepwise method.
23
24. Contoh Soal (5)
3. Pilih dan klik Statistics. Centang pada kotak Means, Univariate ANOVA’s, Box’s M,
serta Unstandardized. Pada Matrices, pilih Within-groups correlation. Lalu, klik
Continue.
24
25. Contoh Soal (6)
4. Kembali ke kotak dialog Discriminant Analysis, lalu pada Classification, lalu diberi
tanda cek di All group equal, Casewise result, Summary table, dan Within-groups. Lalu,
klik Continue.
25
26. Contoh Soal (7)
Hasil Output
Test Results
Box's M 59.825
F
Approx. 17.558
df1 3
df2 58320.000
Sig. .000
Tests null hypothesis of equal
population covariance matrices.
Skewness And Kurtosis Test
Nama Item Nilai
Variabel V1 , V2 , V3
Skewness Hitung 7.541
Skewness Tabel ( 5 % ) 7.815
Signifikansi Skewness 0.057
Kurtosis Hitung 1.005
Kurtosis Tabel ( 5 % ) 1.96
Signifikansi Kurtosis 0.157
Statistik uji Skewness, pada alpha sebesar 5% Statistik uji Kurtosis
,pada alpha sebesar 5% menyatakan data-data tersebut berdistribusi
Multivariate Normal Distribution
26