11. MODEL “MULTIPLE DISCRIMINANT ANALYSIS” (MDA)
Reference: Asumsi dan Contoh Analisis Diskriminan - Belajar SPSS (11 Junli 2012), dan
ripa_fajarina in Statistik MultiVariat (9 Sep 2013)
Model Pengukuran Score Financial Distress (Contoh: Edward Althman, 1968)
Prof. Dr. Dr. H. Aminullah Assagaf, SE., MS., MM., M.Ak
Email: assagaf29@yahoo.com
HP. : +618113543409
12. Analisis Diskriminan
Analisis diskriminana hakekatnya adalah teknik untuk menganalisis data penelitian jika kriteria atau
variabel terikatnya bersifat kategorik dan prediktor atau variabel bebasnya bersifat data interval. Istilah
variabel kategori berarti variabel dependen dibagi menjadi beberapa kategori. Misalnya, tiga merek
komputer, Komputer A, Komputer B dan Komputer C dapat menjadi variabel dependen kategoris.
Tujuan dari analisis diskriminan adalah untuk mengembangkan fungsi diskriminan yang tidak lain
adalah kombinasi linier dari variabel independen yang akan membedakan kategori variabel dependen
secara sempurna. Ini memungkinkan peneliti untuk menguji apakah ada perbedaan yang signifikan di
antara kelompok, dalam hal variabel prediktor. Penjelasan ini juga mengevaluasi keakuratan
klasifikasi.
13. Pengertian Analisis Diskriminan
Analisis diskriminan adalah teknik statistik dan statistika yang dipergunakan untuk
mengklasifikasikan pengamatan ke dalam kelompok yang tidak tumpang tindih, hal ini
tentusaja dilihat berdasarkan skor pada satu atau lebih variabel prediktor dalam penelitian
kuantitatif.
Analisis diskriminan digambarkan dengan banyaknya kategori yang dimiliki oleh variabel
dependen. Seperti dalam statistik, semuanya diasumsikan hingga tak terhingga, sehingga dalam
hal ini bila variabel terikat memiliki dua kategori, maka jenis yang digunakan adalah analisis
diskriminan dua kelompok. Jika variabel terikat memiliki tiga atau lebih dari tiga kategori,
maka jenis yang digunakan adalah analisis diskriminan berganda.
Perbedaan utama jenis analisis diskriminan adalah bahwa untuk dua kelompok, dimungkinkan
untuk mendapatkan hanya satu fungsi diskriminan. Di sisi lain, dalam kasus analisis
diskriminan ganda, lebih dari satu fungsi diskriminan dapat dihitung.
14. Pengertian Analisis Diskriminan Menurut Para Ahli
1. Comprehensive Chemometrics, 2009, Analisis diskriminan adalah teknik
statistik yang digunakan untuk mengklasifikasikan data yang diamati menjadi
salah satu dari dua atau lebih kelompok yang ditentukan secara unik dan diskrit
menggunakan aturan alokasi.
2. D.J. Bartholomew, dalam International Encyclopedia of Education (Edisi
Ketiga), 2010, Definisi analisis diskriminan paling sederhana dianggap sebagai
analisis regresi ketika variabel yang akan diprediksi adalah biner. Misalkan
individu termasuk dalam salah satu dari dua kategori di mana kita dapat
menetapkan nilai 0 dan 1
15. Jenis Analisis Diskriminan
Dua Kelompok
Masalah umum penelitian melibatkan pengklasifikasian observasi menjadi salah satu dari dua kelompok,
berdasarkan dua atau lebih variabel prediktor kuantitatif. Ketika hanya ada dua kelompok klasifikasi, analisis
diskriminan sebenarnya hanyalah regresi berganda, dengan beberapa penyesuaian.
1. Variabel dependen adalah variabel dikotomis dan kategorik (yaitu, variabel kategori yang hanya dapat
mengambil dua nilai)
2. Variabel dependen dinyatakan sebagai variabel dummy (memiliki nilai 0 atau 1)
3. Pengamatan ditetapkan ke dalam kelompok, berdasarkan apakah skor prediksi mendekati 0 atau 1
4. Persamaan regresi disebut fungsi diskriminan
5. Kemanjuran fungsi diskriminan diukur dengan proporsi penugasan yang benar
Perbedaan terbesar antara analisis diskriminan dan analisis regresi standar adalah penggunaan variabel katering
sebagai variabel dependen. Selain itu, analisis diskriminan dua kelompok sama seperti analisis regresi berganda
standar.
16. Konsep Teori Analisis Diskriminan
Prinsip Dasar analisis diskriminan
Analisis diskriminan adalah bagian dari analisis statistik peubah ganda (multivariate statistical analysis) yang
bertujuan untuk memisahkan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk
fungsi diskriminan. Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan
dependensi (hubungan antar variabel dimana sudah bisa dibedakan mana variabel respon dan mana variabel
penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel respon berupa data
kualitatif dan variabel penjelas berupa data kuantitatif.
Menurut Johnson and Wichern (1982 : 470), tujuan dari analisis disriminan adalah untuk menggambarkan ciri-
ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis maupun aljabar
dengan membentuk fungsi diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk
mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih.
Jika dianalogikan dengan regresi linear, maka analisis diskriminan merupakan kebalikannya. pada regresi linear,
variabel respon yang harus mengikuti distribusi normal dan homoskedastis, sedangkan variabel penjelas
diasumsikan fixed, artinya variabel penjelas tidak disyaratkan mengikuti sebaran tertentu. untuk analisis
diskriminan, variabel penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi normal dan
homoskedastis sedangkan variabel responnya fixed.
17. Langkah-langkah kunci dalam analisis adalah;
1. Memperkirakan koefisien regresi
2. Menentukan persamaan regresi, yang merupakan fungsi diskriminan
3. Menilai kesesuaian persamaan regresi dengan data
4. Menilai kemampuan persamaan regresi untuk mengklasifikasikan
observasi dengan benar
5. Menilai kepentingan relatif variabel prediktor
18. Ganda
Regresi juga dapat digunakan dengan lebih dari dua kelompok klasifikasi, tetapi analisisnya lebih
rumit. Jika ada lebih dari dua kelompok, fungsi diskriminan juga lebih dari dua. Misalnya, kita
ingin mengklasifikasikan pemilih menjadi salah satu dari tiga kelompok politik-Demokrat,
Republik, atau Independen.
Dengan menggunakan analisis diskriminan dua kelompok, kita mungkin:
1. Menentukan satu fungsi diskriminan untuk mengklasifikasikan pemilih sebagai Demokrat
atau non-Demokrat
2. Menentukan fungsi diskriminan kedua untuk mengklasifikasikan non-Demokrat sebagai
Republikan atau Independen
Jumlah maksimum fungsi diskriminan akan sama dengan jumlah variabel prediktor atau jumlah
kategori kelompok dikurangi satu – mana yang lebih kecil.
Dengan analisis multi diskriminan, tujuannya adalah untuk mendefinisikan fungsi diskriminan
yang memaksimalkan perbedaan antar kelompok dan meminimalkan perbedaan dalam kelompok.
19. Cara Menghitung Analisis Diskriminan
Model umum analisis diskriminan adalah suatu kombinasi linear dengan bentuk sebagai
berikut:
Membentuk fungsi diskriminan yang optimal memebutuhkan beberapa asumsi terhadap
data yang digunakan. Asumsi tersebut antara lain yaitu:
1. Data pada variabel bebas seharusnya berdistribusi normal multivariat
2. Adanya kesamaan matriks varians-kovariansantar kelompok
20. Teknik Analisis Diskriminan Dapat Menjawab
1. Dalam karakteristik demografi, bagaimana membedakan pelanggan yang loyal atau tidak?
2. Apakah peminum berat, medium dan ringan dari soft drink berbeda bila dinyatakan dalam
konsumsi makanan beku
3. Karakteristik psikografik, membedakan atau mendikriminasi pembeli di swalayan yang sensitive
terhadap harga dan yg tidak?
4. Aapakah diberbagai segmen pasar berbeda dalam kebiasaan menggunakan media promosi?
5. Dalam gaya hidup, apakah ada perbedaan antara pelanggan pasar tradisional dan pasar
modern, variabel apa saja yang bisa membedakan atau mendiskriminasi secara signifikan?
6. Kredit bank, aakan nasabah yang meminjam, nasabah yang jujur atau tidak? Berdasarkan
beberapa karakter /atribut dari nasabah.
7. Karakter SDM, apakah calon karyawan memiliki komitmen atau tidak? Berdasarkan beberapa
data pribadi pelamar
8. Kesehatan, pasien yang kemungkinan besar akan mengalami serangan jantung atau tidak?
Berdasarkan catatan tekanan darah, berat badan, kolestrol, dan lainnya.
21. Contoh Analisis Diskriminan
Wawancara Pekerjaan
Misalnya, ketika individu diwawancarai untuk suatu pekerjaan, manajer tidak akan tahu pasti bagaimana calon pekerjaan akan
tampil pada pekerjaan itu jika dipekerjakan.
Namun, anggaplah seorang manajer sumber daya manusia memiliki daftar karyawan saat ini yang telah diklasifikasikan ke
dalam dua kelompok: “berkinerja tinggi” dan “berkinerja rendah”. Orang-orang ini telah bekerja untuk perusahaan selama
beberapa waktu, telah dievaluasi oleh supervisor mereka, dan diketahui termasuk dalam salah satu dari dua kategori yang saling
eksklusif ini.
Manajer juga memiliki informasi tentang latar belakang karyawan: pencapaian pendidikan, pengalaman kerja sebelumnya,
partisipasi dalam program pelatihan, ukuran sikap kerja, karakteristik kepribadian, dan sebagainya. Informasi ini diketahui pada
saat karyawan tersebut dipekerjakan.
Manajer ingin dapat memprediksi, dengan keyakinan tertentu, calon karyawan mana yang berkinerja tinggi dan mana yang
tidak. Seorang peneliti atau konsultan dapat menggunakan analisis diskriminan, bersama dengan data yang ada, untuk
membantu tugas ini.
Ada dua langkah dasar dalam analisis diskriminan kaitannya dengan contoh kausus tersebut. Yang pertama melibatkan estimasi
koefisien, atau faktor pembobot, yang dapat diterapkan pada karakteristik kandidat pekerjaan yang diketahui (yaitu, variabel
independen) untuk menghitung beberapa ukuran kecenderungan atau kecenderungan mereka untuk menjadi karyawan yang
berkinerja tinggi. Ukuran ini disebut “fungsi diskriminan”.
Kedua, informasi ini kemudian dapat digunakan untuk mengembangkan aturan keputusan yang menetapkan beberapa nilai batas
untuk memprediksi kandidat pekerjaan mana yang cenderung berkinerja tinggi.
22. Tujuan analisis diskriminan secara umum
1. Mengetahui apakah ada perbedaan yang jelas antara kelompok pada variabel dependen.
Bisa juga dikatakan untuk melihat perbedaan antara anggota grup 1 dengan grup 2.
2. Jika ada perbedaan, untuk mengetahui variabel bebas mana yang membuat perbedaan
tersebut.
3. Membuat fungsi atau model diskriminan yang pada dasarnya mirip dengan persamaan
regresi.
4. Melakukan klasifikasi terhadap objek (dalam terminology spss disebut baris), dan untuk
mengetahui apakah suatu objek termasuk pada grup 1 atau grup 2 atau lainnya.
23. Asumsi dan Sampel dalam analisis diskriminan
1. Sejumlah p variabel independen harus berdistribusi normal.
2. Matriks ragam-peragam variabel independen berukuran pxp pada kedua kelompok harus sama.
3. Tidak ada korelasi antar variabel independen.
4. Tidak terdapat data yang outlier pada variabel independen.
Menurut Hair et al. (1987 : 76), analisis diskriminan tidak terlalu sensitif dengan pelanggaran asumsi ini, kecuali
pelanggarannya bersifat ekstrim. Dan Johnson and Wichern (1988: 472) mengatakan hal yang sama bahwa asumsi ini
(kesamaan ragam-peragam) di dalam praktiknya sering dilanggar.
Tidak ada jumlah sampel yang ideal secara pasti pada analisis diskriminan. Pedoman yang bersifat umum menyatakan
untuk setiap variabel independen terdapat 5-20 sampel. Dengan demikian, jika terdapat 6 variabel independen maka
seharusnya terdapat minimal 6x5=30 sampel. Secara terminology spss, jika ada enam kolom variabel independen,
sebaiknya ada 30 baris data.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analisis sampel yang digunakan
untuk membuat fungsi diskriminan, serta holdout sampel (split sampel) yang digunakan untuk menguji hasil
diskriminan.
24. Langkah-langkah dalam analisis diskriminan
1. Memisah variabel-variabel menjadi variabel dependen dan variabel independen.
2. Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya terdapat dua metode dasar untuk
membuat fungsi diskriminan, yakni:
o Simultaneus estimation, semua variabel independen dimasukkan secara bersama-sama kemudian
dilakukan proses diskriminan.
o Stepwise estimation, variabel independen dimasukkan satu per satu kedalam model diskriminan.
Pada proses ini akan ada variabel yang tetap ada dalam model dan ada variabel yang dibuang dari
model.
3. Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s lamda, Pilai, F
test dan uji lainnya.
4. Menguji ketepatan klasifikasi dari fungsi diskriminan serta mengetahui ketepatan klasifikasi secara
individual dengan casewise diagnostics.
5. Melakukan interpretasi terhadap fungsi diskriminan tersebut.
6. Melakukan uji validasi terhadap fungsi diskriminan.
25. Kelayak Fungsi Diskriminan
Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara 2
kelompok yang ada.
Oleh karena itu, sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap
perbedaan vektor nilai rataan dari 2 kelompok tersebut.
Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang harus dipenuhi adalah
peubah-peubah yang diamati berdistribusi multivariate normality dan semua kelompok
populasi mempunyai matrik ragam-peragam yang sama.
27. PROSE SPSS _ Determinant
• Analysis
• Clasiffy
• Discriminant
• Y pindahkan ke Grouping variable
• Klik Define rang (klik dependent) – isi minmum; 1,
maximum: 2
• Continue
• Pindahkan Xi ke Indepents
• Ok
• Pada statistics, centang semua pada Descriptions,
Matrices, Function coefficients
• Continue
• OK
28. OUTPUT SPSS
- Output SPSS untuk persamaan atau fungsi determinant : Standardized Canonical
Discrimintant Function Coefficients untuk : Y = w1X1 + w2X2…..+ wnXn
Misalnya : Y = 0.501 X1 + 0.703 X2
Standardized Canonical Discriminant Function
Coefficients
Function
1
EBITAS .501
ROTC .703
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41. MULTIPLE DISCRIMINANT ANALYSIS
A. DEFINISI
Menurut Cramer, Multiple Discriminant Analysis merupakan teknik parametrik yang digunakan
untuk menentukan bobot dari prediktor yg paling baik untuk membedakan dua atau lebih
kelompok kasus, yang tidak terjadi secara kebetulan.
Model Analisis Diskriminan ditandai dengan ciri khusus yaitu data variabel dependen yang harus
berupa data kategori, sedangkan data independen justru berupa data non kategori. Atau dengan
kata lain Analisis Diskriminan adalah teknik untuk menganalisis data yang memiliki variabel
dependen dalam bentuk kategori dan variabel independen dalam bentuk metric.
Hal ini dapat dimodelkan sebagai berikut :
Y1 = X1 + X2 + X3 + … + Xn
Dimana :
1. Variabel Independen (X1 dan seterusnya) adalah data metrik, yaitu data berskala interval
atau rasio.
2. Variabel Dependen (Y1) adalah data kategorikal atau nominal. Jika data kategorikal
tersebut hanya terdiri dari 2 kode saja disebut “Two-Groups Discriminant Analysis”.
Namun apabila lebih dari 2 kategori disebut “Multiple Discriminant Analysis”.
Dependen Variabel dari analisis diskriminan disebut criterion à kategori (nominal/ordinal)
dalam regression disebut dummy variable (hanya saja tidak hanya 2 kategori, tapi bisa lebih dari
2 kategori). Sedangkan independen variable-nya disebut predictor à interval/rasio
42. B. MODEL MULTIPLE DISCRIMINANT ANALYSIS :
Bentuk Kombinasi linier :
D = bo + bX + b2X2 + b3X3 +…+ bkXk
Dimana :
D = Skor Diskriminan
B = Koefisien diskriminasi atau bobot
X = Predictor atau Variabel Independen
43. C. TUJUAN MULTIPLE DISCRIMINANT ANALYSIS
Tujuan dari Multiple Discriminant Analysis yakni adalah sebagai berikut:
1. Untuk membedakan suatu objek (responden) masuk dalam kelompok kategori yang
mana.
2. Menguji apakah ada perbedaan yang signifikan antara CRITERION (kategori) dengan
PREDIKTOR
3. Menentukan PREDIKTOR yang mana yang memberikan sumbangan sehingga terjadi
perbedaan antar kelompok.
Dalam literatur yang lain tujuan dari analisis diskriminan adalah :
1. Menganalisis apakah terdapat perbedaan yang cukup signifikan antar kelompok dalam
hal variabel independen
2. Penentuan variabel mana yang memberikan kontribusi terbesar terhadap perbedaan yang
terjadi antar kelompok
3. Klasifikasi setiap kasus ke dalam satu kelompok berdasarkan nilai dari prediktor
4. Evaluasi terhadap akurasi klasifikasi
44. D. ASUMSI ANALISIS DISKRIMINAN
Asumsi penting yang harus dipenuhi agar model diskriminan dapat digunakan antara lain :
1. Variabel bebas harus terdistribusi normal (adanya normalitas).
2. Matriks kovarians semua variabel bebas harus sama (equal).
3. Tidak terjadi multikolinearitas (tidak berkorelasi) antar variabel bebas.
4. Tidak terdapat data yang ekstrim (outlier).
45. E. PROSES ANALISIS DISKRIMINAN
Beberapa langkah yang merupakan proses dasar dalam Analisi Diskriminan antara lain :
1. Memilah variabel-variabel menjadi Variabel terikat (Dependent) dan Variabel bebas
(Independent).
2. Menentukan metode untuk membuat Fungsi Diskriminan, yaitu :
1. Simultaneous Estimation; semua variabel dimasukkan secara bersamasama lalu dilakukan
proses Diskriminan.
2. Step-Wise Estimation; variabel dimasukkan satu per satu ke dalam model Diskriminan.
3. Menguji signifikansi Fungsi Diskriminan yang terbentuk, dengan menggunakan Wilk’s
Lambda, Pilai, F test, dan lainnya.
4. Menguji ketepatan klasifikasi dari fungsi diskriminan (secara individual dengan Casewise
Diagnotics).
5. Melakukan interpretasi Fungsi Diskriminan.
6. Melakukan uji validasi fungsi diskriminan.
Dengan analisis diskriminan, pada akhirnya akan dibuat sebuah model seperti regresi yaitu satu
variabel terikat (dependent) dan banyak variabel bebas (independent). Prinsip Diskriminan
adalah ingin membuat model yang dapat secara jelas menunjukkan perbedaan (diskriminasi)
antar isi variabel dependen.
46. F. CONTOH KASUS
Terdapat 100 objek dengan variabel-variabel antara lain :
1. Specification Buying (x11), dengan kode :
– Kode 0 = Specification Buying
– Kode 1 = Total Value Analysis
1. Delivery Speed (x1)
2. Price Level (x2)
3. Price Flexibility (x3)
4. Manufacturer Image (x4)
5. Service (x5)
6. Salesforce Image (x6)
7. Product Quality (x7)
Sebelum melakukan analisis diskriminan, hal yang perlu dilakukan yaitu menguji ketepatan
variabel; yaitu apakah keseluruhan variabel yang terkumpul secara keseluruhan dapat digunakan
lebih lanjut dalam analisis diskriminan, atau terdapat variabel yang terpaksa harus disingkirkan
dalam pelaksanaan analisis diskriminan. Untuk itu, tahap pertama yang harus dilakukan yaitu
melakukan uji variabel. Seperti berikut ini.
47. 1) Menilai Variabel yang Layak
1. Dari data yang telah dimasukkan, selanjutnya klik menu “analyze” dan pilih sub menu
“Classify” dan kemudian “Discriminant…”
2. Masukkan variabel dependent ke dalam kotak “Grouping Variable”. Sedangkan
keenam variabel lainnya: masukkan ke dalam kotak “Independents”. Berarti variabel
dependent berciri data kategori. Oleh karena itu, SPSS minta masukan kode kategori
yang dipakai. Untuk itu, buka icon “Define Range”.
3. Sesuai kode variabel dependent, maka masukkan angka 0 (nol) pada bagian “Minimum”
dan angka 1 (satu) pada bagian “Maximum”. Lalu tekan “Continue” untuk kembali ke
menu utama.
4. Klik mouse pada icon “Statistics”
5. Pada bagian “Descriptives” aktifkan bagian Univariate ANOVAs dan Box’s M. Abaikan
bagian yang lain lalu tekan “Continue”. Selanjutnya dari tampilan menu utama, abaikan
bagian yang lain dan tekan OK untuk menampilkan output aplikasi SPSS pengujian
variabel pada analisis diskriminan.
48. Tabel yang dihasilkan (tests of equality of group means) merupakan hasil pengujian tiap-tiap
variabel bebas yang ada. Keputusan yang diambil dalam pengujian variabel dapat melalui 2 cara
:
a) Dengan angka “Wilk’s Lambda”. Angka Wilk’s Lambda berkisar 0 sampai 1. Jika
angka mendekati 0, maka data tiap grup cenderung berbeda; sedangkan jika angka mendekati 1,
data tiap grup cenderung sama.
b) Dengan F test (uji signifikansi). Uji F dilakukan untuk menguji hipotesis berikut:
Ho : group means dari masing-masing kelompok adalah relatif sama
H1 : group means dari masing-masing kelompok memiliki perbedaan secara nyata
Jika Sig < 0,05, maka Ho ditolak, yang berarti ada perbedaan antar grup.
Jika Sig > 0,05, maka Ho tidak ditolak yang berarti group means masing-masing kelompok
relatif sama. Hal ini menunjukkan bahwa tidak ada perbedaan antar grup.
Setelah dilakukan pengujian terhadap masing-masing variabel, berikutnya dilakukan pengujian
variansi dari setiap variabel. Analisis Diskriminan mempunyai asumsi bahwa :
1. Variansi variabel bebas untuk setiap grup seharusnya sama.
2. Variansi diantara variabel-variabel bebas seharusnya juga sama.
49. Kedua pengertian diatas dapat disimpilkan bahwa “group covariance matrices” adalah relatif
sama.
Untuk itu, perlu dilakukan pengujian hipotesis sebagai berikut :
Ho : group covariance matrices adalah relatif sama
H1 : group covariance matrices adalah berbeda secara nyata
Adapun penilaian signifikansi dari pengujian hipotesis diatas sebagai berikut :
Jika Sig < 0,05, maka Ho ditolak.
Jika Sig > 0,05, maka Ho tidak ditolak.
Dari tampilan tabel (test result) output, tentukan nilai Sig. Bila > 0,05, berarti bahwa group
covariance matrices adalah relatif sama. Hal ini berarti data di atas dianggap telah memenuhi
asumsi analisis diskriminan, sehingga proses dapat dilanjutkan.
52. MODEL LOGISTIC (LOGIT)
Reference: Mudah Memahami Regresi Logit (Junaidi, 2008)
Untuk Latihan SPSS_Binary Logistic, Studi Kasus “AA”
Jakarta, 21 Maret 2019
Prof. Dr. Dr. H. Aminullah Assagaf, SE., MS., MM., M.Ak
Email: assagaf29@yahoo.com
HP. : +618113543409
53. MODEL LOGISTIK ATAU MODEL LOGIT
Regresi logistik (kadang disebut model logistik atau model logit), dalam statistika digunakan
untuk prediksi probabilitas kejadian suatu peristiwa dengan mencocokkan data pada fungsi
logit kurva logistik.
Metode ini merupakan model linier umum yang digunakan untuk regresi binomial.
Seperti analisis regresi pada umumnya, metode ini menggunakan beberapa variabel
prediktor, baik numerik maupun kategori.
Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu tertentu
dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa tubuh.
Regresi logistik juga digunakan secara luas pada bidang kedokteran dan ilmu sosial, maupun
pemasaran seperti prediksi kecenderungan pelanggan untuk membeli suatu produk atau
berhenti berlangganan.
Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang
menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan
secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi
logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0
hingga 1.
54. Regresi logistik
Regresi logistik (kadang disebut model logistik atau model logit), dalam statistika digunakan
untuk prediksi probabilitas kejadian suatu peristiwa dengan mencocokkan data pada fungsi logit
kurva logistik.
Metode ini merupakan model linier umum yang digunakan untuk regresi binomial.
Seperti analisis regresi pada umumnya, metode ini menggunakan beberapa variabel prediktor,
baik numerik maupun kategori.
Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu tertentu
dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa tubuh.
Regresi logistik juga digunakan secara luas pada bidang kedokteran dan ilmu sosial, maupun
pemasaran seperti prediksi kecenderungan pelanggan untuk membeli suatu produk atau
berhenti berlangganan.
55. Fungsi logistik, dengan z pada sumbu
hosrizontal dan ƒ(z) pada sumbu vertikal
Kurva Logistik
56. MODEL LOGISTIK ATAU MODEL LOGIT
Tujuan Menggunakan regresi Logistik, ada 3
1. Menghitung peluang
Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang
responden diluar responden yang termasuk dalam penelitian.
Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi
kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank.
Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang
diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang
akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas
bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau
tidak, nilai antara 0 – 1.
Tentunya model yang digunakan oleh petugas bank adalah model regresi logistik berdasarkan data-data
peminjam sebelumnya. Dalam model tersebut terdapat komponen bahwa biasanya peminjam yang memiliki
pendapatan dibawah sekian dengan pinjaman yang telah dimiliki sebelumnya sekian, ditambah tanggungan
kerja sekian, memiliki peluang untuk mengembalikan pinjaman sebesar sekian ( nilai 0 -1).
57. 2. Melihat karakteristik
Tujuan kedua ini sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok.
Salah satunya adalah skripsi saya yang saya sebutkan diatas. Skripsi tersebut menggambarkan karakteristik
petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik
ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia
beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun,
perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan
petani anorganik.
Tujuan melihat karakteristik ini biasanya membahas nilai odds ratio di masing masing variabel independen
(nilai odds ratio adalah (exp(koefisien)) masing-masing variabel). Nilai odds ratio menjelaskan peluang
responden beralih ke organik (contoh kasus diatas). Penjelasan nilai odds ratio berbeda dari nilai koefisien
regresi pada umumnya.
Bila koefisien regresi menjelaskan : “ jika variabel X naik 1 satuan, maka nilai Y akan naik sebesar nilai
koefisien satuan” maka exp(koefisien) atau odds ratio pada regresi logistik menjelaskan : “ responden yang
memiliki variabel x lebih tinggi, maka akan berpeluang untuk memilih organik (contoh kasus diatas) sebesar
“exp(nilai koefisien) atau biasa disebut odds ratio” kali dibandingkan responden yang memiliki variabel x lebih
rendah”. Iya, nilai exp(koefisien) pada regresi logistik atau disebut sebagai odds ratio menjelaskan peluang,
dan tidak menjelaskan berapa yang dimaksud “lebih tinggi” dari variabel X tersebut.
58. 3. Faktor Yang mempengaruhi
Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang
mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi
menandakan varaibel tersebut memiliki pengaruh yang tinggi terhadap pemilihan beda dari responden.
Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan
mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan
sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1
sebelumnya.
Contoh pada skripsi ini adalah bahwa harga merupakan faktor yang paling berpengaruh terhadap
preferensi petani memilih pertanian organik, maka pemerintah jika ingin mengembangkan pertanian
organik harus melakukan kebijakan yang tetap menstabilkan harga agar terus berada diatas harga produk
anorganik sehingga peminat petani organik akan sebakin banyak dan bisa terus berkembang.
59. Bagaimana Model Persamaan Regresi Logistik?
Jika regresi linear memiliki persamaan :
Y = a + b1X1 + …. + bnXn, dengan a sebagai konstanta, dan b1 hingga bn adalah koefisien, maka
regresi logistik juga akan mengeluarkan output yang sama jika anda menggunakan software
minitab atau SPSS. Namun, anda akan keliru jika langsung mengambil persamaan itu untuk
menjelaskan atau membahas peluang.
Nilai koefisen masing masing variabel dari gambar diatas terletak pada kolom B, sedangkan
penjelasan nilai odds ratio dari masing masing variabel adalah pada kolom Exp(B).
60.
61. Persamaan regresi logistik adalah :
Jika anda menggunakan regresi logistik untuk membuat persamaan dan menginterpretasikan peluang
pada responden lain, maka pembahasan anda akan berkutat kepada kolom B untuk membuat persamaan,
jika anda akan membahas faktor yang mempengaruhi variabel secara parsial, maka anda akan membahas
kolom odd ratio atau exp(B)
Persamaan tersebut dapat anda gunakan untuk menghitung peluang responden yang memiliki nilai
variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p tentunya akan berkisar antara 0 – 1.
63. Tahapan Proses Regresi Logistik
Mari kita langsung praktek dengan menggunakan spss 22. Buka spss dan copikan data yang anda
miliki. Proses regresi logistik bermula dari klik analyze – regression – binary logistic
Kemudian isikan nilai kolom dependen dengan variabel Y dan kolom covariate dengan variabel
independen. Anda bisa menggunakan bermacam – macam methode untuk mengeliminasi variabel
dan memperoleh persamaan yang paling baik untuk menginterpretasikan penelitian anda, anda
bisa membaca artikel saya tentang cara eliminasi variabel pada regresi. Pada latihan ini, kita pilih
methode enter saja. Klik oK
64.
65.
66.
67. Interpretasi Output
Nilai signifikan omnibus test harus berada dibawah 0.05 jika anda menggunakan taraf kepercayaan
95%. Omnibus Test dengan jumlah variabel independen sebanyak x menghasilkan nilai signifikansi
yang lebih rendah dari 0.05. Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari x
variabel independen secara simultan mempengaruhi variabel dependen.Kemudian nilai nagelkerke R
Square merupakan nilai R squared pada regresi linear. Variabel independen mampu menjelaskan 86
persen variabel dependen yang terlihat dari nilai Square nagelkerke sebesar 0.86. Sedangkan 14
persen lainnya dapat dijelaskan oleh faktor lain diluar variabel independen dalam persamaan hasil
regresi logistik.
Hosmer and lemeshow Test
Berbeda dengan omnibus test, nilai hosmer and lemeshow test justru dikatakan baik jika nilai
signifikannya > 0.05.
Nilai Hosmer tersebut lebih besar dibandingkan α = 0.05, artinya terima H0 yakni model regresi
logistik mampu menjelaskan data dan tidak terdapat perbedaan antara model dan nilai
observasinya. Hal ini menunjukkan bahwa persamaan regresi logistik dapat digunakan untuk
menjelaskan hubungan variabel independen dan variabel dependen
68.
69.
70.
71. Membuat persamaan
Persamaan diperlukan apabila anda selanjutnya ingin membahas atau meramal suatu
peluang dimana kondisi – kondisi variabel telah anda peroleh. Contoh simple seperti
diatas adalah penentuan layak atau tidak seseorang mendapatkan kredit pinjaman.
Atau, bisa juga memprediksi peluang keberhasilan suatu program apabila memiliki
kondisi kkondisi yang mirip dengan variabel yang ada di persamaan tersebut.
Cara membuat persamaan sudah saya jelaskan diatas, namun sebagai gambaran saya
ilustrasikan sebuah contoh:
Hasil interpretasi nilai logistic regression adalah sebagai berikut:
B0 = -4.2
B1 = 2.3
Variabel independen yang diproses adalah : IP semester 1 mahasiswa dengan variabel
dependennya : 0 berarti lulus lebih atau sama dengan 4 tahun, nilai 1 berarti lulus
kurang dari 4 tahun.
Jika IP semester 1 seorang mahasiswa adalah 3, maka berapa peluang mahasiswa
tersebut untuk lulus kurang dari 4 tahun?
74. MODEL LOGIT
Model logit disusun berdasarkan fungsi peluang logistik kumulatif (Gaspersz, 91):
Untuk menduga persaman di atas secara langsung adalah tidak mungkin, karena Pi mengambil
nilai 0 sampai 1. Komponen {Pi/(1-Pi)} = 0 akan menjadi 0 apabila Pi = 1 dan menjadi tak
terdefinisi bila Pi = 1. Untuk menduga model peluang melalui penggunaan Pi* sebagai pendekatan
Pi dengan formulasi:
Persamaan di atas linear dalam parameter sehingga dapat diduga dengan menggunakan OLS.
Dengan asumsi bahwa setiap individu pengamatan dalam kelompok adalah bebas menurut sebaran
binomial, maka variabel tak bebas Ln (Pi*/(1-Pi*) akan mendekati sebaran normal (ukuran sampel
besar). Persamaan Model Logit dan variabel yang digunakan untuk mengetahui faktorfaktor yang
berpengaruh terhadap peluang peningkatann produksi disajikan dalam bentuk persamaan sebagai
berikut :
Keterangan :
80. Proses SPSS-LOGISTIC
LOGISTIC
- Analysis
- Regression
- Binary Logistic
- Dependent : Y
- Independent : X1, X2, X3….
- Khusus X3, karena datanya (1, 2, 3), maka:
- Categorical
- Klik X3
- Klik tanda panah samping "Categorical covarians"
- Pilih "Reference Category" dengan " "First"
- Klik "Change"
- Continue
- OK
B S.E. Wald df Sig. Exp(B
Variables in the Equation
81. Exp (B)
=ln(10) =10^(1/2.302) 1.153
10 2.302585 2.718282 =2.718282^(0.142) = 1.153
- Dalam kasus variabel X1 (umur), dengan odds ratio sebesar 1,153 dapat diartikan bahwa konsumen yang berumur
lebih tua satu tahun peluang membeli mobilnya adalah 1,153 kali dibandingkan konsumen umur yang lebih muda
(satu tahun), jika pendapatan dan jenis kelamin mereka sama.
- Dalam kasus variabel X2 (jenis kelamin dimana 1 = wanita dan 0 = pria), dengan odds ratio sebesar 0,201 dapat
diartikan bahwa peluang wanita untuk membeli mobil adalah 0,201 kali dibandingkan pria, jika umur dan
pendapatan mereka sama. Artinya wanita memiliki peluang lebih rendahi dalam membeli mobil dibandingkan pria.
82. Result “Exp(B)”
B S.E. Wald df Sig. Exp(B)
X1 .142 .084 2.838 1 .092 1.153
X2 -1.602 .795 4.065 1 .044 .201
X3 8.783 2 .012
X3(1) -.712 .992 .515 1 .473 .491
X3(2) 1.864 .833 5.011 1 .025 6.450
Constant -5.637 3.150 3.202 1 .074 .004
Variables in the Equation
Step 1a
a. Variable(s) entered on step 1: X1, X2, X3.
83. Uji F (Chi-Square) dan R2
Chi-square df Sig.
Step 18.131 4 .001
Block 18.131 4 .001
Model 18.131 4 .001
-2 Log
likelihood
Cox & Snell R
Square
Nagelkerke R
Square
1 47.660a
.315 .422
Model Summary
Step
a. Estimation terminated at iteration number 5
because parameter estimates changed by less than
Omnibus Tests of Model Coefficients
Step 1
84. TAHAPAN-TAHAPAN ESTIMASI DALAM SPSS
1. Setelah data diinput dalam lembar kerja SPSS kemudian klik Analyze > Regression > Binary Logistic
2. Masukkan Y sebagai variable dependent dengan cara klik Y di kotak kiri, kemudian klik tanda panah
disamping kotak Dependent. Masukkan X1, X2 dan X3 kedalam kotak Covariates, dengan cara klik masing-
masing variable, kemudian klik tanda panah disamping kotak covariates.
3. Selanjutnya, karena variabel X3 merupakan peubah kategori (ordinal) dengan lebih dari dua kategori
(yaitu 0=pendapatan rendah, 1=pendapatan sedang dan 2=pendapatan tinggi) maka diubah terlebih
dahulu ke dalam 2 variabel dummy, untuk mengembangkan model yang logis dan mudah diinterpretasi,
sebagai berikut: (ini sama dengan prosedur regresi dengan variabel bebas dummy sebelumnya)
X3_1 = 1, jika konsumen berpendapatan menengah
0, jika selainnya
X3_2 = 1, jika konsumen berpendapatan tinggi
0, jika selainnya
Dalam program SPSS untuk mengkonversi ini dengan cara klik Categorical dari tampilan diatas, maka akan
muncul tampilan berikut: Selanjutnya, klik X3, klik tanda panah disamping Categorical Covariates. Pilih
Reference Category dengan First, kemudian klik Change dan Continue. Selanjutnya klik OK.
4. Akan keluar output SPSS untuk regresi logit sebagai berikut (disini hanya ditampilkan bagian-bagian
terpenting saja yang akan dibahas)
85.
86.
87. Result and Discuss
Printout di tabel pertama diatas menjelaskan transformasi variabel X3 dengan kategori 0,1 dan 2
menjadi dua variabel dummy yaitu X3_1 dan X3_2. Seperti yang terlihat dari tabel tersebut,
variabel X3_1 bernilai 1 untuk kategori 1 (pendapatan menengah) dan 0 untuk kategori lainnya.
Variabel X3_2 bernilai 1 untuk kategori 2 (pendapatan tinggi) dan 0 untuk kategori lainnya.
Dengan demikian, kategori 0 (pendapatan rendah) akan bernilai 0 baik pada variabel X3_1 dan
X3_2.
Printout di tabel kedua diatas merupakan nilai Khi-kuadrat (χ2) dari model regresi. Sebagaimana
halnya model regresi linear dengan metode OLS, kita juga dapat melakukan pengujian arti penting
model secara keseluruhan. Jika metode OLS menggunakan uji F, maka pada model logit
menggunakan uji G. Statistik G ini menyebar menurut sebaran Khi-kuadrat (χ2). Karenanya dalam
pengujiannya, nilai G dapat dibandingkan dengan nilai χ2 tabel pada α tertentu dan derajat bebas
k-1. (kriteria pengujian dan cara pengujian persis sama dengan uji F pada metode regresi OLS).
Tetapi, kita juga bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan oleh sofware-
software statistik, termasuk SPSS.
88. Result and Discuss
• Dari output SPSS, didapatkan nilai χ2 sebesar 18,131 dengan p-value 0,001. Karena nilai
ini jauh dibawah 10 % (jika menggunakan pengujian dengan α=10%), atau jauh dibawah
5% (jika menggunakan pengujian dengan α=5%), maka dapat disimpulkan bahwa model
regresi logistik secara keseluruhan dapat menjelaskan atau memprediksi keputusan
konsumen dalam membeli mobil.
• Printout di tabel ketiga memberikan estimasi koefisien model dan pengujian hipotesis
parsial dari koefisien model. Dalam pelaporannya, model regresi logistiknya dapat
dituliskan sebagai berikut:
Dari output SPSS diatas menjadi sebagai berikut:
89. Result and Discuss
• Model ini merupakan model peluang membeli mobil [(P(xi)] yang dipengaruhi
oleh faktor-faktor umur, jenis kelamin dan pendapatan. Model tersebut adalah
bersifat non-linear dalam parameter. Selanjutnya, untuk menjadikan model
tersebut linear, dilakukan transformasi dengan logaritma natural, (transformasi ini
yang menjadi hal penting dalam regresi logistik dan dikenal dengan istilah ”logit
transformation”), sehingga menjadi (pembahasan lebih rinci, silakan dibaca buku-
buku ekonometrik):
90. Result and Discuss
• 1-P(xi) adalah peluang tidak membeli mobil, sebagai kebalikan dari P(xi)
sebagai peluang membeli mobil. Oleh karenanya, ln [P(xi)/1-P(xi)] secara
sederhana merupakan log dari perbandingan antara peluang membeli
mobil dengan peluang tidak membeli mobil. Oleh karenanya juga, koefisien
dalam persamaan ini menunjukkan pengaruh dari umur, jenis kelamin dan
pendapatan terhadap peluang relative individu membeli mobil yang
dibandingkan dengan peluang tidak membeli mobil.
• Selanjutnya, untuk menguji faktor mana yang berpengaruh nyata terhadap
keputusan pilihan membeli mobil tersebut, dapat menggunakan uji
signifikansi dari parameter koefisien secara parsial dengan statistik uji
Wald, yang serupa dengan statistik uji t atau uji Z dalam regresi linear
biasa, yaitu dengan membagi koefisien terhadap standar error masing-
masing koefisien.
91. Result and Discuss
• Dari output SPSS ditampilkan nilai Wald dan p-valuenya. Berdasarkan nilai
p-value (dan menggunakan kriteria pengujian α=10%), dapat dilihat seluruh
variabel (kecuali X3_1), berpengaruh nyata (memiliki p-value dibawah 10%)
terhadap keputusan membeli mobil.
• Lalu, bagaimana interpretasi koefisien regresi logit dari persamaan di atas ?
Dalam model regresi linear, koefisien βi menunjukkan perubahan nilai
variabel dependent sebagai akibat perubahan satu satuan variabel
independent.
• Hal yang sama sebenarnya juga berlaku dalam model regresi logit, tetapi
secara matematis sulit diinterpretasikan.
•
92. Result and Discuss
• Koefisien dalam model logit menunjukkan perubahan dalam logit sebagai
akibat perubahan satu satuan variabel independent. Interpretasi yang
tepat untuk koefisien ini tentunya tergantung pada kemampuan
menempatkan arti dari perbedaan antara dua logit.
• Oleh karenanya, dalam model logit, dikembangkan pengukuran yang
dikenal dengan nama odds ratio (ψ).
• Odds ratio untuk masing-masing variabel ditampilkan oleh SPSS
sebagaimana yang terlihat tabel diatas (kolom Exp(B)).
• Odds ratio dapat dirumuskan: ψ = eβ, dimana e adalah bilangan 2,71828
dan β adalah koefisien masing-masing variabel.
• Sebagai contoh, odds ratio untuk variabel X2 = e-0.1602 = 0,201 (lihat
output SPSS). Atau 2.718282^(-1.602) = 0.201…demikian seterusnya utk
variabel lainnya
94. Result and Discuss
• Dalam kasus variabel X2 (jenis kelamin dimana 1 = wanita dan 0 = pria), dengan
odds ratio sebesar 0,201 dapat diartikan bahwa peluang wanita untuk membeli
mobil adalah 0,201 kali dibandingkan pria, jika umur dan pendapatan mereka
sama. Artinya wanita memiliki peluang lebih rendahi dalam membeli mobil
dibandingkan pria.
• Dalam kasus variabel X1 (umur), dengan odds ratio sebesar 1,153 dapat diartikan
bahwa konsumen yang berumur lebih tua satu tahun peluang membeli mobilnya
adalah 1,153 kali dibandingkan konsumen umur yang lebih muda (satu tahun),
jika pendapatan dan jenis kelamin mereka sama.
• Artinya orang yang lebih tua memiliki peluang yang lebih tinggi dalam membeli
mobil.
• Dalam konteks umur ini (yang merupakan variabel dengan skala ratio), hati-hati
menginterpretasikan nilai perbedaan peluangnya. Jika perbedaan umur lebih dari
1 tahun,
95. Result and Discuss
• misalnya 10 tahun, maka odds rationya akan menjadi 4,14, yang diperoleh dari
perhitungan sbb: ψ=e(10 x 0.142) = 2.718282^1.42=4.14 . Artinya peluang
membeli mobil konsumen yang berumur lebih tua 10 tahun adalah 4,14 kali
dibandingkan konsumen yang lebih muda (10 tahun) darinya.
• Selanjutnya, dalam konteks variabel pendapatan, terlihat bahwa X31 tidak
berpengaruh signifikan. Artinya, peluang membeli mobil antara konsumen
pendapatan sedang dan pendapatan rendah adalah sama saja.
• Sebaliknya, untuk X32, dapat diinterpretasikan bahwa peluang membeli mobil
konsumen pendapatan tinggi adalah 6,45 kali dibandingkan pendapatan rendah,
jika umur dan jenis kelaminnya sama.
• atau
96. Result and Discuss
Atau:
Di mana: exp atau ditulis “e” adalah fungsi exponen.
(Perlu diingat bahwa exponen merupakan kebalikan dari logaritma
natural. Sedangkan logaritma natural adalah bentuk logaritma namun
dengan nilai konstanta 2,71828182845904 atau biasa dibulatkan
menjadi 2,72).
97. Result and Discuss
• Dengan model persamaan di atas, tentunya akan sangat sulit untuk
menginterprestasikan koefisien regresinya.
• Oleh karena itu maka diperkenalkanlah istilah Odds Ratio atau yang biasa
disingkat Exp(B) atau OR.
• Exp(B) merupakan exponen dari koefisien regresi. Jadi misalkan nilai slope dari
regresi adalah sebesar 0,80, maka Exp(B) dapat diperkirakan sebagai berikut:
98.
99. Proses SPSS
LOGISTIC
- Analysis
- Regression
- Binary Logistic
- Dependent : Y
- Independent : X1, X2, X3….
- Khusus X3, karena datanya (1, 2, 3), maka:
- Categorical
- Klik X3
- Klik tanda panah samping "Categorical covarians"
- Pilih "Reference Category" dengan " "First"
- Klik "Change"
- Continue
- OK
B S.E. Wald df Sig. Exp(B
Variables in the Equation