Regresi Logistik
Farid AGUSHYBANA
Fakultas Kesehatan Masyarakat Universitas Diponegoro
2
Pemanfaatan
• Meramalkan terjadinya variabel
respons.
• Mengukur hubungan variabel
independent dan dependent setelah
mengontrol pengaruh covariatnya.
3
Asumsi dasar
• Tidak memerlukan asumsi distribusi
normal (terutama pada variabel
dependent)
• Sample cukup besar
• Variabel :
– Independent : nominal, ordinal,interval, rasio
– Dependent : nominal –dikotomi
ordinal (> 2)
4
5
Rumus dasar
)
...
( 2
2
1
1
1
1
k
k x
b
x
b
x
b
a
e
p 






6
Langkah Pembentukan Model
• Analisis univariat pd masing-2
variabel.
• Pengamatan secara individual
variabel-2 dalam model multivariat.
• Memasukkan dan memeriksa
kemungkinan ada interaksi variabel.
7
Analisis univariat pd masing-2
variabel.
• Uji statistik chi-square atau uji rasio
likelihood G.
• Bila kategori lebih dari 2 maka dibuat
variabe dummy.
• Untuk variabel continue:
– Taksiran koef regresi (b).
– Taksiran kesalahan baku (SE)
– Statistik uji rasio likelihood G
– Statistik uji Wald (b/SE).
• Bisa digunakan patokan seleksi pada
p<0,25.
8
Pengamatan secara individual
variabel-2 dalam model multivariat.
• Memasukkan semua variabel secara
serentak (metode Enter).
• Memasukkan sekelompok variabel
biologi penting. (metode Stepwise).
–Seleksi maju (forward selection).
–Seleksi mundur (backward selection).
–Seleksi Stepwise.
Statistik G dan Statistik Wald
9
Memeriksa Interaksi Variabel
• Gunakan metode Rasio Likelihood=
–Membandingkan log-likelihood tanpa
interaksi dengn model log likelihood dgn
interaksi.
10
Latihan Kasus
Infark otot jantung MI 1 = sakit
0 = tidak sakit
Aktifitas fisik AF 1 >= 2500 kcal
0 < 2500 kcal
Kategori umur Umur 1 >= 55 th
0 < 55 th
Kebiasaan merokok Mrk 2 = rokok sigaret
>= 15 btg / hr
1 = rokok sigaret <
15 btg / hr
0 = tidak merokok
11
Langkah-langkah penyelesaian
• Karena variabel kebiasaan merokok
memiliki kategori lebih dari 2 maka harus
dibuat variabel dummy sebanyak 2 (k-1).
Dimana kategori tidak merokok
merupakan variabel acuan.
Variabel asli Variabel dummy
MRK D1 D2
Tidak merokok 0 0
Merokok sigaret < 15 btg / hr 1 0
Merokok sigaret >= 15 btg / hr 0 1
12
_cons -1.9146 .9954819 -1.92 0.054 -3.865709 .0365083
umur 2.013169 .9773984 2.06 0.039 .0975038 3.928835
Merokok sigaret >= 15 btg/hr 2.67343 1.315551 2.03 0.042 .0949968 5.251864
Merokok sigater < 15 btg/hr 2.478233 1.084134 2.29 0.022 .3533694 4.603097
mrk
af -2.243155 1.019025 -2.20 0.028 -4.240408 -.2459031
mi Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -15.810109 Pseudo R2 = 0.5453
Prob > chi2 = 0.0000
LR chi2(4) = 37.93
Logistic regression Number of obs = 55
13
_cons .1474007 .1467348 -1.92 0.054 .0209481 1.037183
umur 7.487009 7.317791 2.06 0.039 1.102416 50.84771
Merokok sigaret >= 15 btg/hr 14.48959 19.0618 2.03 0.042 1.099655 190.9218
Merokok sigater < 15 btg/hr 11.92019 12.92308 2.29 0.022 1.423857 99.7929
mrk
af .1061231 .1081421 -2.20 0.028 .0144017 .781998
mi Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -15.810109 Pseudo R2 = 0.5453
Prob > chi2 = 0.0000
LR chi2(4) = 37.93
Logistic regression Number of obs = 55

Regresi Logistik.ppt

  • 1.
    Regresi Logistik Farid AGUSHYBANA FakultasKesehatan Masyarakat Universitas Diponegoro
  • 2.
    2 Pemanfaatan • Meramalkan terjadinyavariabel respons. • Mengukur hubungan variabel independent dan dependent setelah mengontrol pengaruh covariatnya.
  • 3.
    3 Asumsi dasar • Tidakmemerlukan asumsi distribusi normal (terutama pada variabel dependent) • Sample cukup besar • Variabel : – Independent : nominal, ordinal,interval, rasio – Dependent : nominal –dikotomi ordinal (> 2)
  • 4.
  • 5.
    5 Rumus dasar ) ... ( 2 2 1 1 1 1 k kx b x b x b a e p       
  • 6.
    6 Langkah Pembentukan Model •Analisis univariat pd masing-2 variabel. • Pengamatan secara individual variabel-2 dalam model multivariat. • Memasukkan dan memeriksa kemungkinan ada interaksi variabel.
  • 7.
    7 Analisis univariat pdmasing-2 variabel. • Uji statistik chi-square atau uji rasio likelihood G. • Bila kategori lebih dari 2 maka dibuat variabe dummy. • Untuk variabel continue: – Taksiran koef regresi (b). – Taksiran kesalahan baku (SE) – Statistik uji rasio likelihood G – Statistik uji Wald (b/SE). • Bisa digunakan patokan seleksi pada p<0,25.
  • 8.
    8 Pengamatan secara individual variabel-2dalam model multivariat. • Memasukkan semua variabel secara serentak (metode Enter). • Memasukkan sekelompok variabel biologi penting. (metode Stepwise). –Seleksi maju (forward selection). –Seleksi mundur (backward selection). –Seleksi Stepwise. Statistik G dan Statistik Wald
  • 9.
    9 Memeriksa Interaksi Variabel •Gunakan metode Rasio Likelihood= –Membandingkan log-likelihood tanpa interaksi dengn model log likelihood dgn interaksi.
  • 10.
    10 Latihan Kasus Infark ototjantung MI 1 = sakit 0 = tidak sakit Aktifitas fisik AF 1 >= 2500 kcal 0 < 2500 kcal Kategori umur Umur 1 >= 55 th 0 < 55 th Kebiasaan merokok Mrk 2 = rokok sigaret >= 15 btg / hr 1 = rokok sigaret < 15 btg / hr 0 = tidak merokok
  • 11.
    11 Langkah-langkah penyelesaian • Karenavariabel kebiasaan merokok memiliki kategori lebih dari 2 maka harus dibuat variabel dummy sebanyak 2 (k-1). Dimana kategori tidak merokok merupakan variabel acuan. Variabel asli Variabel dummy MRK D1 D2 Tidak merokok 0 0 Merokok sigaret < 15 btg / hr 1 0 Merokok sigaret >= 15 btg / hr 0 1
  • 12.
    12 _cons -1.9146 .9954819-1.92 0.054 -3.865709 .0365083 umur 2.013169 .9773984 2.06 0.039 .0975038 3.928835 Merokok sigaret >= 15 btg/hr 2.67343 1.315551 2.03 0.042 .0949968 5.251864 Merokok sigater < 15 btg/hr 2.478233 1.084134 2.29 0.022 .3533694 4.603097 mrk af -2.243155 1.019025 -2.20 0.028 -4.240408 -.2459031 mi Coef. Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -15.810109 Pseudo R2 = 0.5453 Prob > chi2 = 0.0000 LR chi2(4) = 37.93 Logistic regression Number of obs = 55
  • 13.
    13 _cons .1474007 .1467348-1.92 0.054 .0209481 1.037183 umur 7.487009 7.317791 2.06 0.039 1.102416 50.84771 Merokok sigaret >= 15 btg/hr 14.48959 19.0618 2.03 0.042 1.099655 190.9218 Merokok sigater < 15 btg/hr 11.92019 12.92308 2.29 0.022 1.423857 99.7929 mrk af .1061231 .1081421 -2.20 0.028 .0144017 .781998 mi Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -15.810109 Pseudo R2 = 0.5453 Prob > chi2 = 0.0000 LR chi2(4) = 37.93 Logistic regression Number of obs = 55