SlideShare a Scribd company logo
1 of 31
Download to read offline
GENERALIZED LINEAR
MODELS
INDAH NURINA
10110094
DATA
Data asuransi kendaraan bermotor dengan jangka
waktu 1 tahun. Berisi 67856 polis, 4624(6.8%) diantaranya
memiliki setidaknya 1 claim
(Generalized Linear Models for Insurance Data, Piet de Jong dan Gillian
Z. Heller )
Variables:
1. Veh_value: Vehicle value (harga kendaraan)
2. Clm: occurence of claim (mengajukan klaim/tidak)
3. Veh_body: vehicle body (tipe kendaraan)
4. Area: Area tempat tinggal pengemudi
5. Agecat: Kategori usia pengemudi
Diketahui data Exposure dari masing-masing polis
PEMILIHAN VARIABEL RESPON
Clm (occurence of claim) sebagai variabel respon
(termasuk variabel kategorikal)
Binary outcome ( can take only one of two value 0=No 1=Yes)
Sifat distribusi bernoulli: hanya memiliki 2 kemungkinan
(2 mutually exclusive and exhaustive ways)
Clm berdistribusi B(1,π)
Jumlah observasi = jumlah polis= 67856
Tujuan: Mengetahui probabilitas seseorang yang memiliki
karakteristik tertentu untuk mengajukan claim
REGRESI MENGGUNAKAN GLM
• Distribusi Respon (clm) berasal dari distribusi
keluarga eksponensial
• Transformasi dari mean respon (clm) linear
terhadap variabel-variabel prediktornya.
DISTRIBUSI BERNOULI SEBAGAI ANGGOTA
KELUARGA DISTRIBUSI EKSPONENSIAL
Bentuk distribusi keluarga eksponensial
Misal y=clm (occurrence of claim), y~B(1,π)
Note slide sebelumnya
• Choice a(theta) determine the actual probability
function----habis menetapkan distribu, taksir
parameter miu dan variansi dari sampel.
(metode momen) atau pake mle, kan y i nya iid.
• Fungsi Variansi (relationship between
variance and mean). Mean kan bervariasi
sesuai eksplanatori variables, karena mean nya
bervariasi, begitu juga variansinya. Mereka
dihubungkan melalui fungsi variansi.
Pemilihan Fungsi Link
• Link kanonik untuk distribusi binomial
Sehingga untuk bernoulli:
Nilai π yang dipilih:
Probability bahwa clm bernilai 1 (Yes)
Note slide sebelumnya
• Link kanonik g(miu)=theta-- parameter
kanonik tujuan buat menyimpelkan estimasi
• Link logit memastikan bahwa pi berada di
interval 0,1 untuk semua x dan beta
Predictor 1
1. Veh_value (vehicle value, in $10,000s)
Jenis variabel: Kontinu
Predictor 1
1. Veh_value (vehicle value, in $10,000s)
Hubungan dengan variabel respon
Predictor
1. Veh_value (vehicle value, in $10,000s)
Hubungan dengan variabel respon:
Penjelasan gambar slide
sebelumnya
• Scatter plot smoother menunjukkan hubungan
yang tidak linier. Terlihat bahwa mngkn
hubungannya kuadratik atau kubik
• Ini buat memenuhi asumsi kelinearan antara
fungsi dr respon dengan prediktor
• Model kuadratik punya kelemahan di oddnya.
• Nilai AIC paling kecil g menjamin model paling
oke harus di fit
Banding Vehicle Value
clm
value(vehicle valuecategory)
1 2 3 4 5 6
0 0,756529 0,155476 0,017287 0,001474 0,000619 0,000472
1 0,053584 0,013101 0,001356 5,89E-05 2,95E-05 1,47E-05
Predictor 2
Veh_body (vehicle body/tipe kendaraan)
Jenis variabel: Kategorikal
1. BUS
2. CONVT = convertible
3. COUPE
4. HBACK = hatchback
5. HDTOP = hardtop
6. MCARA = motorized caravan
7. MIBUS = minibus
8. PANVN = panel van
9. RDSTR = roadster
10. SEDAN
11. STNWG = station wagon
12. TRUCK
13. UTE - utility
Predictor
3. Agecate (kategori usia)
Jenis variabel: Kategorikal
1 2 3 4 5 6
clm
Age Category
1 2 3 4 5 6
0 0,077311 0,176005 0,215957 0,222309 0,149169 0,091105
1 0,00731 0,013735 0,016402 0,01627 0,009049 0,005379
Predictor
4. Area (Area tinggal pengemudi)
Jenis variabel: Kategorikal
A B C D E F
clm
Area
1 2 3 4 5 6
0 0,224402 0,182386 0,281891 0,113137 0,081437 0,048603
1 0,01599 0,014221 0,020809 0,00731 0,005689 0,004126
Pemilihan Base Level
12 var
5 var
5 var
5 varagecat
1 2 3 4 5 6
5742 12875 15767 16189 10736 6547
area
A B C D E F
16312 13341 20540 8173 5912 3578
veh_body
BUS CONVT COPUE HBACK HDTOP MCARA MIBUS
48 81 780 18915 1579 127 717
PANVN RDSTR SEDAN STNWG TRUCK UTE
752 27 22233 16261 1750 4586
valuecat
1 2 3 4 5 6
54971 11439 1265 104 44 33
Full model
STEPWISE REGRESSION-WITHOUT
EXPOSURE
Agecat
entered
STEP 1
AIC = -2 Log L + 2((k-1) + s)
Memberikan Penalti
Likelihood ratio: -2 Log L(null model) - 2 Log L(fitted model)
STEPWISE REGRESSION-
WITHOUT EXPOSURE
Veh_body
entered
STEP 2
Odds:
Penjelasan slide sebelumnya
• Chi square: Ngetes 1 variabel dengan asumsi
variabel lainnya di step tersebut ada di dlm
model. Distribusi chi square karena variansi
heteroskedastik. Kalo p value sama2 kecil, lihat
nilai score chi square. Significantly different
from 0.
• Yang diuji beta j-0/ variansi beta j. H0: C.Beta
=0 H1: C.Beta tdk=0
• AIC k=jumlah level prediktor s=jumlah prediktor
• Score Chi-Square Test : at least one of the
predictors' regression coefficient is not equal to
zero in the model
STEPWISE REGRESSION-
WITHOUT EXPOSURE
STEPWISE REGRESSION-
WITHOUT EXPOSURE
Analysis of
effect eligible
for enty
Testing
global null
hipotesis
MLE of
Parameter
Odd ratio
Estimate
Analysis of
effect eligible
for removal
STEPWISE REGRESSION
SUMMARY-WITHOUT EXPOSURE
STEP
Effect
Entered
AIC
0 intercept
33.768.78
9
1 agecat
33.707.66
8
2 veh_body
33.691.34
6
3 valuecat
33.684.21
4
4 area
33.680.35
6
STEPWISE REGRESSION
SELECTED MODEL-WITHOUT
EXPOSURE
STEP Effect Entered AIC
0 intercept 33.768.789
1 agecat 33.707.668
2 veh_body 33.691.346
3 valuecat 33.684.214
4 area 33.680.356
Sensitivity: Frekuensi relatif dari memprediksi sebuah kejadian
(claim) ketika kejadian tersebut terjadi
Specificity:Frekuensi relatif dari memprediksi tidak terjadinya
sebuah kejadian ketika kejadian (claim)
tersebut memang tidak terjadi
STEPWISE REGRESSION
SELECTED MODEL-WITHOUT
EXPOSURE
STEPWISE REGRESSION
SELECTED MODEL-WITHOUT
EXPOSURE
Hasil Regresi:
Considering the exposure
Exposure (t) : proporsi yang menunjukkan perbandingan
jangka waktu polis yang terekspose terhadap jangka waktu
polis yang seharusnya.
Clm berdistribusi B(1,π)
Clm berdistribusi B(1,tπ)
E
K
S
P
O
S
U
R
E
Definisikan
Sehingga fungsi inversnya:
note
• Nilai pi bintang akan tetap berada di interval 0 1
karena t kan proporsii..
REGRESSION-WITH EXPOSURE
REGRESSION-WITH EXPOSURE
Hasil Regresi
KESIMPULAN
STEP Effect Entered AIC
0 intercept 33.768.789
1 agecat 33.707.668
2 veh_body 33.691.346
3 valuecat 33.684.214
4 area 33.680.356
Without Exposure With Exposure

More Related Content

Similar to Generalized linear models (logistic regression)

PPT Seminar Hasil Anggi Putri Dewi.pptx
PPT Seminar Hasil Anggi Putri Dewi.pptxPPT Seminar Hasil Anggi Putri Dewi.pptx
PPT Seminar Hasil Anggi Putri Dewi.pptx
HendraPerdana7
 
Modul praktikum kendali lanjut
Modul praktikum kendali lanjutModul praktikum kendali lanjut
Modul praktikum kendali lanjut
Pressa Surya
 
Uji asumsi-klasik-dengan-spss-16.0
Uji asumsi-klasik-dengan-spss-16.0Uji asumsi-klasik-dengan-spss-16.0
Uji asumsi-klasik-dengan-spss-16.0
Shedu Puma
 
Besaran-dan-satuan kelas X IPAS SMKN 2 K
Besaran-dan-satuan kelas X IPAS  SMKN 2 KBesaran-dan-satuan kelas X IPAS  SMKN 2 K
Besaran-dan-satuan kelas X IPAS SMKN 2 K
MariaJemina
 
Analisis regresi-sederhana
Analisis regresi-sederhanaAnalisis regresi-sederhana
Analisis regresi-sederhana
Achmad Alphianto
 

Similar to Generalized linear models (logistic regression) (20)

PPT Seminar Hasil Anggi Putri Dewi.pptx
PPT Seminar Hasil Anggi Putri Dewi.pptxPPT Seminar Hasil Anggi Putri Dewi.pptx
PPT Seminar Hasil Anggi Putri Dewi.pptx
 
Makalah model regresi dengan variabel terikat dummy
Makalah model regresi dengan variabel terikat dummyMakalah model regresi dengan variabel terikat dummy
Makalah model regresi dengan variabel terikat dummy
 
169 525-1-pb
169 525-1-pb169 525-1-pb
169 525-1-pb
 
Modul praktikum kendali lanjut
Modul praktikum kendali lanjutModul praktikum kendali lanjut
Modul praktikum kendali lanjut
 
Jawaban diskusi minggu 11 METODE KUANTITATIF
Jawaban diskusi minggu 11 METODE KUANTITATIFJawaban diskusi minggu 11 METODE KUANTITATIF
Jawaban diskusi minggu 11 METODE KUANTITATIF
 
27 model logistic
27 model logistic27 model logistic
27 model logistic
 
27 model logistic
27 model logistic27 model logistic
27 model logistic
 
Aminullah assagaf model logistic
Aminullah assagaf model logisticAminullah assagaf model logistic
Aminullah assagaf model logistic
 
27 model logistic
27 model logistic27 model logistic
27 model logistic
 
Aminullah assagaf model logistic
Aminullah assagaf model logisticAminullah assagaf model logistic
Aminullah assagaf model logistic
 
Aminullah assagaf model logistic
Aminullah assagaf model logisticAminullah assagaf model logistic
Aminullah assagaf model logistic
 
Uji asumsi-klasik-dengan-spss-16.0
Uji asumsi-klasik-dengan-spss-16.0Uji asumsi-klasik-dengan-spss-16.0
Uji asumsi-klasik-dengan-spss-16.0
 
Regresi
RegresiRegresi
Regresi
 
Regresi Aden 1
Regresi Aden 1Regresi Aden 1
Regresi Aden 1
 
Regresi Aden 1
Regresi Aden 1Regresi Aden 1
Regresi Aden 1
 
REGRESI LOGISTIK - Copy.pptx
REGRESI LOGISTIK - Copy.pptxREGRESI LOGISTIK - Copy.pptx
REGRESI LOGISTIK - Copy.pptx
 
Besaran-dan-satuan kelas X IPAS SMKN 2 K
Besaran-dan-satuan kelas X IPAS  SMKN 2 KBesaran-dan-satuan kelas X IPAS  SMKN 2 K
Besaran-dan-satuan kelas X IPAS SMKN 2 K
 
Besaran-dan-satuan.ppt
Besaran-dan-satuan.pptBesaran-dan-satuan.ppt
Besaran-dan-satuan.ppt
 
Analisis jalur kel 4
Analisis jalur  kel 4Analisis jalur  kel 4
Analisis jalur kel 4
 
Analisis regresi-sederhana
Analisis regresi-sederhanaAnalisis regresi-sederhana
Analisis regresi-sederhana
 

More from Indah Fitri Hapsari

Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...
Indah Fitri Hapsari
 
Laporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimiaLaporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimia
Indah Fitri Hapsari
 

More from Indah Fitri Hapsari (6)

Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based ...
 
Tugas regresi sas
Tugas regresi sasTugas regresi sas
Tugas regresi sas
 
Press dan satistik cp (regresi)
Press dan satistik cp (regresi)Press dan satistik cp (regresi)
Press dan satistik cp (regresi)
 
Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)
 
Laporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimiaLaporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimia
 
Catatan Regresi linier
Catatan Regresi linierCatatan Regresi linier
Catatan Regresi linier
 

Recently uploaded

15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
TaufikTito
 
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
sonyaawitan
 
undang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogorundang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogor
ritch4
 
Diac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponenDiac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponen
BangMahar
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
DosenBernard
 
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.pptKeracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
DIGGIVIO2
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Riyadh +966572737505 get cytotec
 
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerjaContoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
IniiiHeru
 
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptxRESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
mirzagozali2
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
EndangNingsih7
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Riyadh +966572737505 get cytotec
 

Recently uploaded (20)

materi konsep dan Model TRIASE Bencana.pptx
materi konsep dan Model TRIASE Bencana.pptxmateri konsep dan Model TRIASE Bencana.pptx
materi konsep dan Model TRIASE Bencana.pptx
 
Hasil wawancara usaha lumpia basah tugas PKWU
Hasil wawancara usaha lumpia basah tugas PKWUHasil wawancara usaha lumpia basah tugas PKWU
Hasil wawancara usaha lumpia basah tugas PKWU
 
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
15_Contoh_Surat_Lamaran_Kerja_Lengkap_de.pdf
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
4. PENGELOLAAN ALAT MEDIS BEKAS PAKAIhbnbbv PPI DASAR (1).pdf
 
undang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogorundang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogor
 
Diac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponenDiac & Triac untuk memenuhi tugas komponen
Diac & Triac untuk memenuhi tugas komponen
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesia
 
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.pptKeracunan bahan kimia,ektasi,opiat,makanan.ppt
Keracunan bahan kimia,ektasi,opiat,makanan.ppt
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
 
contoh judul tesis untuk mahasiswa pascasarjana
contoh judul tesis untuk mahasiswa pascasarjanacontoh judul tesis untuk mahasiswa pascasarjana
contoh judul tesis untuk mahasiswa pascasarjana
 
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerjaContoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
Contoh laporan K3 perusahaan pada tahun 2023 dgn analisis beban kerja
 
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptxRESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
RESUME KEWARGANEGARAAN_7 DAN 9._tugas ke 2pptx
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
 

Generalized linear models (logistic regression)

  • 2. DATA Data asuransi kendaraan bermotor dengan jangka waktu 1 tahun. Berisi 67856 polis, 4624(6.8%) diantaranya memiliki setidaknya 1 claim (Generalized Linear Models for Insurance Data, Piet de Jong dan Gillian Z. Heller ) Variables: 1. Veh_value: Vehicle value (harga kendaraan) 2. Clm: occurence of claim (mengajukan klaim/tidak) 3. Veh_body: vehicle body (tipe kendaraan) 4. Area: Area tempat tinggal pengemudi 5. Agecat: Kategori usia pengemudi Diketahui data Exposure dari masing-masing polis
  • 3. PEMILIHAN VARIABEL RESPON Clm (occurence of claim) sebagai variabel respon (termasuk variabel kategorikal) Binary outcome ( can take only one of two value 0=No 1=Yes) Sifat distribusi bernoulli: hanya memiliki 2 kemungkinan (2 mutually exclusive and exhaustive ways) Clm berdistribusi B(1,π) Jumlah observasi = jumlah polis= 67856 Tujuan: Mengetahui probabilitas seseorang yang memiliki karakteristik tertentu untuk mengajukan claim
  • 4. REGRESI MENGGUNAKAN GLM • Distribusi Respon (clm) berasal dari distribusi keluarga eksponensial • Transformasi dari mean respon (clm) linear terhadap variabel-variabel prediktornya.
  • 5. DISTRIBUSI BERNOULI SEBAGAI ANGGOTA KELUARGA DISTRIBUSI EKSPONENSIAL Bentuk distribusi keluarga eksponensial Misal y=clm (occurrence of claim), y~B(1,π)
  • 6. Note slide sebelumnya • Choice a(theta) determine the actual probability function----habis menetapkan distribu, taksir parameter miu dan variansi dari sampel. (metode momen) atau pake mle, kan y i nya iid. • Fungsi Variansi (relationship between variance and mean). Mean kan bervariasi sesuai eksplanatori variables, karena mean nya bervariasi, begitu juga variansinya. Mereka dihubungkan melalui fungsi variansi.
  • 7. Pemilihan Fungsi Link • Link kanonik untuk distribusi binomial Sehingga untuk bernoulli: Nilai π yang dipilih: Probability bahwa clm bernilai 1 (Yes)
  • 8. Note slide sebelumnya • Link kanonik g(miu)=theta-- parameter kanonik tujuan buat menyimpelkan estimasi • Link logit memastikan bahwa pi berada di interval 0,1 untuk semua x dan beta
  • 9. Predictor 1 1. Veh_value (vehicle value, in $10,000s) Jenis variabel: Kontinu
  • 10. Predictor 1 1. Veh_value (vehicle value, in $10,000s) Hubungan dengan variabel respon
  • 11. Predictor 1. Veh_value (vehicle value, in $10,000s) Hubungan dengan variabel respon:
  • 12. Penjelasan gambar slide sebelumnya • Scatter plot smoother menunjukkan hubungan yang tidak linier. Terlihat bahwa mngkn hubungannya kuadratik atau kubik • Ini buat memenuhi asumsi kelinearan antara fungsi dr respon dengan prediktor • Model kuadratik punya kelemahan di oddnya. • Nilai AIC paling kecil g menjamin model paling oke harus di fit
  • 13. Banding Vehicle Value clm value(vehicle valuecategory) 1 2 3 4 5 6 0 0,756529 0,155476 0,017287 0,001474 0,000619 0,000472 1 0,053584 0,013101 0,001356 5,89E-05 2,95E-05 1,47E-05
  • 14. Predictor 2 Veh_body (vehicle body/tipe kendaraan) Jenis variabel: Kategorikal 1. BUS 2. CONVT = convertible 3. COUPE 4. HBACK = hatchback 5. HDTOP = hardtop 6. MCARA = motorized caravan 7. MIBUS = minibus 8. PANVN = panel van 9. RDSTR = roadster 10. SEDAN 11. STNWG = station wagon 12. TRUCK 13. UTE - utility
  • 15. Predictor 3. Agecate (kategori usia) Jenis variabel: Kategorikal 1 2 3 4 5 6 clm Age Category 1 2 3 4 5 6 0 0,077311 0,176005 0,215957 0,222309 0,149169 0,091105 1 0,00731 0,013735 0,016402 0,01627 0,009049 0,005379
  • 16. Predictor 4. Area (Area tinggal pengemudi) Jenis variabel: Kategorikal A B C D E F clm Area 1 2 3 4 5 6 0 0,224402 0,182386 0,281891 0,113137 0,081437 0,048603 1 0,01599 0,014221 0,020809 0,00731 0,005689 0,004126
  • 17. Pemilihan Base Level 12 var 5 var 5 var 5 varagecat 1 2 3 4 5 6 5742 12875 15767 16189 10736 6547 area A B C D E F 16312 13341 20540 8173 5912 3578 veh_body BUS CONVT COPUE HBACK HDTOP MCARA MIBUS 48 81 780 18915 1579 127 717 PANVN RDSTR SEDAN STNWG TRUCK UTE 752 27 22233 16261 1750 4586 valuecat 1 2 3 4 5 6 54971 11439 1265 104 44 33 Full model
  • 18. STEPWISE REGRESSION-WITHOUT EXPOSURE Agecat entered STEP 1 AIC = -2 Log L + 2((k-1) + s) Memberikan Penalti Likelihood ratio: -2 Log L(null model) - 2 Log L(fitted model)
  • 20. Penjelasan slide sebelumnya • Chi square: Ngetes 1 variabel dengan asumsi variabel lainnya di step tersebut ada di dlm model. Distribusi chi square karena variansi heteroskedastik. Kalo p value sama2 kecil, lihat nilai score chi square. Significantly different from 0. • Yang diuji beta j-0/ variansi beta j. H0: C.Beta =0 H1: C.Beta tdk=0 • AIC k=jumlah level prediktor s=jumlah prediktor • Score Chi-Square Test : at least one of the predictors' regression coefficient is not equal to zero in the model
  • 22. STEPWISE REGRESSION- WITHOUT EXPOSURE Analysis of effect eligible for enty Testing global null hipotesis MLE of Parameter Odd ratio Estimate Analysis of effect eligible for removal
  • 23. STEPWISE REGRESSION SUMMARY-WITHOUT EXPOSURE STEP Effect Entered AIC 0 intercept 33.768.78 9 1 agecat 33.707.66 8 2 veh_body 33.691.34 6 3 valuecat 33.684.21 4 4 area 33.680.35 6
  • 24. STEPWISE REGRESSION SELECTED MODEL-WITHOUT EXPOSURE STEP Effect Entered AIC 0 intercept 33.768.789 1 agecat 33.707.668 2 veh_body 33.691.346 3 valuecat 33.684.214 4 area 33.680.356 Sensitivity: Frekuensi relatif dari memprediksi sebuah kejadian (claim) ketika kejadian tersebut terjadi Specificity:Frekuensi relatif dari memprediksi tidak terjadinya sebuah kejadian ketika kejadian (claim) tersebut memang tidak terjadi
  • 27. Considering the exposure Exposure (t) : proporsi yang menunjukkan perbandingan jangka waktu polis yang terekspose terhadap jangka waktu polis yang seharusnya. Clm berdistribusi B(1,π) Clm berdistribusi B(1,tπ) E K S P O S U R E Definisikan Sehingga fungsi inversnya:
  • 28. note • Nilai pi bintang akan tetap berada di interval 0 1 karena t kan proporsii..
  • 31. KESIMPULAN STEP Effect Entered AIC 0 intercept 33.768.789 1 agecat 33.707.668 2 veh_body 33.691.346 3 valuecat 33.684.214 4 area 33.680.356 Without Exposure With Exposure