LECTURE NOTES #7

                          HETEROKEDASTISITAS

I.    Pendahuluan
      Pada bagian sebelumnya telah dibah...
Secara formal homokedastisitas dinyatakan sbg

Var (u x1 , x2 ,..., xk ) = σ 2                    ………………………1)
Jika asumsi ...
benar dengan demikian kesalahan akibat proses ekstraksi data akan
       semakin menurun.
    d. Keberadaan Outlier. Outli...
^                    σ2
     V ar( β 1 ) =    n                  _
                                                       ...
Grafik 3 menunjukkan pola-pola residual kuadrat yang mungkin sering
diamati pada penelitian. Disini kita melakukan plottin...
Raux 2 / k
         Fht =                          ;
               (1 − Raux ) /(n − k − 1)
                        2
   ...
Kita akan menggunakan prosedur Breusch-Pagan untuk mendeteksi
    keberadaan heterokedastisitas. Untuk itu kita mentabulas...
Preposisi ini dapat diuji melalui model regresi auxiliary berikut

^2
u = δ 0 + δ1 x1 + ... + δ k xk + δ k +1 x12 + ... + ...
diakses pada sub menu output hasil regresi (tabel 1), menu View,
     Residual Test, White Heterocedasticity (cross terms)...
Suatu catatan terkait dengan pengujian heterokedastisitas perlu diberikan
     disini. Dari pembahasan penyebab heterokeda...
Hampir semua paket software ekonometrika/statistik telah memasukkan
     Heterocedasticity Robust Standard Error kedalam r...
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/09/08 Time: 10:05
Sample: 1 732 IF SPRING=1
Incl...
Dependent Variable: CUMGPA
Method: Least Squares
Date: 06/09/08 Time: 08:55
Sample: 1 732 IF SPRING=1
Included observation...
Selanjutnya kita dapat melakukan transformasi atas model awal yang mengalami
heterokedastisitas, yakni


yi = β 0 + β1 x1i...
Sample: 1 100
Included observations: 100

       Variable         Coefficient      Std. Error    t-Statistic     Prob.

  ...
Adjusted R-squared        0.056551      S.D. dependent var      2675.843
S.E. of regression        2686.849      Akaike in...
Contoh 5.
Dengan menggunakan data smoke.raw akan diestimasi regresi cigs terhadap
log(income), log(cigpric), educ, age, ag...
EDUC          -0.463446     0.120159     -3.856953     0.0001
        AGE           0.481948     0.096808      4.978378   ...
Upcoming SlideShare
Loading in …5
×

Heterokesdatisitas

4,774 views

Published on

Published in: Business, Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
4,774
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
206
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Heterokesdatisitas

  1. 1. LECTURE NOTES #7 HETEROKEDASTISITAS I. Pendahuluan Pada bagian sebelumnya telah dibahas penggunaan Ordinary Least Square untuk mengestimasi suatu garis regresi linier berganda serta prosedur inferensinya. Seperti yang diketahui jika asumsi klasik (Gauss-Markov) dipenuhi maka parameter yang diperoleh dengan teknik ini adalah bersifat Best Liniear Unbiased Estimator (BLUE). Dalam prakteknya sangat mungkin sekali satu atau lebih asumsi tersebut tidak dapat dipenuhi. Dengan demikian maka estimator OLS tidak lagi BLUE. Pada kasus yang ekstrim estimator dan/atau pengujian hipotesa bahkan tidak dapat dilakukan. Dalam bagian ini akan dibahas suatu pelanggaran asumsi klasik yang sering terjadi yakni heterokedastisitas. Pelanggaran asumsi ini terjadi ketika residual tidak lagi konstan melainkan bersifat variabel. Kita akan membahas konsep/pengertian dari heterokedastisitas dan implikasi yang ditimbulkannya. Pada beberapa kasus heterokedastisitas dapat diobservasi secara kasual (pengamatan melalui pola residual), namun sering kali tidak. Untuk itu perlu dikembangkan teknik pengujian formal berdasarkan suatu kaidah statistik. teknik deteksi dan metoda koreksi. II. Konsep Heterokedastisitas Salah satu asumsi penting (asumsi Gauss Markov) didalam penggunaan estimator OLS agar ia bersifat Best Liniear Unbiased Estimator (BLUE) adalah varians yang konstan. Varians dari residual tidak berubah dengan berubahnya satu atau lebih variabel bebas (Homokedastisitas). Secara grafis hal ini ditunjukkan pada grafik 1. Grafik 1. Residual dengan Sifat Homokedastis 1
  2. 2. Secara formal homokedastisitas dinyatakan sbg Var (u x1 , x2 ,..., xk ) = σ 2 ………………………1) Jika asumsi ini terlanggar maka dapat dinyatakan Var (u x1 , x2 ,..., xk ) = σ i 2 ………………………2) Dimana indeks I menunjukkan bahwa varians berubah dari observasi ke observasi (bersifat variabel). Secara grafis hal ini ditunjukkan sbb Grafik 2. Residual dengan Sifat Heterokedastis Terdapat beberapa alasan mengapa residual regresi dapat bersifat seperti ini, diantaranya: a. Terdapat situasi error learning, misalnya kita ingin mengetahui hubungan tingkat kesalahan mengetik terhadap berbagai variabel. Jika kita menggunakan sample yang bersifat panel/time series akan sangat mungkin model yang dimiliki akan bersifat heterokedastis. Hal ini disebabkan kesalahan pengetikan akan menurun dari waktu ke waktu dan terjadi konvergensi diantara elemen sample (kesalahan anggota sample yang paling tidak terampir akan menurun mendekati mereka yang awalnya sudah terampil). b. Peningkatan diskresi. Hal ini tampak jelas pada penelitian dengan menggunakan variabel pendapatan. Aktivitas oleh individu yang memiliki pendapatan tinggi akan jauh lebih variatif dibandingkan mereka yang berpendapatan rendah. Dengan demikian suatu model regresi dengan menggunakan variabel semacam ini akan mengalami peningkatan residual kuadrat dengan semakin besarnya pendapatan. c. Perbaikan teknik pengambilan data. Kembali hal ini relevan jika data bersifat panel (data diambil dari individu yang sama pada titik waktu berbeda-beda). Peneliti akan belajar untuk menarik informasi dengan 2
  3. 3. benar dengan demikian kesalahan akibat proses ekstraksi data akan semakin menurun. d. Keberadaan Outlier. Outlier adalah data yang memiliki karakteristik sangat berbeda dari kondisi yang umum. Misalnya kita memiliki suatu set data pendapatan dengan kisaran IDR 2-5 juta per bulan, keberadaan individu dengan pendapatan 100 juta dapat dikatakan outlier. e. Masalah spesifikasi. Jika model pada populasi adalah non linier (misalnya eksponensial) namun kita memaksa penggunaan model linier. Disini kuadrat residual akan meningkat dengan cepat dengan meningkatnya nilai variabel bebas. III. Implikasi Heterokedastisitas Terlanggarnya asumsi ini (disebut Heterokedastisitas) tidak menyebabkan estimator (βi) menjadi bias karena residual bukanlah komponen didalam perhitungan. Sebagai ilustrasi, kita gunakan model regresi sederhana dua variabel sbb: y = β 0 + β1 x + u ………………………3) Parameter model regresi dapat dihitung dengan formula sbb: n _ _ ^ ∑ ( x − x)( y − y) i i Cov( x, y ) β1 = i =1 n _ = ∑ ( x − x) 2 Var ( x) i i =1 ^ _ _ β 0 = y − β1 x ………………………4) Dapat dilihat pada persamaan 4, residual kuadrat bukanlah komponen didalam perhitungan parameter. Namun demikian heterokedastisitas menyebabkan standar error dari model regresi menjadi bias, dan sebagai konsekuensinya matriks varians-kovarians yang digunakan untuk menghitung standar error parameter menjadi bias pula. Untuk model sederhana diatas, standar error parameter dapat dihitung sbb: 3
  4. 4. ^ σ2 V ar( β 1 ) = n _ ………………………5) ∑ ( x − x) i =1 i 2 Dengan demikian pada asumsi heterokedastisitas dapat ditunjukkan formula yang valid bagi persamaan 5 adalah n _ ^ ∑ ( x − x) σi 2 i 2 V ar( β 1 ) = i =1 n _ ………………………6) ∑ ( x − x) i =1 i 2 Hasil kedua formula ini umumnya adalah berbeda, akan sama jika σi2 = σ2, suatu konstanta. Seperti yang diketahui pengujian hipotesa baik t test maupun F test sangatlah tergantung pada standar error yang benar. Dengan demikian masalah heterokedastisitas akan menyebabkan pengambilan kesimpulan berdasarkan rejection rule yang ada akan menjadi tidak valid. IV. Teknik Deteksi Kita dapat mendeteksi keberadaan heterokedastisitas melalui suatu metoda kasual, yakni mengamati pola residual kuadrat. Jika heterokedastisitas ada pada model hal ini dapat terlihat dengan adanya suatu pola tertentu pada grafik residual kuadrat. Grafik 3. Berbagai Pola Residual Kuadrat 4
  5. 5. Grafik 3 menunjukkan pola-pola residual kuadrat yang mungkin sering diamati pada penelitian. Disini kita melakukan plotting residual kuadrat terhadap fitted value namun pola yang sama juga dapat diperoleh jika kita mengganti fitted valued dengan nilai observasi salah satu variabel bebas. Pola 3a. menunjukkan situasi homokedastisitas, disini residual kuadrat berada pada interval yang sama pada setiap tingkat fitted value. Sedangkan pola 3b s/d 3e menunjukkan bahwa selang residual kuadrat adalah bersifat variabel (misalnya kuadratik pada pola 3d). Kita tentunya membutuhkan suatu prosedur formal yang dapat digunakan untuk mendeteksi adanya heterokedastisitas (pengamatan kasual tidaklah mencukupi). Terdapat banyak test yang dikembangkan untuk menguji keberadaan heterokedastisitas, namun disini kita akan membahas 2 metoda yang paling popular, yakni: Breusch-Pagan Test dan White Test (lihat Gujarati, 2003 untuk jenis test lainnya). Prosedur Breusch-Pagan (1980) mengasumsikan bahwa ketika varians residual adalah tidak konstan maka ia akan berhubungan dengan satu atau lebih variabel dalam spesifikasi yang linier. Adapun langkah-langkah test dapat diuraikan sbb: a. Estimasi model, misalnya dengan k regresor sbb y = β 0 + β1 x1 + β 2 x2 + ... + β k xk + u ………………………7) b. Jika kita menduga bahwa model ini mengalami heterokedastisitas, maka laksanakan regresi auxiliary sbb ^2 u = δ 0 + δ1 x1 + δ 2 x2 + ... + δ k xk + v ………………………8) ^ 2 Nilai u diperoleh dari residual persamaan 7, yakni ^ ^ ^ ^ ^ u i = y − β 0 − β 1 x1 − β 2 x2 − ... − β k xk ………………………9) c. Set up hipotesis yang digunakan disini adalah H 0 : δ1 = δ 2 = ... = δ k =0 ……………………10) H1 : Paling tidak satu δ i ≠ 0 Hipotesis null yang digunakan adalah tidak terdapat heterokedastisitas (residual memiliki pola homokedastis). d. Hitung statistik uji Fht atau LM sbb: 5
  6. 6. Raux 2 / k Fht = ; (1 − Raux ) /(n − k − 1) 2 ……………………11) LM = nRaux 2 Dimana Raux2 diperoleh dari regresi auxiliary (persamaan 8), n adalah jumlah sample dan k adalah jumlah variabel bebas (diluar intersep). e. Statistik Fht dan LM masing-masing didistribusikan mengikuti F(df : k, n-k-1) dan Chi Square, χ2 (df=k). Dengan demikian kita dapat menggunakan salah satu criteria rejection rule: nilai kritis atau p value pada α yang relevan (misalnya 5% atau 1%). Jika hipotesis null tidak dapat ditolak, maka dapat disimpulkan bahwa model regresi yang dimiliki tidak mengalami masalah heterokedastisitas (paling tidak jika ia berbentuk linier). Sedangkan penolakan terhadap hipotesis null memberikan indikasi bahwa model mengalami heterokedastisitas dan perlu dilakukan koreksi. Contoh 1: Dengan menggunakan data Hprice1.raw, kita akan melakukan estimasi model regresi linier yang menghubungkan harga rumah (price) terhadap variabel lotsize, sqrft dan bdrms. Hasil regresi yang dilakukan diberikan pada tabel 1. Dependent Variable: PRICE Method: Least Squares Date: 06/08/08 Time: 10:00 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob. C -21.77031 29.47504 -0.738601 0.4622 LOTSIZE 0.002068 0.000642 3.220096 0.0018 SQRFT 0.122778 0.013237 9.275093 0.0000 BDRMS 13.85252 9.010145 1.537436 0.1279 R-squared 0.672362 Mean dependent var 293.5460 Adjusted R-squared 0.660661 S.D. dependent var 102.7134 S.E. of regression 59.83348 Akaike info criterion 11.06540 Sum squared resid 300723.8 Schwarz criterion 11.17800 Log likelihood -482.8775 F-statistic 57.46023 Durbin-Watson stat 2.109796 Prob(F-statistic) 0.000000 Tabel 1. Print Output Regresi Contoh 1 6
  7. 7. Kita akan menggunakan prosedur Breusch-Pagan untuk mendeteksi keberadaan heterokedastisitas. Untuk itu kita mentabulasikan dahulu residual dari regresi diatas dengan nama u dan melakukan regresi auxiliary residual kuadrat terhadap seluruh variabel bebas. Ketika ini dilaksanakan hasil yang diperoleh adalah Dependent Variable: U^2 Method: Least Squares Date: 06/08/08 Time: 10:01 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob. C -5522.795 3259.478 -1.694380 0.0939 LOTSIZE 0.201521 0.071009 2.837961 0.0057 SQRFT 1.691037 1.463850 1.155198 0.2513 BDRMS 1041.760 996.3810 1.045544 0.2988 R-squared 0.160141 Mean dependent var 3417.316 Adjusted R-squared 0.130146 S.D. dependent var 7094.384 S.E. of regression 6616.646 Akaike info criterion 20.47695 Sum squared resid 3.68E+09 Schwarz criterion 20.58956 Log likelihood -896.9860 F-statistic 5.338919 Durbin-Watson stat 2.351111 Prob(F-statistic) 0.002048 Tabel 2. Auxiliary Regression Contoh 1 Dengan demikian nilai F atau LM dapat dihitung dengan cara 1.601/ 3 Fht = ≈ 5.34 (1 − 1.601) /(84) ……………………12) LM = (88)(1.601) ≈ 14.09 Nilai p value terkait dengan Fht dan LM adalah masing-masing 0.02 dan 0.028, dan keduanya dibawah 5%. Dengan demikian hasil test menunjukkan model regresi mengalami heterokedastisitas. White (1980) melakukan evaluasi terhadap pola-pola residual kuadrat serta mengkaitkannya dengan asumsi Gauss Markov: Homokedastisitas. Dalam analisisnya tersebut ia berkesimpulan bahwa asumsi ini dapat diperlunak dengan menyatakan bahwa residual kuadrat tidak berkorelasi dengan seluruh variabel bebas (xj), kuadrat variabel bebas (x2j) dan cross product (xjxh dimana j≠h). 7
  8. 8. Preposisi ini dapat diuji melalui model regresi auxiliary berikut ^2 u = δ 0 + δ1 x1 + ... + δ k xk + δ k +1 x12 + ... + δ k + k xk 2 + δ k + k +1 x1 x2 + ... + δ k + k + C xk −1 xk + error ……………………13) dimana C = kombinasi 2 dari pilihan k Adapun set up hipotesis yang digunakan adalah H 0 : δ1 = δ 2 = ... = δ k + k +C =0 ……………………14) H1 : Paling tidak satu δ m ≠ 0 (m=1,...,k+k+C) Rejection rule dilakukan dengan menggunakan statistik F atau LM dengan perhitungan sebagaimana diberikan pada persamaan 11. Pengujian sebagaimana diuraikan diatas memiliki kelemahan karena memakan banyak degree of freedom. Disini terlalu banyak parameter yang diestimasi, sebagai contoh dengan model hanya 3 variabel kita akan mengestimasi 9 parameter (=3+3+3). Untuk itu Wooldridge (2005) menyarankan modifikasi dengan menggunakan fitted value, ingat bahwa fitted value dapat diperoleh dengan cara ^ ^ ^ ^ ^ y i = β 0 + β 1 x1i + β 2 x2i + ... + β k xki ……………………15) dimana i adalah observasi. Dengan demikian kita dapat memodifikasi persamaan 13 menjadi ^2 ^ ^2 u = δ 0 + δ1 y + δ 2 y + error ……………………16) Rejection rule terhadap null hipotesis δ1=δ1=0 dapat dilakukan dengan menggunakan statistik F atau LM dengan perhitungan sebagaimana diberikan pada persamaan 11. Contoh 2. Masih dengan menggunakan data pada contoh 1, disini kita mengganti prosedur Breusch-Pagan dengan White test. Prosedur White Test dapat 8
  9. 9. diakses pada sub menu output hasil regresi (tabel 1), menu View, Residual Test, White Heterocedasticity (cross terms). Hasil yang diperoleh diberikan oleh tabel 3. White Heteroskedasticity Test: F-statistic 5.386953 Prob. F(9,78) 0.000010 Obs*R-squared 33.73166 Prob. Chi-Square(9) 0.000100 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/09/08 Time: 08:45 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob. C 15626.24 11369.41 1.374411 0.1733 LOTSIZE -1.859507 0.637097 -2.918719 0.0046 LOTSIZE^2 -4.98E-07 4.63E-06 -0.107498 0.9147 LOTSIZE*SQRFT 0.000457 0.000277 1.649673 0.1030 LOTSIZE*BDRMS 0.314647 0.252094 1.248135 0.2157 SQRFT -2.673918 8.662183 -0.308689 0.7584 SQRFT^2 0.000352 0.001840 0.191484 0.8486 SQRFT*BDRMS -1.020860 1.667154 -0.612337 0.5421 BDRMS -1982.841 5438.483 -0.364595 0.7164 BDRMS^2 289.7541 758.8303 0.381843 0.7036 R-squared 0.383314 Mean dependent var 3417.316 Adjusted R-squared 0.312158 S.D. dependent var 7094.384 S.E. of regression 5883.814 Akaike info criterion 20.30444 Sum squared resid 2.70E+09 Schwarz criterion 20.58596 Log likelihood -883.3955 F-statistic 5.386953 Durbin-Watson stat 2.052712 Prob(F-statistic) 0.000010 Tabel 3. White Heterocedasticity Test Seperti yang dapat dilihat pada tabel 3, prosedur yang ada pada Eviews menggunakan spesifikasi persamaan 13. Baik F maupun LM test menunjukkan hipotesis null homokedastisitas dapat ditolak. Dengan demikian sejalan dengan Breusch-Pagan Test, White Test juga mengindikasikan model mengalami heterokedastisitas. 9
  10. 10. Suatu catatan terkait dengan pengujian heterokedastisitas perlu diberikan disini. Dari pembahasan penyebab heterokedastisitas diketahui bahwa fenomena ini dapat terjadi karena masalah misspesifikasi bentuk fungsional. Disisi lain uji yang telah dipelajari mengasumsikan bahwa pola heterokedastisitas adalah linier terhadap variabel bebas. Dengan demikian Wooldridge (2005) menyarankan untuk melakukan uji spesifikasi terdahulu terhadap model sebelum melakukan uji heterokedastisitas. Uji heterokedastisitas dilakukan jika bentuk fungsional model sudah benar. V. Prosedur Koreksi Jika pada suatu model regresi terdeteksi heterokedastisitas maka standar error dari regresi menjadi bias. Sebagai konsekuensinya seluruh tipe uji hipotesis (parsial dan exclusion) menjadi menyesatkan. Untuk itu perlu dilakukan koreksi terhadap model. Terdapat 2 tipe koreksi yakni (1) koreksi terhadap standar error regresi dan (2) Generalized Least Square/GLS. Tipe koreksi yang pertama dilakukan hanya terbatas pada standar error regresi. Tidak ada modifikasi atau estimasi ulang atas parameter yang diperoleh dari OLS. Koreksi terhadap standar error regresi dilakukan melalui prosedur yang diuraikan oleh White (1980) dan dikenal dengan nama Heterocedasticity Robust Standard Error. Uraian bagaimana koreksi dilakukan terhadap varians error model regresi bersifat sangat teknis, dan kita tidak akan membahasnya. White (1980) menunjukkan bahwa suatu standar error yang bersifat robust terhadap heterokedastisitas (yang bahkan bersifat unknown form) dapat dihitung dengan formulas sbb: n ^2 ^ 2 ^ ∑r ij ui V ar( β j ) = i =1 n _ ; ∑ ( x − x) i =1 i 2 ……………………17) ^ ^ SE ( β j ) = V ar( β j ) ^2 dimana r ij menunjukkan residual ke i dari regresi variabel xj terhadap seluruh variabel independen lainnya. Dengan diperolehnya standar error yang robust terhadap heterokedastisitas (persamaan 17) maka perhitungan statistik uji t dapat dilakukan dengan menggantikan standar error OLS semula dengan formula yang baru ini. 10
  11. 11. Hampir semua paket software ekonometrika/statistik telah memasukkan Heterocedasticity Robust Standard Error kedalam routine yang dimilikinya. Namun demikian perhitungan exclusion test dan overall significance test bersifat jauh lebih rumit dan kita tidak akan membahasnya. Bagi pembaca yang tertarik dapat merujuk pada Wooldrige hal 253-254. Contoh 3. Dengan menggunakan data pada GPA3.raw, kita akan mengestimasi regresi cumgpa terhadap sat, hsperc, tothrs, female, black dan white. Dengan menggunakan prosedur biasa diperoleh hasil pada tabel 4 Dependent Variable: CUMGPA Method: Least Squares Date: 06/09/08 Time: 08:54 Sample: 1 732 IF SPRING=1 Included observations: 366 Variable Coefficient Std. Error t-Statistic Prob. C 1.470065 0.229803 6.397063 0.0000 SAT 0.001141 0.000179 6.388504 0.0000 HSPERC -0.008566 0.001240 -6.906003 0.0000 TOTHRS 0.002504 0.000731 3.425510 0.0007 FEMALE 0.303433 0.059020 5.141165 0.0000 BLACK -0.128284 0.147370 -0.870486 0.3846 WHITE -0.058722 0.140990 -0.416497 0.6773 R-squared 0.400560 Mean dependent var 2.334153 Adjusted R-squared 0.390542 S.D. dependent var 0.601126 S.E. of regression 0.469286 Akaike info criterion 1.343732 Sum squared resid 79.06233 Schwarz criterion 1.418372 Log likelihood -238.9029 F-statistic 39.98208 Prob(F-statistic) 0.000000 Tabel 4. Print Out Regresi Contoh 3. Model ini mengalami masalah heterokedastisitas. Hal ini dapat dilihat melalui pengujian White Heterocedasticity Test, dimana baik nilai p value maupun F, menunjukkan dengan sangat kuat bahwa hipotesis null homokedastisitas adalah ditolak. White Heteroskedasticity Test: F-statistic 3.629836 Prob. F(23,342) 0.000000 Obs*R-squared 71.81422 Prob. Chi-Square(23) 0.000001 11
  12. 12. Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/09/08 Time: 10:05 Sample: 1 732 IF SPRING=1 Included observations: 366 Collinear test regressors dropped from specification Variable Coefficient Std. Error t-Statistic Prob. C 0.748114 1.006458 0.743314 0.4578 SAT -0.000930 0.001461 -0.636818 0.5247 SAT^2 6.85E-07 6.21E-07 1.102059 0.2712 SAT*HSPERC -8.15E-07 5.94E-06 -0.137065 0.8911 SAT*TOTHRS -6.69E-06 3.76E-06 -1.779145 0.0761 SAT*FEMALE -0.000232 0.000303 -0.767388 0.4434 SAT*BLACK 0.000798 0.000810 0.985402 0.3251 SAT*WHITE 0.000342 0.000722 0.473846 0.6359 HSPERC -0.007883 0.008268 -0.953522 0.3410 HSPERC^2 7.75E-05 3.74E-05 2.069623 0.0392 HSPERC*TOTHRS -5.63E-06 2.69E-05 -0.209662 0.8341 HSPERC*FEMALE -0.000903 0.002409 -0.375028 0.7079 HSPERC*BLACK 0.001311 0.005295 0.247640 0.8046 HSPERC*WHITE 0.004146 0.004907 0.845006 0.3987 TOTHRS -0.000258 0.006853 -0.037671 0.9700 TOTHRS^2 5.05E-05 1.73E-05 2.921279 0.0037 TOTHRS*FEMALE -0.000609 0.001214 -0.502005 0.6160 TOTHRS*BLACK -0.003979 0.005439 -0.731463 0.4650 TOTHRS*WHITE -0.002024 0.005387 -0.375695 0.7074 FEMALE 0.190255 0.432399 0.439999 0.6602 FEMALE*BLACK -0.045258 0.319959 -0.141450 0.8876 FEMALE*WHITE 0.127827 0.305694 0.418152 0.6761 BLACK -0.433255 0.896341 -0.483360 0.6291 WHITE -0.305580 0.821256 -0.372089 0.7101 R-squared 0.196214 Mean dependent var 0.216017 Adjusted R-squared 0.142158 S.D. dependent var 0.348846 S.E. of regression 0.323101 Akaike info criterion 0.641619 Sum squared resid 35.70277 Schwarz criterion 0.897530 Log likelihood -93.41635 F-statistic 3.629836 Prob(F-statistic) 0.000000 Tabel 5. White Heterocedasticity Test Contoh 3. Dengan demikian perlu dilakukan koreksi terhadap standar error dari parameter. Hasil yang diperoleh dari prosedur ini diberikan oleh tabel 6. 12
  13. 13. Dependent Variable: CUMGPA Method: Least Squares Date: 06/09/08 Time: 08:55 Sample: 1 732 IF SPRING=1 Included observations: 366 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-Statistic Prob. C 1.470065 0.220680 6.661516 0.0000 SAT 0.001141 0.000192 5.955817 0.0000 HSPERC -0.008566 0.001418 -6.041464 0.0000 TOTHRS 0.002504 0.000741 3.380845 0.0008 FEMALE 0.303433 0.059138 5.130949 0.0000 BLACK -0.128284 0.119241 -1.075833 0.2827 WHITE -0.058722 0.111392 -0.527163 0.5984 R-squared 0.400560 Mean dependent var 2.334153 Adjusted R-squared 0.390542 S.D. dependent var 0.601126 S.E. of regression 0.469286 Akaike info criterion 1.343732 Sum squared resid 79.06233 Schwarz criterion 1.418372 Log likelihood -238.9029 F-statistic 39.98208 Prob(F-statistic) 0.000000 Tabel 6. Reestimasi Contoh 3 dengan Heterocedasticity Robust Standard Error Generalized Least Squares (GLS) adalah prosedur koreksi heterokedastisitas dengan cara melakukan transformasi dan reestimasi. Jika kita mengetahui bentuk spesifik dari heterokedastisitas (misalnya linier terhadap variabel bebas) maka kita dapat memodifikasi nilai variabel tergantung dan variabel bebas sesuai dengan bentuk heterokedastisitas dan mengestimasinya kembali. Salah satu bentuk yang paling sering digunakan dalam mengasumsikan heterokedastisitas adalah multiplicative constant, yakni Var (u x) = σ 2 h( x) ……………………18) dimana x menyatakan seluruh variabel bebas dan h(x) adalah suatu fungsi dari variabel bebas yang menentukan heterokedastisitas. Dengan demikian heterokedastisitas dalam asumsi ini dapat dinyatakan sebagai σ 2i = Var (ui xi ) = σ 2 h( xi ) = σ 2 hi ……………………19) 13
  14. 14. Selanjutnya kita dapat melakukan transformasi atas model awal yang mengalami heterokedastisitas, yakni yi = β 0 + β1 x1i + β 2 x2i + ... + β k xki + ui ……………………20) menjadi suatu model dengan residual yang homokedastisitas. Hal ini dapat dilakukan dengan membagi seluruh regressor dan regresand dengan hi (disebut dengan penimbang/bobot). Dapat ditunjukkan disini residual model hasil transformasi, yakni ( ) ( yi / hi = β 0 / hi + β1 x1i / hi + β 2 x2i / hi + ... ) ( + β k xki / h ) + (u / h ) i i i ……………………21) atau y *i = β 0 x *0i + β1 x *1i + β 2 x *2i +... + β k x *ki +u *i memiliki pola homokedastis, atau Var (u *i ) = Var (ui / hi ) = E ⎡ ui / hi ( )⎤ 2 ⎢ ⎣ ⎥ ⎦ = E ( ui ) / hi = σ 2 hi / hi = σ 2 2 ……………………22) Transformasi ini adalah suatu kelas khusus dari GLS yang disebut weighted least squares (WLS). Standar error hasil regresi yang ditransformasi (persamaan 21) adalah tidak bias dan dengan demikian prosedur pengujian (t dan F test) menjadi valid. Tidak ada yang berubah dalam formula perhitungan dan rejection rule, kita tetap menggunakan standar intrepretasi regresi linier berganda. Disamping itu meskipun kita melakukan transformasi terhadap model regresi, intrepretasi koefisien tetap dilakukan seperti regresi awal. Contoh 4 Dengan menggunakan data saving.raw, kita akan mengestimasi hubungan tingkat simpanan rumah tangga (sav) terhadap pendapatan (inc), ukuran RT (size), pendidikan (educ), usia (age) dan ras (black). Hasil estimasi awal dirangkum pada tabel Dependent Variable: SAV Method: Least Squares Date: 06/10/08 Time: 07:04 14
  15. 15. Sample: 1 100 Included observations: 100 Variable Coefficient Std. Error t-Statistic Prob. C -1605.416 2830.707 -0.567143 0.5720 INC 0.109455 0.071432 1.532304 0.1288 SIZE 67.66119 222.9642 0.303462 0.7622 EDUC 151.8235 117.2487 1.294885 0.1985 AGE 0.285722 50.03108 0.005711 0.9955 BLACK 518.3934 1308.063 0.396306 0.6928 R-squared 0.082775 Mean dependent var 1582.510 Adjusted R-squared 0.033987 S.D. dependent var 3284.902 S.E. of regression 3228.598 Akaike info criterion 19.05561 Sum squared resid 9.80E+08 Schwarz criterion 19.21192 Log likelihood -946.7804 F-statistic 1.696615 Durbin-Watson stat 1.594808 Prob(F-statistic) 0.142998 Tabel 7. Print Out Regresi Contoh 4 Selanjutnya jika kita menduga bahwa heterokedastisitas terjadi dengan mengambil bentuk linier terhadap inc (σ2i=σ2 inc) maka transformasi dilakukan dengan menggunakan akar kuadrat inc sebagai bobot. Pada Eviews hal ini dilakukan melalui sub menu output/estimate/option isikan opsi Weighted LS/TSLS dengan (inc)^-0.5. Hasil yang diperoleh adalah pada tabel 8. Dependent Variable: SAV Method: Least Squares Date: 06/10/08 Time: 07:06 Sample: 1 100 Included observations: 100 Weighting series: (INC)^-0.5 Variable Coefficient Std. Error t-Statistic Prob. C -1854.814 2351.797 -0.788680 0.4323 INC 0.100518 0.077251 1.301184 0.1964 SIZE -6.868501 168.4327 -0.040779 0.9676 EDUC 139.4802 100.5362 1.387363 0.1686 AGE 21.74721 41.30598 0.526491 0.5998 BLACK 137.2842 844.5941 0.162545 0.8712 Weighted Statistics R-squared 0.104200 Mean dependent var 1364.931 15
  16. 16. Adjusted R-squared 0.056551 S.D. dependent var 2675.843 S.E. of regression 2686.849 Akaike info criterion 18.68825 Sum squared resid 6.79E+08 Schwarz criterion 18.84456 Log likelihood -928.4125 F-statistic 2.186836 Durbin-Watson stat 1.598984 Prob(F-statistic) 0.062100 Unweighted Statistics R-squared 0.077644 Mean dependent var 1582.510 Adjusted R-squared 0.028582 S.D. dependent var 3284.902 S.E. of regression 3237.617 Sum squared resid 9.85E+08 Durbin-Watson stat 1.578383 Tabel 8. Weighted Least Squares Contoh 4 Seperti yang dapat dilihat pada tabel 8, terjadi perubahan signifikan pada nilai koefisien. Namun demikian jika model ini memang benar mengalami heterokedastis, maka nilai koefisien pada tabel 8 adalah lebih valid. Ada kalanya teori maupun pertimbangan ilmiah tidak memberikan dukungan untuk mengasumsikan suatu pola heterokedastisitas tertentu. Jika ini terjadi maka kita harus mengestimasi bentuk dari h(xi) dan mentransformasikan model awal dengan nilai estimasi dari h(xi). Prosedur ini disebut Feasible GLS (FGLS) atau Estimated GLS (EGLS). Kita tidak akan membicarakan landasan teoritis penggunaan FGLS, pembaca yang tertarik dapat merujuk pada Wooldridge, 2005 (hal 266-267). Adapun prosedur FGLS dapat diuraikan sebagai berikut: ^ 1. Regresikan model awal (persamaan 20) dan peroleh residual,u i . ^ 2 2. Buat series log (u i) . ^ 3. Estimasi regresi auxiliary berikut dan peroleh nilai g i ^2 log(u ) = δ 0 + δ1 x1 + ... + δ k xk + e ^ ^2 ^ ^ ^ g i = log(u ) = δ 0 + δ 1 x1i + ... + δ k xki ^ 4. Hitung hi dimana ^ ^ h i = exp( g i ) ^ 5. Transformasi persamaan 20 dengan bobot 1/ hi . 16
  17. 17. Contoh 5. Dengan menggunakan data smoke.raw akan diestimasi regresi cigs terhadap log(income), log(cigpric), educ, age, age^2 dan restaurn. Hasil yang diperoleh dirangkum pada tabel 9. Dependent Variable: CIGS Method: Least Squares Date: 06/10/08 Time: 08:51 Sample: 1 807 Included observations: 807 Variable Coefficient Std. Error t-Statistic Prob. C -3.639823 24.07866 -0.151164 0.8799 LOG(INCOME) 0.880268 0.727783 1.209519 0.2268 LOG(CIGPRIC) -0.750862 5.773342 -0.130057 0.8966 EDUC -0.501498 0.167077 -3.001596 0.0028 AGE 0.770694 0.160122 4.813155 0.0000 AGE^2 -0.009023 0.001743 -5.176494 0.0000 RESTAURN -2.825085 1.111794 -2.541016 0.0112 R-squared 0.052737 Mean dependent var 8.686493 Adjusted R-squared 0.045632 S.D. dependent var 13.72152 S.E. of regression 13.40479 Akaike info criterion 8.037737 Sum squared resid 143750.7 Schwarz criterion 8.078448 Log likelihood -3236.227 F-statistic 7.423062 Durbin-Watson stat 2.012825 Prob(F-statistic) 0.000000 Tabel 9. Print Out Regresi Contoh 5 Dengan melaksanakan prosedur FGLS sebagaimana diuraikan diatas, diperoleh hasil sbb: Dependent Variable: CIGS Method: Least Squares Date: 06/10/08 Time: 08:59 Sample: 1 807 Included observations: 807 Weighting series: (H)^-0.5 Variable Coefficient Std. Error t-Statistic Prob. C 5.635471 17.80314 0.316544 0.7517 LOG(INCOME) 1.295239 0.437012 2.963855 0.0031 LOG(CIGPRIC) -2.940314 4.460145 -0.659242 0.5099 17
  18. 18. EDUC -0.463446 0.120159 -3.856953 0.0001 AGE 0.481948 0.096808 4.978378 0.0000 AGE^2 -0.005627 0.000939 -5.989706 0.0000 RESTAURN -3.461064 0.795505 -4.350776 0.0000 Weighted Statistics R-squared 0.113409 Mean dependent var 7.158227 Adjusted R-squared 0.106760 S.D. dependent var 11.66855 S.E. of regression 11.69611 Akaike info criterion 7.765025 Sum squared resid 109439.1 Schwarz criterion 7.805736 Log likelihood -3126.188 F-statistic 17.05549 Durbin-Watson stat 2.049719 Prob(F-statistic) 0.000000 Unweighted Statistics R-squared 0.045739 Mean dependent var 8.686493 Adjusted R-squared 0.038582 S.D. dependent var 13.72152 S.E. of regression 13.45421 Sum squared resid 144812.7 Durbin-Watson stat 2.011453 18

×