Regresi linear berganda digunakan untuk mengestimasi hubungan antara produksi kelapa sawit dengan luas areal perkebunan dan faktor dummy topografi. Hasilnya menunjukkan luas areal berpengaruh positif terhadap produksi sedangkan faktor topografi tidak berpengaruh secara signifikan. Uji asumsi menunjukkan model ini memenuhi asumsi kecuali heteroskedastisitas yang umum pada data cross section.
1. TUGAS
RESUME MATERI EKONOMETRIKA
Nama : INDAH SUKMA DEWI
NIM : P2C122008
Kelas : R002
Mata Kualiah : Ekonometrika
Dosen Pengampu : Prof. Dr. H. HARYADI, SE.M.MS
2. RESUME
HIGHLIGHT PERTEMUAN AWAL
Ekonometrika adalah gabungan dari ilmu matematika dan statistika untuk memecahkan
persoalan ekonomi.
Teori Ekonomi
+
Matematika Ekonomi
+ Ekonometrika
Statistika Ekonomi
+
Statistika Matematika
Di dalam analisis ada:
- variabel yang mempengaruhi = independen
- variabel yang dipengaruhi = dependen
- variabel yang saling mempengaruhi
untuk melihatnya harus menggunakan “persamaan regreasi” baik linear dan non linear baik
sederhana maupun berganda.
A. TEORI KORELASI
1. Pengukuran Koefisien Korelasi
Terdapat bermacam metode pengukuran hubungan antar variabel ekonomi, antara lain
Analisis Korelasi dan Analisis Regresi.
Korelasi : tingkat hubungan yang ada antara dua atau lebih variabel
Korelasi Sederhana : tingkat hubungan yang ada antara dua variabel
Korelasi Majemuk : tingkat hubungan yang ada antar tiga atau lebih variabel
3. 1) Korelasi Positif : jika mereka cenderung berubah secara bersama ke arah yang sama.
2) Korelasi Negatif : jika mereka cenderung berubah pada arah yang berlawanan.
4. 3) Tidak Ada Korelasi, Zero Correlation : bila mereka cenderung berubah tanpa hubungan
diantaranya.
2. Pengukuran Korelasi Linear
Scatter diagram dapat memberi gambaran tentang kuat tidaknya hubungan dua variabel,
jika titik-titik mendekati garis, korelasi kuat, dan sebaliknya semakin besar penyebaran titik-titik
menjauhi garis maka korelasi semakin lemah.
Pengukuran hubungan secara kuantitatif antara variabel Y dan X biasanya digunakan
parameter koefisien korelasi yang biasanya disimbolkan dengan ρ (rho). Ρ diestimasikan dari
setiap sampel dinotasikan dengan r. misalnya jika ingin mengukur korelasi antara X dan Y,
koefisien korelasi populasi direpresentasikan sebagai ρxy dan sampelnya diestimasi sebagai rxy.
Formula yang digunakan adalah :
Contoh sederhana nya adalah terori penawaran. Teori ekonomi menetapkan bahwa jumlah
barang yang ditawarkan dalam suatu pasar tergantung pada harga, cateris paribus. Jika harga
meningkat maka jumlah yang ditawarkan meningkat, demikian pula sebaliknya.
5. Untuk mengestimasi koefisien korelasi rxy maka data tersebut dapat diperluas untuk masing-
masing keperluan pengukuran koefisiennya. Sehingga :
Artinya: bahwa antara harga dan jumlah barang yang ditawarkan mempunya hubungan yang
kuat yaitu sebesar 97,5%.
3. Koefisien Korelasi Rank
Beberapa variabel tidak dapat dinyatakan dengan ukuran kuantitatif (atau mungkin
variabel binary) adan akhirnya tidak dapat diukur secara numeric. Misalnya profesi, pendidikan,
preferensi dan lainnya yang disebut sebagai variabel kategori. Tidak ada nilai pasti, sehingga
tidak mungkin menghitung nilai dari koefisien korelasi dengan formula diatas.
Untuk itu dipakai rank correlation coefficient menggunakan angka 1, 2, …. , n.
Maka diukur dengan formula :
Dimana : D = beda antara rangking dari pasangan X dan Y
n = jumlah observasi
r’ = koefisient korelasi rank (nilai r’ diasumsi terletak antara +1 dan -1).
4. Koefisien Korelasi Parsial
Mengukur korelasi parsial hubungan antara setiap dua variabel, bila semua dihubungkan dengan
yang dianggap konstan. Misalnya korelasi antara jumlah minuman segar (X1) yang diminum
pada musim panas dengan jumlah turis (X2) disuatu tempat. Nyatanya kedua variabel itu
dipengaruhi oleh kondisi cuaca yang disimbolkan dengna X3.
5. Keterbatasan Teori Korelasi Linear
1) Fomula r diatas diterapkan hanya jika antar dua variabel bersifat linear, akan tetapi
mungkin saja hubungan keduanya bersifat non linear. Harus dinyatakan jelas.
2) Walaupun koefisien korelasi mengukur covariabilitas dari variabel tidak dengan
semestinya menunjukkan hubungan kasual.
6. MODEL REGRESI LINEAR SEDERHANA
Hubungan antara dua buah variabel yang dinyatakan dalam suatu bentuk fungsi linear.
Hubungan tersebut antara lain :
Contoh : permintaan akan suatu barang tertentu, diasumsikan tergantung pada harga barang itu
saja (factor penentu lainnya dianggap konstan atau ceteris paribus) dan bentuk fungsinya adalah
linear.
dengan data p dan q tertentu misalnya diperoleh α = 25 dan β = -2 sehingga
persamaan permintaan itu menjadi.
q = 25 -2p
hubungan antara p dan q diatas menunjukkan setiap nilai p tertentu, misalnya 2 satuan. Hanya
ada satu nilai q, yaitu = 21 satuan. Jika harga p adalah 5 satuan, maka jumlah barang yang
diminta menjadi 15 satuan, dan seterusnya.
- Model Regresi Linear Sederhana
Bentuk paling sederhana dari hubungan stokastik antara dua variabel X dan Y.
Dimana
Y = variabel terikat
X = variabel bebas
µ = variabek gangguan stokastik
α dan β = parameter regresi
i = menunjukkan pengamatan ke – i
UJI STATISTIK SIGNIFIKANSI OLS
- Goodness of Fit (R2
)
Dikenal dengan nama koefisiensi determinasi (kuadrat dari koefisien korelasi) yang
menunjukkan persentase total variasi dari variabel dependen yang dapat dijelaskan oleh variabel
independen X. semakin dekat observasi kepada garis, semakin baik goodness of fit, semakin
baik ppula keterangan dari variasi Y oleh perubahan dalam variabel penjelasnya.
Contohnya : jika R2
adalah 0,935 (93,5%) artinya 93,5% dari pengamatan sampel atas Y dapat
dihubungkan dengan variasi-variasi Y yang tepat yaitu Ŷ atau dikatakan garis regresi memenuhi
sebaran data dengan baik.
Penaksiran OLS yang memenuhi persyaratan seluruh asumsi klasik
(1) Linear. Sifat ini dibutuhkan untuk memudahkan perhitungan dalam penaksiran, baik α
dan β merupakan fungsi linear dari Y.
(2) Unbiasedness : secara sendiri sifat ini tidak berguna. Hanya saat jumlah sampel sangat
besar.
(3) Best. Secara sendirian varian terkecil tidak dibutuhkan, karena suatu taksiran memiliki
varian nol. Namun memiliki penyimpangan yang besar (enormous bias).
7. REGRESI LINEAR BERGANDA
Y = β0 + β1X1 + β2X2 + β3X3 + εi
Var. Terikat Var. Bebas
Kiri dari persamaan = left hand side dependen
Kanan dari persamaan= right hand side independen
Regresi berganda (multiple regretion) jika ada > dari 1 variabel bebas.
Qd = f (P)
Regresi sederhana
Qd = f (P, P2, People, Y, T, Culture)
Regresi Berganda
Jenis-jenis Data ada 3 yaitu :
1) Time series runtut waktu, minimal 30 tahun biasanya.
Misalnya :
faktor-faktor yang mempengaruhi PAD provinsi jambi tahun 1970 – 2020 (time series)
2) Cross section 1 periode pengamatan, namun untuk beberapa objek
Misalnya:
penelitian seluruh kabupaten/kota di provinsi jambi di tahun 2021 (cross section)
3) Data panel gabungan keduanya. Beberapa lokasi atau objek di beberapa periode
waktu.
- Uji F
Uji simultan semua variabel secara bersama-sama
- Uji T
Uji parsial, masing-masing secara terpisah
Syarat hasil regresi diakui/berlaku = LULUS UJI ASUMSI KLASIK yaitu:
1) Uji normalitas
2) Uji multikolineritas
3) Uji autokorelasi
4) Uji heteroskedastisitas
Berikut ini adalah contoh pengerjaan REGRESI MENGUNAKAN APLIKASI EVIEWS
dari awal hingga interpretasinya.
Berikut ini adalah data terkait Jumlah Produksi Kelapa Sawit dan Luas Area Perkebunan Kelapa
Sawit pada Tahun 2020 untuk 13 Kecamatan dalam Kabupaten Tanjung Jabung Barat. Karena
adanya topografi wilayah antar kecamatan yang berbeda, maka Saya menggunakan Variabel
Dummy. Variabel dummy adalah variabel yang mengkuantifikasikan variabel kualitatif.
Variabel dummy juga bisa dikatakan variabel biner karena menggunakan 0 dan 1.
Adapun variabel yang digunakan dalam simulasi ini adalah sebagai berikut:
- Variabel Dependent (JP) yaitu Jumlah Produksi Kelapa Sawit.
- Variabel Independent (LA) yaitu Luas Area Perkebunan Kelapa Sawit.
- Variabel dummy (DUMMY) yaitu Topografi dimana bernilai 1 (satu) untuk Wilayah
Rawa dan bernilai 0 (nol) untuk Wilayah Bukan Rawa.
Data ini Saya dapatkan dari BPS Kabupaten Tanjung Jabung Barat Tahun 2020.
-
8. Kecamatan
Kelapa Sawit Tahun 2020
Topografi (DUMMY)
Jumlah
Produksi
(Ton)
JP
Luas Areal
Tanaman
(Ha)
LA
(1) Tungkal Ulu 12008 7468 0
(2) Merlung 33624 12246 0
(3) Batang Asam 26579 15179 0
(4) Tebing Tinggi 34650 11267 0
(5) Renah Mendaluh 14496 7849 0
(6) Muara Papalik 30948 10558 0
(7) Pangabuan 438 448 1
(8) Senyerang 1149 1054 1
(9) Tungkal Ilir 81 171 1
(10) Bram Itam 4077 3735 1
(11) Seberang Kota 26 32 1
(12) Betara 1449 2601 1
(13) Kuala Betara 1387 387 1
Setelah diolah dengan menggunakan aplikasi Eviews, maka kemudian diperolehkan hasil regresi
seperti tampilan dibawah ini:
Dependent Variable: JP
Method: Least Squares
Date: 11/19/22 Time: 20:35
Sample: 1 13
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 3738.661 8073.195 0.463096 0.6532
LA 2.011446 0.722946 2.782289 0.0194
DUMMY -4930.871 7508.537 -0.656702 0.5262
R-squared 0.882731 Mean dependent var 12377.85
Adjusted R-squared 0.859277 S.D. dependent var 14083.57
S.E. of regression 5283.179 Akaike info criterion 20.18162
Sum squared resid 2.79E+08 Schwarz criterion 20.31199
Log likelihood -128.1805 Hannan-Quinn criter. 20.15482
F-statistic 37.63697 Durbin-Watson stat 3.390395
Prob(F-statistic) 0.000022
9. Namun, terlebih dahulu harus dilakukan Uji Asumsi Klasik dimana ada 4 (empat) uji. Namun
karena ini data Cross Section maka beberapa uji boleh saja tidak lulus dengan ketentuan detail
akan dibahas dibawah.
1. Normality Test
Karena nilai Probabilitas. Sebesar 0.827284 dimana nilai ini > 0.05 maka data berdistribusi
normal.
2. Multikolineritas
Karena nilai nya -0.9201952 < 0,09 maka tidak terjadi multikolinearitas.
3. Heteroskedastisitas
Karena nilai Prob. Chi-square (2) pada Obs*R-squared nya 0,0029 yakni Kurang dari < 0,05
maka terjadi heteroskedastisitas. Namun, biasanya data cros section mengandung situasi
heteroskedastisitas karena data ini menghimpun data yang mewakili berbagai ukuran kecil,
sedang, dan besar (Ghozali, 2016).
4. Autokorelasi
Uji autokorelasi hanya dilakukan pada data time series (runtut waktu) dan tidak perlu
dilakukan pada data cross section seperti pada kuesioner di mana pengukuran semua variabel
dilakukan secara serempak pada saat yang bersamaan.
Setelah dilakukan Uji Asumsi Klasik diatas dan sudah lolos uji. Maka selanjutnya hasil
regreasi diawal tadi harus diinterpretasikan atau dijelaskan.
0
1
2
3
4
5
6
-10000 -5000 0 5000 10000
Series: Residuals
Sample 1 13
Observations 13
Mean 5.95e-13
Median 729.0817
Maximum 8248.377
Minimum -7691.400
Std. Dev. 4822.860
Skewness 0.006916
Kurtosis 2.163400
Jarque-Bera 0.379216
Probability 0.827284
LA DUMMY
LA 1 -0.9201952...
DUMMY -0.9201952... 1
Heteroskedasticity Test: Glejser
Null hypothesis: Homoskedasticity
F-statistic 44.23841 Prob. F(2,10) 0.0000
Obs*R-squared 11.67989 Prob. Chi-Square(2) 0.0029
Scaled explained SS 8.619767 Prob. Chi-Square(2) 0.0134
Test Equation:
Dependent Variable: ARESID
Method: Least Squares
Date: 11/19/22 Time: 20:43
Sample: 1 13
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 3915.674 1519.005 2.577789 0.0275
LA 0.239349 0.136025 1.759590 0.1090
DUMMY -2822.678 1412.762 -1.997985 0.0736
R-squared 0.898453 Mean dependent var 3739.714
Adjusted R-squared 0.878144 S.D. dependent var 2847.642
S.E. of regression 994.0517 Akaike info criterion 16.84063
Sum squared resid 9881388. Schwarz criterion 16.97100
Log likelihood -106.4641 Hannan-Quinn criter. 16.81383
F-statistic 44.23841 Durbin-Watson stat 2.058580
Prob(F-statistic) 0.000011
10. Beracuan dari hasil olah data regresi diatas maka dapat dijelaskan terkait beberapa hal yaitu
sebagai berikut:
a. Persamaan Ekonometrika nya:
JP = β0 + β1LA + β2DUMMY+ εi
Selanjutnya nilai-nilai yang didapatkan dari aplikasi Eviews dimasukkan ke persamaan
sehingga menjadi:
JP = 3738.661 + 2.011446LA – 4930.871DUMMY + εi
Pembeda antara wilayah Rawa dan Wilayah Bukan Rawa adalah sebesar 4930.871 satuan.
Oleh karena itu dapat disimpulkan sebagai berikut:
JP = 3738.661 + 2.011446LA – 4930.871DUMMY
= 3738.661 + 2.011446LA – 4930.871 (1)
= (3738.661 – 4930.871) + 2.011446LA
= - 1192.21 + 2.011446LA (Wilayah Rawa)
karena Dummy dikali 1
JP = 3738.661 + 2.011446LA – 4930.871DUMMY
= 3738.661 + 2.011446LA – 4930.871 (0)
= 3738.661+ 2.011446LA (Wilayah Bukan Rawa)
karena Dummy dikali 0
Titik pada data angka di dalam tugas ini bermakna sebagai “,” (koma). Dari persamaan diatas
maka dapat dijelaskan sebagai berikut:
- Konstanta sebesar 3738.661 berarti jika variabel Luas Area Perkebunan Kelapa Sawit
dan Dummy tetap, maka Jumlah Total Produksi Kelapa Sawit mengalami kenaikan
senilai 3738.661 Ton.
- Nilai koefisien regresi variabel Luas Area Perkebunan Kelapa Sawit sebesar 2.011446
ini berarti jika variabel Luas Area Kelapa Sawit mengalami kenaikan sebesar 1 Ha maka
Total Produksi Kelapa Sawit mengalami kenaikan sebesar 2.011446 Ton.
- Nilai koefisien regresi Topografi dengan Asumsi angka 1 (satu) untuk Wilayah Rawa
dan Angka 0 (nol) untuk Wilayah Bukan Rawa adalah sebesar – 4930.871 ini berarti
Dependent Variable: JP
Method: Least Squares
Date: 11/19/22 Time: 20:35
Sample: 1 13
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 3738.661 8073.195 0.463096 0.6532
LA 2.011446 0.722946 2.782289 0.0194
DUMMY -4930.871 7508.537 -0.656702 0.5262
R-squared 0.882731 Mean dependent var 12377.85
Adjusted R-squared 0.859277 S.D. dependent var 14083.57
S.E. of regression 5283.179 Akaike info criterion 20.18162
Sum squared resid 2.79E+08 Schwarz criterion 20.31199
Log likelihood -128.1805 Hannan-Quinn criter. 20.15482
F-statistic 37.63697 Durbin-Watson stat 3.390395
Prob(F-statistic) 0.000022
11. bahwa Jumlah Produksi Kelapa Sawit pada Wilayah Rawa lebih rendah dari pada
Wilayah Bukan Rawa sebesar 4930.871 Ton.
b. Uji T-Statistik
Uji ini melihat pengaruh variabel independen secara parsial. Dengan ketentuan dimana jika
nilai probabilitas harus < 0,05 agar berpengaruh signifikan. Untuk itu dapat dijelaskan
sebagai berikut:
1) Variabel Luas Area Perkebunan Kelapa Sawit memiliki nilai t-statistik nya sebesar
0.463096 dengan probabilitas sebesar 0.0104 dapat dijelaskan bahwa pada α 0,05 (5%)
maka variabel Luas Area Perkebunan Kelapa Sawit memiliki pengaruh yang signifikan
terhadap Jumlah Produksi Kelapa Sawit karena nilai Probabilitas tersebut > 0.05.
2) Variabel Topografi nilai t-statistik nya sebesar -0.656702 dengan probabilitas sebesar
0.5262. Dapat dijelaskan bahwa pada α 0,05 (5%) maka variabel Topografi tidak
memiliki pengaruh yang signifikan terhadap Jumlah Produksi Kelapa Sawit karena nilai
Probabilitas tersebut < 0.05.
c. Uji F-Statistik
Berdasarkan hasil uji secara keseluruhan diperoleh nilah F statistik sebesar 37.63697 dengan
probabilitas sebesar 0.000022, ini berarti bahwa Luas Area Perkebunan Kelapa Sawit dan
Topografi secara bersama-sama memberikan pengaruh yang signifikan terhadap Jumlah
Produksi Kelapa Sawit.
d. R-squared
Nilai koefiesien determinasi regresi atau R-squared nya sebesar 0.882731 ini berarti bahwa
88.2731% Jumlah Produksi Kelapa Sawit dipengaruhi oleh Kelapa Sawit dan Topografi.
Sedangkan sisanya 11.7269% dipengaruhi oleh faktor-faktor lain diluar penelitian atau data
yang digunakan saat ini.
SIMULTANEOUS EQUATION MODEL (Model Persamaan Simultan)
merupakan pengembangan dari model regresi. Dalam model persamaan simultan antara
determine variable dan variabel tak bebas (determined) saling pengaruh mempengaruhi
Intriligator dkk (1996 : 318).
Jika digunakan regresi ordinary least square (OLS) hasilnya akan bias, karena tingkat
kesalahan akan terakumulasi dua kali. Oleh karenanya untuk menghindari kekeliruan dan
ketidakkonsistenan hasil regresi maka tahap-tahap pengujian sesuai dengan persyaratan
penggunaan persamaan simultan harus dilakukan.
Contoh :
1) Model Permintaan dan Penawaran
Fungsi Permintaan: Qd
t = o + 1Pt + 1t ; 1< 0.
Fungsi Penawaran: Qs
t = o+ 1Pt + 2t ; 1> 0.
Keseimbangan: Qd
t = Qs
t P
2) Model Pendapatan Nasional Keynes
Fungsi Konsumsi: Ct = o + 1Yt + t ; 0 < 1< 1.
Identitas Pendapatan: Yt = Ct + It ;
3) Model Ekonomi Makro
12. Fungsi Konsumsi: Ct = o + 1Ydt + 1t ; 0 < 1< 1.
Fungsi Pajak: Tt = o+ 1Yt + 2t ; 0 < 1 < 1.
Fungsi Investasi: It = o+ 1 rt + 3t ; 1 < 0.
Definisi: Ydt = Yt - Tt
Pengeluaran Pem: Gt = Ĝ
Identitas Pendapatan: Yt = Ct + It + Gt
Diagram Keterkaitan Variabel Pada Model Persamaan Simultan
Model Permintaan dan Penawaran
Beberapa Istilah dalam Model Persamaan Simultan:
1. Persamaan Struktural/Perilaku:
Persamaan yang dapat menggambarkan:
• Struktur atau perilaku dari fenomena ekonomi yang diamati.
• Perilaku variabel endogen terhadap perubahan-perubahan variabel penjelas pada
persamaan yang bersangkutan
2. Persamaan Identitas:
Persamaan yg tdk dpt menunjukkan perilaku variabel endogen.
Dibentuk oleh perkalian, pembagian, penambahan atau pengurangan beberapa variabel.
3. Persamaan Direduksi (reduced-form equation):
Persamaan dimana variabel endogen hanya dipengaruhi variabel predetermined dan
gangguan stochastic.
4. Variabel Endogen:
Variabel yg nilainya akan ditentukan melalui model.
Variabel yg dipengaruhi oleh dan mempengaruhi variabel lain
5. Variabel Predetermined (eksogen dan lag endogen):
Variabel yg nilainya ditetapkan seblmnya, tdk melalui model.
Variabel yg hanya menpengaruhi variabel lain.
Langkah yang perlu diperhatikan dalam persamaan simultan yaitu:
(i) membuat persamaan struktural yang merupakan persamaan prilaku yang ingin dianalisis
dan dibangun berdasarkan suatu teori tertentu,
(ii) melakukan uji identifikasi,
13. (iii) menyusun persamaan reduce-form, suatu persamaan dimana variabel endogenous
merupakan fungsi dari variabel exogenous yang ada pada sistem persamaan. Lakukan regres
masing2 variabel endogenous thdp semua variabel exogenous, dan
(iv) melakukan pengujian model yaitu uji linieritas, normalitas, autokorelasi, multikolinearitas
dan heteroskedastisitas.
Identifikasi Model:
Dimaksudkan untuk mengetahui apakah model struktural yang dibangun dapat atau tidak
mendapatkan nilai parameter pada persamaan struktural melalui penaksiran parameter
persamaan reduce form dan juga untuk mengetahui pendekatan apa yang terbaik untuk
mengestimasi model tersebut. Suatu persamaan struktural yang diidentifikasi dapat berupa
exactly/fully /just identified atau terlalu teridentifikasi (over identified). Parameter dari
persamaan yang terlalu diidentifikasikan (over identified) dan tepat diidentifikasikan (just
identified) akan dapat ditaksir.
Aturan dalam uji identifikasi dapat dirumuskan dalam formulasi-formulasi berikut :
(Gujarati, 2003 : 748)
Dalam suatu model dari M persamaan simultan, agar suatu persamaan diidentifikasikan,
persamaan tadi harus tidak memasukkan sekurang-kurangnya M-1 variabel baik variabel
endogenous maupun variabel yang ditetapkan lebih dulu (predetermined variable atau
exogenous) yang muncul dalam model. Jika persamaan tadi tidak memasukkan tepat M-1
variabel, persamaan tadi disebut tepat diidentifikasi (exactly identified). Jika persamaan tadi
tidak memasukkan lebih dari M-1 variabel, persamaan tadi terlalu diidentifikasi (over
identified).
M = banyaknya variabel endogen dalam model, m = banyaknya variabel endogen dalam
suatu persamaan tertentu, K = banyaknya variabel yang ditetapkan lebih dulu (predeterminant
variable) atau variabel exogenous dan k = banyaknya variabel yang ditetapkan lebih dulu
(predeterminant variable) atau exogenous variable dalam suatu persamaan tertentu.
Bila K – k = m – 1, maka persamaan dikatakan dapat diidentifikasikan tepat
(exactly identified), bila K – k > m - 1, maka persamaan dikatakan diidentifikasikan lebih
(over identified). Tetapi bila K – k < m – 1, maka persamaan tersebut dikatakan tidak
teridentifikasikan (under identified) yang berakibat parameter struktural tidak dapat
ditaksir (Gujarati, 2003 : 753).
Ada dua cara untuk mendeteksi apakah suatu sistem persamaan simultan bersifat dapat
diidentifikasi (just identified) atau melebihi syarat untuk dapat diidentifikasikan (over identified)
yaitu : (1) cara identifikasi melalui bentuk model persamaan struktural yang sedang diteliti dan
(2) cara identifikasi melalui persamaan reduce form dari model yang sedang diteliti. Dalam
praktek penelitian, cara pertama selalu digunakan karena lebih praktis. Ada dua kondisi yang
harus dipenuhi suatu persamaan untuk dapat dianggap dapat diidentifikasikan yaitu (a)
kondisi order (order condition) dan (b) kondisi rank (rank condition) (Gujarati, 2003 : 747-752
dan Sritua Arief, 1993 : 79).
GFD=1.0+1.1DAP+1.2DSI+1.3EKP+1.4IMP+1.5PDB+1.6HLP(-
1)+1.7PCHLN+1.8IR+1.9Dummy+ u1.................3.5.1
PDB=2.0+2.1GFD+2.2HLNS(-1)+2.3HLP(-1)+2.4FDI(-1)+2.5EMP+2.6Dummy+2.7DS+
u2..3.5.2
DS =3.0+3.1GFD+3.2IS+3.3INV+3.4POP+3.5HLP+3.6HLNS+3.7Dummy+ u3.............3.5.3
INV =4.0+4.1GFD+4.2HLP+4.3HLP(-2)+4.4HLNS+4.5DS+4.6Dummy+ u4................3.5.4
14. EKP=5.0+5.1GFD+5.2HLNS+5.3HLP+5.4FE+5.5IMP+5.6Dummy+ u5............................3.5.5
IMP=6.0+6.1GFD+6.2EKP+6.3HLNS+6.4HLP(-2)+6.6Dummy+ u6............................3.5.6
PR =7.0+7.1 GFD+7.2 HLP+7.3 HLNS+7.4 Dummy+7.6 INV(-1)+7.6PR(-1)+ u7...........3.5.7
Alur Kerja Metodologi Ekonometrika Klasik Selalu Melalui Langkah-Langkah Dibawah
Ini:
1) Teori Ekonomi wajib untuk melihat dahulu teori yang ada kemudian dicari penelitian
sebelumnya yang pernah membahas materi atau teori yang sama.
2) Bangun model ekonometrikanya.
3) Kemudian mengumpulkan data (metode penelitian)
4) Estimasi model tergantung jenis data dan tujuan penelitian. Ada banyak metode yaitu:
OLSm TSLS, Data Panel, Logit, ARIMA dan lain-lain.
5) Uji spesifikasi model uji asumsi klasik
6) Inferensi Statistik pengujian hipotesis ada 2 (dua) yaitu Uji Simultan (Uji F) dan Uji
Parsial (Uji T). Dan ini tidak boleh terbalik. Harus terlebih dahulu lakukan Uji F.
7) Jika data cocok dengan teori, maka
8) Lakukan peramalan (forecast)
Atau
7) Jika data tidak cocok, maka
8) Perbaiki teori / cari teori baru
9) Ulangi dari langkah kedua hingga akhir.
Kesalahan yang Sering terjadi :
a. Metode/model dibangun tanpa teori
b. Dari langkah ke-4 sering langsung ke langkah ke-8
c. Sering tebalik langkah ke-4 dan ke-5
d. Sering melakukan Uji T sebelum Uji F.
Jika uji asumsi klasik tidak terpenuhi maka kemungkinan besar data kita keliru dan begitu
pula hasil akhirnya. (jika masih nekat diteruskan melakukan pengujian).
15. Cara untuk memenuhi spesifikasi statistic ada banyak yaitu bisa dengan Lag, Log dan Ln.
Skala data dari yang terendah hingga tertinggi:
a) Data nominal hanya kode, tidak ada arti
b) Data Ordinal orde / peringkat
Contoh: 1 = sangat miskin
2 = miskin
3 = sederhana
4 = kaya
5 = sangat kaya
Bedanya dengan data nominal adalah bahwa data ini sudah sesuai urutan peringkat tidak
bisa dibolak balik. Tetapi selisih angka tidak menunjukkan keadaan sebenarnya.
c) Data interval tidak ada 0 (nol), selisih angka yang sebenarnya. Seperti berat badan,
tinggi badan, dan sebagainya.
d) Data rasio ada angka 0 (nol) dan selisih juga yang sebernarnya. Contoh: pendapatan.
Untuk data a) dan b) TIDAK BISA DILAKUKAN OPERASI MATEMATIK. Jika data tersebut
ada di variabel X (bebas) maka regresi OLS masih bisa dilakukan namun HARUS DIRUBAH
MENJADI DUMMY VARIABLE. Selanjutnya jika ada di variabel Y (terikat) maka regresi
OLS TIDAK BISA LAGI DIPAKAI dan HARUS MENGGUNAKAN METODE PILIHAN
KUALITATIF yakni :
1) Probit
2) Tobit
3) Logit (sering atau gampang digunakan).
Logit ada 3 (tiga) kelompok :
a. Binary Logit di Y Cuma ada 2 (dua) kategori.
b. Multinomial Logit berskala nominal dengan > 2 kategori.
c. Ordered/Ordinal Logit berskala ordinal dengan > 2 kategori
DUMMY VARIABLE
Jika data Nominal dan Ordinal ada di variabel X (bebas) maka regresi OLS masih bisa dilakukan
namun HARUS DIRUBAH MENJADI DUMMY VARIABLE. Hanya ada angka 1 (satu) dan 0
(nol).
1 = yang memiliki karakteristik
0 = yang tidak memiliki karakteristik
Misalnya :
1 = Pria
0 = bukan pria (wanita)
Bisa langsung ditulis wanita, karena selain pria sudah pasti wanita pasangannya. Namun jika ada
lebih dari 2 kategori pada angka 0 harus menggunakan kata bukan karakteristik angka 1. Dan
jika ada lebih dari 2 kategori (> 2 kategori) maka rubahkan variabel menjadi k – 1. Dimana k
adalah jumlah kategori.
Contoh :
Y = β0 + β1X1 + β2X2 + β3X3 + εi
X1 = pendidikan, dimana
1 = SD
16. 2 = SMP
3 = SMA
4 = S1
k = 4 k – 1 = 4 – 1 = 3 dummy
rumus menjadi :
Y = β0 + β1X1D1 + β2X1D2 + β3X1D3 + β4X2 + β5X3 + εi
Selanjutnya tentukan KATEGORI DASAR. Harus dipilih kategori paling atas atau paling
bawah. Misalnya dalam data ini SD adalah kategori dasar, maka:
X1D1 dimana 1 adalah SMP dan 0 bukan SMP.
X1D2 dimana 1 adalah SMA dan 0 bukan SMA
X1D3 diamna 1 adalah S1 dan 0 bukan S1
Dengan demikian, jika notasi kesampingnya adalah 0 0 0 maka otomatis itu adalah kategori
dasar yakni SD, karena bukan kategori SMP, SMA dan S1.
Responden Kategori
SMP SMA S1
X1D1 X1D2 X1D3
A SD 0 0 0
B SMP 1 0 0
C SD 0 0 0
D SMA 0 1 0
E SMP 1 0 0
F S1 0 0 1
G SMA 0 1 0
H S1 0 0 1
Jika SD masih tetap dimasukkan ke table dummy maka TIDAK BISA DIOLAH matriks
singular.
Dummy bukan untuk melihat pengaruh, namun untuk MELIHAT PERBEDAAN.
Misalnya :
JP = 3738.661 + 2.011446LA – 4930.871DUMMY + εi
Pembeda antara wilayah Rawa dan Wilayah Bukan Rawa adalah sebesar 4930.871 satuan.
Oleh karena itu dapat disimpulkan sebagai berikut:
JP = 3738.661 + 2.011446LA – 4930.871DUMMY
= 3738.661 + 2.011446LA – 4930.871 (1)
= (3738.661 – 4930.871) + 2.011446LA
= - 1192.21 + 2.011446LA (Wilayah Rawa)
karena Dummy dikali 1
JP = 3738.661 + 2.011446LA – 4930.871DUMMY
= 3738.661 + 2.011446LA – 4930.871 (0)
= 3738.661+ 2.011446LA (Wilayah Bukan Rawa)
karena Dummy dikali 0
Interpretasi :
Nilai koefisien regresi Topografi dengan Asumsi angka 1 (satu) untuk Wilayah Rawa dan Angka
0 (nol) untuk Wilayah Bukan Rawa adalah sebesar – 4930.871 ini berarti bahwa Jumlah
17. Produksi Kelapa Sawit pada Wilayah Rawa lebih rendah dari pada Wilayah Bukan Rawa
sebesar 4930.871 Ton.
Perlu sekali untuk MELIHAT PROBABILITAS. Karena jika nilainya < alfa 5% atau 0,05 maka
tidak signifikan atau data tidak perlu dibaca.
MODEL PILIHAN KUALITATIF
Model pilihan kualitatif adalah model dengan peubah tak bebasnya berskala pengukuran
nominal atau ordinal. Dengan kata lain, dalam model regresi ini melibatkan dua atau lebih
pilihan kualitatif. ilustratif, misalnya ingin diprediksi pengaruh umur, jenis kelamin dan
pendapatan terhadap pembelian mobil. Y = 1, jika konsumen membeli mobil, = 0 jika konsumen
tidak membeli mobil.
Setelah data terinput, klik Quick > Estimate Equationakan muncul tampilan berikut:
Pada Equation specificationisikan persamaan: Y C X1 X2 X3_1 X3_2
Pada Estimation setting: pilih Method BINARY –Binary Choice(Logit, Probit, Extreme Value).
Pada Binary estimation methodpilih Logit.
Klik OK, akan muncul output Eviews sebagai berikut:
18. Output Eviews memberikan nilai Khi-kuadrat (χ2) (LR statistic) dari model regresi.
Sebagaimana halnya model regresi linear dengan metode OLS, kita juga dapat melakukan
pengujian arti penting model secara keseluruhan. Jika metode OLS menggunakan uji F, maka
pada model logit menggunakan uji G. Statistik G ini menyebar menurut sebaran Khi-kuadrat
(χ2). Karenanya dalam pengujiannya, nilai G dapat dibandingkan dengan nilai χ2 tabel pada α
tertentu dan derajat bebas k-1. (kriteria pengujian dan cara pengujian persis sama dengan uji F
pada metode regresi OLS). Tetapi, kita juga bisa melihatnilai p-value dari nilai G ini yang
biasanya ditampilkan oleh sofware-software statistik, termasuk Eviews.
Dari output Eviews, didapatkan nilai χ2 sebesar 45,37154 dengan p-value 0,000. Karena
nilai ini jauh dibawah 10 % (jika menggunakan pengujian denganα=10%), atau jauh dibawah
5% (jika menggunakan pengujian dengan α=5%), maka dapat disimpulkan bahwa model regresi
logistik secara keseluruhan dapat menjelaskan atau memprediksi keputusan konsumen dalam
membeli mobil.
Selanjutnya untuk koefisien determinasi (R2) yang digunakan pada regresi logit adalah
R2McFadden. Dari output terlihat bahwa nilai R2
McFadden sebesar 0,6853 yang menunjukkan
bahwa 68,53 persen keputusan membeli atau tidak membeli mobil dipengaruhi oleh peubah-
peubah dalam model.
Selanjutnya, untuk menguji faktor mana yang berpengaruh nyata terhadap keputusan
pilihan membeli mobil tersebut, dapat menggunakan uji signifikansi dari parameter koefisien
secara parsial dengan statistik uji z, yang serupa dengan statistik uji t atau, yaitu dengan
membagi koefisien terhadap standar error masing-masing koefisien.
Dari output Eviews ditampilkan nilai statistic z dan p-valuenya. Berdasarkan nilai p-
value (dan menggunakan kriteria pengujian α=5%), dapat dilihat seluruh peubah (kecuali X3_1),
berpengaruh nyata (memiliki p-valuedibawah 5%) terhadap keputusan membeli mobil.
Koefisien dalam model logit menunjukkan perubahan dalam logit sebagai akibat
perubahan satu satuan peubah bebas. Interpretasi yangtepat untuk koefisien ini tentunya
tergantung pada kemampuan menempatkan arti dari perbedaan antara dua logit. Oleh karenanya,
dalam model logit, dikembangkan pengukuran yang dikenal dengan nama odds ratio (ψ).
Odds ratio dapat dirumuskan: ψ = eβ
, dimana e adalah bilangan 2,71828 dan β adalah
koefisien masing-masing peubah. Sebagai contoh, odds ratio untuk peubah X2= e-4.94774
=
0,00709.
Maka angka tersebutlah yang kemudian diinterpretasikan.