ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL PADA DATA JUMLAH PERMINTAAN AIR BERSIH TERHADAP PENDAPATAN TOTAL KELUARGA, JUMLAH TANGGUNGAN KELUARGA, DAN PENGELUARAN ENERGI
ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL
1. faANALISIS REGRESI LINIER BERGANDA DAN
PENGUJIAN ASUMSI RESIDUAL PADA DATA JUMLAH
PERMINTAAN AIR BERSIH TERHADAP PENDAPATAN
TOTAL KELUARGA, JUMLAH TANGGUNGAN KELUARGA,
DAN PENGELUARAN ENERGI
Arning Susilawati, Marlisa W Setyorini
1
Program Studi DIII, Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember, Surabaya
ABSTRAK
Pada setiap permasalahan, merasa perlu untuk mengetahui faktor-faktor yang
menyebabkan masalah tersebut. Faktor-faktor tersebut merupakan prediktor,
sedangkan permasalahannya merupakan respon. Dalam permasalahan data jumlah
permintaan air bersih (respon), pendapatan total keluarga (prediktor 1), jumlah
tanggungan keluarga (prediktor 2), dan pengeluaran energi (prediktor 3) dengan
jumlah sampel 37 data. Tujuannya untuk mengetahui bagaimana pengaruh dari
semua prediktor terhadap respon dengan cara melakukan analisis regresi linier
sederhana yakni pengujian serentak dan parsial (individu). Dengan uji berganda,
semua variabel prediktor berpengaruh terhadap respon. Pada uji parsial, diketahui
bahwa prediktor 1 dan prediktor 2 berpengaruh terhadap respon, sedangkan
prediktor 3 tidak berpengaruh terhadap respon. Pada asumsi IIDN (0,σ2), diketahui
bahwa data tidak independen, identik, tidak berdistribusi normal dan tidak memiliki
multikolinieritas.
Kata Kunci : Korelasi, Uji Serentak, Uji Parsial, Analisis Regresi, IIDN (0,σ2)
1.
Pendahuluan
Air bersih merupakan salah satu kebutuhan pokok manusia yang dibutuhkan
secara berkelanjutan. Penggunaan air bersih sangat penting untuk komsumsi
rumah tangga, kebutuhan industri dan tempat umum. Karena pentingnya
kebutuhan akan air bersih, maka adalah hal yang wajar jika sektor air bersih
mendapatkan prioritas penanganan utama karena menyangkut kehidupan orang
banyak. Penanganan akan pemenuhan kebutuhan air bersih dapat dilakukan
dengan berbagai cara, disesuaikan dengan sarana dan prasarana yang ada. Di
daerah perkotaan, sistem penyediaan air bersih dilakukan dengan sistem perpipaan
dan non perpipaan. Sistem perpipaan dikelola oleh Perusahaan Daerah Air Minum
(PDAM) dan sistem non perpipaan dikelola oleh masyarakat baik secara individu
maupun kelompok.
Di sebuah wilayah, jumlah permintaan air bersih dapat dipengaruhi oleh
bebarapa faktor, diantaranya pendapatan total keluarga, jumlah tanggungan
keluarga, dan pengeluaran energi dari masing-masing rumah tangga tersebut.
Sehingga dibutuhkan adanya penelitian untuk memperkirakan jumlah permintaan
air yang stabil setiap waktunya. Sumber permasalahan ini berasal dari penelitian
yang dilakukan oleh Universitas Sumatera Utara.
Rumusan masalah yang dibahas dalam praktikum adalah bagaimana
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu pada
1
2. kasus jumlah permintaan air bersih. Bagaimana pengaruh banyaknya prediktor
(pendapatan total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi
dari masing-masing rumah tangga) dan nilai koefisien determinasi terhadap model
serta bagaimana uji asumsi residual IIDN dan multikolinieritasnya. Tujuannya
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu, dan
mengetahui apakah residual sudah memenuhi asumsi residual IIDN serta untuk
menegetahui variabel prediktor dalam percobaan memiliki koefisien korelasi yang
kuat atau tidak.
2.
Landasan Teori
Pada landasan teori terdapat dipaparkan mengenai regresi linier berganda,
pengujian asumsi residual IIDN, serta air bersih.
2.1
Regresi Linier Berganda
Analisis regresi merupakan salah satu teknik analisis data dalam statistika
yang seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan
meramal suatu variabel (Kutner, Nachtsheim dan Neter, 2004). Termasuk di
dalamnya adalah analisis regresi linier berganda.
2.1.1
Persamaan Regresi
Bentuk umum model regresi linier berganda dengan p variabel bebas adalah
seperti pada persamaan (1) berikut (Kutner, Nachtsheim dan Neter, 2004).
2.1
Yi = β0 + β X I + β2 X 2 +... + βk X k +εi
1
Y1 1 X X X β
1 12 1 p − 1 0 ε 1
Y2 1 X X X β ε
Y = = 21 2 2p−1 1 + 2
Y=Xβ+ε
β
dengan:
Y adala 1 X X X ε
Y n1 n2 np−1 p−1 n
2, …, n. n
i
h variabel tidak bebas untuk pengamatan ke-i, untuk i = 1,
β0 , β , β2 ,..., βk adalah parameter.
1
X 1 , X 2 ,..., X k adalah
variabel bebas.
εi adalah sisa (error) untuk pengamatan ke-i yang diasumsikan berdistribusi
normal yang saling bebas dan identik dengan rata-rata 0 (nol) dan variansi σ 2 .
2.1.2
Uji Serentak
Untuk mengetahui apakah koefisien yang ada dalam model secara serentak
nyata atau tidak, digunakan uji F, dengan hipotesisnya sebagai berikut:
H 0 : β1 ≡ β2 = ... = βk = 0 (prediktor tidak berpengaruh terhadap respon)
H 1 : Tidak semua β sama dengan nol, untuk k=1,2,…,k
k
Statistik uji yang digunakan adalah:
2
3. Tabel 2.1 ANOVA Regresi Linier Berganda
Sumber
Varians
Derajat
Sum Square
bebas
Regresi
k
Error
n-k-1
Total
n-1
Mean Square
1
SSR = b' X ' Y − Y ' JY
n
SSR
k
SSR
SSE = SST − SSR = Y ' Y − b' X ' MSR =
n − k −1
1
SST = Y ' Y − Y ' JY
n
MSR =
F
F=
MSR
MSE
(Draper, 1992)
Dimana nilai Fhitung yang dapat dihitung dibandingkan dengan Fα(V 1,V 2 ) dengan
derajat bebas V1=k, V2=n-k-1 dan tingkat signifikan α. Apabila Fhitung >
Fα( k , n −k − ) maka H0 ditolak, yang berarti paling sedikit ada satu β j yang tidak
1
dapat sama dengan nol (Salamah, dkk 2010).
2.1.3
Uji Parsial
Uji parsial digunakan untuk menguji signifikasi variabel predictor terhadap
variabel respon secara individu, jika uji serentak signifikan. Rumusan
hipotesisnya:
H 0 : β j = 0 (variabel predictor X j tidak berpengaruh terhadap respon)
H 1 : β j ≠ 0 , untuk j=0,1,2,….,k
Statistik uji yang digunakan adalah
t hitung =
bi
2.2
var(bi )
[
ˆ
Var ( βj ) = diagonal X T X
]
−
1
σ2
Dimana b = nilai dugaan β ; σ2 = RKG
i
i
Kemudian t hitung dibandingkan dengan nilai table distribusi t dengan derajat bebas
(n-2) dan tingkat signifikan α (Salamah dkk, 2010).
2.1.4
Koefisien Determinan (R2)
Koefisien determinasi didapat dari analisis regresi dengan menggunakan
minitab. Apabila R2 bernilai di atas 75% dapat dijelaskan bahwa nilai variabel Y
yang berada di atas 75% tersebut dapat dijelaskan oleh variabel-variabel bebas
yang ada dalam model. Sedangkan sisanya yang berada di bawah 75% dijelaskan
oleh oleh variabel-variabel bebas yang tidak ada dalam model. Tingginya nilai R 2
ini menandakan baiknya model yang telah didapatkan, artinya model telah sesuai
dan antar variabel pada model terrsebut mempunyai korelasi yang sama (Salamah
dkk, 2010).
3
4. R2 =
SSR
x100%
SST
2.3
2.2
IIDN
Pemeriksaan asumsi IIDN~(0, σ 2 ) digunakan untuk mengetahui data yang
dihasilkan setelah melakukan percobaan sudah memenuhi ketiga asumsi IIDN~(0,
σ 2 ) dan dijelaskan sebagai berikut.
2.2.1 Uji Asumsi Residual Independen
Pemeriksaan residual independen dilakukan untuk melihat apakah residual
memenuhi asumsi independen. Suatu data dikatakan independen apabila plot
residualnya menyebar secara acak dan tidak membentuk suatu pola tertentu
Pemeriksaan asumsi residual independen bisa dilihat dengan cara visual versus
order dan bisa dihitung menggunakan uji Durbin-Watson dapat diketahui sebagai
berikut. (Gujarati,1991)
Hipotesisuji Durbin Watson adalah sebagai berikut.
a)
Hipotesis pertama:
H0: tidak ada korelasi positif
H1: ada korelasi positif
Pengambilan keputusan:
d < dL : tolak H0
d > du : terima H0
dL≤ d ≤ du : tidak dapat disimpulkan (inclonclusive)
Hipotesis kedua:
H0: tidak ada korelasi negatif
H1: ada korelasi negatif
Pengambilan keputusan:
d > 4-dL : tolak H0
d < 4-du : terima H0
4-du ≤ d ≤ 4-dL : tidak dapat disimpulkan (inclonclusive)
Hipotesisketiga:
H0: tidak ada korelasi positif ataunegatif
H1: ada korelasi positif ataunegatif
Pengambilan keputusan:
d < dL : tolak H0
d > 4-dL : tolak H0
du< d < 4-du : terimaH0
dL≤ d ≤ du atau 4-du≤ d ≤ 4-dL : tidak dapat disimpulkan
dengan
: d = nilai d Durbin Watson
dL = batas bawah
dU = batas atas
Satistik Uji:
2
d =
∑[(e − e ]
∑(e )
i−
1
i
2
i
4
2.4
5. 2.2.2
Uji Asumsi Residual Identik
Pemeriksaan residual identik dilakukan untuk melihat apakah residual
memenuhi asumsi identik. Suatu data dikatakan identik apabila plot residualnya
menyebar secara acak dan tidak membentuk suatu pola tertentu. Nilai variansnya
rata-rata sama antara varians satu dengan yang lainnya . Pemeriksaan asumsi
residual identik bisa dilihat dengan cara visual versus fits dan bisa dihitung
menggunakan uji White dapat diketahui sebagai berikut.
a. Estimasi model populasi berdasarkan sampel yang diambil sehingga diperoleh
model sampel y = β0 + β1 x1 + β2 x 2 + + βk x k + ε sehingga didapatkan model
sampel sebagai berikut.
ˆ
ˆ
ˆ
ˆ
ˆ
y i = β0 + β1 x1 + β2 x 2 + + βk x k +ε
Dan cara mendapatkan residualnya
b. Estimasi model populasi
ˆ
ei = y i − y i
2
e 2 = α 0 + α1 x1 + α 2 x 2 + α 3 x12 + α 4 x 2 + α 5 x1 x 2 + V
Sehingga diperoleh model sampel sebagai berikut.
2
ˆ
ei2 = α 0 + α1 x1 + α 2 x 2 + α3 x12 + α 4 x 2 + α 5 x1 x 2
Sehingga dapat diketahui koefisien determinasi(R2) dari model
H0 : residual identik
H1 : residual tidak identik
Daerah kritis : Tolak H0 jika χ2hitung > χ2tabel
Statistik uji : R2 =
SSR
x100%
SST
2.5
2
χhitung = n * R 2
(Catatan: Santi P R)
2.2.3 Uji Asumsi Distribusi Normal
Pemeriksaan residual berdistribusi normal dilakukan untuk melihat apakah
residual memenuhi asumsi berdistribusi normal, apabila plot residualnya
cenderung mendekati garis lurus (linier) Jadi data dikatakan baik jika data tesebut
memenuhi asumsi IIDN Pemeriksaan asumsi residual berdistribusi normal dilihat
dengan Q-Q Plot dengan hipotesis sebagai berikut. (De
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Daerah kritis : Tolak H0 jika rQ ≤ r(n,α)
Statistik uji :
n
rQ =
∑ (e − e ) z
i
i =1
n
i
2.6
n
∑ (e − e ) ∑ ( z )
i =1
2
i
i =1
2
i
Jika
menggunakan
kolmogorov-smirnov
hipotesisnya adalah sebagai berikut.
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Daerah kritis : Tolak H0 jika P-Value ≤ α
Statistik ujinya dapat dilihat dari P-value yang didapat pada percobaan dengan
software.
5
6. (Catatan: Santi P R)
2.2.4 Pemeriksaan Multikolinieritas
Multikolinieritas adalah suatu kondisi dimana terjadi korelasi yang kuat
diantara variabel-variabel bebas (X) yang diikutsertakan dalam pembentukan
model regresi linier. Untuk mendeteksi apakah model regresi kita mengalami
multikolinieritas, dapat diperiksa menggunakan VIF (Variance Inflation Factor).
Jika nilai VIF > 10 berarti telah terjadi multikolinieritas (Gujarati, 1991).
VIF =
1
1 − R2( Xi )
2.7
2.3
Air Bersih, Pendapatan, Jumlah Anggota Keluarga, Pengeluaran
Energi
Kebutuhan air bersih merupakan kebutuhan yang tidak terbatas dan
berkelanjutan. Sedang kebutuhan akan penyediaan dan pelayanan air bersih dari
waktu ke waktu semakin meningkat yang terkadang tidak diimbangi oleh
kemampuan pelayanan. Peningkatan kebutuhan ini disebabkan oleh peningkatan
jumlah penduduk, peningkatan derajat kehidupan warga serta perkembangan
kota/kawasan pelayanan ataupun hal-hal yang berhubungan dengan peningkatan
kondisi sosial ekonomi warga.
Sebuah studi Bank Dunia yang disebarluaskan bulan Agustus 2008
menemukan bahwa kurangnya akses terhadap sanitasi menyebabkan biaya
finansial dan ekonomi yang berat bagi ekonomi Indonesia, tidak hanya bagi
individu tetapi juga bagi sektor publik dan perdagangan (IRD, 2013).
3.
Metode Penelitian
Data penelitian ini merupakan data sekunder yang diambil dari internet pada
tanggal 22 Oktober 2013 dengan data dari Universitas Sumatera Utara. Variabelvariabel pengukuran yang digunakan adalah jumlah permintaan air bersih (Y)
dalam m3, pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X3) dalam rupiah
dengan jumlah sampel 30 data. Berikut langkah analisis yang digunakan dalam
penelitian ini yakni mencari data yang memiliki satu variabel respon, dengan tiga
variabel predictor, menginputkan dan melakukan analisis regresi linear berganda
dari data jumlah permintaan air bersih, pendapatan total keluarga, jumlah
tanggungan keluarga, dan pengeluaran energi. Selanjutnya mengambil setiap hasil
scatterplot, korelasi, uji serentak, uji parsial, analisis regresi dan residual lalu
menganalisis sehingga dapat diambil kesimpulan dan saran, yang kemudian
membuat makalah.
4.
Analisis Korelasi Linier dan Regresi Linier Sederhana
Data pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X 3) serta jumlah
permintaan air bersih (Y) dalam m3, dalam rupiah dengan jumlah sampel 30 data
dapat dilakukan analisi korelasi linier dan regresi linier sederhana sebagai berikut.
6
7. 4.1
Analisis Regresi Linier Berganda
Analisis regresi linier berganda dilakukan dengan menganalisis estimasi
model, koefisien determinasi, uji serentak, uji parsial dari variabel pendapatan
total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi dengan
menganggap asumsi metode OLS terpenuhi.
4.1.1
Uji Serentak
Persamaan
estimasi
model
analisis
regresi
linier
adalah
artinya setiap kenaikan X1
(pendapatan total keluarga) sebanyak satu rupiah maka Y (jumlah permintaan air
bersih) akan bertambah sebesar 0.000003 M3 saat variabel lain konstan dan setiap
kenaikan X2 (jumlah tanggungan keluarga) sebanyak satu orang maka Y(jumlah
permintaan air bersih) akan bertambah sebesar 1.17 M3 saat nilai variabel lain
konstan serta setiap kenaikan X3 (pegeluaran energi) sebanyak satu rupiah maka
Y(jumlah permintaan air bersih) akan berkurang sebesar 0.000010 M3 saat
variabel lain konstan.
Berikut uji serentak parameter model regresi dari pendapatan total keluarga,
jumlah tanggungan keluarga, pengeluaran energi terhadap jumlah permintaan air
bersih.
Hipotesis
H 0 : β1 = β2 = β3 = 0 (pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak berpengaruh signifikan terhadap jumlah permintaan air
bersih)
H 1 : Minimal ada satu β j ≠ 0 (maka ada minimal satu dari pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi berpengaruh
signifikan terhadap jumlah permintaan air bersih)
Y = 2.36 + 0.000003 X 1 +1.17 X 2 - 0.000010 X 3
Tabel 4. 1 ANOVA Uji Serentak Parameter Model Regresi Variabel Y dan X1, X2, X3
Source
DF SS
MS
F
P
Regression
3
504.47
168.16
9.02
0.000
Residual Error
26 484.57
18.64
Total
29 989.04
Tabel 4.1 diperoleh keputusan tolak H0 Fhitung (9.02) > F0.05( 3, 26 ) ( 2.98) .
Artinya, minimal satu dari pendapatan total keluarga, jumlah tanggungan keluarga
dan pengeluaran energi berpengaruh signifikan terhadap jumlah permintaan air
bersih.
4.1.2
Uji Parsial
Pada uji serentak yang dihasilkan adalah tolak H 0 sehingga dilakukan uji
parsial parameter model regresi jumlah permintaan air bersih dengan pendapatan
total keluarga, jumlah tanggungan keluarga dan pegeluaran energi.
Hipotesis:
H 0 : β j = 0 (pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 tidak berpengaruh signifikan terhadap jumlah permintaan
air bersih)
7
8. H 1 : βj ≠ 0 (
pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 berpengaruh signifikan terhadap jumlah permintaan air
bersih)
Tabel 4. 2 Uji Individu Parameter Model Regresi Variabel Y dan X1, X2, X3
No
1
2
Regresi
Constan
Coef
2.358
0.00000322
SE Coef
Thitung
T(df.error=28, α =0.05)
2.625
0.9
1.701
0.0000009
3.5
1.701
X1
2
3
X2
1.1731
0.5881
1.99
1.701
4
-0.00000959 0.0000103
-0.09
1.701
X3
1
Tabel 4.2, pada uji regresi individu, pertama Thitung (0.9) <T(df.error, α) (1.701)
adalah gagal tolak H0. artinya seluruh variansi respon dapat dijelaskan oleh
presiktor. Kedua Thitung (3.5) > T(df.error, α) (1.701) adalah tolak H0. artinya
pendapatan total keluarga berpengaruh signifikan terhadap jumlah permintaan air
bersih. Pada uji regresi individu ketiga P-Value (1.99) > T(df.error, α) (1.701) adalah
tolak H0. artinya jumlah tanggungan keluarga berpengaruh signifikan terhadap
jumlah permintaan air bersih. Pada uji regresi individu keempat P-Value (0.09) <
T(df.error, α) (1.701) adalah gagal tolak H0. artinya pengeluaran energi tidak
berpengaruh signifikan terhadap jumlah permintaan air bersih.
Pemeriksaan Asumsi Residual IIDN (0, σ 2 )
Berikut merupakan pemeriksaan asumsi identik independen, dan
berdistribusi normal dari pendapatan total keluarga, jumlah tanggungan keluarga,
pengeluaran energi terhadap jumlah permintaan air bersih.
4.2
4.2.1 Pengujian Asumsi Residual Identik
Pengujian asumsi residual identik dapat divisualisasikan melalui gambar
versus fits dan menggunakan uji White. Berikut pemaparannya.
4.2.1.1 Uji Identik Versus Fits
Berikut merupakan gambar uji identik secara visual.
Ver sus Fi t s
(response is Y)
15
Residual
10
5
0
-5
5.0
7.5
10.0
12.5
15.0
Fit t ed Value
17.5
20.0
22.5
Gambar 4. 1 Versus Fits Identik Residual
Gambar 4.1 dapat diketahui sebaran plot residual menyebar secara acak
dan tidak membentuk pola sehingga dapat dikatakan data jumlah permintaan air
8
9. bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi adalah identik.
4.2.1.2
Dengan
Uji White
persamaan
estimasi
model
uji
White
adalah
2
2
ˆ
e 2 = − .9 + 0.000043 x1 +30.5 x 2 − 0.000120 x3 − 0.000000 x1 −3.28 x 2
66
2
+ 0.000000 x3 + 0.000001x1 x 2 = 0.000000 x1 x3 + 0.000016 x 2 x3 + 0.000000 x1 x 2 x3
maka berikut ini hasil dari pengujian identik dengan menggunakan prosedur uji
white dari jumlah permintaan air bersih dengan pendapatan total keluarga, jumlah
tanggungan keluarga dan pegeluaran energi..
Hipotesis:
H 0 : Residual identik (homoskedostisitas)
H 1 : Residual tidak identik (heteroskedostisitas)
2
χhitung = n * R 2 = 30*16.5%=4.95
Tabel 4. 3 ANOVA Uji Indetik Prosedur Uji White
Source
Regression
Residual Error
Total
DF
1
28
29
SS
1.01
988.03
989.04
MS
1.01
35.29
F
0.03
P
0.867
Tabel 4.6 diketahui bahwa df=10, R2=16.5%, maka gagal tolak H 0 karena
2
χhitung ( 4.95) < χ2 , 0.05 (18.307) , artinya pada uji asumsi residual identik secara
10
uji White dari data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi adalah memenuhi uji residual
identik.
4.2.2
Pengujian Asumsi Residual Independen
Pengujian asumsi residual independen dapat divisualisasikan melalui
gambar versus order dan menggunakan uji Durbin-Watson. Berikut
pemaparannya.
4.2.2.1 Uji Residual Independen Versus Order
Berikut merupakan gambar uji independen secara visual.
Ver su s Or der
(response is Y)
15
Residual
10
5
0
-5
2
4
6
8
10
12 14
16 18 20
Obser v at ion Or der
22
24
26
28
30
Gambar 4. 2 Versus Order
Gambar 4.2 dapat diketahui sebaran plot residual tidak menyebar secara
acak sehingga dapat dikatakan data jumlah permintaan air bersih dengan
9
10. pendapatan total keluarga, jumlah tanggungan keluarga dan pengeluaran energi
adalah tidak independen.
4.2.2.2 Uji Durbin-Watson
Merupakan uji yang digunakan untuk menentukan asumsi Indepeden.
Hipotesis:
H 0 : ρ e = 0 (tidak ada korelasi serial(otokorelasi) pada residual)
H 1 : ρe ≠ 0 (ada korelasi serial (otokorelasi) pada residual)
α = 5%
Daerah kritis: du=1.21 dl=1.65
Statistik Uji:
∑[e − e ]
d=
∑(e )
i −1
i
2
i
2
=
977.9591232
= 2.018194
484.5713193
Keputusan: Tolak H0 jika H0 (d<dl) atau (4-d)<du
Kesimpulan:
Gagal tolak H0 karena d (2.01)>dl(1.65), 1.99>1.21 artinya jumlah permintaan air
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pegeluaran energi tidak independen.
4.2.3
Pengujian Asumsi Residual Normalitas
Pada pengujian asumsi residual normalitas dapat menggunakan uji
kolmogorov smirnov, uji Q-Q plot, dan uji RQ. Berikut pemaparannya.
4.2.3.1Uji Kolmogorov Smirnov
Uji yang digunakan untuk mengetahui apakah data berdistri busi Normal.
Hipotesis:
H0 = Berdistribusi Normal
H1 = Tidak berdistribusi Normal
α = 5%
Daerah Kritis: Tolah H0 jika p-value < α (0.05)
Pr obabi l i t y Pl ot of RESI 1
Normal
99
Mean
StDev
N
KS
P-Value
95
90
80
Per cent
70
60
50
40
30
20
10
5
1
-10
-5
0
RESI 1
5
10
15
Gambar 4. 3 Kolmogorov Smirnov
10
-2.07242E-16
4.088
30
0.180
0.018
11. Gambar 4.3 menunjukkan p-value dari residual sebesar 0.018 lebih kecil
dari α = 0.05 sehinga tolak H0 yang artinya data jumlah permintaan air bersih
dengan pendapatan total keluarga, jumlah tanggungan keluarga dan pegeluaran
energi tidak berdistribusi normal.
4.2.3.2 Uji Q-Q plot
Dari pengujian Q-Q plot dihasilkan sactterplot seperti gambar berikut.
Scat t er pl ot of z v s e u r u t an
3
2
z
1
0
-1
-2
-5
0
5
e ur ut an
10
15
Gambar 4. 4 Uji Q-Q plot
Gambar 4.4 menunjukkan plot dari residualnya tidak mendekati garis
linier, artinya data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi tidak berdistribusi normal.
4.2.3.3 Uji RQ
Hipotesis:
H0 = Data berdistribusi Normal
H1 = Data tidak berdistribusi Normal
Daerah Kritis: Tolak H0 jika rQ ≤ r(n,α)
Statistik Uji:
n
rQ =
∑ (e
i =1
n
∑ (e
i =1
i
i
− e) z i
− e) 2
=
n
∑ (z )
i =1
2
- 23.6966
= −0.20073
(22.0129807)(5)
i
Karena rQ sebesar -0.020073 lebih kecil dari r(n,α) sebesar 0.9652 sehingga
tolak H0 yang artinya data jumlah permintaan air bersih dengan pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi adalah tidak
berdistribusi normal.
4.2.4
Multikolinieritas
Berikut ini hasil dari pengujian multikolinieritas dari jumlah permintaan air
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pegeluaran energi.
Hipotesis:
H 0 : Tidak ada multikolinieritas (tidak ada hubungan antara pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi)
11
12. H1 :
Ada multikolinieritas (ada hubungan antara pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi)
Tabel 4. 4 ANOVA Uji Multikolinieritas
No Predikto
r
SSR
SST
1
56292300000
0
15.473
11009125301
277498000000
0
69.367
18622200000
2
3
X1
X2
X3
R 2 (%
j
VIF
)
20.3
1.255
22.3
5.9
1.287
1.063
Tabel 4.8 diketahui bahwa dari keseluruhan nilai VIF dari masing-masing regresi
menghasilkan VIF < 10 sehingga gagal tolak H 0 , artinya data pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi tidak ada hubungan
multikolinieritas.
5.
Kesimpulan
1.
Ada hubungan (korelasi) linier antara jumlah permintaan air bersih dengan
pendapatan total keluarga dan jumlah tanggungan keluarga, sedangkan
untuk jumlah permintaan air bersih dan pengeluaran energi tidak ada
hubungan linier.
Tabel analisis berganda, diketahui bahwa pendapatan total keluarga, jumlah
tanggungan keluarga dan pengeluaran energi berpengaruh signifikan
terhadap jumlah permintaan air bersih.
Tabel uji parsial parameter, diketahui bahwa pendapatan total keluarga dan
jumlah tanggungan keluarga berpengaruh signifikan terhadap jumlah
permintaan air bersih, sedangkan pengeluaran energi tidak berpengaruh
signifikan terhadap jumlah permintaan air bersih.
Dengan adanya uji asumsi IIDN, diketahui bahwa data tidak berdistribusi
normal, tidak independen dan identik, serta tidak terjangkit multikolinieritas
dari data pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak multikolinieritas terhadap jumlah permintaan air
bersih.
2.
3.
4.
6.
Daftar Pustaka
1.
Draper, Harry Smith dan Norman. 1992. Analisis Regresi Terapan.
Jakarta: Gramedia Puataka Utama.
2.
Gesaf. (2008, November). Regresi dan Korelasi Sederhana. Retrieved
September
28,
2013,
from
gesaf.files.wordpress.com:
http://gesaf.files.wordpress.com/2008/11/regresi-dan-korelasi.pdf.
3.
Salamah, M dan Distri Susilaningrum. 2010. Modul Praktikum
PenghantarMetode Statistika. Surabaya: Jurusan Statistika ITS.
4.
Setiawan, Y. (2012, Desember 09). Analisis Regresi Linier Sederhana dan
Analisis
Korelasi.
Retrieved
September
28,
2013,
from
yudhasetiawanst.blogspot.com:
http://yudhasetiawanst.blogspot.com/2012/12/analisis-regresi-korelasi-linier.html
12
13. 5.
Kutner, M.H., C.J. Nachtsheim., dan J. Neter. 2004. Applied Linear
Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc.
6.
IRD. (2013). Program Air Bersih dan Sanitasi. Retrieved October 24,
2013, from http://www.ird.or.id/
7.
Air Bersih, Jumlah Keluarga, Jumlah Pendapatan, dan Kebutuhan
Energi.
(n.d.).
Retrieved
October
22,
2013,
from
httprepository.usu.ac.idbitstream123456789191211Appendix.pdf
8.
Gujarati, D. 1991. Ekonometrika Dasar : Jakarta: Penerbit Erlangga.
9.
Catatan Bu Santi Puteri tanggal 6 November 2013
Lampiran
Lampiran 1: Data
No Y
X1
X2
X3
1
15.7
700000 4
60000
Keterangan:5
2
3.4
300000
185000
Y = Jumlah Permintaan Air Bersih (M3)
3
5.3
650000 6
76000
X1 = Pendapatan Total Keluarga (Rp)
265000
Tanggungan Keluarga (orang)
4
23.5 X2 = Jumlah10
75000
0
X3 = Pengeluaran Energi (Rp)
5
10.3
400000 6
150000
6
8.2
300000 4
75000
196300
7
22.2
4
45000
0
8
10.8
950000 6
22500
9
6.3
300000 6
63000
10 6.4
700000 4
225000
120000
11 15.1
7
50000
0
12 8.2
300000 4
30000
158600
13 8.2
4
150000
0
177500
14 11.9
5
325000
0
15 22.6
700000 5
50000
375000
16 16
6
50000
0
150000
17 11.7
5
100000
0
18 4
600000 3
20000
19 10
700000 3
12000
175000
20 17.6
5
55000
0
264550
21 17.3
7
290000
0
22 4.6
400000 5
55000
13
14. 23
24
5
4.6
25
14.1
26
27
28
29
30
318000
300000
350000
0
300000
300000
600000
300000
800000
5.3
6.3
9.1
6.3
7.2
3
3
15000
17000
4
40000
3
3
4
4
5
60000
30000
130000
130000
20000
Lampiran
Correlations: Y, X1, X2, X3
Y
0.655
0.000
X1
X2
0.520
0.003
0.445
0.014
X3
0.032
0.867
0.170
0.369
X1
X2
0.231
0.219
Cell Contents: Pearson correlation
P-Value
Lampiran 3: Uji Regresi Berganda
Regression Analysis: Y versus X1, X2, X3
The regression equation is
Y = 2.36 + 0.000003 X1 + 1.17 X2 - 0.000010 X3
30 cases used, 1 cases contain missing values
S = 4.31710
R-Sq = 51.0%
R-Sq(adj) = 45.4%
Analysis of Variance
Source
Regression
Residual Error
Total
Predictor
Constant
X1
X2
X3
DF
3
26
29
SS
504.47
484.57
989.04
Coef
2.358
0.00000322
1.1731
-0.00000959
MS
168.16
18.64
SE Coef
2.625
0.00000092
0.5881
0.00001031
F
9.02
T
0.90
3.50
1.99
-0.93
Residual Plots for Y
14
P
0.000
P
0.377
0.002
0.057
0.361
VIF
1.254
1.287
1.063
15. Resi dual Pl ot s f or Y
No rmal Pro b ab ilit y Plo t
Versu s Fit s
10
Residual
15
90
Per cent
99
50
5
0
10
1
-5
-10
-5
0
5
Residual
10
5
10
Hist o g ram
15
Fit t ed Value
20
Versu s Ord er
15
10
7.5
Residual
Fr equency
10.0
5.0
5
0
2.5
0.0
-5
-5.0 -2.5 0.0
2.5 5.0
Residual
7.5
10.0 12.5
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30
Obser vat ion Or der
Regression Analysis: Y versus X1
The regression equation is
Y = 6.37 + 0.000004 X1
30 cases used, 1 cases contain missing values
S = 4.49268
R-Sq = 42.9%
R-Sq(adj) = 40.8%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
28
29
SS
423.88
565.16
989.04
MS
423.88
20.18
F
21.00
P
0.000
Regression Analysis: Y versus X2
The regression equation is
Y = 1.21 + 1.96 X2
30 cases used, 1 cases contain missing values
S = 5.07642
R-Sq = 27.0%
R-Sq(adj) = 24.4%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
28
29
SS
267.48
721.56
989.04
MS
267.48
25.77
F
10.38
P
0.003
Regression Analysis: Y versus X3
The regression equation is
Y = 10.4 + 0.000002 X3
30 cases used, 1 cases contain missing values
15
16. S = 5.94027
R-Sq = 0.1%
R-Sq(adj) = 0.0%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
28
29
SS
1.01
988.03
989.04
MS
1.01
35.29
F
0.03
P
0.867
Regression Analysis: e^2 versus X1, X2, ...
The regression equation is
e^2 = - 66.9 + 0.000043 X1 + 30.5 X2 - 0.000120 X3 - 0.000000 x1^2 - 3.28
X2^2
+ 0.000000 X3^2 + 0.000001 X1*X2 - 0.000000 X1*x3 + 0.000016 X2*X3
+ 0.000000 X1*X2*X3
Predictor
Constant
X1
X2
X3
x1^2
X2^2
X3^2
X1*X2
X1*x3
X2*X3
X1*X2*X3
Coef
-66.88
0.00004255
30.50
-0.0001197
-0.00000000
-3.281
0.00000000
0.00000145
-0.00000000
0.0000163
0.00000000
S = 36.5406
SE Coef
76.12
0.00006126
30.10
0.0009461
0.00000000
3.591
0.00000000
0.00001177
0.00000000
0.0002163
0.00000000
R-Sq = 16.5%
T
-0.88
0.69
1.01
-0.13
-1.04
-0.91
0.16
0.12
-0.42
0.08
0.25
P
0.391
0.496
0.324
0.901
0.309
0.372
0.874
0.903
0.680
0.941
0.805
R-Sq(adj) = 0.0%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
10
19
29
SS
5018
25369
30387
MS
502
1335
F
0.38
P
0.942
Regression Analysis: X1 versus X2, X3
The regression equation is
X1 = - 293013 + 271159 X2 + 0.86 X3
S = 905141
R-Sq = 20.3%
R-Sq(adj) = 14.4%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
2
27
29
SS
5.62923E+12
2.21206E+13
2.77498E+13
MS
2.81462E+12
8.19280E+11
Regression Analysis: Y versus X1
The regression equation is
Y = 6.37 + 0.000004 X1
16
F
3.44
P
0.047
17. S = 4.49268
R-Sq = 42.9%
R-Sq(adj) = 40.8%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
28
29
SS
423.88
565.16
989.04
MS
423.88
20.18
F
21.00
P
0.000
Regression Analysis: X1 versus X2, X3
The regression equation is
X1 = - 293013 + 271159 X2 + 0.86 X3
S = 905141
R-Sq = 20.3%
R-Sq(adj) = 14.4%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
2
27
29
SS
5.62923E+12
2.21206E+13
2.77498E+13
MS
2.81462E+12
8.19280E+11
F
3.44
P
0.047
Regression Analysis: X2 versus X1, X3
The regression equation is
X2 = 3.79 + 0.000001 X1 + 0.000003 X3
S = 1.41281
R-Sq = 22.3%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
2
27
29
SS
15.473
53.893
69.367
R-Sq(adj) = 16.6%
MS
7.737
1.996
F
3.88
P
0.033
Regression Analysis: X3 versus X1, X2
The regression equation is
X3 = 31546 + 0.0068 X1 + 10059 X2
S = 80556.5
R-Sq = 5.9%
R-Sq(adj) = 0.0%
Analysis of Variance
Source
DF
SS
MS
F
Regression
2 11009125301 5504562650 0.85
Residual Error 27 1.75212E+11 6489349989
Total
29 1.86222E+11
Hasil Uji Durbin Watson
e
e(i)-1
P
0.439
Hasil Uji rQ
[(e(i)-1)-e]^2
ei-ebar
(ei-ebar)z
(ei-ebar)^2
z^2
6.973439
6.973439
-14.8398
48.62885148
5
-4.0149
6.973439
120.743675
-4.0149
6.603929
16.11945157
3
-5.45863
-4.0149
2.08434054
-5.45863
7.549251
29.79662201
2
1.606717
-5.45863
49.9191001
1.606717
-1.91491
2.581538854
1
1.054821
1.606717
0.30458915
1.054821
-1.09325
1.112647001
1
0.903742
1.054821
0.02282484
0.903742
-0.81584
0.816749451
1
17