ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL

faANALISIS REGRESI LINIER BERGANDA DAN
PENGUJIAN ASUMSI RESIDUAL PADA DATA JUMLAH
PERMINTAAN AIR BERSIH TERHADAP PENDAPATAN
TOTAL KELUARGA, JUMLAH TANGGUNGAN KELUARGA,
DAN PENGELUARAN ENERGI
Arning Susilawati, Marlisa W Setyorini
1

Program Studi DIII, Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember, Surabaya

ABSTRAK
Pada setiap permasalahan, merasa perlu untuk mengetahui faktor-faktor yang
menyebabkan masalah tersebut. Faktor-faktor tersebut merupakan prediktor,
sedangkan permasalahannya merupakan respon. Dalam permasalahan data jumlah
permintaan air bersih (respon), pendapatan total keluarga (prediktor 1), jumlah
tanggungan keluarga (prediktor 2), dan pengeluaran energi (prediktor 3) dengan
jumlah sampel 37 data. Tujuannya untuk mengetahui bagaimana pengaruh dari
semua prediktor terhadap respon dengan cara melakukan analisis regresi linier
sederhana yakni pengujian serentak dan parsial (individu). Dengan uji berganda,
semua variabel prediktor berpengaruh terhadap respon. Pada uji parsial, diketahui
bahwa prediktor 1 dan prediktor 2 berpengaruh terhadap respon, sedangkan
prediktor 3 tidak berpengaruh terhadap respon. Pada asumsi IIDN (0,σ2), diketahui
bahwa data tidak independen, identik, tidak berdistribusi normal dan tidak memiliki
multikolinieritas.
Kata Kunci : Korelasi, Uji Serentak, Uji Parsial, Analisis Regresi, IIDN (0,σ2)

1.

Pendahuluan

Air bersih merupakan salah satu kebutuhan pokok manusia yang dibutuhkan
secara berkelanjutan. Penggunaan air bersih sangat penting untuk komsumsi
rumah tangga, kebutuhan industri dan tempat umum. Karena pentingnya
kebutuhan akan air bersih, maka adalah hal yang wajar jika sektor air bersih
mendapatkan prioritas penanganan utama karena menyangkut kehidupan orang
banyak. Penanganan akan pemenuhan kebutuhan air bersih dapat dilakukan
dengan berbagai cara, disesuaikan dengan sarana dan prasarana yang ada. Di
daerah perkotaan, sistem penyediaan air bersih dilakukan dengan sistem perpipaan
dan non perpipaan. Sistem perpipaan dikelola oleh Perusahaan Daerah Air Minum
(PDAM) dan sistem non perpipaan dikelola oleh masyarakat baik secara individu
maupun kelompok.
Di sebuah wilayah, jumlah permintaan air bersih dapat dipengaruhi oleh
bebarapa faktor, diantaranya pendapatan total keluarga, jumlah tanggungan
keluarga, dan pengeluaran energi dari masing-masing rumah tangga tersebut.
Sehingga dibutuhkan adanya penelitian untuk memperkirakan jumlah permintaan
air yang stabil setiap waktunya. Sumber permasalahan ini berasal dari penelitian
yang dilakukan oleh Universitas Sumatera Utara.
Rumusan masalah yang dibahas dalam praktikum adalah bagaimana
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu pada
1

kasus jumlah permintaan air bersih. Bagaimana pengaruh banyaknya prediktor
(pendapatan total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi
dari masing-masing rumah tangga) dan nilai koefisien determinasi terhadap model
serta bagaimana uji asumsi residual IIDN dan multikolinieritasnya. Tujuannya
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu, dan
mengetahui apakah residual sudah memenuhi asumsi residual IIDN serta untuk
menegetahui variabel prediktor dalam percobaan memiliki koefisien korelasi yang
kuat atau tidak.

2.

Landasan Teori

Pada landasan teori terdapat dipaparkan mengenai regresi linier berganda,
pengujian asumsi residual IIDN, serta air bersih.
2.1

Regresi Linier Berganda
Analisis regresi merupakan salah satu teknik analisis data dalam statistika
yang seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan
meramal suatu variabel (Kutner, Nachtsheim dan Neter, 2004). Termasuk di
dalamnya adalah analisis regresi linier berganda.
2.1.1
Persamaan Regresi
Bentuk umum model regresi linier berganda dengan p variabel bebas adalah
seperti pada persamaan (1) berikut (Kutner, Nachtsheim dan Neter, 2004).
2.1

Yi = β0 + β X I + β2 X 2 +... + βk X k +εi
1

 Y1  1 X X  X  β
   1 12 1 p − 1   0   ε 1 
 Y2  1 X X  X   β   ε 
Y =   =  21 2 2p−1  1  +  2
Y=Xβ+ε              
  β   
dengan:
Y adala    1 X X  X  ε
Y n1 n2 np−1  p−1  n
2, …, n.  n  
i

h variabel tidak bebas untuk pengamatan ke-i, untuk i = 1,

β0 , β , β2 ,..., βk adalah parameter.
1

X 1 , X 2 ,..., X k adalah

variabel bebas.
εi adalah sisa (error) untuk pengamatan ke-i yang diasumsikan berdistribusi
normal yang saling bebas dan identik dengan rata-rata 0 (nol) dan variansi σ 2 .
2.1.2
Uji Serentak
Untuk mengetahui apakah koefisien yang ada dalam model secara serentak
nyata atau tidak, digunakan uji F, dengan hipotesisnya sebagai berikut:
H 0 : β1 ≡ β2 = ... = βk = 0 (prediktor tidak berpengaruh terhadap respon)
H 1 : Tidak semua β sama dengan nol, untuk k=1,2,…,k
k
Statistik uji yang digunakan adalah:

2

Tabel 2.1 ANOVA Regresi Linier Berganda

Sumber
Varians

Derajat
Sum Square
bebas

Regresi

k

Error

n-k-1

Total

n-1

Mean Square

1 
SSR = b' X ' Y −  Y ' JY
n 

SSR
k
SSR
SSE = SST − SSR = Y ' Y − b' X ' MSR =
n − k −1
1 
SST = Y ' Y −  Y ' JY
n 
MSR =

F
F=

MSR
MSE

(Draper, 1992)
Dimana nilai Fhitung yang dapat dihitung dibandingkan dengan Fα(V 1,V 2 ) dengan
derajat bebas V1=k, V2=n-k-1 dan tingkat signifikan α. Apabila Fhitung >
Fα( k , n −k − ) maka H0 ditolak, yang berarti paling sedikit ada satu β j yang tidak
1
dapat sama dengan nol (Salamah, dkk 2010).
2.1.3
Uji Parsial
Uji parsial digunakan untuk menguji signifikasi variabel predictor terhadap
variabel respon secara individu, jika uji serentak signifikan. Rumusan
hipotesisnya:
H 0 : β j = 0 (variabel predictor X j tidak berpengaruh terhadap respon)
H 1 : β j ≠ 0 , untuk j=0,1,2,….,k
Statistik uji yang digunakan adalah
t hitung =

bi

2.2

var(bi )

[

ˆ
Var ( βj ) = diagonal X T X

]

−
1

σ2

Dimana b = nilai dugaan β ; σ2 = RKG
i
i
Kemudian t hitung dibandingkan dengan nilai table distribusi t dengan derajat bebas
(n-2) dan tingkat signifikan α (Salamah dkk, 2010).
2.1.4
Koefisien Determinan (R2)
Koefisien determinasi didapat dari analisis regresi dengan menggunakan
minitab. Apabila R2 bernilai di atas 75% dapat dijelaskan bahwa nilai variabel Y
yang berada di atas 75% tersebut dapat dijelaskan oleh variabel-variabel bebas
yang ada dalam model. Sedangkan sisanya yang berada di bawah 75% dijelaskan
oleh oleh variabel-variabel bebas yang tidak ada dalam model. Tingginya nilai R 2
ini menandakan baiknya model yang telah didapatkan, artinya model telah sesuai
dan antar variabel pada model terrsebut mempunyai korelasi yang sama (Salamah
dkk, 2010).

3

R2 =

SSR
x100%
SST

2.3

2.2

IIDN
Pemeriksaan asumsi IIDN~(0, σ 2 ) digunakan untuk mengetahui data yang
dihasilkan setelah melakukan percobaan sudah memenuhi ketiga asumsi IIDN~(0,
σ 2 ) dan dijelaskan sebagai berikut.
2.2.1 Uji Asumsi Residual Independen
Pemeriksaan residual independen dilakukan untuk melihat apakah residual
memenuhi asumsi independen. Suatu data dikatakan independen apabila plot
residualnya menyebar secara acak dan tidak membentuk suatu pola tertentu
Pemeriksaan asumsi residual independen bisa dilihat dengan cara visual versus
order dan bisa dihitung menggunakan uji Durbin-Watson dapat diketahui sebagai
berikut. (Gujarati,1991)
Hipotesisuji Durbin Watson adalah sebagai berikut.
a)
Hipotesis pertama:
H0: tidak ada korelasi positif
H1: ada korelasi positif
Pengambilan keputusan:
d < dL : tolak H0
d > du : terima H0
dL≤ d ≤ du : tidak dapat disimpulkan (inclonclusive)
Hipotesis kedua:
H0: tidak ada korelasi negatif
H1: ada korelasi negatif
d > 4-dL : tolak H0
d < 4-du : terima H0
4-du ≤ d ≤ 4-dL : tidak dapat disimpulkan (inclonclusive)
Hipotesisketiga:
H0: tidak ada korelasi positif ataunegatif
H1: ada korelasi positif ataunegatif
d < dL : tolak H0
d > 4-dL : tolak H0
du< d < 4-du : terimaH0
dL≤ d ≤ du atau 4-du≤ d ≤ 4-dL : tidak dapat disimpulkan
dengan
: d = nilai d Durbin Watson
dL = batas bawah
dU = batas atas
Satistik Uji:
2
d =

∑[(e − e ]
∑(e )
i−
1

i

2

i

4

2.4

2.2.2
Uji Asumsi Residual Identik
Pemeriksaan residual identik dilakukan untuk melihat apakah residual
memenuhi asumsi identik. Suatu data dikatakan identik apabila plot residualnya
menyebar secara acak dan tidak membentuk suatu pola tertentu. Nilai variansnya
rata-rata sama antara varians satu dengan yang lainnya . Pemeriksaan asumsi
residual identik bisa dilihat dengan cara visual versus fits dan bisa dihitung
menggunakan uji White dapat diketahui sebagai berikut.
a. Estimasi model populasi berdasarkan sampel yang diambil sehingga diperoleh
model sampel y = β0 + β1 x1 + β2 x 2 + + βk x k + ε sehingga didapatkan model
sampel sebagai berikut.
ˆ
ˆ
ˆ
ˆ
ˆ
y i = β0 + β1 x1 + β2 x 2 + + βk x k +ε

Dan cara mendapatkan residualnya
b. Estimasi model populasi

ˆ
ei = y i − y i

2
e 2 = α 0 + α1 x1 + α 2 x 2 + α 3 x12 + α 4 x 2 + α 5 x1 x 2 + V

Sehingga diperoleh model sampel sebagai berikut.
2
ˆ
ei2 = α 0 + α1 x1 + α 2 x 2 + α3 x12 + α 4 x 2 + α 5 x1 x 2

Sehingga dapat diketahui koefisien determinasi(R2) dari model
H0 : residual identik
H1 : residual tidak identik
Daerah kritis : Tolak H0 jika χ2hitung > χ2tabel
Statistik uji : R2 =

SSR
x100%
SST
2.5

2
χhitung = n * R 2

(Catatan: Santi P R)

2.2.3 Uji Asumsi Distribusi Normal
Pemeriksaan residual berdistribusi normal dilakukan untuk melihat apakah
residual memenuhi asumsi berdistribusi normal, apabila plot residualnya
cenderung mendekati garis lurus (linier) Jadi data dikatakan baik jika data tesebut
memenuhi asumsi IIDN Pemeriksaan asumsi residual berdistribusi normal dilihat
dengan Q-Q Plot dengan hipotesis sebagai berikut. (De
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Daerah kritis : Tolak H0 jika rQ ≤ r(n,α)
Statistik uji :
n

rQ =

∑ (e − e ) z
i

i =1

n

i

2.6

n

∑ (e − e ) ∑ ( z )
i =1

2

i

i =1

2

i

Jika
menggunakan
kolmogorov-smirnov
hipotesisnya adalah sebagai berikut.
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Daerah kritis : Tolak H0 jika P-Value ≤ α
Statistik ujinya dapat dilihat dari P-value yang didapat pada percobaan dengan
software.
5

(Catatan: Santi P R)
2.2.4 Pemeriksaan Multikolinieritas
Multikolinieritas adalah suatu kondisi dimana terjadi korelasi yang kuat
diantara variabel-variabel bebas (X) yang diikutsertakan dalam pembentukan
model regresi linier. Untuk mendeteksi apakah model regresi kita mengalami
multikolinieritas, dapat diperiksa menggunakan VIF (Variance Inflation Factor).
Jika nilai VIF > 10 berarti telah terjadi multikolinieritas (Gujarati, 1991).

VIF =

1
1 − R2( Xi )

2.7

2.3

Air Bersih, Pendapatan, Jumlah Anggota Keluarga, Pengeluaran
Energi
Kebutuhan air bersih merupakan kebutuhan yang tidak terbatas dan
berkelanjutan. Sedang kebutuhan akan penyediaan dan pelayanan air bersih dari
waktu ke waktu semakin meningkat yang terkadang tidak diimbangi oleh
kemampuan pelayanan. Peningkatan kebutuhan ini disebabkan oleh peningkatan
jumlah penduduk, peningkatan derajat kehidupan warga serta perkembangan
kota/kawasan pelayanan ataupun hal-hal yang berhubungan dengan peningkatan
kondisi sosial ekonomi warga.
Sebuah studi Bank Dunia yang disebarluaskan bulan Agustus 2008
menemukan bahwa kurangnya akses terhadap sanitasi menyebabkan biaya
finansial dan ekonomi yang berat bagi ekonomi Indonesia, tidak hanya bagi
individu tetapi juga bagi sektor publik dan perdagangan (IRD, 2013).

3.

Metode Penelitian

Data penelitian ini merupakan data sekunder yang diambil dari internet pada
tanggal 22 Oktober 2013 dengan data dari Universitas Sumatera Utara. Variabelvariabel pengukuran yang digunakan adalah jumlah permintaan air bersih (Y)
dalam m3, pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X3) dalam rupiah
dengan jumlah sampel 30 data. Berikut langkah analisis yang digunakan dalam
penelitian ini yakni mencari data yang memiliki satu variabel respon, dengan tiga
variabel predictor, menginputkan dan melakukan analisis regresi linear berganda
dari data jumlah permintaan air bersih, pendapatan total keluarga, jumlah
tanggungan keluarga, dan pengeluaran energi. Selanjutnya mengambil setiap hasil
scatterplot, korelasi, uji serentak, uji parsial, analisis regresi dan residual lalu
menganalisis sehingga dapat diambil kesimpulan dan saran, yang kemudian
membuat makalah.

4.

Analisis Korelasi Linier dan Regresi Linier Sederhana

Data pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X 3) serta jumlah
permintaan air bersih (Y) dalam m3, dalam rupiah dengan jumlah sampel 30 data
dapat dilakukan analisi korelasi linier dan regresi linier sederhana sebagai berikut.

6

4.1

Analisis Regresi Linier Berganda
Analisis regresi linier berganda dilakukan dengan menganalisis estimasi
model, koefisien determinasi, uji serentak, uji parsial dari variabel pendapatan
total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi dengan
menganggap asumsi metode OLS terpenuhi.
4.1.1
Uji Serentak
Persamaan
estimasi

model

analisis

regresi
linier
adalah
artinya setiap kenaikan X1
(pendapatan total keluarga) sebanyak satu rupiah maka Y (jumlah permintaan air
bersih) akan bertambah sebesar 0.000003 M3 saat variabel lain konstan dan setiap
kenaikan X2 (jumlah tanggungan keluarga) sebanyak satu orang maka Y(jumlah
permintaan air bersih) akan bertambah sebesar 1.17 M3 saat nilai variabel lain
konstan serta setiap kenaikan X3 (pegeluaran energi) sebanyak satu rupiah maka
Y(jumlah permintaan air bersih) akan berkurang sebesar 0.000010 M3 saat
variabel lain konstan.
Berikut uji serentak parameter model regresi dari pendapatan total keluarga,
jumlah tanggungan keluarga, pengeluaran energi terhadap jumlah permintaan air
bersih.
Hipotesis
H 0 : β1 = β2 = β3 = 0 (pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak berpengaruh signifikan terhadap jumlah permintaan air
bersih)
H 1 : Minimal ada satu β j ≠ 0 (maka ada minimal satu dari pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi berpengaruh
signifikan terhadap jumlah permintaan air bersih)
Y = 2.36 + 0.000003 X 1 +1.17 X 2 - 0.000010 X 3

Tabel 4. 1 ANOVA Uji Serentak Parameter Model Regresi Variabel Y dan X1, X2, X3

Source
DF SS
MS
F
P
Regression
3
504.47
168.16
9.02
0.000
Residual Error
26 484.57
18.64
Total
29 989.04
Tabel 4.1 diperoleh keputusan tolak H0 Fhitung (9.02) > F0.05( 3, 26 ) ( 2.98) .
Artinya, minimal satu dari pendapatan total keluarga, jumlah tanggungan keluarga
dan pengeluaran energi berpengaruh signifikan terhadap jumlah permintaan air
bersih.
4.1.2
Uji Parsial
Pada uji serentak yang dihasilkan adalah tolak H 0 sehingga dilakukan uji
parsial parameter model regresi jumlah permintaan air bersih dengan pendapatan
total keluarga, jumlah tanggungan keluarga dan pegeluaran energi.
Hipotesis:
H 0 : β j = 0 (pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 tidak berpengaruh signifikan terhadap jumlah permintaan
air bersih)

7

H 1 : βj ≠ 0 (

pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 berpengaruh signifikan terhadap jumlah permintaan air
bersih)
Tabel 4. 2 Uji Individu Parameter Model Regresi Variabel Y dan X1, X2, X3

No
1
2

Regresi
Constan

Coef
2.358
0.00000322

SE Coef
Thitung
T(df.error=28, α =0.05)
2.625
0.9
1.701
0.0000009
3.5
1.701
X1
2
3
X2
1.1731
0.5881
1.99
1.701
4
-0.00000959 0.0000103
-0.09
1.701
X3
1
Tabel 4.2, pada uji regresi individu, pertama Thitung (0.9) <T(df.error, α) (1.701)
adalah gagal tolak H0. artinya seluruh variansi respon dapat dijelaskan oleh
presiktor. Kedua Thitung (3.5) > T(df.error, α) (1.701) adalah tolak H0. artinya
pendapatan total keluarga berpengaruh signifikan terhadap jumlah permintaan air
bersih. Pada uji regresi individu ketiga P-Value (1.99) > T(df.error, α) (1.701) adalah
tolak H0. artinya jumlah tanggungan keluarga berpengaruh signifikan terhadap
jumlah permintaan air bersih. Pada uji regresi individu keempat P-Value (0.09) <
T(df.error, α) (1.701) adalah gagal tolak H0. artinya pengeluaran energi tidak
berpengaruh signifikan terhadap jumlah permintaan air bersih.
Pemeriksaan Asumsi Residual IIDN (0, σ 2 )
Berikut merupakan pemeriksaan asumsi identik independen, dan
berdistribusi normal dari pendapatan total keluarga, jumlah tanggungan keluarga,
pengeluaran energi terhadap jumlah permintaan air bersih.
4.2

4.2.1 Pengujian Asumsi Residual Identik
Pengujian asumsi residual identik dapat divisualisasikan melalui gambar
versus fits dan menggunakan uji White. Berikut pemaparannya.
4.2.1.1 Uji Identik Versus Fits
Berikut merupakan gambar uji identik secara visual.
Ver sus Fi t s

(response is Y)
15

Residual

10

5

0

-5
5.0

7.5

10.0

12.5
15.0
Fit t ed Value

17.5

20.0

22.5

Gambar 4. 1 Versus Fits Identik Residual

Gambar 4.1 dapat diketahui sebaran plot residual menyebar secara acak
dan tidak membentuk pola sehingga dapat dikatakan data jumlah permintaan air
8

bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi adalah identik.
4.2.1.2
Dengan

Uji White
persamaan
estimasi

model

uji

White

adalah

2
2
ˆ
e 2 = − .9 + 0.000043 x1 +30.5 x 2 − 0.000120 x3 − 0.000000 x1 −3.28 x 2
66

2
+ 0.000000 x3 + 0.000001x1 x 2 = 0.000000 x1 x3 + 0.000016 x 2 x3 + 0.000000 x1 x 2 x3

maka berikut ini hasil dari pengujian identik dengan menggunakan prosedur uji
white dari jumlah permintaan air bersih dengan pendapatan total keluarga, jumlah
tanggungan keluarga dan pegeluaran energi..
Hipotesis:
H 0 : Residual identik (homoskedostisitas)
H 1 : Residual tidak identik (heteroskedostisitas)
2
χhitung = n * R 2 = 30*16.5%=4.95
Tabel 4. 3 ANOVA Uji Indetik Prosedur Uji White
Source
Regression
Residual Error
Total

DF
1
28
29

SS
1.01
988.03
989.04

MS
1.01
35.29

F
0.03

P
0.867

Tabel 4.6 diketahui bahwa df=10, R2=16.5%, maka gagal tolak H 0 karena
2
χhitung ( 4.95) < χ2 , 0.05 (18.307) , artinya pada uji asumsi residual identik secara
10
uji White dari data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi adalah memenuhi uji residual
identik.
4.2.2
Pengujian Asumsi Residual Independen
Pengujian asumsi residual independen dapat divisualisasikan melalui
gambar versus order dan menggunakan uji Durbin-Watson. Berikut
pemaparannya.
4.2.2.1 Uji Residual Independen Versus Order
Berikut merupakan gambar uji independen secara visual.
Ver su s Or der
(response is Y)

15

Residual

10

5

0

-5
2

4

6

8

10

12 14
16 18 20
Obser v at ion Or der

22

24

26

28

30

Gambar 4. 2 Versus Order

Gambar 4.2 dapat diketahui sebaran plot residual tidak menyebar secara
acak sehingga dapat dikatakan data jumlah permintaan air bersih dengan

9

pendapatan total keluarga, jumlah tanggungan keluarga dan pengeluaran energi
adalah tidak independen.
4.2.2.2 Uji Durbin-Watson
Merupakan uji yang digunakan untuk menentukan asumsi Indepeden.
Hipotesis:
H 0 : ρ e = 0 (tidak ada korelasi serial(otokorelasi) pada residual)
H 1 : ρe ≠ 0 (ada korelasi serial (otokorelasi) pada residual)
α = 5%
Daerah kritis: du=1.21 dl=1.65
Statistik Uji:

∑[e − e ]
d=
∑(e )
i −1

i

2

i

2

=

977.9591232
= 2.018194
484.5713193

Keputusan: Tolak H0 jika H0 (d<dl) atau (4-d)<du
Kesimpulan:
Gagal tolak H0 karena d (2.01)>dl(1.65), 1.99>1.21 artinya jumlah permintaan air
pegeluaran energi tidak independen.
4.2.3
Pengujian Asumsi Residual Normalitas
Pada pengujian asumsi residual normalitas dapat menggunakan uji
kolmogorov smirnov, uji Q-Q plot, dan uji RQ. Berikut pemaparannya.
4.2.3.1Uji Kolmogorov Smirnov
Uji yang digunakan untuk mengetahui apakah data berdistri busi Normal.
Hipotesis:
H0 = Berdistribusi Normal
H1 = Tidak berdistribusi Normal
α = 5%
Daerah Kritis: Tolah H0 jika  p-value < α (0.05)
Pr obabi l i t y Pl ot of RESI 1
Normal

99

Mean
StDev
N
KS
P-Value

95
90
80

Per cent

70
60
50
40
30
20
10
5

1

-10

-5

0

RESI 1

5

10

15

Gambar 4. 3 Kolmogorov Smirnov

10

-2.07242E-16
4.088
30
0.180
0.018

Gambar 4.3 menunjukkan p-value dari residual sebesar 0.018 lebih kecil
dari α = 0.05 sehinga tolak H0 yang artinya data jumlah permintaan air bersih
dengan pendapatan total keluarga, jumlah tanggungan keluarga dan pegeluaran
energi tidak berdistribusi normal.
4.2.3.2 Uji Q-Q plot
Dari pengujian Q-Q plot dihasilkan sactterplot seperti gambar berikut.
Scat t er pl ot of z v s e u r u t an
3

2

z

1

0

-1

-2
-5

0

5
e ur ut an

10

15

Gambar 4. 4 Uji Q-Q plot

Gambar 4.4 menunjukkan plot dari residualnya tidak mendekati garis
linier, artinya data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi tidak berdistribusi normal.
4.2.3.3 Uji RQ
Hipotesis:
H0 = Data berdistribusi Normal
H1 = Data tidak berdistribusi Normal
Daerah Kritis: Tolak H0 jika rQ ≤ r(n,α)
Statistik Uji:
n

rQ =

∑ (e
i =1

n

∑ (e
i =1

i

i

− e) z i

− e) 2

=

n

∑ (z )
i =1

2

- 23.6966
= −0.20073
(22.0129807)(5)

i

Karena rQ sebesar -0.020073 lebih kecil dari r(n,α) sebesar 0.9652 sehingga
tolak H0 yang artinya data jumlah permintaan air bersih dengan pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi adalah tidak
berdistribusi normal.
4.2.4
Multikolinieritas
Berikut ini hasil dari pengujian multikolinieritas dari jumlah permintaan air
pegeluaran energi.
Hipotesis:
H 0 : Tidak ada multikolinieritas (tidak ada hubungan antara pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi)
11

H1 :

Ada multikolinieritas (ada hubungan antara pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi)
Tabel 4. 4 ANOVA Uji Multikolinieritas

No Predikto
r

SSR

SST

1

56292300000
0
15.473
11009125301

277498000000
0
69.367
18622200000

2
3

X1
X2
X3

R 2 (%
j

VIF

)
20.3

1.255

22.3
5.9

1.287
1.063

Tabel 4.8 diketahui bahwa dari keseluruhan nilai VIF dari masing-masing regresi
menghasilkan VIF < 10 sehingga gagal tolak H 0 , artinya data pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi tidak ada hubungan
multikolinieritas.

5.

Kesimpulan

1.

Ada hubungan (korelasi) linier antara jumlah permintaan air bersih dengan
pendapatan total keluarga dan jumlah tanggungan keluarga, sedangkan
untuk jumlah permintaan air bersih dan pengeluaran energi tidak ada
hubungan linier.
Tabel analisis berganda, diketahui bahwa pendapatan total keluarga, jumlah
tanggungan keluarga dan pengeluaran energi berpengaruh signifikan
terhadap jumlah permintaan air bersih.
Tabel uji parsial parameter, diketahui bahwa pendapatan total keluarga dan
jumlah tanggungan keluarga berpengaruh signifikan terhadap jumlah
permintaan air bersih, sedangkan pengeluaran energi tidak berpengaruh
signifikan terhadap jumlah permintaan air bersih.
Dengan adanya uji asumsi IIDN, diketahui bahwa data tidak berdistribusi
normal, tidak independen dan identik, serta tidak terjangkit multikolinieritas
dari data pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak multikolinieritas terhadap jumlah permintaan air
bersih.

2.
3.

4.

6.

Daftar Pustaka

1.
Draper, Harry Smith dan Norman. 1992. Analisis Regresi Terapan.
Jakarta: Gramedia Puataka Utama.
2.
Gesaf. (2008, November). Regresi dan Korelasi Sederhana. Retrieved
September
28,
2013,
from
gesaf.files.wordpress.com:
http://gesaf.files.wordpress.com/2008/11/regresi-dan-korelasi.pdf.
3.
Salamah, M dan Distri Susilaningrum. 2010. Modul Praktikum
PenghantarMetode Statistika. Surabaya: Jurusan Statistika ITS.
4.
Setiawan, Y. (2012, Desember 09). Analisis Regresi Linier Sederhana dan
Analisis
Korelasi.
Retrieved
September
28,
2013,
from
yudhasetiawanst.blogspot.com:
http://yudhasetiawanst.blogspot.com/2012/12/analisis-regresi-korelasi-linier.html

12

5.
Kutner, M.H., C.J. Nachtsheim., dan J. Neter. 2004. Applied Linear
Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc.
6.
IRD. (2013). Program Air Bersih dan Sanitasi. Retrieved October 24,
2013, from http://www.ird.or.id/
7.
Air Bersih, Jumlah Keluarga, Jumlah Pendapatan, dan Kebutuhan
Energi.
(n.d.).
Retrieved
October
22,
2013,
from
httprepository.usu.ac.idbitstream123456789191211Appendix.pdf
8.
Gujarati, D. 1991. Ekonometrika Dasar : Jakarta: Penerbit Erlangga.
9.
Catatan Bu Santi Puteri tanggal 6 November 2013

Lampiran
Lampiran 1: Data
No Y
X1
X2
X3
1
15.7
700000 4
60000
Keterangan:5
2
3.4
300000
185000
Y = Jumlah Permintaan Air Bersih (M3)
3
5.3
650000 6
76000
X1 = Pendapatan Total Keluarga (Rp)
265000
Tanggungan Keluarga (orang)
4
23.5 X2 = Jumlah10
75000
0
X3 = Pengeluaran Energi (Rp)
5
10.3
400000 6
150000
6
8.2
300000 4
75000
196300
7
22.2
4
45000
0
8
10.8
950000 6
22500
9
6.3
300000 6
63000
10 6.4
700000 4
225000
120000
11 15.1
7
50000
0
12 8.2
300000 4
30000
158600
13 8.2
4
150000
0
177500
14 11.9
5
325000
0
15 22.6
700000 5
50000
375000
16 16
6
50000
0
150000
17 11.7
5
100000
0
18 4
600000 3
20000
19 10
700000 3
12000
175000
20 17.6
5
55000
0
264550
21 17.3
7
290000
0
22 4.6
400000 5
55000

13

23
24

5
4.6

25

14.1

26
27
28
29
30

318000
300000
350000
0
300000
300000
600000
300000
800000

5.3
6.3
9.1
6.3
7.2

3
3

15000
17000

4

40000

3
3
4
4
5

60000
30000
130000
130000
20000

Lampiran
Correlations: Y, X1, X2, X3
Y
0.655
0.000

X1

X2

0.520
0.003

0.445
0.014

X3

0.032
0.867

0.170
0.369

X1

X2

0.231
0.219

Cell Contents: Pearson correlation
P-Value

Lampiran 3: Uji Regresi Berganda
Regression Analysis: Y versus X1, X2, X3
The regression equation is
Y = 2.36 + 0.000003 X1 + 1.17 X2 - 0.000010 X3
30 cases used, 1 cases contain missing values
S = 4.31710

R-Sq = 51.0%

R-Sq(adj) = 45.4%

Analysis of Variance
Source
Regression
Residual Error
Total
Predictor
Constant
X1
X2
X3

DF
3
26
29

SS
504.47
484.57
989.04

Coef
2.358
0.00000322
1.1731
-0.00000959

MS
168.16
18.64

SE Coef
2.625
0.00000092
0.5881
0.00001031

F
9.02

T
0.90
3.50
1.99
-0.93

Residual Plots for Y

14

P
0.000

P
0.377
0.002
0.057
0.361

VIF
1.254
1.287
1.063

Resi dual Pl ot s f or Y
No rmal Pro b ab ilit y Plo t

Versu s Fit s
10
Residual

15

90
Per cent

99

50

5
0

10
1

-5
-10

-5

0
5
Residual

10

5

10

Hist o g ram

15
Fit t ed Value

20

Versu s Ord er
15
10

7.5

Residual

Fr equency

10.0

5.0

5
0

2.5
0.0

-5
-5.0 -2.5 0.0

2.5 5.0
Residual

7.5

10.0 12.5

2

4

6

8 10 12 14 16 18 20 22 24 26 28 30

Obser vat ion Or der

Regression Analysis: Y versus X1
Y = 6.37 + 0.000004 X1
S = 4.49268

R-Sq = 42.9%

R-Sq(adj) = 40.8%

Source
Regression
Residual Error
Total

DF
1
28
29

SS
423.88
565.16
989.04

MS
423.88
20.18

F
21.00

P
0.000

Y = 1.21 + 1.96 X2
S = 5.07642

R-Sq = 27.0%

R-Sq(adj) = 24.4%

Source
Regression
Residual Error
Total

DF
1
28
29

SS
267.48
721.56
989.04

MS
267.48
25.77

F
10.38

P
0.003

Y = 10.4 + 0.000002 X3

15

S = 5.94027

R-Sq = 0.1%

R-Sq(adj) = 0.0%

Source
Regression
Residual Error
Total

DF
1
28
29

SS
1.01
988.03
989.04

MS
1.01
35.29

F
0.03

P
0.867

Regression Analysis: e^2 versus X1, X2, ...
e^2 = - 66.9 + 0.000043 X1 + 30.5 X2 - 0.000120 X3 - 0.000000 x1^2 - 3.28
X2^2
+ 0.000000 X3^2 + 0.000001 X1*X2 - 0.000000 X1*x3 + 0.000016 X2*X3
+ 0.000000 X1*X2*X3
Predictor
Constant
X1
X2
X3
x1^2
X2^2
X3^2
X1*X2
X1*x3
X2*X3
X1*X2*X3

Coef
-66.88
0.00004255
30.50
-0.0001197
-0.00000000
-3.281
0.00000000
0.00000145
-0.00000000
0.0000163
0.00000000

S = 36.5406

SE Coef
76.12
0.00006126
30.10
0.0009461
0.00000000
3.591
0.00000000
0.00001177
0.00000000
0.0002163
0.00000000

R-Sq = 16.5%

T
-0.88
0.69
1.01
-0.13
-1.04
-0.91
0.16
0.12
-0.42
0.08
0.25

P
0.391
0.496
0.324
0.901
0.309
0.372
0.874
0.903
0.680
0.941
0.805

R-Sq(adj) = 0.0%

Source
Regression
Residual Error
Total

DF
10
19
29

SS
5018
25369
30387

MS
502
1335

F
0.38

P
0.942

Regression Analysis: X1 versus X2, X3
X1 = - 293013 + 271159 X2 + 0.86 X3
S = 905141

R-Sq = 20.3%

R-Sq(adj) = 14.4%

Source
Regression
Residual Error
Total

DF
2
27
29

SS
5.62923E+12
2.21206E+13
2.77498E+13

MS
2.81462E+12
8.19280E+11

Y = 6.37 + 0.000004 X1

16

F
3.44

P
0.047

S = 4.49268

R-Sq = 42.9%

R-Sq(adj) = 40.8%

Source
Regression
Residual Error
Total

DF
1
28
29

SS
423.88
565.16
989.04

MS
423.88
20.18

F
21.00

P
0.000

X1 = - 293013 + 271159 X2 + 0.86 X3
S = 905141

R-Sq = 20.3%

R-Sq(adj) = 14.4%

Source
Regression
Residual Error
Total

DF
2
27
29

SS
5.62923E+12
2.21206E+13
2.77498E+13

MS
2.81462E+12
8.19280E+11

F
3.44

P
0.047

X2 = 3.79 + 0.000001 X1 + 0.000003 X3
S = 1.41281
R-Sq = 22.3%
Source
Regression
Residual Error
Total

DF
2
27
29

SS
15.473
53.893
69.367

R-Sq(adj) = 16.6%
MS
7.737
1.996

F
3.88

P
0.033

X3 = 31546 + 0.0068 X1 + 10059 X2
S = 80556.5
R-Sq = 5.9%
R-Sq(adj) = 0.0%
Source
DF
SS
MS
F
Regression
2 11009125301 5504562650 0.85
Residual Error 27 1.75212E+11 6489349989
Total
29 1.86222E+11
Hasil Uji Durbin Watson
e

e(i)-1

P
0.439

Hasil Uji rQ
[(e(i)-1)-e]^2

ei-ebar

(ei-ebar)z

(ei-ebar)^2

z^2

6.973439

6.973439

-14.8398

48.62885148

5

-4.0149

6.973439

120.743675

-4.0149

6.603929

16.11945157

3

-5.45863

-4.0149

2.08434054

-5.45863

7.549251

29.79662201

2

1.606717

-5.45863

49.9191001

1.606717

-1.91491

2.581538854

1

1.054821

1.606717

0.30458915

1.054821

-1.09325

1.112647001

1

0.903742

1.054821

0.02282484

0.903742

-0.81584

0.816749451

1

17

9.267492

0.903742

69.9523108

9.267492

-7.26108

85.88640277

1

-1.43637

9.267492

114.572728

-1.43637

0.968819

2.063168465

0

-3.45755

-1.43637

4.08516818

-3.45755

1.981066

11.95467461

0

-0.74483

-3.45755

7.35884571

-0.74483

0.355316

0.554777722

0

1.150049

-0.74483

3.59058194

1.150049

-0.44314

1.322612865

0

0.472362

1.150049

0.45926

0.472362

-0.14017

0.2231257

0

-2.51342

0.472362

8.91489012

-2.51342

0.528895

6.317277554

0

1.083164

-2.51342

12.9354108

1.083164

-0.13611

1.173243625

0

12.60445

1.083164

132.739957

12.60445

-0.52673

158.8720718

0

-4.97832

12.60445

309.153646

-4.97832

-0.20804

24.78366098

0

-0.38926

-4.97832

21.0594506

-0.38926

-0.04892

0.151524432

0

-3.61525

-0.38926

10.4070175

-3.61525

-0.76075

13.07004939

0

1.98643

-3.61525

31.3788504

1.98643

0.589449

3.945906096

0

4.27529

1.98643

5.23887808

4.27529

1.647357

18.27810501

0

1.001619

4.27529

10.7169225

1.001619

0.477813

1.003240527

0

-4.38274

1.001619

28.9913235

-4.38274

-2.51117

19.20841169

0

-1.75619

-4.38274

6.89874384

-1.75619

-1.18453

3.08421811

0

-2.07913

-1.75619

0.10428677

-2.07913

-1.629

4.322776708

1

-3.82385

-2.07913

3.0440602

-3.82385

-3.45192

14.6218469

1

-0.96692

-3.82385

8.16205569

-0.96692

-1.00215

0.934936602

1

-0.25451

-0.96692

0.50753268

-0.25451

-0.30333

0.064774282

1

1.366102

-0.25451

2.62637676

1.366102

1.889311

1.866234881

2

-0.46902

1.366102

3.36765747

-0.46902

-0.77146

0.219975782

3

-3.40477

-0.46902

8.61863888

-3.40477

-7.2455

11.59244242

5

Total

-23.6966

484.5713193

29

22.0129807

5

sum[(e(i)-1)-e]^2

977.959123

sum e^2

484.5713

D

2.018194

akar

rq=

Uji Q-Q plot
i

e urutan

i-0.5/30

z

1

-5.45863

0.016667

-2.12805

2

-4.97832

0.05

-1.64485

3

-4.38274

0.083333

-1.38299

4

-4.0149

0.116667

-1.19182

5

-3.82385

0.15

-1.03643

6

-3.61525

0.183333

-0.90273

7

-3.45755

0.216667

-0.7835

8

-3.40477

0.25

-0.67449

9

-2.51342

0.283333

-0.57297

10

-2.07913

0.316667

-0.47704

11

-1.75619

0.35

-0.38532

12

-1.43637

0.383333

-0.29674

18

-0.20073

13

-0.96692

0.416667

-0.21043

14

-0.74483

0.45

-0.12566

15

-0.46902

0.483333

-0.04179

16

-0.38926

0.516667

0.041789

17

-0.25451

0.55

0.125661

18

0.472362

0.583333

0.210428

19

0.903742

0.616667

0.296738

20

1.001619

0.65

0.38532

21

1.054821

0.683333

0.47704

22

1.083164

0.716667

0.572968

23

1.150049

0.75

0.67449

24

1.366102

0.783333

0.7835

25

1.606717

0.816667

0.902735

26

1.98643

0.85

1.036433

27

4.27529

0.883333

1.191816

28

6.973439

0.916667

1.382994

29

9.267492

0.95

1.644854

30

12.60445

0.983333

2.128045

19

ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL

Similar to ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL (20)

More from Arning Susilawati

More from Arning Susilawati (14)

ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL