Analisis Regresi Liniear Sederhana

1
1 Pendahuluan
1.1 Pengertian Analisis Regresi
Regresi dalam pengertian moderen menurut Gujarati (2009) ialah sebagai
kajian terhadap ketergantungan satu variabel, yaitu variabel tergantung terhadap
satu atau lebih variabel lainnya atau yang disebut sebagai variabel – variabel
eksplanatori dengan tujuan untuk membuat estimasi dan / atau memprediksi rata –
rata populasi atau nilai rata-rata variabel tergantung dalam kaitannya dengan nilai
– nilai yang sudah diketahui dari variabel ekslanatorinya. Selanjutnya menurut
Gujarati meski analisis regresi berkaitan dengan ketergantungan atau dependensi
satu variabel terhadap variabel – variabel lainnya hal tersebut tidak harus
menyiratkan sebab – akibat (causation). (Jonatan, 2017)
Regresi linear sederhana adalah metode statistik yang berfungsi untuk
menguji sejauh mana hubungan sebab akibat antara variabel faktor penyebab (X)
terhadap variabel akibatnya. Faktor penyebab pada umumnya dilambangkan
dengan X atau disebut juga dengan predictor sedangkan variabel akibat
dilambangkan dengan Y atau disebut juga dengan response. Regresi linear
sederhana atau sering disingkat dengan SLR (Simple Linear Regression) juga
merupakan salah satu metode statistik yang dipergunakan dalam produksi untuk
melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun
kuantitas.Model Persamaan Regresi Linear Sederhana adalah seperti berikut ini :
Y = a + bX
Dimana :
Y = Variabel Response atau Variabel Akibat (Dependent)
X = Variabel Predictor atau Variabel Faktor Penyebab (Independent)
a = konstanta
b = koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh
Predictor.
Nilai-nilai a dan b dapat dihitung dengan menggunakan Rumus dibawah ini :

2
a = (Σy) (Σx²) – (Σx) (Σxy)
n(Σx²) – (Σx)²
b = n(Σxy) – (Σx) (Σy)
n(Σx²) – (Σx)² (Kho, 2017)
1.2 Syarat-Syarat penggunaan Regresi
Model kelayakan regresi linear didasarkan pada hal-hal sebagai berikut:
1. Model regresi dikatakan layak jika angka signifikansi pada ANOVA sebesar
< 0.05.
2. Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini
diketahui jika angka Standard Error of Estimate < Standard Deviation.
3. Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji T.
Koefesien regresi signifikan jika T hitung > T tabel (nilai kritis).
4. Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi yang
sangat tinggi atau sangat rendah antar variabel bebas. Syarat ini hanya berlaku
untuk regresi linier berganda dengan variabel bebas lebih dari satu.
5. Tidak terjadi otokorelasi. Terjadi otokorelasi jika angka Durbin dan Watson
(DB) sebesar < 1 dan > 3.
6. Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2
semakin besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1
maka model regresi semakin baik. Nilai r2 mempunyai karakteristik
diantaranya: 1) selalu positif, 2) Nilai r2 maksimal sebesar 1. Jika Nilai r2
sebesar 1 akan mempunyai arti kesesuaian yang sempurna. Maksudnya seluruh
variasi dalam variabel Y dapat diterangkan oleh model regresi. Sebaliknya jika
r2 sama dengan 0, maka tidak ada hubungan linier antara X dan Y.
7. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung
(Y)
8. Data harus berdistribusi normal
9. Data berskala interval atau rasio

3
10. Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel
bebas (disebut juga sebagai variabel predictor) sedang variabel lainnya variabel
tergantung (disebut juga sebagai variabel response) (Arnita, 2013)
1.3 Uji Asumsi
1.3.1 Uji Normalitas
Uji normalitas data bertujuan untuk menguji apakah dalam model regresi,
variabel residual memiliki distribusi normal (Ghozali 2006). Untuk menguji apakah
data-data yang dikumpulkan berdistribusi normal atau tidak dapat dilakukan
dengan metode sebagai berikut : Uji statistik sederhana yang sering digunakan
untuk menguji asumsi normalitas adalah dengan menggunakan uji normalitas dari
Kolmogorov-Smirnov. Metode pengujian normal tidaknya distribusi data
dilakukan dengan melihat nilai signifikansi variabel jika signifikan lebih besar dari
α = 5% maka menunjukkan distribusi data normal.
1.3.2 Uji Autokorelasi
Uji autokorelasi menggunakan uji Durbin-Watson Test (DW), dimaksudkan
untuk menguji adanya kesalahan pengganggu periode 1 dengan kesalahan
pengganggu pada periode sebelumnya -1. Keadaan tersebut mengakibatkan
pengaruh terhadap variabel dependen tidak hanya karena variabel independen
namun juga variabel dependen periode lalu (Ghozali 2005). Menurut keputusan ada
tidaknya autokorelasi dilihat dari bila nilai DW terletak diantara nilai du dan 4-du
(du<DW<4-du), maka berarti tidak ada autokorelasi. (Satya, 2017)
1.3.3 Uji Homoskedastisitas
Uji homoskedastisitas digunakan dalam menguji error atau galat dalam
model statistik untuk melihat apakah varians atau keragaman dari error terpengaruh
oleh faktor lain atau tidak. Misalnya untuk analisis data runtun waktu, apakah
keragaman errornya terpangaruh oleh waktu atau tidak, atau kalau datanya cross
section maka apakah varians dari error berubah-ubah setiap amatan atau tidak.
(Binus Nusantara, 2015)

4
2 Deskripsi Kerja
2.1 Studi Kasus
Seorang Engineer ingin mempelajari pengaruh Suhu Ruangan terhadap
Jumlah Cacat, sehingga dapat memprediksi atau meramalkan jumlah cacat
produksi jika suhu ruangan tersebut tidak terkendali. Engineer tersebut kemudian
mengambil data selama 30 hari terhadap rata-rata (mean) suhu ruangan dan
Jumlah Cacat Produksi.
Tabel 2.1 Rata-rata Suhu Ruangan dan Jumlah Cacat Produksi
Tanggal
Rata-rata
Suhu
Ruangan
Jumlah
Cacat
1 24 10
2 22 5
3 21 6
4 20 3
5 22 6
6 19 4
7 20 5
8 23 9
9 24 11
10 25 13
11 21 7
12 20 4
13 20 6
14 19 3
15 25 12

5
16 27 13
17 28 16
18 25 12
19 26 14
20 24 12
21 27 16
22 23 9
23 24 13
24 23 11
25 22 7
26 21 5
27 26 12
28 25 11
29 26 13
30 27 14
a. Lakukan analisis regresi sederhana pada data di atas (serta uji asumsi).
Berikan kesimpulan berkaitan dengan model yang anda dapatkan.
b. Dari persamaan regresi yang didapat, jika diketahui data rata-rata suhu
ruangan 18, 30, 29, berapakah hasil prediksi untuk jumlah cacat produksi?
2.2 Langkah Kerja
Adapun langkah kerja dengan menggunakan software R adalah sebagai
berikut:
1. Membuka aplikasi R Studio dengan melakukan double klick pada ikon R
Studio yang ada di dekstop. Tampilan awal R Studio dapat dilihat pada
(gambar 2.1) di bawah ini.

6
Gambar 2.1. Tampilan awal pada program R Studio
2. Panggil data yang telah disimpan dalam bentuk file.csv dengan script seperti
(gambar 2.3).
Gambar 2.2. Memanggil data dari program lain
3. Kemudian akan muncul tampilan seperti (gambar 2.4). Pilih file yang
berbentuk file.csv.
Gambar 2.3. Pilih file yang akan di-input

7
4. Deskripsikan variabel yang dibutuhkan yaitu rata-rata suhu ruangan dan
jumlah cacat dengan menggunakan script seperti (gambar 2.4) di bawah ini.
Gambar 2.4. Deskripsikan variabel
5. Untuk melihat bagaimana plot menggambarkan model dari variabel rata-ata
suhu ruangan dan jumlah cacat dapat dilakukan menggunakan script yang
ada pada (gambar 2.5).
Gambar 2.5. Membuat plot dari model
6. Tuliskan script seperti (gambar 2.6) untuk mendapatkan hasil regresi dan
analisis variansi dari variabel rata-rata suhu ruangan dan jumlah cacat.
Gambar 2.6. Mencari hasil regresi dan analisis variansi
7. Praktikan akan melihat residuals atau error dari data rata-rata suhu dan
jumlah cacat dengan menggunakan script di bawah ini.
Gambar 2.7. Menguji kenormalan data residuals
8. Selanjutnya praktikan melakukan uji kenormalan menggunakan
Kolmogorov-Smirnov, dengan mengaktifkan packages nortest seperti
gambar di bawah ini.

8
Gambar 2.8. Uji kenormalan dengan Kolmogorov-Smirnov
9. Script pada (gambar 2.9) digunakan untuk melakukan uji autokorelasi
dengan Durbin Waston.
Gambar 2.9. Uji autokorelasi dengan Durbin Waston
10. Selanjutnya, uji homoskedastisitas dengan menggunakan script berikut.
Gambar 2.10. Uji homoskedastisitas

9
3 Pembahasan
Berdasarkan langkah kerja yang telah dijelaskan sebelumnya, berikut
adalah pembahasan tentang analisis regresi linier sederhana serta hasil dari prediksi
y untuk nilai x yang telah ditentukan.
Sebelum melakukan analisis regresi linier, praktikan menentukan variabel
independen dan dependen nya.
a. Variabel independennya atau yang dilambangkan dengan x adalah rata-
rata suhu, karena rata-rata suhu akan mempengaruhi cacat produksi.
b. Variabel dependen atau dilambangkan dengan y adalah cacat produksi,
karena cacat produksi dipengaruhi oleh rata-rata suhu.
Berikut adalah plot yang bertujuan untuk menunjukkan linieritas antara
variabel x dan variabel y.
Gambar 3.1. Plot untuk menunjukkan linieritas antara x dan y
Pada uji linearitas antara variabel rata-rata suhu (X) terhadap jumlah cacat
(Y), dapat dilihat pada (gambar 3.1) bahwa jika ditarik garis, maka dari plot nya
akan membentuk suatu garis lurus yang melewati atau mendekati masing-masing
titik. Jadi jika hanya dengan melihat gambar plot yang ada, dapat disimpulkan
sementara bahwa rata-rata suhu dapat mempengaruhi jumlah cacat. Tetapi untuk
memastikan lebih dalam lagi, maka praktikan melakukan uji regresi terhadap rata-
rata suhu dengan jumlah cacat.
Berikut adalah penjelasan tentang tahap analisis regresi linier sederhana.

10
3.1 Uji Overall
a. Hipotesis Uji
H0: β0=0 (model tidak layak)
H1: β1≠0 (model layak)
b. Tingkat Signifikansi
α = 5% = 0.05
c. Daerah Kritis
Tolak H0 jika F-hit > F-tabel, atau p-value ≤ α.
d. Statistik Uji
Diperoleh F-hitung = 293.47 dan nilai p-value = 2.255x10-16 (Lihat gambar
3.2).
e. Keputusan
Karena nilai p-value = 2.255x10-16 < α = 0.05, maka keputusannya tolak H0.
f. Kesimpulan
Dengan tingkat kepercayaan 95%, didapatkan hasil p-value sebesar
2.255x10-16. Yang artinya H0 ditolak, maka model layak untuk digunakan.
Pada (gambar 3.2) berikut, nilai yang ada pada Pr(>F) adalah p-value nya.
Uji Overall dapat dilakukan dengan menggunaka Anova (Analisis Variansi) seperti
(gambar 3.2) berikut.
Gambar 3.2. Uji Overall dengan menggunakan Analisis Variansi
Berdasarkan uji overall sebelumnya dapat diketahu bahwa model layak
digunakan atau model mampu menjelaskan permasalahan yang ada. Setelah uji
overall dilanjutkan dengan uji parsial atau yang biasa dikenal dengan uji T. Dari
visualisasi dapat dilihat terdapat ‘***’ di sebelah p-value yang artinya nilai

11
significant atau tingkat kesalahan nya adalah 0 sehingga cukup dilakukan uji sekali
untuk mengetahui hasilnya.
3.2 Uji Parsial
a. Hipotesis Uji
H0: βi=0 (variable x tidak berpengaruh terhadap y)
H1: β1≠0 (variable x berpengaruh terhadap y)
α = 5% = 0.05
c. Daerah Kritis dan Statistik Uji
Untuk mendapatkan nilai p-value dari intercept (β0) dan X (β1), dapat dilihat
pada (gambar 3.3).
Tabel 3.1 Daerah Kritis dan Statistik Uji untuk Uji Parsial
Koefisien p-value Daerah Kritis Keputusan
Intercept 8.49x10-13 Tolak H0 jika p-value < α Tolak H0 karena p-value
= 8.49x10-13 < α = 0.05
X 2.26x10-16 Tolak H0 jika p-value < α Tolak H0 karena p-value
= 2.26x10-16 < α = 0.05
d. Kesimpulan
Dengan tingkat kepercayaan 95%, didapatkan hasil p-value untuk intercept
sebesar 8.49x10-13 dan untuk X sebesar 2.26x10-16. Yang artinya H0 ditolak
baik untuk intercept (β0) maupun X (β1). Jadi, pada intercept (β0) maupun
X (β1), variabel rata-rata suhu (x) berpengaruh terhadap variabel jumlah
cacat (y).
Data yang didapat dari hasil regresi seperti (gambar 3.3) di bawah ini, dapat
digunakan untuk melakukan uji parsial. Nilai p-value dapat dilihat pada nilai yang
berada di Pr(> | t |).

12
Gambar 3.3. Uji Parsial
3.3 Interpretasi R2
Berdasarkan (gambar 3.3) didapatkan nilai R2 sebesar 0.9129 atau sama dengan
91.29% yang dapat dibulatkan menjadi 91.3%. artinya sebesar 91.3% variasi
jumlah cacat (y) mampu dijelaskan oleh rata-rata suhu (x) dalam model
sedangkan sisanya dijelaskan oleh faktor-faktor lain yang belum masuk ke
dalam model.
3.4 Uji Asumsi
1. Uji Normalitas
a. Hipotesis
H0: Sisaan menyebar normal
H1: Sisaan tidak menyebar normal
α = 5% = 0,05
c. Daerah Kritis
Tolak H0 jika p-value < α
d. Statistik Uji
Diperoleh D = 0.087573 dan nilai p-value = 0.8063 (Lihat gambar 3.4).
e. Keputusan
Karena p-value = 0.08063 > α = 0.05 maka keputusannya gagal tolak H0.
f. Kesimpulan

13
Dengan tingkat kepercayaan 95%, didapatkan hasil p-value sebesar =
0.08063. Yang artinya H0 gagal ditolak, maka sisaan menyebar normal.
Gambar 3.4. Uji normalitas dengan Kolmogorov-Smirnov
Uji normalitas dengan Kolmogorov-Smirnov digunakan untuk
mengetahui kenormalan dari residuals atau error dari model. Pada (gambar
3.4), didapatkan hasil p-value sebesar 0.8063.
2. Uji Autokorelasi
a. Hipotesis
H0: Tidak terdapat autokorelasi
H1: Terdapat autokorelasi
b. Tingkat Signifikasi
α = 5% = 0,05
c. Daerah Kritis
Tolak H0 apabila 0<DW<dl atau 4-dl<DW<4
Gagal Tolak H0 apabila du<DW<4-du
Tidak ada keputusan apabila dl<DW<du atau 4-du<DW<4-dl
d. Statistika Uji
Diperoleh DW = 1.2796 dan nilai p-value = 0.01445 (Lihat gambar 3.5)
e. Keputusan
Tolak H0 karena 0 < DW= 1.2796 < dl = 1.3520
f. Kesimpulan
Dengan tingkat kepercayaan 95%, didapatkan hasil DW sebesar 1.2796.
Yang artinya H0 ditolak karena 0 < DW= 1.2796 < dl = 1.3520, maka
sisaan terdapat autokorelasi.

14
Gambar 3.5. Uji autokorelasi dengan Durbin Waston
Dari (gambar 3.5) di atas, praktikan mendapatkan nilai p-value sebesar
0.01445 dan juga nilai DW sebesar 1.2796 yang digunakan untuk uji autokorelasi.
3. Uji Homoskedastisitas
1. Hipotesis
Ho : Asumsi kehomogenan ragam sisaan terpenuhi
H1 : Asumsi kehomogenan ragam sisaan tidak terpenuhi
2. Tingkat Signifikansi
α = 5% = 0,05
3. Daerah Kritis
Tolak H0 jika p-value ≤ α
4. Statistik Uji
p-value = 0.9659
5. Keputusan
Karena nilai p-value = 0.9659 > α = 0.05, maka gagal tolak Ho.
6. Kesimpulan
Dengan tingkat kepercayaan 95%, didapatkan hasil p-value sebesar
0.9659. Oleh karena itu, H0 gagal ditolak karena p-value = 0.9659 > α =
0.05, maka asumsi kehomogenan ragam terpenuhi.
Gambar 3.6. Uji homoskedastisitas

15
Pada (gambar 3.6) merupakan output yang muncul setelah menuliskan
script “bptest(regres1, studentize=FALSE, data=data)” pada program R.
Kemudian didapatkan BP= 0.0018303 dan p-valuesebesar 0.9659 yang selanjutnya
akan digunakan untuk melakukan uji homoskedastisitas atau menguji
kehomogenan ragam.
3.5 Prediksi
Untuk melakukan prediksi nilai y jika nilai x diketahui, maka harus
menentukan model terlebih dahulu.
Adapun model regresi yang didapat adalah sebagai berikut:
𝑦̂ = β0 + β1X + 𝜀
= -24.38 + 1.45X + 𝜀
Nilai β0 dan β1 didapatkan dari estimate intercept dan X dengan
menggunakan script “summary(regres1)”. Script ini juga digunakan untuk
mendapatkan hasil dari p-value yang akan digunakan untuk uji parsial.
Gambar 3.7. Nilai estimate intercept dan X
Setelah mendapatkan model, selanjutnya praktikan akan mencari prediksi
Y untuk nilai x = 18, 30, dan 29.
1. Untuk x = 18
𝑦̂ = -24.38 + 1.45X + 𝜀
= -24.38 + 1.45 (18) + 𝜀 = 1.72+ 𝜀
2. Untuk x = 30
𝑦̂ = -24.38 + 1.45X + 𝜀

16
= -24.38 + 1.45 (30) + 𝜀 = 19.12+ 𝜀
3. Untuk x = 29
𝑦̂ = -24.38 + 1.45X + 𝜀
= -24.38 + 1.45 (29) + 𝜀 = 17.67+ 𝜀
Gambar 3.8. Hasil prediksi menggunakan R
Untuk x =18, maka didapatkan y dengan perhitungan manual sebesar 1.72
dan menggunakan R sebesar 1.715926 atau jika dibulatkan sama dengan 1.72.
Artinya jika rata-rata suhu adalah 18 derajat, maka prediksi jumlah cacat sebesar
1.72.
Kemudian, jika x =30, maka didapatkan y dengan perhitungan manual
sebesar 19.12 dan menggunakan R sebesar 19.113829 atau jika dibulatkan sama
dengan 19.12. Artinya jika rata-rata suhu adalah 30 derajat, maka prediksi jumlah
cacat adalah sekitar 19.12
Untuk x =29, maka didapatkan y dengan perhitungan manual sebesar 17.67
dan menggunakan R sebesar 17.664004 atau jika dibulatkan sama dengan 17.67.
Artinya jika rata-rata suhu adalah 29 derajat, maka perkiraan jumlah cacat sebesar
adalah sebesar 17.67.

17
4 Penutup
4.1 Kesimpulan
Setelah melakukan berbagai hal di atas untuk menjawab studi kasus, dapat
ditarik kesimpulan sebagai berikut:
1. Untuk melakukan analisis reresi linier sederhana harus melalui berbagai
tahapan, yaitu uji overall, uji parsial, interpretasi R2, dan terakhir uji asumsi.
2. Berdasarkan uji linearitas dengan melihat plot gambar, dapat disimpulkan
bahwa variable rata-rata suhu (X) dengan variable jumlah cacat (Y)
memiliki hubungan linier postif.
3. Berdasarkan tabel coefficients dapat diperoleh model regresi yaitu :
𝑦̂ = -24.38 + 1.45X + 𝜀
4. Berdasarkan Uji Overall dapat disimpulkan bahwa model regresi layak
digunakan dengan tingkat kepercayaan 5 %.
5. Berdasarkan Uji Parsial terhadap β0 dapat disimpulkan bahwa nilai konstan
(β0) berpengaruh terhadap jumlah cacat.
6. Berdasarkan Uji Parsial terhadap β1 dapat disimpulkan bahwa rata-rata suhu
berpengaruh terhadap jumlah cacat.
7. Dari uji normalitas, dapat diketahui bahwa data residuals berdistribusi
normal.
8. Dari uji autokorelasi, dapat disimpulkan bahwa terdapat autokorelasi pada
data residuals.
9. Dari uji homoskedastisitas, dapat disimpulkan bahwa model regresi
mengandung adanya homoskedastisitas.
10. Hasil prediksi yang jika rata-rata suhu (x) adalah 18 derajat, maka jumlah
cacat (y) adalah 1.72. Jika rata-rata suhu (x) 30 derajat, maka jumlah cacat
(y) sebesar 19.12. Dan jika rata-rata suhu (x) adalah 29 derajat, maka
diprediksikan jumlah cacat (y) sebesar 17.67.

18
5 Daftar Pustaka
Arnita. (2013). Pengantar Statistika. Bandung: Citapustaka Media Perintis.
Binus Nusantara. (2015). Diambil kembali dari Binus University:
http://sbm.binus.ac.id/2015/11/20/uji-asumsi-klasik-uji-
heteroskedastisitas/
Jonatan. (2017). Teori Regresi. Diambil kembali dari Info dot Com:
http://www.jonathansarwono.info/regresi/regresi.htm
Kho, D. (2017). Analisis Regresi Linier Sederhana. Diambil kembali dari Teknik
Elektronika: http://teknikelektronika.com/analisis-regresi-linear-
sederhana-simple-linear-regression/
Satya, A. (2017). Cara Asumsi Klasik dalam Pembuatan Skripsi. Diambil kembali
dari Solusi Smart: https://solusismart.com/uji-asumsi-klasik/

Analisis Regresi Liniear Sederhana

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Analisis Regresi Liniear Sederhana

Similar to Analisis Regresi Liniear Sederhana (20)

Recently uploaded

Recently uploaded (12)

Analisis Regresi Liniear Sederhana