Analisa Regresi Linier Sederhana
(Simple Linear Regression Analysis)
ARIF RAHMAN
1
Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
2
Statistika
3
Mengorganisasi,
Merangkum,
Menyederhanakan,
Menyajikan,
Menginterpretasikan
Menganalisa
Mensintesa
Mengumpulkan data
Menghasilkan informasi dan/atau kesimpulan
Menggeneralisasi
Mengestimasi,
Menguji hipotesa,
Menilai relasi,
Memprediksi
Menyelesaikan masalah Mengambil keputusan
Statistika Inferensia
Statistika inferensia adalah cabang statistika yang
menganalisa atau mensintesa data untuk
menggeneralisasi sampel terhadap populasi,
mengestimasi parameter, menguji hipotesa, menilai
relasi, dan membuat prediksi untuk menghasilkan
informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical tools)
yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
4
Statistika Inferensia
5
Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel
SAMPLING
INFERENSI
Parameter :
N (banyaknya anggota populasi),
μ (rata-rata populasi),
σ (simpangan baku populasi),
π (proporsi populasi)
Statistik :
n (banyaknya anggota sampel),
ẋ (rata-rata sampel),
s (simpangan baku sampel),
p (proporsi sampel)
Tipe Data
Data Nominal, data yang hanya berupa simbol (meski berupa
angka) untuk membedakan nilainya tanpa menunjukkan tingkatan
Data Ordinal, data yang mempunyai nilai untuk menunjukkan
tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan.
Data Interval, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya
untuk menunjukkan titik acuan (baseline).
Data Rasio, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala indikasi rasio perbandingan. Nilai nol
menunjukkan titik asal (origin) yang bernilai kosong (null).
6
Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free)
7
Tipe Data
Data Diskrit, data hasil pencacahan atau
penghitungan, sehingga biasanya dalam angka
bilangan bulat.
Data Kontinyu, data hasil pengukuran yang
memungkinkan dalam angka bilangan nyata
(meskipun dapat pula dibulatkan)
8
Statistika Alat Bantu Problem Solving
9
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan
Statistika Alat Bantu Problem Solving
10
Metode statistika bukan
ramuan sihir
Alat statistika bukan
tongkat sihir
Ketelitian &
Tipe Kesalahan
11
Akurasi dan Presisi
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian
pengukuran dari alat pengukur, atau ketersebaran
yang relatif mengumpul (variansi atau deviasi kecil)
12
Akurat dan Presisi
Tidak presisi, akibat pola sebaran sampel
lebih melebar daripada pola sebaran
populasi menyebabkan deviasi yang besar.
Tidak akurat, akibat pergeseran
pemusatan sampel menjauh dari
pemusatan populasi menyebabkan bias
yang besar.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
13
Kesalahan Pengambilan Kesimpulan
Galat tipe 1 () : kesalahan menyimpulkan karena
menolak hipotesa yang semestinya diterima
Galat tipe 2 () : kesalahan menyimpulkan karena
menerima hipotesa yang semestinya ditolak
14
 
Kesalahan Pengambilan Kesimpulan
15
The true state of nature
Decision H0 is true H0 is false
Reject H0 Type I error Exact decision
Fail to reject H0 Exact decision Type II error
The true state of nature
Decision H0 is true H0 is false
Reject H0  1 – 
Fail to reject H0 1 –  
Ukuran Ketelitian Pendugaan
Tingkat keberartian (significance level, ), probabilitas
penolakan data observasi, karena menyimpang signifikan terhadap
sasaran.
Tingkat kepercayaan (confidence coefficient,1-), persentase
data observasi yang diyakini tidak berbeda signifikan dengan target.
Kuasa statistik (power,1-), persentase data observasi yang
diyakini berbeda signifikan dengan target.
Derajat kebebasan (degree of freedom, df=n-k), besaran
yang menunjukkan bebas terhadap bias dari n data observasi.
16
Kekeliruan pada Analisa Regresi
 Tidak ada logika penalaran atau alasan logis yang mendasari hipotesa
variabel bebas mempengaruhi variabel terikat.
 Deskripsi dari variabel bebas tidak mempunyai hubungan kausal
dengan deskripsi dari variabel terikat.
 Pengukuran atau pengumpulan data dilakukan oleh/dari pihak yang
mempunyai konflik kepentingan atau yang tidak punya kewenangan
atas data.
 Variabel bebas dan/atau variabel terikat diukur pada hanya satu obyek
yang bernilai tunggal atau statis.
 Rentang data sampel sangat sempit, namun dipergunakan untuk
menginduksi rentang populasi yang sangat lebar dengan ekstrapolasi.
17
Kekeliruan pada Analisa Regresi
 Variabel bebas (x) = tinggi badan anak-anak di desa A (pertumbuhan tiap tahunnya);
Variabel terikat (y) = harga emas (kenaikan tiap tahunnya). Meskipun jika dihitung,
menunjukkan pertumbuhan tinggi badan anak-anak di desa A mempunyai korelasi
kuat dengan kenaikan harga emas.
 Variabel bebas (x) = motivasi kerja; Variabel terikat (y) = kinerja. Deskripsi “motivasi
kerja” adalah mendapatkan pengakuan dari keluarga besar karena menjadi karyawan
pabrik.Deskripsi “kinerja” adalah waktu penyelesaian pekerjaan lebih cepat daripada
batas waktu yang ditargetkan.
 Data yang diukur : Banyaknya pelanggaran yang dilakukan. Ditanyakan pada pelaku
pelanggaran, atau pada pihak yang tidak pernah melihat pelaku pelanggaran.
 Data yang diukur : Aturan pengupahan dari satu perusahaan di satu waktu.
 Rentang data sampel pada 10 < x < 50, namun dipergunakan untuk menduga nilai Y
jika x=200.
18
Kekeliruan pada Analisa Regresi
19
Analisa Regresi
20
Perbedaan Korelasi dan Regresi
21
Correlation Regression
Perbedaan Korelasi dan Regresi
22
Correlation Regression
Analisa Regresi
23
Analisa Regresi
24
Analisa Regresi
25
Analisa Regresi
26
Analisa Regresi
27
Analisa Regresi
28
Analisa Regresi
29
Example 1
30
Example 1
31
Example 2
32
Example 3
33
Example 3
34
Estimasi
Parameter atau
Koefisien Regresi
35
Estimasi Parameter Regresi
36
Estimasi Parameter Regresi
37
Estimasi Parameter Regresi
38
Estimasi Parameter Regresi
39
Estimasi Parameter Regresi
40
Estimasi Parameter Regresi
41
Estimasi Parameter Regresi
42
Estimasi Parameter Regresi
43
Estimasi Parameter Regresi
44
Estimasi Parameter Regresi
45
Estimasi Parameter Regresi
46
Estimasi Parameter Regresi
47
Example 4
48
Example 4
Problem :
Solution
(a)
49
X y xy x2
22 18,4 404,8 484
18 19,2 345,6 324
30 14,5 435 900
16 19 304 256
25 16,6 415 625
20 17,7 354 400
10 24,4 244 100
14 21 294 196
155 150,8 2796,4 3285
Example 4
50
Example 4
51
Example 5
52
Example 5
53
Example 5
54
Example 6
55
Example 6
56
Example 6
57
Properti dari Estimator
(Least Square Estimators)
58
Properti dari Estimator
59
Properti dari Estimator
60
Properti dari Estimator
61
Properti dari Estimator
62
Example 7
63
Example 7
64
Example 8
65
Example 8
66
Example 8
67
Estimasi Rata-rata
Respon
68
Estimasi Rata-rata Respon
69
Estimasi Rata-rata Respon
70
Example 9
71
Example 9
72
Example 10
73
Example 10
74
Example 10
75
Prediksi Observasi Baru
76
Prediksi Observasi Baru
77
Prediksi Observasi Baru
78
Example 11
79
Example 11
80
Example 12
81
Example 12
82
Example 12
83
Uji t
Parameter atau
Koefisien Regresi
84
Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
2. Formulasi hipotesa
3. Memilih uji statistik
4. Menentukan tingkat keberartian
5. Membangun daerah keputusan
6. Menghitung statistik uji
7. Menarik kesimpulan
85
Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
Berdasarkan masalah yang menjadi fokus studi, untuk
menentukan parameter of interest sebagai tujuan
pengujiannya.
86
Tujuan pengujian hipotesa berawal dari maksud mempelajari sistem atau
menjawab permasalahan. Tujuan menjadi dasar utama dalam menentukan
populasi, memilih sampel, mengambil data dan mengujinya untuk memperoleh
kesimpulan yang selaras dengan tujuan tersebut.
Langkah Pengujian Hipotesa
2. Formulasi hipotesa
Hipotesa diformulasikan berdasarkan praduga yang
dirumuskan sesuai dengan tujuan. Praduga tidak selalu
menjadi hipotesa nol, bahkan lebih diutamakan praduga
direfleksikan pada hipotesa alternatif.
87
Hipotesa alternatif H1 biasanya merepresentasikan permasalahan yang akan
dijawab atau teori yang akan diuji, sehingga formulasi spesifik menjadi krusial.
Hipotesa nol H0 menyatakan status quo atau equality yang meniadakan
(nullifies) atau berlawanan (opposes) H1 dan menjadi complement dari H1 yang
bersifat mutually exclusive. Penggunaan format pertidaksamaan dengan tanda
pengujian satu arah memberikan deskripsi lebih spesifik pada H1.
Langkah Pengujian Hipotesa
3. Memilih uji statistik
Uji statistik dalam statistik inferensia dikelompokkan
menjadi dua, uji parametrik (berdistribusi) dan uji
nonparametrik. Uji statistik yang dipilih harus disesuaikan
dengan tujuan pengujian, hipotesa dan data (evidence)
yang diuji.
88
Uji parametrik mempertimbangkan tipe data dan distribusi data.
Pendekatan distribusi normal terkadang dapat dipergunakan dengan merujuk
Central Limit Theorem dan Law of Large Number
Langkah Pengujian Hipotesa
4. Menentukan tingkat keberartian
Tingkat keberartian (terkadang juga disebut taraf nyata atau
tingkat ketelitian) menunjukkan luas daerah penolakan.
Tingkat keberartian sebenarnya juga menunjukkan
besarnya peluang terjadinya galat tipe I.
89
Semakin besar nilai tingkat keberartian semakin besar peluang galat tipe 1.
Sebaliknya semakin kecil nilainya semakin kecil pula peluang galat tipe 1, tetapi
juga semakin besar peluang galat tipe 2, bukannya bermakna semakin teliti.
Peluang galat tipe 2 beririsan dengan daerah penerimaan, sehingga sebenarnya
peluang galat tipe 2 tidak sama besar dengan satu dikurangi peluang galat tipe 1.
Langkah Pengujian Hipotesa
5. Membangun daerah keputusan
Daerah keputusan terbagi menjadi dua, yaitu daerah
penolakan dan daerah penerimaan. Di antara kedua daerah
tersebut dibatasi oleh nilai kritis. Nilai kritis diperoleh
berdasarkan tingkat keberartian, dan distribusi (termasuk
parameter) yang dipergunakan dalam uji statistik.
90
Semakin besar nilai tingkat keberartian semakin luas daerah penolakan
(semakin besar peluang galat tipe 1).
Sebaliknya semakin kecil nilainya semakin luas daerah penerimaan (semakin
besar peluang galat tipe 2), bukannya bermakna semakin teliti.
Langkah Pengujian Hipotesa
6. Menghitung statistik uji
Perhitungan statistik uji berdasarkan uji statistik yang dipilih
dan distribusi (termasuk parameter) yang dipergunakan.
Hasil perhitungan statistik uji tergantung kecukupan,
sebaran, kevalidan dan kesesuaian data.
91
Data yang keliru akan memberikan hasil yang keliru (garbage in garbage out)
Uji statistik yang keliru memberikan hasil yang keliru (failure makes inappropriate
result). Periksa datanya, pahami uji statistik yang dipilih, pelajari distribusi yang
dipergunakan, dan pastikan sesuai dengan tepat.
Langkah Pengujian Hipotesa
7. Menarik kesimpulan
Kesimpulan ditarik berdasarkan hasil perhitungan statistik
uji, apakah berada di daerah penerimaan atau daerah
penolakan.
92
The truth or falsity of a statistical hypothesis is never known with absolute
certainty unless we examine the entire population. It should be made clear that
the decision procedure must include an awareness of the probability of a wrong
conclusion.
Uji Hipotesa Koefisien Regresi
Salah satu cara menilai kelayakan model regresi
linier adalah dengan uji hipotesa pada parameter
atau koefisien model regresi. Untuk menguji hipotesa
koefisien slope dan intercept dri model regresi, kita
perlu mengsumsikan bahwa error model, є,
berdistribusi normal.
Dan asumsi lengkapnya adalah error model
berdistribusi normal dan independen dengan mean,
μ=0, variance, σ2, atau dinotasikan NID (0, σ2)
93
Uji Hipotesa Koefisien Regresi
94
Uji Hipotesa Koefisien Regresi
95
Uji Hipotesa Koefisien Regresi
96
Uji Hipotesa Koefisien Regresi
97
Example 13
98
Example 13
99
Example 14
100
Example 14
101
Example 14
102
Example 14
103
Uji F
Model Regresi
104
Uji Hipotesa Model Regresi
105
Uji Hipotesa Model Regresi
106
Example 15
107
Example 15
108
Analisis Residu
109
Analisis Residu
110
Analisis Residu
111
Analisis Residu
112
Analisis Residu
113
Example 16
114
Example 16
115
Example 16
116
Example 16
117
Analisis Linieritas
118
Lack of Fit
119
Lack of Fit
120
Lack of Fit
121
Lack of Fit
122
Lack of Fit
123
Example 17
124
Example 17
125
Koefisien Determinasi
126
Koefisien Determinasi
127
Koefisien Determinasi
128
Koefisien Determinasi
129
Koefisien Determinasi
130
Koefisien Determinasi
131
Koefisien Determinasi
132
Example 18
133
Example 18
134
Example 19
135
Example 19
136
Example 19
137
No x y δx δy δ2x δ2y δx.δy
1 2 9,95 -6,24 -19,08 38,9376 364,1533 119,0767
2 8 24,45 -0,24 -4,58 0,0576 21,0021 1,0999
3 11 31,75 2,76 2,72 7,6176 7,3832 7,4995
4 10 35,00 1,76 5,97 3,0976 35,6075 10,5023
5 8 25,02 -0,24 -4,01 0,0576 16,1026 0,9631
6 4 16,86 -4,24 -12,17 17,9776 148,1771 51,6127
7 2 14,38 -6,24 -14,65 38,9376 214,7045 91,4335
8 2 9,60 -6,24 -19,43 38,9376 377,6337 121,2607
9 9 24,35 0,76 -4,68 0,5776 21,9286 -3,5589
10 8 27,50 -0,24 -1,53 0,0576 2,3495 0,3679
11 4 17,08 -4,24 -11,95 17,9776 142,8694 50,6799
12 11 37,00 2,76 7,97 7,6176 63,4763 21,9895
13 12 41,95 3,76 12,92 14,1376 166,8541 48,5687
14 2 11,66 -6,24 -17,37 38,9376 301,8142 108,4063
15 4 21,65 -4,24 -7,38 17,9776 54,5057 31,3031
16 4 17,89 -4,24 -11,14 17,9776 124,1620 47,2455
17 20 69,00 11,76 39,97 138,2976 1597,3771 470,0143
18 1 10,30 -7,24 -18,73 52,4176 350,9178 135,6255
19 10 34,93 1,76 5,90 3,0976 34,7770 10,3791
20 15 46,59 6,76 17,56 45,6976 308,2553 118,6867
21 15 44,88 6,76 15,85 45,6976 251,1337 107,1271
22 16 54,12 7,76 25,09 60,2176 629,3676 194,6767
23 17 56,63 8,76 27,60 76,7376 761,6054 241,7515
24 6 22,13 -2,24 -6,90 5,0176 47,6486 15,4623
25 5 21,15 -3,24 -7,88 10,4976 62,1385 25,5403
Total 206 725,82 698,5600 6105,9447 2027,7132
Rata-rata 8,24 29,0328
Example 20
138
Example 20
139
Example 20
140
Software Aplikasi
Spreadsheet
141
142
Analisis Regresi Linier
Estimasi Parameter
Y = 0 + 1.x
Intercept, 0
INTERCEPT(YRange;XRange)
INDEX(LINEST(YRange;Xrange;TRUE);2)
Slope, 1
SLOPE(YRange;XRange)
INDEX(LINEST(YRange;Xrange;TRUE);1)
143
Analisis Regresi Linier
Koefisien Korelasi dan Koefisien Determinasi
Korelasi, r
CORREL(YRange;XRange)
PEARSON(YRange;XRange)
Determinasi, R2
RSQ(YRange;XRange)
144
Terima kasih ...
... Ada pertanyaan ???

Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Simple Linear Regression)

Editor's Notes

  • #10 Statistika dapat menjadi alat bantu dalam menyelesaikan masalah. Mulai dari saat mengumpulkan data, mengolah, menginterpresikan, menganalisa dan mensitesanya. Namun saat keliru menetapkan populasi atau keliru memilih sampel, serta keliru mendeskripsikan variabel yang akan diambil datanya, melalaikan tujuan penelitian, maka hasil pengolahannyapun akan menjadi sampah. Demikian pula meskipun data yang diambil benar dan representatif, namun metode dan alat pengolahannya pun keliru yang dipilih atau keliru cara mempergunakannya, maka hasilnya pun akan menjadi sampah. Sehingga perlu kita pahami bahwa statistika cuma alat berbasis model matematis, ada angka dimasukkan akan mengeluarkan hasil, entah itu benar atau sampah.
  • #11 Alat statistika bukan tongkat sihir, apapun dan bagaimanapun keadaan datanya dengan tongkat sihir ajaib bisa mengubahnya menjadi hasil yang sesuai dengan tujuan penelitian. Metode statistika pun bukan ramuan sihir, apapun dan bagaimanapun keadaan datanya diolah dalam ramuan sihir ajaib bisa mewujudkan hasil yang sesuai dengan tujuan penelitian.