1. 12/8/2012
KORELASI
DAN REGRESI
Sinollah, S.Sos, M.AB
Dalam banyak keputusan manajemen terutama dalam dunia usaha, adalah
perlu untuk membuat ramalan nilai-nilai dari variable yang tidak diketahui.
Perencanaan anggaran perusahaan tahun mendatang
memerlukan ramalan tentang nilai penjualan.
Manajer bagian produksi harus membuat ramalan berapa
banyak bahan dasar yang terbuang selama pengerjaan
untuk dapat menentukan berapa banyak bahan dasar yang
akan dipesan.
Perusahaan listrik harus meramalkan permintaan akan
jasa-jasa pemakaian listrik tahun-tahun akan datang dalam
hal akan memutuskan berapa besar kapasitas generator
yang akan dibangun.
Manajer sumberdaya manusia perlu mengetahui apakah
Produktivitas karyawan dapat diramalkan dari hasil tes
Seleksi dan lamanya latihan, dan sebagainya.
1
2. 12/8/2012
Dalam pembahasan ini kita akan mempelajari bagaimana
pengetahuan tentang hubungan antara dua variable dapat
dipraktekkan, sehingga informasi dari satu variable dapat
digunakan untuk memperkirakan nilai dari variable lain. Teknik
statistik tentang hubungan antara dua variabel tersebut dinamakan
korelasi dan regresi.
Regresi akan menjelaskan kepada kita bagaimana satu variable
dihubungkan dengan variable lain, dimana hubungan tersebut
dinyatakan dalam bentuk persamaan dan nilai dari satu variable
yang diketahui atau variable yang digunakan untuk meramalkan
(predictor) dapat digunakan untuk menduga nilai variable lain yang
tidak diketahui atau variable yang diramalkan (kreterium). Misalnya
manajer pemasaran dapat memperkirakan penjualan (kreterium)
yang akan dicapai berdasarkan besarnya biaya advertensi
(predictor).
Sedangkan korelasi akan menjelaskan kepada kita tentang
besarnya derajat hubungan antara dua variable.
KORELASI
Korelasi (correlation) adalah salah satu teknik statistik yang
digunakan untuk mencari hubungan antara dua variabel atau lebih
yang sifatnya kuantitatif.
Misalnya kita ingin menyelidiki apakah ada hubungan antara
penetapan harga dengan jumlah yang diminta, biaya advertensi yang
dikeluarkan dengan hasil penjualan barang yang diadvertensikan,
banyaknya jam kerja dengan besarnya penghasilan dsb.
Hubungan antara dua variabel dapat hanya karena kebetulan saja,
dapat pula memang merupakan hubungan sebab akibat. Dalam
statistik yang dipelajari adalah hubungan yang bersifat tidak
kebetulan.
Dua variabel dikatakan berkorelasi apabila perubahan pada variabel
yang satu akan diikuti perubahan pada variabel yang lain secara
teratur, dengan arah yang sama atau dapat pula dengan arah yang
berlawanan. Bila dua variabel tersebut dinyatakan sebagai variabel X
dan variabel Y, maka apabila variabel X berubah, variabel Y pun
berubah dan sebaliknya.
2
3. 12/8/2012
Arah hubungan antara dua variabel (direction of correlation) dapat
dibedakan menjadi:
1. Direct correlation (Positive Correlation)
Perubahan pada salah satu variabel diikuti perubahan variabel yang
lain secara teratur dengan arah/gerakan yang sama. Kenaikan nilai
variabel X selalu diikuti kenaikan nilai variabel Y dan sebaliknya
turunnya nilai X selalui diikuti oleh turunnya nilai variabel Y. misalnya
: hubungan antara penetapan harga dengan jumlah yang ditawarkan.
2. Inverse Correlation (Negative Correlation)
Perubahan pada salah satu variabel diikuti perubahan variabel
yang lain ssecara teratur dengan arah/gerakan yang berlawanan.
Nilai variabel X yang tinggi selalu disertai dengan nilai variabel Y
yang rendah dan sebaliknya variabel X yang rendah nilainya selalu
diikuti nilai variabel Y yang tinggi. Misalmya : hubungan antara
penetapan harga dengan jumlah yang diminta.
3. Korelasi Nihil (Tidak Berkorelasi)
Kenaikan nilai variabel yang satu kadang-kadang disertai dengan
turunnya nilai variabel yang lain atau kadang-kadang diikuti kenaikan
variabel yang lain. Arah hubungannya tidak teratur kadang-kadang
dengan arah yang sama kadang-kadang berlawanan.
Besar kecilnya hubungan dinyatakan dalam bilangan. Bilangan yang
menyatakan besar kecilnya hubungan tersebut disebut koefisien
korelasi yang bergerak antara 0,000 sampai +1,000 atau diantara
0,000 sampai – 1,000, tergantung kepada arah korelasinya (nihil,
positif apa negatif). Koefisien yang bertanda positif menunjukkan
arah korelasi yang positif. Koefisien yang bertanda negatif
menunjukkan arah korelasi yang negatif. Adapun koefisien yang
bernilai 0,000 menunjukkan tidak adanya korelasi antara X dan Y.
3
4. 12/8/2012
Jika dua variable mempunyai koefisien korelasi sebesar +1,000 atau -
1,000, kedua variable tersebut dikatakan mempunyai korelasi yang
sempurna.
Yang pertama disebut korelasi yang sempurna positif dan sebaliknya.
Dalam korelasi yang sempurna positif, tiap-tiap kenaikan variable X
selalu disertai kenaikan yang seimbang (proporsional) pada nilai-nilai
variable Y.
Sebaliknya dalam korelasi yang sempurna negatif, tiap-tiap kenaikan
variable X selalu diserta penurunan yang seimbang pada nilai variable
Y.
Korelasi Product Moment (Karl Pearson)
Korelasi dari Pearson, atau juga disebut Korelasi Momen Tangkar
mendasarkan perhitungannya pada angka-angka kasar seperti apa
adanya. Untuk menghitung korelasi product moment dapat dilakukan
dengan rumus deviasi dan rumus angka kasar.
Rumus deviasi: Rumus angka kasar:
Σxy (ΣX )(ΣY )
rxy = ΣXY −
(Σx )(Σy ) rxy = N
2 2
2 (ΣX ) 2 2 (ΣΥ) 2
ΣX − ΣΥ −
N N
Ket: rxy = koefisien korelasi
x = deviasi X (X – M)
y = deviasi Y (Y – M)
4
6. 12/8/2012
(1595)(276)
44.827 −
10 805
rxy = = = 0.7363
(1595)
2
(276)
2 (4202)(284.4)
258.605 −
7902 −
10 10
Untuk menguji apakah harga rxy = 0,7363 itu signifikan atau tidak,
kita dapat berkonsultasi dengan tabel r – teoritik dengan N = 10
atau derajat kebebasan db = 10 – 2.
Dari tabel r teoritik dengan N = 10 (atau db = 8) akan kita temukan
harga r – teoritik pada taraf signifikansi 1% atau rt1% = 0,765 dan
rt5% = 0,632. karena harga rt5% < rxy < rt1% maka kita nyatakan
signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X
dan Y signifikan.
Resp Berat Bada (X) Kelincahan (Y)
1 24 28
2 23 30
3 22 26
4 25 28
5 20 28
6 24 29
7 23 27
Carilah koefisien korelasinya. Apakah koefisien
tersebut signifikan atau tidak ?
6
7. 12/8/2012
Tujuan utama dari analisis regresi adalah mendapatkan ramalan
dari satu variable (kreterium) dengan menggunakan variable lain
yang diketahui (predictor).
Korelasi antara variable kreterium dengan variable predictor dapat
dilukiskan dalam satu garis. Garis tersebut disebut garis regresi.
Garis regresi mungkin merupakan garis lurus (linier), mungkin
merupakan garis lengkung (parabolic, hiperbolik dsb). Dalam
kesempatan ini dibicarakan garis yang linier saja.
Suatu garis dapat dinyatakan dalam persamaan matematik.
Persamaan ini disebut persamaan regresi linier. Dengan
mengetahui persamaan regresi ini peramalan nilai Y (kreterium)
dapat dibuat berdasarkan nilai X (predictor) tertentu.
Untuk garis linier dengan satu variable predictor persamaannya
adalah:
Y = aX + K
Dimana: Y = kriterium
X = predictor
a = bilangan koefisien preditktor
K = bilangan konstans
Tugas pokok regresi linier adalah:
1) mencari korelasi antara kreterium dengan predictor,
2) menguji apakah korelasi itu signifikan atau tidak, dan
3) mencari persamaan garis regresinya.
7
8. 12/8/2012
Contoh: misalkan suatu Penyelidikan ingin memastikan apakah berat
badan orang pada kelompok umur tertentu dapat diramalkan dari tinggi
badan? Dalam penyelodokan itu dikumpulkan data tinggi badan dan
berat badan sepuluh orang sebagai seperti nampak pada tabel 100
berikut:
Tinggi Berat Badan
Subjek Badan (cm) (kg) X2 Y2 XY
X Y
1 168 63 28224 3969 10584
2 173 81 29929 6561 14013
3 162 54 26244 2916 8748
4 157 49 24649 2401 7693
5 160 52 25600 2704 8320
6 165 62 27225 3844 10230
7 163 56 26569 3136 9128
8 170 78 28900 6084 13260
9 168 64 28224 4096 10752
10 164 61 26896 3721 10004
Jumlah 1650 620 272460 39432 102732
Korelasi antara X dan Y dapat kita cari melalui teknik korelasi product
moment dari Pearson, dengan rumus umum (deviasi).
Telah diketahui:
Σ xy = ΣΧΥ −
(ΣΧ )(ΣΥ ) = 102732 − (1650 )(620 ) = 432
Ν 10
Σ x 2 = ΣΧ 2 −
(ΣΧ ) 2
= 272460 −
(1650 )
= 210
2
Ν 10
Σ y = ΣΥ −
2 2 (ΣΥ )2 = 39432 − (620 )2 = 992
Ν
Σ xy 432
rxy = = = 0,946
(Σx )(Σ y )
2 2
( 210 )( 992 )
8
9. 12/8/2012
Untuk menguji apakah harga rxy = 0,946 itu signifikan kita dapat
berkonsultasi dengan tabel r – teoritik dengan N = 10 atau derajat
kebebasan db = 10 – 2.
Dari tabel r teoritik dengan N = 10 (atau db = 8) akan kita temukan
harga r – teoritik pada taraf signifikansi 1% atau rt1% = 0,765 dan rt5%
= 0,632. karena harga rt5% < rxy < rt1% maka kita nyatakan signifikan,
dan kita dapat menyimpulkan bahwa korelasi antara X dan Y signifikan.
Kesimpulannya adalah bahwa korelasi antara tinggi badan dan berat
badan sangat signifikan.
Dengan harga korelasi antara tinggi badan dan berat badan yang
sangat signifikan tersebut kita mempunyai landasan untuk meramalkan
berat badan dari tinggi badan. Karenanya kita dapat membuat garis
regresi untuk prediksi dengan rumus garis linier yang sudah ada, yaitu:
y = aX = K.
Untuk mengisi persamaan regresi itu harga koefisien predictor (harga a)
dan harga bilangan konstan K harus kita ketemukan lebih dahulu.
Harga-harga a dan K itu dapat kita cari melalui dua jalan: yaitu dengan
metode skor kasar dan dengan metode skor deviasi.
Dengan metode skor kasar, harga a dan K dapat dicari dari
persamaan:
ΣXY = a ΣX2 + KΣX
ΣY = a ΣX + NK
Jika data yang sudah kita ketahui kita masukkan ke dalam rumus-
rumus tersebut:
(1) 102732 = 272,460 a + 1650K
(2) 620 = 1650 a + 10 K
9
10. 12/8/2012
Dengan penyelesaian persamaan secara simultan akan kita temukan
(dengan membagi persamaan 1 dengan 1.650 dan persamaan 2
dengan 10).
(3) 62 = 165,13 a + K
(4) 62 = 165 a + K
(5) 0,26 = 0,13 a
a =2
(4) 62 = (165) 2 + K
K = - 268
Dengan harga a = 2 dan K = -268, persamaan garis regresinya
adalah:
Y = aX – K
Y = 2X – 268
Dengan metode skor deviasi harga-harga a dan K dapat kita cari
dari persamaan: y = ax
− − Σxy
dimana: y = Y – Υ , x = X - Χ dan a = , maka:
Σxy = 432 Σx 2
Σx2 = 210
a = 432/210 = 2,05
Y = 2,05x
dari data yang dikumpulkan dapat dicari:
−
Υ = ΣΥ = 620 = 62 −
ΣΧ 1650
Ν 10 Χ = = = 165
Ν 10
10
11. 12/8/2012
− −
Karena itu, untuk persamaan garis regresi y = ax atau Y - Υ= a (X - Χ
), adalah:
Y – 62 = (2,05) (X – 165)
Y = 2,05X – 338,25 + 62
= 2,05X – 276,25
Dengan metode skor kasar kita dapat menemukan persamaan
garis regresinya, yaitu: Y = 2X – 268, sedang dengan metode
skor deviasi kita menemukan persamaan garis regresinya Y =
2,05X – 276,25.
Seharusnya dengan kedua metode itu kita tidak menemukan hasil
perhitungan yang berbeda. Perbedaan hasil perhitungan garis
regresi yang kita temukan itu semata-mata disebabkan karena
ketelitian perhitungan saja.
Resp Berat Bada (X) Kelincahan (Y)
1 24 28
2 23 30
3 22 26
4 25 28
5 20 28
6 24 29
7 23 27
Carilah koefisien regresinya. Apakah koefisien
tersebut signifikan atau tidak ?
11