Analisis regresi linier berganda digunakan untuk memodelkan hubungan antara variabel terikat dengan dua atau lebih variabel bebas. Metode ini mengestimasi koefisien regresi untuk setiap variabel bebas berdasarkan data sampel yang dikumpulkan. Contoh menunjukkan estimasi koefisien regresi untuk tiga variabel bebas berdasarkan data 15 observasi.
2. Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
2
4. Statistika Inferensia
Statistika inferensia adalah cabang statistika yang
menganalisa atau mensintesa data untuk
menggeneralisasi sampel terhadap populasi,
mengestimasi parameter, menguji hipotesa, menilai
relasi, dan membuat prediksi untuk menghasilkan
informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical tools)
yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
4
5. Statistika Inferensia
5
Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel
SAMPLING
INFERENSI
Parameter :
N (banyaknya anggota populasi),
μ (rata-rata populasi),
σ (simpangan baku populasi),
π (proporsi populasi)
Statistik :
n (banyaknya anggota sampel),
ẋ (rata-rata sampel),
s (simpangan baku sampel),
p (proporsi sampel)
6. Tipe Data
Data Nominal, data yang hanya berupa simbol (meski berupa
angka) untuk membedakan nilainya tanpa menunjukkan tingkatan
Data Ordinal, data yang mempunyai nilai untuk menunjukkan
tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan.
Data Interval, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya
untuk menunjukkan titik acuan (baseline).
Data Rasio, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala indikasi rasio perbandingan. Nilai nol
menunjukkan titik asal (origin) yang bernilai kosong (null).
6
7. Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free)
7
8. Tipe Data
Data Diskrit, data hasil pencacahan atau
penghitungan, sehingga biasanya dalam angka
bilangan bulat.
Data Kontinyu, data hasil pengukuran yang
memungkinkan dalam angka bilangan nyata
(meskipun dapat pula dibulatkan)
8
9. Statistika Alat Bantu Problem Solving
9
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan
10. Statistika Alat Bantu Problem Solving
10
Metode statistika bukan
ramuan sihir
Alat statistika bukan
tongkat sihir
12. Akurasi dan Presisi
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian
pengukuran dari alat pengukur, atau ketersebaran
yang relatif mengumpul (variansi atau deviasi kecil)
12
13. Akurat dan Presisi
Tidak presisi, akibat pola sebaran sampel
lebih melebar daripada pola sebaran
populasi menyebabkan deviasi yang besar.
Tidak akurat, akibat pergeseran
pemusatan sampel menjauh dari
pemusatan populasi menyebabkan bias
yang besar.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
13
14. Kesalahan Pengambilan Kesimpulan
Galat tipe 1 () : kesalahan menyimpulkan karena
menolak hipotesa yang semestinya diterima
Galat tipe 2 () : kesalahan menyimpulkan karena
menerima hipotesa yang semestinya ditolak
14
15. Kesalahan Pengambilan Kesimpulan
15
The true state of nature
Decision H0 is true H0 is false
Reject H0 Type I error Exact decision
Fail to reject H0 Exact decision Type II error
The true state of nature
Decision H0 is true H0 is false
Reject H0 1 –
Fail to reject H0 1 –
16. Ukuran Ketelitian Pendugaan
Tingkat keberartian (significance level, ), probabilitas
penolakan data observasi, karena menyimpang signifikan terhadap
sasaran.
Tingkat kepercayaan (confidence coefficient,1-), persentase
data observasi yang diyakini tidak berbeda signifikan dengan target.
Kuasa statistik (power,1-), persentase data observasi yang
diyakini berbeda signifikan dengan target.
Derajat kebebasan (degree of freedom, df=n-k), besaran
yang menunjukkan bebas terhadap bias dari n data observasi.
16
17. Kekeliruan pada Analisa Regresi
Tidak ada logika penalaran atau alasan logis yang mendasari hipotesa
variabel bebas mempengaruhi variabel terikat.
Deskripsi dari variabel bebas tidak mempunyai hubungan kausal
dengan deskripsi dari variabel terikat.
Pengukuran atau pengumpulan data dilakukan oleh/dari pihak yang
mempunyai konflik kepentingan atau yang tidak punya kewenangan
atas data.
Variabel bebas dan/atau variabel terikat diukur pada hanya satu obyek
yang bernilai tunggal atau statis.
Rentang data sampel sangat sempit, namun dipergunakan untuk
menginduksi rentang populasi yang sangat lebar dengan ekstrapolasi.
17
18. Kekeliruan pada Analisa Regresi
Variabel bebas (x) = tinggi badan anak-anak di desa A (pertumbuhan tiap tahunnya);
Variabel terikat (y) = harga emas (kenaikan tiap tahunnya). Meskipun jika dihitung,
menunjukkan pertumbuhan tinggi badan anak-anak di desa A mempunyai korelasi
kuat dengan kenaikan harga emas.
Variabel bebas (x) = motivasi kerja; Variabel terikat (y) = kinerja. Deskripsi “motivasi
kerja” adalah mendapatkan pengakuan dari keluarga besar karena menjadi karyawan
pabrik.Deskripsi “kinerja” adalah waktu penyelesaian pekerjaan lebih cepat daripada
batas waktu yang ditargetkan.
Data yang diukur : Banyaknya pelanggaran yang dilakukan. Ditanyakan pada pelaku
pelanggaran, atau pada pihak yang tidak pernah melihat pelaku pelanggaran.
Data yang diukur : Aturan pengupahan dari satu perusahaan di satu waktu.
Rentang data sampel pada 10 < x < 50, namun dipergunakan untuk menduga nilai Y
jika x=200.
18
83. Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
2. Formulasi hipotesa
3. Memilih uji statistik
4. Menentukan tingkat keberartian
5. Membangun daerah keputusan
6. Menghitung statistik uji
7. Menarik kesimpulan
83
84. Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
Berdasarkan masalah yang menjadi fokus studi, untuk
menentukan parameter of interest sebagai tujuan
pengujiannya.
84
Tujuan pengujian hipotesa berawal dari maksud mempelajari sistem atau
menjawab permasalahan. Tujuan menjadi dasar utama dalam menentukan
populasi, memilih sampel, mengambil data dan mengujinya untuk memperoleh
kesimpulan yang selaras dengan tujuan tersebut.
85. Langkah Pengujian Hipotesa
2. Formulasi hipotesa
Hipotesa diformulasikan berdasarkan praduga yang
dirumuskan sesuai dengan tujuan. Praduga tidak selalu
menjadi hipotesa nol, bahkan lebih diutamakan praduga
direfleksikan pada hipotesa alternatif.
85
Hipotesa alternatif H1 biasanya merepresentasikan permasalahan yang akan
dijawab atau teori yang akan diuji, sehingga formulasi spesifik menjadi krusial.
Hipotesa nol H0 menyatakan status quo atau equality yang meniadakan
(nullifies) atau berlawanan (opposes) H1 dan menjadi complement dari H1 yang
bersifat mutually exclusive. Penggunaan format pertidaksamaan dengan tanda
pengujian satu arah memberikan deskripsi lebih spesifik pada H1.
86. Langkah Pengujian Hipotesa
3. Memilih uji statistik
Uji statistik dalam statistik inferensia dikelompokkan
menjadi dua, uji parametrik (berdistribusi) dan uji
nonparametrik. Uji statistik yang dipilih harus disesuaikan
dengan tujuan pengujian, hipotesa dan data (evidence)
yang diuji.
86
Uji parametrik mempertimbangkan tipe data dan distribusi data.
Pendekatan distribusi normal terkadang dapat dipergunakan dengan merujuk
Central Limit Theorem dan Law of Large Number
87. Langkah Pengujian Hipotesa
4. Menentukan tingkat keberartian
Tingkat keberartian (terkadang juga disebut taraf nyata atau
tingkat ketelitian) menunjukkan luas daerah penolakan.
Tingkat keberartian sebenarnya juga menunjukkan
besarnya peluang terjadinya galat tipe I.
87
Semakin besar nilai tingkat keberartian semakin besar peluang galat tipe 1.
Sebaliknya semakin kecil nilainya semakin kecil pula peluang galat tipe 1, tetapi
juga semakin besar peluang galat tipe 2, bukannya bermakna semakin teliti.
Peluang galat tipe 2 beririsan dengan daerah penerimaan, sehingga sebenarnya
peluang galat tipe 2 tidak sama besar dengan satu dikurangi peluang galat tipe 1.
88. Langkah Pengujian Hipotesa
5. Membangun daerah keputusan
Daerah keputusan terbagi menjadi dua, yaitu daerah
penolakan dan daerah penerimaan. Di antara kedua daerah
tersebut dibatasi oleh nilai kritis. Nilai kritis diperoleh
berdasarkan tingkat keberartian, dan distribusi (termasuk
parameter) yang dipergunakan dalam uji statistik.
88
Semakin besar nilai tingkat keberartian semakin luas daerah penolakan
(semakin besar peluang galat tipe 1).
Sebaliknya semakin kecil nilainya semakin luas daerah penerimaan (semakin
besar peluang galat tipe 2), bukannya bermakna semakin teliti.
89. Langkah Pengujian Hipotesa
6. Menghitung statistik uji
Perhitungan statistik uji berdasarkan uji statistik yang dipilih
dan distribusi (termasuk parameter) yang dipergunakan.
Hasil perhitungan statistik uji tergantung kecukupan,
sebaran, kevalidan dan kesesuaian data.
89
Data yang keliru akan memberikan hasil yang keliru (garbage in garbage out)
Uji statistik yang keliru memberikan hasil yang keliru (failure makes inappropriate
result). Periksa datanya, pahami uji statistik yang dipilih, pelajari distribusi yang
dipergunakan, dan pastikan sesuai dengan tepat.
90. Langkah Pengujian Hipotesa
7. Menarik kesimpulan
Kesimpulan ditarik berdasarkan hasil perhitungan statistik
uji, apakah berada di daerah penerimaan atau daerah
penolakan.
90
The truth or falsity of a statistical hypothesis is never known with absolute
certainty unless we examine the entire population. It should be made clear that
the decision procedure must include an awareness of the probability of a wrong
conclusion.
91. Uji Hipotesa Koefisien Regresi
Salah satu cara menilai kelayakan model regresi
linier adalah dengan uji hipotesa pada parameter
atau koefisien model regresi. Untuk menguji hipotesa
koefisien slope dan intercept dri model regresi, kita
perlu mengsumsikan bahwa error model, є,
berdistribusi normal.
Dan asumsi lengkapnya adalah error model
berdistribusi normal dan independen dengan mean,
μ=0, variance, σ2, atau dinotasikan NID (0, σ2)
91
105. Uji Hipotesa Model Regresi
105
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
1
1
0
2
2
2
1
1
0
2
2
2
2
2
2
2
y
x
y
x
y
y
y
y
SSE
n
y
y
x
y
x
y
y
y
SSR
n
y
y
y
y
SST
y
y
y
y
y
y
SSE
SSR
SST
k
k
i
i
k
k
i
i
i
i
i
i
Statistika dapat menjadi alat bantu dalam menyelesaikan masalah. Mulai dari saat mengumpulkan data, mengolah, menginterpresikan, menganalisa dan mensitesanya. Namun saat keliru menetapkan populasi atau keliru memilih sampel, serta keliru mendeskripsikan variabel yang akan diambil datanya, melalaikan tujuan penelitian, maka hasil pengolahannyapun akan menjadi sampah. Demikian pula meskipun data yang diambil benar dan representatif, namun metode dan alat pengolahannya pun keliru yang dipilih atau keliru cara mempergunakannya, maka hasilnya pun akan menjadi sampah. Sehingga perlu kita pahami bahwa statistika cuma alat berbasis model matematis, ada angka dimasukkan akan mengeluarkan hasil, entah itu benar atau sampah.
Alat statistika bukan tongkat sihir, apapun dan bagaimanapun keadaan datanya dengan tongkat sihir ajaib bisa mengubahnya menjadi hasil yang sesuai dengan tujuan penelitian. Metode statistika pun bukan ramuan sihir, apapun dan bagaimanapun keadaan datanya diolah dalam ramuan sihir ajaib bisa mewujudkan hasil yang sesuai dengan tujuan penelitian.