Statistika

Statistika Industri
 M. Aulia Rendy 116111146
 Fadhillah Nurainy 116111147
 Arif Nurfajar 116111149
 Liffi Noferianti 116111150
 Mahdy Arief 116110052

Daftar Isi
 BAB I Teori Sampling
 BAB II Distribusi Sampling
 BAB III Teori Estimasi
 BAB IV Uji Hipotesis
 BAB V Uji Chi Kuadrat
 BAB VI Analisis Korelasi dan Regresi Linier
Sederhana
 BAB VII Analisis of Variance (ANOVA)

PENGERTIAN DASAR
 Sampling
Proses pengambilan atau memilih n buah elemen/objek/unsur dari
populasi yang berukuran N.
 Sample (n) :
Merupakan bagian dari populasi. Elemen anggota
sampel, merupakan anggota populasi dimana sampel diambil. Jika
N banyaknya elemen populasi, dan n banyaknya elemen
sampel, maka n < N.
 Populasi (N)
Kumpulan lengkap dari elemen-elemen yang sejenis akan tetapi
dapat dibedakan berdasarkan karekteristiknya.

TEKNIK-TEKNIK PENGAMBILAN
SAMPEL

Tipe Sampling menurut Proses Memilih
 Sampling dengan Pengembalian
Satuan sampling yang terpilih, “dikembalikan” lagi ke dalam populasi
(sebelum dilakukan kembali proses pemilihan berikutnya). Sebuah
satuan sampling bisa terpilih lebih dari satu kali. Untuk populasi
berukuran N=4 dan sampel berukuran n=2, maka sampel yang
mungkin terambil adalah Nn = 42 = 16 buah sampel.
 Sampling tanpa Pengembalian
Satuan sampling yang telah terpilih, “tidak dikembalikan” lagi ke
dalam populasi. Tidak ada kemungkinan suatu satuan sampling
terpilih lebih dari sekali. Untuk populasi berukuran N=4 (misalnya
A, B, C, D) dan sampel berukuran n=3, maka sampel yang mungkin
terambil ada 4 buah sampel yaitu ABC, ABD, ACD, dan BCD.
Secara umum untuk menghitung banyaknya macam sampel yang
mungkin jika pengambilan sampel tanpa pengembalian adalah: nCr
= n!/(r!(n-r)!)

Tipe Sampling menurut Peluang
Pemilihannya
 Random sampling
Random sampling adalah cara pengambilan sampel yang
memberikan kesempatan yang sama untuk diambil kepada setiap
elemen populasi. Artinya jika elemen populasinya ada 100 dan
yang akan dijadikan sampel adalah 25, maka setiap elemen
tersebut mempunyai kemungkinan 25/100 untuk bisa dipilih menjadi
sampel. Random Sampling ada dua macam yaitu:
1. Simple Random Sampling atau Sampel Acak
Sederhana
Cara atau teknik ini dapat dilakukan jika analisis
penelitiannya cenderung deskriptif dan bersifat umum.
2. Stratified Random Sampling atau Sampel Acak
Distratifikasikan
Penarikan sampel acak terstruktur dilakukan dengan
membagi anggota populasi dalam beberapa sub kelompok
yang disebut strata, lalu suatu sampel dipilih dari masing-
masing stratum.

3. Cluster Sampling atau Sampel Gugus
Teknik ini biasa juga diterjemahkan dengan cara
pengambilan sampel berdasarkan gugus. Dalam sampel
gugus, setiap gugus boleh mengandung unsur yang
karakteristiknya berbeda-beda atau heterogen.
4. Systematic Sampling atau Sampel Sistematis
Cara ini menuntut kepada peneliti untuk memilih unsur
populasi secara sistematis, yaitu unsur populasi yang bisa
dijadikan sampel adalah yang “keberapa”.
5. Area Sampling atau Sampel Wilayah
Teknik ini dipakai ketika peneliti dihadapkan pada situasi
bahwa populasi penelitiannya tersebar di berbagai wilayah.

TEKNIK PENYAJIAN DATA
SAMPEL
Penyajian Data
Penyajian data dilakukan untuk mempermudah dalam pengambilan
keputusan. Data-data yang kita ambil dari populasi atau biasa
disebut sebagai data sampel, dapat diperoleh dengan berbagai
cara, antara lain:
 Wawancara
 Pengamatan
 Surat menyurat
 Kuisioner
Data mentah yang diperoleh dapat disajikan sebagai statistika
tataan (pengurutan data) dalam bentuk tabel distribusi
frekuensi,histogram, box plot, diagram dahan daun, dan lain-lain.

Tabel Distribusi frekuensi
Tabel distribusi frekuensi adalah metode pengelompokan data ke
dalam beberapa kategori yang menunjukan banyaknya data dalam
setiap kategori. Setiap data tidak dapat dimasukan ke dalam dua
atau lebih kategori agar data menjadi informatif dan mudah
dipahami. Data yang sudah dirangkum dalam distribusi frekuensi
dinamakan data berkelompok.
Contoh tabel distribusi frekuensi
Kelas interval Frekuensi
3 – 5 2
6 – 8 5
9 – 11 7
12 – 14 1
15 - 17 1

Langkah-langkah distribusi
frekuensi:
 Mengurutkan data dari data terkecil hingga data terbesar atau
sebaliknya.
 Menentukan banyaknya kelas dengan menggunakan kaidah
Sturges, yaitu
N : banyaknya pengamatan
Banyaknya kelas sebaiknya antara 5 sampai dengan 15
 Menentukan interval kelas (KI), dengan rumus :
KI sebaiknya kelipatan 5.
k = 1 + 3,3 log N

 Melakukan penturusan atau tabulasi dengan memasukan nilai ke
dalam interval kelas.
 Untuk komposisi kelas,perhatikan bahwa kelas tidak tumpang tindih
(lihat batas atas dan batas bawah tiap kelasnya kelas).
 Bila tabel distribusi frekuensi akan digunakan untuk membuat
histogram atau poligon, maka komposisinya diubah ke bentuk batas
kelas, yaitu batas bawah dikurangi ( ½ x satuan pengukuran terkecil
dari data) dan batas atas ditambah (½ x satuan pengukuran terkecil
dari data).

BATAS KELAS
Batas kelas adalah nilai terendah dan tertinggi dalam satu kelas
tabel distribusi frekuensi. Batas kelas dalam suatu interval kelas
terdiri dari dua macam :
 Batas kelas bawah – lower class limit, yaitu nilai terendah dalam
suatu interval kelas
 Batas kelas atas – upper class limit, yaitu nilai tertinggi dalam
suatu interval kelas
Contoh Batas Kelas :
Kelas Jumlah Frekuensi (F)
1 215 2122 14
2 2123 4030 4
3 4031 5938 1
4 5939 7846 1
5 7847 9754 1
Interval
Batas kelas bawah Batas kelas atas

NILAI TENGAH
Nilai tengah adalah tanda atau perinci dari suatu interval kelas dan
merupakan suatu angka yang dapat dianggap mewakili suatu
interval kelas. Nilai tengah kelas berada di tengah-tengah pada
setiap interval kelas.
Contoh nilai tengah:
Kelas Nilai tengah
1 215 2122 1168.5
2 2123 4030 3076.5
3 4031 5938 4984.5
4 5939 7846 6892.5
5 7847 9754 8800.5
Interval
Nilai tengah Kelas ke 1
= [ 215 + 2122] / 2
= 1168.5

NILAI TEPI KELAS
Nilai tepi kelas (Class Boundaries) adalah nilai batas antara kelas
yang memisahkan nilai antara kelas satu dengan kelas lainnya.
Nilai tepi kelas ini dapat dihutung dengan penjumlahan nilai atas
kelas dengan nilai bawah kelas diantaranya dan di bagi dua.
Contoh nilai tepi kelas:
Kelas Interval
Jumlah
Frekuensi (F)
Nilai Tepi Kelas
1 215 2122 14 214.5
2 2123 4030 3 2122.5
3 4031 5938 1 4030.5
4 5939 7846 1 5938.5
5 7847 9754 1 7846.5
9754.5
Nilai tepi kelas ke 2
= [ 2122 +2123 ] / 2
= 2122,5

Distribusi Frekuensi Relatif
Distribusi frekuensi relatif adalah frekuensi setiap kelas
dibandingkan dengan frekuensi total. Tujuan pembuatan distribusi
ini adalah untuk memudahkan membaca data secara tepat dan
tidak kehilangan makna dari kandungan data.
Contoh Distribusi Frekuensi Relatif
Kelas Interval
Jumlah Frekuensi
(F)
Frekuensi relatif
(%)
1 215 2122 14 70
2 2123 4030 3 15
3 4031 5938 1 5
4 5939 7846 1 5
5 7847 9754 1 5
Frekuensi relatif (%)
= [ 14 / 20 ] x 100 %
= 70 %

Penyajian dalam Bentuk Grafik
1. Grafik Histogram
Penyajian dalam bentuk histogram tidak lain merupakan
pengembangan dari bentuk tabel frekuensi. Bentuk histogram
memberikan gambaran frekuensi untuk setiap nilai atau selang nilai
tertentu dari data. Gambaran ini akan lebih memudahkan pengguna
dalam mengungkap informasi yang terkandung dalam data.
Histogram merupakan diagram yang berbentuk balok. Histogram
menghubungkan antara tepi kelas interval dengan pada sumbu
horizontal (X) dan frekuensi setiap kelas pada sumbu vertikal (Y).

Kelas Interval
Jumlah Frekuensi
(F)
1 215 2122 14
2 2123 4030 3
3 4031 5938 1
4 5939 7846 1
5 7847 9754 1
0
5
10
15
Tepi Kelas

2. Grafik Polygon
Grafik polygon menggunakan garis yang mengubungkan titik–titik
yang merupakan koordinat antara nilai tengah kelas dengan jumlah
frekuensi pada kelas tersebut.
Contoh Grafik Polygon
Kelas Nilai Tengah Jumlah Frekuensi (F)
1 1168.5 14
2 3076.5 3
3 4984.5 1
4 6892.5 1
5 8800.5 1
Jumlah Frekuensi (F)
0
2
4
6
8
10
12
14
16
1 2 3 4 5
Jumlah
Frekuensi (F)

3. Kurva Ogif
Kurva ogif merupakan diagram garis yang menunjukan kombinasi
antara interval kelas dengan frekuensi kumulatif.
Contoh kurva Ogif
Kelas
Interval Nilai Tepi Kelas
Frekuensi kumulatif
Bawah Atas Kurang dari Lebih dari
1 215 2122 214.5 0 20
2 2123 4030 2122.5 14 6
3 4031 5938 4030.5 17 3
4 5939 7846 5938.5 18 2
5 7847 9754 7846.5 19 1
9754.5 20 0

0
5
10
15
20
25
1 2 3 4 5 6
Interval kelas
FrekuansiKumulatif
Kurang dari
Lebih dari

4. Box plot
Dalam membuat boxplot, pendekatan yang digunakan adalah
dengan membagi kumpulan data yang telah diurutkan menjadi
empat bagian sama banyak. Keempat bagian tersebut mempunyai
lima pembatas, yaitu : data terkecil (Xmin), K1, K2 atau
median, K3, dan data terbesar (Xmax) seperti terlihat di bawah ini :
25% 25% 25% 25%
Xmin K1 K2 K3 Xmax

Dengan menggunakan boxplots kita dapat pula mendeteksi ada
atau tidaknya data pencilan (data ekstrim). Data pencilan dideteksi
dengan menggunakan nilai-nilai Pagar Dalam (PD) dan Pagar Luar
(PL). Nilai-nilai pagar tersebut dihitung menggunakan rumus :
Nilai data yang terletak antara PD dan PL dikategorikan sebagai
data pencilan dekat (∗), dan nilai data yang terletak di luar PL
dikategorikan sebagai data pencilan jauh (ο).
Contoh boxplot

5. Diagram dahan daun
Diagram dahan daun adalah suatu cara mencatat data secara
tersusun. Diagram ini sangat berguna pada saat kita ingin
menyajikan data dalam bentuk gambar tentang bentuk sebarannya
tanpa kehilangan informasi nilai numerik dari data. Penggunaan
diagram dahan-daun memungkinkan kita untuk mengelompokkan
data sekaligus memberi kita informasi visual; panjang tiap baris
memperlihatkan frekuensi tiap baris
Diagram dahan-daun sangat mudah dibuat. Angka-angka data kita
bagi menjadi dua bagian, bagian pertama menjadi dahan, dan
bagian kedua menjadi daun. Angka yang menjadi daun biasanya
adalah satu atau dua angka terakhir..

Contoh diagram batang daun
Stem-and-leaf of C1 N =
30
Leaf Unit = 1.0
3 0 333
5 0 45
7 0 66
11 0 8899
(6) 1 000011
13 1 2223
9 1 55
7 1 6
6 1 88
4 2 01
2 2
2 2 44

 Distribusi Sampling merupakan distribusi
teoritis (distribusi kemungkinan) dari semua
hasil sampel yang mungkin, dengan ukuran
sampel yang tetap N, pada statistik
(karakteristik sampel) yang digeneralisasikan
ke populasi.
 Distribusi Sampling memungkinkan untuk
memperkirakan probabilitas hasil sampel
tertentu untuk statististik tersebut
 Merupakan jembatan, karena melalui distribusi
sampling dapat diketahui karakteristik
populasi

 Sampel dari Populasi Terbatas
 Sampel dari Populasi Tidak Terbatas
 Teorema Limit Pusat

 Bila populasi terbatas yang berukuran N dan berdistribusi normal
dengan rata-rata µ dan simpangan baku rata-rata sampel
yang didasarkan pada sampel random berukuran n dan dipilih
dari populasi di atas, akan memiliki distribusi normal dengan
rata-rata dan simpangan baku seperti berikut:
 Untuk pengambilan sampel tanpa pengembalian atau n/N >
5%:
 Untuk pengambilan sampel dengan pengembalian
atau n/N ≤ 5%
 X
1



N
nN
nX
X



nX
X






 Bila populasi memiliki ukuran yang tidak berhingga
dan didistribusikan secara normal dengan rata-rata µ
dan simpangan baku .., maka rata-rata sampel .. Yang
didasarkan pada sampel random ukuran n, dan yang
dipilih dengan pengembalian atau tanpa pengembalian
dari populasi tersebut akan memiliki distribusi normal
dengan rata-rata dan simpangan baku:
nX
X






 Dalam suatu pengujian kelelahan (fatigue test), material
titanium diberi pembebanan berulag sampai deteksi
timbulnya retak (crack initiation). Siklus pembebanan
rata-rata sampai mulai retak adalah 25000 kali dengan
deviasi standar 5000. jika diuji 25 spesimen material
titanium yang dipilih secara acak, berapakah :
 Mean dari sampel tersebut?
 Deviasi standar dari sampel tersebut?

 Mean dari sampel
 Deviasi standar dari sampel
1000
25
5000
25000


nx
x




 Normalitas dari distribusi sampling rata-rata
 Jika populasi cukup besar dan berdistribusi secara
normal, maka distribusi sampling rata-ratanya akan
normal
 Jika distribusi populasi tidak normal, maka
distribusi sampling rata-ratanya akan mendekati
normal, apabila jumlah sampel cukup besar,
biasanya 30 atau lebih (n≥ 30)
 Distribusi normal dari rata-rata sampel memiliki
rata-rata yang sama dengan rata-rata harapan E( )
dan simpangan baku. Nilai-nilai tersebut dapat
dihitung dari rata-rata populasi dan simpangan
baku populasi
X

 Untuk populasi terbatas atau
n/N>5%, berlaku:
 Untuk populasi tidak terbatas atau
n/N≤5%, berlaku:
1





N
nN
n
X
Zatau
X
Z
X 



n
X
Zatau
X
Z
X



 




0
2
4
6
8
10
12
-6 -4 -2 0 2 4 6
Distribusi X jika n > 30
Distribusi X jika n < 30Distribusi Populasi
(tidak terdistribusi normal)

 Lima ratus cetakan logam memiliki berat rata-
rata 6,03 N dan deviasi standar 0,4 N.
Berapakah probabilitas bahwa suatu sampel
acak terdiri dari 100 cetakan yang dipilih akan
mempunyai berat total antara 597 sampai 600
N?

 Mean dan deviasi standar :
 Probabilitas mean tersebut dapat dicari dengan menggunakan
tabel distribusi normal standar di mana :
 Maka:
1558,00475,02033,0
)67,1()83,0(
)83,067,1(
036,0
03,600,6
036,0
03,697,5
)00,697,5(
036,0
1500
100500
100
4,0
1
03,6








 













x
x
x
x
x
x
x
ZP
ZPXP
x
z
N
nN
n






 Adalah distribusi dari perbedaan dari besaran rata-rata
yang muncul dari sampel-sampel dua populasi
 Rata-Rata
 Simpangan Baku
 Pendekatan Normal
2121
 XX
2
2
2
1
2
1
21
nnXX

 
   
21
2121
XX
XX
Z






 Distribusi Proporsi Sampling adalah
distribusiproporsi-proporsi (rasio /
perbandingan) dari seluruh sampel acak
berukuran n yang mungkin yang dipilih dari
sebuah populasi.

 Jika dalam sebuah populasi probabilitas
terjadinya suatu peristiwa (probabilitas
sukses) adalah π sementara probabilitas gagalnya
adalah θ = 1 – π maka mean dan deviasi standar
distribusi proporsi sampling adalah :
 Jika sampling dilakukan tanpa pergantian atau
populasi terhingga yang berukuran N :
1



N
nN
n
P
P




 Jika sampling dilakukan dengan pergantian
atau populasinya tak terhingga, maka :
nn
P
P
)1( 















n
N
P
P
Mean dari distribusi proporsi sampling
Deviasi standar dari distribusi proporsi
sampling
Ukuran populasi
Ukuran sampel
Probabilitas sukses
Probabilitas gagal

 Proporsi adalah variabel diskrit yang
populasinya mengikuti distribusi binomial.
Jika nilai n besar (n>30), distribusi proporsi
sampling mendekati suatu distribusi normal.
Untuk menentukan probabilitas dengan
menggunakan tabel distribusi normal maka
diperlukan faktor koreksiterhadap nilai
proporsi tersebut. n2
1

 Divisi pengendalian mutu pabrik perkakas
mesin mencatat bahwa 1,5% dari bearing
mengalami cacat. Jika dalam pengiriman satu
kotak produk terdiri dari 100 bearing, tentukan
probabilitas banyaknya bearing yang cacat
sebanyak 2% atau lebih!

 Mean dan deviasi standar :
 Faktor koreksi variabel diskrit = 1/2n = 1/200 = 0,005
 Proporsi (2%) setelah dikoreksi, p= 0,02-0,005 = 0,015
 Maka,
%505,01)0(1
0122,0
015,0015,0
1
)01,0(1)01,0(
0122,0
100
)015,01(015,0)1(
015,0






 








p
p
P
P
ZP
ZP
pPpP
nn




 Distribusi perbedaan dari sampling S1 – S2
memiliki mean dan deviasi standar sebagai
berikut :
 Dengan syarat bahwa sampel yang dipilih
tidak saling terikat (saling bebas)
22
2121
2121
SSSS
SSSS







 Distribusi penjumlahan dari sampling S1 + S2
memiliki mean dan deviasi standar sebagai
berikut :
 Dengan syarat bahwa sampel yang dipilih
tidak saling terikat (saling bebas)
22
2121
2121
SSSS
SSSS







 Lampu bohlam merk Phillups (1) memiliki
daya tahan pakai rata-rata 2400 jam dan
deviasi standar 200 jam. Sementara lampu
bohlam merk Dup (2) memiliki daya tahan
pakai rata-rata 2200 jam dengan deviasi
standar 100 jam. Jika dari masing-masing merk
dipilih 125 sampel yang diuji, berapakan
probabilitas bahwa bohlam merk Phillups (1)
memiliki daya tahan pakai sekurang-
kurangnya 160 jam lebih lama dibandingkan
bohlam merk Dup (2)?

 Mean dan deviasi standar dari distribusi perbedaan sampling :
 Skor z untuk perbedaan mean 160 jam adalah :
 Jadi, probabilitas yang akan ditentukan adalah :
%72,979772,00228,01
)2(1)2()160)((
2
20
200160)()(
20
125
)100(
125
)200(
20022002400
2121
21
21
21
21
2121
2121
21
21
22
2
2
1
2
22















SSSS
SS
SS
SS
SS
SSSS
SSSS
ZPZPSSP
SS
Z
nn






1.Selang kepercayaan mean sampel
Dari gambar di atas
Sampel acak berukuran n dari suatu populasi dengan variansi σ2 yang diketahui dan mean yang
dihitung akan menghasilkan selang kepercayaan sebesar (1-α)100%.

2.Selang kepercayaan untuk µ; diketahui
Bila rataan sampel acak berukuran n dari suatu populasi dengan variansi 2 yang diketahui maka
selang keperctayaan (1-α)100% untuk µ ialah :
zα/2 adalah nilai sebaran normal yang menghasilkan luas α/2 di sebelah kanannya.
Contoh : mean dan simpangan baku dari IPK sebanyak 36 orang mahasiswa adalah 2.6 dan 0.3.
tentukan selang kepercayaan 95% dan 99% untuk nilai mean-nya.
Jawab : titik estimasi adalah = 2.6. karena sampel beukuran besar, simpangan baku σ dapat
didekati dengan s = 0.3. nilai z yang memberikan luas daerah dibawah kurva sebesar 0.025 di
sebelah kanan, atau 0.975 di sebelah kiri, adalah z0.025 = 1.96 (dari tabel). Oleh karena itu
selang kepercayaan 95% adalah
2.6 – (1.96) (0.3)/) < µ < 2.6 + (1.96) (0.3/) atau
2.50 < µ < 2.70
Dengan cara yang sama, selang kepercayaan 99% memerlukan z0.005 = 2.575 dan selang
kepercayaan ini adalah :
2.6 – (2.575) (0.3/) < µ < 2.6 + (2.575) (0.3/) atau
2.47 < µ < 2.73

3. Sampel sedikit
Bagaimana jika syarat n ≥ 30 untuk menghitung variansi populasi tidak dapat dipenuhi?
Gunakan distribusi T sebagai ganti distribusi Gauss. Disini :
Mengacu pada gambar di atas, nilai peluang pada daerah diarsir
P(-tα/2<T< tα/2) = 1 – α
Di mana tα/2 adalah nilai t untuk derajat bebas n-1. Luas sebelah kanan nilai ini adalah α/2, dan
berdasarkan simetri, luas sebelah kiri dari -tα/2 juga α/2. Substitusi untuk T menghasilkan
P(-tα/2<( )< tα/2) = 1 – α
Maka diperoleh P( ) = 1 – α
Dengan demikian, untuk n sampel, mean dan simpangan baku s, interval kepercayaan (1 –
α)100% diberikan oleh :

4. Selang kepercayaan untuk µ; σ tidak diketahui.
Suatu selang kepercayaan (1 – α)100% untuk µ adalah:
Contoh : ada 7 kontainer serupa yang berisi asam sulfat dengan volume :
9.8, 10.2, 10.4, 9.8, 10.0, 10.2, dan 9.6 liter. Tentukan selang kepercayaan 95% untuk mean dari
kontainer-kontainer tersebut juka distribusinya mendekati normal.
Jawab : dari data yang diberikan,diketahui mean sampel =10.0 dan simpangan baku sampel
s=0.283. berdasarkan tabel T, kita dapatkan t0.025 = 2.447 untuk derajat bebas v=6. Karena
itu, selang kepercayaan 95% dari adalah
10.0 – (2.447) (0.283 / )< < 10.0 + (2.447) (0.283 / ), atau
9.74< <10.26

Penaksir titik untuk proporsi p dalam suatu percobaan binomial diberikan oleh statistic dengan
X menyatakan banyaknya yang berhasil dalam n usaha. Jadi, proporsi sampel akan digunakan
sebagai taksiran titik untuk parameter p.
Variansi
Dengan demikian dapat dituliskan
Dengan
dan menyatakan nilai kurva normal baku yang di sebelah kanannya terdapat daerah seluas .

Selang kepercayaan sampel-besar untuk p
dengan menyatakan nilai z sehingga luas di sebelah kanannya α/2.
Contoh 1
Pada suatu sampel acak n = 500 keluarga yang memiliki pesawat televise di kota
Hamilton, Kanada, ditemukan bahwa x = 340 memiliki tv berwarna. Carilah selang kepercayaan 95%
untuk proporsi sesungguhnya dari keluarga yang memiliki tv berwarna di kota tersebut.
Jawab
Taksiran titik untuk p ialah . Dari table diperoleh . Jadi, selang kepercayaan 95% untuk p adalah
Yang, bila disederhanakan akan menjadi
Yang, bila disederhanakan akan menjadi
0,64 < p < 0,72

Bila p berada tepat di tengah selang kepercayaan (1-) 100% maka menaksir p tanpa galat.
Tapi, biasanya, tidak akan tepat sama dengan p dan taksiran titik meleset (mempunyai galat).
Besarnya galat akan smaa dengan selisih positif antara dan p, dan dengan selang kepercayaan (1-
) 100% selisih ini akan lebih kecil dari .
Teorema 1
Bila dipakai sebagai taksiran p, galatnya akan lebih kecil daripada
dengan kepercayaan (1-α) 100%.
Pada contoh 1 diatas, proporsi sampel berbeda dengan proporsi p yang sesungguhnya tidak lebih
dari 0,04 dengan kepercayaan 95%. Sekarang ingin ditentukan berapa besarkah sampel yang
diperlukan agar terjamin bahwa galat dalam menaksir p tidak melebihi suatu besaran g. Menurut
teorema 1, ini berarti n harus dipilih agar
Teorema 2
Bila dipakai sebagai taksiran p, maka dengan kepercayaan (1-α) 100% galat
akan lebih kecil dari besaran tertentu g bila ukuran sampel sebesar

Contoh 2
Berapa besarkah diperlukan sampel pada contoh 1 agar taksiran p meleset kurang dari 0,02
dengan kepercayaan 95%?
Jawab :
Pandanglah ke-500 keluarga sebagai sampel pendahuluan yang memberikan taksiran . Maka
menurut teorema 3
Jadi, bila taksiran p didasarkan atas sampel acak ukuran 2090 maka proporsi sampel tidak akan
berbeda lebih dari 0,02 dengan proporsi sesungguhnya, dengan kepercayaan 95 %.
Teorema 3
Bila dipakai sebagai taksiran p, maka dengan kepercayaan paling sedikit (1-α) 100%
galat akan lebih kecil dari besaran tertentu g bila ukuran sampel
Contoh 3
Berapa besarkah sampel yang diperlukan pada contoh 1 agar kita yakin paling sedikit dengan
kepercayaan 95% bahwa taksiran p melesat kurang dari 0,02?
Jawab
Berbeda dengan contoh2, disini kita anggap tidak ada sampel pendahuluan diambil untuk
menaksir p. Karena itu, dengan kepercayaan paling sedikit 95% proporsi sampel yang kita
peroleh tidak akan berbeda dari proporsi sesungguhnya melebihi 0,02 bila kita memilih ukuran
sampel

MENAKSIR SELISIH RATA-RATA.
Dalam hal ini kita berhubungan dengan dua buah populasi yang selisih rata-ratanya ( μ1 – μ2 )
akan kita taksir.
a. Interval taksiran untuk selisih rata-rata jika σ1 dan σ2 diketahui:
b. Interval taksiran untuk selisih rata-rata jika simpangan baku σ1 dan σ2 tidak diketahui tetapi σ1 =
σ2 :

c. jika simpangan baku σ1 dan σ2 tidak diketahui dan σ1 ≠ σ2 :
Contoh:
Masa pakai barang A yang dihasilkan oleh dua pengusaha akan diteliti. Dari barang yang
dihasilkan oleh pengusaha 1 diteliti 150 buah dan dicatat masa pakainya. Rata -ratanya 1400 jam
dean simpangan baku 80 jam.Barang yang dihasilkan pengusaha II diteliti sebanyak 100 buah.
Ternyata rata-ratanya = 1300 jam dan S = 70 jam. Carilah interval taksiran selisih rata-ratanya.
dengan kepercayaan 95%.
Jawab:
Asumsi σ1 = σ2
sehingga sp= 74,5 dari daftar t dengan kepercayaan 95% dan V= 248 didapat t0,05(248)= 1,96

2.1.Estimasi Selisih Dua Proporsi
Selang kepercayaan untuk p1- p2 dapat ditetapkan dengan menggunakan distribusi sampel . Dari
materi menaksir proporsi diketahui dan masing-masing berdistribusi hampir normal, dengan
rataan p1 dan p2 , dan variansi p1q1 / n1 dan p2q2 / n2 . Dengan mengambil kedua sampel secara
bebas dari kedua populasi maka peubah akan bebas satu sama lain, dank arena distribusi normal
bersifat merambat, maka dapat disimpulkan bahwa
berdistribusi hampir normal dengan rataan
Dan variansi

Bila nilai kurva normal sehingga luas di sebelah kanannya
Contoh 4
Suatu perusahaan dalam cara pembuatan suku cadang sedang direncanakan. Sampel diambil
dari cara lama maupun yang baru untuk melihat apakah cara baru tersebut memberikan
perbaikan. Bila 75 dari 1500 suku cadang yang berasal dari cara lama ternyata cacat dan 80 dari
2000 yang berasal dari cara baru ternyata cacat, carilah selang kepercayaan 90% untuk selisih
sesungguhnya proporsi yang cacat dalam kedua cara.

Karena selang ini mengandung nilai 0, tak ada alasan mempercayai bahwa cara baru tersebut
memberikan penurunan yang berarti dalam proporsi suku cadang yang cacat disbanding dengan
cara lama.

Bila sampel berukuran n diambil dari populasi normal dengan variansi dan variansi sampel S2
dihitung maka kita peroleh suatu nilai dari statistic S2. Variansi sampel hasil perhitungan ini
akan digunakan sebagai taksiran titik untuk . Karena itu statistik S2 disebut penaksir .
Jadi dapat ditulis
Bila S2 variansi sampel acak ukuran n dari populasi normal maka selang kepercayaan (1-α) 100%
untuk variansi diberikan oleh

Contoh 5
Data berikut menyatakan berat, dalam gram, 10 bungkus bibit sejenis tanaman yang dipasarkan
oleh suatu perusahaan : 46,4, 46,1 , 45,8 , 47,0 , 46,1 , 45,9 , 45,8 , 46,9 , 45,2 dan 46, 0 . Carilah
selang kepercayaan 95 % untuk variansi semua bungkusan bibit yang dipasarkan perusahaan
tersebut, anggap populasinya normal.
Jawab
Mula-mula hitunglah
atau
0,135 < < 0,953

Contoh :
Suatu selang kepercayaan untuk perbedaan rataan kadar ortofosfor, diukur dalam mg per
liter, pada dua stasion di sungai James telah dihitung di contoh 7.8 dengan menganggap kedua
variansi populasi normal tidak sama. Beri dukungan atas anggapan ini dengan membuat selang
kepercayaan 98% untuk dan untuk , bila dan variansi populasi kadar ortofosfor masing-masing
di stasion 1 dan 2.
Jawab
Dari contoh 7.8 diperoleh n1 = 15, n2 = 12, s1 = 3,07 dan s2 = 0,80 . Untuk selang kepercayaan
98%, α = 0,02. Dengan menggunakan interpolasi dari tabel, kita peroleh
Yang, bila disederhanakan, menjadi

HIPOTESIS
• Hipotesis statistik, disingkat hipotesis, adalah
suatu asersi (assertion) atau dugaan
(conjecture) mengenai satu atau lebih populasi.
• Terdapat dua macam hipotesis
Hipotesis nol (hipotesis yang menyatakan tidak adanya
perbedaan atau tidak adanya korelasi, ditandai dengan lambang
“=“, lambang H0)
Hipotesis alternatif (negasi dari hipotesis nol, lambang
H1)

UJI DUA EKOR
nilai kritis (dicari
dari tabel statistika
daerah
kritis
daerah
kritis
daerah
penolakan
H0
daerah
penolakan H0

UJI SATU EKOR KANAN
daerah
kritis
daerah
penolakan
H0

UJI SATU EKOR KIRI
daerah
kritis
daerah
penolakan
H0

Prosedur uji hipotesis
1. Rumuskan H0 dan H1.
2. Tentukan taraf signifikansi, yaitu , yang
akan dipakai untuk uji hipotesis.
3. Pilihlah statistik uji yang cocok untuk menguji
hipotesis yang telah dirumuskan.
4. Hitunglah nilai statistik uji berdasarkan data
observasi (amatan) yang diperoleh dari
sampel. Penghitungan nilai statistik uji ini dapat dilakukan
secara manual, namun dapat pula dengan menggunakan paket
program statistik yang dewasa ini telah beredar secara luas.

Prosedur uji hipotesis
5. Tentukan nilai kritik dan daerah kritik
berdasarkan tingkat signifikansi yang telah
ditetapkan.
6. Tentukan keputusan uji mengenai H0.
Manual: Jika nilai statistik uji amatan berada di daerah
kritik, maka H0 ditolak.
Komputer: Jika p  , maka H0 ditolak.
7. Tulislah kesimpulan berdasarkan keputusan
uji
Sebaiknya, kesimpulan dirumuskan dengan bahasa sehari-hari
(bukan dalam terminologi statistik) dan koheren dengan
permasalahan yang dirumus-kan di awal penelitian.

Contoh 1
Menurut pengalaman selama beberapa tahun terakhir
ini, pada ujian matematika standar yang diberikan
kepada siswa-siswa SMU di Surakarta diperoleh
rataan 74.5 dengan deviasi baku 8.0. Tahun ini
dilaksanakan metode baru untuk dapat meningkatkan
kemampuan siswa dalam bidang studi matematika
tersebut. Setelah metode baru tersebut
dilaksanakan, secara random dari
populasinya, diambil 200 siswa untuk dites dengan
ujian matematika standar dan tenyata dari 200 siswa
tersebut diperoleh rataan 75.9. Jika diambil  =
5%, apakah dapat disimpulkan bahwa metode baru
tersebut dapat meningkatkan kemampuan siswa
dalam matematika?
µ0 σ
n
X

DK
α = 0.05
•
1.645
•
2.475

Contoh 2
• Untuk melihat apakah rataan nilai
matapelajaran Matematika siswa kelas tiga SMU
“Entah-Mana” lebih dari 65, secara random dari
populasinya, diambil 12 siswa. Ternyata nilai-
nilai keduabelas siswa tersebut adalah sebagai
berikut.
51 71 76 81 67 98 58 69 87 74
79 81
• Jika diambil  = 1% dan dengan mengasumsikan
bahwa distribusi nilai-nilai di populasi
normal, bagaimana kesimpulan penelitian
tersebut?

Contoh 3
• Seseorang ingin menunjukkan bahwa siswa wanita dan siswa pria
tidak sama kemampuannya dalam matematika. Untuk itu, ia
mengambil 12 wanita dan 16 pria sebagai sampel. Nilai-nilai mereka
adalah:
Wanita : 51 71 76 81 67 98 58 69 87 74 79 81
Pria : 68 72 77 79 68 80 54 63 89 74 66 86 77 73
74 87
• Jika diasumsikan bahwa sampel-sampel tadi diambil dari
populasi-populasi normal yang variansi-variansinya sama tetapi
tidak diketahui, dan dengan =5%, bagaimana kesimpulan
penelitian tersebut?

Kegunaan Chi‐Square:
 Uji Chi Square berguna untuk menguji hubungan atau
 pengaruh dua buah variabel nominal dan mengukur
 kuatnya hubungan antara variabel yang satu dengan
 variabel nominal lainnya (C = Coefisien of contingency).
Karakteristik Chi‐Square:
 Nilai Chi‐Square selalu positip.
 Terdapat beberapa keluarga distribusi Chi‐Square, yaitu
distribusi Chi‐Square dengan DK=1, 2, 3, dst.
 Bentuk Distribusi Chi‐Square adalah menjulur positip.

 Pengujian hipotesis kompatibilitas merupakan
suatu pengujian hipotesis untuk menentukan
apakah suatu himpunan frekuensi yang
diharapkan (frekuensi teoritis) sama dengan
frekuensi yang telah diperoleh (frekuensi
pengamatan) dari suatu distribusi.
 Jadi, dalam pengujian hipotesis kompatibilitas
merupakan pengujian kecocokan antara hasil
pengamatan (frekuensi pengamatan) tertentu
dengan frekuensi yang telah diperoleh
berdasarkan nilai harapannya (frekuensi
teoritis).

 Menentukan Formulasi Hipotesis
H0 : frekuensi pengamatan sesuai dengan frekuensi yang diharapkan.
H1 : frekuensi pengamatan tidak sesuai dengan frekuensi yang diharapkan.
 Menentukan Taraf Nyata (α) dan tabel χ2
Taraf nyata (α) dan χ2 tabel dapat ditentukan dengan derajat kebebasan (db)=
k-N.
keterangan:
k : merupakan banyaknya kejadian atau kelas,
N : merupakan banyaknya kuantitas dari hasil pengamatan yang
digunakan untuk menghitung frekuensi harapan.

 Menentukan Kriteria Pengujian
H0 diterima jika X2
hitung ≤ X2
α(k - N).
H1 ditolak jika X2
hitung > X2
α (k - N).
 Menentukan Nilai Uji Statistik
Keterangan:
f0 : merupakan frekuensi pengamatan,
fe : merupakan frekuensi harapan.
 Membuat Kesimpulan
Dalam membuat kesimpulan kita akan menentukan
apakah H0 dapat diterima atau ditolak.

 Peneliti ingin mengetahui apakah terdapat
hubungan antara jenis kelamin dengan
hobi?
Data:
Laki‐laki yang suka olah raga 27
Perempuan yang suka olah raga 13
Laki‐laki yang suka otomotif 35
Perempuan yang suka otomotif 15
Laki‐laki yang suka Shopping 33
Perempuan yang suka Shopping 27
Laki‐laki yang suka komputer 25
Perempuan yang suka komputer 25

1. Tulis Hipotesis Ha dan Ho
 Ho : χ = 0, Tidak terdapat hubungan
yang signifikan antara jenis kelamin
dengan hobi.
 Ha : χ ≠ 0, Terdapat hubungan yang
signifikan antara jenis kelamin dengan
hobi.

 3. Cari nilai Frekuensi yang diharapkan
(fe)
 Fe untuk setiap sel =
 Misal:
 fe sel pertama = = 24

 4. Isikan Nilai fe ke Dalam Tabel
Kontingensi

6. Tentukan kriteria pengujian

7. Tentukan nilai χ2 Tabel
› Taraf signifikansi (α) = 0,05.
› Df = (Baris‐1)(Kolom‐1)
= (2‐1)(4‐1)
= 3
 χ2 Tabel = 7,815

8.
KESIMPULAN:
 Tidak terdapat hubungan yang signifikan
 antara jenis kelamin dengan hobi.

 Uji kebebasan antara 2 variabel memiliki
prinsip pengerjaan yang sama dengan
pengujian beberapa proporsi.
 (Berbeda hanya pada penetapan
Hipotesis awal dan hipotesis alternatif)

A. Uji Kebebasan :
› H0 : variabel-variabel saling bebas
› H1 : variabel-variabel tidak saling bebas
B Uji Beberapa Proporsi :
› H0 : setiap proporsi bernilai sama
› H1 : ada proporsi yang bernilai tidak sama

 Bentuk umum Tabel Kontingensi → berukuran r baris x k kolom
 derajat bebas = (r-1)(k-1)
 r : banyak baris
 k : banyak kolom
 o: frekuensi observasi baris ke-i, kolom ke-j ij,
 e : frekuensi ekspektasi baris ke-i, kolom ke-j )

 Kita akan menguji kebebasan antara faktor gender (jenis kelamin)
dengan jam kerja di suatu pabrik. Tabel kontingensi dapat dibuat
sebagai berikut :
*) Nilai dalam kotak kecil adalah frekuensi ekspektasi
Perhatikan cara mendapatkan frekuensi ekspektasi!
 Apakah ada kaitan antara gender dengan jam kerja?
 Lakukan pengujian kebebasan variabel dengan taraf uji 5 %
 Ukuran Tabel Kontingensi di atas = 3 x 2 ( 3 baris dan 2 kolom)
db = (3-1)(2-1) = 2 x 1 = 2

1. H0 : Gender dan Jam kerja saling bebas
H1 : Gender dan Jam kerja tidak saling
bebas
2. Statistik Uji = χ²
3. Nilai α = 5 % = 0.05
4. Nilai Tabel χ² db = 2; α = 0.05 → χ² tabel =
5.99147
5. Wilayah Kritis : Penolakan H0 → χ² hitung >
χ²tabel
χ² hitung > 5.99147

 Kesimpulan
χ² hitung < χ² tabel (0.4755 < 5.99147)
χ² hitung ada di daerah penerimaan H0
H0 diterima, gender dan jam kerja saling bebas
 Catatan : Kesimpulan hanya menyangkut
kebebasan antar variabel dan bukan hubungan
sebab-akibat (hubungan kausal)

1. Pendahuluan
 Analisa regresi digunakan untuk mempelajari dan mengukur
hubungan statistik yang terjadi antara dua atau lebih varibel. Dalam
regresi sederhana dikaji dua variabel, sedangkan dalam regresi
majemuk dikaji lebih dari dua variabel.
 Dalam analisa regresi suatu persamaan regresi hendak ditentukan dan
digunakan untuk menggambarkan pola atau fungsi hubungan yang
terdapat antar variabel.
 Variabel yang akan diestimasi nilainya disebut variabel terikat
(dependent variable atau response variable) dan biasanya diplot pada
sumbu tegak (sumbu-y). Sedangkan variabel bebas (independent
variable atau explanatory variable) adalah variabel yang diasumsikan
memberikan pengaruh terhadap variasi variabel terikat dan biasanya
diplot pada sumbu datar (sumbu-x).
Regresi Linear

1. Pendahuluan
 Analisa korelasi bertujuan untuk mengukur
"seberapa kuat" atau "derajat kedekatan" suatu
relasi yang terjadi antar variabel.
 Analisa regresi ingin mengetahui pola relasi dalam
bentuk persamaan regresi,
 Analisa korelasi ingin mengetahui kekuatan
hubungan tersebut dalam koefisien korelasinya.
Dengan demikian biasanya analisa regresi dan
korelasi sering dilakukan bersama-sama.
Regresi Linear

1. Pendahuluan
 Dalam menentukan apakah terdapat suatu hubungan yang
logis antar variabel, terutama bila penilaian dilakukan
terhadap angka-angka statistik saja, perlu diperhatikan
beberapa hal yang berkaitan dengan masuk akal atau
tidaknya hubungan tersebut jika ditinjau dari sifat dasar
hubungan tersebut.
 Terdapat beberapa kemungkinan bentuk relasi meliputi
hubungan sebab akibat (cause-and-effect
relationship), hubungan akibat penyebab yang sama
(common-cause factor relationship) hubungan semu
(spurious relationship).
Regresi Linear

1. Pendahuluan
 Langkah pertama dalam menganalisa relasi antar
variabel adalah dengan membuat diagram pencar
(scatter diagram) yang menggambarkan titik-titik
plot dari data yang diperoleh. Diagram pencar ini
berguna untuk
 membantu dalam melihat apakah ada relasi yang
berguna antar variabel,
 membantu dalam menentukan jenis persamaan yang
akan digunakan untuk menentukan hubungan tersebut.
Regresi Linear

1. Pendahuluan
Regresi Linear
Linier positif Linier negatif

1. Pendahuluan
Regresi Linear
Curvelinier positif Curvelinier negatif

1. Pendahuluan
Regresi Linear
Curvelinier Tak tentu

2. Analisis Regresi Linear
Fungsi regresi linear dapat dinyatakan dalam hubungan matematis oleh: BXAY  .
Sebagai misal Y = 2 + 1,4X, secara teoritis bila X = 10, maka Y = 16. Pada kenyataannya
tidak demikian, sebab yang mempengaruhi Y bukan hanya X tetapi ada faktor lain yang tidak
dimasukkan dalam persamaan, faktor tersebut secara keseluruhan disebut sebagai
“kesalahan” (disturbance’s error). Adanya kesalahan ini menjadikan perkiraan menjadi tidak
akurat, selalu ada resiko yang disebabkan oleh adanya kesalahan. Kesalahan ini tidak dapat
dihilangkan sama sekali, maka resiko ini harus diperkecil sekecil mungkin dengan
memperkecil kesalahan. Dengan memperhitungkan kesalahan, regresi linear dinyatakan
sebagai  BXAY .
Regresi Linear

Asumsi yang digunakan dalam regresi linear adalah sebagai berikut:
a.   0iE
b.   22
iE
c.   0),cov(  jijiE
d. iX konstan
Untuk memperkirakan A dan B dipergunakan metode kuadrat kesalahan terkecil, dimana
Model sebenarnya :  BXAY
Model perkiraan : ebXaY 
a, b, dan e adalah penduga untuk A, B, dan 
iii ebXaY  atau )( iii bXaYe  dan  22
)(  ii
i
bXaYei
.
Regresi Linear

penurunan parsial terhadap a dan b yang sederhana diperoleh
2
2
2











i
i
i
i
i
ii
i
i
i
i
i
i
XXn
YXXXY
XbYa dan
 










i i
ii
i
i
i
i
i
ii
XXn
YXYXn
b 2
2
Regresi Linear

Gambar 2 Garis regresi linier pada diagram pencar
y
(+)
y
(+)
y
(+)
y
(+)
y
(-)
y
(-)
y
(-)
y
(-)
y
(0)
y
(0)
a
 ˆy a bx
x
y
Regresi Linear

Nilai variabel A dan B untuk populasi diberikan oleh
XBYA  dan
     
    
 
  x
xy
X
YX
XEXE
YEXEXYE
B






var
,cov
22
Bila 





   nYXYX
n
s
i i
ii
i
iixy /
1
adalah penduga untuk xy dan














  nXX
n
s
i
i
i
ix /
1
2
22
adalah penduga untuk
2
x , maka



i
i
i
ii
x
xy
x
yx
s
s
b 22
Regresi Linear

dimana 





   nYXYXyx
i i
ii
i
ii
i
ii / dan














  nXXx
i
i
i
i
i
i /
2
22
 


i
i
e
b
x
b 2
2
2
var

 dan  











i
i
ea
x
X
n
a 2
2
22 1
var 
  2
2
2
,,cov e
i
i
ba
x
X
ba 



Regresi Linear

Contoh 1
Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel
bebas x dan variabel terikat y seperti ditunjukkan dalam tabel berikut.
Uji ke- x y
1 6 30
2 9 49
3 3 18
4 8 42
5 7 39
6 5 25
7 8 41
8 10 52
 56 296
Regresi Linear

Jika berdasarkan kajian teoritis dan sifat dari fenomena yang menghubungkan x
dan y dapat diasumsikan mempunyai bentuk hubungan linier, maka persamaan
garis regresinya dapat ditentukan sebagai berikut.
Tabel perhitungan:
Uji ke- x y xy x2 y2
1 6 30 180 36 900
2 9 49 441 81 2401
3 3 18 54 9 324
4 8 42 336 64 1764
5 7 39 273 49 1521
6 5 25 125 25 625
7 8 41 328 64 1681
8 10 52 520 100 2704
 56 296 2257 428 12920
     
 56 296
7 37
8 8
x y
x y
n n
Regresi Linear

Kolom y2 ditambahkan pada tabel meskipun belum digunakan untuk perhitungan
persamaan garis regresi. Nilai tersebut akan digunakan kemudian. Jadi dengan
menggunakan hasil pada tabel, nilai dari konstanta a dan b dapat ditentukan:
    
   
 
   

  
 
2 22
8(2257) (56)(296) 1480
5,1389
2888(428) (56)
n xy x y
b
n x x
    37 (5,1389)(7) 1,0277a y bx
Jadi persamaan garis regresi linier yang menggambarkan hubungan antara
variabel x dan y dari data sampel pada percobaan/praktikum di atas adalah:
   ˆ 1,0277 5,1389y a bx x
Dengan menggunakan persamaan garis regresi yang diperoleh, maka dapat
diperkirakan hasil yang akan diperoleh (nilai y) untuk suatu nilai x tertentu.
Misalnya untuk x = 4 maka dapat diperkirakan bahwa y akan bernilai:
   ˆ 1,0277 5,1389y a bx x =1,0277 + 5,1389(4) = 21,583
Regresi Linear

y = 5.1389x + 1.0278
0
10
20
30
40
50
60
0 2 4 6 8 10 12
x
y
Gambar. Garis regresi untuk contoh soal 1
Regresi Linear

Karena variansi dari A dan B tidak diketahui maka digunakan variansi
dari a dan b yang dapat dinyatakan sebagai
222
22
2
2








 

 
n
yxby
n
xby
n
e
S i i
iii
i i
ii
i
e


i
i
e
b
x
S
S 2
2
2
dan











i
i
ea
x
X
n
SS 2
2
22 1
Regresi Linear

Regresi Linear
x x
y y
(a)x (b)x
Derajat variasi sebaran data

Dengan menggunakan data dan tabel perhitungan pada contoh 1, maka standard
error estimasi dari garis regresi yang diperoleh adalah:
      


 
 

  2
,
2
(11,920) 1,0277(296) 5,1389(2,257)
1,698
8 2
y x
y a y b xy
s
n
Regresi Linear

3. Uji Koefisien dan Korelasi
Untuk melihat pengaruh X terhadap Y, maka dilakukan pengujian pada koefisien regresi
B. Bila X tidak mempengaruhi Y maka B = 0, bila ada pengaruh negatif B < 0, ada pengaruh
positif B > 0, dan bila ada pengaruh X terhadap Y maka B  0. Perumusan untuk pengujian
koefisien regresi B, adalah:
a. Ho : B = 0
b. H1 : B > 0 (ada pengaruh X terhadap Y positif)
H1 : B < 0 (ada pengaruh X terhadap Y negatif)
H1 : B 0 (ada pengaruh X terhadap Y)
c. Dengan diketahui, dari tabel distribusi-t maka dapat dihitung t untuk pengujian satu
arah dan
2
t untuk pengujian dua arah.
d. Tentukan statistik uji (tb) yang diberikan oleh
b
o
b
s
Bb
t

 ;  
 

n
x
x
s
s
xy
b 2
2
,
)(
e. Simpulkan, tolak Ho atau terima Ho.
Regresi Linear

Pendugaan Parameter Regresi
Dari nilai  atau derajat kepercayaan (1 -  ) yang telah ditentukan, interval
pendugaan parameter A dan B dapat ditentukan, yang diberikan masing-masing oleh:
bb stbBstb
22
  dan
aa staAsta
22
 
Regresi Linear

Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan hasil
perhitungan standard error estimasi dari garis regresi yang diperoleh pada contoh 12,
maka uji kemiringan (slope) garis regresi dapat dilakukan sebagai berikut:
1. Hipotesis:
Ho : B = 0
H1 : B  0
2. α = 0.05
3. Digunakan distribusi t0,025 dengan df = n - 2 = 8 - 2 = 6
4. Batas-batas daerah penolakan uji dua ujung (two-tailed)
Dari tabel distribusi t batas kritis adalah = tcr = 2,447
5. Aturan keputusan:
Tolak H0 dan terima H1 jika perbedaan yang terstandard antara kemiringan
sample (b) dan kemiringan populasi yang dihipotesiskan (BHo) kurang dari -
2,447 atau lebih dari 2,447. Jika sebaliknya terima H0
Regresi Linear

6. Rasio Uji
     
   



,
2 2
2
1,698 1,698
0,283
656
428
8
y x
b
s
s
x
x
n
 
   
5,1389 0
18,159
0,283
oH
t test
b
b B
RU t
s
7. Pengambilan keputusan
Karena RUt = 18,159 bernilai jauh lebih besar daripada nilai batas tcr = 2,447,
maka H0: B = 0 ditolak. Hal ini bahwa hipotesis alternatif yang menyatakan
bahwa terdapat kemiringan pada garis regresi untuk populasi serta suatu
hubungan regresi yang berarti benar-benar ada antara variabel X dan Y.
Kesimpulan diatas dapat juga diperkuat dengan menentukan perkiraan interval
nilai B dengan tingkat kepercayaan 95 persen sebagai:
b - t(sb) < B < b - t(sb)
5,1389 - 2,447(0,283) < B < 5,1389 + 2,447(0,283)
4,4464 < B < 5,8314

Dengan menganggap nilai variable terikat, y yang sesungguhnya terdistribusi
normal di sekitar garis regresi maka suatu estimasi interval dapat diperoleh sebagai:
  ,
ˆ y xy z s
Dalam relasi ( z adalah skor z yang akan menentukan tingkat kepercayaan dari
penerimaan estimasi interval yang dilakukan. Gambar 7 mengilustrasikan estimasi
interval untuk z = 2.
Gambar 7 Interpretasi dan aplikasi estimasi interval untuk sampel besar
x
y ˆy
 ,3 y xs
 ,3 y xs
1x
1
ˆy1 ,
ˆ 2 y xy s

Untuk Sampel Kecil (n < 30)
a. Prediksi Kisaran Nilai Rata-rata y Jika Diketahui x
Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan
rumus berikut:
 
   

 
 
   
 
  


2
/2 , 2
2
1
ˆ
g
y x
x x
y t s
n x
x
n
dimana:
ˆy = estimasi titik yang dihitung dengan persamaan regresi untuk nilai x tertentu
tα/2 = nilai t untuk α/2 ( =tingkat kepercayaan) dengan derajat kebebasan n-2
xg = nilai x yang ditentukan
n = jumlah observasi pasangan pada sampel
Regresi Linear

b. Prediksi Kisaran Nilai Spesifik y Jika Diketahui x
Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan
rumus berikut:
 
   

 
 
    
 
  


2
/2 , 2
2
1
ˆ 1
g
y x
x x
y t s
n x
x
n
Regresi Linear

 Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan persamaan
garis regresi yang dihasilkan serta nilai sy,x pada contoh 2 , dapat diprediksi
dengan tingkat kepercayaan 95 persen dan derajat kebebasan = n - 2 = 8 -2 = 6,
untuk x = 4,
 
   
 
 

 
 
   
 
  
    
 
 


2
/2 , 2
2
2
2
1
ˆ
4 71
21,583 2,447 1,698
8 428 56 8
g
y x
x x
y t s
n x
x
n
Jadi dengan derajat kepercayaan 95 persen diperoleh: 19,038 < ˆy < 24,128
Regresi Linear

4. Analisis Korelasi
Sebelum dilakukan analisa regresi, langkah yang biasa ditempuh adalah melakukan
analisa korelasi yang ditujukan untuk mengetahui erat tidaknya hubungan antar variabel.
Pada analisa regresi, untuk observasi Y diasumsikan bahwa X adalah tetap konstan dari
sampel ke sampel. Interpretasi koefisien korelasi untuk mengukur kuatnya hubungan antar
variabel tergantung pada asumsi yang digunakan untuk X dan Y. Bila X dan Y bervariasi
maka koefisien korelasi akan mengukur “covariability (kesamaan variasi)” antara X dan Y. Di
dalam analisa regresi, koefisien korelasi digunakan untuk mengukur “cocok/tepat (fitness)”
garis regresi sebagai pendekatan data observasi. Besarnya koefisien korelasi dinyatakan
sebagai
yx
xy
yx
YX



 
),cov(
Dalam prakteknya,  tidak diketahui tetapi nilainya dapat diestimasi berdasar data sampel.
Bila r adalah penduga  , dengan r dinyatakan sebagai
  


















i i
ii
i i
ii
i
i
i
i
i
ii
i
i
i
i
i
ii
YYnXXn
YXYXn
yx
yx
r
2
2
2
2
Regresi Linear

Pengujian hipotesis tentang  dilakukan dengan langkah-langkah sebagai berikut
a. Ho :  = 0 (tidak ada hubungan antara X dan Y)
H1 :  > 0 (ada hubungan positif)
H1 :  < 0 (ada hubungan negatif)
H1 :   0 (ada hubungan)
Apabila  = 0, maka variansi r diberikan oleh
2
1
)var(
2
2



n
r
r r
Dimana r2
disebut sebagai koefisien determinasi untuk mengukur besarnya kontribusi X
terhadap variasi Y
b. Dengan diketahui, dari tabel distribusi-t maka dapat dihitung )2( nt untuk pengujian
satu arah dan
)2(
2
n
t untuk pengujian dua arah.
c. Tentukan statistik uji (tb) yang diberikan oleh
2
1
2
r
nr
tr


 dengan derajat kebebasan n
d. Simpulkan, tolak Ho atau terima Ho.
Regresi Linear

 Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan persamaan
garis regresi yang dihasilkan dapat diperoleh koefisien determinasi dan koefisien
korelasi sebagai berikut. Dari persamaan regresi a = 1,0277 dan b = 5,1389.
Jumlah pasangan pengamatan n = 8. Maka:
     
   
     
 
 


 
 

 

2
2
2 2
2
2
1,0277 296 5,1389 2257 8 37
0,982
11920 8 37
a y b xy n y
r
y n y
   0,982 0,991r
Regresi Linear

Hubungan antara koefisien regresi b dengan koefisien korelasi r dinyatakan oleh
x
y
s
s
rb  dimana   
i
iy YY
n
s
21
dan   
i
ix XX
n
s
21
.
Regresi Linear

Dalam statistika seringkali menduga nilai rata-rata Y pada nilai X tertentu. Telah
ditunjukkan bahwa bXaY ˆ adalah penduga E(Y|X). Misalkan oYˆ adalah nilai Yˆ pada X =
Xo, maka
         oooooo XYEBXAXbEaEbXaEYE |ˆ 
Interval penduga E(Yo|Xo) dengan tingkat keyakinan  1 diberikan oleh
 
     
 




 2
2
2/2
2
2/
1
|
1
i
o
eooo
i
o
eo
X
XX
n
stbXaXYE
X
XX
n
stbXa 
Interval penduga untuk individu Yo pada X = Xo diberikan oleh
 
   
 




 2
2
2/2
2
2/
11
i
o
eoo
i
o
eo
X
XX
n
stbXaY
X
XX
n
stbXa 
Regresi Linear

5. Regresi Linear Non Linear
Tidak selamanya hubungan antara X dan Y dapat bersifat linear, akan tetapi bisa juga
non linear. Metode kesalahan kuadrat terkecil dapat pula digunakan untuk menentukan
parameter sebagai koefisien pada hubungan yang non linear. Bentuk-bentuk hubungan non
linear dapat didekati/ditransformasi sebagai hubungan linear, Tabel 11.1. adalah beberapa
bentuk transformasi dari non linear menjadi linear oooo XBAY  .
Tabel 11.1. Hubungan Koefisien Non Linear Dengan Hasil Transformasi Linear
Persamaan Hasil Transformasi oooo XBAY 
Persamaan Asal
oY oA oB oX
B
AXY  Ylog Alog Xlog
X
B
AY 
Y A B
X
1
BX
AeY  Yln Aln B X
X
ABY  Ylog Alog Blog X
Regresi Linear

BAB VII
ANOVA
(Analisis Of Varians)

ANOVA
Anova berfungsi untuk menguji lebih dari 2
rata-rata. Tabel yang digunakan pada Anova
adalah tabel distribusi-F
Anova terbagi menjadi 2 :
- Anova One Way
- Anova Two Way

Kegunaan ANOVA
• Mengendalikan 1 atau lebih variabel independen
▫ Disebut dgn faktor (atau variabel treatment)
▫ Tiap faktor mengandung 2 atau lebih level
(kategori / klasifikasi)
• Mengamati efek pada variabel dependen
▫ Merespon level pada variabel independen
• Perencanaan Eksperimen: perencanaan dengan
menggunakan uji hipotesis

ANOVA
• Asumsi :
1. Data berdistribusi normal
2. Skala pengukuran minimum interval
3. Variasi homogen
4. Pengambilan sampel acak dan
independent

Anova One Way
(Complete Random Design / CRD)
Pengertian :
Dipengaruhi satu faktor yang terdiri dari beberapa
level.
Misalnya, mengukur kesuburan tanaman dengan
faktor pupuk. Jadi tiap pot memiliki tingkat
kesuburan tanah yang sama namun pupuknya
berbeda, dari pernyataan tersebut dapat dilihat
bahwa kesuburan tanaman hanya dipengaruhi
oleh satu faktor saja, yaitu pupuk

Anova One Way
• Model Matematik
Dimana:
µ = Mean
= efek perlakuan ke-j
~ IIDN(0,σ)
= Hasil Observasi

Prosedur analisis variansi adalah
• Menentukan H0 dan H1.
H0 : 1 = 2 = 3 = ……= k
H1 : paling sedikit dua diantara rata-rata tersebut
tidak sama
• Menentukan taraf nyata .

• Uji statistik (tabel Anova):
1k
1
2
1


k
JKA
S
2
2
1
S
S
)1( nk
)1(
2


nk
JKG
S
Sumber
Variasi
Jumlah
Kuadrat
Derajat Bebas Rata-rata
Kuadrat
F hitungan
Perlakuan JKA
Galat JKG
Total JKT 1nk
nk
T
n
T
JKA
k
i
i 2
..1
2
.

  

k
i
n
j
ij
nk
T
yJKT
1 1
2
..2 JKAJKTJKG 

Analisis Variansi Dua Arah
• Untuk menentukan apakah ada variasi dalam
pengamatan yang diakibatkan oleh perbedaan dalam
perlakuan, uji hipotesisnya adalah :
▫ H0 : 1. = 2. = … = k. atau bisa dituliskan H0 : 1 = 2 = … =
k
▫ H1 : paling sedikit dua diantaranya tidak sama
• Untuk menentukan apakah ada variasi dalam
pengamatan yang diakibatkan oleh perbedaan dalam
blok, uji hipotesisnya adalah :
▫ H0 : .1 = .2 = … = .b atau bisa dituliskan H0 : 1 = 2 = … = b
▫ H1 : paling sedikit dua diantaranya tidak sama

• Tabel Anova:
1k
1
2
1


k
JKA
S
2
2
1
1
S
S
F 
1b
1
2
2


b
JKB
S
2
2
2
2
S
S
F 
)1)(1(  bk
)1)(1(
2


bk
JKG
S
1bk
Sumber Variasi
Jumlah
Kuadrat
Derajat Bebas Rata-rata Kuadrat F hitung
Perlakuan JKA
Blok JKB
Galat JKG
Total JKT
bk
T
yJKT
k
i
b
j
ij
2
1 1
2 ..
  
bk
T
b
T
JKA
k
i
i 2
..1
2
.


bk
T
k
T
JKB
b
j
j 2
..1
2
.


JKBJKAJKTJKG 

Daerah kritis :
H0 ditolak pada taraf keberartian  jika
F1 >
H0 ditolak pada taraf keberartian  jika
F2 >
)]1)(1(,1[;  bkkf
)]1)(1(,1[;  bkbf

Uji Kesamaan Beberapa Variansi
• Analisis variansi satu arah hanya
dapat dilakukan apabila variansi dari
k-populasi adalah sama (homogen).
• Bila syarat tersebut tidak
dipenuhi, maka uji analisis variansi
tidak dapat dilakukan

Statistika

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to Statistika

Similar to Statistika (20)

Recently uploaded

Recently uploaded (20)

Statistika