Teks tersebut membahas tentang statistika inferensia yang menganalisis atau mensintesa data untuk menggeneralisasi sampel terhadap populasi, mengestimasi parameter, menguji hipotesa, dan membuat prediksi untuk menghasilkan informasi dan kesimpulan. Metode pengujian hipotesa secara statistik digunakan untuk membentuk kesimpulan mengenai populasi berdasarkan sampel yang diambil.
2. Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
2
4. Statistika Inferensia
Statistika inferensia adalah cabang statistika yang
menganalisa atau mensintesa data untuk
menggeneralisasi sampel terhadap populasi,
mengestimasi parameter, menguji hipotesa, menilai
relasi, dan membuat prediksi untuk menghasilkan
informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical tools)
yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
4
5. Statistika Inferensia
5
Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel
SAMPLING
INFERENSI
Parameter :
N (banyaknya anggota populasi),
μ (rata-rata populasi),
σ (simpangan baku populasi),
π (proporsi populasi)
Statistik :
n (banyaknya anggota sampel),
ẋ (rata-rata sampel),
s (simpangan baku sampel),
p (proporsi sampel)
6. Tipe Data
Data Nominal, data yang hanya berupa simbol (meski berupa
angka) untuk membedakan nilainya tanpa menunjukkan tingkatan
Data Ordinal, data yang mempunyai nilai untuk menunjukkan
tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan.
Data Interval, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya
untuk menunjukkan titik acuan (baseline).
Data Rasio, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala indikasi rasio perbandingan. Nilai nol
menunjukkan titik asal (origin) yang bernilai kosong (null).
6
7. Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free)
7
8. Tipe Data
Data Diskrit, data hasil pencacahan atau
penghitungan, sehingga biasanya dalam angka
bilangan bulat.
Data Kontinyu, data hasil pengukuran yang
memungkinkan dalam angka bilangan nyata
(meskipun dapat pula dibulatkan)
8
9. Statistika Alat Bantu Problem Solving
9
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan
10. Statistika Alat Bantu Problem Solving
10
Metode statistika bukan
ramuan sihir
Alat statistika bukan
tongkat sihir
12. Akurasi dan Presisi
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian
pengukuran dari alat pengukur, atau ketersebaran
yang relatif mengumpul (variansi atau deviasi kecil)
12
13. Akurat dan Presisi
Tidak presisi, akibat pola sebaran sampel
lebih melebar daripada pola sebaran
populasi menyebabkan deviasi yang besar.
Tidak akurat, akibat pergeseran
pemusatan sampel menjauh dari
pemusatan populasi menyebabkan bias
yang besar.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
13
14. Kesalahan Pengambilan Kesimpulan
Galat tipe 1 () : kesalahan menyimpulkan karena
menolak hipotesa yang semestinya diterima
Galat tipe 2 () : kesalahan menyimpulkan karena
menerima hipotesa yang semestinya ditolak
14
15. Kesalahan Pengambilan Kesimpulan
15
The true state of nature
Decision H0 is true H0 is false
Reject H0 Type I error Exact decision
Fail to reject H0 Exact decision Type II error
The true state of nature
Decision H0 is true H0 is false
Reject H0 1 –
Fail to reject H0 1 –
16. Ukuran Ketelitian Pendugaan
Tingkat keberartian (significance level, ), probabilitas
penolakan data observasi, karena menyimpang signifikan terhadap
sasaran.
Tingkat kepercayaan (confidence coefficient,1-), persentase
data observasi yang diyakini tidak berbeda signifikan dengan target.
Kuasa statistik (power,1-), persentase data observasi yang
diyakini berbeda signifikan dengan target.
Derajat kebebasan (degree of freedom, df=n-k), besaran
yang menunjukkan bebas terhadap bias dari n data observasi.
16
24. Hipotesa
Hipotesa adalah pernyataan sebuah pendugaan (presumption),
anggapan (claim), pemikiran (postulate), penegasan (assertion), atau
penerkaan (conjecture), yang mungkin benar atau salah, mengenai
data dan statistik dari satu atau lebih sampel yang berkenaan dengan
parameter dari satu atau lebih populasi
Hipotesa berkaitan dengan
Evaluasi keputusan
Analisa data observasi atau eksperimen
Prediksi statistik
Estimasi parameter
Pengujian
Komparasi perbandingan
24
25. Hipotesa
Hipotesa statistik diformulasikan dalam dua bentuk,
yaitu :
Hipotesa nol (null hypothesis), dinotasikan Ho (dibaca “H-naught”)
dengan format persamaan atau menggunakan tanda baca “=“
Hipotesa alternatif (alternative hypothesis), dinotasikan H1 (dibaca
“H-one”) dengan format pertidaksamaan.
Dua arah (two tail) menggunakan tanda baca “”
Satu arah (one tail) menggunakan tanda baca “<“ atau “>”
25
26. Pengujian Hipotesa
Pengujian hipotesa (hypothesis testing) adalah
prosedur menggunakan informasi dalam sampel acak dari
sebuah populasi dan probabilitasnya (termasuk distribusinya)
melalui pengujian statistik untuk membentuk keputusan atau
kesimpulan secara induksi atau inferensia menggeneralisasi
terhadap populasinya.
26
27. Pengujian Hipotesa
Daerah penolakan atau kritis (critical region) yaitu
daerah yang mencakup semua nilai yang memenuhi hipotesa
alternatif.
Daerah penerimaan (acceptance region) yaitu daerah
yang mencakup semua nilai yang memenuhi hipotesa nol.
Nilai kritis (critical value) yaitu nilai yang menjadi batas
antara daerah penolakan dan penerimaan.
Kesimpulan menolak Ho, jika statistik uji < nilai kritis kiri (left-
tailed) atau statistik uji > nilai kritis kanan (right tailed)
27
29. Kesimpulan Pengujian Hipotesa
Menerima hipotesa nol (lebih tepatnya “gagal menolak
hipotesa nol”) menyatakan bahwa data sampel tidak
mampu memberikan bukti yang cukup dan signifikan untuk
menolaknya.
Menolak hipotesa nol menyatakan bahwa data sampel
memberikan bukti yang cukup dan signifikan untuk
menolaknya.
29
31. P-Value
P-value adalah tingkat signifikansi terrendah di mana nilai
observasi dari statistik uji signifikan.
P-value merupakan tingkat signifikansi terrendah yang
menandakan batas penolakan hipotesa nol dari data
observasi.
Penggunaan pendekatan P-value sebagai alat bantu
pengambilan keputusan sedikit lebih natural, dan hampir
semua software statistik menyertakan P-value bersama nilai
statistik uji.
Kesimpulan menolak Ho, jika P-value < α
31
33. Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
2. Formulasi hipotesa
3. Memilih uji statistik
4. Menentukan tingkat keberartian
5. Membangun daerah keputusan
6. Menghitung statistik uji
7. Menarik kesimpulan
33
34. Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
Berdasarkan masalah yang menjadi fokus studi, untuk
menentukan parameter of interest sebagai tujuan
pengujiannya.
34
Tujuan pengujian hipotesa berawal dari maksud mempelajari sistem atau
menjawab permasalahan. Tujuan menjadi dasar utama dalam menentukan
populasi, memilih sampel, mengambil data dan mengujinya untuk memperoleh
kesimpulan yang selaras dengan tujuan tersebut.
35. Langkah Pengujian Hipotesa
2. Formulasi hipotesa
Hipotesa diformulasikan berdasarkan praduga yang
dirumuskan sesuai dengan tujuan. Praduga tidak selalu
menjadi hipotesa nol, bahkan lebih diutamakan praduga
direfleksikan pada hipotesa alternatif.
35
Hipotesa alternatif H1 biasanya merepresentasikan permasalahan yang akan
dijawab atau teori yang akan diuji, sehingga formulasi spesifik menjadi krusial.
Hipotesa nol H0 menyatakan status quo atau equality yang meniadakan
(nullifies) atau berlawanan (opposes) H1 dan menjadi complement dari H1 yang
bersifat mutually exclusive. Penggunaan format pertidaksamaan dengan tanda
pengujian satu arah memberikan deskripsi lebih spesifik pada H1.
36. Langkah Pengujian Hipotesa
3. Memilih uji statistik
Uji statistik dalam statistik inferensia dikelompokkan
menjadi dua, uji parametrik (berdistribusi) dan uji
nonparametrik. Uji statistik yang dipilih harus disesuaikan
dengan tujuan pengujian, hipotesa dan data (evidence)
yang diuji.
36
Uji parametrik mempertimbangkan tipe data dan distribusi data.
Pendekatan distribusi normal terkadang dapat dipergunakan dengan merujuk
Central Limit Theorem dan Law of Large Number
37. Langkah Pengujian Hipotesa
4. Menentukan tingkat keberartian
Tingkat keberartian (terkadang juga disebut taraf nyata atau
tingkat ketelitian) menunjukkan luas daerah penolakan.
Tingkat keberartian sebenarnya juga menunjukkan
besarnya peluang terjadinya galat tipe I.
37
Semakin besar nilai tingkat keberartian semakin besar peluang galat tipe 1.
Sebaliknya semakin kecil nilainya semakin kecil pula peluang galat tipe 1, tetapi
juga semakin besar peluang galat tipe 2, bukannya bermakna semakin teliti.
Peluang galat tipe 2 beririsan dengan daerah penerimaan, sehingga sebenarnya
peluang galat tipe 2 tidak sama besar dengan satu dikurangi peluang galat tipe 1.
38. Langkah Pengujian Hipotesa
5. Membangun daerah keputusan
Daerah keputusan terbagi menjadi dua, yaitu daerah
penolakan dan daerah penerimaan. Di antara kedua daerah
tersebut dibatasi oleh nilai kritis. Nilai kritis diperoleh
berdasarkan tingkat keberartian, dan distribusi (termasuk
parameter) yang dipergunakan dalam uji statistik.
38
Semakin besar nilai tingkat keberartian semakin luas daerah penolakan
(semakin besar peluang galat tipe 1).
Sebaliknya semakin kecil nilainya semakin luas daerah penerimaan (semakin
besar peluang galat tipe 2), bukannya bermakna semakin teliti.
39. Langkah Pengujian Hipotesa
6. Menghitung statistik uji
Perhitungan statistik uji berdasarkan uji statistik yang dipilih
dan distribusi (termasuk parameter) yang dipergunakan.
Hasil perhitungan statistik uji tergantung kecukupan,
sebaran, kevalidan dan kesesuaian data.
39
Data yang keliru akan memberikan hasil yang keliru (garbage in garbage out)
Uji statistik yang keliru memberikan hasil yang keliru (failure makes inappropriate
result). Periksa datanya, pahami uji statistik yang dipilih, pelajari distribusi yang
dipergunakan, dan pastikan sesuai dengan tepat.
40. Langkah Pengujian Hipotesa
7. Menarik kesimpulan
Kesimpulan ditarik berdasarkan hasil perhitungan statistik
uji, apakah berada di daerah penerimaan atau daerah
penolakan.
40
The truth or falsity of a statistical hypothesis is never known with absolute
certainty unless we examine the entire population. It should be made clear that
the decision procedure must include an awareness of the probability of a wrong
conclusion.
41. Kekeliruan Yang Kerapkali Terjadi
Menggunakan data yang salah.
Data yang tidak tepat.
Distribusi (termasuk parameter) yang keliru.
Kesalahan dalam sampling.
Kesalahan dalam pengukuran.
Memilih pengujian yang salah.
Tidak sesuai dengan tujuan studi.
Formulasi hipotesa keliru.
Tidak sesuai dengan hipotesa.
41
42. Kekeliruan Yang Kerapkali Terjadi
Membangun daerah keputusan yang salah.
Tingkat keberartian yang tidak tepat.
Kurang memperhatikan sebaran data yang berdampak
pada kurtosis dan skewness.
Terlalu ketat / longgar terhadap peluang galat.
Menarik kesimpulan yang salah.
Tidak berpijak kembali pada data (evidence) dan
hipotesa.
Analisa yang kurang lengkap dan keliru.
42
44. Fungsi Probabilitas Distribusi Normal
Parameter (mean) dan (standard deviation)
Probability Density Function, f(x)
Cummulative Distribution Function, F(x)
44
2
)
2
/(
)
(
.
2
)
(
2
2
x
e
x
f
f(x)
F(x)
x
di
i
f
x
F )
(
)
(
where erf is the error function
46. Distribusi Standard Normal
Distribusi Standard Normal adalah distribusi normal
yang mempunyai parameter = 0 dan = 1
Distribusi Standard Normal juga disebut dengan
Distribusi Z.
46
47. Fungsi Distribusi Standard Normal
Parameter (mean) dan (standard deviation)
Probability Density Function, f(x)
Cummulative Distribution Function, F(x)
47
2
)
(
2
/
2
x
e
x
f
f(x)
F(x)
x
di
i
f
x
F )
(
)
(
where erf is the error function
52. Cara membaca Tabel Z
52
z0 = -1.65
P(Z<-1,65) = 0,049471
dan
P(Z>-1,65) = 1 - 0,049471
= 0,950529
z0 = 1.28
P(Z<1,28) = 0,899727
dan
P(Z>1,28) = 1 - 0,899727
= 0,100273
Zα = - Z(1 - α)
jika α semakin besar maka
P(Z < zα) semakin besar dan
P(Z > zα) semakin kecil
53. Cara membaca Tabel Z
Nilai z0 saat P(Z < z0) = 0,05
Nilai z0 saat P(Z < z0) = 0,90
53
z0 = -1,65 + (
(0,05 – 0,049471)
X (-1,64 – (-1,65)))
(0,050503 – 0,049471)
= -1,65 + ( 0,5126 X 0,01)
= -1,644874
z0 = 1,28 + (
(0,90 – 0,899727)
X (1,29 – 1,28))
(0,901475 – 0,899727)
= 1,28 + ( 0,1562 X 0,01)
= 1,281562
54. Cara membaca Tabel Z
Nilai P(Z < z0) saat z0 = -1,645
Nilai P(Z < z0) saat z0 = 1,285
54
P-value = 0,049471 + (
(-1,645 – (-1,65))
X (0,050503 – 0,049471))
(-1,64 – (-1,65))
= 0,049471 + ( 0,5 X 0,001032)
= 0,049987
P-value = 0,899727 + (
(1,285 – 1,28)
X (0,901475 – 0,899727))
(1,29 – 1,28)
= 0,899727 + ( 0,5 X 0,001748)
= 0,900601
55. Distribusi Student’s t
Distribusi Student’s t adalah sebaran variabel acak
yang merupakan model gabungan variabel acak
X berdistribusi Standard Normal yang mempunyai
parameter =0 dan =1 dengan variabel acak Y
berdistribusi Chi square dengan derajat bebas sebesar
yang mempunyai parameter =/2 dan =2.
55
Y
X
56. Fungsi Distribusi Student’s t
Parameter (degree of freedom)
Probability Density Function, f(x)
Cummulative Distribution Function, F(x)
56
)
(x
f
f(x)
F(x)
)
(x
F
where 2F1 is the hypergeometric function
57. Parameter Distribusi Student’s t
Dinotasikan dengan t(x;)
Parameter (degree of freedom)
Mean
Variance
57
0
2
2
59. Cara membaca Tabel t
59
t0,05;9 = 1.833
α=0,05 df=9
tα = - t(1 - α)
left-tailed (negative)
P(t<-1,833) = 0,05
dan
right tailed (positive)
P(t>1,833) = 0,05
t0,10;10 = 1.372
α=0,10 df=10
left-tailed (negative)
P(t<-1,372) = 0,05
dan
right tailed (positive)
P(t>1,372) = 0,05
jika α semakin besar maka
P(t < tα) semakin kecil dan
P(t > tα) semakin besar
60. Cara membaca Tabel t
Nilai t0 saat P(t < t0) = 0,05 atau P(t > t0) = 0,95 dengan df = 9
Nilai t0 saat P(t < t0) = 0,90 atau P(t > t0) = 0,10 dengan df = 9
60
t0 = -1.833
t0 = 1.383
61. Cara membaca Tabel t
Nilai P(t < t0) saat t0 = -2 dengan df = 9
Nilai P(t > t0) saat t0 = 1,5 dengan df = 9
61
P-value = 0,025 + (
(-2 – (-2,262))
X (0,05 – 0,025))
(-1,833 – (-2,262))
= 0,025 + ( 0,6107 X 0,025)
= 0,040268
P-value = 0,05 + (
(1,5 – 1,883)
X (0,1 – 0,05))
(1,383 – 1,883)
= 0,05 + ( 0,74 X 0,05)
= 0,087
101. Uji Hipotesa Rata-Rata dgn MS Excel
101
Parameter P-value Test Table of
Left-tailed Right-tailed Statistics Distribution
Single sample
2 known with
DataRange
1-
ZTEST(DataRan
ge;0;)
ZTEST(DataRan
ge;0;)
NORMSINV(PVal
ue)
NORMSINV()
Single sample
2 known with
sample mean
NORMDIST(XBa
r;0;/SQRT(n);T
RUE)
1-
NORMDIST(XBa
r;0;/SQRT(n);T
RUE)
NORMSINV(PVal
ue)
NORMSINV()
Single sample
2 unknown with
DataRange
TDIST(ABS(Test
Stat);df;TailType)
TDIST(TestStat;
df;TailType)
(Average(DataRa
nge)-0)/
(STDEV(DataRa
nge)/SQRT(n))
TINV(;df)
Single sample
2 unknown with
sample mean
TDIST(ABS(Test
Stat);df;TailType)
TDIST(TestStat;
df;TailType)
(XBar-0)/
(StdDev/SQRT(n
))
TINV(;df)
102. Uji Hipotesa Rata-Rata dgn MS Excel
102
Parameter P-Value Test Table of
Left-tailed Right-tailed Statistics Distribution
Two samples
2 known with
DataRange
1-ZTEST(
DataRange of
differences;D0;
D)
ZTEST( Data
Range of
differences;D0;
D)
NORMSINV(P-
Value)
NORMSINV()
Two samples
2 known with
sample mean
NORMSDIST(Te
stStat)
1-
NORMSDIST(Te
stStat)
(XBar1-XBar2-
D0)/
SQRT((Var1/n1)
+(Var2/n2))
NORMSINV()
Two samples
2 unknown
TTEST(Data
Range1;Data
Range2;Tail
Type;TestType)
TTEST(Data
Range1;Data
Range2;Tail
Type;TestType)
TINV(P-Value;
df)
TINV(;df)
TestType: 1:paired test; 2:equal
variance; 3:unequal variance
103. Uji Hipotesa Rata-Rata dgn MathCAD
103
Parameter Test Significance Level Table of
Statistics Left-tailed Right-tailed Distribution
Single sample
2 known
or pnorm(XBar,0,
)
1- pnorm(XBar,
0,)
qnorm(,0,)
pnorm(z,0,1) 1- pnorm(z,0,1) qnorm(,0,1)
Single sample
2 unknown
or pt(t,df) 1- pt(t,df) qt(,df)
Statistika dapat menjadi alat bantu dalam menyelesaikan masalah. Mulai dari saat mengumpulkan data, mengolah, menginterpresikan, menganalisa dan mensitesanya. Namun saat keliru menetapkan populasi atau keliru memilih sampel, serta keliru mendeskripsikan variabel yang akan diambil datanya, melalaikan tujuan penelitian, maka hasil pengolahannyapun akan menjadi sampah. Demikian pula meskipun data yang diambil benar dan representatif, namun metode dan alat pengolahannya pun keliru yang dipilih atau keliru cara mempergunakannya, maka hasilnya pun akan menjadi sampah. Sehingga perlu kita pahami bahwa statistika cuma alat berbasis model matematis, ada angka dimasukkan akan mengeluarkan hasil, entah itu benar atau sampah.
Alat statistika bukan tongkat sihir, apapun dan bagaimanapun keadaan datanya dengan tongkat sihir ajaib bisa mengubahnya menjadi hasil yang sesuai dengan tujuan penelitian. Metode statistika pun bukan ramuan sihir, apapun dan bagaimanapun keadaan datanya diolah dalam ramuan sihir ajaib bisa mewujudkan hasil yang sesuai dengan tujuan penelitian.
Kesimpulan menolak Ho karena statistik uji (z=2,02) > critical value (z=1,645), atau P-value (0,0217) < alpha (0,05)
Kesimpulan menolak Ho karena statistik uji (z=3,25) > critical value (z=1,96), atau P-value (0,0012) < alpha (0,05)
Kesimpulan gagal menolak Ho karena statistik uji (t=1,80) < critical value (t=2,262), atau P-value (0,106) > alpha (0,05)
Kesimpulan menolak Ho karena statistik uji (t=2,72) > critical value (t=1,761), atau P-value (0,00864) < alpha (0,05)
Kesimpulan menolak Ho karena statistik uji (z=2,52) > critical value (z=1,645), atau P-value (0,0059) < alpha (0,05)
Kesimpulan gagal menolak Ho karena statistik uji (t=-0,35) > critical value (t=-2.145), atau P-value (0,3682) > alpha (0,05)
Kesimpulan menolak Ho karena statistik uji (t=-2,77) < critical value (t=-2.160), atau P-value (0,016) < alpha (0,05)
Kesimpulan gagal menolak Ho karena statistik uji (t=2.06) < critical value (t=2.145), atau P-value (0,06) > alpha (0,05)
Kesimpulan menolak Ho karena statistik uji (t=6.15) > critical value (t=2.306), atau P-value (0,001) < alpha (0,05)