Hypothesis
Asumsi / jawaban sementara / praduga terhadap suatu masalah atau hubungan antara dua variable yang masih harus dibuktikan kebenarannya
Hypothesis Testing
Proses membuktikan kebenaran hypothesis
Inductive Reasoning
Spesifik Umum
Deductive Reasoning
Umum Spesifik
2. Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
2
4. Statistika Inferensia
Statistika inferensia adalah cabang statistika yang
menganalisa atau mensintesa data untuk
menggeneralisasi sampel terhadap populasi,
mengestimasi parameter, menguji hipotesa, menilai
relasi, dan membuat prediksi untuk menghasilkan
informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical tools)
yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
4
5. Statistika Inferensia
5
Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel
SAMPLING
INFERENSI
Parameter :
N (banyaknya anggota populasi),
μ (rata-rata populasi),
σ (simpangan baku populasi),
π (proporsi populasi)
Statistik :
n (banyaknya anggota sampel),
ẋ (rata-rata sampel),
s (simpangan baku sampel),
p (proporsi sampel)
6. Tipe Data
Data Nominal, data yang hanya berupa simbol (meski berupa
angka) untuk membedakan nilainya tanpa menunjukkan tingkatan
Data Ordinal, data yang mempunyai nilai untuk menunjukkan
tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan.
Data Interval, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya
untuk menunjukkan titik acuan (baseline).
Data Rasio, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala indikasi rasio perbandingan. Nilai nol
menunjukkan titik asal (origin) yang bernilai kosong (null).
6
7. Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free)
7
8. Tipe Data
Data Diskrit, data hasil pencacahan atau
penghitungan, sehingga biasanya dalam angka
bilangan bulat.
Data Kontinyu, data hasil pengukuran yang
memungkinkan dalam angka bilangan nyata
(meskipun dapat pula dibulatkan)
8
9. Statistika Alat Bantu Problem Solving
9
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan
10. Statistika Alat Bantu Problem Solving
10
Metode statistika bukan
ramuan sihir
Alat statistika bukan
tongkat sihir
12. Akurasi dan Presisi
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian
pengukuran dari alat pengukur, atau ketersebaran
yang relatif mengumpul (variansi atau deviasi kecil)
12
13. Akurat dan Presisi
Tidak presisi, akibat pola sebaran sampel
lebih melebar daripada pola sebaran
populasi menyebabkan deviasi yang besar.
Tidak akurat, akibat pergeseran
pemusatan sampel menjauh dari
pemusatan populasi menyebabkan bias
yang besar.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
13
14. Kesalahan Pengambilan Kesimpulan
Galat tipe 1 () : kesalahan menyimpulkan karena
menolak hipotesa yang semestinya diterima
Galat tipe 2 () : kesalahan menyimpulkan karena
menerima hipotesa yang semestinya ditolak
14
15. Kesalahan Pengambilan Kesimpulan
15
The true state of nature
Decision H0 is true H0 is false
Reject H0 Type I error Exact decision
Fail to reject H0 Exact decision Type II error
The true state of nature
Decision H0 is true H0 is false
Reject H0 1 –
Fail to reject H0 1 –
16. Ukuran Ketelitian Pendugaan
Tingkat keberartian (significance level, ), probabilitas
penolakan data observasi, karena menyimpang signifikan terhadap
sasaran.
Tingkat kepercayaan (confidence coefficient,1-), persentase
data observasi yang diyakini tidak berbeda signifikan dengan target.
Kuasa statistik (power,1-), persentase data observasi yang
diyakini berbeda signifikan dengan target.
Derajat kebebasan (degree of freedom, df=n-k), besaran
yang menunjukkan bebas terhadap bias dari n data observasi.
16
18. Hipotesa
Hipotesa adalah pernyataan sebuah pendugaan (presumption),
anggapan (claim), pemikiran (postulate), penegasan (assertion), atau
penerkaan (conjecture), yang mungkin benar atau salah, mengenai
data dan statistik dari satu atau lebih sampel yang berkenaan dengan
parameter dari satu atau lebih populasi
Hipotesa berkaitan dengan
Evaluasi keputusan
Analisa data observasi atau eksperimen
Prediksi statistik
Estimasi parameter
Pengujian
Komparasi perbandingan
18
19. Hipotesa
Hipotesa statistik diformulasikan dalam dua bentuk,
yaitu :
Hipotesa nol (null hypothesis), dinotasikan Ho (dibaca “H-naught”)
dengan format persamaan atau menggunakan tanda baca “=“
Hipotesa alternatif (alternative hypothesis), dinotasikan H1 (dibaca
“H-one”) dengan format pertidaksamaan.
Dua arah (two tail) menggunakan tanda baca “”
Satu arah (one tail) menggunakan tanda baca “<“ atau “>”
19
20. Pengujian Hipotesa
Pengujian hipotesa (hypothesis testing) adalah
prosedur menggunakan informasi dalam sampel acak dari
sebuah populasi dan probabilitasnya (termasuk distribusinya)
melalui pengujian statistik untuk membentuk keputusan atau
kesimpulan secara induksi atau inferensia menggeneralisasi
terhadap populasinya.
20
21. Pengujian Hipotesa
Daerah penolakan atau kritis (critical region) yaitu
daerah yang mencakup semua nilai yang memenuhi hipotesa
alternatif.
Daerah penerimaan (acceptance region) yaitu daerah
yang mencakup semua nilai yang memenuhi hipotesa nol.
Nilai kritis (critical value) yaitu nilai yang menjadi batas
antara daerah penolakan dan penerimaan.
Kesimpulan menolak Ho, jika statistik uji < nilai kritis kiri (left-
tailed) atau statistik uji > nilai kritis kanan (right tailed)
21
23. Kesimpulan Pengujian Hipotesa
Menerima hipotesa nol (lebih tepatnya “gagal menolak
hipotesa nol”) menyatakan bahwa data sampel tidak
mampu memberikan bukti yang cukup dan signifikan untuk
menolaknya.
Menolak hipotesa nol menyatakan bahwa data sampel
memberikan bukti yang cukup dan signifikan untuk
menolaknya.
23
25. P-Value
P-value adalah tingkat signifikansi terrendah di mana nilai
observasi dari statistik uji signifikan.
P-value merupakan tingkat signifikansi terrendah yang
menandakan batas penolakan hipotesa nol dari data
observasi.
Penggunaan pendekatan P-value sebagai alat bantu
pengambilan keputusan sedikit lebih natural, dan hampir
semua software statistik menyertakan P-value bersama nilai
statistik uji.
Kesimpulan menolak Ho, jika P-value < α
25
27. Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
2. Formulasi hipotesa
3. Memilih uji statistik
4. Menentukan tingkat keberartian
5. Membangun daerah keputusan
6. Menghitung statistik uji
7. Menarik kesimpulan
27
28. Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
Berdasarkan masalah yang menjadi fokus studi, untuk
menentukan parameter of interest sebagai tujuan
pengujiannya.
28
Tujuan pengujian hipotesa berawal dari maksud mempelajari sistem atau
menjawab permasalahan. Tujuan menjadi dasar utama dalam menentukan
populasi, memilih sampel, mengambil data dan mengujinya untuk memperoleh
kesimpulan yang selaras dengan tujuan tersebut.
29. Langkah Pengujian Hipotesa
2. Formulasi hipotesa
Hipotesa diformulasikan berdasarkan praduga yang
dirumuskan sesuai dengan tujuan. Praduga tidak selalu
menjadi hipotesa nol, bahkan lebih diutamakan praduga
direfleksikan pada hipotesa alternatif.
29
Hipotesa alternatif H1 biasanya merepresentasikan permasalahan yang akan
dijawab atau teori yang akan diuji, sehingga formulasi spesifik menjadi krusial.
Hipotesa nol H0 menyatakan status quo atau equality yang meniadakan
(nullifies) atau berlawanan (opposes) H1 dan menjadi complement dari H1 yang
bersifat mutually exclusive. Penggunaan format pertidaksamaan dengan tanda
pengujian satu arah memberikan deskripsi lebih spesifik pada H1.
30. Langkah Pengujian Hipotesa
3. Memilih uji statistik
Uji statistik dalam statistik inferensia dikelompokkan
menjadi dua, uji parametrik (berdistribusi) dan uji
nonparametrik. Uji statistik yang dipilih harus disesuaikan
dengan tujuan pengujian, hipotesa dan data (evidence)
yang diuji.
30
Uji parametrik mempertimbangkan tipe data dan distribusi data.
Pendekatan distribusi normal terkadang dapat dipergunakan dengan merujuk
Central Limit Theorem dan Law of Large Number
31. Langkah Pengujian Hipotesa
4. Menentukan tingkat keberartian
Tingkat keberartian (terkadang juga disebut taraf nyata atau
tingkat ketelitian) menunjukkan luas daerah penolakan.
Tingkat keberartian sebenarnya juga menunjukkan
besarnya peluang terjadinya galat tipe I.
31
Semakin besar nilai tingkat keberartian semakin besar peluang galat tipe 1.
Sebaliknya semakin kecil nilainya semakin kecil pula peluang galat tipe 1, tetapi
juga semakin besar peluang galat tipe 2, bukannya bermakna semakin teliti.
Peluang galat tipe 2 beririsan dengan daerah penerimaan, sehingga sebenarnya
peluang galat tipe 2 tidak sama besar dengan satu dikurangi peluang galat tipe 1.
32. Langkah Pengujian Hipotesa
5. Membangun daerah keputusan
Daerah keputusan terbagi menjadi dua, yaitu daerah
penolakan dan daerah penerimaan. Di antara kedua daerah
tersebut dibatasi oleh nilai kritis. Nilai kritis diperoleh
berdasarkan tingkat keberartian, dan distribusi (termasuk
parameter) yang dipergunakan dalam uji statistik.
32
Semakin besar nilai tingkat keberartian semakin luas daerah penolakan
(semakin besar peluang galat tipe 1).
Sebaliknya semakin kecil nilainya semakin luas daerah penerimaan (semakin
besar peluang galat tipe 2), bukannya bermakna semakin teliti.
33. Langkah Pengujian Hipotesa
6. Menghitung statistik uji
Perhitungan statistik uji berdasarkan uji statistik yang dipilih
dan distribusi (termasuk parameter) yang dipergunakan.
Hasil perhitungan statistik uji tergantung kecukupan,
sebaran, kevalidan dan kesesuaian data.
33
Data yang keliru akan memberikan hasil yang keliru (garbage in garbage out)
Uji statistik yang keliru memberikan hasil yang keliru (failure makes inappropriate
result). Periksa datanya, pahami uji statistik yang dipilih, pelajari distribusi yang
dipergunakan, dan pastikan sesuai dengan tepat.
34. Langkah Pengujian Hipotesa
7. Menarik kesimpulan
Kesimpulan ditarik berdasarkan hasil perhitungan statistik
uji, apakah berada di daerah penerimaan atau daerah
penolakan.
34
The truth or falsity of a statistical hypothesis is never known with absolute
certainty unless we examine the entire population. It should be made clear that
the decision procedure must include an awareness of the probability of a wrong
conclusion.
35. Kekeliruan Yang Kerapkali Terjadi
Menggunakan data yang salah.
Data yang tidak tepat.
Distribusi (termasuk parameter) yang keliru.
Kesalahan dalam sampling.
Kesalahan dalam pengukuran.
Memilih pengujian yang salah.
Tidak sesuai dengan tujuan studi.
Formulasi hipotesa keliru.
Tidak sesuai dengan hipotesa.
35
36. Kekeliruan Yang Kerapkali Terjadi
Membangun daerah keputusan yang salah.
Tingkat keberartian yang tidak tepat.
Kurang memperhatikan sebaran data yang berdampak
pada kurtosis dan skewness.
Terlalu ketat / longgar terhadap peluang galat.
Menarik kesimpulan yang salah.
Tidak berpijak kembali pada data (evidence) dan
hipotesa.
Analisa yang kurang lengkap dan keliru.
36
38. Uji Parametrik dan Nonparametrik
Uji parametrik menggunakan asumsi data berdistribusi
probabilitas tertentu (i.i.d: independent and identically
distributed). Uji parametrik reliabel jika mempergunakan
distribusi probabilitas yang sesuai. Misalnya, uji-t Student
akan reliabel untuk dua sampel independen jika setiap
sampel mengikuti distribusi normal.
Uji nonparametrik (distribution-free test) menggunakan
asumsi tidak mempunyai pengetahuan mengenai distribusi
populasi data. Uji nonparametrik tidak bergantung pada
distribusi apa pun. Uji nonparametrik dapat diterapkan saat
kondisi parametrik tidak terpenuhi.
38
39. Uji Parametrik dan Nonparametrik
39
JENIS UJI UJI PARAMETRIK UJI NONPARAMETRIK
Uji rata-rata 1 sampel • Z test (σ is known),
• t test (σ is unknown)
• Sign test
• Wilcoxon signed-rank
test
Uji rata-rata 2 sampel tak
berpasangan
• Independent t test • Wilcoxon rank sum test
• Mann-Whitney U test
Uji rata-rata 2 sampel
berpasangan
• Paired t test • Sign test
• Wilcoxon signed-rank
test
Analisa varians n>2
sampel satu arah
• One-way analysis of
variance
• Kruskal-Wallis test
• Mood’s median test
Analisa varians n>2
sampel dua arah
• Two-way analysis of
variance
• Friedman test
Analisa Korelasi • Pearson’s r • Spearman’s rho (ρ)
117. Apakah bisa untuk kasus berikut?
117
Membandingkan daun
yang gugur di dua pohon
118. Apakah bisa untuk kasus berikut?
118
Membandingkan pH atau
keasaman air sumur di
dua area industri
119. Apakah bisa untuk kasus berikut?
119
Membandingkan kompetensi sumber daya
manusia terhadap standar minimal kompetensi
organisasi di level pekerjaannya?
120. Apakah bisa untuk kasus berikut?
120
Membandingkan dua alternatif keputusan
dengan multi kriteria?
Statistika dapat menjadi alat bantu dalam menyelesaikan masalah. Mulai dari saat mengumpulkan data, mengolah, menginterpresikan, menganalisa dan mensitesanya. Namun saat keliru menetapkan populasi atau keliru memilih sampel, serta keliru mendeskripsikan variabel yang akan diambil datanya, melalaikan tujuan penelitian, maka hasil pengolahannyapun akan menjadi sampah. Demikian pula meskipun data yang diambil benar dan representatif, namun metode dan alat pengolahannya pun keliru yang dipilih atau keliru cara mempergunakannya, maka hasilnya pun akan menjadi sampah. Sehingga perlu kita pahami bahwa statistika cuma alat berbasis model matematis, ada angka dimasukkan akan mengeluarkan hasil, entah itu benar atau sampah.
Alat statistika bukan tongkat sihir, apapun dan bagaimanapun keadaan datanya dengan tongkat sihir ajaib bisa mengubahnya menjadi hasil yang sesuai dengan tujuan penelitian. Metode statistika pun bukan ramuan sihir, apapun dan bagaimanapun keadaan datanya diolah dalam ramuan sihir ajaib bisa mewujudkan hasil yang sesuai dengan tujuan penelitian.
Karena mempergunakan uji dua arah, maka kita menggunakan acuan α/2 =0.025. Dalam CDF binomial F(x, n,p), untuk left tail kita dapatkan F(5,20,0.5)=0.0207 dan F(6,20,0.5)=0.0577, sehingga daerah kritis pada (X<5) karena Probabilitasnya < α/2. Untuk right tail, secara praktis sebenarnya bisa mempergunakan nilai N – X left tail. namun jika akan mencarinya maka kita memahami bahwa P(X>14) = 1 – F(13,20,0.5) dan P(X>15) = 1 – F(14,20,0.5).
Kesimpulan gagal menolak Ho karena batas daerah kritis kiri (c1=5) < X1 (r+=14) < batas daerah kritis kanan (c2=15), atau P-value (0,1153) > alpha (0,05)
Karena mempergunakan uji dua arah, maka kita menggunakan acuan α/2 =0.025. Dalam CDF binomial F(x, n,p), untuk left tail kita dapatkan F(1,10,0.5)=0.0107 dan F(2,10,0.5)=0.0547, sehingga daerah kritis pada (X<1) karena Probabilitasnya < α/2. Untuk right tail, secara praktis sebenarnya bisa mempergunakan nilai N – X left tail. namun jika akan mencarinya maka kita memahami bahwa P(X>8) = 1 – F(7,10,0.5) dan P(X>9) = 1 – F(8,10,0.5).
Kesimpulan gagal menolak Ho karena batas daerah kritis kiri (c1=1) < X1 (r+=3) < batas daerah kritis kanan (c2=9), atau P-value (0,3438) > alpha (0,05)
Kesimpulan menolak Ho karena X1 (r+=11) > batas daerah kritis kanan (c2=10), atau statistik uji Z (1.87) > Z0.95 (1.65) atau P-value (0,0307) < alpha (0,05)
Kesimpulan: gagal menolak Ho karena batas daerah kritis kiri (c1=3) < X1 (r+=9) < batas daerah kritis kanan (c2=10), atau P-value (0,1338) > alpha (0,05)
Kesimpulan: gagal menolak Ho karena batas daerah kritis kiri (c1=0) < X1 (r+=4) < batas daerah kritis kanan (c2=6), atau P-value (0,3438) > alpha (0,05)
Kesimpulan: gagal menolak Ho karena statistik uji w (60) > batas daerah kritis (52)
Kesimpulan: gagal menolak Ho karena statistik uji w (13) > batas daerah kritis (8)
Kesimpulan: menolak Ho karena statistik uji w (10.5) < batas daerah kritis (11)