Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik

Uji Nonparametrik
RATA-RATA
SATU & DUA SAMPEL
ARIF RAHMAN
1

Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
2

Statistika
3
Mengorganisasi,
Merangkum,
Menyederhanakan,
Menyajikan,
Menginterpretasikan
Menganalisa
Mensintesa
Mengumpulkan data
Menghasilkan informasi dan/atau kesimpulan
Menggeneralisasi
Mengestimasi,
Menguji hipotesa,
Menilai relasi,
Memprediksi
Menyelesaikan masalah Mengambil keputusan

Statistika Inferensia
Statistika inferensia adalah cabang statistika yang
menganalisa atau mensintesa data untuk
menggeneralisasi sampel terhadap populasi,
mengestimasi parameter, menguji hipotesa, menilai
relasi, dan membuat prediksi untuk menghasilkan
informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical tools)
yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
4

Statistika Inferensia
5
Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel
SAMPLING
INFERENSI
Parameter :
N (banyaknya anggota populasi),
μ (rata-rata populasi),
σ (simpangan baku populasi),
π (proporsi populasi)
Statistik :
n (banyaknya anggota sampel),
ẋ (rata-rata sampel),
s (simpangan baku sampel),
p (proporsi sampel)

Tipe Data
Data Nominal, data yang hanya berupa simbol (meski berupa
angka) untuk membedakan nilainya tanpa menunjukkan tingkatan
Data Ordinal, data yang mempunyai nilai untuk menunjukkan
tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan.
Data Interval, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya
untuk menunjukkan titik acuan (baseline).
Data Rasio, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala indikasi rasio perbandingan. Nilai nol
menunjukkan titik asal (origin) yang bernilai kosong (null).
6

Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free)
7

Tipe Data
Data Diskrit, data hasil pencacahan atau
penghitungan, sehingga biasanya dalam angka
bilangan bulat.
Data Kontinyu, data hasil pengukuran yang
memungkinkan dalam angka bilangan nyata
(meskipun dapat pula dibulatkan)
8

Statistika Alat Bantu Problem Solving
9
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan

Statistika Alat Bantu Problem Solving
10
Metode statistika bukan
ramuan sihir
Alat statistika bukan
tongkat sihir

Ketelitian &
Tipe Kesalahan
11

Akurasi dan Presisi
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian
pengukuran dari alat pengukur, atau ketersebaran
yang relatif mengumpul (variansi atau deviasi kecil)
12

Akurat dan Presisi
Tidak presisi, akibat pola sebaran sampel
lebih melebar daripada pola sebaran
populasi menyebabkan deviasi yang besar.
Tidak akurat, akibat pergeseran
pemusatan sampel menjauh dari
pemusatan populasi menyebabkan bias
yang besar.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
13

Kesalahan Pengambilan Kesimpulan
Galat tipe 1 () : kesalahan menyimpulkan karena
menolak hipotesa yang semestinya diterima
Galat tipe 2 () : kesalahan menyimpulkan karena
menerima hipotesa yang semestinya ditolak
14
 

Kesalahan Pengambilan Kesimpulan
15
The true state of nature
Decision H0 is true H0 is false
Reject H0 Type I error Exact decision
Fail to reject H0 Exact decision Type II error
The true state of nature
Decision H0 is true H0 is false
Reject H0  1 – 
Fail to reject H0 1 –  

Ukuran Ketelitian Pendugaan
Tingkat keberartian (significance level, ), probabilitas
penolakan data observasi, karena menyimpang signifikan terhadap
sasaran.
Tingkat kepercayaan (confidence coefficient,1-), persentase
data observasi yang diyakini tidak berbeda signifikan dengan target.
Kuasa statistik (power,1-), persentase data observasi yang
diyakini berbeda signifikan dengan target.
Derajat kebebasan (degree of freedom, df=n-k), besaran
yang menunjukkan bebas terhadap bias dari n data observasi.
16

Prinsip Dasar
Pengujian Hipotesa
17

Hipotesa
Hipotesa adalah pernyataan sebuah pendugaan (presumption),
anggapan (claim), pemikiran (postulate), penegasan (assertion), atau
penerkaan (conjecture), yang mungkin benar atau salah, mengenai
data dan statistik dari satu atau lebih sampel yang berkenaan dengan
parameter dari satu atau lebih populasi
Hipotesa berkaitan dengan
 Evaluasi keputusan
 Analisa data observasi atau eksperimen
 Prediksi statistik
 Estimasi parameter
 Pengujian
 Komparasi perbandingan
18

Hipotesa
Hipotesa statistik diformulasikan dalam dua bentuk,
yaitu :
Hipotesa nol (null hypothesis), dinotasikan Ho (dibaca “H-naught”)
dengan format persamaan atau menggunakan tanda baca “=“
Hipotesa alternatif (alternative hypothesis), dinotasikan H1 (dibaca
“H-one”) dengan format pertidaksamaan.
Dua arah (two tail) menggunakan tanda baca “”
Satu arah (one tail) menggunakan tanda baca “<“ atau “>”
19

Pengujian Hipotesa
Pengujian hipotesa (hypothesis testing) adalah
prosedur menggunakan informasi dalam sampel acak dari
sebuah populasi dan probabilitasnya (termasuk distribusinya)
melalui pengujian statistik untuk membentuk keputusan atau
kesimpulan secara induksi atau inferensia menggeneralisasi
terhadap populasinya.
20

Pengujian Hipotesa
Daerah penolakan atau kritis (critical region) yaitu
daerah yang mencakup semua nilai yang memenuhi hipotesa
alternatif.
Daerah penerimaan (acceptance region) yaitu daerah
yang mencakup semua nilai yang memenuhi hipotesa nol.
Nilai kritis (critical value) yaitu nilai yang menjadi batas
antara daerah penolakan dan penerimaan.
Kesimpulan menolak Ho, jika statistik uji < nilai kritis kiri (left-
tailed) atau statistik uji > nilai kritis kanan (right tailed)
21

Kesimpulan Pengujian Hipotesa
Menerima hipotesa nol (lebih tepatnya “gagal menolak
hipotesa nol”) menyatakan bahwa data sampel tidak
mampu memberikan bukti yang cukup dan signifikan untuk
menolaknya.
Menolak hipotesa nol menyatakan bahwa data sampel
memberikan bukti yang cukup dan signifikan untuk
menolaknya.
23

P-Value
P-value adalah tingkat signifikansi terrendah di mana nilai
observasi dari statistik uji signifikan.
P-value merupakan tingkat signifikansi terrendah yang
menandakan batas penolakan hipotesa nol dari data
observasi.
Penggunaan pendekatan P-value sebagai alat bantu
pengambilan keputusan sedikit lebih natural, dan hampir
semua software statistik menyertakan P-value bersama nilai
statistik uji.
 Kesimpulan menolak Ho, jika P-value < α
25

Langkah Pengujian Hipotesa
1. Menentukan tujuan pengujian hipotesa
2. Formulasi hipotesa
3. Memilih uji statistik
4. Menentukan tingkat keberartian
5. Membangun daerah keputusan
6. Menghitung statistik uji
7. Menarik kesimpulan
27

1. Menentukan tujuan pengujian hipotesa
Berdasarkan masalah yang menjadi fokus studi, untuk
menentukan parameter of interest sebagai tujuan
pengujiannya.
28
Tujuan pengujian hipotesa berawal dari maksud mempelajari sistem atau
menjawab permasalahan. Tujuan menjadi dasar utama dalam menentukan
populasi, memilih sampel, mengambil data dan mengujinya untuk memperoleh
kesimpulan yang selaras dengan tujuan tersebut.

2. Formulasi hipotesa
Hipotesa diformulasikan berdasarkan praduga yang
dirumuskan sesuai dengan tujuan. Praduga tidak selalu
menjadi hipotesa nol, bahkan lebih diutamakan praduga
direfleksikan pada hipotesa alternatif.
29
Hipotesa alternatif H1 biasanya merepresentasikan permasalahan yang akan
dijawab atau teori yang akan diuji, sehingga formulasi spesifik menjadi krusial.
Hipotesa nol H0 menyatakan status quo atau equality yang meniadakan
(nullifies) atau berlawanan (opposes) H1 dan menjadi complement dari H1 yang
bersifat mutually exclusive. Penggunaan format pertidaksamaan dengan tanda
pengujian satu arah memberikan deskripsi lebih spesifik pada H1.

3. Memilih uji statistik
Uji statistik dalam statistik inferensia dikelompokkan
menjadi dua, uji parametrik (berdistribusi) dan uji
nonparametrik. Uji statistik yang dipilih harus disesuaikan
dengan tujuan pengujian, hipotesa dan data (evidence)
yang diuji.
30
Uji parametrik mempertimbangkan tipe data dan distribusi data.
Pendekatan distribusi normal terkadang dapat dipergunakan dengan merujuk
Central Limit Theorem dan Law of Large Number

4. Menentukan tingkat keberartian
Tingkat keberartian (terkadang juga disebut taraf nyata atau
tingkat ketelitian) menunjukkan luas daerah penolakan.
Tingkat keberartian sebenarnya juga menunjukkan
besarnya peluang terjadinya galat tipe I.
31
Semakin besar nilai tingkat keberartian semakin besar peluang galat tipe 1.
Sebaliknya semakin kecil nilainya semakin kecil pula peluang galat tipe 1, tetapi
juga semakin besar peluang galat tipe 2, bukannya bermakna semakin teliti.
Peluang galat tipe 2 beririsan dengan daerah penerimaan, sehingga sebenarnya
peluang galat tipe 2 tidak sama besar dengan satu dikurangi peluang galat tipe 1.

5. Membangun daerah keputusan
Daerah keputusan terbagi menjadi dua, yaitu daerah
penolakan dan daerah penerimaan. Di antara kedua daerah
tersebut dibatasi oleh nilai kritis. Nilai kritis diperoleh
berdasarkan tingkat keberartian, dan distribusi (termasuk
parameter) yang dipergunakan dalam uji statistik.
32
Semakin besar nilai tingkat keberartian semakin luas daerah penolakan
(semakin besar peluang galat tipe 1).
Sebaliknya semakin kecil nilainya semakin luas daerah penerimaan (semakin
besar peluang galat tipe 2), bukannya bermakna semakin teliti.

6. Menghitung statistik uji
Perhitungan statistik uji berdasarkan uji statistik yang dipilih
dan distribusi (termasuk parameter) yang dipergunakan.
Hasil perhitungan statistik uji tergantung kecukupan,
sebaran, kevalidan dan kesesuaian data.
33
Data yang keliru akan memberikan hasil yang keliru (garbage in garbage out)
Uji statistik yang keliru memberikan hasil yang keliru (failure makes inappropriate
result). Periksa datanya, pahami uji statistik yang dipilih, pelajari distribusi yang
dipergunakan, dan pastikan sesuai dengan tepat.

7. Menarik kesimpulan
Kesimpulan ditarik berdasarkan hasil perhitungan statistik
uji, apakah berada di daerah penerimaan atau daerah
penolakan.
34
The truth or falsity of a statistical hypothesis is never known with absolute
certainty unless we examine the entire population. It should be made clear that
the decision procedure must include an awareness of the probability of a wrong
conclusion.

Kekeliruan Yang Kerapkali Terjadi
Menggunakan data yang salah.
Data yang tidak tepat.
Distribusi (termasuk parameter) yang keliru.
Kesalahan dalam sampling.
Kesalahan dalam pengukuran.
Memilih pengujian yang salah.
Tidak sesuai dengan tujuan studi.
Formulasi hipotesa keliru.
Tidak sesuai dengan hipotesa.
35

Kekeliruan Yang Kerapkali Terjadi
Membangun daerah keputusan yang salah.
Tingkat keberartian yang tidak tepat.
Kurang memperhatikan sebaran data yang berdampak
pada kurtosis dan skewness.
Terlalu ketat / longgar terhadap peluang galat.
Menarik kesimpulan yang salah.
Tidak berpijak kembali pada data (evidence) dan
hipotesa.
Analisa yang kurang lengkap dan keliru.
36

Perbedaan
Uji Parametrik dan
Uji Nonparametrik
37

Uji Parametrik dan Nonparametrik
Uji parametrik menggunakan asumsi data berdistribusi
probabilitas tertentu (i.i.d: independent and identically
distributed). Uji parametrik reliabel jika mempergunakan
distribusi probabilitas yang sesuai. Misalnya, uji-t Student
akan reliabel untuk dua sampel independen jika setiap
sampel mengikuti distribusi normal.
Uji nonparametrik (distribution-free test) menggunakan
asumsi tidak mempunyai pengetahuan mengenai distribusi
populasi data. Uji nonparametrik tidak bergantung pada
distribusi apa pun. Uji nonparametrik dapat diterapkan saat
kondisi parametrik tidak terpenuhi.
38

Uji Parametrik dan Nonparametrik
39
JENIS UJI UJI PARAMETRIK UJI NONPARAMETRIK
Uji rata-rata 1 sampel • Z test (σ is known),
• t test (σ is unknown)
• Sign test
• Wilcoxon signed-rank
test
Uji rata-rata 2 sampel tak
berpasangan
• Independent t test • Wilcoxon rank sum test
• Mann-Whitney U test
Uji rata-rata 2 sampel
berpasangan
• Paired t test • Sign test
• Wilcoxon signed-rank
test
Analisa varians n>2
sampel satu arah
• One-way analysis of
variance
• Kruskal-Wallis test
• Mood’s median test
Analisa varians n>2
sampel dua arah
• Two-way analysis of
variance
• Friedman test
Analisa Korelasi • Pearson’s r • Spearman’s rho (ρ)

Uji Tanda (Sign Test)
Let p = X1 / n and p0 = 1 / 2
45

Uji Tanda (Sign Test)
Let p = X1 / n and p0 = 1 / 2
52

Example 1
58
P(X1 < 5) = 0.0207 < 0.025
P(X1 < 6) = 0.0577
P(X1 > 14) = 0.0577
P(X1 > 15) = 0.0207 < 0.025

Example 2
60
P(X1 < 1) = 0.0107 < 0.025
P(X1 < 2) = 0.0547
P(X1 > 8) = 0.0547
P(X1 > 9) = 0.0107 < 0.025

Uji Peringkat Bertanda
(Wilcoxon Signed-Rank Test)
67

Uji Mann Whitney U
(Mann Whitney U Test)
82

Uji Jumlah Peringkat
(Wilcoxon Rank Sum Test)
97

Uji Jumlah Peringkat
(Mann-Whitney-Wilcoxon
Rank Sum Test)
107

Mann-Whitney-Wilcoxon Rank Sum Test
108

109

110

111

112

113

114

Apakah bisa untuk kasus berikut?
117
Membandingkan daun
yang gugur di dua pohon

118
Membandingkan pH atau
keasaman air sumur di
dua area industri

119
Membandingkan kompetensi sumber daya
manusia terhadap standar minimal kompetensi
organisasi di level pekerjaannya?

120
Membandingkan dua alternatif keputusan
dengan multi kriteria?

Uji Nonparametrik dgn Matlab
signtest - Sign test (paired samples).
ranksum - Wilcoxon rank sum test
(independent samples).
signrank - Wilcoxon sign rank test (paired
samples).
kruskalwallis - Kruskal-Wallis test (nonparametric
one-way anova).
friedman - Friedman's test (nonparametric two-
way anova).
122

123
Terima kasih ...
... Ada pertanyaan ???

Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik

Similar to Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik (20)

More from Arif Rahman

More from Arif Rahman (19)

Recently uploaded

Recently uploaded (11)

Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik

Editor's Notes