Successfully reported this slideshow.
Your SlideShare is downloading. ×

S inf 2020_07

Ad

Uji Tabel Kontingensi
(Contingency Table Test)
ARIF RAHMAN
1

Ad

Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, mer...

Ad

Statistika
3
Mengorganisasi,
Merangkum,
Menyederhanakan,
Menyajikan,
Menginterpretasikan
Menganalisa
Mensintesa
Mengumpulk...

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Upcoming SlideShare
S inf 2020_06
S inf 2020_06
Loading in …3
×

Check these out next

1 of 90 Ad
1 of 90 Ad

S inf 2020_07

Download to read offline

Modul kuliah statistika inferensia - Teknik Industri - pertemuan 7 - uji tabel kontingensi

Modul kuliah statistika inferensia - Teknik Industri - pertemuan 7 - uji tabel kontingensi

More Related Content

S inf 2020_07

  1. 1. Uji Tabel Kontingensi (Contingency Table Test) ARIF RAHMAN 1
  2. 2. Statistika Statistika adalah cabang ilmu matematika yang mempelajari metode ilmiah untuk mengumpulkan, mengorganisasi, merangkum, menyederhanakan, menyajikan, menginterpretasikan, menganalisa dan mensintesa data (numerik atau nonnumerik) untuk menghasilkan informasi dan/atau kesimpulan, yang membantu dalam penyelesaian masalah dan/atau pengambilan keputusan. 2
  3. 3. Statistika 3 Mengorganisasi, Merangkum, Menyederhanakan, Menyajikan, Menginterpretasikan Menganalisa Mensintesa Mengumpulkan data Menghasilkan informasi dan/atau kesimpulan Menggeneralisasi Mengestimasi, Menguji hipotesa, Menilai relasi, Memprediksi Menyelesaikan masalah Mengambil keputusan
  4. 4. Statistika Inferensia Statistika inferensia adalah cabang statistika yang menganalisa atau mensintesa data untuk menggeneralisasi sampel terhadap populasi, mengestimasi parameter, menguji hipotesa, menilai relasi, dan membuat prediksi untuk menghasilkan informasi dan/atau kesimpulan. Terdapat banyak alat bantu statistika (statistical tools) yang dapat dipergunakan untuk menginferensi populasi atau sistem yang menjadi sumber asal data sampel 4
  5. 5. Statistika Inferensia 5 Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel SAMPLING INFERENSI Parameter : N (banyaknya anggota populasi), μ (rata-rata populasi), σ (simpangan baku populasi), π (proporsi populasi) Statistik : n (banyaknya anggota sampel), ẋ (rata-rata sampel), s (simpangan baku sampel), p (proporsi sampel)
  6. 6. Tipe Data Data Nominal, data yang hanya berupa simbol (meski berupa angka) untuk membedakan nilainya tanpa menunjukkan tingkatan Data Ordinal, data yang mempunyai nilai untuk menunjukkan tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan. Data Interval, data yang mempunyai nilai untuk menunjukkan tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya untuk menunjukkan titik acuan (baseline). Data Rasio, data yang mempunyai nilai untuk menunjukkan tingkatan dengan skala indikasi rasio perbandingan. Nilai nol menunjukkan titik asal (origin) yang bernilai kosong (null). 6
  7. 7. Tipe Data Data Parametrik, data kuantitatif yang mempunyai sebaran variabel acak mengikuti pola distribusi probabilitas dengan parameter tertentu (independent and identically distributed random variables) Data Nonparametrik, data yang tidak mempunyai distribusi probabilitas (distribution-free) 7
  8. 8. Tipe Data Data Diskrit, data hasil pencacahan atau penghitungan, sehingga biasanya dalam angka bilangan bulat. Data Kontinyu, data hasil pengukuran yang memungkinkan dalam angka bilangan nyata (meskipun dapat pula dibulatkan) 8
  9. 9. Statistika Alat Bantu Problem Solving 9 Penting memperhatikan cara memperoleh data yang akan diolah Demikian pula cara mengolah data juga penting diperhatikan
  10. 10. Statistika Alat Bantu Problem Solving 10 Metode statistika bukan ramuan sihir Alat statistika bukan tongkat sihir
  11. 11. Ketelitian & Tipe Kesalahan 11
  12. 12. Akurasi dan Presisi Akurasi (accuracy), kesesuaian hasil pengukuran terhadap nilai obyek sesungguhnya (bias kecil) Presisi (precision), tingkat skala ketelitian pengukuran dari alat pengukur, atau ketersebaran yang relatif mengumpul (variansi atau deviasi kecil) 12
  13. 13. Akurat dan Presisi Tidak presisi, akibat pola sebaran sampel lebih melebar daripada pola sebaran populasi menyebabkan deviasi yang besar. Tidak akurat, akibat pergeseran pemusatan sampel menjauh dari pemusatan populasi menyebabkan bias yang besar. Akurat dan presisi, bias dan deviasi kecil, membutuhkan sampel sedikit. 13
  14. 14. Kesalahan Pengambilan Kesimpulan Galat tipe 1 () : kesalahan menyimpulkan karena menolak hipotesa yang semestinya diterima Galat tipe 2 () : kesalahan menyimpulkan karena menerima hipotesa yang semestinya ditolak 14  
  15. 15. Kesalahan Pengambilan Kesimpulan 15 The true state of nature Decision H0 is true H0 is false Reject H0 Type I error Exact decision Fail to reject H0 Exact decision Type II error The true state of nature Decision H0 is true H0 is false Reject H0  1 –  Fail to reject H0 1 –  
  16. 16. Ukuran Ketelitian Pendugaan Tingkat keberartian (significance level, ), probabilitas penolakan data observasi, karena menyimpang signifikan terhadap sasaran. Tingkat kepercayaan (confidence coefficient,1-), persentase data observasi yang diyakini tidak berbeda signifikan dengan target. Kuasa statistik (power,1-), persentase data observasi yang diyakini berbeda signifikan dengan target. Derajat kebebasan (degree of freedom, df=n-k), besaran yang menunjukkan bebas terhadap bias dari n data observasi. 16
  17. 17. Prinsip Dasar Pengujian Hipotesa 17
  18. 18. Hipotesa Hipotesa adalah pernyataan sebuah pendugaan (presumption), anggapan (claim), pemikiran (postulate), penegasan (assertion), atau penerkaan (conjecture), yang mungkin benar atau salah, mengenai data dan statistik dari satu atau lebih sampel yang berkenaan dengan parameter dari satu atau lebih populasi Hipotesa berkaitan dengan  Evaluasi keputusan  Analisa data observasi atau eksperimen  Prediksi statistik  Estimasi parameter  Pengujian  Komparasi perbandingan 18
  19. 19. Hipotesa Hipotesa statistik diformulasikan dalam dua bentuk, yaitu : Hipotesa nol (null hypothesis), dinotasikan Ho (dibaca “H-naught”) dengan format persamaan atau menggunakan tanda baca “=“ Hipotesa alternatif (alternative hypothesis), dinotasikan H1 (dibaca “H-one”) dengan format pertidaksamaan. Dua arah (two tail) menggunakan tanda baca “” Satu arah (one tail) menggunakan tanda baca “<“ atau “>” 19
  20. 20. Pengujian Hipotesa Pengujian hipotesa (hypothesis testing) adalah prosedur menggunakan informasi dalam sampel acak dari sebuah populasi dan probabilitasnya (termasuk distribusinya) melalui pengujian statistik untuk membentuk keputusan atau kesimpulan secara induksi atau inferensia menggeneralisasi terhadap populasinya. 20
  21. 21. Pengujian Hipotesa Daerah penolakan atau kritis (critical region) yaitu daerah yang mencakup semua nilai yang memenuhi hipotesa alternatif. Daerah penerimaan (acceptance region) yaitu daerah yang mencakup semua nilai yang memenuhi hipotesa nol. Nilai kritis (critical value) yaitu nilai yang menjadi batas antara daerah penolakan dan penerimaan. Kesimpulan menolak Ho, jika statistik uji < nilai kritis kiri (left- tailed) atau statistik uji > nilai kritis kanan (right tailed) 21
  22. 22. Critical Region 22
  23. 23. Kesimpulan Pengujian Hipotesa Menerima hipotesa nol (lebih tepatnya “gagal menolak hipotesa nol”) menyatakan bahwa data sampel tidak mampu memberikan bukti yang cukup dan signifikan untuk menolaknya. Menolak hipotesa nol menyatakan bahwa data sampel memberikan bukti yang cukup dan signifikan untuk menolaknya. 23
  24. 24. Critical Region 24
  25. 25. P-Value P-value adalah tingkat signifikansi terrendah di mana nilai observasi dari statistik uji signifikan. P-value merupakan tingkat signifikansi terrendah yang menandakan batas penolakan hipotesa nol dari data observasi. Penggunaan pendekatan P-value sebagai alat bantu pengambilan keputusan sedikit lebih natural, dan hampir semua software statistik menyertakan P-value bersama nilai statistik uji.  Kesimpulan menolak Ho, jika P-value < α 25
  26. 26. Langkah Pengujian Hipotesa 26
  27. 27. Langkah Pengujian Hipotesa 1. Menentukan tujuan pengujian hipotesa 2. Formulasi hipotesa 3. Memilih uji statistik 4. Menentukan tingkat keberartian 5. Membangun daerah keputusan 6. Menghitung statistik uji 7. Menarik kesimpulan 27
  28. 28. Langkah Pengujian Hipotesa 1. Menentukan tujuan pengujian hipotesa Berdasarkan masalah yang menjadi fokus studi, untuk menentukan parameter of interest sebagai tujuan pengujiannya. 28 Tujuan pengujian hipotesa berawal dari maksud mempelajari sistem atau menjawab permasalahan. Tujuan menjadi dasar utama dalam menentukan populasi, memilih sampel, mengambil data dan mengujinya untuk memperoleh kesimpulan yang selaras dengan tujuan tersebut.
  29. 29. Langkah Pengujian Hipotesa 2. Formulasi hipotesa Hipotesa diformulasikan berdasarkan praduga yang dirumuskan sesuai dengan tujuan. Praduga tidak selalu menjadi hipotesa nol, bahkan lebih diutamakan praduga direfleksikan pada hipotesa alternatif. 29 Hipotesa alternatif H1 biasanya merepresentasikan permasalahan yang akan dijawab atau teori yang akan diuji, sehingga formulasi spesifik menjadi krusial. Hipotesa nol H0 menyatakan status quo atau equality yang meniadakan (nullifies) atau berlawanan (opposes) H1 dan menjadi complement dari H1 yang bersifat mutually exclusive. Penggunaan format pertidaksamaan dengan tanda pengujian satu arah memberikan deskripsi lebih spesifik pada H1.
  30. 30. Langkah Pengujian Hipotesa 3. Memilih uji statistik Uji statistik dalam statistik inferensia dikelompokkan menjadi dua, uji parametrik (berdistribusi) dan uji nonparametrik. Uji statistik yang dipilih harus disesuaikan dengan tujuan pengujian, hipotesa dan data (evidence) yang diuji. 30 Uji parametrik mempertimbangkan tipe data dan distribusi data. Pendekatan distribusi normal terkadang dapat dipergunakan dengan merujuk Central Limit Theorem dan Law of Large Number
  31. 31. Langkah Pengujian Hipotesa 4. Menentukan tingkat keberartian Tingkat keberartian (terkadang juga disebut taraf nyata atau tingkat ketelitian) menunjukkan luas daerah penolakan. Tingkat keberartian sebenarnya juga menunjukkan besarnya peluang terjadinya galat tipe I. 31 Semakin besar nilai tingkat keberartian semakin besar peluang galat tipe 1. Sebaliknya semakin kecil nilainya semakin kecil pula peluang galat tipe 1, tetapi juga semakin besar peluang galat tipe 2, bukannya bermakna semakin teliti. Peluang galat tipe 2 beririsan dengan daerah penerimaan, sehingga sebenarnya peluang galat tipe 2 tidak sama besar dengan satu dikurangi peluang galat tipe 1.
  32. 32. Langkah Pengujian Hipotesa 5. Membangun daerah keputusan Daerah keputusan terbagi menjadi dua, yaitu daerah penolakan dan daerah penerimaan. Di antara kedua daerah tersebut dibatasi oleh nilai kritis. Nilai kritis diperoleh berdasarkan tingkat keberartian, dan distribusi (termasuk parameter) yang dipergunakan dalam uji statistik. 32 Semakin besar nilai tingkat keberartian semakin luas daerah penolakan (semakin besar peluang galat tipe 1). Sebaliknya semakin kecil nilainya semakin luas daerah penerimaan (semakin besar peluang galat tipe 2), bukannya bermakna semakin teliti.
  33. 33. Langkah Pengujian Hipotesa 6. Menghitung statistik uji Perhitungan statistik uji berdasarkan uji statistik yang dipilih dan distribusi (termasuk parameter) yang dipergunakan. Hasil perhitungan statistik uji tergantung kecukupan, sebaran, kevalidan dan kesesuaian data. 33 Data yang keliru akan memberikan hasil yang keliru (garbage in garbage out) Uji statistik yang keliru memberikan hasil yang keliru (failure makes inappropriate result). Periksa datanya, pahami uji statistik yang dipilih, pelajari distribusi yang dipergunakan, dan pastikan sesuai dengan tepat.
  34. 34. Langkah Pengujian Hipotesa 7. Menarik kesimpulan Kesimpulan ditarik berdasarkan hasil perhitungan statistik uji, apakah berada di daerah penerimaan atau daerah penolakan. 34 The truth or falsity of a statistical hypothesis is never known with absolute certainty unless we examine the entire population. It should be made clear that the decision procedure must include an awareness of the probability of a wrong conclusion.
  35. 35. Kekeliruan Yang Kerapkali Terjadi Menggunakan data yang salah. Data yang tidak tepat. Distribusi (termasuk parameter) yang keliru. Kesalahan dalam sampling. Kesalahan dalam pengukuran. Memilih pengujian yang salah. Tidak sesuai dengan tujuan studi. Formulasi hipotesa keliru. Tidak sesuai dengan hipotesa. 35
  36. 36. Kekeliruan Yang Kerapkali Terjadi Membangun daerah keputusan yang salah. Tingkat keberartian yang tidak tepat. Kurang memperhatikan sebaran data yang berdampak pada kurtosis dan skewness. Terlalu ketat / longgar terhadap peluang galat. Menarik kesimpulan yang salah. Tidak berpijak kembali pada data (evidence) dan hipotesa. Analisa yang kurang lengkap dan keliru. 36
  37. 37. Tabulasi Silang atau Tabel Kontingensi 37
  38. 38. Tabel Kontingensi Tabel Kontingensi (contingency table) atau tabulasi silang (crosstabs) adalah jenis tabel dalam format matriks yang menampilkan distribusi frekuensi (banyaknya atau persentase) gabungan beberapa variabel (multivariat). Setiap variabel dipecah menjadi beberapa level kategori. Setiap sel menunjukkan interaksi antar variabel di level yang spesifik masing-masing. Istilah tabel kontingensi pertama kali digunakan oleh Karl Pearson pada tahun 1904 38
  39. 39. Tabel Kontingensi Tabel kontingensi r X c dipergunakan untuk memetakan dua variabel (bivariat), r level variabel 1 dan c level variabel 2 dalam tabel dwi arah. 39
  40. 40. Tabel Kontingensi Tabel kontingensi berdimensi tinggi dipergunakan untuk menemukan struktur dependensi pada statistik multivariat. Relasi independensi bersyarat memberikan bantuan besar dalam pengelolaan data. Konsep teori informasi dengan dukungan tabel kontingensi beserta frekuensi relatifnya, akan memudahkan memberikan gambaran sebaran dependensi-independensi antar variabel. 40
  41. 41. Distribusi Chi-Square 41
  42. 42. Distribusi Chi-Square Hubungan Distribusi Chi Square dengan Distribusi Normal Jika X adalah variabel acak independen berdistribusi Normal (,) dengan derajat kebebasan sebesar , maka X2 adalah variabel acak berdistribusi Chi Square 42
  43. 43. Fungsi Distribusi Chi-Square  Parameter   (degree of freedom)  Probability Density Function, f(x)  Cummulative Distribution Function, F(x) 43 f(x) F(x)          0 ) ( 0 0 ) ( 0 x di i f x x F x            other x e x x f x 0 0 ) ( 2 ) ( 2 2 / 1 ) 2 / ( 2 /   
  44. 44. Parameter Distribusi Chi-Square Dinotasikan dengan CHISQR(x;) atau 2 Parameter   (degree of freedom) Mean Variance 44      2 2 
  45. 45. 45
  46. 46. Cara membaca Tabel 2 46 P(2 > 4,17) = 0,90, maka left tailed P(2 < 4,17) = 0,10 2 α ≠ - 2 (1 - α) P(2 > 16,92) = 0, 05, maka right tailed P(2 > 16,92) = 0,05 2 0 = 16.92 2 0 = 4.17 2 α ≠ 1 / 2 (1 - α) jika α semakin besar maka P(2 < 2 α) semakin kecil dan P(2 > 2 α) semakin besar
  47. 47. Cara membaca Tabel 2 Nilai 2 0 saat P(2 > 2 0) = 0,05 dengan df = 9 Nilai 2 0 saat P(2 > 2 0) = 0,90 dengan df = 9 47 2 0 = 16.92 2 0 = 4.17
  48. 48. Cara membaca Tabel 2 Nilai 2 0 saat P(2 > 2 0) = 0,05 dengan df = 9 Nilai 2 0 saat P(2 > 2 0) = 0,90 dengan df = 9 48 2 0 = 16.92 2 0 = 4.17
  49. 49. Cara membaca Tabel 2 Nilai P(2 > 2 0) saat 2 0 = 15 dengan df = 9 Nilai P(2 < 2 0) saat 2 0 = 4 dengan df = 9 49 P-value = 0,05 + ( (15 – 16,92)) X (0,10 – 0,05)) (14,68 – 16,92) = 0,05 + ( 0,85714 X 0,05) = 0,092857 P-value = (1-0,95) + ( (4 – 3,33) X ((1-0,9) – (1-0,95)) (4,17 – 3,33) = 0,05 + ( 0,79762 X 0,05) = 0,089881
  50. 50. Uji Independensi (Independency Test) 50
  51. 51. Uji Chi-Square 51
  52. 52. Uji Chi-Square 52
  53. 53. Uji Chi-Square 53
  54. 54. Uji Chi-Square 54
  55. 55. Uji Chi-Square 55
  56. 56. Example 1 56
  57. 57. Example 1 57
  58. 58. Example 1 58
  59. 59. Example 1 59
  60. 60. Example 1 Solution: 1.Is there independence between a voter’s opinion concerning the tax reform and his or her level of income? 2.H0: Fobs(x) = Fexp(x) H1: Fobs(x) ≠ Fexp(x) 3.test statistic 4.α = 0,05 5.Critical region : the null hypothesis is rejected when 2 = 5.991 for  = (3–1)(2–1) = 2 degrees of freedom and α = 0,05 60
  61. 61. Example 1 6. Computation 7. Decision : Since 2=7.85 is greater than the critical value (2=5.991), we reject H0. We conclude that a voter’s opinion concerning the tax reform and his or her level of income are not independent 61 P-value (2>7,85) = 0,010 + ( (7,85 – 9,21) X (0,025 – 0,010)) (7,38 – 9,21) = 0,010 + ( 0,7432 X 0,015) = 0,021148 7,38 (2 0,025;2) < 7,85 < 9,21 (2 0,010;2) 
  62. 62. Example 2 62
  63. 63. Example 2 63 49,63 > 10,60 (2 0,005;2)  P-value (2>49,63) < 0,005
  64. 64. Example 3 64
  65. 65. Example 3 65
  66. 66. Example 3 66
  67. 67. Example 3 67
  68. 68. Example 3 1. Is there any differences in opinion between the doctors and the nurses about the procedures? 2. H0: Fobs(x) = Fexp(x) H1: Fobs(x) ≠ Fexp(x) 3. test statistic 4. α = 0,05 5. Critical region : the null hypothesis is rejected when 2 = 5.991 for  = (3–1)(2–1) = 2 degrees of freedom and α = 0,05 68
  69. 69. Example 3 6. Computation 7. Decision : Since 2=26.67 is greater than the critical value (2=5.991), we reject H0. There is enough evidence to support the claim that opinion is related to (dependent on) profession—that is, that the doctors and nurses differ in their opinions about the procedure. 69 26,67 > 10,60 (2 0,005;2)  P-value (2>26,67) < 0,005
  70. 70. Uji Homogenitas (Homogeneity Test) 70
  71. 71. Uji Chi-Square 71
  72. 72. Uji Chi-Square 72
  73. 73. Uji Chi-Square 73
  74. 74. Example 4 74
  75. 75. Example 4 75
  76. 76. Example 4 76
  77. 77. Uji Homogenitas Beberapa Proporsi (Homogeneity Test) 77
  78. 78. Uji Chi-Square 78
  79. 79. Uji Chi-Square 79
  80. 80. Example 5 80
  81. 81. Example 5 81
  82. 82. Example 5 82
  83. 83. Example 6 83
  84. 84. Example 6 1. Is there no differences in the proportions between four income groups? 2. 3. test statistic 4. α = 0,05 5. Critical region : the null hypothesis is rejected when 2 = 7.815 for  = (2–1)(4–1) = 3 degrees of freedom and α = 0,05 84
  85. 85. Example 6 6. Computation :Since we want to test the claim that the proportions are equal, we use the expected value as ¼ X 400 = 100. 85
  86. 86. Example 6 7. Decision : Since 2=14.149 is greater than the critical value (2=7.815), we reject H0. There is enough evidence to reject the claim that there is no difference in the proportions. Hence the incomes seem to make a difference in the proportions. 86
  87. 87. Aplikasi Software: Microsoft Excel, MathCAD 87
  88. 88. 88 Uji Chi- Square dgn MS Excel Uji Chi Square 2 Tingkat Signifikansi CHITEST(DataRange1; DataRange1) 2 hitung CHIINV(SignLvl;df) 2 tabel CHIINV(;df)
  89. 89. 89 Uji Chi- Square MathCAD Uji Chi Square 2 Tingkat signifikansi pchisq(2,df) , atau 1 - pchisq(2,df) 2 tabel qchisq(,df) , daerah kritis left-tail qchisq(1-,df) , daerah kritis right-tail
  90. 90. 90 Terima kasih ... ... Ada pertanyaan ???

Editor's Notes

  • Statistika dapat menjadi alat bantu dalam menyelesaikan masalah. Mulai dari saat mengumpulkan data, mengolah, menginterpresikan, menganalisa dan mensitesanya. Namun saat keliru menetapkan populasi atau keliru memilih sampel, serta keliru mendeskripsikan variabel yang akan diambil datanya, melalaikan tujuan penelitian, maka hasil pengolahannyapun akan menjadi sampah. Demikian pula meskipun data yang diambil benar dan representatif, namun metode dan alat pengolahannya pun keliru yang dipilih atau keliru cara mempergunakannya, maka hasilnya pun akan menjadi sampah. Sehingga perlu kita pahami bahwa statistika cuma alat berbasis model matematis, ada angka dimasukkan akan mengeluarkan hasil, entah itu benar atau sampah.
  • Alat statistika bukan tongkat sihir, apapun dan bagaimanapun keadaan datanya dengan tongkat sihir ajaib bisa mengubahnya menjadi hasil yang sesuai dengan tujuan penelitian. Metode statistika pun bukan ramuan sihir, apapun dan bagaimanapun keadaan datanya diolah dalam ramuan sihir ajaib bisa mewujudkan hasil yang sesuai dengan tujuan penelitian.

×