Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,193
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
10
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. SPSS TATAP MUKA KE IV COMPUTING DESCRIPTIVE STATISTICS COMPARING GROUPS 31-82 EDISI 2013 dosen Prof(Em). Dr. H. Soedito Adjisoedarmo
  • 2. BAGAIMANA CARA ANDA DAPAT MERANGKUMG NILAI SUATU VARIABEL ? Apa yang dimaksud skala mengukuran ? Mengapa skala mengukuran penting ? Apa bedanya mean dengan mode dan Median? Kapan median lebih baik mengukur Central tendency dibanding dg mean ? COMPUTING DESCRIPTIVE STATISTICS
  • 3. BAGAIMANA CARA ANDA DAPAT MERANGKUMG NILAI SUATU VARIABEL Apa yang dimaksud skala mengukuran ? Mengapa skala mengukuran penting ? Apa bedanya mean dengan mode dan Median? Kapan median lebih baik mengukur Central tendency dibanding dg mean ? Apa yang dapatkan dari variance ? Apa yang dapatkan dari coefficient Variation? Apa yang dimaksud score terstandar Dan mengpa penting ?
  • 4. Pada pokok bahasan ke iii, telah digunakan tabel frekuensi, pie dan bar chart serta histogram untuk mengamati distribusi nilai variabel. Fasilitas/prosedur tersebut merupakan teknik esensial untuk mengenali data. Di samping teknik tersebut kita sering membutuhkan untuk merangkum nilai variabel lebih lengkap dengan cara menghitung statistics dari nilai variabel
  • 5. Atau central tendency, dan mengamati penyebaran data di sekitas nilai tengah, atau yang lebih dikenal sebagai variasi atau kergamanan data. Pada pokok bahasan iv akan dibahasan penggunaan frekuensi dan prosedur descriptive untuk menghitung statistics yang sering digunakan untuk central tendency dan variability
  • 6. Sering kalau kita mengumpulkan data, kita ingin menarik kesimpulan mengenai populasi individu atau obyek berdasar individu atau obyek yang kita libatkan dalam penelitian. Contoh Dari sampel gss ditarik (ditaksir) simpulan untuk populasi, rakyat amerika. Dari sample umpan balik ditarik simpulan untuk mhs fakultas peternakan. Dst…. WHAT’S A STATISTIC ?
  • 7. Statistic merupakan karak teristik sampel untuk variabel tertentu. Simpulan yang diambil untuk menaksir karakteristik po pulasi. Karakteristik yang dimili ki populasi disebut parameter. Kalau kita mempunyai data umur seluruh mahasiswa indonesia, nilai tengah umur tersebut disebut nilai parameter
  • 8. Pada umumnya untuk semua populasi nilai parameter tidak diketahui. Oleh karena itu ditaksir menggunakan stastic sample yang diperoleh lewat penelitian; menggunakan analisis data yang antara lain dapat menggunakan spss.
  • 9. Perhatikan data dari tatap muka ke iii; kalau ada akan merangkum lebih lanjut nilai data tersebut, misal ingin mengetahui rataan umur, atau karakteristik status pekerjaan atau kepuasaan terhadap pekerjaan mereka ( di tempat yang berbeda). Jawaban yang spesifik mungkin tidak dapat diperoleh, karena cara untuk menetapkan jawaban yang spesifik banyak cara. SUMMARIZING DATA
  • 10. Anda dapat menjawab mengguna kan mode, median atau nilai tengah data dari sampel. Untuk memilih mengukuran yang digunakan di atas, anda harus mempertimbangkan sifat data yang anda miliki/peroleh dari survai, dan sifat dari skal mengukuran yang digunakan.
  • 11. Salah satu karakteristik data yang harus selalu pertimbangkan adalah skala mengukuran yang digunakan untuk memperoleh data tersebut. Skala mengukuran dikelompok kan menjadi • nominal • Ordinal • Interval dan • ratio (Steven, 1946) SCALES OF MEASUREMENT (SKALA PENGUKURAN)
  • 12. Skala nominal digunakan hanya untuk identifikasi. Data yang diukur dengan skala nominal tidak dapat diurutkan dari yang kecil ke yang besar. Contoh Status pekerjaan diukur dengan skala nominal, meskipun dalam bentuk kode, angka tersebut tidak bermakna, retired, in school dan keeping house tidak dapat diurutkan dan dikatakan yang satu lebih besar dari yang lain SKALA NOMINAL
  • 13. Contoh variavel dengan skala nominal
  • 14. Tempat lahir, dan warna kulit adalah contoh lain variabel yang diukur dengan skala nominal. Digunakan untuk identifikasi.
  • 15. SKALA PENGUKURAN YANG PERLU DIINGAT WHEN ARE STATISTICS APPLICABLE ? The data type fall into a sort of hierarchy so that any statistic or procedure that is applicable for the lowest type is also applicable for all higher type. The lowest type of data in the hierarchy is called Nominal data .
  • 16. Nominal data, is the type of data that we normally call categorical data. In this type of data the values merely substitutes for names of values. An example of nominal data would be Church. This variable could take on values such as (1) Lutheran , (2) Methodist, (3) Catholic, and (4) Jewish, etc.
  • 17. Alphanumeric data can also be described as nominal data. None of the statistics (mean, variance, range, sum, std err, kurtosis, minimum, std dev, skewness, sum) however Frequencies or Crosstabs are applicable.
  • 18. Bila anda menggunakan skala nomial, maka anda membuat partisi dalam suatu himpunan ke dalam kelompok-2 yg mutually exclusive (mewakili kajadian yang berbeda) dan collectively exhaustic (dapat menjelaskan semua kejadian yg terjadi dalam kelompok tersebut). SKALA NOMINAL
  • 19. VARIABEL NOMINAL Varibel yang ditetapkan berdasar atas proses penggolongan. Variabel nominal bersifat diskrit dan saling pilah (mutually exclusive) antara kategori yang satu dengan kategori yang lain. Contoh: jenis kelamin, status perkawinan, dan jenis pekerjaan
  • 20. The next data types is called Ordinal data Ordinal data This type of data has a particular order to its values. For example a rating on FOOD at a restaurant with values good, fair, dan poor would be ordinal data. Another example of ordinal data would be an opinion survey with answers such as strongly agree, agree, neutral, disagree, strongly disagree.
  • 21. Ordinal data can be ranked from high to low which makes the statistics minimum, maximum, danminimum, maximum, dan rangerange applicable. Most statisticians agree that the other statistics and procedures such as mean, Pearson corr and regression should not be used with ordinal data.
  • 22. SKALA ORDINAL Mencakup ciri-2 skala nominal ditambah satu yaitu urutan. Skala ordinal dapat dipakai jika postulat mengenai transitivitas dipenuhi. Postulat tsb menyatakan bahwa apabila a lebih besar dari b dan b lebih besar dari c, maka a lebih besar dari c (a>b>c). Urutan yang dapat dipakai adalah : lebih dari………………. kurang dari……………. di atas …………………. di bawah……………….
  • 23. SKALA ORDINAL Contoh skala pendapat, skala preferensi, Statistik yang dapat dipakai: median, persentil (seperseratusan) dan kuartil (seperempatan) menyatakan sebaran nya. Ukuran uji nyata secara statistik menggunakan metode non-para metrik (Steel & Torrie, 19--; hal 533)
  • 24. VARIABEL ORDINALVARIABEL ORDINAL Variabel yang disusun atas jenjang dalam atribut tertentu. Jenjang tertinggi biasanya diberi angka 1, jenjang di bawah nya diberi angka 2, dan seterusnya. Contoh: ranking hasil lomba
  • 25. INTERVAL DATA The third type of data is in interval level data. We frequently call this metric or continues data. In addition to having a order like ordinal data this type of data also as a fixed unit of measurement. An example of an interval level variable would be temperature. This variable is interval since the distance between 30 and 1 degrees is the same as the distance between any other two consecutive degrees.
  • 26. INTERVAL DATA All of the statistics including mean, standard deviation, standard error, variance, kurtosis and skewness are applicable for this kind of data, The procedures Pearson Corr dan Regression are also applicable
  • 27. SKALA INTERVALSKALA INTERVAL Skala interval memiliki keampuhan skala ordinal dan niminal masih ditambah lagi dengan mencakup kesamaan interval (jarak antara 1 dan 2, sama dengan jarak antara 2 dengan 3). Waktu kalender merupakan contoh skala interval. Dapat juga untuk skala sikap. Ukuran sentralnya adalah rata-rata hitung. Prosedur statistik yang dapat dipakai antara lain: korelasi product moment, uji t, dan uji F .
  • 28. VARIABEL INTERVALVARIABEL INTERVAL Variabel yang dihasilkan dari pengukuran, yang di dalam pengukuran itu dasumsikan terdapat satuan pengukuran yang sama . Contoh: prestasi belajar, sikap terhadap……, penghasilan, dsb
  • 29. RATIO DATA The forth and highest type of data in the hierarchy is called ratio data. This type of data has all the properties of ordinal data but has added the additional property of having a zero point in its measurement scheme.
  • 30. SKALA RASIO Memiliki semua keampuhan dari skala nominal, ordinal, dan interval, dan ditambah dengan memiliki titik nol. Skala rasio mencerminkan jumlah yang sebenarnya dari dari suatu variabel.
  • 31. SKALA RASIO Contoh: ukuran dimensi fisik seperti berat, tinggi, jarak dan lsb. Dalam penelitian bisnis banyak ditemui /digunakan skala rasio misalnya: nilai uang, jumlah pupulasi, jarak, jumlah waktu dalam periode waktu. Semua prosedur teknik dapat diterapkan untuk skala rasio.
  • 32. VARIABEL RASIO Variabel yang dalam kuantifi kasinya mempunyai nilai nol mutlak. Di dalam penelitian , terlebih-lebih dalam penelitian ilmu sosial, orang jarang menggunakan variabel rasio.
  • 33. Mode, Median dan Arithmetic Average Mode, Median dan Arithmetic average merupakan pengukuran central tendency yang paling banyak dipakai. Mode diperoleh dengan cara mendapat frekuensi yang paling sering muncul. Mode, karena tidak membutuhkan nilai variabel mempunyai makna, maka sering digunakan untuk skala nominal.
  • 34. Mode jarang dilaporkan sendi rian, biasanya dilengkapi dengan tabel frekuensi dan bar chart. Dengan menggunakan mode kesalahan mudah terjadi apabila digunakan untuk karakteristik variabel. Mode hanya memberikan infor masi sedikit.
  • 35. Apabila anda merangkum suatu variabel yang nilainya dapat diurutkan dari yang kecil ke besar, median akan lebih berguna untuk mengukur central tendency. Urutkan lebih dahulu nilai variabel, kemudian cari nilai yang di tengah.
  • 36. Kelemahan Median, ialah, tidak memanfaatkan seluruh informasi yang tersedia. Misal, diperoleh nilai, 28, 29, 30, 31, dan 32 maka mediannya adalah 30. Untuk nilai 28, 29, 30, 98, dan 190 mendian juga 30. Jelas bahwa angka di atas dan di bawah median diabaikan. Angka 98 dan 190 tidak mempengaruhi nilai median.
  • 37. Ukuran central tendency yang paling sering digunakan adalah arithmetic mean, yang juga disebut sebagai average (rataan, x). Mean meng gunakan semua nilai nyata dari seluruh kasus. Mean dihitung dengan menggunakan rumus Mean = 28+29+30+98+190 = 75 5 (4.1)
  • 38. Can I use the mean for variables that have only two values ? Banyak variabel, seperti yang menjawab pertanyaa ya/tidak atau setuju/tidak setuju, memiliki dua nilai. Biasanya dikodekan dengan 0 dan 1. Maka arithmetic average memberikan proporsi kasus dengan kode 1. Arithmetic mean=0,5 berarti 50% responden menjawab ya.
  • 39. Fig 4.1 berisi descriptive statistics dari prosedur Frequency, untuk variabel age dan education. Dapat diperiksa bahwa rataan umur responden GSS adalah 46,23 tahun, Median 43, lebih rendah dari mean. Lama mengikuti pendidikan mempunyai mean 13,04 dan median 12 tahun. Comparing Mean dan Median
  • 40. Kedua variable tersebut memiliki mean lebih besar dari median. Penyebabnya adalah karena kedua variabel tersebut memiliki tail menuju ke nilai terbesar. Karena responden yang disertakan berumur 18 tahun ke atas, maka angka di bawah 18 tidak diperoleh, umur di atas 18 tahun tidak ada batasnya. Nilai yang tinggi menaikkan mean umur.
  • 41. Fig 4.1 Mean, Median and mode for age and education
  • 42. Apabila distribusi nilai benar- benar simetrik maka mean dan median sama nilainya. Apabila distribusi nilai memiliki long tail (distribusinya disebut skwed) maka mean akan lebih besar dari median apabila tail menuju nilai yang lebih besar, dan sebaliknya.
  • 43. Apabila nilai data berbeda yang besar, maka mean bukan merupakan ukuran central tendency yang baik; disebabkan karena mean dipengaruhi oleh nilai ekstrim yang disebut outliers. Pada kasus demikian lebih baik dilengkapi dengan median, dan sebutkan nilai ekstrim tinggi dan rendah.
  • 44. Ukuran central tendency tidak memberikan informasi mengenai besar perbedaan antar nilai. Misal, mean dan median mempunyai nilai 50; datanya sbb., 50, 50, 50, 50, 50 dan 10, 20, 50, 80, 90. Terlihat bahwa distribusi/ sebaran angka tersebut sangat berbeda. Ukuran variability/keragaman akan memberikan informasi penyebaran angka. Measures of Variability
  • 45. Range adalah ukuran paling sederhana untuk keragaman; yaitu perbedaan (selisih) antara nilai tertinggi dan terendah. Range tidak ada manfaat dihitung untuk variabel nominal; karena nilai/kode untuk varibel nominal tidak dapat diartikan sebagai urutan besar ke kecil dan sebaliknya. Range
  • 46. Pada fig 4.2 dapat diperiksa, variabel age memiliki minimal 18 th, maximum 89 dan range 71 (89-18). Nilai range menunjukkan besar kecilnya perbedaan antara nilai terkecil dan terbesar. Ukuran keragaman yang lebih baik dari range adalah interquartile range.
  • 47. Fig 4.2 Descriptive statistics for age and education
  • 48. Interquartile range adalah jarak antara nilai 75th dan 25 th percentile. Nilai ini berbeda dengan range karena, tidak terpengaruh oleh nilai ekstrim.
  • 49. Ukuran keragamaan yang paling sering adalah variance. Variance berdasar kuadrat jarak antara nilai individu dan mean. Variance dihitung dengan rumus sbb. Variance and Standard Deviation )1N( )xx( Variance 2 − − = ∑ Eq 4.2
  • 50. 5,026Variance )15( 2 )75190.....( 2 )7528( Variance = − −+− = Contoh data : 28,29, 30, 98, dan 190 mean = 75 Eq 4.3
  • 51. er Kalau variance sama dengan 0, maka berarti data memiliki nilai yang sama, sehingga mean juga sama dengan nilai individu. Makin besar nilai variance berarti data nilainya makin tersebar. Pada fig 4.2 variance untuk variabel age = 303,392 tahun; untuk variabel education = 9,452 tahun. Akar variance = standard deviation
  • 52. Nilai standar deviation tergantung pada unit pengukuran untuk variabel tertentu. Misal, standard deviation untuk umur diukur dalam hari akan lebih besar dibanding kalau diukur dengan bulan. Coefficient of variation mengeks- presikan standard deviation sebagai persentase dari mean. The Coefficient of Variation
  • 53. Coefficient of variation dihitung dengan rumus sbb. Coefficient satandard dev. of variation = x 100 mean CV = 100% kalau standard deviasi sama dengan mean Eq 4.4
  • 54. CV untuk variabel umur= 37,68%; CV untuk variavel education= 23.54%. Berdasar nilai mean maka umur lebih bervariasi dibandingkan dengan education.
  • 55. Anda dapat menentukan posisi suatu kasus pada distribusi nilai pengamatan dengan cara menghitung/menggunakan standard score atau z score, menggunakan rumus sbb. Standar value - mean score = standar deviation Standard Score Eq 4.5
  • 56. Standard score memberikan infor masi berapa standard deviasi jarak kasus terhadap mean (di bawah atau di atas). Kalau kasus memiliki standard score sama dengan 0, maka nilai kasus tersebut sama dengan mean. Kalau Z score sama dengan 1, berarti, kasus, 1 standar deviasi di atas mean, dst.
  • 57. Untuk mendapatkan z score anda dapat menggunakan prosedur Descriptive, z score dapat disim pan sebagai variabel baru. Periksa fig 4.3 dan 4.4
  • 58. Fig 4.3 Descriptive statistics in the Viewer
  • 59. Fig 4.4 Data Editor with standar score saved as a new variable
  • 60. COMPARING GROUPS How can you determine if the values of the summary statistics for a variable differ for subgroups of cases ? 1. Apa yang dimaksud subgrup kasus ? 2. Apa yang dapat anda pelajari dari menghitung rangkuman statistik secara terpisah dari subgrup kasus tersebut ?
  • 61. 3. Bagaimana cara anda dapat membuat grafik mean dari subgrup kasus tersebut ? Telah dibahas penggunaan pro sedur Frequency dan Descriptive untuk menghitung rangkuman statistics untuk kasus yang telah dipelajari (GSS dan Umpan balik).
  • 62. Selain yang telah dibahas tersebut, sering dibutuhkan kemampuan kita untuk membandingkan rangkuman statistik untuk subgrup kasus yang berbeda. Misal 1. Kita ingin membandingkan nilai ujian untuk klas A, B danK. 2. Kita ingin membandingakan nilai mahasiswa putri dan putra. 3. Kita ingin membandingkan nilai mahasiswa putri dan putra untuk klas A, B dan K. Dst
  • 63. Masalah tersebut tidak mudah untuk dijawab dengan menggunakan prosedur Frequency dan Descriptive. Yang dapat membantu adalah prosedur Mean yang dapat diguna kan untuk menghitung rangkuman statistik subgrup. Menggunakan prosedur Mean anda akan dapat membandingkan rataaan education, dan job satisfaction untuk subgrup yang berbeda.
  • 64. Case Processing Summary 61 34,5% 116 65,5% 177 100,0% Nilai ujian sisipan * Klas mahasiswa N Percent N Percent N Percent Included Excluded Total Cases
  • 65. Report Nilai ujian sisipan 84,56 26 9,2675 73,75 2 8,8388 78,79 33 9,5631 81,08 61 9,7870 Klas mahasiswa A B K Total Mean N Std. Deviati on
  • 66. Misal untuk variabel Education, anda dapat membadingkan mean education (dalam tahun) dalam sub grup Very satified, Most satified, A little dissatified dan Very dissatisfied. Selanjutnya dalam subgrup tersebut dapat dibandingkan mean untuk subsubgrup male dan female (periksa fig 5.1 dan 5.3).
  • 67. Fig 5.1 Pivoted Means output for education and jsatisfaction
  • 68. Fig 5.2 Bar chart of education by job satifaction
  • 69. Layers : Defining subgroups by more than one variable
  • 70. Fig 5.3 Pivoted means output for job satisfaction and gender subgroups
  • 71. COMPARING GROUPS Menggunakan Case selection Menggunakan file gss Membandingkan mean education dalam Kelompok Job satisfiction Yang dilibatkan dalam analisis hanya full-time workers Cara mengerjakan periksa caption berikut
  • 72. Memilih kasus - full-time workers---
  • 73. Gunakan select cases
  • 74. Dialog box Select cases--- pilih if condition
  • 75. Ketik syarat, wrkstat = 1 …. 1=Working fulltime
  • 76. Kasus yang tidak memenuhi syarat di coret (/)