• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Kul 05 spss_eb
 

Kul 05 spss_eb

on

  • 279 views

 

Statistics

Views

Total Views
279
Views on SlideShare
279
Embed Views
0

Actions

Likes
0
Downloads
6
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Kul 05 spss_eb Kul 05 spss_eb Document Transcript

    • SPSS TATAP MUKA KE V COUNTING RESPONSES FOR COMBINATIONS OF VARIABLES 111-125 30-1-2009 dosen Prof. Dr. H. Soedito Adjisoedarmo
    • BAGAIMANA CARA ANDA DAPAT MENGKAJI HUBUNGAN ANTARA DUA ATAU LEBIH VARIABLES ? MENGAPA FREKUENSI TABEL BELUM MEMADAI UNTUK MENJAWAB PERTANYAAN TSB ? APA YANG DIMAKSUD CROSSTABULATION (TABULASI SILANG) ? COUNTING RESPONSES FOR COMBINATIONS OF VARIABLES
    • Sebutkan jenis percentages yang dapat Anda hitung untuk crosstabulation, Dan bagaimana anda memilih Persentase tersebut ? Apa yang dimaksud dependent variable ? Apa yang dimaksud independet variable? Bagaimana kalau anda ingin mengamati Lebih dari dua variabel ? Bagaiman cara anda menggunakan Chart untuk menmenggambarkan Crosstabulation ?
    • Prosedur mean dan explore yang disediakan spss, hanya berguna apabila mean dan standar deviasi merupakan mengukuran yang tepat untuk variabel yang dikaji. Anda tidak dapat menggunakan prosedur mean dan explore untuk mengamati hubungan antara warna mobil yang dikenderai dan daerah, karena tidak bermakna anda mencari mean warna dan derah.
    • Apabila anda ingin mengetahui hubungan antara dua variabel yang bernialai kecil atau catagorical variables, anda dapat menggunakan crosstabu lation, tabel yang berisi cacah/jumlah kominasi nilai dua variabel yang sering muncul. Contoh Anda dapat menghitung berapa wanita dan pria dalam kategori job satisfaction, atau anda dapat mengamati distribusi warna mobil pada suatu daerah.
    • Akan digunakan crosstabulation untuk mengamati hubungan antara job satisfaction dengan total family income, diukur dengan four point scale. Untuk pembahasan tetap digunakan file gss, dan dilab anda menggunakan file umpan balik.
    • Pada gss, responden diminta untuk memilih rentangan nilai yang sesuai dengan famiy income-nya. Tersedia 21 kategori income mulai dari di bawah $1000 (kode 1) sampai $ 75,000 (kode 21). Untuk mengamati hubungan antara income dengan job satis faction, digunakan 4 kategori income yang memiliki jumlah responden yang hampir sama INCOME AND JOB SATISFACTION
    • Digunakan income4, yang berisi data yang disusun dalam quartile katagori. Pada fig. 7.1 terlihat frekuensi distribusi dari 4 kategori income, yang secara kasar 25% responden masuk dalam setiap kategori.
    • GUNAKAN VARIABEL INCOME4
    • GUNAKAN PROSEDUR FREQUENCY
    • FIG 7.1 FREQUENCY TABEL FOR INCOME QUAERTILE UNTUK FULL-TIME EMPLOYEES)
    • Untuk mengamati hubungan antera income dengan job satis fication, dihitung jumlah pada very satisfied, moderately satis fied, dan a little dissatis fied, serta very dissatisfied responden dana masing-masing kategori income. Fig 7.2 menampilkan informasi tersebut.
    • FIG 7.2 CROSSTABULATION OF JOB SATISFACTION BY INCOME
    • Di kolom kanan bawah terdapat totals (174, 194, 156, 223 dan 747), sering disebut marginal totals, disebabkan kerna terletak di margin tabel. Will the marginal totals that i get in a crosstabulation table always be the same as those i wpuld get from frequency tables for the variables individually ?
    • Jawabnya tidak, kalau ada missing values, untuk salah satu dari dua variabel dalam crosstab tsb. Contoh Pada tabel fig 7.2 hanya melibatkan data tanpa missing values, baik untuk income maupun job satisfaction. Kalau menggunakan prosedur frequency untuk income, case dengan missing value disisihkan dari case valid.
    • Statistics Total Family Income in quartiles 1500 0 Valid Missing N Total Family Income in quartiles 585 39,0 39,0 39,0 300 20,0 20,0 59,0 230 15,3 15,3 74,3 385 25,7 25,7 100,0 1500 100,0 100,0 24,999 or less 25,000 to 39,999 40,000 to 59,999 60,000 or more Total Valid Frequency Percent Valid Percent Cumula tive Percent
    • Statistics Job or Housework 1143 357 Valid Missing N Job or Housework 491 32,7 43,0 43,0 472 31,5 41,3 84,3 127 8,5 11,1 95,4 53 3,5 4,6 100,0 1143 76,2 100,0 309 20,6 1 ,1 47 3,1 357 23,8 1500 100,0 Very satisfied Mod satisfied A little dissatisfied Very dissatisfied Total Valid NAP DK NA Total Missing Total Frequency Percent Valid Percent Cumula tive Percent
    • ER Informasi yang dapat dibaca pada crosstab sebagai berikut. 53 respoden dg kategori income terendah menjawab, satisfied dengan pekerjaannya, 90 dari kategori kedua, 74 dari kategori ketiga dan 110 responden dari kategori gaji tertinggi, yang menjawab puas terhdap pekerjaanya. Jumlah tersebut belum dapat digunakan untuk membandingkan SKALA NOMINAL
    • Untuk membandingkan anda harus menggunakan persentase. Setelah diketahui persentasenya, hubungan antara job satisfac tion dan income dapat dijelas kan dengan benar.
    • SKALA PENGUKURANSKALA PENGUKURAN YANG PERLU DIINGATYANG PERLU DIINGAT WHEN ARE STATISTICS APPLICABLE ?WHEN ARE STATISTICS APPLICABLE ? The data type fall into a sort of hierarchy so that any statistic or procedure that is applicable for the lowest type is also applicable for all higher type. The lowest type of data in the hierarchy is called Nominal data .
    • Nominal data, is the type of data that we normally call categorical data. In this type of data the values merely substitutes for names of values. An example of nominal data would be Church. This variable could take on values such as (1) Lutheran , (2) Methodist, (3) Catholic, and (4) Jewish, etc.
    • Alphanumeric data can also be described as nominal data. None of the statistics (mean, variance, range, sum, std err, kurtosis, minimum, std dev, skewness, sum) however Frequencies or Crosstabs are applicable.
    • Bila anda menggunakan skala nomial, maka anda membuat partisi dalam suatu himpunan ke dalam kelompok-2 yg mutually exclusive (mewakili kajadian yang berbeda) dan collectively exhaustic (dapat menjelaskan semua kejadian yg terjadi dalam kelompok tersebut). SKALA NOMINAL
    • VARIABEL NOMINAL Varibel yang ditetapkan berdasar atas proses penggolongan. Variabel nominal bersifat diskrit dan saling pilah (mutually exclusive) antara kategori yang satu dengan kategori yang lain. Contoh: jenis kelamin, status perkawinan, dan jenis pekerjaan
    • The next data types isThe next data types is called Ordinal datacalled Ordinal data Ordinal data This type of data has a particular order to its values. For example a rating on FOOD at a restaurant with values good, fair, dan poor would be ordinal data. Another example of ordinal data would be an opinion survey with answers such as strongly agree, agree, neutral, disagree, strongly disagree.
    • Ordinal data can be ranked from high to low which makes the statistics minimum, maximum, dan rangeminimum, maximum, dan range applicable. Most statisticians agree that the other statistics and procedures such as mean, Pearson corr and regression should not be used with ordinal data.
    • SKALA ORDINAL Mencakup ciri-2 skala nominal ditambah satu yaitu urutan. Skala ordinal dapat dipakai jika postulat mengenai transitivitas dipenuhi. Postulat tsb menyatakan bahwa apabila a lebih besar dari b dan b lebih besar dari c, maka a lebih besar dari c (a>b>c). Urutan yang dapat dipakai adalah : lebih dari………………. kurang dari……………. di atas …………………. di bawah……………….
    • SKALA ORDINAL Contoh skala pendapat, skala preferensi, Statistik yang dapat dipakai: median, persentil (seperseratusan) dan kuartil (seperempatan) menyatakan sebaran nya. Ukuran uji nyata secara statistik menggunakan metode non-para metrik (Steel & Torrie, 19--; hal 533)
    • VARIABEL ORDINALVARIABEL ORDINAL Variabel yang disusun atas jenjang dalam atribut tertentu. Jenjang tertinggi biasanya diberi angka 1, jenjang di bawah nya diberi angka 2, dan seterusnya. Contoh: ranking hasil lomba
    • INTERVAL DATAINTERVAL DATA The third type of data is in interval level data. We frequently call this metric or continues data. In addition to having a order like ordinal data this type of data also as a fixed unit of measurement. An example of an interval level variable would be temperature. This variable is interval since the distance between 30 and 1 degrees is the same as the distance between any other two consecutive degrees.
    • INTERVAL DATA All of the statistics including mean, standard deviation, standard error, variance, kurtosis and skewness are applicable for this kind of data, The procedures Pearson Corr dan Regression are also applicable
    • SKALA INTERVALSKALA INTERVAL Skala interval memiliki keampuhan skala ordinal dan niminal masih ditambah lagi dengan mencakup kesamaan interval (jarak antara 1 dan 2, sama dengan jarak antara 2 dengan 3). Waktu kalender merupakan contoh skala interval. Dapat juga untuk skala sikap. Ukuran sentralnya adalah rata-rata hitung. Prosedur statistik yang dapat dipakai antara lain: korelasi product moment, uji t, dan uji F .
    • VARIABEL INTERVALVARIABEL INTERVAL Variabel yang dihasilkan dari pengukuran, yang di dalam pengukuran itu dasumsikan terdapat satuan pengukuran yang sama . Contoh: prestasi belajar, sikap terhadap……, penghasilan, dsb
    • RATIO DATA The forth and highest type of data in the hierarchy is called ratio data. This type of data has all the properties of ordinal data but has added the additional property of having a zero point in its measurement scheme.
    • SKALA RASIO Memiliki semua keampuhan dari skala nominal, ordinal, dan interval, dan ditambah dengan memiliki titik nol. Skala rasio mencerminkan jumlah yang sebenarnya dari dari suatu variabel.
    • SKALA RASIO Contoh: ukuran dimensi fisik seperti berat, tinggi, jarak dan lsb. Dalam penelitian bisnis banyak ditemui /digunakan skala rasio misalnya: nilai uang, jumlah pupulasi, jarak, jumlah waktu dalam periode waktu. Semua prosedur teknik dapat diterapkan untuk skala rasio.
    • VARIABEL RASIO Variabel yang dalam kuantifi kasinya mempunyai nilai nol mutlak. Di dalam penelitian , terlebih-lebih dalam penelitian ilmu sosial, orang jarang menggunakan variabel rasio.
    • Mode, Median dan Arithmetic Average Mode, Median dan Arithmetic average merupakan pengukuran central tendency yang paling banyak dipakai. Mode diperoleh dengan cara mendapat frekuensi yang paling sering muncul. Mode, karena tidak membutuhkan nilai variabel mempunyai makna, maka sering digunakan untuk skala nominal.
    • Mode jarang dilaporkan sendi rian, biasanya dilengkapi dengan tabel frekuensi dan bar chart. Dengan menggunakan mode kesalahan mudah terjadi apabila digunakan untuk karakteristik variabel. Mode hanya memberikan infor masi sedikit.
    • Apabila anda merangkum suatu variabel yang nilainya dapat diurutkan dari yang kecil ke besar, median akan lebih berguna untuk mengukur central tendency. Urutkan lebih dahulu nilai variabel, kemudian cari nilai yang di tengah.
    • Kelemahan Median, ialah, tidak memanfaatkan seluruh informasi yang tersedia. Misal, diperoleh nilai, 28, 29, 30, 31, dan 32 maka mediannya adalah 30. Untuk nilai 28, 29, 30, 98, dan 190 mendian juga 30. Jelas bahwa angka di atas dan di bawah median diabaikan. Angka 98 dan 190 tidak mempengaruhi nilai median.
    • Ukuran central tendency yang paling sering digunakan adalah arithmetic mean, yang juga disebut sebagai average (rataan, x). Mean meng gunakan semua nilai nyata dari seluruh kasus. Mean dihitung dengan menggunakan rumus Mean = 28+29+30+98+190 = 75 5 (4.1)
    • Can I use the mean for variables that have only two values ? Banyak variabel, seperti yang menjawab pertanyaa ya/tidak atau setuju/tidak setuju, memiliki dua nilai. Biasanya dikodekan dengan 0 dan 1. Maka arithmetic average memberikan proporsi kasus dengan kode 1. Arithmetic mean=0,5 berarti 50% responden menjawab ya.
    • Fig 4.1 berisi descriptive statistics dari prosedur Frequency, untuk variabel age dan education. Dapat diperiksa bahwa rataan umur responden GSS adalah 46,23 tahun, Median 43, lebih rendah dari mean. Lama mengikuti pendidikan mempunyai mean 13,04 dan median 12 tahun. Comparing Mean dan Median
    • Kedua variable tersebut memiliki mean lebih besar dari median. Menyebabnya adalah karena kedua variabel tersebut memiliki tail menuju ke nilai terbesar. Karena responden yang disertakan berumur 18 tahun ke atas, maka angka di bawah 18 tidak diperoleh, umur di atas 18 tahun tidak ada batasnya. Nilai yang tinggi menaikkan mean umur.
    • Fig 4.1 Mean, Median and mode for age and education
    • Apabila distribusi nilai benar-benar simetrik maka mean dan median sama nilainya. Apabila distribusi nilai memiliki long tail (distribusinya disebut skwed) maka mean akan lebih besar dari median apabila tail menuju nilai yang lebih besar, dan sebaliknya.
    • Apabila nilai data berbeda yang besar, maka mean bukan merupakan ukuran central tendency yang baik; disebabkan karena mean dipengaruhi oleh nilai ekstrim yang disebut outliers. Pada kasus demikian lebih baik dilengkapi dengan median, dan sebutkan nilai ekstrim tinggi dan rendah.
    • Ukuran central tendency tidak memberikan informasi mengenai besar perbedaan antar nilai. Misal, mean dan median mempunyai nilai 50; datanya sbb., 50, 50, 50, 50, 50 dan 10, 20, 50, 80, 90. Terlihat bahwa distribusi/ sebaran angka tersebut sangat berbeda. Ukuran variability/keragaman akan memberikan informasi penyebaran angka. Measures of Variability
    • Range adalah ukuran paling sederhana untuk keragaman; yaitu perbedaan (selisih) antara nilai tertinggi dan terendah. Range tidak ada manfaat dihitung untuk variabel nominal; karena nilai/kode untuk varibel nominal tidak dapat diartikan sebagai urutan besar ke kecil dan sebaliknya. Range
    • Pada fig 4.2 dapat diperiksa, variabel age memiliki minimal 18 th, maximum 89 dan range 71 (89-18). Nilai range menunjukkan besar kecilnya perbedaan antara nilai terkecil dan terbesar. Ukuran keragaman yang lebih baik dari range adalah interquartile range.
    • Fig 4.2 Descriptive statistics for age and education
    • Interquartile range adalah jarak antera nilai 75th dan 25 th percentile. Nilai ini berbeda dengan range karena, tidak terpengaruh oleh nilai ekstrim.
    • Ukuran keragamaan yang paling sering adalah variance. Variance berdasar kuadrat jarak antara nilai individu dan mean. Variance dihitung dengan rumus sbb. Variance and Standard Deviation )1N( )xx( Variance 2 − − = ∑ Eq 4.2
    • 5,026Variance )15( 2 )75190.....( 2 )7528( Variance = − −+− = Contoh data : 28,29, 30, 98, dan 190 mean = 75 Eq 4.3
    • er Kalau variance sama dengan 0, maka berarti data memiliki nilai yang sama, sehingga mean juga sama dengan nilai individu. Makin besar nilai variance berarti data nilainya makin tersebar. Pada fig 4.2 variance untuk variabel age = 303,392 tahun; untuk variabel education = 9,452 tahun. Akar variance = standard deviation
    • Nilai standar deviation tergantung pada unit pengukuran untuk variabel tertentu. Misal, standard deviation untuk umur diukur dalam hari akan lebih besar dibanding kalau diukur dengan hari. Coefficient of variation mengeks- presikan standard deviation sebagai persentase dari mean. The Coefficient of Variation
    • Coefficient of variation dihitung dengan rumus sbb. Coefficient satandard dev. of variation = x 100 mean CV = 100% kalau standard deviasi sama dengan mean Eq 4.4
    • CV untuk variabel umur = 37,68%; CV untuk variavel education = 23.54%. Berdasar nilai mean maka umur lebih bervariasi dibandingkan dengan education.
    • Anda dapat menentukan posisi suatu kasus pada distribusi nilai pengamatan dengan cara menghitung/menggunakan standard score atau z score, menggunakan rumus sbb. Standar value - mean score = standar deviation Standard Score Eq 4.5
    • Standard score memberikan informasi berapa standard deviasi jarak kasus terhadap mean (di bawah atau di atas). Kalau kasus memiliki standard score sama dengan 0, maka nilai kasus tersebut sama dengan mean. Kalau Z score sama dengan 1, berarti, kasus, 1 standar deviasi di atas mean, dst.
    • Untuk mendapatkan z score anda dapat menggunakan prosedur Descriptive, z score dapat disim pan sebagai variabel baru. Periksa fig 4.3 dan 4.4
    • Fig 4.3 Descriptive statistics in the Viewer
    • Fig 4.4 Data Editor with standar score saved as a new variable
    • COMPARING GROUPS How can you determine if the values of the summary statistics for a variable differ for subgroups of cases ? 1. Apa yang dimaksud subgrup kasus ? 2. Apa yang dapat anda pelajari dari menghitung rangkuman statistik secara terpisah dari subgrup kasus tersebut ?
    • 3. Bagaimana cara anda dapat membuat grafik mean dari subgrup kasus tersebut ? Telah dibahas penggunaan pro sedur Frequency dan Descriptive untuk menghitung rangkuman statistics untuk kasus yang telah dipelajari (GSS dan Umpan balik).
    • Selain yang telah dibahas tersebut, sering dibutuhkan kemampuan kita untuk membandingkan rangkuman statistik untuk subgrup kasus yang berbeda. Misal 1. Kita ingin membandingkan nilai ujian untuk klas A, B danK. 2. Kita ingin membandingakan nilai mahasiswa putri dan putra. 3. Kita ingin membandingkan nilai mahasiswa putri dan putra untuk klas A, B dan K. Dst
    • Masalah tersebut tidak mudah untuk dijawab dengan menggunakan prosedur Frequency dan Descriptive. Yang dapat membantu adalah prosedur Mean yang dapat diguna kan untuk menghitung rangkuman statistik subgrup. Menggunakan prosedur Mean anda akan dapat membandingkan rataaan education, dan job satisfaction untuk subgrup yang berbeda.
    • Misal untuk variabel Education, anda dapat membadingkan mean education (dalam tahun) dalam sub grup Very satified, Most satified, A little dissatified dan Very dissatisfied. Selanjutnya dalam subgrup tersebut dapat dibandingkan mean untuk subsubgrup male dan female (periksa fig 5.1 dan 5.3).
    • Fig 5.1 Pivoted Means output for education and job satisfaction
    • Fig 5.2 Bar chart of education by job satifaction
    • Layers : Defining subgroups by more than one variable
    • Fig 5.3 Pivoted means output for job satisfaction and gender subgroups
    • COMPARING GROUPS Menggunakan Case selection Menggunakan file gss Membandingkan mean education dalam kelompok Job satisfiction Yang dilibatkan dalam analisis hanya full-time workers Cara mengerjakan periksa caption berikut
    • Memilih kasus - full-time workers---
    • Gunakan select cases
    • Dialog box Select cases--- pilih if condition
    • Ketik syarat, wrkstat = 1 …. 1=Working fulltime
    • Kasus yang tidak memenuhi syarat di coret (/)