2. PENGANTAR PENGOLAHAN DATA
Agar analisis penelitian menghasilkan informasi yang benar, paling tidak
ada empat tahapan dalam pengolahan data yang harus dilalui
• kegiatan untuk melakukan pengecekan isian kuesioner apakah jawaban yang ada
sudah: lengkap, jelas, relevan, konsisten1. Editing
• Coding merupakan kegiatan merubah data berbentuk huruf menjadi data berbentuk
angka/bilangan. Misalnya untuk variabel pendidikan dilakukan koding 1 = SD, 2 = SMP,
3 = SMU dan 4 = PT
2. Coding
• Pemrosesan data dilakukan dengan cara meng-entry data dari kuesioner ke paket
program komputer. Salah satu paket program untuk entry data adalah paket SPSS.
3.
Processing
• Pengecekan kembali data yang sudah di-entry. Kesalahan terjadi pada saat kita meng-entry ke
komputer Misalnya untuk variabel pendidikan ada data yang bernilai 7, mestinya berdasarkan
coding yang ada pendidikan kodenya hanya antara 1 s.d. 4 (1=SD, 2=SMP, 3=SMU dan 4=PT).
4.
Cleaning
3. ENTRY DATA
Di dalam operasionalnya, SPSS mengenal 2 jenis jendela (Window)
yang utama yaitu:
SPSS Data Editor
• Jendela ini berisis tampilan data yang kita
olah dan analisis dengan tampilan sejenis
Spreadsheet (seperti tampilan Program
Excel).
SPSS Output
• Hasil olahan (hasil analisis) yang anda
lakukan akan ditampilkan pada Output
window. Window ini merupakan teks editor,
artinya dapat mengedit hasil analisis yang
ditampilkan.
4. STRUKTUR DATA di SPSS
Agar dapat diolah dengan SPSS, data harus mempunyai struktur, format
dan jenis tertentu. Dalam SPSS (dan yang umum terjadi pada program lain),
data yang diolah tersusun berdasarkan kolom dan baris. Tiap kolom
melambangkan satu variabel (dalam data base dikenal Field), misalnya tiap
pertanyaan pada kuesioner menunjukkan satu variabel. Tiap baris data
dinamakan case (kasus/responden) sebagaimana istilah record di Data Base.
6. b. Tampilan variabel (1)
File: digunakan untuk
membuat file data baru,
membuka file data yang
telah tersimpan (ekstensi
SAV), atau membaca file
data dari program lain,
seperti dbase, excell dll.
Edit: digunakan untuk memodifikasi, mengcopy, menghapus, mencari, dan mengganti data.
View: digunakan untuk mengatur tampilan font, tampilan kode/label
Data: digunakan untuk membuat/mendefinisikan nama variabel, mengambil/menganalisis
sebagian data, menggabungkan data.
Transform: digunakan untuk transformasi/modifikasi data seperti pengelompokan variabel,
pembuatan variabel baru dari perkalian/penjumlahan variabel yang ada dll.
Analyze: digunakan untuk memilih berbagai prosedur statistik, dari statistik
sederhana (deskriptif) sampai dengan analisis statistik komplek (multivariat).
7. b. Tampilan variabel (2)
Graphs: digunakan untuk membuat grafik meliputi grafik Bar, Pie, garis, Histogram, scatter
plot dsb.
Utilities: digunakan untuk menampilkan berbagai informasi tentang isi file.
Window: digunakan untuk berpindah-pindah antar jendela, misalnya dari jendela data ke
jendela output.
Help: memuat informasi bantuan bagaimana menggunakan berbagai fasilitas pada SPSS.
8. MEMASUKAN DATA
Entry data dapat langsung dilakukan pada data editor. Data editor memiliki bentuk
tampilan sejenis spreadsheet (seperti Excel) yang digunakan sebagai fasilitas untuk
memasukkan/engisikan data. Ada tiga hal yang harus diperhatikan:
Baris
• menunjukkan
kasus/responden
Kolom
• menunjukkan
variabel
Sel
• merupakan perpotongan antara kolom dan baris
menunjukkan nilai/data
Memberi nama
variabel
Mendefinisi
kan tipe
variabel
Mendefinisi
kan adanya
desimal
Memberi
label
variabel
Memberi
value label
Dalam memasukan data ke SPSS, ada 4 hal yang harus dieperhatikan:
9. a. Memberi Nama Variabel
Pertama kali yang harus dilakukan pada saat entry data adalah memberi
nama variabel. Satu variabel mewakili/melambangkan satu pertanyaan.
Agar tidak menemui kesulitan dalam membuat nama variabel, berikut
akan diuraikan ketentuan / persyaratan nama variabel:
Nama variabel maksimum berisi 8 huruf/karakter, untuk SPSS
versi 13 jumlah karakter dapat lebih dari 8 huruf
Nama variabel tidak boleh ada spasi
Nama variabel tidak ada yang sama ( tidak boleh ada 2 atau
lebih variabel yang memiliki nama sama)
10. b. Mendefinisikan Tipe Variabel
Tipe data harus ditentukan kalau kita akan memasukan data di SPSS,
adapun jenis tipenya antara lain:
• 1. Numerik untuk data berbentuk angka/nomer
• 2. String untuk data berbentuk huruf
• 3. Date untuk data berbentuk date/tanggal
• 4. dll….
Tipe Data
Note: yang sering digunakan adalah tipe Numerik, karena data yang
akan kita olah biasanya berbentuk angka.
11. c. Mendefinisikan Adanya Desimal
Kebanyakan data penelitian berbentuk tidak ada desimal, oleh
karena itu untuk data yang tidak ada desimal kita harus seting di
SPSS isian jumlah desimal diberi angka 0 atau dikosongkan.
Bila data yang akan dimasukkan berbentuk dsimal, seperti kadar
HB, maka perlu ditentukan berapa desimal yang kita inginkan.
SPSS secara default/standar memberikan dua angka desimal
untuk setiap data yang akan di entry.
12. d. Memberi Label Variabel
Nama variabel biasanya tertulis dengan kata/huruf yang singkat, pada
bagian ini kita dapat menuliskan keterangan nama variabel sehingga dapat
memperjelas arti dari masing-masing variabel. Misalnya nama variabel BWT
diberi label “Berat badan bayi pada saat lahir dalam satuan gram” dan bisa
juga deskripsi jelas.
13. e. Memberi Value Label
Untuk variabel yang berbentuk koding kita harus memberi keterangan
untuk setiap kode yang ada dalam kode tsb, misalnya untuk variabel
Sex, 0 = pria dan 1 = wanita.
16. analisis merupakan kegiatan
meringkas kumpulan data
menjadi ukuran tengah dan
ukuran variasi.
Selanjutnya membandingkan
gambaran-gambaran tersebut
antara satu kelompok subyek &
kelompok subyek lain, sesuai
dengan tujuan yang ingin dicapai
dalam analisis.
1. Peringkasan Data
Untuk Data Jenis Numerik
17. a. Ukuran Tengah
Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil pengukuran.
Berbagai ukuran dikembangkan untuk mencerminkan ukuran tengah tersebut, dan
yang paling sering dipakai adalah mean, median dan mode/modus.
Mean
Median
modus
Bila nilai mean > median > mode,
maka bentuk distribusi datanya
menceng/miring ke kanan
Bila nilai mean < median < mode,
maka bentuk distribusi datanya
menceng /miring ke kiri
18. b. Nilai-nilai/Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau dengan kata
lain hasil pengamatan akan bervariasi. Untuk menegtahui seberapa jauh data bervariasi
digunakan ukuran variasi antara lain range, jarak linier kuartil dan standard deviasi.
Standar Deviasi Range Jarak Inter Quartil
suatu ukuran variasi yang
mempunyai satuan yang
sama dengan satuan
pengamatan
Seperti halnya varian,
semakin besar SD semakin
besar variasinya. Apabila
tidak ada variasi, maka
SD=0
KESIMPULAN: untuk data numerik digunakan nilai mean (rata-
rata), median, standard deviasi dan inter quartil range, minimal
dan maksimal.
Bila data yang terkumpul tidak menunjukkan adanya nilai
ekstrim (distribusi normal), maka perhitungan nilai mean dan
standard deviasi merupakan cara analisis univariat yang tepat.
Bila dijumpai nilai ekstrim (distribusi data tidak normal), maka
nilai median dan inter quartil range (IQR) yang lebih tepat
dibandingkan nilai mean
19. DISTRIBUSI DATA NORMAL
Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal),
maka perhitungan nilai mean dan standar deviasi (SD) merupakan cara analisis
univariat yang tepat.
X (kg) |x - | (x - )2
48 9 81
52 5 25
56 1 1
62 5 25
67 10 100
285
x x Mean = 48+52+56+62+ 67 = 57 kg
5
Varians = V = s2
V = 81+25+1+25+100 = 58 kg
4
Standar deviasi adalah akar dari varian.
Nilai standar deviasi disebut juga dengan “SIMPANGAN BAKU”
karena merupakan patokan luas area di bawah kurva normal
Rumus: s = √ V = √ s2
S = √58 = √7,6 kg
20.
21. Kurva mana yang mempunyai standar deviasi lebih tinggi?
A
B
Fungsi STANDAR DEVIASI
•Untuk mengetahui besar perbedaan dari nilai sampel terhadap rata-rata.
•Untuk menyatakan keragaman sampel.
•Untuk membantu mendapatkan data dari suatu populasi.
•Mengukur tingkat kepercayaan pada kesimpulan statistik.
22.
23. Uji Kenormalan Data
Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya yaitu:
Dilihat dari grafik
histogram dan kurve
normal
bila bentuknya
menyerupai bel
shape, berarti
distribusi normal
Menggunakan nilai
Skewness dan
standar errornya
bila nilai
Skewness dibagi
standar errornya
menghasilkan
angka ≤ 2, maka
distribusinya
normal
Uji kolmogorov
smirnov
bila hasil uji
signifkan
(p value < 0,05)
maka distribusi
normal.
Lihat halaman
84 buku
ANALISIS DATA
24. DISTRIBUSI DATA TIDAK NORMAL
Bila dijumpai nilai ekstrim (distribusi data tidak normal), maka nilai median dan
inter quartil range (IQR) yang lebih tepat dibandingkan nilai mean
26. Contoh Penyajian data Numerik
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 2019
Variabel Mean Median SD Min-Max 95% CI
Umur 25,10 31,1 10,1 17 – 60 23,72 – 26,48
Cara Interpretasi: Hasil analisis didapatkan rata-rata umur
pasien adalah 25,10 tahun (95% CI: 23,72 – 26,48), dengan
standar deviasi 10,1 tahun. Umur termuda 17 tahun dan
umur tertua 60 tahun. Dari hasil estimasi interval dapat
disimpulkan bahwa 95% diyakini bahwa rata-rata umur
pasien adalah diantara 23,72 sampai dengan 26,48 tahun.
27. 2. Peringkasan Data
Untuk Data Kategorik
Pada data katagorik peringkasan data
hanya menggunakan distribusi
frekuensi dengan ukuran
persentase atau proporsi. Bila data
berjenis katagorik, tentunya
informasi/ peringkasan yang penting
disampaikan tidak mungkin/tidak
lazim menggunakan ukuran mean
atau median. melainkan informasi
jumlah dan persentase yang disajikan.
28. Contoh Penyajian data Kategorik
Distribusi Responden menurut Tingkat Pendidikan
Pasien Rumah sakit X Tahun 2019
Pendidikan Jumlah Persentase (%)
SD 10 20,0
SMP 11 22,0
SMA 16 32,0
PT 13 26,0
Total 50 100,0
Cara Interpretasi: Distribusi tingkat pendidikan responden hampir merata untuk
masing-masing tingkat pendidikan. Paling banyak responden berpendidikan SMU
yaitu 16 orang (32,0%) sedangkan untuk pendidikan SD, SMP dan PT masing-masing
20,0%, 22,0%, dan 26,0%.