Dokumen ini memberikan penjelasan tentang proses cleaning data yang meliputi tahapan-tahapannya seperti editing, coding, processing, dan cleaning data. Langkah-langkah cleaning data mencakup mendeteksi data yang tidak lengkap, tidak akurat, atau tidak relevan kemudian memperbaikinya. Metode yang digunakan antara lain filtering dan pivot table pada Microsoft Excel untuk menemukan data yang perlu diverifikasi kembali kepada surveyor. Setelah selesai dicleaning, data siap
2. APA ITU DATA ???
Bentuk jamak dari Datum artinya himpunan hasil dari penghitungan
atau pengukuran, bisa dalam bentuk numerik (umur, berat badan) dan
kategorik (jenis kelamin, tingkat pendidikan) dsb.
Data bisa berwujud suatu keadaan, gambar, suara, huruf, angka,
bahasa ataupun simbol-simbol lainnya.
Data dapat berupa catatan-catatan dalam kertas, buku, atau tersimpan
sebagai file dalam database
Data belum dapat berbicara banyak sebelum diolah lebih lanjut.
2
3. MANAJEMENDA
T
A
Rangkaian kegiatan pengelolaan data
mulai dari kegiatan pencatatan,
pengumpulan, pengolahan, analisis data
hingga menjadi suatu informasi
3
Langkah-langkah statistika
Pengumpulan
data
Pengolahan
data
Analisis &
interpretasi
data
Penyajian
data
4. TAHAPANPENGOLAHANDATA
A. Editing
Memeriksa kelengkapan dan kebenaran isi formulir/ kuesioner :
lengkap terisi, jelas terbaca, relevan antara pertanyaan dengan
jawaban
B. Coding
Pengubahan jawaban pertanyaan yg berisi huruf kedalam bentuk angka:
Misal data pendidikan dikoding: 1=sd 2=smp , dst
C.Processing
Memindahkan isi kuesioner ke media komputer: mis ,ke dalam Microsoft
excel
D. Cleaning Data
Mengecek kebenaran entry data sehingga data siap untuk dianalisis
4
5. CLEANINGDATA
• Data cleaning (Pembersihan data) adalah proses
mendeteksi, mengoreksi (atau menghapus) catatan yang
rusak atau tidak akurat dari kumpulan catatan, tabel, atau
database dengan mengidentifikasi bagian data yang tidak
lengkap, tidak benar, tidak akurat atau tidak relevan dan
kemudian mengganti, memodifikasi, atau menghapus
data kotor atau kasar.
5
6. HALY
ANGPERLUDITINDAKLANJUTI/
PERBAIKI
1.menemukan data yang tidak lengkap
2.menemukan tahun data yg aneh
3.tidak ada kepala keluarga
4.di dalam 1 KK terdapat lebih dari 1 Kepala Keluarga
5.ada wanita kawin 10-54 tapi isian jawaban pertanyaan
hamil “kosong”
6.Ada hipertensi pada usia <15 DLL
surveyor melakukan pengecekan kembali diaplikasi maupun
kuisioner, apakah memang data masih kurang lengkap, dan
perlu dilakukan perbaikan data 6
8. • Sebagai contoh, Ketika memfilter kolom RW, dapat terlihat RW 0 dan RW
dengan angka ribuan. Sedangkan Ketika memfilter kolom RT, terlihat ada
angka -4, 0, dan angka di atas 100. Perlu diklarifikasi kembali pada
surveyor akan kebenaran isiannya, apakah terjadi salah entry.
8
9. No urut keluarga blank (tidak terisi), dicek Kembali apakah
terlupa saat entri?
9
10. Untuk melihat data ART dalam satu keluarga, maka filter
dilakukan per survei ID. 1 survei ID berlaku untuk 1 keluarga.
10
11. 11
Untuk pengecekan tanggal lahir, dapat dilakukan dengan filter dan terlihat tanggal lahir dimana
tahunnya aneh.
Untuk pengecekan lanjutan dari tanggal lahir, dapat dilakukan juga pengecekan umur dengan
cara membuat kolom sementara yaitu kolom cek umur (tahun). Kolom semnetara ini hanya
untuk mengecek umur saja, jika saat analisis, kolom sementara ini dihapus. Untuk pengecekan
umur, pada kolom sementara tersebut diketiikan rumus =DATEDIF(TANGGAL
LAHIR;TANGGAL SURVEI;"Y"). Penggunaan tanda titik koma (;) pada rumus tergantung
setting dari laptop/computer, jika tidak bisa dapat dicoba dengan tanda (,).
a. Jika terdapat “#VALUE!” perlu di cek kembali tanggal lahir nya, biasanya angkanya
aneh. Perlu diklarifikasi kembali pada surveyor akan kebenaran isian data.
b. Jika terdapat “#NUM!” berarti tanggal survei lebih dulu dibandingkan tanggal lahir
(dilakukan survei sebelum lahir).
12. 12
Untuk melihat data yang aneh pada kolom diagnosis hipertensi dengan:
1. Filter kolom Umur (Tahun) 0 – 14 tahun
2. Filter kolom Diagnosis Hipertensi untuk isian “Y dan T”
3. Jika terdapat isian “Y dan T” maka di cek Kembali karena seharusnya
terisi N
13. 13
Untuk melihat data aneh pada wanita kawin usia
10-54 tapi isian pertanyaan hamil kosong
dilakukan dengan cara:
1.Filter kolom umur (10-54 tahun)
2.Filter kolom jenis kelamin (perempuan)
3.Filter status kawin (kawin)
4.Filter kolom wanita usia hamil, seharusnya tidak
boleh ada yang blank atau kosong maupun N
15. 15
2. PIVOT TABLE
Pivot table digunakan untuk merangkum data dalam jumlah yang besar
dengan waktu yang singkat. Sebagai contoh, untuk melihat data dimana
satu keluarga terdiri dari lebih dari 1 kepala keluarga maupun satu keluarga
tidak ada kepala keluarga.
Langkah-Langkah Pivot Table:
Drag semua data (taruh kursor pada cell A1 kemudian tekan bersama
tombol shift + ctrl + panah kanan (> atau dan shift + ctrl + panah bawah
(v atau ).
Klik TAB insert Pivot Table Ok
Masukan Survei ID pada fields “Rows” dan hubungan Keluarga
pada fields “Values” dan fields“columns”
Kemudian Copy Paste Value Pivot table tersebut ke sheet baru dan filter
kolom kepala keluarga
Nanti akan terlihat data yang blank dan jumlah kepala keluarga lebih dari
1, hal ini harus di cek kembali pada Surveyor.
16. 16
Setelah difilter pada kolom kepala
keluarga, akan terlihat dimana kepala
keluarga ada yang lebih dari 1 maupun
yang tidak ada kepala keluarga sama
sekali dalam satu keluarga
17. 17
Setelah data selesai dicleaning, data siap untuk dianalisis. Terdapat 2(dua)
cara analisis, yaitu:
• Analisis Dengan Excel Inarata
• Analisis Dengan Spss
Untuk analisis dengan SPSS, harus dilakukan import data
excel ke SPSS.
Langkah-Langkah import data excel ke SPSS:
1. Buka aplikasi SPSS
2. Klik file Import Data Excel
3. Pilih excel file excel yang akan diimport kemudian klik open, maka
data akan terlihat pada layar SPSS.
4. Klik file save as (pilih tipe save as dengan .sav)