CLEANING
DATA PISPK
PENDAHULUAN
Data adalah bagian yang penting dalam suatu
penelitian/ laporan untuk pengambilan keputusan/
kebijakan
Tanpa adanya data, maka tidak dapat memberikan
kesimpulan.
Agar data yang dihasilkan bermutu, salah satu hal
yang perlu diperhatikan adalah proses manajemen
data
DATA
PIS-PK
PROGRAM/
PROFIL
SURVEY
KESEHATAN DAN
SUMBER DATA
LAIN
DATA DASAR
PUSKESMAS
• RISET KESEHATAN
NASIONAL
• RISKESDAS, SIRKESNAS,
RIFASKES
• BPS
• PODES
• dll
MANAJEMEN DATA
MANAJEMEN DATA PISPK
 serangkaian proses
pengelolaan data mentah
hasil Survei Keluarga Sehat
yang bertujuan untuk
mempersiapkan data
sebelum dilakukan analisis
Informasi
Analisis
Cleaning
Data
1.
AnalisisData
Aplikasi
PENTINGNYA MANAJEMEN DATA PIS-PK
Peningkatan
IKS
Capaian
Program
SPM
VALID DAN
RELIABLE
METODE DAN
TEKNIK ANALISIS
HARUS SESUAI
AKURAT, UPTO
DATE (TEPAT
WAKTU), DAN
RELEVAN
KOREKSI &
KONFIRMASI
Intervensi
Diseminsi
KELOLA DENGAN BAIK
• Data cleaning (Pembersihan data) adalah
proses mendeteksi, mengoreksi (atau
menghapus) catatan yang rusak atau
tidak akurat dari kumpulan catatan,
tabel, atau database dengan
mengidentifikasi bagian data yang tidak
lengkap, tidak benar, tidak akurat atau
tidak relevan dan kemudian mengganti,
memodifikasi, atau menghapus data
kotor atau kasar
HAL YANG PERLU DITIN DAK LANJUTI/PERBAIKI
DATA TIDAK
LENGKAP
DATA TAHUN
ANEH
TIDAK ADA KK
DALAM 1 KK
TERDAPAT
LEBIH 1 KK
WANITA KAWIN
10-54
‘HAMIL’
KOSONG
PENDERITA HT
<15 TH
DAN LAINNYA
surveyor melakukan
pengecekan kembali
diaplikasi maupun
kuisioner, apakah
memang data masih
kurang lengkap, dan
perlu dilakukan
perbaikan data
ENTRI TAHUN SURVEY YANG TIDAK SESUAI
Nama Status Tgl lahir Umur bulan Umur tahun Tgl survei
FULANAH Anak 16/01/2019 11 0 01/01/2020
FULAN Anak 10/11/2017 2 2 20/01/2020
FULANAH Istri 10/09/1999 4 20 20/01/2020
FULAN Anak 12/07/2019 4 0 05/12/2019
FULANAH Anak 11/12/2015 46 0 22/10/2019
FULANAH Istri 25/03/1993 0 24 22/05/2017
FULANAH Mertua 12/01/1938 10 81 05/12/2019
FULANAH Istri 05/04/1952 7 67 01/12/2019
FULAN Anak 01/01/0001 0 0 09/02/2018
FULANAH Istri 01/01/0001 0 37 09/02/2018
FULANAH Anak 10/07/0193 0 127 09/02/2018
FULANAH Istri 29/06/1887 0 127 01/08/2018
FULANAH Anak 29/11/1889 0 118 19/10/2018
Ruta 0333 Kepala Keluarga 29/05/2986 0 127 25/03/2019
PERBEDAAN PENGHITUNGAN USIA
TEKNIK CLEANING
•perangkat lunak analisis statistik
(statistical analysis software)
• Microsoft Excel
CLEANING DATA/ PENGECEKAN DATA EXCELL
1. FILTER
Klik Tab DATA kemudian klik FILTER. Setelah itu, kita dapat melihat variable data
apakah ada missing data atau data yang aneh.
Sebagai contoh, Ketika memfilter kolom RW, (L) dapat terlihat RW 0 dan RW dengan angka
ribuan. Sedangkan Ketika memfilter kolom RT, terlihat ada angka -4, 0, dan angka di atas 100.
Perlu diklarifikasi kembali pada surveyor akan kebenaran isiannya, apakah terjadi salah entry.
Cleaning ID
 Untuk pengecekan tanggal lahir, dapat dilakukan dengan filter dan terlihat tanggal lahir dimana tahunnya aneh.
 Untuk pengecekan lanjutan dari tanggal lahir, dapat dilakukan juga pengecekan umur dengan cara membuat kolom sementara yaitu kolom
cek umur (tahun). Kolom semnetara ini hanya untuk mengecek umur saja, jika saat analisis, kolom sementara ini dihapus. Untuk
pengecekan umur, pada kolom sementara tersebut diketiikan rumus =DATEDIF(TANGGAL LAHIR;TANGGAL SURVEI;"Y"). Penggunaan tanda
titik koma (;) pada rumus tergantung setting dari laptop/computer, jika tidak bisa dapat dicoba dengan tanda (,).
a. Jika terdapat “#VALUE!” perlu di cek kembali tanggal lahir nya, biasanya angkanya aneh. Perlu diklarifikasi kembali pada surveyor
akan kebenaran isian data.
b. Jika terdapat “#NUM!” berarti tanggal survei lebih dulu dibandingkan tanggal lahir (dilakukan survei sebelum lahir).
AR
Cleaning Data Error
Untuk melihat data yang aneh pada kolom diagnosis hipertensi (BH) dengan:
1. Filter kolom Umur (Tahun) 0 – 14 tahun
2. Filter kolom Diagnosis Hipertensi untuk isian “Y dan T”
3. Jika terdapat isian “Y dan T” maka di cek Kembali karena seharusnya terisi N
Cleaning Variabel
- HIPERTENSI
Untuk melihat data aneh pada
wanita kawin usia 10-54 tapi isian
pertanyaan hamil kosong dilakukan
dengan cara:
1. Filter kolom umur (10-54 tahun)
2. Filter kolom jenis kelamin
(perempuan)
- Kehamilan
Untuk melihat data aneh pada
wanita kawin usia 10-54 tapi isian
pertanyaan hamil kosong
dilakukan dengan cara:
3. Filter status kawin (kawin)
4. Filter kolom wanita usia hamil,
seharusnya tidak boleh ada yang
blank atau kosong maupun N
Pivot table digunakan untuk merangkum data dalam jumlah yang besar dengan waktu yang singkat.
Sebagai contoh, untuk melihat data dimana satu keluarga terdiri dari lebih dari 1 kepala keluarga maupun
satu keluarga tidak ada kepala keluarga.
Langkah-Langkah Pivot Table:
 Drag semua data (taruh kursor pada cell A1 kemudian tekan bersama tombol shift + ctrl + panah
kanan (> atau  dan shift + ctrl + panah bawah (v atau ).
 Klik TAB insert  Pivot Table  Ok
 Masukan Survei ID pada fields “Rows” dan hubungan Keluarga pada fields “Values” dan
fields“columns”
 Kemudian Copy Paste Value Pivot table tersebut ke sheet baru dan filter kolom kepala
keluarga
 Nanti akan terlihat data yang blank dan jumlah kepala keluarga lebih dari 1, hal ini harus di cek
kembali pada Surveyor.
2.PIVOT TABLE
• Setelah difilter pada kolom kepala keluarga, akan
terlihat dimana kepala keluarga ada yang lebih dari 1
maupun yang tidak ada kepala keluarga sama sekali
dalam satu keluarga
Setelah data selesai dicleaning, data siap untuk dianalisis.
Hal-hal Penting Terkait Data Cleaning
 Buat salinan data asli di lembar kerja (workbook)
terpisah
 Manajemen dokumen pada saat proses data cleaning
juga perlu diperhatikan, usahakan tiap tahap cleaning
disimpan dalam dokumen yang baru dan di back up
secara reguler.
Dokumentasi Perubahan
Serangkaian proses data cleaning yang diterapkan pada suatu data sebaiknya
dicatat atau didokumentasikan.
Hal tersebut bertujuan untuk:
1. Menjaga kualitas data
2. Menghindari duplikasi pemeriksaan oleh data cleaner
(orang yang melakukan data cleaning) yang berbeda
3. Memperbaiki kesalahan dalam proses data cleaning
4. Menentukan kelayakan data untuk digunakan 
5. Menginformasikan kepada pengguna data yang mungkin
telah menggunakan data agar dapat mengetahui
perubahan apa yang telah dibuat sejak terakhir kali
mengakses data
NO KK NIK IDENTIFIKASI
MASALAH
RENCANA
TINDAK
LANJUT
TINDAK
LANJUT
WAKTU
CLEANING
KETERANGAN
ontoh Formulir Dokumentasi Perubahan Data Cleaning
BULAN :
NO JUMLAH
DATA
JUMLAH
DATA
CLEANING
IDENTIFIKASI
MASALAH
RENCANA
TINDAK
LANJUT
TINDAK
LANJUT
WAKTU
CLEANING
KETERANGAN
1 5000 200 KESALAHAN ID
RT RW
KLARIFIKASI /
VERIFIKASI
TELAH
DILAKUK
AN
KLARIFIK
ASI DAN
UPDATIN
G
25 JUNI 2022
TERIMAKASIH

CLEANING DATA PISPK SUMENEP JUNI 2022.pptx

  • 1.
  • 2.
    PENDAHULUAN Data adalah bagianyang penting dalam suatu penelitian/ laporan untuk pengambilan keputusan/ kebijakan Tanpa adanya data, maka tidak dapat memberikan kesimpulan. Agar data yang dihasilkan bermutu, salah satu hal yang perlu diperhatikan adalah proses manajemen data
  • 3.
    DATA PIS-PK PROGRAM/ PROFIL SURVEY KESEHATAN DAN SUMBER DATA LAIN DATADASAR PUSKESMAS • RISET KESEHATAN NASIONAL • RISKESDAS, SIRKESNAS, RIFASKES • BPS • PODES • dll MANAJEMEN DATA
  • 4.
    MANAJEMEN DATA PISPK serangkaian proses pengelolaan data mentah hasil Survei Keluarga Sehat yang bertujuan untuk mempersiapkan data sebelum dilakukan analisis
  • 5.
    Informasi Analisis Cleaning Data 1. AnalisisData Aplikasi PENTINGNYA MANAJEMEN DATAPIS-PK Peningkatan IKS Capaian Program SPM VALID DAN RELIABLE METODE DAN TEKNIK ANALISIS HARUS SESUAI AKURAT, UPTO DATE (TEPAT WAKTU), DAN RELEVAN KOREKSI & KONFIRMASI Intervensi Diseminsi KELOLA DENGAN BAIK
  • 6.
    • Data cleaning(Pembersihan data) adalah proses mendeteksi, mengoreksi (atau menghapus) catatan yang rusak atau tidak akurat dari kumpulan catatan, tabel, atau database dengan mengidentifikasi bagian data yang tidak lengkap, tidak benar, tidak akurat atau tidak relevan dan kemudian mengganti, memodifikasi, atau menghapus data kotor atau kasar
  • 7.
    HAL YANG PERLUDITIN DAK LANJUTI/PERBAIKI DATA TIDAK LENGKAP DATA TAHUN ANEH TIDAK ADA KK DALAM 1 KK TERDAPAT LEBIH 1 KK WANITA KAWIN 10-54 ‘HAMIL’ KOSONG PENDERITA HT <15 TH DAN LAINNYA surveyor melakukan pengecekan kembali diaplikasi maupun kuisioner, apakah memang data masih kurang lengkap, dan perlu dilakukan perbaikan data
  • 8.
    ENTRI TAHUN SURVEYYANG TIDAK SESUAI
  • 9.
    Nama Status Tgllahir Umur bulan Umur tahun Tgl survei FULANAH Anak 16/01/2019 11 0 01/01/2020 FULAN Anak 10/11/2017 2 2 20/01/2020 FULANAH Istri 10/09/1999 4 20 20/01/2020 FULAN Anak 12/07/2019 4 0 05/12/2019 FULANAH Anak 11/12/2015 46 0 22/10/2019 FULANAH Istri 25/03/1993 0 24 22/05/2017 FULANAH Mertua 12/01/1938 10 81 05/12/2019 FULANAH Istri 05/04/1952 7 67 01/12/2019 FULAN Anak 01/01/0001 0 0 09/02/2018 FULANAH Istri 01/01/0001 0 37 09/02/2018 FULANAH Anak 10/07/0193 0 127 09/02/2018 FULANAH Istri 29/06/1887 0 127 01/08/2018 FULANAH Anak 29/11/1889 0 118 19/10/2018 Ruta 0333 Kepala Keluarga 29/05/2986 0 127 25/03/2019 PERBEDAAN PENGHITUNGAN USIA
  • 10.
    TEKNIK CLEANING •perangkat lunakanalisis statistik (statistical analysis software) • Microsoft Excel
  • 11.
    CLEANING DATA/ PENGECEKANDATA EXCELL 1. FILTER Klik Tab DATA kemudian klik FILTER. Setelah itu, kita dapat melihat variable data apakah ada missing data atau data yang aneh.
  • 12.
    Sebagai contoh, Ketikamemfilter kolom RW, (L) dapat terlihat RW 0 dan RW dengan angka ribuan. Sedangkan Ketika memfilter kolom RT, terlihat ada angka -4, 0, dan angka di atas 100. Perlu diklarifikasi kembali pada surveyor akan kebenaran isiannya, apakah terjadi salah entry. Cleaning ID
  • 13.
     Untuk pengecekantanggal lahir, dapat dilakukan dengan filter dan terlihat tanggal lahir dimana tahunnya aneh.  Untuk pengecekan lanjutan dari tanggal lahir, dapat dilakukan juga pengecekan umur dengan cara membuat kolom sementara yaitu kolom cek umur (tahun). Kolom semnetara ini hanya untuk mengecek umur saja, jika saat analisis, kolom sementara ini dihapus. Untuk pengecekan umur, pada kolom sementara tersebut diketiikan rumus =DATEDIF(TANGGAL LAHIR;TANGGAL SURVEI;"Y"). Penggunaan tanda titik koma (;) pada rumus tergantung setting dari laptop/computer, jika tidak bisa dapat dicoba dengan tanda (,). a. Jika terdapat “#VALUE!” perlu di cek kembali tanggal lahir nya, biasanya angkanya aneh. Perlu diklarifikasi kembali pada surveyor akan kebenaran isian data. b. Jika terdapat “#NUM!” berarti tanggal survei lebih dulu dibandingkan tanggal lahir (dilakukan survei sebelum lahir). AR Cleaning Data Error
  • 14.
    Untuk melihat datayang aneh pada kolom diagnosis hipertensi (BH) dengan: 1. Filter kolom Umur (Tahun) 0 – 14 tahun 2. Filter kolom Diagnosis Hipertensi untuk isian “Y dan T” 3. Jika terdapat isian “Y dan T” maka di cek Kembali karena seharusnya terisi N Cleaning Variabel - HIPERTENSI
  • 15.
    Untuk melihat dataaneh pada wanita kawin usia 10-54 tapi isian pertanyaan hamil kosong dilakukan dengan cara: 1. Filter kolom umur (10-54 tahun) 2. Filter kolom jenis kelamin (perempuan) - Kehamilan
  • 16.
    Untuk melihat dataaneh pada wanita kawin usia 10-54 tapi isian pertanyaan hamil kosong dilakukan dengan cara: 3. Filter status kawin (kawin) 4. Filter kolom wanita usia hamil, seharusnya tidak boleh ada yang blank atau kosong maupun N
  • 17.
    Pivot table digunakanuntuk merangkum data dalam jumlah yang besar dengan waktu yang singkat. Sebagai contoh, untuk melihat data dimana satu keluarga terdiri dari lebih dari 1 kepala keluarga maupun satu keluarga tidak ada kepala keluarga. Langkah-Langkah Pivot Table:  Drag semua data (taruh kursor pada cell A1 kemudian tekan bersama tombol shift + ctrl + panah kanan (> atau  dan shift + ctrl + panah bawah (v atau ).  Klik TAB insert  Pivot Table  Ok  Masukan Survei ID pada fields “Rows” dan hubungan Keluarga pada fields “Values” dan fields“columns”  Kemudian Copy Paste Value Pivot table tersebut ke sheet baru dan filter kolom kepala keluarga  Nanti akan terlihat data yang blank dan jumlah kepala keluarga lebih dari 1, hal ini harus di cek kembali pada Surveyor. 2.PIVOT TABLE
  • 18.
    • Setelah difilterpada kolom kepala keluarga, akan terlihat dimana kepala keluarga ada yang lebih dari 1 maupun yang tidak ada kepala keluarga sama sekali dalam satu keluarga Setelah data selesai dicleaning, data siap untuk dianalisis.
  • 19.
    Hal-hal Penting TerkaitData Cleaning  Buat salinan data asli di lembar kerja (workbook) terpisah  Manajemen dokumen pada saat proses data cleaning juga perlu diperhatikan, usahakan tiap tahap cleaning disimpan dalam dokumen yang baru dan di back up secara reguler.
  • 20.
    Dokumentasi Perubahan Serangkaian prosesdata cleaning yang diterapkan pada suatu data sebaiknya dicatat atau didokumentasikan. Hal tersebut bertujuan untuk: 1. Menjaga kualitas data 2. Menghindari duplikasi pemeriksaan oleh data cleaner (orang yang melakukan data cleaning) yang berbeda 3. Memperbaiki kesalahan dalam proses data cleaning 4. Menentukan kelayakan data untuk digunakan  5. Menginformasikan kepada pengguna data yang mungkin telah menggunakan data agar dapat mengetahui perubahan apa yang telah dibuat sejak terakhir kali mengakses data
  • 21.
    NO KK NIKIDENTIFIKASI MASALAH RENCANA TINDAK LANJUT TINDAK LANJUT WAKTU CLEANING KETERANGAN ontoh Formulir Dokumentasi Perubahan Data Cleaning BULAN : NO JUMLAH DATA JUMLAH DATA CLEANING IDENTIFIKASI MASALAH RENCANA TINDAK LANJUT TINDAK LANJUT WAKTU CLEANING KETERANGAN 1 5000 200 KESALAHAN ID RT RW KLARIFIKASI / VERIFIKASI TELAH DILAKUK AN KLARIFIK ASI DAN UPDATIN G 25 JUNI 2022
  • 22.