SlideShare a Scribd company logo
1 of 37
Download to read offline
PERTEMUAN 9 – DATA
WAREHOUSE
Data Quality
Dedi Darwis, M.Kom.
OUTLINE
 Mengapa Kualitas Data Penting?
 Tantangan Kualitas Data
 Kakas Bantu Kualitas Data
 Inisiatif Kualitas Data
PENTINGNYA KUALITAS DATA
 Kualitas Data di DW > Sistem Operasional Biasa
 Kepentingan:
 Meningkatkan kepercayaan diri dalam pengambilan keputusan
 Customer Service bisa lebih baik
 Meningkatkan kesempatan tambahan added value dalam layanan
 Mengurangi risiko keputusan buruk
 Mengurangi cost, khususnya di kampanye marketing
 Meningkatkan strategi pengambilan keputusan
 Menghindari akibat data tercemar
KUALITAS DATA?
 Data Quality ? Data Accuracy
DATA QUALITY
 Accuracy
 Domain Integrity
 DataType
 Consistency
 Redundansi
 Kelengkapan
 Duplikat
 Kesinambungan aturan bisnis
 Ketentuan Struktural
DATA QUALITY
 Anomali Data
 Kejelasan Makna Data
 Berwaktu
 Manfaat
 Kesinambungan dengan Aturan Integritas Data
MANFAAT KUALITAS DATAYANG BAIK
 Analisis Informasi Berwaktu
 Promosi Musiman
 Pelayanan Pelanggan yang Lebih Baik
 Mengetahui lebih cepat mengenai keadaan pelanggan
 Kesempatan Baru
 Penjualan lintas-apapun
 Marketing tepat sasaran
 Berkurangnya biaya dan risiko
 Terbuangnya waktu
 Kesalahan proses dan sistem
 Kesalahan aksi pelanggan dan rekan bisnis
MANFAAT KUALITAS DATAYANG BAIK
 Produktivitas yang Meningkat
 Adanya pandangan luas mengenai perusahaan
 Pengambilan Keputusan Strategis yang Reliable
 Keputusan yang diambil berdasarkan informasi yang masuk akal
JENIS PERMASALAHAN KUALITAS DATA
JENIS PERMASALAHAN KUALITAS DATA
 Nilai Dummy dalam Kolom
 Nilai yang dibiarkan begitu saja untuk tes awal namun lupa dihapus/dikoreksi
 Ex: Kode Pos 00000
 Hilangnya nilai data
 MissingValue
 Penggunaan Kolom yangTidak Resmi/Unofficial
 Komentar pada komentar pelanggan
 Nilai Cryptic/Kode
 Masalah di sistem lawas, contoh: Status pelanggan: R=Regular, N=New
JENIS PERMASALAHAN KUALITAS DATA
 Nilai yang bertentangan
 Kode Pos dan Alamat yang bertentangan
 Pelanggaran Aturan Bisnis
 Hari kerja+hari liburan+libur bersama+cuti sakit <=365 atau <=366
 Pengulangan Primary Key
 Penggunaan angka dengan ukuran 5-bit, jika customer > 100.000, key akan diulang
 ID non unik
 Kode Produk X di penjualan = 355, tetapi di akuntansi = A226
JENIS PERMASALAHAN KUALITAS DATA
 NilaiTidak Konsisten
 Sistem yang menggunakan kode: 1, 2, 3, 4.
 Sistem lain menggunakanAU, HO, FL, danWO
 Nilai yang Salah
 Produk: vas bunga, tinggi: 125 m
 Kolom banyakTujuan
 Kolom X awalnya digunakan untuk kode penyimpanan barang di suatu gudang
 Perusahaan membangun gudang baru untuk penyimpanan barang
 Kode Penyimpanan digunakan juga untuk menunjukkan kode gudang
JENIS PERMASALAHAN KUALITAS DATA
 Integrasi yang Bermasalah
 Kode pelanggan sama tetapi tercatat berbeda di sistem lain
 Kode pelanggan berbeda di sistem dan sistem lain, tetapi menunjuk ke orang yang
sama
TANTANGAN KUALITAS DATA
 Sumber Pencemaran Data:
 Konversi Sistem
 Penuaan Data
 Sistem integrasi yang bervariasi
 Rancangan database yang buruk
 Informasi yang tidak lengkap saat data dimasukkan
 Kesalahan Input
 Internasionalisasi/pelokalan
 Fraud/Penipuan
 Kelemahan Kebijakan
TANTANGAN KUALITAS DATA
 Validasi nama dan alamat
TANTANGAN KUALITAS DATA
 Cost Kualitas Data yang Buruk
 Keputusan yang buruk dalam analisis rutin
 Kesempatan bisnis yang hilang akibat data tidak tersedia atau data kotor
 Kesulitan dalam source system akibat data yang buruk mengakibatkan pengulangan
kembali
TANTANGAN KUALITAS DATA
 Cost Kualitas Data yang Buruk
 Permasalahan audit
 Redundansi data mengakibatkan sumber yang boros
 Laporan yang tidak konsisten
 Usaha danWaktu untuk koreksi data setiap penemuan data yang rusak
PERKAKAS BANTU KUALITAS DATA
 Kategori: Penemuan Error dan Koreksi Data
 Biasanya dalam satu software terdapat dua fitur ini
FITUR PENEMUAN ERROR
 Identifikasi record duplikat secara cepat dan mudah
 Mengidentifikasi data yang nilainya di luar rentang yang diizinkan
 Menemukan data inkonsisten
 Memeriksa rentang nilai yang diizinkan
 Mendeteksi data item yang inkonsisten dari berbagai sumber
 Mengizinkan user untuk mengidentifikasi dan mengkuantisasi permasalahan
kualitas data
 Mengawasi tren dalam kualitas data
 Melaporkan ke user terhadap kualitas data untuk analisis
 Mendamaikan masalah integritas referensial dengan RDBMS
FITUR KOREKSI DATA
 Normalisasi data inkonsisten
 Meningkatkan merging data dari data source yang berbeda
 Mengelompokkan dan merelasikan record customer dari rumah tangga yang
sama
 Memberikan pengukuran mengenai kualitas data
 Memvalidasi nilai yang diizinkan
RDBMS UNTUK KENDALI KUALITAS
 Integritas Domain
 Update Security
 Pemeriksaan integritas entitas
 Minimalisasi missing value
 Pemeriksaan integritas referensial
 Kesinambungan dengan aturan bisnis
 Penggunaan trigger
INISIATIF KUALITAS DATA
 Mengapa sulit menerapkan Data Quality?
 Sulit dan menghabiskan waktu
 Metadata yang berguna untuk membantu kualitas data tidak ditemukan atau hilang
 User dengan tanggung jawab memastikan kualitas data mengesampingkan prioritas
kualitas data
 Aktivitas Data Quality bisa sangat besar dan menindas inisiatif penerapan kualitas data
PENDEKATAN PENERAPAN PEMBERSIHAN
DATA
 Hanya data yang bersih saja yang boleh masuk data warehouse
 Clean as you go
KEPUTUSAN PEMBERSIHAN DATA
 Data yang ManaYang dibersihkan?
 Bergantung pada user
 IT membantu user untuk memutuskan
 Jika data kotor dibiarkan apa akibatnya?
 Di mana harus dibersihkan?
 Suatu tempat di staging area atau dalam DW
 Bagaimana cara membersihkan?
 Menggunakan kakas bantu vendor
 Bagaimana menentukan jangkauan polusi data
 Semua pihak user berpotensi untuk menanggulangi data yang tercemar
KEPUTUSAN PEMBERSIHAN DATA
 Mempersiapkan Data Quality Framework
SIAPAYANG BERTANGGUNG JAWAB?
SIAPAYANG BERTANGGUNG JAWAB?
 Data Consumer: query, reports, analysis
 Data Producer: Input data ke source system
 Data Expert: Paham dalam bidang yang dimaksud, bertanggung jawab atas
identifikasi polusi dalam source system
 Administrator kebijakan data: bertanggung jawab atas penyelesaian data yang
rusak ketika transformasi dan dipindah ke DW
SIAPAYANG BERTANGGUNG JAWAB?
 Spesialis Integritas Data: meyakinkan data dalam source system sesuai dengan
aturan bisnis
 Otoritas Koreksi Data: Penerapan Pembersihan Data dengan kakas bantu atau
program sendiri
 Ahli Konsistensi Data: Meyakinkan semua data di dalam DW tersinkronisasi
secara penuh
PROSES PEMURNIAN
 Pengadaan kepentingan kualitas data
 Membentuk steering committee kualitas data
 Menerapkan framework kualitas data
 Menerapkan peran dan tanggung jawab
 Menentukan kakas bantu untuk proses pemurnian
 Menyiapkan program buatan sendiri jika diperlukan
PROSES PEMURNIAN
 Melatih peserta dalam teknik pembersihan data
 Mengulas dan memastikan standar data
 Memprioritaskan data menjadi kategori prioritas tinggi, sedang, dan rendah
 Menjadwalkan proses pemurnian dimulai dari data prioritas tinggi
 Memastikan teknik tersedia untuk membenarkan catatan data duplikat dan
mengaudit data eksternal
 Memulai dengan proses pemurnian berdasarkan jadwal yang sudah ditentukan
TIPS PRAKTIS DALAM KUALITAS DATA
 Identifikasi sumber polusi data yang berefek tinggi dan mulai proses pemurnian
dari hal-hal ini
 Jangan mencoba melakukan segalanya dengan program buatan sendiri
 Kakas bantu sangat baik dan berguna, gunakan kakas bantu yang sesuai
 Buat persetujuan dalam standar dan konfirmasi ulang hal ini
 Sambungkan kualitas data dengan tujuan bisnis yang spesifik
 Tanyakan sponsor eksekutif agar aktif dalam membantu inisiatif pembersihan
data
 Ajak pengguna berpartisipasi dan tetap terhubung dengan pengembangan
 Jika diperlukan, ajak ahli luar untuk tugas tertentu
RINGKASAN
 Kualitas data  Penting
 Meningkatkan confidence
 Membantu customer service
 Meningkatkan strategi pengambilan keputusan
 Mengurangi risiko keputusan buruk
RINGKASAN
 Dimensi kualitas data meliputi
 Akurasi
 Integritas domain
 Konsistensi
 Kelengkapan
 Ketentuan struktural
 Kejelasan
 dst
RINGKASAN
 Permasalahan Kualitas Data
 Dummy value
 Missing value
 Nilai bertentangan
 Dst
 Hasil polusi data berasal dari banyak sumber di DW dan meningkatkan tingkat
kesulitan untuk membersihkan data
 Fitur Pembersihan data: penemuan error dan koreksi kesalahan
 RDBMS bisa digunakan untuk pembersihan data

More Related Content

What's hot

mengenal big data dan privasi
mengenal big data dan privasi mengenal big data dan privasi
mengenal big data dan privasi farhan syahreza
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Aprioridedidarwis
 
Pertemuan 9 Strukturdata Datawarehouse
Pertemuan 9 Strukturdata DatawarehousePertemuan 9 Strukturdata Datawarehouse
Pertemuan 9 Strukturdata DatawarehouseEndang Retnoningsih
 
SISTEM INFORMASI (POWER POINT)
SISTEM INFORMASI (POWER POINT)SISTEM INFORMASI (POWER POINT)
SISTEM INFORMASI (POWER POINT)j3fr1
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayesdedidarwis
 
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)tafrikan
 
Bab 6 dasar dasar intelejen bisnis, database dan manajemen informasi
Bab 6 dasar dasar intelejen bisnis, database dan manajemen informasiBab 6 dasar dasar intelejen bisnis, database dan manajemen informasi
Bab 6 dasar dasar intelejen bisnis, database dan manajemen informasiKasi Irawati
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Miningdedidarwis
 
Konsep Dasar Data Warehouse
Konsep Dasar Data WarehouseKonsep Dasar Data Warehouse
Konsep Dasar Data Warehousededidarwis
 
Pemodelan sistem (DFD)
Pemodelan sistem (DFD)Pemodelan sistem (DFD)
Pemodelan sistem (DFD)Fahmi Hakam
 
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043DinaNisrinaRosandi
 
Penerapan decision support system dalam perusahaan
Penerapan decision support system dalam perusahaanPenerapan decision support system dalam perusahaan
Penerapan decision support system dalam perusahaanputrirakhma13
 

What's hot (20)

mengenal big data dan privasi
mengenal big data dan privasi mengenal big data dan privasi
mengenal big data dan privasi
 
OLAP
OLAPOLAP
OLAP
 
Sistem Pendukung Keputusan
Sistem Pendukung KeputusanSistem Pendukung Keputusan
Sistem Pendukung Keputusan
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
Pertemuan 9 Strukturdata Datawarehouse
Pertemuan 9 Strukturdata DatawarehousePertemuan 9 Strukturdata Datawarehouse
Pertemuan 9 Strukturdata Datawarehouse
 
pengantar basis data
pengantar basis data pengantar basis data
pengantar basis data
 
SISTEM INFORMASI (POWER POINT)
SISTEM INFORMASI (POWER POINT)SISTEM INFORMASI (POWER POINT)
SISTEM INFORMASI (POWER POINT)
 
ETL
ETLETL
ETL
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Array
ArrayArray
Array
 
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
Bab 6 dasar dasar intelejen bisnis, database dan manajemen informasi
Bab 6 dasar dasar intelejen bisnis, database dan manajemen informasiBab 6 dasar dasar intelejen bisnis, database dan manajemen informasi
Bab 6 dasar dasar intelejen bisnis, database dan manajemen informasi
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
 
DATA ANALYTIC KELOMPOK 2.pptx
DATA ANALYTIC KELOMPOK 2.pptxDATA ANALYTIC KELOMPOK 2.pptx
DATA ANALYTIC KELOMPOK 2.pptx
 
Konsep Dasar Data Warehouse
Konsep Dasar Data WarehouseKonsep Dasar Data Warehouse
Konsep Dasar Data Warehouse
 
Pemodelan sistem (DFD)
Pemodelan sistem (DFD)Pemodelan sistem (DFD)
Pemodelan sistem (DFD)
 
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043
 
Penerapan decision support system dalam perusahaan
Penerapan decision support system dalam perusahaanPenerapan decision support system dalam perusahaan
Penerapan decision support system dalam perusahaan
 
Pertemuan 3 Data Multi Dimensi
Pertemuan 3 Data Multi DimensiPertemuan 3 Data Multi Dimensi
Pertemuan 3 Data Multi Dimensi
 

Similar to DWDATA9

Mengukur kepuasan pelanggan
Mengukur kepuasan pelangganMengukur kepuasan pelanggan
Mengukur kepuasan pelangganFaiz Fanani
 
DASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASI
DASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASIDASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASI
DASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASIYunita Tri Andra Yani
 
Siskohatkes 2020 (kompetensi ppih) d. pengolahan dan analisa data
Siskohatkes 2020 (kompetensi ppih)   d. pengolahan dan analisa dataSiskohatkes 2020 (kompetensi ppih)   d. pengolahan dan analisa data
Siskohatkes 2020 (kompetensi ppih) d. pengolahan dan analisa datarickygunawan84
 
persyaratan sistem manajemen ISO 9001-2015.pptx
persyaratan sistem manajemen ISO 9001-2015.pptxpersyaratan sistem manajemen ISO 9001-2015.pptx
persyaratan sistem manajemen ISO 9001-2015.pptxf26617201
 
Chapter 1 : The Compelling Need for Data Warehousing .pdf
Chapter 1 : The Compelling Need for Data Warehousing .pdfChapter 1 : The Compelling Need for Data Warehousing .pdf
Chapter 1 : The Compelling Need for Data Warehousing .pdfBelinda Isamar
 
Sistem infirmasi akuntansi 1
Sistem infirmasi akuntansi 1Sistem infirmasi akuntansi 1
Sistem infirmasi akuntansi 1Ary Efendi
 
PPT_INM PKM_TKM (1).ppt
PPT_INM PKM_TKM (1).pptPPT_INM PKM_TKM (1).ppt
PPT_INM PKM_TKM (1).pptFadliAnnisa1
 
Presentasi bab 21 data warehouse
Presentasi bab 21   data warehousePresentasi bab 21   data warehouse
Presentasi bab 21 data warehouseasephidayat19080
 
Praproses data yang digunakan dalam data mining
Praproses data yang digunakan dalam data miningPraproses data yang digunakan dalam data mining
Praproses data yang digunakan dalam data miningssuseref80a11
 
Chapter 12 Buku Implementing Continuous Quality Improvement in Health care
Chapter 12 Buku Implementing Continuous Quality Improvement in Health careChapter 12 Buku Implementing Continuous Quality Improvement in Health care
Chapter 12 Buku Implementing Continuous Quality Improvement in Health careNasiatul Salim
 
Bab iii sim ppt2
Bab iii sim ppt2Bab iii sim ppt2
Bab iii sim ppt2Fitran Zain
 
Data Analytics Generic Presentation.pdf
Data Analytics Generic Presentation.pdfData Analytics Generic Presentation.pdf
Data Analytics Generic Presentation.pdfNoeradji Prabowo
 

Similar to DWDATA9 (20)

Aps03 planning
Aps03 planningAps03 planning
Aps03 planning
 
2700 3 data preprocessing
2700 3 data preprocessing2700 3 data preprocessing
2700 3 data preprocessing
 
Mengukur kepuasan pelanggan
Mengukur kepuasan pelangganMengukur kepuasan pelanggan
Mengukur kepuasan pelanggan
 
DASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASI
DASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASIDASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASI
DASAR-DASAR INTELEGENSI BISNIS : BASIS DATA DAN MANAJEMEN INFORMASI
 
Manajemen.ppt
Manajemen.pptManajemen.ppt
Manajemen.ppt
 
Siskohatkes 2020 (kompetensi ppih) d. pengolahan dan analisa data
Siskohatkes 2020 (kompetensi ppih)   d. pengolahan dan analisa dataSiskohatkes 2020 (kompetensi ppih)   d. pengolahan dan analisa data
Siskohatkes 2020 (kompetensi ppih) d. pengolahan dan analisa data
 
persyaratan sistem manajemen ISO 9001-2015.pptx
persyaratan sistem manajemen ISO 9001-2015.pptxpersyaratan sistem manajemen ISO 9001-2015.pptx
persyaratan sistem manajemen ISO 9001-2015.pptx
 
sistem informasi manajemen
sistem informasi manajemensistem informasi manajemen
sistem informasi manajemen
 
Chapter 1 : The Compelling Need for Data Warehousing .pdf
Chapter 1 : The Compelling Need for Data Warehousing .pdfChapter 1 : The Compelling Need for Data Warehousing .pdf
Chapter 1 : The Compelling Need for Data Warehousing .pdf
 
Sistem infirmasi akuntansi 1
Sistem infirmasi akuntansi 1Sistem infirmasi akuntansi 1
Sistem infirmasi akuntansi 1
 
PPT_INM PKM_TKM (1).ppt
PPT_INM PKM_TKM (1).pptPPT_INM PKM_TKM (1).ppt
PPT_INM PKM_TKM (1).ppt
 
Presentasi bab 21 data warehouse
Presentasi bab 21   data warehousePresentasi bab 21   data warehouse
Presentasi bab 21 data warehouse
 
MIK4237-02.pdf
MIK4237-02.pdfMIK4237-02.pdf
MIK4237-02.pdf
 
Penanda aras
Penanda arasPenanda aras
Penanda aras
 
Praproses data yang digunakan dalam data mining
Praproses data yang digunakan dalam data miningPraproses data yang digunakan dalam data mining
Praproses data yang digunakan dalam data mining
 
Chapter 12 Buku Implementing Continuous Quality Improvement in Health care
Chapter 12 Buku Implementing Continuous Quality Improvement in Health careChapter 12 Buku Implementing Continuous Quality Improvement in Health care
Chapter 12 Buku Implementing Continuous Quality Improvement in Health care
 
Manajemen Kualitas
Manajemen KualitasManajemen Kualitas
Manajemen Kualitas
 
Bab iii sim ppt2
Bab iii sim ppt2Bab iii sim ppt2
Bab iii sim ppt2
 
MASTER DATA MANAGEMENT.pptx
MASTER DATA MANAGEMENT.pptxMASTER DATA MANAGEMENT.pptx
MASTER DATA MANAGEMENT.pptx
 
Data Analytics Generic Presentation.pdf
Data Analytics Generic Presentation.pdfData Analytics Generic Presentation.pdf
Data Analytics Generic Presentation.pdf
 

More from dedidarwis

Cv dedi darwis
Cv dedi darwisCv dedi darwis
Cv dedi darwisdedidarwis
 
Manajemen pengetahuan
Manajemen pengetahuanManajemen pengetahuan
Manajemen pengetahuandedidarwis
 
Siklus Pendapatan
Siklus PendapatanSiklus Pendapatan
Siklus Pendapatandedidarwis
 
Pengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis KomputerPengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis Komputerdedidarwis
 
Sistem Pengendalian Internal
Sistem Pengendalian InternalSistem Pengendalian Internal
Sistem Pengendalian Internaldedidarwis
 
Model data dan desain database
Model data dan desain databaseModel data dan desain database
Model data dan desain databasededidarwis
 
Pengantar e-business
Pengantar e-businessPengantar e-business
Pengantar e-businessdedidarwis
 
Siklus sistem informasi akuntansi
Siklus sistem informasi akuntansiSiklus sistem informasi akuntansi
Siklus sistem informasi akuntansidedidarwis
 
Konsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi AkuntansiKonsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi Akuntansidedidarwis
 
Pert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitianPert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitiandedidarwis
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitiandedidarwis
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitiandedidarwis
 
Pert 12 metode eksperimen
Pert 12   metode eksperimenPert 12   metode eksperimen
Pert 12 metode eksperimendedidarwis
 
Pert 11 kesalahan penelitian
Pert 11  kesalahan penelitianPert 11  kesalahan penelitian
Pert 11 kesalahan penelitiandedidarwis
 
Slide trik skripsi ftik s1
Slide trik skripsi ftik s1Slide trik skripsi ftik s1
Slide trik skripsi ftik s1dedidarwis
 
Pert 9 proposal penelitian
Pert 9 proposal penelitianPert 9 proposal penelitian
Pert 9 proposal penelitiandedidarwis
 
Pert 6 literatur review
Pert 6 literatur reviewPert 6 literatur review
Pert 6 literatur reviewdedidarwis
 
Pert 5 pengolahan data
Pert 5 pengolahan dataPert 5 pengolahan data
Pert 5 pengolahan datadedidarwis
 
Pert 5 pengumpulan-data
Pert 5 pengumpulan-dataPert 5 pengumpulan-data
Pert 5 pengumpulan-datadedidarwis
 
Pert 4 masalah-penelitian
Pert 4 masalah-penelitianPert 4 masalah-penelitian
Pert 4 masalah-penelitiandedidarwis
 

More from dedidarwis (20)

Cv dedi darwis
Cv dedi darwisCv dedi darwis
Cv dedi darwis
 
Manajemen pengetahuan
Manajemen pengetahuanManajemen pengetahuan
Manajemen pengetahuan
 
Siklus Pendapatan
Siklus PendapatanSiklus Pendapatan
Siklus Pendapatan
 
Pengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis KomputerPengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis Komputer
 
Sistem Pengendalian Internal
Sistem Pengendalian InternalSistem Pengendalian Internal
Sistem Pengendalian Internal
 
Model data dan desain database
Model data dan desain databaseModel data dan desain database
Model data dan desain database
 
Pengantar e-business
Pengantar e-businessPengantar e-business
Pengantar e-business
 
Siklus sistem informasi akuntansi
Siklus sistem informasi akuntansiSiklus sistem informasi akuntansi
Siklus sistem informasi akuntansi
 
Konsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi AkuntansiKonsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi Akuntansi
 
Pert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitianPert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitian
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitian
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitian
 
Pert 12 metode eksperimen
Pert 12   metode eksperimenPert 12   metode eksperimen
Pert 12 metode eksperimen
 
Pert 11 kesalahan penelitian
Pert 11  kesalahan penelitianPert 11  kesalahan penelitian
Pert 11 kesalahan penelitian
 
Slide trik skripsi ftik s1
Slide trik skripsi ftik s1Slide trik skripsi ftik s1
Slide trik skripsi ftik s1
 
Pert 9 proposal penelitian
Pert 9 proposal penelitianPert 9 proposal penelitian
Pert 9 proposal penelitian
 
Pert 6 literatur review
Pert 6 literatur reviewPert 6 literatur review
Pert 6 literatur review
 
Pert 5 pengolahan data
Pert 5 pengolahan dataPert 5 pengolahan data
Pert 5 pengolahan data
 
Pert 5 pengumpulan-data
Pert 5 pengumpulan-dataPert 5 pengumpulan-data
Pert 5 pengumpulan-data
 
Pert 4 masalah-penelitian
Pert 4 masalah-penelitianPert 4 masalah-penelitian
Pert 4 masalah-penelitian
 

DWDATA9

  • 1. PERTEMUAN 9 – DATA WAREHOUSE Data Quality Dedi Darwis, M.Kom.
  • 2. OUTLINE  Mengapa Kualitas Data Penting?  Tantangan Kualitas Data  Kakas Bantu Kualitas Data  Inisiatif Kualitas Data
  • 3. PENTINGNYA KUALITAS DATA  Kualitas Data di DW > Sistem Operasional Biasa  Kepentingan:  Meningkatkan kepercayaan diri dalam pengambilan keputusan  Customer Service bisa lebih baik  Meningkatkan kesempatan tambahan added value dalam layanan  Mengurangi risiko keputusan buruk  Mengurangi cost, khususnya di kampanye marketing  Meningkatkan strategi pengambilan keputusan  Menghindari akibat data tercemar
  • 4. KUALITAS DATA?  Data Quality ? Data Accuracy
  • 5. DATA QUALITY  Accuracy  Domain Integrity  DataType  Consistency  Redundansi  Kelengkapan  Duplikat  Kesinambungan aturan bisnis  Ketentuan Struktural
  • 6. DATA QUALITY  Anomali Data  Kejelasan Makna Data  Berwaktu  Manfaat  Kesinambungan dengan Aturan Integritas Data
  • 7. MANFAAT KUALITAS DATAYANG BAIK  Analisis Informasi Berwaktu  Promosi Musiman  Pelayanan Pelanggan yang Lebih Baik  Mengetahui lebih cepat mengenai keadaan pelanggan  Kesempatan Baru  Penjualan lintas-apapun  Marketing tepat sasaran  Berkurangnya biaya dan risiko  Terbuangnya waktu  Kesalahan proses dan sistem  Kesalahan aksi pelanggan dan rekan bisnis
  • 8. MANFAAT KUALITAS DATAYANG BAIK  Produktivitas yang Meningkat  Adanya pandangan luas mengenai perusahaan  Pengambilan Keputusan Strategis yang Reliable  Keputusan yang diambil berdasarkan informasi yang masuk akal
  • 10. JENIS PERMASALAHAN KUALITAS DATA  Nilai Dummy dalam Kolom  Nilai yang dibiarkan begitu saja untuk tes awal namun lupa dihapus/dikoreksi  Ex: Kode Pos 00000  Hilangnya nilai data  MissingValue  Penggunaan Kolom yangTidak Resmi/Unofficial  Komentar pada komentar pelanggan  Nilai Cryptic/Kode  Masalah di sistem lawas, contoh: Status pelanggan: R=Regular, N=New
  • 11. JENIS PERMASALAHAN KUALITAS DATA  Nilai yang bertentangan  Kode Pos dan Alamat yang bertentangan  Pelanggaran Aturan Bisnis  Hari kerja+hari liburan+libur bersama+cuti sakit <=365 atau <=366  Pengulangan Primary Key  Penggunaan angka dengan ukuran 5-bit, jika customer > 100.000, key akan diulang  ID non unik  Kode Produk X di penjualan = 355, tetapi di akuntansi = A226
  • 12. JENIS PERMASALAHAN KUALITAS DATA  NilaiTidak Konsisten  Sistem yang menggunakan kode: 1, 2, 3, 4.  Sistem lain menggunakanAU, HO, FL, danWO  Nilai yang Salah  Produk: vas bunga, tinggi: 125 m  Kolom banyakTujuan  Kolom X awalnya digunakan untuk kode penyimpanan barang di suatu gudang  Perusahaan membangun gudang baru untuk penyimpanan barang  Kode Penyimpanan digunakan juga untuk menunjukkan kode gudang
  • 13. JENIS PERMASALAHAN KUALITAS DATA  Integrasi yang Bermasalah  Kode pelanggan sama tetapi tercatat berbeda di sistem lain  Kode pelanggan berbeda di sistem dan sistem lain, tetapi menunjuk ke orang yang sama
  • 14. TANTANGAN KUALITAS DATA  Sumber Pencemaran Data:  Konversi Sistem  Penuaan Data  Sistem integrasi yang bervariasi  Rancangan database yang buruk  Informasi yang tidak lengkap saat data dimasukkan  Kesalahan Input  Internasionalisasi/pelokalan  Fraud/Penipuan  Kelemahan Kebijakan
  • 15. TANTANGAN KUALITAS DATA  Validasi nama dan alamat
  • 16. TANTANGAN KUALITAS DATA  Cost Kualitas Data yang Buruk  Keputusan yang buruk dalam analisis rutin  Kesempatan bisnis yang hilang akibat data tidak tersedia atau data kotor  Kesulitan dalam source system akibat data yang buruk mengakibatkan pengulangan kembali
  • 17. TANTANGAN KUALITAS DATA  Cost Kualitas Data yang Buruk  Permasalahan audit  Redundansi data mengakibatkan sumber yang boros  Laporan yang tidak konsisten  Usaha danWaktu untuk koreksi data setiap penemuan data yang rusak
  • 18. PERKAKAS BANTU KUALITAS DATA  Kategori: Penemuan Error dan Koreksi Data  Biasanya dalam satu software terdapat dua fitur ini
  • 19. FITUR PENEMUAN ERROR  Identifikasi record duplikat secara cepat dan mudah  Mengidentifikasi data yang nilainya di luar rentang yang diizinkan  Menemukan data inkonsisten  Memeriksa rentang nilai yang diizinkan  Mendeteksi data item yang inkonsisten dari berbagai sumber  Mengizinkan user untuk mengidentifikasi dan mengkuantisasi permasalahan kualitas data  Mengawasi tren dalam kualitas data  Melaporkan ke user terhadap kualitas data untuk analisis  Mendamaikan masalah integritas referensial dengan RDBMS
  • 20. FITUR KOREKSI DATA  Normalisasi data inkonsisten  Meningkatkan merging data dari data source yang berbeda  Mengelompokkan dan merelasikan record customer dari rumah tangga yang sama  Memberikan pengukuran mengenai kualitas data  Memvalidasi nilai yang diizinkan
  • 21. RDBMS UNTUK KENDALI KUALITAS  Integritas Domain  Update Security  Pemeriksaan integritas entitas  Minimalisasi missing value  Pemeriksaan integritas referensial  Kesinambungan dengan aturan bisnis  Penggunaan trigger
  • 22. INISIATIF KUALITAS DATA  Mengapa sulit menerapkan Data Quality?  Sulit dan menghabiskan waktu  Metadata yang berguna untuk membantu kualitas data tidak ditemukan atau hilang  User dengan tanggung jawab memastikan kualitas data mengesampingkan prioritas kualitas data  Aktivitas Data Quality bisa sangat besar dan menindas inisiatif penerapan kualitas data
  • 23. PENDEKATAN PENERAPAN PEMBERSIHAN DATA  Hanya data yang bersih saja yang boleh masuk data warehouse  Clean as you go
  • 24. KEPUTUSAN PEMBERSIHAN DATA  Data yang ManaYang dibersihkan?  Bergantung pada user  IT membantu user untuk memutuskan  Jika data kotor dibiarkan apa akibatnya?  Di mana harus dibersihkan?  Suatu tempat di staging area atau dalam DW  Bagaimana cara membersihkan?  Menggunakan kakas bantu vendor  Bagaimana menentukan jangkauan polusi data  Semua pihak user berpotensi untuk menanggulangi data yang tercemar
  • 25.
  • 26. KEPUTUSAN PEMBERSIHAN DATA  Mempersiapkan Data Quality Framework
  • 27.
  • 29. SIAPAYANG BERTANGGUNG JAWAB?  Data Consumer: query, reports, analysis  Data Producer: Input data ke source system  Data Expert: Paham dalam bidang yang dimaksud, bertanggung jawab atas identifikasi polusi dalam source system  Administrator kebijakan data: bertanggung jawab atas penyelesaian data yang rusak ketika transformasi dan dipindah ke DW
  • 30. SIAPAYANG BERTANGGUNG JAWAB?  Spesialis Integritas Data: meyakinkan data dalam source system sesuai dengan aturan bisnis  Otoritas Koreksi Data: Penerapan Pembersihan Data dengan kakas bantu atau program sendiri  Ahli Konsistensi Data: Meyakinkan semua data di dalam DW tersinkronisasi secara penuh
  • 31. PROSES PEMURNIAN  Pengadaan kepentingan kualitas data  Membentuk steering committee kualitas data  Menerapkan framework kualitas data  Menerapkan peran dan tanggung jawab  Menentukan kakas bantu untuk proses pemurnian  Menyiapkan program buatan sendiri jika diperlukan
  • 32. PROSES PEMURNIAN  Melatih peserta dalam teknik pembersihan data  Mengulas dan memastikan standar data  Memprioritaskan data menjadi kategori prioritas tinggi, sedang, dan rendah  Menjadwalkan proses pemurnian dimulai dari data prioritas tinggi  Memastikan teknik tersedia untuk membenarkan catatan data duplikat dan mengaudit data eksternal  Memulai dengan proses pemurnian berdasarkan jadwal yang sudah ditentukan
  • 33.
  • 34. TIPS PRAKTIS DALAM KUALITAS DATA  Identifikasi sumber polusi data yang berefek tinggi dan mulai proses pemurnian dari hal-hal ini  Jangan mencoba melakukan segalanya dengan program buatan sendiri  Kakas bantu sangat baik dan berguna, gunakan kakas bantu yang sesuai  Buat persetujuan dalam standar dan konfirmasi ulang hal ini  Sambungkan kualitas data dengan tujuan bisnis yang spesifik  Tanyakan sponsor eksekutif agar aktif dalam membantu inisiatif pembersihan data  Ajak pengguna berpartisipasi dan tetap terhubung dengan pengembangan  Jika diperlukan, ajak ahli luar untuk tugas tertentu
  • 35. RINGKASAN  Kualitas data  Penting  Meningkatkan confidence  Membantu customer service  Meningkatkan strategi pengambilan keputusan  Mengurangi risiko keputusan buruk
  • 36. RINGKASAN  Dimensi kualitas data meliputi  Akurasi  Integritas domain  Konsistensi  Kelengkapan  Ketentuan struktural  Kejelasan  dst
  • 37. RINGKASAN  Permasalahan Kualitas Data  Dummy value  Missing value  Nilai bertentangan  Dst  Hasil polusi data berasal dari banyak sumber di DW dan meningkatkan tingkat kesulitan untuk membersihkan data  Fitur Pembersihan data: penemuan error dan koreksi kesalahan  RDBMS bisa digunakan untuk pembersihan data