DATA QUALITY & MATCHING
INFORMATION TO USER
Hegar Yudha Candra Tionica
B220181005
Data Quality
Menurut Mark Mosley (2008) dalam bukunya “Dictionary of
Data Management”, pengertian kualitas data adalah level data
yang menyatakan data tersebut akurat (accurate), lengkap
(complete), timely (update), konsisten (consistent) sesuai dengan
semua kebutuhan peraturan bisnis dan relevan.
Data yang berkualitas sangat penting karena dapat :
 Meningkatkan kepercayaan diri dalam pengambilan keputusan
 Memperbaiki pelayanan kepada Customer
 Meningkatkan kesempatan memperbaiki kinerja,
 Mengurangi resiko dari keputusan yang berbahaya,
 Mengurangi biaya, terutama untuk pemasaran,
 Mengembangkan strategi untuk pembuatan keputusan,
 Meningkatkan produktivitas dengan memangkas beberapa proses
 Menghindari efek komplikasi dari data yang terkontaminasi
Beberapa indicator data berkualitas :
1. ACCURACY = Data Yang Tersimpan Nilainya Benar (Name Cocok Dengan Alamatnya).
2. DOMAIN INTEGRITY = Nilai Attributnya Sesuai Batasan Yang Diperkenankan (Nilai Attribut Laki dan
Perempuan).
3. DATA TYPE = Nilai Data Disimpan Dalam Tipe Data Yang Sesuai (Data Nama Disimpan Dengan Tipe
Text).
4. CONSISTENCY = Nilai Sebuah Field Data Akan Sama Semua Dalam Berbagai Berkas (Field Produk A
Dgn Kode 123, Akan Selalu Sama Kodenya Di Setiap Berkas Lain).
5. REDUDANCY = Tidak Boleh Ada Data Yang Sama Disimpan Di Tempat Yang Berbeda Dalam Satu
Sistem.
6. COMPLETENESS = Tidak Ada Nilai Atttribut Salah Yang Diberikan Dalam Sistem.
7. DATAANOMALY = Sebuah Field Hanya Digunakan Sesuai Kegunaannya. (Field Address3 È Digunakan
Untuk Mencatat Baris Ketiga Dalam Alamat Bukan Untuk Telp Atau Fax).
8. CLARITY = Kejelasan Arti Kegunaan Dan Cara Penulisan Sebuah Data (Penamaan Khusus).
9. TIMELY = Merepresentasikan Waktu Dari Data Yang Dimasukkan (Jika Data Digunakan Perhari Maka
Data Pada Warehaouse Harus Juga Dibuat Per Hari).
10. USEFULNESS = Setiap Data Harus Benar Digunakan Oleh User.
11. ADHERENCE TO DATA INTEGRITY RULES = Taat Pada Aturan Keterhubungan Data
Keuntungan Data Berkualitas
■ Analisis dengan Informasi Tepat Waktu
■ Customer Service yang lebih baik
■ Peluang baru
■ Biaya berkurang dan Risiko
■ Peningkatan Produktivitas
■ Handal Pengambilan Keputusan Strategis
Data Quality Challenges ( tantangan dalam membuat data berkualitas )
Terdapat beberapa factor yaitu :
1. Data Source :
Penuaan Data
Kesalahan Inputan
Penipuan
Sistem Konversi yang salah
2. Validasi Data :
Terjadi duplikasi data
Beberapa atribut data tercampur dalam field yang sama
Ejaan yang berbeda untuk nama yang sama
Tidak adanya atribut kunci
3. Dibutuhkan biaya yang besar untuk menjaga kualitas data, terdapat beberapa cara
yaitu :
Mengatur data agar selalu berkualitas membutuhkan biaya yang tidak sedikit
Membutuhkan orang – orang yang berkompeten untuk me-manage data
MATCHING INFORMATION TO THE CLASSES
OF USERS
 Hargai potensi informasi yang sangat besar dari gudang data.
 Catat dengan cermat semua pengguna yang akan menggunakan
gudang data dan pikirkan cara praktis untuk mengklasifikasikannya.
 Selidiki secara mendalam jenis mekanisme penyampaian informasi.
 Cocokkan setiap kelas pengguna dengan metode penyampaian
informasi yang sesuai.
 Memahami kerangka penyampaian informasi secara keseluruhan dan
mempelajari komponen-komponennya .
Mari kita asumsikan bahwa tim proyek gudang data Anda telah
berhasil mengidentifikasi semua sistem sumber terkait. Anda
telah mengekstrak dan mengubah data sumber. Anda memiliki
desain data terbaik untuk gudang data warehouse. Anda telah
menerapkan metode pembersihan data yang paling efektif dan
menghilangkan sebagian besar polusi dari data sumber. Dengan
menggunakan metode yang paling optimal, Anda telah memuat
data yang diubah dan dibersihkan ke dalam database gudang
data Anda. Lalu apa?
Setelah melakukan semua tugas ini dengan paling efektif, jika tim
Anda belum menyediakan mekanisme terbaik untuk pengiriman
intelijen bisnis kepada pengguna Anda, Anda benar-benar tidak
mencapai apa pun dari perspektif pengguna. Seperti yang Anda
ketahui, gudang data ada karena satu alasan dan satu alasan saja. Itu
ada hanya untuk memberikan informasi strategis kepada pengguna
Anda. Bagi pengguna, mekanisme penyampaian informasi adalah
data warehouse. Antarmuka pengguna untuk informasi adalah apa
yang menentukan keberhasilan akhir dari gudang data Anda.
TERIMAKASIH
@CandraYudha2021

Data Warehouse (data quality & matching information)

  • 1.
    DATA QUALITY &MATCHING INFORMATION TO USER Hegar Yudha Candra Tionica B220181005
  • 2.
    Data Quality Menurut MarkMosley (2008) dalam bukunya “Dictionary of Data Management”, pengertian kualitas data adalah level data yang menyatakan data tersebut akurat (accurate), lengkap (complete), timely (update), konsisten (consistent) sesuai dengan semua kebutuhan peraturan bisnis dan relevan.
  • 3.
    Data yang berkualitassangat penting karena dapat :  Meningkatkan kepercayaan diri dalam pengambilan keputusan  Memperbaiki pelayanan kepada Customer  Meningkatkan kesempatan memperbaiki kinerja,  Mengurangi resiko dari keputusan yang berbahaya,  Mengurangi biaya, terutama untuk pemasaran,  Mengembangkan strategi untuk pembuatan keputusan,  Meningkatkan produktivitas dengan memangkas beberapa proses  Menghindari efek komplikasi dari data yang terkontaminasi
  • 4.
    Beberapa indicator databerkualitas : 1. ACCURACY = Data Yang Tersimpan Nilainya Benar (Name Cocok Dengan Alamatnya). 2. DOMAIN INTEGRITY = Nilai Attributnya Sesuai Batasan Yang Diperkenankan (Nilai Attribut Laki dan Perempuan). 3. DATA TYPE = Nilai Data Disimpan Dalam Tipe Data Yang Sesuai (Data Nama Disimpan Dengan Tipe Text). 4. CONSISTENCY = Nilai Sebuah Field Data Akan Sama Semua Dalam Berbagai Berkas (Field Produk A Dgn Kode 123, Akan Selalu Sama Kodenya Di Setiap Berkas Lain). 5. REDUDANCY = Tidak Boleh Ada Data Yang Sama Disimpan Di Tempat Yang Berbeda Dalam Satu Sistem. 6. COMPLETENESS = Tidak Ada Nilai Atttribut Salah Yang Diberikan Dalam Sistem. 7. DATAANOMALY = Sebuah Field Hanya Digunakan Sesuai Kegunaannya. (Field Address3 È Digunakan Untuk Mencatat Baris Ketiga Dalam Alamat Bukan Untuk Telp Atau Fax). 8. CLARITY = Kejelasan Arti Kegunaan Dan Cara Penulisan Sebuah Data (Penamaan Khusus). 9. TIMELY = Merepresentasikan Waktu Dari Data Yang Dimasukkan (Jika Data Digunakan Perhari Maka Data Pada Warehaouse Harus Juga Dibuat Per Hari). 10. USEFULNESS = Setiap Data Harus Benar Digunakan Oleh User. 11. ADHERENCE TO DATA INTEGRITY RULES = Taat Pada Aturan Keterhubungan Data
  • 5.
    Keuntungan Data Berkualitas ■Analisis dengan Informasi Tepat Waktu ■ Customer Service yang lebih baik ■ Peluang baru ■ Biaya berkurang dan Risiko ■ Peningkatan Produktivitas ■ Handal Pengambilan Keputusan Strategis
  • 6.
    Data Quality Challenges( tantangan dalam membuat data berkualitas ) Terdapat beberapa factor yaitu : 1. Data Source : Penuaan Data Kesalahan Inputan Penipuan Sistem Konversi yang salah 2. Validasi Data : Terjadi duplikasi data Beberapa atribut data tercampur dalam field yang sama Ejaan yang berbeda untuk nama yang sama Tidak adanya atribut kunci 3. Dibutuhkan biaya yang besar untuk menjaga kualitas data, terdapat beberapa cara yaitu : Mengatur data agar selalu berkualitas membutuhkan biaya yang tidak sedikit Membutuhkan orang – orang yang berkompeten untuk me-manage data
  • 7.
    MATCHING INFORMATION TOTHE CLASSES OF USERS  Hargai potensi informasi yang sangat besar dari gudang data.  Catat dengan cermat semua pengguna yang akan menggunakan gudang data dan pikirkan cara praktis untuk mengklasifikasikannya.  Selidiki secara mendalam jenis mekanisme penyampaian informasi.  Cocokkan setiap kelas pengguna dengan metode penyampaian informasi yang sesuai.  Memahami kerangka penyampaian informasi secara keseluruhan dan mempelajari komponen-komponennya .
  • 8.
    Mari kita asumsikanbahwa tim proyek gudang data Anda telah berhasil mengidentifikasi semua sistem sumber terkait. Anda telah mengekstrak dan mengubah data sumber. Anda memiliki desain data terbaik untuk gudang data warehouse. Anda telah menerapkan metode pembersihan data yang paling efektif dan menghilangkan sebagian besar polusi dari data sumber. Dengan menggunakan metode yang paling optimal, Anda telah memuat data yang diubah dan dibersihkan ke dalam database gudang data Anda. Lalu apa?
  • 9.
    Setelah melakukan semuatugas ini dengan paling efektif, jika tim Anda belum menyediakan mekanisme terbaik untuk pengiriman intelijen bisnis kepada pengguna Anda, Anda benar-benar tidak mencapai apa pun dari perspektif pengguna. Seperti yang Anda ketahui, gudang data ada karena satu alasan dan satu alasan saja. Itu ada hanya untuk memberikan informasi strategis kepada pengguna Anda. Bagi pengguna, mekanisme penyampaian informasi adalah data warehouse. Antarmuka pengguna untuk informasi adalah apa yang menentukan keberhasilan akhir dari gudang data Anda.
  • 10.