SlideShare a Scribd company logo
1 of 33
Download to read offline
Populating Data
Warehouse
“When you are willing to make sacrifices for a
great cause, you will never be alone.”
TIF32604 Data Warehouse
Nova Eka Diana (nova.diana@yarsi.ac.id)
Fakultas Teknologi Informasi
Universitas YARSI
Konten
• Loading stage
• Create data firewall
• Populating normalized data store
• Populating dimension tables
• Populating fact tables
STAGE LOADING
Stage Loading
• Sistem file
• Perhatikan nama file dan struktur direktori
• Pastikan punya hak akses dan permisi ke folder
stage
• Perhatikan kapasitas stage
• Basis data
• Jangan membuat indeks atau constraint 
menangkap bad data (null, duplicate)
Pendekatan
Pendekatan 1
• Simpan data-data sebelumnya dalam tabel yang
sama  mudah diimplementasikan
• Tambahkan kolom loaded_timestamp yang
menyimpan informasi waktu suatu data
dimasukkan ke stage
• Indexing perlu dilakukan untuk memudahkan
pencarian data sebelumnya; juga jika stage tabel
diakses oleh banyak aplikasi
• Indexing berguna  jika volume data besar
Pendekatan 2
• Simpan data untuk tiap harinya dalam tabel yang
terpisah  memberikan performa yang lebih baik
• Dimulai dengan loading data Today ke stage
• Diikuti dengan data Day1, Day2, dst setelah proses
loading data sebelumnya berhasil dilakukan
Pendekatan 3
• Hanya memiliki satu buah tabel
• Lakukan proses truncate setiap kali sebelum proses
loading data akan dilakukan
• Tidak menyimpan data pada hari sebelumnya
• Harus diambil langsung ke database backup jika
ingin mengambil data dari beberapa hari
sebelumnya
DATA FIREWALL
Data Firewall
• Penting untuk menolak/memblok data-data yang
buruk masuk ke dalam data warehouse
Data Firewall
• Data firewall adalah program yang melakukan
pengecekan terhadap data yang masuk ke DW
• Ditempatkan diantara stage dan NDS 
mengijinkan/menolak data tergantung pada data
quality rule yang dibuat
• Mempunyai mekanisme untuk melakukan
pelaporan data yang ditolak, oleh rule mana, dan
kapan terjadi
• Operasi yang dapat dilakukan:
• Menolak bad data
• Mengijinkan bad data masuk
• Memperbaiki data sebelum dimasukkan
POPULATING NDS
Populating NDS
• Dalam arsitekture NDS+DDS
• Populasikan data ke dalam NDS
• Populasikan data dari NDS ke DDS
• Beberapa isu yang harus diperhatikan:
• Normalisasi  data dalam stage harus
dinormalisasi agar sesuai dengan struktur NDS
• External table  konversi data
• Key management  perlu menjaga internal
data warehouse key
• Junction table  memungkinkan implementasi
many-to-many relationship
Normalisasi:
Non-normalized Data
Normalisasi:
Normalized Data
Normalisasi: NDS
Normalisasi:
NDS Problem
Normalisasi:
NDS Problem
NDS Problem: External Data
Key Management
• Tujuan:
• Mempermudah integrasi dengan source kedua
• Mampu beradaptasi dengan perubahan key di
source sytem
• Surrogate key: data warehouse key (1, 2, 3, dst)
• Natural key: key dalam source system
Key Management
Key Management
Key Management
Junction Table
• Menyediakan many-to-many relationship antara
Customer dan Phone_number_junction
Junction Table
Junction Table
Junction Table
Junction Table
POPULATING DDS
DIMENSION TABLES
Load Dimension Table
• Isu Penting:
• Incremental Loading
- hanya memasukkan records di NDS yang
berubah sejak ETL terakhir
- NDS menyediakan informasi last-updated
timestamp
• Key Management
- NDS+DDS: Menggunakan surrogate key yang
sama dengan NDS
- ODS+DDS: surrogate key perlu dibuat di DDS
Load Dimension Table (2)
• Isu Penting:
• Denormalization
Perlu dilakukan operasi join antara beberapa
tabel di NDS ketika akan dimasukkan ke DDS
• Slowly Changing Dimension (SCD)
•SCD 1(overwrite)  mengganti dengan nilai baru
•SCD 2(rows)  membuat baris baru yang terdiri atas nilai
baru dan nilai yang lama
•SCD 3(column)  letakkan nilai yang lama dalam kolom
lain, dan masukkan nilai baru ke kolom utama
Load Fact Table
• Mekanisme dasar:
• Baca baris data dari NDS
• Mencari dimensional key
• Memasukkan key kedalam fact table
Load Fact Table

More Related Content

Similar to Populating Data Warehouse

Tantangan n solusi real time DWh
Tantangan n solusi real time DWhTantangan n solusi real time DWh
Tantangan n solusi real time DWh
ayick19
 
Slide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptxSlide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptx
dion antariksa
 

Similar to Populating Data Warehouse (20)

Arsitektur Data Warehouse
Arsitektur Data WarehouseArsitektur Data Warehouse
Arsitektur Data Warehouse
 
arsitektur data warehouse.pptx
arsitektur data warehouse.pptxarsitektur data warehouse.pptx
arsitektur data warehouse.pptx
 
01 Pengatantar Basis Data
01 Pengatantar Basis Data01 Pengatantar Basis Data
01 Pengatantar Basis Data
 
Seminar datawarehouse @ Universitas Multimedia Nusantara
Seminar datawarehouse @ Universitas Multimedia NusantaraSeminar datawarehouse @ Universitas Multimedia Nusantara
Seminar datawarehouse @ Universitas Multimedia Nusantara
 
pengantar dasar Basis Data relasional Sesi-1.pptx
pengantar dasar Basis Data relasional Sesi-1.pptxpengantar dasar Basis Data relasional Sesi-1.pptx
pengantar dasar Basis Data relasional Sesi-1.pptx
 
Perencanaan dan Akses Kebutuhan
Perencanaan dan Akses KebutuhanPerencanaan dan Akses Kebutuhan
Perencanaan dan Akses Kebutuhan
 
Pertemuan 1 - Pengantar Basis Data untuk kelas xi.ppt
Pertemuan 1 - Pengantar Basis Data untuk kelas xi.pptPertemuan 1 - Pengantar Basis Data untuk kelas xi.ppt
Pertemuan 1 - Pengantar Basis Data untuk kelas xi.ppt
 
Perwakilan keperluan pangkalan data
Perwakilan keperluan pangkalan dataPerwakilan keperluan pangkalan data
Perwakilan keperluan pangkalan data
 
pptModul5
pptModul5pptModul5
pptModul5
 
Tugas 4 – 0317 (individu)
Tugas 4 – 0317 (individu)Tugas 4 – 0317 (individu)
Tugas 4 – 0317 (individu)
 
Ptw6
Ptw6Ptw6
Ptw6
 
Data Modeling
Data ModelingData Modeling
Data Modeling
 
Modul5ppt
Modul5pptModul5ppt
Modul5ppt
 
Basis data adalah ilmu untuk organisasi data modern
Basis data adalah ilmu untuk organisasi data modernBasis data adalah ilmu untuk organisasi data modern
Basis data adalah ilmu untuk organisasi data modern
 
Tantangan n solusi real time DWh
Tantangan n solusi real time DWhTantangan n solusi real time DWh
Tantangan n solusi real time DWh
 
APPLIED DATABASE III - Modul Data Preprocessing
APPLIED DATABASE III - Modul Data PreprocessingAPPLIED DATABASE III - Modul Data Preprocessing
APPLIED DATABASE III - Modul Data Preprocessing
 
Desain database
Desain databaseDesain database
Desain database
 
Database Introduction - Dasar Teori Basis Data
Database Introduction - Dasar Teori Basis DataDatabase Introduction - Dasar Teori Basis Data
Database Introduction - Dasar Teori Basis Data
 
Slide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptxSlide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptx
 
Mbd
MbdMbd
Mbd
 

More from Nova ed (6)

Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Meta Data dalam Data Warehouse
Meta Data dalam Data WarehouseMeta Data dalam Data Warehouse
Meta Data dalam Data Warehouse
 
Data Extraction
Data ExtractionData Extraction
Data Extraction
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Augmented reality (ar) introduction
Augmented reality (ar) introductionAugmented reality (ar) introduction
Augmented reality (ar) introduction
 
Gui component
Gui componentGui component
Gui component
 

Recently uploaded

KELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdf
KELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdfKELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdf
KELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdf
InnesKana26
 
Aksi Nyata Mencegah Kekerasan Seksual.pptx
Aksi Nyata Mencegah Kekerasan Seksual.pptxAksi Nyata Mencegah Kekerasan Seksual.pptx
Aksi Nyata Mencegah Kekerasan Seksual.pptx
meirahayu651
 
Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...
Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...
Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...
buktifisikskp23
 
undang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogorundang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogor
ritch4
 
Jual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan KonsultasiJual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan Konsultasi
ssupi412
 
Jual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec Asli
Jual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec AsliJual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec Asli
Jual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec Asli
Jual Cytotec Asli 085225524732 Obat Penggugur Kandungan
 
Jual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan KonsultasiJual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan Konsultasi
ssupi412
 
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953
 

Recently uploaded (20)

KELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdf
KELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdfKELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdf
KELOMPOK 6- DINAMIKA DAN TANTANGAN PANCASILA SEBAGAI IDEOLOGI.pdf
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 
materi konsep dan Model TRIASE Bencana.pptx
materi konsep dan Model TRIASE Bencana.pptxmateri konsep dan Model TRIASE Bencana.pptx
materi konsep dan Model TRIASE Bencana.pptx
 
Aksi Nyata Mencegah Kekerasan Seksual.pptx
Aksi Nyata Mencegah Kekerasan Seksual.pptxAksi Nyata Mencegah Kekerasan Seksual.pptx
Aksi Nyata Mencegah Kekerasan Seksual.pptx
 
384986085-Bahaya-Narkoba-Bagi-Kesehatan-Jiwa-Remaja.ppt
384986085-Bahaya-Narkoba-Bagi-Kesehatan-Jiwa-Remaja.ppt384986085-Bahaya-Narkoba-Bagi-Kesehatan-Jiwa-Remaja.ppt
384986085-Bahaya-Narkoba-Bagi-Kesehatan-Jiwa-Remaja.ppt
 
Digital Onboarding (Bisnis Digital) Fase F
Digital Onboarding (Bisnis Digital) Fase FDigital Onboarding (Bisnis Digital) Fase F
Digital Onboarding (Bisnis Digital) Fase F
 
Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...
Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...
Telaah Kurikulum dan Buku Teks Mata Pelajaran Bahasa Indonesia Sekolah Dasar ...
 
undang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogorundang undang penataan ruang daerah kabupaten bogor
undang undang penataan ruang daerah kabupaten bogor
 
Jual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan KonsultasiJual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Sinjai Ori 👙082122229359👙Pusat Peluntur Kandungan Konsultasi
 
contoh judul tesis untuk mahasiswa pascasarjana
contoh judul tesis untuk mahasiswa pascasarjanacontoh judul tesis untuk mahasiswa pascasarjana
contoh judul tesis untuk mahasiswa pascasarjana
 
Materi Pajak Untuk Bantuan Operasional Sekolah ( BOS )
Materi Pajak Untuk Bantuan Operasional Sekolah ( BOS )Materi Pajak Untuk Bantuan Operasional Sekolah ( BOS )
Materi Pajak Untuk Bantuan Operasional Sekolah ( BOS )
 
Jual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec Asli
Jual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec AsliJual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec Asli
Jual Pil Penggugur Kandungan 085225524732 Obat Aborsi Cytotec Asli
 
Jual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan KonsultasiJual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan Konsultasi
Jual Cytotec Di Majalengka Ori👗082322223014👗Pusat Peluntur Kandungan Konsultasi
 
PEMANTAUAN HEMODINAMIK.dalam keperawatan pptx
PEMANTAUAN HEMODINAMIK.dalam keperawatan pptxPEMANTAUAN HEMODINAMIK.dalam keperawatan pptx
PEMANTAUAN HEMODINAMIK.dalam keperawatan pptx
 
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...
Jual Obat Aborsi Tasikmalaya ( Asli Ampuh No.1 ) 082223109953 Tempat Klinik J...
 
apotek jual obat aborsi Bogor Wa 082223109953 obat aborsi Cytotec Di Bogor
apotek jual obat aborsi Bogor Wa 082223109953 obat aborsi Cytotec Di Bogorapotek jual obat aborsi Bogor Wa 082223109953 obat aborsi Cytotec Di Bogor
apotek jual obat aborsi Bogor Wa 082223109953 obat aborsi Cytotec Di Bogor
 
Materi RDK Rumah Data Kependudukan BKKBN.pptx
Materi RDK Rumah Data Kependudukan BKKBN.pptxMateri RDK Rumah Data Kependudukan BKKBN.pptx
Materi RDK Rumah Data Kependudukan BKKBN.pptx
 
PPT SEMINAR PROPOSAL KLASIFIKASI CNN.pptx
PPT SEMINAR PROPOSAL KLASIFIKASI CNN.pptxPPT SEMINAR PROPOSAL KLASIFIKASI CNN.pptx
PPT SEMINAR PROPOSAL KLASIFIKASI CNN.pptx
 
Menganalisis T Test dengan menggunakan SPSS
Menganalisis T Test dengan menggunakan SPSSMenganalisis T Test dengan menggunakan SPSS
Menganalisis T Test dengan menggunakan SPSS
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 

Populating Data Warehouse

  • 1. Populating Data Warehouse “When you are willing to make sacrifices for a great cause, you will never be alone.” TIF32604 Data Warehouse Nova Eka Diana (nova.diana@yarsi.ac.id) Fakultas Teknologi Informasi Universitas YARSI
  • 2. Konten • Loading stage • Create data firewall • Populating normalized data store • Populating dimension tables • Populating fact tables
  • 4. Stage Loading • Sistem file • Perhatikan nama file dan struktur direktori • Pastikan punya hak akses dan permisi ke folder stage • Perhatikan kapasitas stage • Basis data • Jangan membuat indeks atau constraint  menangkap bad data (null, duplicate)
  • 6. Pendekatan 1 • Simpan data-data sebelumnya dalam tabel yang sama  mudah diimplementasikan • Tambahkan kolom loaded_timestamp yang menyimpan informasi waktu suatu data dimasukkan ke stage • Indexing perlu dilakukan untuk memudahkan pencarian data sebelumnya; juga jika stage tabel diakses oleh banyak aplikasi • Indexing berguna  jika volume data besar
  • 7. Pendekatan 2 • Simpan data untuk tiap harinya dalam tabel yang terpisah  memberikan performa yang lebih baik • Dimulai dengan loading data Today ke stage • Diikuti dengan data Day1, Day2, dst setelah proses loading data sebelumnya berhasil dilakukan
  • 8. Pendekatan 3 • Hanya memiliki satu buah tabel • Lakukan proses truncate setiap kali sebelum proses loading data akan dilakukan • Tidak menyimpan data pada hari sebelumnya • Harus diambil langsung ke database backup jika ingin mengambil data dari beberapa hari sebelumnya
  • 10. Data Firewall • Penting untuk menolak/memblok data-data yang buruk masuk ke dalam data warehouse
  • 11. Data Firewall • Data firewall adalah program yang melakukan pengecekan terhadap data yang masuk ke DW • Ditempatkan diantara stage dan NDS  mengijinkan/menolak data tergantung pada data quality rule yang dibuat • Mempunyai mekanisme untuk melakukan pelaporan data yang ditolak, oleh rule mana, dan kapan terjadi • Operasi yang dapat dilakukan: • Menolak bad data • Mengijinkan bad data masuk • Memperbaiki data sebelum dimasukkan
  • 13. Populating NDS • Dalam arsitekture NDS+DDS • Populasikan data ke dalam NDS • Populasikan data dari NDS ke DDS • Beberapa isu yang harus diperhatikan: • Normalisasi  data dalam stage harus dinormalisasi agar sesuai dengan struktur NDS • External table  konversi data • Key management  perlu menjaga internal data warehouse key • Junction table  memungkinkan implementasi many-to-many relationship
  • 20. Key Management • Tujuan: • Mempermudah integrasi dengan source kedua • Mampu beradaptasi dengan perubahan key di source sytem • Surrogate key: data warehouse key (1, 2, 3, dst) • Natural key: key dalam source system
  • 24. Junction Table • Menyediakan many-to-many relationship antara Customer dan Phone_number_junction
  • 30. Load Dimension Table • Isu Penting: • Incremental Loading - hanya memasukkan records di NDS yang berubah sejak ETL terakhir - NDS menyediakan informasi last-updated timestamp • Key Management - NDS+DDS: Menggunakan surrogate key yang sama dengan NDS - ODS+DDS: surrogate key perlu dibuat di DDS
  • 31. Load Dimension Table (2) • Isu Penting: • Denormalization Perlu dilakukan operasi join antara beberapa tabel di NDS ketika akan dimasukkan ke DDS • Slowly Changing Dimension (SCD) •SCD 1(overwrite)  mengganti dengan nilai baru •SCD 2(rows)  membuat baris baru yang terdiri atas nilai baru dan nilai yang lama •SCD 3(column)  letakkan nilai yang lama dalam kolom lain, dan masukkan nilai baru ke kolom utama
  • 32. Load Fact Table • Mekanisme dasar: • Baca baris data dari NDS • Mencari dimensional key • Memasukkan key kedalam fact table