3. Data warehouse memberikan storage, fungsionalitas yang
lebih dan lebih responsif terhadap query dibandingkan
kemampuan database yang bersifat transaksi
Banyak orang hanya butuh data read-access tapi butuh
akses yang cepat pada data yang sangat bear dan bisa
diunduh ke desktop, seringkali data itu datangnya dari
lebih dari 1 database. DW, DM dan OLAP menyediakan
fungsi ini.
4. Subject-oriented, integrated, nonvolatile, time-
variant collection of data in support of
management’s decisions (Inmon, 1992)
Dibanding database tradisional, DW umumnya
terdiri dari data yang berukuran sangat besar dari
banyak sumber dan mungkin terdiri dari database
dari model data yang berbeda dan kadang file dari
sistem dan platform yang independen
5. Tidak seperti database transaksional, DW biasanya
mendukung analisa tren dan time-series, di mana
keduanya membutuhkan data historik
DW itu nonvolatile. Artinya informasi dalam DW jarang
diubah dan bisa dianggap non-real-time
DW bisa digambarkan sebagai “kumpulan teknologi
pendukung keputusan, dimaksudkan untuk memungkinkan
pekerja yang berhubungan dengan informasi (eksekutif,
manajer dan analis) untuk membuat keputusan lebih baik
dan lebih cepat”
6. Konsep multidimensi
Deminsi generic
Tingkat agregasi dan
dimensi tak terbatas
Operasi lintas dimensi tak
terbatas
Penanganan matriks
dinamis
Arsitektur client-server
Dukungan multi-user
aksesibilitas
Transparansi
Manipulasi data yang intuitif
Performa reporting yang
konsisten
Reporting yang fleksibel
7. Data warehouse ada untuk memfasilitasi queri ad hoc yang terjadi sering
dan kompleks. Untuk itu, data warehouse harus menyediakan dukungan
query yang lebih efisien
Roll-up: data dirangkum dengan generalisasi
Dril-down: meningkatkan tingkat detail
Pivot: lintas tabulasi (juga disebut rotasi)
Potong dan iris: melakukan operasi proyeksi terhadap dimensi
Sorting: data diurut berdasarkan nilai ordinal
Selection: data tersedia dalam nilai atau range
Derived attributes: atribut dihitung oleh operasi dalam nilai yang
disimpan atau turunan
8. Contoh dimensi dalam DW adalah periode fiskal, produk dan region
perusahaan
Spreadsheet standar biasanya matrix 2 dimensi. Contohnya
spreadsheet sales regional berdimensi produk untuk satu jangka
waktu tertentu. Produk ditampilkan per baris dengan pendapatan
sales untuk masing-masing region ditampilkan per kolom.
Menambah dimensi waktu seperti kuartal fiskal perusahaan
menjadikannya matrix 3 dimensi yang ditampilkan sebagai kubus
data
Menambah dimensi tambahan, bisa menghasilkan hypercube, tapi
sulit untuk divisualisasikan
9. Mengubah dari satu (orientasi) hirarki dimensi ke
hirarki lain bisa dikerjakan dalam satu kubus data
dengan teknik pivoting (juga disebut rotasi)
Model multidimensi memiliki view hirarki yang
dikenal dengan roll-up display dan drill-down.
Roll-up display memindahkan ke atas secara hirarki,
mengelompokkan ke unit yang lebih besar
Drill-down display lebih mendetailkan
10. Model storage multidimensi melibatkan 2 tipe tabel:
tabel dimensi dan tabel fakta
Tabel dimensi terdiri dari tupel atribut tuples dari
diemsni
Tabel fakta bisa digambarkan memiliki banyak
tupel. Satu tupel untuk satu fakta yang tercatat.
Fakta ini berisikan data dan dimensi
mengidentifikasikan masing-masing tupel dalam
data tersebut
11. Skema multidimensi yang umum adalah skema
bintang dan skema snowflake.
Skema bintang terdiri dari sebuah tabel fakta
dengan satu tabel untuk masing-masing dimensi
Skema snowflake adalah variasi skema bintang di
mana di dalamnya tabel dimensi dari skema
bintang diorganisir menjadi hirarki dengan
normalisasi.
12.
13. Skema snowflake merupakan perluasan dari skema
bintang, di mana setiap titik dari bintang meledak
menjadi poin lebih.
14.
15. Misalnya, DimensiWaktu yang terdiri dari 2
hirarki yang berbeda:
1.Tahun → → Bulan Hari
2. Minggu → Day
16. Dalam beberapa kasus dapat meningkatkan
kinerja karena meja kecil yang bergabung,
Lebih mudah untuk mempertahankan,
Meningkatkan fleksibilitas.
17. Meningkatkan jumlah tabel pengguna akhir
harus bekerja dengan,
Membuat query jauh lebih sulit untuk
menciptakan karena lebih tabel perlu
digabung.
18. ▪ Snowflake Schema merupakan varian dari skema bintang dimana table-
table dimensi tidak terdapat data yang di denormalisasi.
▪ Snowflake Schema memberi kemudahan pada perawatan dimensi,
dikarenakan strukturnya yang lebih normalisasi.
▪ Snowflake schema adalah model data dimensional yang memiliki
sebuah tabel fakta sebagai pusatnya, dikelilingi tabel-tabel dimensi
yang ternormalisasi. Snowflake schema adalah sebuah variasi dari star
schema dimana tabel dimensinya boleh memiliki dimensi.
▪ Penggunaan tabel dimensi pada snowflake schema sangatlah mendasar,
sedangkan pada star schema tidak. Snowflake schema dibuat
berdasarkan OLTP sehingga semua data akan termuat detail dalam
setiap tabel fakta dan tabel dimensi.
19. Keduanya merupakan model-model dimensional,
perbedaannya terletak pada implementasi fisikal. Skema
snowflake memberi kemudahan pada perawatan dimensi,
dikarenakan strukturnya yang lebih normalisasi.
Skema bintang lebih efisien serta sederhana dalam
membuat query dan mudah diakses secara langsung oleh
pengguna.
Jika data yang digunakan kompleks sebaiknya
menggunakan snowflake schema, namun jika data yang
digunakan sederhana lebih baik kita menggunakan star
schema.