Sebuah pendekatan penyimpanandata yang cenderung
menyimpan data masa lalu yang mempunyai karakteristik
Subject Oriented, Integrated, Time Variant,
dan Nonvolatile
5.
Konsep Subject Oriented
Datawarehousemenyajikan informasi sekitar subjek bisnis dibandingkan operasi yang terjadi
OPERATIONAL DATAWAREHOUSE
E-Commerce
Transaksi Penjualan Pelanggan
E-Library
Peminjaman - Pengembalian Buku
6.
Konsep Integrated
Datawarehouse mengintegrasikandata dari sumber yang heterogenous (beda sumber atau beda format)
Basis Data PT. X Cabang 1
Basis Data PT. X Cabang 2
Flat File PT. X Cabang 3
Datawarehouse PT. X
Konsep Time Variant
•Time horizon: 60-90 days
• Update of records
• Key structure may/may not contains
element of time
OPERATIONAL DATAWAREHOUSE
• Time horizon: 5-10 years
• Sophisticated snapshots of data
• Key structure contains element of
time
Legacy applications +databases = chaos
Production Control
MRP
Inventory
Control
Parts Management
Logistics
Shipping
Raw Goods
Order Control
Purchasing
Marketing
Finance
Sales
Accounting
Management
Reporting
Engineering
Actuarial
Human
Resources
Continuity
Consolidation
Control
Compliance
Collaboration
Enterprise data warehouse = order
Single version of the
truth
Enterprise Data
Warehouse
Every question = decision
Dua tujuan datawarehouse: 1) menghemat waktu pembuatan laporan; 2) mudah mengkotak-kotakan data
DATABASE (OLTP) DATAWAREHOUSE (OLAP)
• Menangani data saat ini
• Data bisa saja disimpan pada beberapa
platform
• Data diorganisasikan berdasarkan fungsi
atau operasi seperti penjualan, produksi, dan
pemrosesan pesanan
• Pemrosesan bersifat berulang
• Untuk mendukung keputusan harian
(operasional)
• Melayani banyak pemakai operasional
• Berorientasi pada transaksi
• Lebih cenderung menangani data masa lalu
• Data disimpan dalam satu platform
• Data diorganisasikan menutut subjek seperti
pelanggan atau produk
• Pemrosesan sewaktu-waktu, tak terstruktur,
dan bersifat heuristik
• Untuk mendukung keputusan yang strategis
• Untuk mendukung pemakai manajerial yang
berjumlah relatif sedikit
• Berorientasi pada analisis
Tabel dimensi berisidetail
informasi dari kunci tamu
yang digunakan pada
pengaksesan tabel fakta
26.
Tabel fakta berisiitem numerik
hasil perhitungan agregat
berdasarkan kunci pada tabel
dimensi yang direlasikan
27.
NIP NIM Kd.Matkul Nilai
Info Dosen
Info Mata Kuliah
. . .
Ukuran numerik
dari tabel fakta
Kolom-kolom kunci dari tabel fakta
juga kunci dari tabel-tabel dimensiInfo Mahasiswa
. . .. . .. . .. . .
Tabel-tabel
dimensi
Tabel fakta
Gambaran Tabel Dimensi dan Tabel Fakta
28.
ER model berfokusterhadap
transaksional sementara
Dimensional Modelling berfokus
kepada dimensi dan fakta
Ada tiga jenisskema model
data pada datawarehouse,
yaitu star, fact constellation,
dan snowflake
32.
STAR FACT CONSTELATIONSNOWFLAKE
KONSEP DASAR
• Tabel dimensi berelasi
langsung dengan satu
tabel fakta
• Tabel dimensi tidak
bertingkat (denormalisasi)
• Tabel fakta berbagi tabel
dimensi dengan tabel
fakta lainnya
• Multiple facts
Tabel dimensi utama
berelasi dengan tabel fakta
dan dimensi lainnya berelasi
dengan dimensi utama
KELEBIHAN
Akses cepat dan mudah
dipahami oleh pengguna
Hemat ruang Mengurangi redundansi
karena ternormalisasi
KEKURANGAN
Boros ruang Tabel dimensi yang berelasi
dengan banyak fakta
kinerjanya menurun apabila
diakses bersamaan
Konsep normalisasi
menimbulkan query yang
kompleks
33.
Store Key
Product Key
PeriodKey
Units
Price
Time Dimension
Product
Dimension
Store Key
Store Name
City
State
Region
Period Key
Year
Quarter
Month
Product Key
Product Desc
Store Dimension Sale Fact
Skema Star
34.
Skema Fact Constellation
StoreKey
Product Key
Period Key
Units
Price
Store Dimension
Product
Dimension
Sales Fact
Store Key
Store Name
City
State
Region
Product Key
Product Desc
Shipper Key
Store Key
Product Key
Period Key
Units
Price
Shipping Fact
35.
Skema Snowflake
Store Key
ProductKey
Period Key
Units
Price
Time Dimension
Product
Dimension
Sale Fact
Store Key
Store Name
City Key
Period Key
Year
Quarter
Month
Product Key
Product Desc
City Key
City
State
Region
City Dimension
Store Dimension
Dua Methodologi UmumDatawarehouse (Common)
Pendekatan Relasional
Bill Inmon Ralph Kimball
Pendekatan Dimensional
39.
Dua pendekatan inimemiliki
perbedaan dari penyusunan
datawarehouse maupun
pendekatan skema data
40.
INMON (RELATIONAL APPROACH)KIMBALL (DIMENTIONAL APPROACH)
• Entity Relationship (ER) model
• Normalization rules
• Many tables using joins
• History Tables, natural keys
• Good for indirect end-user access of data
• Top-down approach
• Fact and dimensions, star schema
• Less tables but have duplicate data
(denormalized)
• Easier for user to understand (but strange for
IT people used to relational)
• Slowly changing dimensions, surrogate keys
• Good for direct end-user access of data
• Bottom-up approach
41.
Relational Model DimensionalModel
If you are a business user, which model is easier to use?
Relational VS. Dimension Approach
Pertanyaan 2:
Informasi apasaja yang dibutuhkan?
Jawaban:
• Barang apa saja yang paling banyak dijual
di lokasi tertentu sepanjang tahun
• Barang apa yang paling banyak
memberikan pendapatan sepanjang tahun
Jawaban:
TAHUN KECAMATAN KATEGORISUM(TOTAL_PENJUALAN)
2007 ANDIR KONSUMSI 26
2007 SUMUR BANDUNG ATK 17
2007 ASTANA ANYAR ATK 16
2007 BANDUNG WETAN KONSUMSI 15
2007 SUMUR BANDUNG KONSUMSI 13
2007 ANDIR ATK 13
2007 BANDUNG WETAN ATK 7
Barang apa saja yang paling banyak dijual di lokasi tertentu sepanjang tahun?
TAHUN KECAMATAN SUBKATEGORI SUM(TOTAL_PENDAPATAN)
2007 ATK ALAT TULIS 4.270.000
2007 ATK ELEKTRONIK 511.000
2007 KONSUMSI SEMBAKO 116.000
2007 KONSUMSI SNACK 87.100
Barang apa yang paling banyak memberikan pendapatan sepanjang tahun?
Pertanyaan 6:
Basis dataapa saja yang menjadi sumber informasi tersebut?
Jawaban:
• Barang (#kode_barang, nama_barang, kelompok, satuan, harga)
• Kategori (#kelompok, sub_kategori, kategori)
• Pelanggan (#kode_cust, nama_cust, alamat, kota, kode_pos, telepon)
• Lokasi (#kode_pos, kelurahan, kecamatan)
• Penjualan (#no_faktur, #kode_barang, qty)
• Pembayaran (#no_faktur, tanggal, total, discount, #kode_cust)
64.
Tahap kedua dalammerancang
datawarehouse adalah
menentukan measure dan
dimension per informasi
65.
Informasi:
Barang apa sajayang paling banyak dijual di lokasi
tertentu sepanjang tahun?
Jawaban:
Measure: total penjualan
Dimension: barang, tahun (waktu/periode), lokasi
66.
Informasi:
Barang apa sajayang memberikan pendapatan
paling banyak sepanjang tahun?
Jawaban:
Measure: total pendapatan
Dimension: barang, tahun (waktu/periode)
67.
Dimensi mempunyai hirarkidan
hirarki ditentukan sesuai dengan
proses drill down dan roll up
pada OLAP
68.
Hirarki Barang:
Nama barang> sub kategori > kategori
Hirarki Periode:
Minggu > bulan > tahun
Hirarki Lokasi:
Kelurahan > kecamatan > kota
69.
BARANG PERIODE LOKASITOTAL
PENJUALAN
TOTAL
PENDAPATAN
KODE NAMA
SUB
KATEGORI
KATEGORI MINGGU BULAN TAHUN KELURAHAN KECAMATAN KOTA
B-001 SUKRO SNACK KONSUMSI 44 11 2007 ARJUNA ANDIR BANDUNG 5 12.500
45 11 2007 ARJUNA ANDIR BANDUNG 1 2.500
45 11 2007 SUKALUYU
BANDUNG
WETAN
BANDUNG 1 2.500
45 11 2007 BRAGA
SUMUR
BANDUNG
BANDUNG 2 5.000
9 22.500
..
..
TOTAL 54.500
Layout Informasi
Kategori dari teknologiperangkat lunak yang memungkinkan
analist, manajer, dan eksekutif mendapatkan insight pada
data secara cepat, konsisten, interaktif, aneka
ragam tampilan dari datawarehouse