Modul ini membahas tentang datawarehouse dan business intelligence. Modul ini menjelaskan karakteristik datawarehouse seperti subject oriented, integrated, time variant, dan non-volatile. Modul ini juga menjelaskan arsitektur datawarehouse yang terdiri dari source data, data staging, dan datamart. Selain itu, modul ini menjelaskan langkah-langkah pembuatan datawarehouse dan penerapan business intelligence.
Modul 1 - Datawarehouse & Business Intelligence Overview
1. MODULPERKULIAHAN
Kapita Selekta
Applied
Database
Datawarehouse & Business Intelligence
Overview
Fakultas Program Studi Tatap Muka Kode MK Disusun Oleh
Teknik Informatika
01
0641805 Yan Puspitarani
Abstract Kompetensi
Materi ini berisi penjelasan singkat
mengenai datawarehouse dan
Business Intelligence
Mahasiswa mampu menjelaskan
karakteristik datawarehouse dan
langkah-langkah pembangunan
datawarehouse dan Business
Intelligence.
2. ‘20
2 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Pendahuluan
Datawarehouse adalah database yang didesain khusus untuk mengerjakan proses query,
membuat laporan dan analisa. Data dari Data Warehouse bersumber dari Data operasional
perusahaan dan Sumber Eksternal, misalnya melalui internet, basis data komersial, basis
data pemasok. Sumber data pada datawarehouse berasal dari berbagai macam format,
software, platform dan jaringan yang beda. Data tersebut adalah hasil dari proses transaksi
perusahan / organisasi sehari.hari. Karena berasal dari sumber yang berbeda beda tadi,
maka data pada datawarehouse harus tersimpan dalam sebuah format yang baku.
Datawarehouse juga merupakan salah satu sistem pendukung keputusan, yaitu dengan
menyimpan data dari berbagai sumber, mengorganisasikannya dan dianalisa oleh para
pengambil kebijakan. Akan tetapi datawarehouse tidak dapat memberikan keputusan secara
langsung. Namun ia dapat memberikan informasi yang dapat membuat user menjadi lebih
paham dalam membuat kebijakan strategis. Secara umum, konsep datawarehouse
dijelaskan melalui gambar di bawah ini.
Konsep Data Warehouse
Adapun karakteristik Data Warehouse adalah :
a. Subject Oriented
3. ‘20
3 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Data disimpan berdasarkan jenis subjek
b. Integrated
Data berasal dari berbagai sumber dan aplikasi yang terintegrasi
c. Time Variant
Data disimpan berdasarkan waktu
d. Non-Volatile
Data tidak dapat dimanipulasi (bersifat permanen). Tidak dapat di update atau di
delete
Arsitektur Datawarehouse
Arsitektur Datawarehouse
4. ‘20
4 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Source Data
1. Production Data
berasal dari proses transaksi
2. Internal Data
spreadsheets, documents, customer profile, departmental database
3. Archived Data
arsip
4. External Data
Data Staging
1. Extraction
Extraction merupakan proses pengambilan data yang diperlukan dari sumber
datawarehouse dan selanjutnya dimasukkan pada staging area untuk diproses
pada tahap berikutnya.
2. Transformation
Proses ini akan menyesuaikan format data yang berbeda-beda menjadi sebuah
format konsisten yang sudah standar sesuai desain.
3. Loading
Proses ini memindahkan data ke data warehouse
Datamart
Datamart merupakan bagian dari datawarehouse. Datamart hanya menangani satu
bisnis proses, misalnya penjualan, maka hanya proses penjualan saja yang ditangani
pada data mart. Datamart sangat cocok untuk merepresentasikan data departemen.
Data Multidimensi
Jika selama ini model penyimpanan data yang kita ketahui adalah model relasional,
maka dalam datawarehouse, penyimpanan data mengunakan konsep data
multidimensi. Data multidimensi merupakan data yang dapat dilihat dari berbagai
sudut pandang, seperti : spreadsheet, cube. Pemrosesan data multidimensi
menggunakan OLAP.
Pemodelan data multidimensi :
1. Star Schema
5. ‘20
5 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Star Schema
Karakteristik model ini adalah :
a. Pusat dari star disebut fact table
b. Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal
dari tabel dimensi
c. Setiap tabel dimensi berelasi langsung dengan fact table
d. Tabel dimensi berisikan data tentang informasi atau waktu
e. Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to
many)
f. Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat
diakatakan bahwa fact table memiliki kombinasi key dari tabel dimensi
tersebut
Kelebihan model ini adalah lebih simple dan mudah dipahami, serta hasil dari
proses query juga relatif lebih cepat. Sementara kekurangan model ini adalah
lebih boros dalam space.
2. Snowflake Schema
Karakteristik model ini adalah :
a. Model snowflakes merupakan perluasan dari star yang sama2 punya satu
atau lebih dimensi.
6. ‘20
6 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
b. Pada snowflake, tabel yang berelasi pada fact table hanya tabel dimensi
utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama.
c. Model snowflake ini hampir sama seperti teknik normalisasi
Perhatikan Star Schema berikut ini :
Tabel Item dan Location ternyata memerlukan normalisasi karena masih
mengakibatkan redudansi yang akan membuat space penyimpanan sangat
besar. Hasil normalisasi table tersebut mengubah model star schema menjadi
snowflake schema seperti gambar di bawah ini.
Snowflakes Schema
Kelebihan model ini adalah :
a. Pemakain space yang lebih sedikit
b. Update dan maintenance yang lebih mudah
7. ‘20
7 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Kekurangan model ini adalah :
a. Model lebih komplek dan rumit
b. Proses query lebih lambat
c. Performance yang kurang bagus
Langkah pembuatan datawarehouse
1. Design Datawarehouse
Langkah ini menghasilkan Logical Design berupa ER Diagram dan Physical Design
berupa tablespace, table dan integrity constraint.
2. ETL
Proses ini dapat dibangun menggunakan Data Transformation Service yang dimiliki
MS SQL Server atau SQL*Loader milik Oracle
3. Create Dimension
Gambar berikut merupakan langkah-langkah pembuatan dimension
4. Create Cube
Gambar di bawah ini menjelaskan langkah-langkah pembuatan cube.
8. ‘20
8 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Business Intelligence
Setelah Datawarehouse dibangun, perusahaan dapat memanfaatkannya untuk membangun
Business Intelligence. Business intelligence (BI) adalah sekumpulan teori, metodologi,
arsitektur, dan teknologi yang mengubah data mentah menjadi informasi yang bermakna dan
berguna untuk tujuan bisnis.
Pengertian BI
Atau jika diilustrasikan, proses BI digambarkan pada gambar di bawah ini.
9. ‘20
9 Nama Mata Kuliah dari Modul Biro Akademik dan Pembelajaran
Dosen Pengampu http://www.widyatama.ac.id
Business Intelligence
Berdasarkan gambar dapat dilihat bahwa beragam data dari beragam sistem disimpan dalam
data repository atau dapat juga disimpan dalam datawarehouse yang kemudian diolah dalam
bentuk report untuk digunakan pihak eksekutif dalam membantu menentukan keputusan
bisnis.
Beberapa aplikasi yang dapat dimanfaatkan untuk membangun BI, yaitu spagoBI, Pentaho,
Tableau, Domo, Knime, Rapidminer, dan masih banyak lagi.