Data warehouse dan database merupakan sistem penyimpanan data yang berbeda dalam cara memprosesnya. Data warehouse menggunakan OLAP untuk menganalisis data secara cepat sedangkan database menggunakan OLTP untuk transaksi data. Data mart merupakan bagian penting dari data warehouse yang mendukung analisis tingkat departemen. OLAP menampilkan laporan multidimensi dari data besar menggunakan tabel fakta dan dimensi. Data mining mengekstrak pola dari data besar menggunak
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
DATA WAREHOUSE.pdf
1. TUGAS DATA WAREHOUSE, DATA BASE, dan Online Analytical Processing (OLAP)
Jelaskan mengenai data warehouse, serta sebutkan beberapa karakteristiknya.
➢ Pengertian data warehouse dari beberpa ahli,
a. Data warehouse adalah kumpulan data yang memiliki sifat subjek berorientasi,
terpadu, waktu-varian, dan tetap pada pengumpulan data untuk mendukung proses
pengambilan keputusan manajemen. (W.H. Inmon dan Richard DH)
b. Data warehouse adalah database yang read-only analisis dan digunakan sebagai
dasar sistem pendukung keputusan. (Vidette Poe)
c. Data warehouse merupakan database relasional yang dirancang lebih untuk query
dan analisis proses transaksi, biasanya mengandung sejarah data transaksi dan
mungkin juga data dari sumber lain. Data warehouse memisahkan beban kerja
analisis dari beban kerja transaksi dan memungkinkan organisasi untuk
menggabungkan / konsolidasi data dari berbagai sumber. (Paul Lane)
d. Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber
data yang heterogen (yang biasanya tersebar di beberapa basis data OLTP) bermigrasi
ke penyimpanan data dan terpisah homogen. (Ramelho)
e. Pengguna menerapkan keahliannya dalam hal masalah, dan komputer melakukan
analisis data yang canggih untuk memilih data yang tepat dan menempatkannya
dalam format yang sesuai untuk pengambilan keputusan. (Usama Fayyad)
Jadi, secara umum data warehouse merupakan metode dalam perancangan database, yang
menunjang DSS (Decission Support System) dan EIS (Executive Information System). Secara
fisik, data warehouse adalah database, tapi perancangan data warehouse dan database
sangat berbeda. Dalam desain database tradisional menggunakan normalisasi, sedangkan
data warehouse normalisasi bukanlah cara terbaik.
➢ Karakteristik data warehouse,
1. Berorientasi kepada subjek (subjek-oriented), data warehouse berorientasi
subjek dirancang untuk menganalisis data berdasarkan subjek-subjek tertentu dalam
organisasi, bukan pada proses atau fungsi aplikasi tertentu.
2. Data yang dimiliki terintegrasi (Data Integrated), Data Warehouse dapat menyimpan
data dari sumber yang terpisah ke dalam format yang konsisten dan terintegrasi satu
sama lain.
3. Dibuat dalam waktu tertentu (Timeline), semua data dalam data warehouse dapat
dikatakan akurat atau valid pada rentang waktu tertentu.
4. Data yang disimpan bersifat tetap (Non-Volatile), data dalam gudang data tidak
diperbarui secara realtime tetapi dalam refresh sistem operasi tertentu.
1. Jelaskan perbedaan database dan data warehouse
Data warehouse dan database merupakan sistem penyimpanan data, yang
membedakannya adalah cara kedua sistem ini memproseses data. Data warehouse
menggunakan OnLine Analytical Processing (OLAP) untuk menganalisis data yang
2. banyak dengan cepat, sedangkan database menggunakan Online Transactional
Processing (OLTP) untuk menghapus, memasukan, menggantu, dan memperbarui data
dalam transaksi yang banyak dalam waktu relatif singkat. Database merupakan salah
satu komponen dari data warehouse, sehingga data warehouse dan database saling
melengkapi.
2. Jelaskan definisi mengenai data mart dan jelaskan mengapa data mart sangat penting.
Data mart merupakan bagian dari data warehouse yang mendukung kebutuhan
(pembuatan laporan dan analisis) pada tingkat dapartemen/unit atau fungsi bisnis tertentu
dalam perusahaan.
Mengapa data mart menjadi sangat penting, berikut beberapa alasan yang menjadi
pertimbangannya,
a. Data mart lebih mudah dipahami dan dinavigasi,
b. Biaya pembuatan lebih murah.
c. Berisi data perusahan yang penting.
d. Meningkatkan waktu respon end-user.
3. Jelaskan mengenai Online Analytical Processing (OLAP).
Online Analytical Processing (OLAP) adalah suatu jenis pemrosesan yang menggunakan
tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan,
analisis query dari data yang berukuran besar dari barbagai perspektif (multidimensi).
4. Berikan definisi mengenai data mining, dan sebutkan beberapa teknologi utamanya.
Pengertian data mining adalah suatu proses semi otomatik yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan machine learning untuk mengektraksi
dan mengidentifikasi informasi pengetahuan potensial dan berguna yang tersimpan
didalam database besar. (Turban et al, 2005).
Teknologi utama yang digunakan pada data mining,
a. Statistik
b. Jaringan saraf tiruan (neural network)
c. Logika kabur (fuzzy logic)
d. Algoritma genetika
e. Teknologi kecerdasan buatan
f.
6. Jelaskan hubungan antara OLAP dan data mining.
OLAP merujuk pada summery dari data yang ada di dalam database yang dibentuk
menjadi data cubes, sedangkan data mining lebih kepada pemodelan-pemodelan yang
tidak tergantung apakah data yang dimodel berasal dari raw data yang ada di data
warehouse atau data yang sudah di summary seperti data cubes.