Your SlideShare is downloading. ×
Kel2 Data Warehouse
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Kel2 Data Warehouse

3,419
views

Published on

DataWarehouse

DataWarehouse

Published in: Education, Technology, Business

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
3,419
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
122
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)
  • 2. Kelompok 2 : R Dhiro Nugroho Diktyas Herly S P Chresida Julitania Novan Eko P Achmad Khalif Hakim Erian Pramudiono Dandy Herlambang Hurun Iin Paramita Dyah W Fanny Bintang S Riza Alaudin Syah
  • 3. Overview
    • Data Warehouse dan OLAP merupakan elemen penting yang mendukung decision support. Terutama bagi perusahaan – perusahaan besar dengan database yang kompleks.
    • Data Warehouse membantu para pekerja teknologi (manager,executive,analyst) untuk pengambilan keputusan yang lebih cepat dan mudah.
  • 4. DATA WAREHOUSE
  • 5. Definisi
    • Datawarehouse : Merupakan kumpulan data dari berbagai resource, yang disimpan dalam suatu gudang data (repository )dalam kapasitas besar.
    • Data warehouse memungkinkan user untuk memeriksa history data dan melakukan analisis terhadap data sehingga dapat mengambil keputisan berdasarkan analisa yang dibuat.
  • 6. Manfaat Data Warehouse
    • Kemampuan mengakses data yang berskala perusahaan.
    • Kemampuan memiliki data yang konsisten.
    • Dapat melakukan analisis secara cepat.
    • Dapat digunakan untuk mencari redundansi usaha di perusahaan.
    • Menemukan gap antara pengetahuan bisnis dengan proses bisnis.
    • Meminimalkan biaya administrasi.
    • Meningkatkan kinerja pegawai perusahaan untuk dapat melakukan tugasnya dengan lebih efektif.
  • 7. Karakteristik Data Warehouse
    • Subject Oriented : Data warehouse berfokus pada entitas – entitas bisnis level tinggi.
    • Integrated : Data disimpan dalam format yang konsisten (dalam konvensi penamaan, constraint domain, atribut fisik dan pengukuran)
    • Time variant : Data diasosiasikan dengan suatu titik waktu.
    • Non-volatile : Data yang berasal dari banyak resource terbebut tidak dapat diubah karena bersifat read only .
  • 8. Arsitektur Data Warehouse
  • 9. Desain Data Warehouse (1)
    • Mendefinisikan arsitektur, perencanaan kapasitas, memilih server storage, server OLAP dan database, dan toolsnya.
    • Mengintegrasikan server, storage dan client tools.
    • Mendesain skema warehouse dan views
    • Menentukan pengaturan physical database, data placement, pemartisian, metode pengaksesan
  • 10. Desain Data Warehouse (2)
    • Mengkoneksikan source menggunakan gateway, ODBC driver, atau yg lainnya
    • Mendesain dan mengimplementasikan script untuk extraksi data, cleaning, transformasi, load dan refresh
    • Menggabungkan repository dengan definisi skema dan view, script dan metadata lainnya
    • Mendisain dan mengimplementasikan aplikasi end user
    • Membuat data warehouse dan aplikasinya
  • 11. Transformasi Data Menjadi Informasi Data warehouse Business View Business Information Operational Data Metadata Data Transformation Tool Business View Business Information Operational Data Data warehouse Metadata Data Business View Business Information Operational Data Transformation Tool Data warehouse Metadata Data Business View Business Information Operational Data
  • 12. Perbedaan Data Warehouse dan View
    • Data warehouse merupakan penyimpanan yang stabil
    • Data warehouse tidak selalu relational, tetapi bisa juga multidimensional. Sedangkan view merupakan relational database
    • Data warehouse dapat diindex untuk mengoptimalkan performance, sedangkan view tidak dapat diindex secara independent
    • Karakteristik data warehouse mendukung spesifikasi dari funcionalitinya, sedangkan view tidak
    • Data warehouse menyediakan integrasi dan temporal data dalam jumlah yang besar umumya lebih dari satu database dimana view merupakan extraksi dari sebuah database
  • 13. Pemodelan Data
    • Skema tabel yang sering digunakan adalah skema bintang (star schema), yang digunakan pada OLAP
    • Skema tabel ini membentuk struktur informasi multidimensi yang kompatibel dengan kebutuhan bisnis.
  • 14. Star Schema
  • 15. Karakteristik Star Schema
    • Pusat skema bintang adalah fact table.
    • Fact table berisi indikator – indikator kinerja pokok.
    • Tabel di sekeliling fact table adalah dimension table
    • Tiap dimension table di-relasikan fact table berdasarkan primary key-nya
    • Skema bintang diimplementasikan menggunakan teknologi relational database.
  • 16. OLAP
  • 17. Definisi
    • OLAP : Sistem yang bertugas mengubah data yang disimpan dalam data warehouse dan mentransformasikan data menjadi struktur multidimensi (cube).
  • 18. OLTP vs OLAP Knowledge Worker IT Professional User OLAP OLTP Item Pengambilan keputusan Operasi harian Fungsi Berorientasi subjek Berorientasi aplikasi Perancangan Basis Data Historis, multidimensi, terintegrasi Up to date, rinci, relasional Data Read only Read/write Akses Complex Query Transaksi jangka pendek Unit Kerja 100 GB-TB 100 MB-GB Ukuran DB
  • 19. OLAP Server
    • Relational OLAP : RDBMS perluasan yang melakukan pemetaan operasi data multidimensi menjadi operasi relasional standar.
    • Multidimensional OLAP : Server yang secara langsung mengimplementasikan data dan operasi multidimensi.
    • Hybrid OLAP : Memberi kebebasan pada user / administrator untuk memilih partisi yang berbeda.
  • 20. Multidimensional Data Model (1)
    • Terdiri atas sekumpulan dimensi (independent variable) dan ukuran / nilai numerik (dependent variable)
    • Untuk semua record pada tiap dimensi, mempunyai nilai atribut yang sesuai dengan nilai cell pada dimensi tersebut.
    • Contoh : dimensi  Product (pid), Location (locid), Time (timeid)
    • nilai  Sales
  • 21. Multidimensional Data Model (2)
  • 22. Multidimensional Data Model (3)
    • Untuk setiap dimensi, penentuan nilai dilakukan berdasarkan konsep hirarki .
    • PRODUCT TIME LOCATION
    • year
    • quarter country
    • Category
    • week month
    • state
    • Pname date
    • city
  • 23. Tipe Penelusuran Data (OLAP Query)
    • Roll-up : Menampilkan data yang semakin meningkat ke level agregasinya, misalnya untuk mengetahui total penjualan di tiap kota dapat melalui informasi total penjualan di tiap negara.
    • Drill-down : Menampilkan rincian – rincian melalui query. Kita melakukan drill-down terhadap hirarki suatu tabel dimensi atau lebih, misalnya melihat ringkasan bulanan, mingguan, dst.
    • Pivot : pembentukan cross tabulation
    • Slice and dice : Persamaan dan
    • pembuatan range selection pada satu
    • atau banyak dimensi.