Upcoming SlideShare
×

# Data dimensioanal kelompok akbar aswad

2,928 views

Published on

2 Likes
Statistics
Notes
• Full Name
Comment goes here.

Are you sure you want to Yes No
• Be the first to comment

Views
Total views
2,928
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
129
0
Likes
2
Embeds 0
No embeds

No notes for slide

### Data dimensioanal kelompok akbar aswad

1. 1. TUGAS KELOMPOK DATA MINING DAN DATA WAREHOUSE “DATA DIMENSIONAL” Oleh : - Akbar Aswad (1031098) - Pingky Hermanto (1131092) - Yulianto (1031102) - Lintang A. R. (1031080) - Ogi Riwandi (1031115) JURUSAN SISTEM INFORMASI FAKULTAS ILMU KOMPUTERUNIVERSITAS INTERNASIONAL BATAM 2012 1
2. 2. Daftar Isi ............................................................ Error! Bookmark not defined.Definisi Data Warehouse ........................................................................ 3I.1. Pengertian Data, Informasi dan Database ................................................... 3I.2. Pengertian Data Warehouse ..................................................................... 3I.3. Store-store data yang berhubungan dengan data warehouse .......................... 4I.4. Istilah-istilah yang berhubungan dengan data warehouse .............................. 5I.5. Karakteristik Data Warehouse .................................................................. 6Data Operasional ......................................................................................... 6Data Warehouse .......................................................................................... 6Data Dimensional ......................................................................................... 71. Pengertian ......................................................................................... 72. Konsep Modeling Data Dimensional ................................................. 92.1. Tabel Fakta (the fact table) .................................................................102.2. Dimensi Data Model .............................................................................113. Membangun Sebuah Model Data Dimensional ...............................133.1. Memilih Sebuah Proses Bisnis ................................................................ 143.2. Merangkum Dari Proses Bisnis...............................................................143.3. Menentukan Ringkasan Dari Tabel Fakta ................................................153.4. Indentifikasi Dimensi dan Hirarki ...........................................................163.4. Memilih dan Menetukan Tabel Fakta ......................................................173.5. Resisting Normalisasi ............................................................................183.6. Memilih Atribut Tabel Dimensi ..........................................................194. Menangani Masalah umum Data Dimensional ...............................204.1. Meminalisir Jumlah Atribut ..................................................................204.2. Penanganan Dimensi Yang Berubah........................................................214.3. Menggunakan Skema Snowflake ............................................................22Daftar Pustaka ..........................................................................................24 2
3. 3. Definisi Data WarehouseI.1. Pengertian Data, Informasi dan Database Sebelum membahas tentang data warehouse, hal yang harus dipahami terlebih dahuluyaitu pengertian tentang data,informasi dan database yaitu :1. Steven Alter, data merupakan fakta,gambar atau suara yang mungkin atau tidakberhubungan atau berguna bagi tugas tertentu.2. McLeod, data terdiri dari fakta-fakta dan angka yang secara relatif tidak berarti bagipemakai. Sedangkan informasi adalah data yang sudah diproses atau data yang memiliki arti. Jadi dapat diartikan bahwa data merupakan suatu bentuk keterangan-keterangan yangbelum diolah atau dimanipulasi sehingga belum begitu berarti bagi sebagian pemakai.Sedangkan informasi merupakan data yang sudah di olah sehingga memiliki arti. Menurut James A. O’Brien Database adalah suatu koleksi terintegrasi dimana secaralogika berhubungan dengan record dari file. Jadi Database adalah tempat penyimpanan data yang saling berhubungan secara logika,sehingga bisa digunakan untuk mendapatkan suatu informasi yang diperlukan oleh suatuorganisasi atau perusahaan. Sedangkan data yang diperoleh suatu organisasi atau perusahaan umumnya didapat darikegiatan operasional sehari-hari atau hasil dari transaksi. Sehingga dari perkembangan modeldatabase, dapat disebut juga dengan data warehouse.I.2. Pengertian Data Warehouse Pengertian Data Warehouse dapat bermacam-macam namun mempunyai inti yang sama,seperti pendapat beberapa ahli berikut ini : 3
5. 5. Sebuah sistem subjek berorientasi yang dioptimalkan untuk mencari satu atau dua catatan pada suatu waktu untuk pengambilan keputusan. Sebuah toko data operasional adalah bentuk hibrida data warehouse yang berisi tepat waktu, saat ini, informasi yang terintegrasi. Data biasanya adalah granularity tingkat lebih tinggi dari transaksi. Anda dapat menggunakan menyimpan data operasional untuk administrasi pengambilan keputusan, sehari-hari membuat. Data ini dapat berfungsi sebagai sumber umum dari data untuk gudang data. Repository Sebuah repositori menggabungkan sumber data ke dalam satu database dinormalisasi. Catatan dalam repositori sering diperbarui. Data operasional, bukan sejarah. Anda mungkin menggunakan repositori untuk spesifik pendukung keputusan query, tergantung pada persyaratan sistem tertentu. Sebuah repositori sesuai dengan kebutuhan perusahaan yang memerlukan, terpadu enterprise-wide sumber data untuk pengolahan operasional.I.4. Istilah-istilah yang berhubungan dengan data warehouse Istilah-istilah yang berkaitan dengan data warehouse : 1. On-Line Analytical Processing(OLAP) Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query dari data yang berukuran besar. 2. On-Line Transaction Processing(OLTP) Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari. 3. Dimension Table Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun). 4. Fact Table Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan. 5. DSS 5
8. 8. Anda bisa menempatkan setiap kombinasi dari bidang dari tabel pelanggansebelumnya dalam matriks ini, tetapi Anda selalu akan berakhir dengan korespondensisatu-ke-satu, yang menunjukkan bahwa tabel ini tidak multidimensi dan tidak akancocok untuk database dimensi. Namun, pertimbangkan meja relasional yang berisi lebih dari korespondensisatu-ke-satu antara bidang meja. Misalkan Anda membuat tabel yang berisi datapenjualan untuk produk yang dijual di setiap wilayah negara. Untuk mempermudah,misalkan perusahaan memiliki tiga produk yang dijual di tiga wilayah. Tabel 9 showsbagaimana Anda dapat menyimpan data ini dalam tabel relasional. Table 9. A Simple Relational Table Product Region Unit Sales Football East 2300 Football West 4000 Football Central 5600 Tennis racket East 5500 Tennis racket West 8000 Tennis racket Central 2300 Baseball East 10000 Baseball West 22000 Baseball Central 34000 Tabel dalam Tabel 9 cocok untuk representasi multidimensi karena memilikilebih dari satu produk per wilayah dan lebih dari satu wilayah per produk. Tabel 10menunjukkan matriks dua dimensi yang lebih baik merupakan hubungan banyak-ke-banyak data produk dan wilayah. Table 10. A Simple Two-Dimensional Example Product Region Central East West Football 5600 2300 4000 Tennis Racket 2300 5500 8000 Baseball 34000 10000 22000 Meskipun data ini dapat dipaksa ke dalam tabel tiga bidang relasional dari Tabel9, data cocok lebih alami ke dalam matriks dua dimensi dari Tabel 10. 8
9. 9. Keunggulan kinerja dari tabel dimensi di atas meja relasional tradisional dapat menjadi besar. Pendekatan dimensi menyederhanakan akses ke data yang ingin Anda meringkas atau membandingkan. Misalnya, jika Anda menggunakan tabel dimensi untuk query jumlah produk yang dijual di Barat, database server menemukan kolom Barat dan menghitung total untuk semua nilai baris dalam kolom tersebut. Untuk melakukan query yang sama di meja relasional, database server harus mencari dan mengambil setiap baris di mana kolom Daerah sama barat dan kemudian agregat data. Dalam pertanyaan semacam ini, tabel dimensi dapat total semua nilai kolom thewest di sebagian kecil dari waktu yang dibutuhkan tabel relasional untuk menemukan semua catatan Barat.2. Konsep Modeling Data Dimensional Untuk membangun sebuah database dimensi, Anda mulai dengan model data dimensi. Model Data dimensi menyediakan metode untuk membuat database sederhana dan mudah dipahami. Anda dapat membayangkan database dimensi sebagai kubus database tiga atau empat dimensi di mana pengguna dapat mengakses sepotong database bersama salah satu dimensi. Untuk membuat database dimensi, Anda membutuhkan model yang memungkinkan Anda memvisualisasikan data. Misalkan bisnis Anda menjual produk di pasar yang berbeda dan mengevaluasi kinerja dari waktu ke waktu. Sangat mudah untuk memahami proses bisnis sebagai kubus data, yang berisi dimensi waktu, produk, dan pasar. Gambar 35 menunjukkan model dimensi. Persimpangan berbagai sepanjang baris kubus akan berisi langkah- langkah bisnis. Langkah-langkah sesuai dengan kombinasi tertentu dari data produk, pasar, dan waktu. Figure 35. A Dimensional Model of a Business That Has Time, Product, and Market Dimensions Nama lain untuk model dimensi adalah skema bintang-bergabung. Para desainer database menggunakan nama ini karena diagram untuk model ini tampak seperti bintang dengan satu meja sentral di mana satu set meja lainnya akan ditampilkan. Tabel utama adalah tabel hanya dalam skema dengan beberapa join menghubungkannya ke 9
10. 10. semua tabel lainnya. Ini meja tengah disebut tabel fakta dan tabel lain yang disebut tabel dimensi. Tabel dimensi semua hanya memiliki join tunggal yang menempel mereka ke tabel fakta, terlepas dari query.Gambat 36 menunjukkan model dimensi sederhana dari sebuah bisnis yang menjual produk di pasar yang berbeda dan mengevaluasi kinerja bisnis dari waktu ke waktu. Gambar 36. A Typical Dimensional Model2.1. Tabel Fakta (the fact table) Tabel fakta menyimpan ukuran bisnis dan menunjuk ke nilai kunci pada tingkat terendah dari masing-masing tabel dimensi. Langkah-langkah adalah data kuantitatif atau faktual tentang subjek. Langkah-langkah umumnya numerik dan sesuai dengan seberapa jauh atau seberapa banyak aspek dari pertanyaan. Contoh tindakan adalah harga, penjualan produk, persediaan produk, pendapatan, dan sebagainya. Sebuah ukuran dapat didasarkan pada sebuah kolom dalam sebuah tabel atau dapat dihitung. Tabel 11 menunjukkan tabel fakta yang tindakannya merupakan jumlah dari unit yang terjual, pendapatan, dan keuntungan untuk penjualan produk tersebut ke akun bahwa pada hari itu. Table 11. A Fact Table with Sample Records Product Account Code Day Code Units Sold Revenue Profit Code 1 5 32104 1 82.12 27.12 3 17 33111 2 171.12 66.00 10
11. 11. Table 11. A Fact Table with Sample Records Product Account Code Day Code Units Sold Revenue Profit Code 1 13 32567 1 82.12 27.12 Sebelum Anda merancang tabel fakta, Anda harus menentukan rincian (granularity) dari tabel fakta. Granularity sesuai dengan bagaimana Anda mendefinisikan catatan rendah tingkat individu dalam tabel fakta. Granularity mungkin transaksi individual, snapshot harian, atau snapshot bulanan. Tabel fakta dalam Tabel 11 berisi satu baris untuk setiap produk yang dijual untuk setiap account setiap hari. Dengan demikian, granularity dari tabel fakta yang diungkapkan oleh asproduct akun demi hari.2.2. Dimensi Data Model Sebuah dimensi merupakan satu set objek atau peristiwa di dunia nyata. Setiap dimensi yang Anda mengidentifikasi untuk model data akan diimplementasikan sebagai tabel dimensi. Dimensi adalah kualifikasi yang membuat ukuran tabel fakta bermakna, karena mereka menjawab apa, kapan, dan di mana aspek pertanyaan. Sebagai contoh, perhatikan pertanyaan-pertanyaan berikut ini bisnis, dimana dimensi yang dicetak miring: • Apakah penyebab menghasilkan pendapatan tertinggi tahun lalu? • Apa keuntungan kita oleh vendor? • Berapa banyak unit yang terjual untuk setiap produk? Pada set sebelumnya pertanyaan, pendapatan, laba, dan unit yang dijual adalah ukuran (tidak dimensi), karena masing-masing merupakan data kuantitatif atau faktual. Dimension Elements Sebuah dimensi dapat menentukan elemen dimensi ganda untuk berbagai tingkat penjumlahan. Sebagai contoh, semua elemen yang berhubungan dengan struktur organisasi penjualan mungkin terdiri dari satu dimensi. Gambar 37 menunjukkan elemen dimensi bahwa dimensi rekening mendefinisikan. Gambar 37. Dimension Elements in the Accounts Dimension 11