SlideShare a Scribd company logo
1 of 38
Download to read offline
Perancangan Data Warehouse
(Logical dan Physical)
PERTEMUAN 6 DATA WAREHOUSE AND DATA MINING
Dedi Darwis, M.Kom.
Outline
Logical Design
◦ OLTP
◦ DW
◦ OLAP
◦ Dimensi
◦ Agregasi
Physical Design
◦ OLTP
◦ DW
◦ OLAP
◦ Dimensi
◦ Agregasi
Logical Design
Berisi mengenai keterangan entitas, atribut, primary key, dan foreign key
Logical Design
Logical Design: OLTP
Dalam OLTP, desain logical yang ada hanya mencakup kebutuhan-kebutuhan
perusahaan yang bersifat transaksional saja
Logical Design
OLTP
Logical Design: Perancangan DW
Logical Design dalam Perancangan Data Warehouse ditinjau dari data mart-data
mart yang dibutuhkan dalam pembangunan data warehouse
Logical Design: Dimensional Modelling
Perubahan pada tabel dimensi
◦ Dimensi berubah secara lambat
◦ Tipe-tipe perubahan
Dimensi lain
◦ Ukuran dimensi yang sangat besar
◦ Dimensi sampah
Dimensi Berubah Secara Lambat
Dimensi-dimensi pada umumnya konstan
◦ Contoh: lokasi, departemen perusahaan, dst
Beberapa dimensi bisa berubah secara lambat
◦ Contoh: penambahan departemen, penambahan cabang
Product key dari produk tidak berubah
Deskripsi dan atribut lain bisa berubah namun lambat
Dalam sumber sistem OLTP, nilai baru menimpa nilai lama
Perubahan di tabel dimensi harus memperhitungkan nilai yang lama dan yang baru
Pengubahan pada tabel dimensi bergantung pada jenis Data Warehouse
Dimensi lain
Dimensi ukuran besar
Contoh:
◦ Customer
◦ Sangat banyak, bisa lebih dari 20 juta baris
◦ Memiliki atribut yang sangat lebar +- 150 kolom
◦ Bisa memiliki hierarki jamak
Dimensi lain
Dimensi ukuran besar
Contoh:
◦ Produk
◦ Sangat banyak, bisa lebih dari 100k jenis produk
◦ Memiliki atribut yang lebar, lebih dari 100 kolom
◦ Bisa memiliki hierarki jamak
Dimensi lain
Penggunaan dimensi tersebut bisa sangat tidak optimal
Ada kekhususan: hierarki jamak:
◦ Dimensi tersebut dapat memiliki garis dimensi yang lebih dari 1
◦ Tergantung pada perspektif penggunaan dimensi tersebut
Dimensi Sampah
Ada beberapa atribut yang mungkin tidak berguna dalam struktur data DW.
Seperti:
◦ Flag ya/tidak
◦ Kode teks (seperti produk dengan kode tertentu)
◦ Informasi teks bebas (deskripsi produk, komentar)
Beberapa informasi yang terkandung di dalamnya bisa sangat sulit untuk
dijelajahi (text mining pada informasi teks)
Dimensi Sampah
Terkadang atribut-atribut dimensi ini bisa menjadi penting/tidak, maka
diperlukan keputusan untuk membuang/mempertahankan:
◦ Buang semua info teks dan flag
◦ Biarkan info teks dan flag apa adanya dalam tabel fakta
◦ Sendirikan info teks dan flag dalam satu tabel dimensi
◦ Cukup pertahankan info teks dan flag yang penting, misal penjualan terjadi (ya/tidak), dst
Logical Design: Perancangan Data Agregat
Data agregat adalah data yang muncul sebagai ringkasan pengelompokan data
tertentu (SUM, AVERAGE, MIN, MAX, GROUP BY, dst)
Hal ini penting karena kebutuhan penyimpanan data bisa diminimasi dan kueri
bisa lebih efektif
Logical Design: Perancangan Data
Agregat
Contoh kasus:
Suatu DW berisi data transaksi sebanyak 5 tahun dengan 300 toko
melaporkan transaksi harian terhadap 40000 produk di toko.
Berapakah jumlah baris pada tabel fakta yang terlibat?
5x365x300x40000= +- 20 milyar
Logical Design: Perancangan Data
Agregat
Contoh kasus lain:
Sebuah perusahaan telepon menyimpan data selama 5 tahun dan mencatat 150
juta panggilan tiap harinya
Sebuah perusahaan kartu kredit menyimpan data selama 5 tahun dan mencatat
transaksi 150 juta nasabah dengan rata-rata jumlah transaksi adalah 20 tiap
bulannya
Logical Design: Perancangan Data
Agregat
Mengagregasi Tabel Fakta
◦ Beberapa data bisa digabungkan dengan meninjau dimensi yang
disederhanakan/dinaikkan hierarkinya
◦ Caranya disebut multi-way aggregation
Logical Design: Perancangan Data
Agregat
Logical Design: Perancangan Data
Agregat
Logical Design: Perancangan Data
Agregat
Contoh hasil agregasi
Suatu DW berisi data transaksi sebanyak 5 tahun dengan 300 toko melaporkan
transaksi harian terhadap 40000 produk di toko. Namun, pemilik toko merasa
cukup untuk perlu tahu data ringkasan per brand, karena mengetahui data per
produk pun terlalu sulit untuk di analisis. Jumlah brand adalah 80.
Berapakah jumlah baris pada tabel fakta yang terlibat?
Logical Design: Perancangan Data
Agregat
Contoh hasil agregasi
Suatu DW berisi data transaksi sebanyak 5 tahun dengan 300 toko melaporkan
transaksi harian terhadap 40000 produk di toko. Namun, pemilik toko merasa
cukup untuk perlu tahu data ringkasan per brand, karena mengetahui data per
produk pun terlalu sulit untuk di analisis. Jumlah brand adalah 80.
Berapakah jumlah baris pada tabel fakta yang terlibat?
5x365x80x300=43800000
Logical Design: Perancangan Data
Agregat
Agregat tidak perlu selalu dilakukan, tergantung tingkat kejarangan data dan
jumlah yang dimiliki
◦ Jika data 25000 cabang akan diagregasi berdasar 15000 kota, agregasi ini tidak akan terlalu
signifikan
◦ Jika dalam tabel fakta memiliki tingkat kejarangan sebanyak 10%, sedangkan setelah
diagregasi masih tidak jauh dari 10%, maka agregasi berdasar suatu dimensi tidak perlu
dilakukan
Perhatikan user yang bisa menganalisis dengan maksimal, biasanya mereka tidak
menginginkan data hasil agregasi
Perhatikan efeknya terhadap data staging, karena agregasi yang terlalu intensif
akan membebani proses tersebut
Physical Design di OLTP
Berisi keterangan rinci mengenai entitas, atribut, jenis data, panjang nilai, dan
seterusnya
Berisi keterangan tentang indexing
Lokasi penempatan database (drive apa, ukuran berapa, jenis penyimpanan)
Parameter awalan dari pembuatan DBMS OLTP
Physical Design
Physical Design: Data Warehouse
Langkah-langkah
Physical Design: Data Warehouse
Pembuatan perencanaan agregasi
◦ Perlu diperhatikan mengenai hierarki-hierarki yang penting
◦ Perlu diperhatikan apakah OLAP perlu menyertakan data agregat atau
tidak
Physical Design: Data Warehouse
Adanya opsi clustering
◦ Penempatan dan manajemen data yang berhubungan dalam satu blok penyimpanan
Physical Design: Data Warehouse
Perlunya strategi indexing
◦ Penentuan indeks per tabel
◦ Apakah kolom yang dijadikan indeks sering berelasi
Physical Design: Data Warehouse
Menentukan Struktur Penyimpanan
◦ Penyimpanan per tahap Data Warehouse
◦ Data sementara
◦ Data Staging
◦ Pendukung aplikasi front end
Physical Design: Data Warehouse
Penyelesaian Model Fisik
◦ Standardisasi penamaan objek
◦ Pembuatan DDL
◦ Pemilihan RDBMS
Physical Design: Data Warehouse
Dari model logic ke model fisik
Physical Design: Data Warehouse
Perbedaan model logic
dan model fisik
Physical Design: OLAP
OLAP memiliki karakteristik data multidimensional
Biasanya ketentuan penyimpanan dan retrieval OLAP ditentukan oleh software pendukung
Physical Design: Dimensional Modelling
Pemberian Indeks
◦ Tabel Fakta
◦ Jika DBMS tidak mengindeks pada primary key, buatlah B-tree index pada full primary key
◦ Aturlah urutan dari unsur key individu
◦ Jangan lewatkan meninjau kolom dengan ciri-ciri metrik
◦ Contoh: Jika banyak kueri meninjau penjualan dalam dolar dengan rentang tertentu, ada
baiknya kolom penjualan menjadi indeks
Physical Design: Dimensional Modelling
Pemberian Indeks
◦ Tabel Dimensi
◦ Pembuatan indeks B-tree pada primary key tunggal
◦ Pemberian indeks pada kolom yang bersifat sebagai constraint kueri
◦ Penggunaan kolom dari dua atau lebih tabel yang sering diakses sebagai indeks (aturan
hierarki berlaku di sini)
◦ Pemberian indeks pada kolom tunggal yang sering digunakan sebagai join
Physical Design: Perancangan Data
Agregat
Peringkasan data
◦ Tergantung pada pengguna kueri
◦ Jika banyak yang meminta kueri mingguan, sebaiknya data agregat dirancang sebagai mingguan
◦ Konsekuensinya, tidak ada data harian yang tersimpan dalam data warehouse
◦ Gunakan prosedur untuk melakukan peringkasan secara otomatis

More Related Content

What's hot

Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Aprioridedidarwis
 
Kebutuhan Data Warehouse
Kebutuhan Data WarehouseKebutuhan Data Warehouse
Kebutuhan Data Warehousededidarwis
 
Ragam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerRagam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerAuliaa Oktarianii
 
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi InformasiMetodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi InformasiAlbaar Rubhasy
 
Laporan Makalah Pembuatan Website E-Commerce-Basis Data
Laporan Makalah Pembuatan Website E-Commerce-Basis DataLaporan Makalah Pembuatan Website E-Commerce-Basis Data
Laporan Makalah Pembuatan Website E-Commerce-Basis DataShofura Kamal
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Miningdedidarwis
 
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQLLaporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQLShofura Kamal
 
Pembuatan uml pada toko belanja online
Pembuatan uml pada toko belanja onlinePembuatan uml pada toko belanja online
Pembuatan uml pada toko belanja onlineandiseprianto
 
5 transformasi model data
5 transformasi model data5 transformasi model data
5 transformasi model dataSimon Patabang
 
LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...
LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...
LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...Uofa_Unsada
 
Fitur dan Komponen Data Warehouse
Fitur dan Komponen Data WarehouseFitur dan Komponen Data Warehouse
Fitur dan Komponen Data Warehousededidarwis
 
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop OnlineERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop OnlineLucha Kamala Putri
 
Intermediate code kode antara
Intermediate code   kode antaraIntermediate code   kode antara
Intermediate code kode antaraGunawan Manalu
 
Data Flow Diagram
Data Flow DiagramData Flow Diagram
Data Flow DiagramSherly Uda
 
4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)Simon Patabang
 
Tugas normalisasi imaika penjualan komputer
Tugas normalisasi   imaika penjualan komputerTugas normalisasi   imaika penjualan komputer
Tugas normalisasi imaika penjualan komputerHamdi Hamdi
 
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)tafrikan
 
Pengembangan Sistem Informasi Manajemen
Pengembangan Sistem Informasi ManajemenPengembangan Sistem Informasi Manajemen
Pengembangan Sistem Informasi ManajemenRahmi Septhianingrum
 

What's hot (20)

Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
Kebutuhan Data Warehouse
Kebutuhan Data WarehouseKebutuhan Data Warehouse
Kebutuhan Data Warehouse
 
Ragam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerRagam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan Komputer
 
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi InformasiMetodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
 
Laporan Makalah Pembuatan Website E-Commerce-Basis Data
Laporan Makalah Pembuatan Website E-Commerce-Basis DataLaporan Makalah Pembuatan Website E-Commerce-Basis Data
Laporan Makalah Pembuatan Website E-Commerce-Basis Data
 
Algoritma penjadwalan proses
Algoritma penjadwalan prosesAlgoritma penjadwalan proses
Algoritma penjadwalan proses
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Mining
 
ETL
ETLETL
ETL
 
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQLLaporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
Laporan Praktikum Basis Data Modul I-Membangun Database SQL Pada MYSQL
 
Pembuatan uml pada toko belanja online
Pembuatan uml pada toko belanja onlinePembuatan uml pada toko belanja online
Pembuatan uml pada toko belanja online
 
5 transformasi model data
5 transformasi model data5 transformasi model data
5 transformasi model data
 
LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...
LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...
LAPORAN TUGAS AKHIR PERANCANGAN APLIKASI KNOWLEDGE BASE SYSTEM UNTUK INSTRUKS...
 
Fitur dan Komponen Data Warehouse
Fitur dan Komponen Data WarehouseFitur dan Komponen Data Warehouse
Fitur dan Komponen Data Warehouse
 
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop OnlineERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
 
Intermediate code kode antara
Intermediate code   kode antaraIntermediate code   kode antara
Intermediate code kode antara
 
Data Flow Diagram
Data Flow DiagramData Flow Diagram
Data Flow Diagram
 
4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)
 
Tugas normalisasi imaika penjualan komputer
Tugas normalisasi   imaika penjualan komputerTugas normalisasi   imaika penjualan komputer
Tugas normalisasi imaika penjualan komputer
 
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)
 
Pengembangan Sistem Informasi Manajemen
Pengembangan Sistem Informasi ManajemenPengembangan Sistem Informasi Manajemen
Pengembangan Sistem Informasi Manajemen
 

Similar to Perancangan Data Warehouse (Logical dan Physical)

DATAWAREHOSEpertemuan 1.pdf
DATAWAREHOSEpertemuan 1.pdfDATAWAREHOSEpertemuan 1.pdf
DATAWAREHOSEpertemuan 1.pdfZoeniardiPutra
 
Data_warehouse.ppt
Data_warehouse.pptData_warehouse.ppt
Data_warehouse.pptDedek28
 
Data Mining 2 - Pemodelan Data.pptx
Data Mining 2 - Pemodelan Data.pptxData Mining 2 - Pemodelan Data.pptx
Data Mining 2 - Pemodelan Data.pptxssuser910c71
 
Business Intelligence - Overview
Business Intelligence - Overview Business Intelligence - Overview
Business Intelligence - Overview Beni Krisbiantoro
 
Data Management (Introducing of Datawarehouse)
Data Management (Introducing of Datawarehouse)Data Management (Introducing of Datawarehouse)
Data Management (Introducing of Datawarehouse)Adam Mukharil Bachtiar
 
Kel2 Data Warehouse 2
Kel2 Data Warehouse 2Kel2 Data Warehouse 2
Kel2 Data Warehouse 2Mrirfan
 
Kel2 Data Warehouse
Kel2 Data WarehouseKel2 Data Warehouse
Kel2 Data WarehouseMrirfan
 
Tugaswarehosdio2003
Tugaswarehosdio2003Tugaswarehosdio2003
Tugaswarehosdio2003Lavarino Dio
 
Data warehouse fundamental (Planning & Requirement)
Data warehouse fundamental (Planning & Requirement)Data warehouse fundamental (Planning & Requirement)
Data warehouse fundamental (Planning & Requirement)Ikka Utamy
 
jbptunikompp-gdl-mirakanias-25645-18-pemodela-p.ppt
jbptunikompp-gdl-mirakanias-25645-18-pemodela-p.pptjbptunikompp-gdl-mirakanias-25645-18-pemodela-p.ppt
jbptunikompp-gdl-mirakanias-25645-18-pemodela-p.pptaria800212
 
Materi 3_Munti Parsi Holan.pptx
Materi 3_Munti Parsi Holan.pptxMateri 3_Munti Parsi Holan.pptx
Materi 3_Munti Parsi Holan.pptxMuntiHolanBokenka
 
SISTEM MANAJEMEN BASIS DATA BAB 6
SISTEM MANAJEMEN BASIS DATA BAB 6 SISTEM MANAJEMEN BASIS DATA BAB 6
SISTEM MANAJEMEN BASIS DATA BAB 6 Muhamad SýLvêstër
 

Similar to Perancangan Data Warehouse (Logical dan Physical) (20)

DWO - Pertemuan 2 & 3
DWO - Pertemuan 2 & 3DWO - Pertemuan 2 & 3
DWO - Pertemuan 2 & 3
 
DATAWAREHOSEpertemuan 1.pdf
DATAWAREHOSEpertemuan 1.pdfDATAWAREHOSEpertemuan 1.pdf
DATAWAREHOSEpertemuan 1.pdf
 
Sesion 5 - DW.pptx
Sesion 5 - DW.pptxSesion 5 - DW.pptx
Sesion 5 - DW.pptx
 
05_Skema Database.ppt
05_Skema Database.ppt05_Skema Database.ppt
05_Skema Database.ppt
 
Data_warehouse.ppt
Data_warehouse.pptData_warehouse.ppt
Data_warehouse.ppt
 
Data Mining 2 - Pemodelan Data.pptx
Data Mining 2 - Pemodelan Data.pptxData Mining 2 - Pemodelan Data.pptx
Data Mining 2 - Pemodelan Data.pptx
 
Business Intelligence - Overview
Business Intelligence - Overview Business Intelligence - Overview
Business Intelligence - Overview
 
Data Management (Introducing of Datawarehouse)
Data Management (Introducing of Datawarehouse)Data Management (Introducing of Datawarehouse)
Data Management (Introducing of Datawarehouse)
 
Kel2 Data Warehouse 2
Kel2 Data Warehouse 2Kel2 Data Warehouse 2
Kel2 Data Warehouse 2
 
Kel2 Data Warehouse
Kel2 Data WarehouseKel2 Data Warehouse
Kel2 Data Warehouse
 
Chapter 2 fitur dan komponen datawarehouse
Chapter 2   fitur dan komponen datawarehouseChapter 2   fitur dan komponen datawarehouse
Chapter 2 fitur dan komponen datawarehouse
 
Tugaswarehosdio2003
Tugaswarehosdio2003Tugaswarehosdio2003
Tugaswarehosdio2003
 
Data warehouse fundamental (Planning & Requirement)
Data warehouse fundamental (Planning & Requirement)Data warehouse fundamental (Planning & Requirement)
Data warehouse fundamental (Planning & Requirement)
 
ALYAMIN II
ALYAMIN IIALYAMIN II
ALYAMIN II
 
4114310.ppt
4114310.ppt4114310.ppt
4114310.ppt
 
jbptunikompp-gdl-mirakanias-25645-18-pemodela-p.ppt
jbptunikompp-gdl-mirakanias-25645-18-pemodela-p.pptjbptunikompp-gdl-mirakanias-25645-18-pemodela-p.ppt
jbptunikompp-gdl-mirakanias-25645-18-pemodela-p.ppt
 
TEORI BAB 6
TEORI BAB 6TEORI BAB 6
TEORI BAB 6
 
ARTIKEL
ARTIKELARTIKEL
ARTIKEL
 
Materi 3_Munti Parsi Holan.pptx
Materi 3_Munti Parsi Holan.pptxMateri 3_Munti Parsi Holan.pptx
Materi 3_Munti Parsi Holan.pptx
 
SISTEM MANAJEMEN BASIS DATA BAB 6
SISTEM MANAJEMEN BASIS DATA BAB 6 SISTEM MANAJEMEN BASIS DATA BAB 6
SISTEM MANAJEMEN BASIS DATA BAB 6
 

More from dedidarwis

Cv dedi darwis
Cv dedi darwisCv dedi darwis
Cv dedi darwisdedidarwis
 
Manajemen pengetahuan
Manajemen pengetahuanManajemen pengetahuan
Manajemen pengetahuandedidarwis
 
Metadata pada Data Warehouse
Metadata pada Data WarehouseMetadata pada Data Warehouse
Metadata pada Data Warehousededidarwis
 
Siklus Pendapatan
Siklus PendapatanSiklus Pendapatan
Siklus Pendapatandedidarwis
 
Pengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis KomputerPengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis Komputerdedidarwis
 
Sistem Pengendalian Internal
Sistem Pengendalian InternalSistem Pengendalian Internal
Sistem Pengendalian Internaldedidarwis
 
Model data dan desain database
Model data dan desain databaseModel data dan desain database
Model data dan desain databasededidarwis
 
Pengantar e-business
Pengantar e-businessPengantar e-business
Pengantar e-businessdedidarwis
 
Siklus sistem informasi akuntansi
Siklus sistem informasi akuntansiSiklus sistem informasi akuntansi
Siklus sistem informasi akuntansidedidarwis
 
Konsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi AkuntansiKonsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi Akuntansidedidarwis
 
Pert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitianPert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitiandedidarwis
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitiandedidarwis
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitiandedidarwis
 
Pert 12 metode eksperimen
Pert 12   metode eksperimenPert 12   metode eksperimen
Pert 12 metode eksperimendedidarwis
 
Pert 11 kesalahan penelitian
Pert 11  kesalahan penelitianPert 11  kesalahan penelitian
Pert 11 kesalahan penelitiandedidarwis
 
Slide trik skripsi ftik s1
Slide trik skripsi ftik s1Slide trik skripsi ftik s1
Slide trik skripsi ftik s1dedidarwis
 
Pert 9 proposal penelitian
Pert 9 proposal penelitianPert 9 proposal penelitian
Pert 9 proposal penelitiandedidarwis
 
Pert 6 literatur review
Pert 6 literatur reviewPert 6 literatur review
Pert 6 literatur reviewdedidarwis
 
Pert 5 pengolahan data
Pert 5 pengolahan dataPert 5 pengolahan data
Pert 5 pengolahan datadedidarwis
 
Pert 5 pengumpulan-data
Pert 5 pengumpulan-dataPert 5 pengumpulan-data
Pert 5 pengumpulan-datadedidarwis
 

More from dedidarwis (20)

Cv dedi darwis
Cv dedi darwisCv dedi darwis
Cv dedi darwis
 
Manajemen pengetahuan
Manajemen pengetahuanManajemen pengetahuan
Manajemen pengetahuan
 
Metadata pada Data Warehouse
Metadata pada Data WarehouseMetadata pada Data Warehouse
Metadata pada Data Warehouse
 
Siklus Pendapatan
Siklus PendapatanSiklus Pendapatan
Siklus Pendapatan
 
Pengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis KomputerPengendalian SIA Berbasis Komputer
Pengendalian SIA Berbasis Komputer
 
Sistem Pengendalian Internal
Sistem Pengendalian InternalSistem Pengendalian Internal
Sistem Pengendalian Internal
 
Model data dan desain database
Model data dan desain databaseModel data dan desain database
Model data dan desain database
 
Pengantar e-business
Pengantar e-businessPengantar e-business
Pengantar e-business
 
Siklus sistem informasi akuntansi
Siklus sistem informasi akuntansiSiklus sistem informasi akuntansi
Siklus sistem informasi akuntansi
 
Konsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi AkuntansiKonsep Dasar Sistem Informasi Akuntansi
Konsep Dasar Sistem Informasi Akuntansi
 
Pert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitianPert 14 publikasi hasil penelitian
Pert 14 publikasi hasil penelitian
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitian
 
Pert 13 pengujian hasil penelitian
Pert 13  pengujian hasil penelitianPert 13  pengujian hasil penelitian
Pert 13 pengujian hasil penelitian
 
Pert 12 metode eksperimen
Pert 12   metode eksperimenPert 12   metode eksperimen
Pert 12 metode eksperimen
 
Pert 11 kesalahan penelitian
Pert 11  kesalahan penelitianPert 11  kesalahan penelitian
Pert 11 kesalahan penelitian
 
Slide trik skripsi ftik s1
Slide trik skripsi ftik s1Slide trik skripsi ftik s1
Slide trik skripsi ftik s1
 
Pert 9 proposal penelitian
Pert 9 proposal penelitianPert 9 proposal penelitian
Pert 9 proposal penelitian
 
Pert 6 literatur review
Pert 6 literatur reviewPert 6 literatur review
Pert 6 literatur review
 
Pert 5 pengolahan data
Pert 5 pengolahan dataPert 5 pengolahan data
Pert 5 pengolahan data
 
Pert 5 pengumpulan-data
Pert 5 pengumpulan-dataPert 5 pengumpulan-data
Pert 5 pengumpulan-data
 

Perancangan Data Warehouse (Logical dan Physical)

  • 1. Perancangan Data Warehouse (Logical dan Physical) PERTEMUAN 6 DATA WAREHOUSE AND DATA MINING Dedi Darwis, M.Kom.
  • 2. Outline Logical Design ◦ OLTP ◦ DW ◦ OLAP ◦ Dimensi ◦ Agregasi Physical Design ◦ OLTP ◦ DW ◦ OLAP ◦ Dimensi ◦ Agregasi
  • 3. Logical Design Berisi mengenai keterangan entitas, atribut, primary key, dan foreign key
  • 5. Logical Design: OLTP Dalam OLTP, desain logical yang ada hanya mencakup kebutuhan-kebutuhan perusahaan yang bersifat transaksional saja
  • 7. Logical Design: Perancangan DW Logical Design dalam Perancangan Data Warehouse ditinjau dari data mart-data mart yang dibutuhkan dalam pembangunan data warehouse
  • 8. Logical Design: Dimensional Modelling Perubahan pada tabel dimensi ◦ Dimensi berubah secara lambat ◦ Tipe-tipe perubahan Dimensi lain ◦ Ukuran dimensi yang sangat besar ◦ Dimensi sampah
  • 9. Dimensi Berubah Secara Lambat Dimensi-dimensi pada umumnya konstan ◦ Contoh: lokasi, departemen perusahaan, dst Beberapa dimensi bisa berubah secara lambat ◦ Contoh: penambahan departemen, penambahan cabang Product key dari produk tidak berubah Deskripsi dan atribut lain bisa berubah namun lambat Dalam sumber sistem OLTP, nilai baru menimpa nilai lama Perubahan di tabel dimensi harus memperhitungkan nilai yang lama dan yang baru Pengubahan pada tabel dimensi bergantung pada jenis Data Warehouse
  • 10. Dimensi lain Dimensi ukuran besar Contoh: ◦ Customer ◦ Sangat banyak, bisa lebih dari 20 juta baris ◦ Memiliki atribut yang sangat lebar +- 150 kolom ◦ Bisa memiliki hierarki jamak
  • 11. Dimensi lain Dimensi ukuran besar Contoh: ◦ Produk ◦ Sangat banyak, bisa lebih dari 100k jenis produk ◦ Memiliki atribut yang lebar, lebih dari 100 kolom ◦ Bisa memiliki hierarki jamak
  • 12. Dimensi lain Penggunaan dimensi tersebut bisa sangat tidak optimal Ada kekhususan: hierarki jamak: ◦ Dimensi tersebut dapat memiliki garis dimensi yang lebih dari 1 ◦ Tergantung pada perspektif penggunaan dimensi tersebut
  • 13.
  • 14. Dimensi Sampah Ada beberapa atribut yang mungkin tidak berguna dalam struktur data DW. Seperti: ◦ Flag ya/tidak ◦ Kode teks (seperti produk dengan kode tertentu) ◦ Informasi teks bebas (deskripsi produk, komentar) Beberapa informasi yang terkandung di dalamnya bisa sangat sulit untuk dijelajahi (text mining pada informasi teks)
  • 15. Dimensi Sampah Terkadang atribut-atribut dimensi ini bisa menjadi penting/tidak, maka diperlukan keputusan untuk membuang/mempertahankan: ◦ Buang semua info teks dan flag ◦ Biarkan info teks dan flag apa adanya dalam tabel fakta ◦ Sendirikan info teks dan flag dalam satu tabel dimensi ◦ Cukup pertahankan info teks dan flag yang penting, misal penjualan terjadi (ya/tidak), dst
  • 16. Logical Design: Perancangan Data Agregat Data agregat adalah data yang muncul sebagai ringkasan pengelompokan data tertentu (SUM, AVERAGE, MIN, MAX, GROUP BY, dst) Hal ini penting karena kebutuhan penyimpanan data bisa diminimasi dan kueri bisa lebih efektif
  • 17. Logical Design: Perancangan Data Agregat Contoh kasus: Suatu DW berisi data transaksi sebanyak 5 tahun dengan 300 toko melaporkan transaksi harian terhadap 40000 produk di toko. Berapakah jumlah baris pada tabel fakta yang terlibat? 5x365x300x40000= +- 20 milyar
  • 18. Logical Design: Perancangan Data Agregat Contoh kasus lain: Sebuah perusahaan telepon menyimpan data selama 5 tahun dan mencatat 150 juta panggilan tiap harinya Sebuah perusahaan kartu kredit menyimpan data selama 5 tahun dan mencatat transaksi 150 juta nasabah dengan rata-rata jumlah transaksi adalah 20 tiap bulannya
  • 19. Logical Design: Perancangan Data Agregat Mengagregasi Tabel Fakta ◦ Beberapa data bisa digabungkan dengan meninjau dimensi yang disederhanakan/dinaikkan hierarkinya ◦ Caranya disebut multi-way aggregation
  • 22. Logical Design: Perancangan Data Agregat Contoh hasil agregasi Suatu DW berisi data transaksi sebanyak 5 tahun dengan 300 toko melaporkan transaksi harian terhadap 40000 produk di toko. Namun, pemilik toko merasa cukup untuk perlu tahu data ringkasan per brand, karena mengetahui data per produk pun terlalu sulit untuk di analisis. Jumlah brand adalah 80. Berapakah jumlah baris pada tabel fakta yang terlibat?
  • 23. Logical Design: Perancangan Data Agregat Contoh hasil agregasi Suatu DW berisi data transaksi sebanyak 5 tahun dengan 300 toko melaporkan transaksi harian terhadap 40000 produk di toko. Namun, pemilik toko merasa cukup untuk perlu tahu data ringkasan per brand, karena mengetahui data per produk pun terlalu sulit untuk di analisis. Jumlah brand adalah 80. Berapakah jumlah baris pada tabel fakta yang terlibat? 5x365x80x300=43800000
  • 24. Logical Design: Perancangan Data Agregat Agregat tidak perlu selalu dilakukan, tergantung tingkat kejarangan data dan jumlah yang dimiliki ◦ Jika data 25000 cabang akan diagregasi berdasar 15000 kota, agregasi ini tidak akan terlalu signifikan ◦ Jika dalam tabel fakta memiliki tingkat kejarangan sebanyak 10%, sedangkan setelah diagregasi masih tidak jauh dari 10%, maka agregasi berdasar suatu dimensi tidak perlu dilakukan Perhatikan user yang bisa menganalisis dengan maksimal, biasanya mereka tidak menginginkan data hasil agregasi Perhatikan efeknya terhadap data staging, karena agregasi yang terlalu intensif akan membebani proses tersebut
  • 25. Physical Design di OLTP Berisi keterangan rinci mengenai entitas, atribut, jenis data, panjang nilai, dan seterusnya Berisi keterangan tentang indexing Lokasi penempatan database (drive apa, ukuran berapa, jenis penyimpanan) Parameter awalan dari pembuatan DBMS OLTP
  • 27. Physical Design: Data Warehouse Langkah-langkah
  • 28. Physical Design: Data Warehouse Pembuatan perencanaan agregasi ◦ Perlu diperhatikan mengenai hierarki-hierarki yang penting ◦ Perlu diperhatikan apakah OLAP perlu menyertakan data agregat atau tidak
  • 29. Physical Design: Data Warehouse Adanya opsi clustering ◦ Penempatan dan manajemen data yang berhubungan dalam satu blok penyimpanan
  • 30. Physical Design: Data Warehouse Perlunya strategi indexing ◦ Penentuan indeks per tabel ◦ Apakah kolom yang dijadikan indeks sering berelasi
  • 31. Physical Design: Data Warehouse Menentukan Struktur Penyimpanan ◦ Penyimpanan per tahap Data Warehouse ◦ Data sementara ◦ Data Staging ◦ Pendukung aplikasi front end
  • 32. Physical Design: Data Warehouse Penyelesaian Model Fisik ◦ Standardisasi penamaan objek ◦ Pembuatan DDL ◦ Pemilihan RDBMS
  • 33. Physical Design: Data Warehouse Dari model logic ke model fisik
  • 34. Physical Design: Data Warehouse Perbedaan model logic dan model fisik
  • 35. Physical Design: OLAP OLAP memiliki karakteristik data multidimensional Biasanya ketentuan penyimpanan dan retrieval OLAP ditentukan oleh software pendukung
  • 36. Physical Design: Dimensional Modelling Pemberian Indeks ◦ Tabel Fakta ◦ Jika DBMS tidak mengindeks pada primary key, buatlah B-tree index pada full primary key ◦ Aturlah urutan dari unsur key individu ◦ Jangan lewatkan meninjau kolom dengan ciri-ciri metrik ◦ Contoh: Jika banyak kueri meninjau penjualan dalam dolar dengan rentang tertentu, ada baiknya kolom penjualan menjadi indeks
  • 37. Physical Design: Dimensional Modelling Pemberian Indeks ◦ Tabel Dimensi ◦ Pembuatan indeks B-tree pada primary key tunggal ◦ Pemberian indeks pada kolom yang bersifat sebagai constraint kueri ◦ Penggunaan kolom dari dua atau lebih tabel yang sering diakses sebagai indeks (aturan hierarki berlaku di sini) ◦ Pemberian indeks pada kolom tunggal yang sering digunakan sebagai join
  • 38. Physical Design: Perancangan Data Agregat Peringkasan data ◦ Tergantung pada pengguna kueri ◦ Jika banyak yang meminta kueri mingguan, sebaiknya data agregat dirancang sebagai mingguan ◦ Konsekuensinya, tidak ada data harian yang tersimpan dalam data warehouse ◦ Gunakan prosedur untuk melakukan peringkasan secara otomatis