DATA WAREHOUSE
Merupakan database yang
menyimpan data sekarang dan data
historis yang dibutuhkan oleh
pengambil keputusan perusahaan
Data Warehouse?
Komponen Data Warehouse/Model Data Warehouse
Data mart adalah merupakan bagian
dari informasi data warehouse.
Data warehouse fokus pada data
organisasi, data mart fokus pada
informasi unit tertentu seperti
keuangan, produksi, atau operasi.
Data mart
Query
Kemampuan untuk menampilkan suatu data dari database
dimana mengambil dari tabel-tabel yang ada di database.
Perintah-perintah untuk mengakses data pada sistem basis
data.
Struktur bahasa query standar:
SELECT nama data item
FROM nama file
WHERE kondisi
Akses dan Analisis Data
Sebagai misal penggunaan bahasa query adalah sebagai
berikut:
SELECT no_mhs, nama_mhs, ip_mhs
FROM file_mhs
WHERE ip_mhs>=3
Query di atas digunakan untuk menampilkan data
mahasiswa dari file database yang bernama file_mhs
untuk mahasiswa yang indeks prestasinya paling
sedikit 3.
OLAP (Online Analytical Processing/OLAP)
Analisis data multidimensi
Mendukung manipulasi dan analisis data
dalam jumlah besar dari beragam
dimensi/perspektif
Multidimensional Data Model
Data Mining
Proses selecting, exploring, and
modeling sejumlah besar data untuk
menemukan pola tersembunyi dan
hubungan yang belum diketahui
sebelumnya untuk mendukung
pembuatan keputusan guna
memprediksi perilaku masa depan.
Tipe informasi yang diperoleh dari data mining:
Assosiasi
Sequence
Klasifikasi
Kluster
Forecasting (peramalan)
Analisis Statistik
Asosiasi
Informasi yang dikaitkan dengan event tunggal
tertentu.
Contoh:
Pembelian pop corn -> kenaikan pembelian coca
cola 65%
Ada promosi -> kenaikan pembelian coca-cola 85%
Sequence (tahapan)
Informasi yang menghubungkan
kejadian lintas waktu.
Contoh:
Pembelian rumah -> pembelian kulkas
naik 65% -> pembelian oven naik 45%
Klasifikasi
Pola yang menggambarkan suatu item masuk
dalam kelompok mana dengan menguji item
yang sudah diklasifikasi dan menyimpulkan suatu
aturan.
Contoh:
Bisnis kartu kredit khawatir tentang konsumen
yang loyal/tidak -> klasifikasi untuk mengetahui
klasifikasi konsumen loyal/tidak  menentukan
kampanye untuk mempertahankan konsumen
Klaster
Sama seperti melakukan klasifikasi tapi ketika belum ada
kelompok yang teridentifikasi
Contoh: data dalam kartu kredit yang membagi
konsumen berdasar demografi
Forecasting (peramalan)
Menggunakan data yang ada untuk meramalkan
informasi yang akan terjadi.
Contoh: data historis penjualan 5 tahun terakhir untuk
meramalkan penjualan tahun depan
Analisis Statistik
Menggunakan fungsi2 Statistik
seperti: korelasi, regresi, variance, dll
untuk menganalisa data
Korelasi: membahas keeratan hubungan antar
variabel X dg Y
Regresi: membahas prediksi (peramalan), jenisnya:
Regresi tunggal: Y = a + bX
Regresi berganda; Y = a + b1X1 + b2X2, dst…
Perusahaan perlu memformulasi strategi untuk:
meningkatkan kualitas informasi organisasi
Efektifitas pengambilan keputusan
“information cleansing / scrubbing
Aktivitas untuk menyelesaikan masalah informasi yang
inconsistent, incorrect, atau incomplete.
(dengan bantuan software, misal: Oracle, SAS, dll)
Kualitas Informasi
Contoh (gambar 6.17)
Perubahan dari CUSTOMER ID menjadi
CONTACT
o Contoh (gambar 6.18)
Diperlukannya standarisasi nama konsumen
Terima kasih atas perhatiannya
ada pertanyaan?

08 sip datawarehouse

  • 1.
  • 2.
    Merupakan database yang menyimpandata sekarang dan data historis yang dibutuhkan oleh pengambil keputusan perusahaan Data Warehouse?
  • 3.
  • 5.
    Data mart adalahmerupakan bagian dari informasi data warehouse. Data warehouse fokus pada data organisasi, data mart fokus pada informasi unit tertentu seperti keuangan, produksi, atau operasi. Data mart
  • 6.
    Query Kemampuan untuk menampilkansuatu data dari database dimana mengambil dari tabel-tabel yang ada di database. Perintah-perintah untuk mengakses data pada sistem basis data. Struktur bahasa query standar: SELECT nama data item FROM nama file WHERE kondisi Akses dan Analisis Data
  • 7.
    Sebagai misal penggunaanbahasa query adalah sebagai berikut: SELECT no_mhs, nama_mhs, ip_mhs FROM file_mhs WHERE ip_mhs>=3 Query di atas digunakan untuk menampilkan data mahasiswa dari file database yang bernama file_mhs untuk mahasiswa yang indeks prestasinya paling sedikit 3.
  • 8.
    OLAP (Online AnalyticalProcessing/OLAP) Analisis data multidimensi Mendukung manipulasi dan analisis data dalam jumlah besar dari beragam dimensi/perspektif
  • 9.
  • 10.
    Data Mining Proses selecting,exploring, and modeling sejumlah besar data untuk menemukan pola tersembunyi dan hubungan yang belum diketahui sebelumnya untuk mendukung pembuatan keputusan guna memprediksi perilaku masa depan.
  • 11.
    Tipe informasi yangdiperoleh dari data mining: Assosiasi Sequence Klasifikasi Kluster Forecasting (peramalan) Analisis Statistik
  • 12.
    Asosiasi Informasi yang dikaitkandengan event tunggal tertentu. Contoh: Pembelian pop corn -> kenaikan pembelian coca cola 65% Ada promosi -> kenaikan pembelian coca-cola 85%
  • 13.
    Sequence (tahapan) Informasi yangmenghubungkan kejadian lintas waktu. Contoh: Pembelian rumah -> pembelian kulkas naik 65% -> pembelian oven naik 45%
  • 14.
    Klasifikasi Pola yang menggambarkansuatu item masuk dalam kelompok mana dengan menguji item yang sudah diklasifikasi dan menyimpulkan suatu aturan. Contoh: Bisnis kartu kredit khawatir tentang konsumen yang loyal/tidak -> klasifikasi untuk mengetahui klasifikasi konsumen loyal/tidak  menentukan kampanye untuk mempertahankan konsumen
  • 15.
    Klaster Sama seperti melakukanklasifikasi tapi ketika belum ada kelompok yang teridentifikasi Contoh: data dalam kartu kredit yang membagi konsumen berdasar demografi Forecasting (peramalan) Menggunakan data yang ada untuk meramalkan informasi yang akan terjadi. Contoh: data historis penjualan 5 tahun terakhir untuk meramalkan penjualan tahun depan
  • 16.
    Analisis Statistik Menggunakan fungsi2Statistik seperti: korelasi, regresi, variance, dll untuk menganalisa data
  • 17.
    Korelasi: membahas keeratanhubungan antar variabel X dg Y Regresi: membahas prediksi (peramalan), jenisnya: Regresi tunggal: Y = a + bX Regresi berganda; Y = a + b1X1 + b2X2, dst…
  • 18.
    Perusahaan perlu memformulasistrategi untuk: meningkatkan kualitas informasi organisasi Efektifitas pengambilan keputusan “information cleansing / scrubbing Aktivitas untuk menyelesaikan masalah informasi yang inconsistent, incorrect, atau incomplete. (dengan bantuan software, misal: Oracle, SAS, dll) Kualitas Informasi
  • 19.
    Contoh (gambar 6.17) Perubahandari CUSTOMER ID menjadi CONTACT o Contoh (gambar 6.18) Diperlukannya standarisasi nama konsumen
  • 22.
    Terima kasih atasperhatiannya ada pertanyaan?