SlideShare a Scribd company logo
1 of 35
Download to read offline
PROSES DATA:
Analisis Data Eksploratori
ARIF RAHMAN
1
2
Godsey, B, Think Like a Data
Scientist: Tackle the Data
Science Process Step-by-Step
3
4
Cielen, D, Meysman, ADB, & Ali, M,
Introducing Data Science: Big Data,
Machine Learning, and More, Using
Python Tools
5
6
Analisa Data Eksploratori
(Exploratory Data Analysis)
7
Analisis Data Eksploratori
Selama exploratory data analysis, maka perlu menyelami
lebih dalam pada ilustrasi dari data.
Informasi lebih mudah ditangkap saat data dipetakan dalam
ilustrasi gambar, sehingga biasanya menggunakan teknik
grafis untuk meningkatkan pengetahuan terhadap data dan
interaksi antar variabel.
Tujuan dari exploratory data analysis adalah untuk
mengetahui pola dari data dan menemukan anomali yang
terlewatkan sebelumnya, sehingga mampu menentukan dan
mengadaptasi model data yang sesuai dengan tujuan
analisis data.
8
Analisis Data Eksploratori
Teknik Visualisasi Data berbasis grafis dalam statistika
deskriptif dapat digunakan dalam exploratory data analysis
mulai dari grafik yang sederhana hingga grafik yang
kompleks.
Terkadang juga perlu memadukan beberapa model grafik
untuk mendapat ilustrasi data yang lebih banyak.
Bahkan grafik yang didukung animasi dan interaktif dapat
mempermudah mengenali data.
9
Tujuan Analisa Data Eksploratori
1. memaksimalkan pengetahuan (insight atau
knowledge) terhadap kumpulan data
2. mengungkap struktur dasar dari pola data;
3. mengekstrak variabel penting
4. mendeteksi outlier dan anomali
5. menguji asumsi yang mendasarinya
6. mengembangkan model parsimoni
7. menentukan setting faktor optimal
10
Data Warehouse
11
12
13
14
15
16
17
18
DATA WAREHOUSE
Data warehouse adalah koleksi dari
data yang subject-oriented, terintegrasi, time-
varian, dan nonvolatile, dalam mendukung
proses pembuatan keputusan.
Sering diintegrasikan dengan
berbagai sistem aplikasi untuk mendukung
pemrosesan dan analisis data dengan
menyediakan platform untuk historical data.
http://www.visualmetrics.co.uk/wp-
content/uploads/data-warehouse.png
19
KRITERIA DATA WAREHOUSE
SUBJECT ORIENTED
Diorganisasikan seputar subjek
utama seperti customer, produk,
sales. Fokus pada pemodelan data
dan analisis data untuk pembuatan
keputusan
TERINTIGRASI
Mengintegrasikan banyak
sumber data yang heterogen
seperti: relational database,
flatfile, olap. Teknik yang
digunakan adalah data cleaning
dan integrasi data
NON-VOLATILE
Penyimpanan data yang terpisah
secara fisik yang ditransformasikan
dari lingkungan operasional. Data
warehouse tidak memerlukan
oemrisesan transaksi
TIME-VARIANT
Data disimpan untuk
menyediakan informasi 5-10
tahun yang lalu. Data
mengandung elemen waktu baik
eksplisit maupun implisit
20
OLAP (on-line analitical
processing)
• OLAP adalah operasi basis data untuk mendapatkan
data dalam bentuk kesimpulan dengan menggunakan
agregasi sebagian mekanisme utama.
• OLAP berbeda dengan OLTP. OLTP ( on-line
transaction processing) merupakan operasi harian
yang dilakukan dalam sistem seperti: pembayaran,
registrasi, inventori, dsb
21
OLTP vs. OLAP
22
KUBUS DATA
❑ Data warehouse didasarkan pada model data multidimensional,
dimana data dipandnag dalam ebntuk kubus data.
❑ Kubus data, seperti sales, memungkinkan data dipandang dan
dimodelkan dalam banyak dimensi
o Tabel dimensi, seperti item (item_name, brand, type), or
time(day, week,month, quarter, year).
o Tabel fakta mengandung measures (seperti dollars_sold) dan
merupakan kunci untuk setiap tabel-tabel dimensi terkait.
❑ n-D base cube dinamakan base cuboid. 0-D cuboid merupakan
cuboid pada level paling tinggi, yang menampung ringkasan data
dalan level paling tinggi, dinamakan apex cuboid. Lattice dari
cuboidcuboid membentuk sebuah data cube.
23
24
Pemodelan Konseptual Data Warehouse
➢ Star schema: Sebuah tabel fakta di tengah-tengah
dihubungkan dengan sekumpulan tabel-tabel dimensi
➢ Snowflake schema: perbaikan dari skema star ketika
hirarki dimensional dinormalisasi ke dalam sekumpulan
tabel-tabel dimensi yang lebih kecil
➢ Fact constellations: Beberapa tabel fakta
dihubungkan ke tabel-tabel dimensi yang sama,
dipandang sebagai kumpulan dari skema star,
sehingga dinamakan skema galaksi atau fact
constellation.
25
CONTOH SKEMA STAR
26
CONTOH SKEMA SNOWFLAKE
27
CONTOH SKEMA GALAKSI
28
CONTOH KUBUS DATA
29
Cuboid yang terkait dengan
kubus
30
OPERASI- OPERASI OLAP
❖ Slicing adalah seleksi
sekumpulan sel dari seluruh array
multidimensi dengan menetapkan
nilai spesifik untuk satu
atau lebih dimensi
31
OPERASI- OPERASI OLAP
❖ Dicing melibatkan proses seleksi dari
subset sel dengan
menetapkan interval nilai atribut
32
OPERASI- OPERASI OLAP
❖ Role up adalah
mengumpulkan data-
data yang cakupannya
kecil hingga menjadi
besar. Contoh: Untuk
data penjualan, kita
dapat mengumpulkan
data penjualan dari
seluruh tanggal (harian)
dalam satu bulan.
33
OPERASI- OPERASI OLAP
❖ Drill down adalah
membagi data yang
cakupannya besar
menjadi lebih kecil.
Contoh: Untuk data
penjualan, kita dapat
membagi total data
penjualan bulanan (drill-
down) ke dalam total
penjualan harian.
34
Terima kasih ...
... Ada pertanyaan ???
35

More Related Content

Similar to Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07

Data warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.comData warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.comsuleman ganteng
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfHendroGunawan8
 
Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanDasufianti
 
2-3. Pengenalan SPSS dan Deskriptif (1).ppt
2-3. Pengenalan SPSS dan Deskriptif (1).ppt2-3. Pengenalan SPSS dan Deskriptif (1).ppt
2-3. Pengenalan SPSS dan Deskriptif (1).pptFaniaAmbarWanti
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfAndri946883
 
Topik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.pptTopik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.pptwidisalendra1
 
Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsHendro Subagyo
 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCcastakaagussugianto
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATAkejolo
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2kejolo
 
Slide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptxSlide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptxdion antariksa
 
Sekilas Tentang Data Mining
Sekilas Tentang Data MiningSekilas Tentang Data Mining
Sekilas Tentang Data MiningDEDE IRYAWAN
 

Similar to Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07 (20)

Data warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.comData warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.com
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
 
Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang Keputusan
 
DWO - Pertemuan 2 & 3
DWO - Pertemuan 2 & 3DWO - Pertemuan 2 & 3
DWO - Pertemuan 2 & 3
 
Sesion 5 - DW.pptx
Sesion 5 - DW.pptxSesion 5 - DW.pptx
Sesion 5 - DW.pptx
 
2-3. Pengenalan SPSS dan Deskriptif (1).ppt
2-3. Pengenalan SPSS dan Deskriptif (1).ppt2-3. Pengenalan SPSS dan Deskriptif (1).ppt
2-3. Pengenalan SPSS dan Deskriptif (1).ppt
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
 
Visualisasi Data.pptx
Visualisasi Data.pptxVisualisasi Data.pptx
Visualisasi Data.pptx
 
Topik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.pptTopik 24 Processing Data dan Visualisasi.pptx.ppt
Topik 24 Processing Data dan Visualisasi.pptx.ppt
 
Big data.pptx
Big data.pptxBig data.pptx
Big data.pptx
 
Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan Netlytics
 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDC
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATA
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Slide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptxSlide-SIF101-Data-Knowledge.pptx
Slide-SIF101-Data-Knowledge.pptx
 
Sekilas Tentang Data Mining
Sekilas Tentang Data MiningSekilas Tentang Data Mining
Sekilas Tentang Data Mining
 

More from Arif Rahman

Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Arif Rahman
 
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...Arif Rahman
 
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...Arif Rahman
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Arif Rahman
 
Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02Arif Rahman
 
Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01
Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01
Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01Arif Rahman
 
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi NonlinierModul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi NonlinierArif Rahman
 
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...Arif Rahman
 
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata NonparametrikModul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata NonparametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi ParametrikModul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi ParametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi ParametrikModul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi ParametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata ParametrikModul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata ParametrikArif Rahman
 
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika InferensiaModul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika InferensiaArif Rahman
 
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...Arif Rahman
 

More from Arif Rahman (20)

Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
 
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
 
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
Preparasi Data: Pembersihan dan Proses Awal Data - Modul Ajar Kuliah Analisis...
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
 
Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02Proses Data Science - Modul Ajar Kuliah Analisis Data 02
Proses Data Science - Modul Ajar Kuliah Analisis Data 02
 
Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01
Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01
Pengantar Analisis Data - Modul Ajar Kuliah Analisis Data 01
 
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
Modul Ajar Statistika Inferensia ke-13: Analisis Variansi, Eksperimentasi Fak...
 
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
Modul Ajar Statistika Inferensia ke-12: Uji Asumsi Klasik pada Regresi Linier...
 
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
Modul Ajar Statistika Inferensia ke-11: Analisis Regresi Linier Berganda (Mul...
 
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi NonlinierModul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
Modul Ajar Statistika Inferensia ke-10: Analisis Regresi Nonlinier
 
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
Modul Ajar Statistika Inferensia ke-9: Analisis Regresi Linier Sederhana (Sim...
 
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
Modul Ajar Statistika Inferensia ke-8: Analisis Korelasi Pearson, Spearman, K...
 
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
Modul Ajar Statistika Inferensia ke-7: Uji Tabel Kontingensi Independensi dan...
 
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
Modul Ajar Statistika Inferensia ke-6: Uji Kesesuaian Baik (Goodness of Fit T...
 
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata NonparametrikModul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
Modul Ajar Statistika Inferensia ke-5: Uji Hipotesa Rata-Rata Nonparametrik
 
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi ParametrikModul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
Modul Ajar Statistika Inferensia ke-4: Uji Hipotesa Proporsi Parametrik
 
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi ParametrikModul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
Modul Ajar Statistika Inferensia ke-3: Uji Hipotesa Variansi Parametrik
 
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata ParametrikModul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
Modul Ajar Statistika Inferensia ke-2: Uji Hipotesa Rata-rata Parametrik
 
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika InferensiaModul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
Modul Ajar Statistika Inferensia ke-1: Pengantar Statistika Inferensia
 
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
Modul Ajar Statistika Inferensia ke-14: Aplikasi Spreadsheet pada Statistika ...
 

Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07

  • 1. PROSES DATA: Analisis Data Eksploratori ARIF RAHMAN 1
  • 2. 2
  • 3. Godsey, B, Think Like a Data Scientist: Tackle the Data Science Process Step-by-Step 3
  • 4. 4
  • 5. Cielen, D, Meysman, ADB, & Ali, M, Introducing Data Science: Big Data, Machine Learning, and More, Using Python Tools 5
  • 6. 6
  • 8. Analisis Data Eksploratori Selama exploratory data analysis, maka perlu menyelami lebih dalam pada ilustrasi dari data. Informasi lebih mudah ditangkap saat data dipetakan dalam ilustrasi gambar, sehingga biasanya menggunakan teknik grafis untuk meningkatkan pengetahuan terhadap data dan interaksi antar variabel. Tujuan dari exploratory data analysis adalah untuk mengetahui pola dari data dan menemukan anomali yang terlewatkan sebelumnya, sehingga mampu menentukan dan mengadaptasi model data yang sesuai dengan tujuan analisis data. 8
  • 9. Analisis Data Eksploratori Teknik Visualisasi Data berbasis grafis dalam statistika deskriptif dapat digunakan dalam exploratory data analysis mulai dari grafik yang sederhana hingga grafik yang kompleks. Terkadang juga perlu memadukan beberapa model grafik untuk mendapat ilustrasi data yang lebih banyak. Bahkan grafik yang didukung animasi dan interaktif dapat mempermudah mengenali data. 9
  • 10. Tujuan Analisa Data Eksploratori 1. memaksimalkan pengetahuan (insight atau knowledge) terhadap kumpulan data 2. mengungkap struktur dasar dari pola data; 3. mengekstrak variabel penting 4. mendeteksi outlier dan anomali 5. menguji asumsi yang mendasarinya 6. mengembangkan model parsimoni 7. menentukan setting faktor optimal 10
  • 12. 12
  • 13. 13
  • 14. 14
  • 15. 15
  • 16. 16
  • 17. 17
  • 18. 18
  • 19. DATA WAREHOUSE Data warehouse adalah koleksi dari data yang subject-oriented, terintegrasi, time- varian, dan nonvolatile, dalam mendukung proses pembuatan keputusan. Sering diintegrasikan dengan berbagai sistem aplikasi untuk mendukung pemrosesan dan analisis data dengan menyediakan platform untuk historical data. http://www.visualmetrics.co.uk/wp- content/uploads/data-warehouse.png 19
  • 20. KRITERIA DATA WAREHOUSE SUBJECT ORIENTED Diorganisasikan seputar subjek utama seperti customer, produk, sales. Fokus pada pemodelan data dan analisis data untuk pembuatan keputusan TERINTIGRASI Mengintegrasikan banyak sumber data yang heterogen seperti: relational database, flatfile, olap. Teknik yang digunakan adalah data cleaning dan integrasi data NON-VOLATILE Penyimpanan data yang terpisah secara fisik yang ditransformasikan dari lingkungan operasional. Data warehouse tidak memerlukan oemrisesan transaksi TIME-VARIANT Data disimpan untuk menyediakan informasi 5-10 tahun yang lalu. Data mengandung elemen waktu baik eksplisit maupun implisit 20
  • 21. OLAP (on-line analitical processing) • OLAP adalah operasi basis data untuk mendapatkan data dalam bentuk kesimpulan dengan menggunakan agregasi sebagian mekanisme utama. • OLAP berbeda dengan OLTP. OLTP ( on-line transaction processing) merupakan operasi harian yang dilakukan dalam sistem seperti: pembayaran, registrasi, inventori, dsb 21
  • 23. KUBUS DATA ❑ Data warehouse didasarkan pada model data multidimensional, dimana data dipandnag dalam ebntuk kubus data. ❑ Kubus data, seperti sales, memungkinkan data dipandang dan dimodelkan dalam banyak dimensi o Tabel dimensi, seperti item (item_name, brand, type), or time(day, week,month, quarter, year). o Tabel fakta mengandung measures (seperti dollars_sold) dan merupakan kunci untuk setiap tabel-tabel dimensi terkait. ❑ n-D base cube dinamakan base cuboid. 0-D cuboid merupakan cuboid pada level paling tinggi, yang menampung ringkasan data dalan level paling tinggi, dinamakan apex cuboid. Lattice dari cuboidcuboid membentuk sebuah data cube. 23
  • 24. 24
  • 25. Pemodelan Konseptual Data Warehouse ➢ Star schema: Sebuah tabel fakta di tengah-tengah dihubungkan dengan sekumpulan tabel-tabel dimensi ➢ Snowflake schema: perbaikan dari skema star ketika hirarki dimensional dinormalisasi ke dalam sekumpulan tabel-tabel dimensi yang lebih kecil ➢ Fact constellations: Beberapa tabel fakta dihubungkan ke tabel-tabel dimensi yang sama, dipandang sebagai kumpulan dari skema star, sehingga dinamakan skema galaksi atau fact constellation. 25
  • 30. Cuboid yang terkait dengan kubus 30
  • 31. OPERASI- OPERASI OLAP ❖ Slicing adalah seleksi sekumpulan sel dari seluruh array multidimensi dengan menetapkan nilai spesifik untuk satu atau lebih dimensi 31
  • 32. OPERASI- OPERASI OLAP ❖ Dicing melibatkan proses seleksi dari subset sel dengan menetapkan interval nilai atribut 32
  • 33. OPERASI- OPERASI OLAP ❖ Role up adalah mengumpulkan data- data yang cakupannya kecil hingga menjadi besar. Contoh: Untuk data penjualan, kita dapat mengumpulkan data penjualan dari seluruh tanggal (harian) dalam satu bulan. 33
  • 34. OPERASI- OPERASI OLAP ❖ Drill down adalah membagi data yang cakupannya besar menjadi lebih kecil. Contoh: Untuk data penjualan, kita dapat membagi total data penjualan bulanan (drill- down) ke dalam total penjualan harian. 34
  • 35. Terima kasih ... ... Ada pertanyaan ??? 35