Dokumen tersebut membahas tentang pengantar konsep data mining mulai dari sejarah, definisi, jenis operasi, dan jenis data yang dapat dimining. Dibahas pula perkembangan konsep database, big data, dan data warehouse sebagai sumber data untuk proses data mining."
undang undang penataan ruang daerah kabupaten bogor
Â
2. Pengantar Data Mining
1.
2.
3. Table of Index
1) Sekapur Sirih
› Why Data Mining
2) Data dan Informasi
3) Perkembangan Konsep Data
› Data Base, Big Data, Data Warehouse
4) Pengantar Data Mining
› Sejarah Data Mining
› Definisi Data Mining
› Operasional Data Mining
› Jenis dan Pola Data Yang Dapat Di Mining
5) Penutup
6. Sekapur Sirih
Ilustrasi diatas menjelaskan bahwa :
≥ Banyak Database yang terhimpun dari berbagai
transaksi, akan tetapi digudangkan (warehoused)
seperti web data, e commerce, transaksi belanja
online & offline, transaksi perbankan (kredit,
debit, transfer, m-banking, e-banking, dll)
≥ Tingkat persaingan yang semakin kuat
≥ Tingkat kecepatan computer dan
bandwidth yang semakin kencang
7. Data vs Informasi
Data adalah suatu bahan keterangan yang
berasal dari suatu kejadian-kejadian nyata dan
fakta-fakta yang dapat berupa angka atau
catatan yang belum memiliki makna/manfaat.
Informasi adalah suatu data-data yang telah
diolah sedemikian baik secara manual maupun
terkomputasi yang hasilnya berguna bagi
penggunanya.
8. Data vs Informasi
Data (example)
•Data hasil transaksi suatu minimarket atau gerai
took yang belum diolah.
•Data hasil penjualan suatu produk oleh Sales
Promotion Girl (SPG)
Informasi (example)
Data hasil transaksi penjualan sepatu yang telah
dikumpulkan dan diolah untuk melihat seberapa
banyak hasil penjualan produk sepatu tipe A
perminggu atau perbulan.
10. Perkembangan Konsep Data
Database
Database / Pangkalan Data merupakan
suatu kumpulan data yang terhubung
satu sama lain (interrelated data)
disimpan secara bersama-sama dalam
suatu media penyimpanan.
11. Perkembangan Konsep Data
Database (cont’d)
Database berisi sekumpulan table-table
data dengan penamaan yang unik. Setiap
table berisi sekumpulan attribute yang
biasa di sebut dengan kolom/field dan
berisi sejumlah data record atau rows
12. Perkembangan Konsep Data
Database (cont’d)
Database terdiri dari kumpulan-
kumpulan record data operasional suatu
organisasi yang terintegrasi dengan
metode query tertentu yang mampu
memenuhi informasi yang optimal bagi
para penggunanya.
13. Perkembangan Konsep Data
Database (cont’d)
Database Transaksional merupakan data
yang diperoleh dari sebuah transaksi,
misalnya dari proses pembelian yang
dilakukan penumpang pesawat terhadap
maskapai yang dipilih atau transaksi
pengambilan uang di mesin ATM.
14. Perkembangan Konsep Data
Database (cont’d)
Contoh Database
NO KODE BARANG JENIS BARANG NAMA BARANG
JUMLAH
BARANG
HARGA BARANG PRODUSEN
1 lgt-spk-z01 Speaker 5.1 Sabre 9 1.200.000 Logitech
2 alt-spk-k03 Speaker 2.1 Simply 7 350.000 Altech
3 alt-spk-z02 Speaker 5.1 Surround 8 1.400.000 Altech
4 sbd-spk-z03 Speaker 5.1 Bomba 5 900.000 Simbadda
5 lgt-spk-k02 Speaker 2.1 Tracer 8 450.000 Logitech
6 sbd-spk-k01 Speaker 2.1 Zumba 6 200.000 Simbadda
15. Perkembangan Konsep Data
Database Management System
DBMS merupakan perangkat lunak
(software) yang mengatur kumpulan-
kumpulan database. Selain itu DBMS
digunakan untuk mengelola database yang
selanjutnya dapat digunakan oleh para
penggunanya.
16. Perkembangan Konsep Data
Database Management System (cont’d)
DBMS memiliki 2 fungsi utama.
1. Untuk mendeskripsikan data dalam suatu database
2. Untuk pengelolaan akses data dalam suatu database
17. Perkembangan Konsep Data
Big Data
Merupakan suatu istilah yang
menjelaskan tentang suatu kumpulan
dan himpunan data dengan jumlah yang
sangat besar sehingga menjadikannya
sulit untuk ditangani atau di proses
hanya dengan menggunakan database
manajemen biasa.
18. Perkembangan Konsep Data
Big Data (cont’d)
Big data memiliki 3 hal, yaitu :
›Ukuran (volume)
›Kecepatan (velocity)
›Ragam (variety)
19. Perkembangan Konsep Data
Big Data (cont’d)
Studi Kasus
Contoh data dengan ukuran sangat besar hingga ukuran
petabytes (1024 terabytes), atau bahkan sampai dengan
exabytes (1024 petabytes).
Hal ini bisa dilihat dari data web audio video youtube
yang memiliki kapasitas penyimpanan data sangat
besar.
Kasus lain seperti aplikasi Google Mail yang menyimpan
ratusan juta pengguna dengan semua inbox maupun
outbox e mail setiap user nya.
20. Perkembangan Konsep Data
Data Warehouse
merupakan suatu system computer yang
berfungsi untuk mengarsipkan dan
menganalisis data historis suatu organisasi
(instansi negara ataupun swasta) seperti
data transaksi penjualan, penggajian, data
karyawan atau data audio video pada suatu
simpanan data dalam jumlah besar.
21. Perkembangan Konsep Data
Data Warehouse
Proses yang ber-
langsung untuk mem-
bentuk data warehouse
adalah data cleaning,
data integration, data
transformation, data
loading dan periodic
data refresing.
Data
Keuangan
Data
Pegawai
Data
Operasionali
Data
Produksi
Clean
Integrate
Transform
Load
Refresh
DATA
WAREHOUSE
Query dan
Perangkat Analisis
Client ClientClient
22. Pengantar Data Mining
Sejarah Data Mining
Data mining muncul pada tahun 90-an. Data
mining merupakan cabang dari ilmu computer.
Kehadiran data mining berawal dari data
explosion 10-20 tahun terakhir ini. Banyak
organisasi (pemerintah/swasta) mengumpulkan
data sekian tahun lamanya, akan tetapi hanya
sebagai data simpanan.
23. Pengantar Data Mining
Sejarah Data Mining (cont’d)
Data mining dapat me-
nempatkan diri pada lingkup
database, statistik atau analisis
statistik, artificial intelligence
dan machine learning.
24. Pengantar Data Mining
Sejarah Data Mining
(cont’d)
Data mining berperan
penting dalam meng-olah
dan mem-proses database
yang ber-ukuran besar
(big data) dan tersimpan
di data warehouse.
Data Sources
Paper, files, Information Provider, Database, System, OLTP
Data Warehouse / Data Marts
OLAP, MDA
Data Exploration
Statistical, Analysis, Querying, and Reporting
Data Mining
Information Discovery
Data Presentation
Visualization Techniques
Making
Decision
25. Pengantar Data Mining
Sejarah Data Mining (cont’d)
Contoh kasus :
➢ Berapa banyak nasabah pada suatu bank. Berapa kali
nasabah transaksi dengan bank tersebut. Database
apa yang dapat diambil dari nasabah.
➢ Berapa banyak data barang yang dijual di hypermart.
Berapa pengunjung dalam 1 hari. Berapa kali transaksi
yang dilakukan dalam sehari. Berapa keuntungan yang
diperoleh. Barang apa yang paling sering/banyak di
beli oleh pelanggan.
26. Pengantar Data Mining
Sejarah Data Mining (cont’d)
Contoh kasus :
➢ Pertanyaan yang akan timbul adalah apakah database
tersebut akan terus menggunung dan tidak bermanfaat ???
➢ Apakah akan dibuang dalam kurun waktu tertentu ???
➢ Apakah hanya akan menjadi pajangan yang indah bagi
organisasi tanpa mengetahui maksud dan manfaatnya
It Call Rich Data – Poor Information
27. Pengantar Data Mining
Definisi Data Mining
Data Mining merupakan istilah yang
digunakan untuk mendeskripsikan
penggalian (mining) suatu data yang
tertimbun dan menggunung dalam
jumlah besar, yang kemudian diolah
untuk menghasilkan suatu
pengetahuan (knowledge discovery)
dan Pengenalan Pola (Pattern
Recognition).
28. Pengantar Data Mining
Definisi Data Mining (cont’d)
Istilah lain :
Knowledge Discovery in Databases
(KDD), Knowledge Extraction,
Data/Pattern Analysis, Data Archeology,
Data Dredging, Information Harvesting
dan Business Intelligence.
29. Pengantar Data Mining
Operasional Data Mining
Menurut sifatnya operasi data mining terbagi
menjadi 2, yaitu Prediksi (Predictive Driven)
dan Penemuan (Discovery Driven)
30. Pengantar Data Mining
Operasional Data Mining
1. Prediksi (Predictive Driven)
Yaitu untuk menjawab pertanyaan “apa” dan sesuatu
yang sifatnya remang-remang/transparan.
Operasional Prediksi digunakan untuk validasi hipotesis,
querying dan pelaporan, analisis multidimensional,
OLAP (On Line Analytic Processing) serta analisis
Statistik.
31. Pengantar Data Mining
Operasional Data Mining
2. Penemuan (Discovery Driven)
Bersifat transparan dan untuk menjawab pertanyaan
“mengapa”.
Operasi Penemuan digunakan untuk analisis data
ekplorasi, pemodelan prediktif, analisis keterkaitan dan
deteksi deviasi
32. Pengantar Data Mining
Jenis dan Pola Data Yang Dapat di Mining (cont’d)
Pada dasarnya semua jenis data dapat
digunakan pada proses data mining,
selama data tersebut memiliki makna
dan nilai untuk hasil yang diharapkan.
33. Pengantar Data Mining
Jenis dan Pola Data Yang Dapat di Mining (cont’d)
Data yang dapat di mining bersumber dari
database yang dapat berupa data
transaksional dan Data Streaming.
Data tersebut tersimpan di dalam database
management system (dbms) atau data
warehouse dan belum diolah sebagaimana
mestinya.
34. Pengantar Data Mining
Jenis dan Pola Data Yang Dapat di Mining (cont’d)
Data Transaksional
merupakan data yang diperoleh dari suatu
transaksi seperti pembelian barang di super/mini
market, pembelian baju online, pembelian barang
elektronik, dsb.
Sebuah transaksi biasanya terdiri dari nomor
identitas transaksi (kode transaksi, nama kasir,
harga barang dan sejumlah item lain yang
membentuk suatu transaksi.
35. Pengantar Data Mining
Jenis dan Pola Data Yang Dapat di Mining (cont’d)
Data Transaksional (Contoh) :
Transaksi Pembelian Perlengkapan Bayi
Kode Transaksi : tr-3-1234 (transksi bulan 3 ke 1234)
Barang : Popok, Harga : 32.000, Qty : 2, TG : 64.000
Barang : Susu, Harga : 28.000, Qty : 3, TG : 56.000
TOTAL BELANJA Rp. 120.000
36. Pengantar Data Mining
Jenis dan Pola Data Yang Dapat di Mining (cont’d)
Jenis Data Lain
Data Streaming yang dapat berupa hasil pengamatan dan
sensorik.
Data Sekuen/order seperti data bursa saham dan time
series)
Data Jaringan seperti data yang diperoleh dari media
social.
Data Spasial seperti peta
Data hypertext dan multimedia seperti gambar, audio,
video dan teks