Dokumen tersebut membahas tentang data mining, yaitu proses menganalisis data besar untuk menemukan pola dan pengetahuan baru. Data mining memanfaatkan teknik pembelajaran mesin untuk secara otomatis mengekstrak pengetahuan dari basis data. Dokumen tersebut juga membahas berbagai ilmu yang berkaitan dengan data mining serta contoh penerapannya dalam berbagai bidang seperti bisnis, keuangan, olahraga, dan telekomunikasi.
2. ◗ Definisi Data Mining
◗ Kebutuhan Akan Data Mining
◗ Ilmu-ilmu yang Berkaitan dengan Data Mining
◗ Penerapan Data Mining
3. ◗ Melimpahnya Data
Terciptanya data dari tools otomatis dan teknologi
basis data sehingga jumlah yang tercatat dalam
basis data atau media penyimpanan lain semakin
membesar
4. ◗ Walaupun data teramat melimpah, namun
yang diolah menjadi knowledge sangat
sedikit
◗ Solusinya?? : Data warehouse dan data
mining
◦ Data warehouse dan OLAP (on-line analytical processing)
◦ Ekstraksi knowledge yang menarik dalam bentuk rule,
regularities, pola, konstrain dll dari data yang tersimpan
dalam sejumlah besar basis data
5.
6. ◉ Data mining adalah proses yang
memperkerjakan satu atau lebih teknik-
teknik pembelajaran komputer (machine
learning) untuk menganalisis dan
mengekstraksi pengetahuan (knowledge)
secara otomatis.
◉ Data mining merupakan proses iteratif dan
interaktif untuk menemukan pola atau model
yang baru, bermanfaat, dan dimengerti dalam
suatu database yang sangat besar (massive
databases).
7. ◉ Data mining merupakan serangkaian proses
untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang
selama ini tidak diketahui secara manual dari
suatu kumpulan data.
◉ Data mining menggunakan berbagai
perangkat lunak analisis data untuk
menemukan pola dan relasi data agar dapat
digunakan untuk membuat prediksi dengan
tepat.
8. ◉ Ketersediaan data yang melimpah, kebutuhan
akan informasi (pengetahuan) sebagai
pendukung pengambilan keputusan untuk
membuat solusi bisnis.
◉ Ketersediaan data transaksi dalam volume yang
besar.
◉ Informasi yang penting melahirkan gudang data
yang mengintegrasikan informasi dari sistem
yang tersebar untuk mendukung pengambilan
keputusan.
◉ Ketersediaan teknologi informasi yang terjangkau
dan dapat diadopsi secara luas.
13. ◉ Database, Data Warehouse, Database
Transaksional
◉ Data streams dan sensor data
◉ Time-series data, temporal data, sequence data
◉ Struktur data, graf, social networks dan database
link
◉ Object-relational database
◉ Spatial data
◉ Spatiotemporal data
◉ Multimedia database
◉ Text databases
◉ The World-Wide Web
14. Pattern Evaluation
Graphical User Interface
Knowle
data cleaning, integration, and selection
Database or Data Warehouse
Server
Data Mining Engine dge-
Base
Database Data
Warehouse
World-Wide
Web
Other Info
Repositories
15. Meningkatkan potensi untuk
mendukung keputusan bisnis
End User
Making
Decisions
Business
Analyst
Data
Analyst
DBA
Data Presentation
Visualization Techniques
Data Mining
Information Discovery
Data Exploration
Statistical Analysis, Querying and Reporting
Data Warehouses / Data Marts
OLAP, MDA
Data Sources
Paper, Files, Information Providers, Database Systems, OLTP
16. ◉ Metode Prediksi
Dengan menggunakan beberapa variabel untuk memprediksi
nilai yang belum diketahui (unknown ) atau nilai selanjutnya
(future) dari variabel lain
Contoh:
◦ Classification
◦ Regression
◦ Deviation Detection
◉ Metode Deskripsi
Menemukan pola pendeskripsian data yang dapat
diinterpretasikan oleh manusia
Contoh:
◦ Clustering
◦ Association Rule Discovery
◦ Sequential Pattern Discovery
17. Analisa Pasar dan Manajemen :
◉ Menebak target pasar
◉ Melihat pola beli pemakai dari waktu ke
waktu
◉ Cross Market Analysis
◉ Profil Customer
◉ Identifikasi Kebutuhan Customer
◉ Menilai loyalitas customer
◉ Informasi summary
18. Analisa Perusahaan dan Manajemen Resiko :
◉ Merencanakan Keuangan dan Evaluasi Aset
◉ Merencanakan Sumber Daya (Resource
Planning)
Telekomunikasi :
◉ Memonitor Persaingan (Competition) Melihat
jutaan transaksi yang masuk dengan tujuan
menambah layanan otomatis
19. Keuangan :
◉ Mendeteksi transaksi-transaksi keuangan
yang mencurigakan dimana akan susah
dilakukan jika menggunakan analisis standar.
◉ Digunakan Australian Health Insurance
Commision untuk mengidentifikasi layanan
kesehatan dan berhasil menghemat satu juta
dollar pertahun
20. Olah Raga :
◉ Digunakan IBM Advanced Scout untuk
menganalisis statistik permainan NBA dalam
rangka competitive advantage untuk tim New
Internet Web Surf Aid :
◉ Digunakan IBM Surf-Aid untuk mendata akses
halaman Web khususnya berkaitan dengan
pemasaran melalui web.
21. ◉ Bagaimana Menentukan metodologi mining? karena:
◦ Tipe data berbeda
◦ Performansi yang diharapkan dari segi keefektifan, efisiensi
dan skalabilitas bisa jadi berbeda tiap metodologi
◦ Evaluasi pola yanki pengukuran “interestingness’ yang
berbeda
◦
◦ dll
◉ Bagaimana Bentuk Interaksi dengan User? Apakah:
◦ Menggunakan Data mining query languages dan ad-hoc
mining
◦ Hasil data mining berupa ekspresi dan visualisasi