SlideShare a Scribd company logo
Data Mining 
Romi Satria Wahono 
romi@romisatriawahono.net 
http://romisatriawahono.net 
+6281586220090
Romi Satria Wahono 
 SD Sompok Semarang (1987) 
 SMPN 8 Semarang (1990) 
 SMA Taruna Nusantara, Magelang (1993) 
 S1, S2 dan S3 (on-leave) 
Department of Computer Sciences 
Saitama University, Japan (1994-2004) 
 Research Interests: Software Engineering and 
Intelligent Systems 
 Founder IlmuKomputer.Com 
 Peneliti LIPI (2004-2007) 
 Founder dan CEO PT Brainmatics Cipta Informatika
Learning Design 
Educational Objectives 
(Benjamin Bloom) 
Cognitive 
Affective 
Psychomotor 
Criterion Referenced 
Instruction 
(Robert Mager) 
Competencies 
Performance 
Evaluation 
Minimalism 
(John Carroll) 
Start Immediately 
Minimize the Reading 
Error Recognition 
Self-Contained
Learning Design 
Pretest dan Posttest untuk 
Mengukur Kompetensi Kognifif 
Mahasiwa 
Penyajian Materi dengan 
Model Minimalism berbasis 
Konsep Amati-Tiru-Modifikasi 
Penugasan berbasis Self- 
Contained Project atau 
Literatur Review 
Latihan Secara Iteratif untuk 
Meningkatkan Kompetensi Kognitif 
dan Psikomotorik Mahasiswa
Textbooks
Course Outline 
1. Pengenalan Data Mining 
2. Proses Data Mining 
3. Evaluasi dan Validasi pada Data Mining 
4. Metode dan Algoritma Data Mining 
5. Penelitian Data Mining
Pretest 
1. Jelaskan apa yang dimaksud dengan data 
mining? 
2. Sebutkan peran data mining dan algoritma apa 
saja yang mendukung peran data mining 
tersebut? 
3. Berikan contoh penerapan ataupun penelitian 
data mining
Pengenalan Data Mining
Pengenalan Data Mining 
1. Apa itu Data Mining? 
2. Peran Utama Data Mining 
3. Algoritma Data Mining
Apa itu Data Mining?
Mengapa Data Mining? 
 Manusia dalam suatu organisasi, sadar atau 
tidak sadar telah memproduksi berbagai data 
yang jumlahnya sangat besar 
• Contoh data: bisnis, kedokteran, ekonomi, geografi, 
olahraga, … 
 Pada dasarnya, data adalah entitas yang tidak 
memiliki arti, meskipun kemungkinan memiliki 
nilai di dalamnya
Apa itu Data Mining? 
 Disiplin ilmu yang mempelajari 
metode untuk mengekstrak 
pengetahuan atau menemukan 
pola dari suatu data 
1. Data: fakta yang terekam dan tidak 
membawa arti 
2. Pengetahuan: pola, aturan atau model 
yang muncul dari data 
 Sehingga Data mining sering 
disebut Knowledge Discovery in 
Database (KDD) 
 Konsep Transformasi 
DataInformasiPengetahuan www.newmediamusings.com
Data 
 Tidak membawa arti, merupakan 
kumpulan dari fakta-fakta tentang suatu 
kejadian 
 Suatu catatan terstruktur dari suatu 
transaksi 
 Merupakan materi penting dalam 
membentuk informasi
Pengetahuan 
 Gabungan dari suatu pengalaman, nilai, 
informasi kontekstual dan juga pandangan 
pakar yang memberikan suatu framework 
untuk mengevaluasi dan menciptakan 
pengalaman baru dan informasi 
(Thomas H. Davenport, Laurence Prusak) 
 Bisa berupa solusi pemecahan suatu masalah, 
petunjuk suatu pekerjaan dan ini bisa 
ditingkatkan nilainya, dipelajari dan juga bisa 
diajarkan kepada yang lain
Data - Informasi – Pengetahuan 
Data Kehadiran Pegawai 
NIP TGL DATANG PULANG 
1103 02/12/2004 07:20 15:40 
1142 02/12/2004 07:45 15:33 
1156 02/12/2004 07:51 16:00 
1173 02/12/2004 08:00 15:15 
1180 02/12/2004 07:01 16:31 
1183 02/12/2004 07:49 17:00
Data - Informasi – Pengetahuan 
Informasi Akumulasi Bulanan Kehadiran Pegawai 
NIP Masuk Alpa Cuti Sakit Telat 
1103 22 
1142 18 2 2 
1156 10 1 11 
1173 12 5 5 
1180 10 12
Data - Informasi – Pengetahuan 
Informasi Kondisi Kehadiran Mingguan Pegawai 
Senin Selasa Rabu Kamis Jumat 
Terlambat 7 0 1 0 5 
Pulang 
Cepat 
0 1 1 1 8 
Izin 3 0 0 1 4 
Alpa 1 0 2 0 2
Data - Informasi – Pengetahuan 
 Pengetahuan tentang 
kebiasaan pegawai dalam 
jam datang/pulang kerja 
 Pengetahuan tentang 
bagaimana teknik 
meningkatkan kehadiran 
pegawai  kebijakan
Data - Informasi - Pengetahuan - Kebijakan 
 Kebijakan penataan jam kerja karyawan 
khusus untuk hari senin dan jumat 
 Peraturan jam kerja: 
• Hari Senin dimulai jam 10:00 
• Hari Jumat diakhiri jam 14:00 
• Sisa jam kerja dikompensasi ke hari lain: 
1. Senin pulang setelah maghrib, toh jalanan jakarta macet 
total di sore hari (bayar hutang 2 jam) 
2. Rabu dan kamis bayar hutang setengah jam di pagi hari 
dan setengah jam di sore hari (bayar hutang 2 jam)
Definisi Data Mining 
 Melakukan ekstraksi untuk mendapatkan 
informasi penting yang sifatnya implisit dan 
sebelumnya tidak diketahui, dari suatu data 
(Witten et al., 2011) 
 Kegiatan yang meliputi pengumpulan, 
pemakaian data historis untuk menemukan 
keteraturan, pola dan hubungan dalam set data 
berukuran besar (Santosa, 2007)
Definisi Data Mining 
 The analysis of (often large) observational data 
sets to find unsuspected relationships and to 
summarize the data in novel ways that are both 
understandable and useful to the data owner 
(Han & Kamber, 2001) 
 The process of discovering meaningful new 
correlations, patterns and trends by sifting 
through large amounts of data stored in 
repositories, using pattern recognition 
technologies as well as statistical and 
mathematical techniques (Gartner Group)
Irisan Bidang Ilmu Data Mining 
1. Statistik: 
• Lebih bersifat teori 
• Fokus ke pengujian hipotesis 
2. Machine Learning: 
• Lebih bersifat heuristik 
• Fokus pada perbaikan performansi dari suatu teknik learning 
3. Data Mining: 
• Gabungan teori dan heuristik 
• Fokus pada seluruh proses penemuan knowledge dan pola 
• Termasuk data cleaning, learning dan visualisasi hasilnya
Cognitive-Performance Test 
1. Jelaskan dengan kalimat sendiri 
apa yang dimaksud dengan 
data mining? 
2. Apa perbedaan antara data dan 
pengetahuan (knowledge)?
Peran Utama Data Mining
Peran Utama Data Mining 
1. Estimation 
2. Prediction 
3. Classification 
4. Clustering 
5. Association 
Estimation 
Prediction 
Association 
Clustering Classification
Dataset with Attribute and Class 
Attribute Class/Label
Estimasi Waktu Pengiriman Pizza 
Customer Jumlah 
Pesanan (P) 
Jumlah 
Bangjo (B) 
Jarak (J) Waktu Tempuh (T) 
1 3 3 3 16 
2 1 7 4 20 
3 2 4 6 18 
4 4 6 8 36 
... 
1000 2 4 2 12 
Waktu Tempuh (T) = 0.48P + 0.23B + 0.5J
Penentuan Kelulusan Mahasiswa 
NIM Gender Nilai 
UN 
Asal 
Sekolah 
IPS1 IPS2 IPS3 IPS 4 ... Lulus 
Tepat 
Waktu 
10001 L 28 SMAN 2 3.3 3.6 2.89 2.9 Ya 
10002 P 27 SMA DK 4.0 3.2 3.8 3.7 Tidak 
10003 P 24 SMAN 1 2.7 3.4 4.0 3.5 Tidak 
10004 L 26.4 SMAN 3 3.2 2.7 3.6 3.4 Ya 
... 
... 
11000 L 23.4 SMAN 5 3.3 2.8 3.1 3.2 Ya
Klastering Bunga Iris
Klastering Bunga Iris
Algoritma Data Mining (DM) 
1. Estimation (Estimasi): 
• Linear Regression, Neural Network, Support Vector Machine, etc 
2. Prediction/Forecasting (Prediksi/Peramalan): 
• Linear Regression, Neural Network, Support Vector Machine, etc 
3. Classification (Klasifikasi): 
• Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant 
Analysis, etc 
4. Clustering (Klastering): 
• K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc 
5. Association (Asosiasi): 
• FP-Growth, A Priori, etc
Metode Learning Pada Algoritma DM 
Supervised 
Learning 
Unsupervised 
Association 
Learning 
Learning
Metode Learning Pada Algoritma DM 
1. Supervised Learning (Pembelajaran dengan Guru): 
• Sebagian besar algoritma data mining (estimation, 
prediction/forecasting, classification) adalah supervised 
learning 
• Variabel yang menjadi target/label/class ditentukan 
• Algoritma melakukan proses belajar berdasarkan nilai dari 
variabel target yang terasosiasi dengan nilai dari variable 
prediktor
Dataset with Attribute and Class 
Attribute Class/Label
Metode Learning Pada Algoritma DM 
2. Unsupervised Learning (Pembelajaran tanpa Guru): 
• Algoritma data mining mencari pola dari semua variable 
(atribut) 
• Variable (atribut) yang menjadi target/label/class tidak 
ditentukan (tidak ada) 
• Algoritma clustering adalah algoritma unsupervised learning
Dataset with Attribute (No Class) 
Attribute
Metode Learning Pada Algoritma DM 
3. Association Learning (Pembelajaran untuk Asosiasi Atribut) 
• Proses learning pada algoritma asosiasi (association rule) 
agak berbeda karena tujuannya adalah untuk mencari 
atribut yang muncul bersamaan dalam satu transaksi 
• Algoritma asosiasi biasanya untuk analisa transaksi belanja, 
dengan konsep utama adalah mencari “produk/item mana 
yang dibeli bersamaan” 
• Pada pusat perbelanjaan banyak produk yang dijual, 
sehingga pencarian seluruh asosiasi produk memakan cost 
tinggi, karena sifatnya yang kombinatorial 
• Algoritma association rule seperti a priori algorithm, dapat 
memecahkan masalah ini dengan efisien
Dataset Transaction
Association Rules
Proses Utama pada Data Mining 
Input 
(Data) 
Metode 
(Algoritma 
Data Mining) 
Output 
(Pola/Model)
Output/Pola/Model/Knowledge 
1. Formula/Function (Rumus atau Fungsi Regresi) 
• WAKTU TEMPUH = 0.48 + 0.6 JARAK + 0.34 LAMPU + 0.2 PESANAN 
2. Decision Tree (Pohon Keputusan) 
3. Rule (Aturan) 
• IF ips3=2.8 THEN lulustepatwaktu 
4. Cluster (Klaster)
Input – Metode – Output – Evaluation 
Input 
(Data) 
Metode 
(Algoritma 
Data Mining) 
Output 
(Pola/Model) 
Evaluation 
(Akurasi, AUC, 
RMSE, etc)
Cognitive-Performance Test 
1. Sebutkan 5 peran utama data mining! 
2. Jelaskan perbedaan estimasi dan prediksi! 
3. Jelaskan perbedaan estimasi dan klasifikasi! 
4. Jelaskan perbedaan klasifikasi dan klastering! 
5. Jelaskan perbedaan klastering dan prediksi! 
6. Jelaskan perbedaan supervised dan 
unsupervised learning! 
7. Sebutkan tahapan utama proses data mining!
Algoritma Data Mining
Algoritma Estimasi 
 Algoritma estimasi mirip dengan algoritma 
klasifikasi, tapi variabel target adalah berupa 
bilangan numerik (kontinyu) dan bukan 
kategorikal (nominal atau diskrit) 
 Estimasi nilai dari variable target ditentukan 
berdasarkan nilai dari variabel prediktor 
(atribut) 
 Algoritma estimasi yang biasa digunakan 
adalah: Linear Regression, Neural Network, 
Support Vector Machine
Contoh: Estimasi Performansi CPU 
 Example: 209 different computer configurations 
Cache Channels Performance 
(Kb) 
Main memory 
(Kb) 
Cycle time 
(ns) 
1 125 256 6000 256 198 
2 29 8000 32000 32 269 
208 480 512 8000 32 67 
209 480 1000 4000 0 45 
 Linear regression function 
CHMAX 
128 
32 
0 
0 
CHMIN 
16 
8 
0 
0 
PRP = -55.9 + 0.0489 MYCT + 0.0153 MMIN + 0.0056 MMAX 
+ 0.6410 CACH - 0.2700 CHMIN + 1.480 CHMAX 
… 
MYCT MMIN MMAX CACH PRP
Algoritma Prediksi 
 Algoritma prediksi/forecasting sama dengan 
algoritma estimasi di mana label/target/class 
bertipe numerik, bedanya adalah data yang 
digunakan merupakan data rentet waktu 
(data time series) 
 Istilah prediksi kadang digunakan juga untuk 
klasifikasi, tidak hanya untuk prediksi time series, 
karena sifatnya yang bisa menghasilkan class 
berdasarkan berbagai atribut yang kita sediakan 
 Semua algoritma estimasi dapat digunakan untuk 
prediksi/forecasting
Contoh: Prediksi Harga Saham 
Dataset harga saham 
dalam bentuk time 
series (rentet waktu) 
harian
Contoh: Prediksi Harga Saham (Plot)
Contoh: Prediksi Harga Saham (Plot)
Algoritma Klasifikasi 
 Klasifikasi adalah algoritma yang menggunakan data 
dengan target/class/label berupa nilai kategorikal 
(nominal) 
 Contoh, apabila target/class/label adalah pendapatan, 
maka bisa digunakan nilai nominal (kategorikal) sbb: 
pendapatan besar, menengah, kecil 
 Contoh lain adalah rekomendasi contact lens, apakah 
menggunakan yang jenis soft, hard atau none 
 Algoritma klasifikasi yang biasa digunakan adalah: 
Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, 
Linear Discriminant Analysis, etc
Contoh: Rekomendasi Main Golf 
 Input: 
 Output (Rules): 
If outlook = sunny and humidity = high then play = no 
If outlook = rainy and windy = true then play = no 
If outlook = overcast then play = yes 
If humidity = normal then play = yes 
If none of the above then play = yes
Contoh: Rekomendasi Main Golf 
 Input (Atribut Nominal dan Numerik): 
 Output (Rules): 
If outlook = sunny and humidity = high then play = no 
If outlook = sunny and humidity > 83 then play = no 
If outlook = rainy and windy = true then play = no 
If outlook = overcast then play = yes 
If humidity < 85 then play = yes 
If none of the above then play = yes
Contoh: Rekomendasi Main Golf 
 Output (Tree):
Contoh: Rekomendasi Contact Lens 
 Input:
Contoh: Rekomendasi Contact Lens 
 Output/Model (Tree):
Contoh: Penentuan Jenis Bunga Iris 
 Input:
Contoh: Penentuan Jenis Bunga Iris 
 Output (Rules):
Contoh: Penentuan Jenis Bunga Iris 
 Output (Tree):
Algoritma Klastering 
 Klastering adalah pengelompokkan data, hasil observasi 
dan kasus ke dalam class yang mirip 
 Suatu klaster (cluster) adalah koleksi data yang mirip 
antara satu dengan yang lain, dan memiliki perbedaan 
bila dibandingkan dengan data dari klaster lain 
 Perbedaan utama algoritma klastering dengan 
klasifikasi adalah klastering tidak memiliki 
target/class/label, jadi termasuk unsupervised learning 
 Klastering sering digunakan sebagai tahap awal dalam 
proses data mining, dengan hasil klaster yang terbentuk 
akan menjadi input dari algoritma berikutnya yang 
digunakan
Contoh: Klastering Jenis Gaya Hidup 
 Claritas, Inc. provide a demographic profile of each of the 
geographic areas in the country, as defined by zip code. One of 
the clustering mechanisms they use is the PRIZM segmentation 
system, which describes every U.S. zip code area in terms of 
distinct lifestyle types (66 segments). Just go to the company’s 
Web site, enter a particular zip code, and you are shown the 
most common PRIZM clusters for that zip code. 
 What do these clusters mean? For illustration, let’s look up the 
clusters for zip code 90210, Beverly Hills, California. The 
resulting clusters for zip code 90210 are: 
1. Cluster 01: Blue Blood Estates 
2. Cluster 10: Bohemian Mix 
3. Cluster 02: Winner’s Circle 
4. Cluster 07: Money and Brains 
5. Cluster 08: Young Literati
Contoh: Klastering Bunga Iris
Contoh: Klastering Bunga Iris (Plot)
Contoh: Klastering Bunga Iris (Table)
Algoritma Asosiasi 
 Algoritma association rule (aturan asosiasi) adalah 
algoritma yang menemukan atribut yang “muncul 
bersamaan” 
 Dalam dunia bisnis, sering disebut dengan affinity 
analysis atau market basket analysis 
 Algoritma asosiasi akan mencari aturan yang 
menghitung hubungan diantara dua atau lebih 
atribut 
 Algoritma association rules berangkat dari pola “If 
antecedent, then consequent,” bersamaan dengan 
pengukuran support (coverage) dan confidence 
(accuration) yang terasosiasi dalam aturan
Algoritma Asosiasi 
 Contoh, pada hari kamis malam, 1000 pelanggan 
telah melakukan belanja di supermaket ABC, dimana: 
• 200 orang membeli Sabun Mandi 
• dari 200 orang yang membeli sabun mandi, 50 orangnya 
membeli Fanta 
 Jadi, association rule menjadi, “Jika membeli sabun 
mandi, maka membeli Fanta”, dengan nilai support = 
200/1000 = 20% dan nilai confidence = 50/200 = 25% 
 Algoritma association rule diantaranya adalah: A 
priori algorithm, FP-Growth algorithm, GRI algorithm
Contoh Penerapan Data Mining 
 Penentuan kelayakan aplikasi peminjaman uang di bank 
 Penentuan pasokan listrik PLN untuk wilayah Jakarta 
 Diagnosis pola kesalahan mesin 
 Perkiraan harga saham dan tingkat inflasi 
 Analisis pola belanja pelanggan 
 Memisahkan minyak mentah dan gas alam 
 Pemilihan program TV otomatis 
 Penentuan pola pelanggan yang loyal pada perusahaan 
operator telepon 
 Deteksi pencucian uang dari transaksi perbankan 
 Deteksi serangan (intrusion) pada suatu jaringan
Cognitive-Performance Test 
1. Sebutkan 5 peran utama data mining! 
2. algoritma apa saja yang dapat digunakan untuk 5 
peran utama data mining di atas? 
3. Jelaskan perbedaan estimasi dan prediksi! 
4. Jelaskan perbedaan estimasi dan klasifikasi! 
5. Jelaskan perbedaan klasifikasi dan klastering! 
6. Jelaskan perbedaan klastering dan prediksi! 
7. Jelaskan perbedaan supervised dan unsupervised 
learning! 
8. Sebutkan tahapan utama proses data mining!
Referensi 
1. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical 
Machine Learning Tools and Techniques 3rd Edition, Elsevier, 
2011 
2. Daniel T. Larose, Discovering Knowledge in Data: an 
Introduction to Data Mining, John Wiley & Sons, 2005 
3. Florin Gorunescu, Data Mining: Concepts, Models and 
Techniques, Springer, 2011 
4. Jiawei Han and Micheline Kamber, Data Mining: Concepts and 
Techniques Second Edition, Elsevier, 2006 
5. Oded Maimon and Lior Rokach, Data Mining and Knowledge 
Discovery Handbook Second Edition, Springer, 2010 
6. Warren Liao and Evangelos Triantaphyllou (eds.), Recent 
Advances in Data Mining of Enterprise Data: Algorithms and 
Applications, World Scientific, 2007

More Related Content

What's hot

Pembuktian Sifat – Sifat Operasi Matriks
Pembuktian Sifat – Sifat Operasi MatriksPembuktian Sifat – Sifat Operasi Matriks
Pembuktian Sifat – Sifat Operasi MatriksIpit Sabrina
 
penyajian data
penyajian datapenyajian data
penyajian data
Ratih Ramadhani
 
Daftar Distribusi Frekuensi
Daftar Distribusi FrekuensiDaftar Distribusi Frekuensi
Daftar Distribusi Frekuensimaudya09
 
Jenis jenis data dan teknik pengumpulan data
Jenis jenis data dan teknik pengumpulan dataJenis jenis data dan teknik pengumpulan data
Jenis jenis data dan teknik pengumpulan dataFirman Marine
 
Tabel t, z dan f dan chi kuadrat
Tabel t, z dan f dan chi kuadratTabel t, z dan f dan chi kuadrat
Tabel t, z dan f dan chi kuadratIr. Zakaria, M.M
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
Universitas Bina Darma Palembang
 
Metode statistika
Metode statistikaMetode statistika
Metode statistikamus_lim
 
11.statistik parametrik dan non parametrik
11.statistik parametrik dan non parametrik11.statistik parametrik dan non parametrik
11.statistik parametrik dan non parametrik
Hafiza .h
 
Transformasi Linear ( Aljabar Linear Elementer )
Transformasi Linear ( Aljabar Linear Elementer )Transformasi Linear ( Aljabar Linear Elementer )
Transformasi Linear ( Aljabar Linear Elementer )
Kelinci Coklat
 
Perancangan Data Warehouse (Logical dan Physical)
Perancangan Data Warehouse (Logical dan Physical)Perancangan Data Warehouse (Logical dan Physical)
Perancangan Data Warehouse (Logical dan Physical)
dedidarwis
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)
Adam Mukharil Bachtiar
 
9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma
ArdianDwiPraba
 
Contoh soal dan penyelesaian metode biseksi
Contoh soal dan penyelesaian metode biseksiContoh soal dan penyelesaian metode biseksi
Contoh soal dan penyelesaian metode biseksi
muhamadaulia3
 
Barisan dan Deret ( Kalkulus 2 )
Barisan dan Deret ( Kalkulus 2 )Barisan dan Deret ( Kalkulus 2 )
Barisan dan Deret ( Kalkulus 2 )
Kelinci Coklat
 
Teknik sampling
Teknik samplingTeknik sampling
Teknik sampling
Muhammad Luthfan
 
Metode Penelitian Kuantitatif
Metode Penelitian KuantitatifMetode Penelitian Kuantitatif
Metode Penelitian Kuantitatif
Siti Sahati
 
Ukuran pemusatan dan penyebaran
Ukuran pemusatan dan penyebaranUkuran pemusatan dan penyebaran
Ukuran pemusatan dan penyebaran
Sriwijaya University
 
Distribusi Seragam, Bernoulli, dan Binomial
Distribusi Seragam, Bernoulli, dan BinomialDistribusi Seragam, Bernoulli, dan Binomial
Distribusi Seragam, Bernoulli, dan Binomial
Silvia_Al
 

What's hot (20)

Pembuktian Sifat – Sifat Operasi Matriks
Pembuktian Sifat – Sifat Operasi MatriksPembuktian Sifat – Sifat Operasi Matriks
Pembuktian Sifat – Sifat Operasi Matriks
 
proses poisson
proses poissonproses poisson
proses poisson
 
penyajian data
penyajian datapenyajian data
penyajian data
 
Daftar Distribusi Frekuensi
Daftar Distribusi FrekuensiDaftar Distribusi Frekuensi
Daftar Distribusi Frekuensi
 
Jenis jenis data dan teknik pengumpulan data
Jenis jenis data dan teknik pengumpulan dataJenis jenis data dan teknik pengumpulan data
Jenis jenis data dan teknik pengumpulan data
 
Tabel t, z dan f dan chi kuadrat
Tabel t, z dan f dan chi kuadratTabel t, z dan f dan chi kuadrat
Tabel t, z dan f dan chi kuadrat
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
Metode statistika
Metode statistikaMetode statistika
Metode statistika
 
Ukuran pemusatan data
Ukuran pemusatan dataUkuran pemusatan data
Ukuran pemusatan data
 
11.statistik parametrik dan non parametrik
11.statistik parametrik dan non parametrik11.statistik parametrik dan non parametrik
11.statistik parametrik dan non parametrik
 
Transformasi Linear ( Aljabar Linear Elementer )
Transformasi Linear ( Aljabar Linear Elementer )Transformasi Linear ( Aljabar Linear Elementer )
Transformasi Linear ( Aljabar Linear Elementer )
 
Perancangan Data Warehouse (Logical dan Physical)
Perancangan Data Warehouse (Logical dan Physical)Perancangan Data Warehouse (Logical dan Physical)
Perancangan Data Warehouse (Logical dan Physical)
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)
 
9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma
 
Contoh soal dan penyelesaian metode biseksi
Contoh soal dan penyelesaian metode biseksiContoh soal dan penyelesaian metode biseksi
Contoh soal dan penyelesaian metode biseksi
 
Barisan dan Deret ( Kalkulus 2 )
Barisan dan Deret ( Kalkulus 2 )Barisan dan Deret ( Kalkulus 2 )
Barisan dan Deret ( Kalkulus 2 )
 
Teknik sampling
Teknik samplingTeknik sampling
Teknik sampling
 
Metode Penelitian Kuantitatif
Metode Penelitian KuantitatifMetode Penelitian Kuantitatif
Metode Penelitian Kuantitatif
 
Ukuran pemusatan dan penyebaran
Ukuran pemusatan dan penyebaranUkuran pemusatan dan penyebaran
Ukuran pemusatan dan penyebaran
 
Distribusi Seragam, Bernoulli, dan Binomial
Distribusi Seragam, Bernoulli, dan BinomialDistribusi Seragam, Bernoulli, dan Binomial
Distribusi Seragam, Bernoulli, dan Binomial
 

Viewers also liked

Machine learning dan data mining
Machine learning dan data miningMachine learning dan data mining
Machine learning dan data mining
Alvian yudha Prawira
 
Sistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokokSistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokok
Abdul Fauzan
 
Tugas 5 Data Mining
Tugas 5 Data Mining Tugas 5 Data Mining
Tugas 5 Data Mining Ivul Varel Fu
 
Belajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining aprioriBelajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining apriori
ilmuBiner
 
9349 12 supervised dan-unsupervised-learning
9349 12 supervised dan-unsupervised-learning9349 12 supervised dan-unsupervised-learning
9349 12 supervised dan-unsupervised-learning
Universitas Bina Darma Palembang
 
Minggu10 algoritma genetika
Minggu10   algoritma genetikaMinggu10   algoritma genetika
Minggu10 algoritma genetika
mkbx01
 
Analisa dengan uji t dua variabel bebas
Analisa dengan uji t dua variabel bebasAnalisa dengan uji t dua variabel bebas
Analisa dengan uji t dua variabel bebasFeri Chandra
 
pert 8
pert 8pert 8
pert 8t34ra
 
67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani
irhdy
 
Support Vector Machine
Support Vector MachineSupport Vector Machine
Support Vector Machine
Randy Wihandika
 
Bab 1 pendahuluan weka
Bab 1 pendahuluan wekaBab 1 pendahuluan weka
Bab 1 pendahuluan weka
Medika Risna
 
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...Aris Prasetyo
 
Proses fp growth modul
Proses fp growth modulProses fp growth modul
Proses fp growth modul
Isty Hara
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
ilmuBiner
 
Perancangan aplikasi data mining berbasis web dengan algoritma
Perancangan aplikasi data mining berbasis web dengan algoritmaPerancangan aplikasi data mining berbasis web dengan algoritma
Perancangan aplikasi data mining berbasis web dengan algoritma
Andreas Chandra
 
materi umum sospol punya curi ilmu nama
materi umum sospol punya curi ilmu namamateri umum sospol punya curi ilmu nama
materi umum sospol punya curi ilmu nama
albert giban
 
OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...
OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...
OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...
Uofa_Unsada
 

Viewers also liked (20)

Machine learning dan data mining
Machine learning dan data miningMachine learning dan data mining
Machine learning dan data mining
 
Contoh data mining
Contoh data miningContoh data mining
Contoh data mining
 
Sistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokokSistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokok
 
Tugas 5 Data Mining
Tugas 5 Data Mining Tugas 5 Data Mining
Tugas 5 Data Mining
 
Belajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining aprioriBelajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining apriori
 
3475 16 decision tree
3475 16 decision tree3475 16 decision tree
3475 16 decision tree
 
9349 12 supervised dan-unsupervised-learning
9349 12 supervised dan-unsupervised-learning9349 12 supervised dan-unsupervised-learning
9349 12 supervised dan-unsupervised-learning
 
Minggu10 algoritma genetika
Minggu10   algoritma genetikaMinggu10   algoritma genetika
Minggu10 algoritma genetika
 
Analisa dengan uji t dua variabel bebas
Analisa dengan uji t dua variabel bebasAnalisa dengan uji t dua variabel bebas
Analisa dengan uji t dua variabel bebas
 
pert 8
pert 8pert 8
pert 8
 
67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani
 
Support Vector Machine
Support Vector MachineSupport Vector Machine
Support Vector Machine
 
Bab 1 pendahuluan weka
Bab 1 pendahuluan wekaBab 1 pendahuluan weka
Bab 1 pendahuluan weka
 
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
 
Proses fp growth modul
Proses fp growth modulProses fp growth modul
Proses fp growth modul
 
Belajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
 
Perancangan aplikasi data mining berbasis web dengan algoritma
Perancangan aplikasi data mining berbasis web dengan algoritmaPerancangan aplikasi data mining berbasis web dengan algoritma
Perancangan aplikasi data mining berbasis web dengan algoritma
 
materi umum sospol punya curi ilmu nama
materi umum sospol punya curi ilmu namamateri umum sospol punya curi ilmu nama
materi umum sospol punya curi ilmu nama
 
OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...
OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...
OPTIMASI PENJADWALAN MATA KULIAH DENGAN MENGGUNAKAN ALGORITMA GENETIKA (STUDI...
 
Cara pemakaian weka
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
 

Similar to Data mining

Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012
aiiniR
 
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptxfile_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
FeriskaListrianti
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik Lingkungan
Bimastyaji Surya
 
01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf
herii2k01
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
RinnaRachmatika2
 
Bab1.pptx
Bab1.pptxBab1.pptx
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
NanzalXIV
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
muhammadarsyad77
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Arif Rahman
 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ssuser82ed8e
 
PENGENALAN DATA SCIENCE.pptx
PENGENALAN DATA SCIENCE.pptxPENGENALAN DATA SCIENCE.pptx
PENGENALAN DATA SCIENCE.pptx
YezintaDewimaharani
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma
ArdianDwiPraba
 
PENGANTAR DATA SCIENCE.pdf
PENGANTAR DATA SCIENCE.pdfPENGANTAR DATA SCIENCE.pdf
PENGANTAR DATA SCIENCE.pdf
melrideswina
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
Andri946883
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
dedidarwis
 
Big data.pptx
Big data.pptxBig data.pptx
Big data.pptx
AgusMailana1
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
ArianDerida
 

Similar to Data mining (20)

Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012
 
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptxfile_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik Lingkungan
 
01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
 
Bab1.pptx
Bab1.pptxBab1.pptx
Bab1.pptx
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
10
1010
10
 
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
Preparasi Data: Penetapan Tujuan dan Pengumpulan Data - Modul Ajar Kuliah Ana...
 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
 
PENGENALAN DATA SCIENCE.pptx
PENGENALAN DATA SCIENCE.pptxPENGENALAN DATA SCIENCE.pptx
PENGENALAN DATA SCIENCE.pptx
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma
 
PENGANTAR DATA SCIENCE.pdf
PENGANTAR DATA SCIENCE.pdfPENGANTAR DATA SCIENCE.pdf
PENGANTAR DATA SCIENCE.pdf
 
P1 data mining
P1  data mining P1  data mining
P1 data mining
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
 
Big data.pptx
Big data.pptxBig data.pptx
Big data.pptx
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 

More from Agung Apriyadi

handbook sistem informasi manajemen proses bisnis
handbook sistem informasi manajemen proses bisnishandbook sistem informasi manajemen proses bisnis
handbook sistem informasi manajemen proses bisnis
Agung Apriyadi
 
Proposal pengajuan sistem informasi pt.kargo transkontinental
Proposal pengajuan sistem informasi pt.kargo transkontinentalProposal pengajuan sistem informasi pt.kargo transkontinental
Proposal pengajuan sistem informasi pt.kargo transkontinental
Agung Apriyadi
 
Analisis Customer Relationship Management CRM
Analisis Customer Relationship Management CRMAnalisis Customer Relationship Management CRM
Analisis Customer Relationship Management CRMAgung Apriyadi
 
Presentasi kerja praktek
Presentasi kerja praktek Presentasi kerja praktek
Presentasi kerja praktek
Agung Apriyadi
 
Sistem informasi-pelayan-jasa-servis-motor
Sistem informasi-pelayan-jasa-servis-motorSistem informasi-pelayan-jasa-servis-motor
Sistem informasi-pelayan-jasa-servis-motorAgung Apriyadi
 
Jurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motor
Jurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motorJurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motor
Jurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motor
Agung Apriyadi
 

More from Agung Apriyadi (6)

handbook sistem informasi manajemen proses bisnis
handbook sistem informasi manajemen proses bisnishandbook sistem informasi manajemen proses bisnis
handbook sistem informasi manajemen proses bisnis
 
Proposal pengajuan sistem informasi pt.kargo transkontinental
Proposal pengajuan sistem informasi pt.kargo transkontinentalProposal pengajuan sistem informasi pt.kargo transkontinental
Proposal pengajuan sistem informasi pt.kargo transkontinental
 
Analisis Customer Relationship Management CRM
Analisis Customer Relationship Management CRMAnalisis Customer Relationship Management CRM
Analisis Customer Relationship Management CRM
 
Presentasi kerja praktek
Presentasi kerja praktek Presentasi kerja praktek
Presentasi kerja praktek
 
Sistem informasi-pelayan-jasa-servis-motor
Sistem informasi-pelayan-jasa-servis-motorSistem informasi-pelayan-jasa-servis-motor
Sistem informasi-pelayan-jasa-servis-motor
 
Jurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motor
Jurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motorJurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motor
Jurnal pa aplikasi penjualan suku cadang dan jasa perbaikan sepeda motor
 

Recently uploaded

Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdfPaparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
SEMUELSAMBOKARAENG
 
tugas modul 1.4 Koneksi Antar Materi (1).pptx
tugas  modul 1.4 Koneksi Antar Materi (1).pptxtugas  modul 1.4 Koneksi Antar Materi (1).pptx
tugas modul 1.4 Koneksi Antar Materi (1).pptx
d2spdpnd9185
 
Koneksi Antar Materi Modul 1.4.ppt x
Koneksi Antar Materi Modul 1.4.ppt           xKoneksi Antar Materi Modul 1.4.ppt           x
Koneksi Antar Materi Modul 1.4.ppt x
johan199969
 
Laporan wakil kepala sekolah bagian Kurikulum.pdf
Laporan wakil kepala sekolah bagian Kurikulum.pdfLaporan wakil kepala sekolah bagian Kurikulum.pdf
Laporan wakil kepala sekolah bagian Kurikulum.pdf
yuniarmadyawati361
 
RANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptx
RANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptxRANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptx
RANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptx
SurosoSuroso19
 
RUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docx
RUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docxRUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docx
RUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docx
kinayaptr30
 
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docxSOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
MuhammadBagusAprilia1
 
PPT Aksi Nyata Diseminasi Modul 1.4.pptx
PPT Aksi Nyata Diseminasi Modul 1.4.pptxPPT Aksi Nyata Diseminasi Modul 1.4.pptx
PPT Aksi Nyata Diseminasi Modul 1.4.pptx
Kurnia Fajar
 
Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...
Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...
Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...
haryonospdsd011
 
813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx
813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx
813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx
RinawatiRinawati10
 
Program Kerja Kepala Sekolah 2023-2024.pdf
Program Kerja Kepala Sekolah 2023-2024.pdfProgram Kerja Kepala Sekolah 2023-2024.pdf
Program Kerja Kepala Sekolah 2023-2024.pdf
erlita3
 
Laporan pembina seni tari - www.kherysuryawan.id.pdf
Laporan pembina seni tari - www.kherysuryawan.id.pdfLaporan pembina seni tari - www.kherysuryawan.id.pdf
Laporan pembina seni tari - www.kherysuryawan.id.pdf
heridawesty4
 
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum MerdekaModul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Fathan Emran
 
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docxINSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
lindaagina84
 
PRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptx
PRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptxPRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptx
PRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptx
muhammadyudiyanto55
 
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdfMATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
ssuser289c2f1
 
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptxBab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
nawasenamerta
 
Form B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docx
Form B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docxForm B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docx
Form B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docx
EkoPutuKromo
 
ppt landasan pendidikan Alat alat pendidikan PAI 9_
ppt landasan pendidikan Alat alat pendidikan PAI 9_ppt landasan pendidikan Alat alat pendidikan PAI 9_
ppt landasan pendidikan Alat alat pendidikan PAI 9_
setiatinambunan
 
Permainan Wiwi Wowo aksi nyata berkebhinekaan
Permainan Wiwi Wowo aksi nyata berkebhinekaanPermainan Wiwi Wowo aksi nyata berkebhinekaan
Permainan Wiwi Wowo aksi nyata berkebhinekaan
DEVI390643
 

Recently uploaded (20)

Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdfPaparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
 
tugas modul 1.4 Koneksi Antar Materi (1).pptx
tugas  modul 1.4 Koneksi Antar Materi (1).pptxtugas  modul 1.4 Koneksi Antar Materi (1).pptx
tugas modul 1.4 Koneksi Antar Materi (1).pptx
 
Koneksi Antar Materi Modul 1.4.ppt x
Koneksi Antar Materi Modul 1.4.ppt           xKoneksi Antar Materi Modul 1.4.ppt           x
Koneksi Antar Materi Modul 1.4.ppt x
 
Laporan wakil kepala sekolah bagian Kurikulum.pdf
Laporan wakil kepala sekolah bagian Kurikulum.pdfLaporan wakil kepala sekolah bagian Kurikulum.pdf
Laporan wakil kepala sekolah bagian Kurikulum.pdf
 
RANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptx
RANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptxRANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptx
RANCANGAN TINDAKAN AKSI NYATA MODUL 1.4.pptx
 
RUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docx
RUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docxRUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docx
RUBRIK OBSERVASI KINERJA KEPALA SEKOLAH.docx
 
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docxSOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
 
PPT Aksi Nyata Diseminasi Modul 1.4.pptx
PPT Aksi Nyata Diseminasi Modul 1.4.pptxPPT Aksi Nyata Diseminasi Modul 1.4.pptx
PPT Aksi Nyata Diseminasi Modul 1.4.pptx
 
Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...
Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...
Dokumen Rangkuman Kehadiran Guru ini dipergunakan sebagai bukti dukung yang w...
 
813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx
813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx
813 Modul Ajar KurMer Usaha, Energi, dan Pesawat Sederhana (2).docx
 
Program Kerja Kepala Sekolah 2023-2024.pdf
Program Kerja Kepala Sekolah 2023-2024.pdfProgram Kerja Kepala Sekolah 2023-2024.pdf
Program Kerja Kepala Sekolah 2023-2024.pdf
 
Laporan pembina seni tari - www.kherysuryawan.id.pdf
Laporan pembina seni tari - www.kherysuryawan.id.pdfLaporan pembina seni tari - www.kherysuryawan.id.pdf
Laporan pembina seni tari - www.kherysuryawan.id.pdf
 
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum MerdekaModul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
 
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docxINSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
 
PRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptx
PRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptxPRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptx
PRESENTASI OBSERVASI PENGELOLAAN KINERJA KEPALA SEKOLAH.pptx
 
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdfMATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
 
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptxBab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
 
Form B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docx
Form B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docxForm B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docx
Form B8 Rubrik Refleksi Program Pengembangan Kompetensi Guru -1.docx
 
ppt landasan pendidikan Alat alat pendidikan PAI 9_
ppt landasan pendidikan Alat alat pendidikan PAI 9_ppt landasan pendidikan Alat alat pendidikan PAI 9_
ppt landasan pendidikan Alat alat pendidikan PAI 9_
 
Permainan Wiwi Wowo aksi nyata berkebhinekaan
Permainan Wiwi Wowo aksi nyata berkebhinekaanPermainan Wiwi Wowo aksi nyata berkebhinekaan
Permainan Wiwi Wowo aksi nyata berkebhinekaan
 

Data mining

  • 1. Data Mining Romi Satria Wahono romi@romisatriawahono.net http://romisatriawahono.net +6281586220090
  • 2. Romi Satria Wahono  SD Sompok Semarang (1987)  SMPN 8 Semarang (1990)  SMA Taruna Nusantara, Magelang (1993)  S1, S2 dan S3 (on-leave) Department of Computer Sciences Saitama University, Japan (1994-2004)  Research Interests: Software Engineering and Intelligent Systems  Founder IlmuKomputer.Com  Peneliti LIPI (2004-2007)  Founder dan CEO PT Brainmatics Cipta Informatika
  • 3. Learning Design Educational Objectives (Benjamin Bloom) Cognitive Affective Psychomotor Criterion Referenced Instruction (Robert Mager) Competencies Performance Evaluation Minimalism (John Carroll) Start Immediately Minimize the Reading Error Recognition Self-Contained
  • 4. Learning Design Pretest dan Posttest untuk Mengukur Kompetensi Kognifif Mahasiwa Penyajian Materi dengan Model Minimalism berbasis Konsep Amati-Tiru-Modifikasi Penugasan berbasis Self- Contained Project atau Literatur Review Latihan Secara Iteratif untuk Meningkatkan Kompetensi Kognitif dan Psikomotorik Mahasiswa
  • 6. Course Outline 1. Pengenalan Data Mining 2. Proses Data Mining 3. Evaluasi dan Validasi pada Data Mining 4. Metode dan Algoritma Data Mining 5. Penelitian Data Mining
  • 7. Pretest 1. Jelaskan apa yang dimaksud dengan data mining? 2. Sebutkan peran data mining dan algoritma apa saja yang mendukung peran data mining tersebut? 3. Berikan contoh penerapan ataupun penelitian data mining
  • 9. Pengenalan Data Mining 1. Apa itu Data Mining? 2. Peran Utama Data Mining 3. Algoritma Data Mining
  • 10. Apa itu Data Mining?
  • 11. Mengapa Data Mining?  Manusia dalam suatu organisasi, sadar atau tidak sadar telah memproduksi berbagai data yang jumlahnya sangat besar • Contoh data: bisnis, kedokteran, ekonomi, geografi, olahraga, …  Pada dasarnya, data adalah entitas yang tidak memiliki arti, meskipun kemungkinan memiliki nilai di dalamnya
  • 12. Apa itu Data Mining?  Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, aturan atau model yang muncul dari data  Sehingga Data mining sering disebut Knowledge Discovery in Database (KDD)  Konsep Transformasi DataInformasiPengetahuan www.newmediamusings.com
  • 13. Data  Tidak membawa arti, merupakan kumpulan dari fakta-fakta tentang suatu kejadian  Suatu catatan terstruktur dari suatu transaksi  Merupakan materi penting dalam membentuk informasi
  • 14. Pengetahuan  Gabungan dari suatu pengalaman, nilai, informasi kontekstual dan juga pandangan pakar yang memberikan suatu framework untuk mengevaluasi dan menciptakan pengalaman baru dan informasi (Thomas H. Davenport, Laurence Prusak)  Bisa berupa solusi pemecahan suatu masalah, petunjuk suatu pekerjaan dan ini bisa ditingkatkan nilainya, dipelajari dan juga bisa diajarkan kepada yang lain
  • 15. Data - Informasi – Pengetahuan Data Kehadiran Pegawai NIP TGL DATANG PULANG 1103 02/12/2004 07:20 15:40 1142 02/12/2004 07:45 15:33 1156 02/12/2004 07:51 16:00 1173 02/12/2004 08:00 15:15 1180 02/12/2004 07:01 16:31 1183 02/12/2004 07:49 17:00
  • 16. Data - Informasi – Pengetahuan Informasi Akumulasi Bulanan Kehadiran Pegawai NIP Masuk Alpa Cuti Sakit Telat 1103 22 1142 18 2 2 1156 10 1 11 1173 12 5 5 1180 10 12
  • 17. Data - Informasi – Pengetahuan Informasi Kondisi Kehadiran Mingguan Pegawai Senin Selasa Rabu Kamis Jumat Terlambat 7 0 1 0 5 Pulang Cepat 0 1 1 1 8 Izin 3 0 0 1 4 Alpa 1 0 2 0 2
  • 18. Data - Informasi – Pengetahuan  Pengetahuan tentang kebiasaan pegawai dalam jam datang/pulang kerja  Pengetahuan tentang bagaimana teknik meningkatkan kehadiran pegawai  kebijakan
  • 19. Data - Informasi - Pengetahuan - Kebijakan  Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat  Peraturan jam kerja: • Hari Senin dimulai jam 10:00 • Hari Jumat diakhiri jam 14:00 • Sisa jam kerja dikompensasi ke hari lain: 1. Senin pulang setelah maghrib, toh jalanan jakarta macet total di sore hari (bayar hutang 2 jam) 2. Rabu dan kamis bayar hutang setengah jam di pagi hari dan setengah jam di sore hari (bayar hutang 2 jam)
  • 20. Definisi Data Mining  Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data (Witten et al., 2011)  Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar (Santosa, 2007)
  • 21. Definisi Data Mining  The analysis of (often large) observational data sets to find unsuspected relationships and to summarize the data in novel ways that are both understandable and useful to the data owner (Han & Kamber, 2001)  The process of discovering meaningful new correlations, patterns and trends by sifting through large amounts of data stored in repositories, using pattern recognition technologies as well as statistical and mathematical techniques (Gartner Group)
  • 22. Irisan Bidang Ilmu Data Mining 1. Statistik: • Lebih bersifat teori • Fokus ke pengujian hipotesis 2. Machine Learning: • Lebih bersifat heuristik • Fokus pada perbaikan performansi dari suatu teknik learning 3. Data Mining: • Gabungan teori dan heuristik • Fokus pada seluruh proses penemuan knowledge dan pola • Termasuk data cleaning, learning dan visualisasi hasilnya
  • 23. Cognitive-Performance Test 1. Jelaskan dengan kalimat sendiri apa yang dimaksud dengan data mining? 2. Apa perbedaan antara data dan pengetahuan (knowledge)?
  • 25. Peran Utama Data Mining 1. Estimation 2. Prediction 3. Classification 4. Clustering 5. Association Estimation Prediction Association Clustering Classification
  • 26. Dataset with Attribute and Class Attribute Class/Label
  • 27. Estimasi Waktu Pengiriman Pizza Customer Jumlah Pesanan (P) Jumlah Bangjo (B) Jarak (J) Waktu Tempuh (T) 1 3 3 3 16 2 1 7 4 20 3 2 4 6 18 4 4 6 8 36 ... 1000 2 4 2 12 Waktu Tempuh (T) = 0.48P + 0.23B + 0.5J
  • 28. Penentuan Kelulusan Mahasiswa NIM Gender Nilai UN Asal Sekolah IPS1 IPS2 IPS3 IPS 4 ... Lulus Tepat Waktu 10001 L 28 SMAN 2 3.3 3.6 2.89 2.9 Ya 10002 P 27 SMA DK 4.0 3.2 3.8 3.7 Tidak 10003 P 24 SMAN 1 2.7 3.4 4.0 3.5 Tidak 10004 L 26.4 SMAN 3 3.2 2.7 3.6 3.4 Ya ... ... 11000 L 23.4 SMAN 5 3.3 2.8 3.1 3.2 Ya
  • 31. Algoritma Data Mining (DM) 1. Estimation (Estimasi): • Linear Regression, Neural Network, Support Vector Machine, etc 2. Prediction/Forecasting (Prediksi/Peramalan): • Linear Regression, Neural Network, Support Vector Machine, etc 3. Classification (Klasifikasi): • Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, etc 4. Clustering (Klastering): • K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc 5. Association (Asosiasi): • FP-Growth, A Priori, etc
  • 32. Metode Learning Pada Algoritma DM Supervised Learning Unsupervised Association Learning Learning
  • 33. Metode Learning Pada Algoritma DM 1. Supervised Learning (Pembelajaran dengan Guru): • Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning • Variabel yang menjadi target/label/class ditentukan • Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang terasosiasi dengan nilai dari variable prediktor
  • 34. Dataset with Attribute and Class Attribute Class/Label
  • 35. Metode Learning Pada Algoritma DM 2. Unsupervised Learning (Pembelajaran tanpa Guru): • Algoritma data mining mencari pola dari semua variable (atribut) • Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada) • Algoritma clustering adalah algoritma unsupervised learning
  • 36. Dataset with Attribute (No Class) Attribute
  • 37. Metode Learning Pada Algoritma DM 3. Association Learning (Pembelajaran untuk Asosiasi Atribut) • Proses learning pada algoritma asosiasi (association rule) agak berbeda karena tujuannya adalah untuk mencari atribut yang muncul bersamaan dalam satu transaksi • Algoritma asosiasi biasanya untuk analisa transaksi belanja, dengan konsep utama adalah mencari “produk/item mana yang dibeli bersamaan” • Pada pusat perbelanjaan banyak produk yang dijual, sehingga pencarian seluruh asosiasi produk memakan cost tinggi, karena sifatnya yang kombinatorial • Algoritma association rule seperti a priori algorithm, dapat memecahkan masalah ini dengan efisien
  • 40. Proses Utama pada Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model)
  • 41. Output/Pola/Model/Knowledge 1. Formula/Function (Rumus atau Fungsi Regresi) • WAKTU TEMPUH = 0.48 + 0.6 JARAK + 0.34 LAMPU + 0.2 PESANAN 2. Decision Tree (Pohon Keputusan) 3. Rule (Aturan) • IF ips3=2.8 THEN lulustepatwaktu 4. Cluster (Klaster)
  • 42. Input – Metode – Output – Evaluation Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model) Evaluation (Akurasi, AUC, RMSE, etc)
  • 43. Cognitive-Performance Test 1. Sebutkan 5 peran utama data mining! 2. Jelaskan perbedaan estimasi dan prediksi! 3. Jelaskan perbedaan estimasi dan klasifikasi! 4. Jelaskan perbedaan klasifikasi dan klastering! 5. Jelaskan perbedaan klastering dan prediksi! 6. Jelaskan perbedaan supervised dan unsupervised learning! 7. Sebutkan tahapan utama proses data mining!
  • 45. Algoritma Estimasi  Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit)  Estimasi nilai dari variable target ditentukan berdasarkan nilai dari variabel prediktor (atribut)  Algoritma estimasi yang biasa digunakan adalah: Linear Regression, Neural Network, Support Vector Machine
  • 46. Contoh: Estimasi Performansi CPU  Example: 209 different computer configurations Cache Channels Performance (Kb) Main memory (Kb) Cycle time (ns) 1 125 256 6000 256 198 2 29 8000 32000 32 269 208 480 512 8000 32 67 209 480 1000 4000 0 45  Linear regression function CHMAX 128 32 0 0 CHMIN 16 8 0 0 PRP = -55.9 + 0.0489 MYCT + 0.0153 MMIN + 0.0056 MMAX + 0.6410 CACH - 0.2700 CHMIN + 1.480 CHMAX … MYCT MMIN MMAX CACH PRP
  • 47. Algoritma Prediksi  Algoritma prediksi/forecasting sama dengan algoritma estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu (data time series)  Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan berbagai atribut yang kita sediakan  Semua algoritma estimasi dapat digunakan untuk prediksi/forecasting
  • 48. Contoh: Prediksi Harga Saham Dataset harga saham dalam bentuk time series (rentet waktu) harian
  • 49. Contoh: Prediksi Harga Saham (Plot)
  • 50. Contoh: Prediksi Harga Saham (Plot)
  • 51. Algoritma Klasifikasi  Klasifikasi adalah algoritma yang menggunakan data dengan target/class/label berupa nilai kategorikal (nominal)  Contoh, apabila target/class/label adalah pendapatan, maka bisa digunakan nilai nominal (kategorikal) sbb: pendapatan besar, menengah, kecil  Contoh lain adalah rekomendasi contact lens, apakah menggunakan yang jenis soft, hard atau none  Algoritma klasifikasi yang biasa digunakan adalah: Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, etc
  • 52. Contoh: Rekomendasi Main Golf  Input:  Output (Rules): If outlook = sunny and humidity = high then play = no If outlook = rainy and windy = true then play = no If outlook = overcast then play = yes If humidity = normal then play = yes If none of the above then play = yes
  • 53. Contoh: Rekomendasi Main Golf  Input (Atribut Nominal dan Numerik):  Output (Rules): If outlook = sunny and humidity = high then play = no If outlook = sunny and humidity > 83 then play = no If outlook = rainy and windy = true then play = no If outlook = overcast then play = yes If humidity < 85 then play = yes If none of the above then play = yes
  • 54. Contoh: Rekomendasi Main Golf  Output (Tree):
  • 55. Contoh: Rekomendasi Contact Lens  Input:
  • 56. Contoh: Rekomendasi Contact Lens  Output/Model (Tree):
  • 57. Contoh: Penentuan Jenis Bunga Iris  Input:
  • 58. Contoh: Penentuan Jenis Bunga Iris  Output (Rules):
  • 59. Contoh: Penentuan Jenis Bunga Iris  Output (Tree):
  • 60. Algoritma Klastering  Klastering adalah pengelompokkan data, hasil observasi dan kasus ke dalam class yang mirip  Suatu klaster (cluster) adalah koleksi data yang mirip antara satu dengan yang lain, dan memiliki perbedaan bila dibandingkan dengan data dari klaster lain  Perbedaan utama algoritma klastering dengan klasifikasi adalah klastering tidak memiliki target/class/label, jadi termasuk unsupervised learning  Klastering sering digunakan sebagai tahap awal dalam proses data mining, dengan hasil klaster yang terbentuk akan menjadi input dari algoritma berikutnya yang digunakan
  • 61. Contoh: Klastering Jenis Gaya Hidup  Claritas, Inc. provide a demographic profile of each of the geographic areas in the country, as defined by zip code. One of the clustering mechanisms they use is the PRIZM segmentation system, which describes every U.S. zip code area in terms of distinct lifestyle types (66 segments). Just go to the company’s Web site, enter a particular zip code, and you are shown the most common PRIZM clusters for that zip code.  What do these clusters mean? For illustration, let’s look up the clusters for zip code 90210, Beverly Hills, California. The resulting clusters for zip code 90210 are: 1. Cluster 01: Blue Blood Estates 2. Cluster 10: Bohemian Mix 3. Cluster 02: Winner’s Circle 4. Cluster 07: Money and Brains 5. Cluster 08: Young Literati
  • 62.
  • 65. Contoh: Klastering Bunga Iris (Table)
  • 66. Algoritma Asosiasi  Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang “muncul bersamaan”  Dalam dunia bisnis, sering disebut dengan affinity analysis atau market basket analysis  Algoritma asosiasi akan mencari aturan yang menghitung hubungan diantara dua atau lebih atribut  Algoritma association rules berangkat dari pola “If antecedent, then consequent,” bersamaan dengan pengukuran support (coverage) dan confidence (accuration) yang terasosiasi dalam aturan
  • 67. Algoritma Asosiasi  Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan belanja di supermaket ABC, dimana: • 200 orang membeli Sabun Mandi • dari 200 orang yang membeli sabun mandi, 50 orangnya membeli Fanta  Jadi, association rule menjadi, “Jika membeli sabun mandi, maka membeli Fanta”, dengan nilai support = 200/1000 = 20% dan nilai confidence = 50/200 = 25%  Algoritma association rule diantaranya adalah: A priori algorithm, FP-Growth algorithm, GRI algorithm
  • 68. Contoh Penerapan Data Mining  Penentuan kelayakan aplikasi peminjaman uang di bank  Penentuan pasokan listrik PLN untuk wilayah Jakarta  Diagnosis pola kesalahan mesin  Perkiraan harga saham dan tingkat inflasi  Analisis pola belanja pelanggan  Memisahkan minyak mentah dan gas alam  Pemilihan program TV otomatis  Penentuan pola pelanggan yang loyal pada perusahaan operator telepon  Deteksi pencucian uang dari transaksi perbankan  Deteksi serangan (intrusion) pada suatu jaringan
  • 69. Cognitive-Performance Test 1. Sebutkan 5 peran utama data mining! 2. algoritma apa saja yang dapat digunakan untuk 5 peran utama data mining di atas? 3. Jelaskan perbedaan estimasi dan prediksi! 4. Jelaskan perbedaan estimasi dan klasifikasi! 5. Jelaskan perbedaan klasifikasi dan klastering! 6. Jelaskan perbedaan klastering dan prediksi! 7. Jelaskan perbedaan supervised dan unsupervised learning! 8. Sebutkan tahapan utama proses data mining!
  • 70. Referensi 1. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 2. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining, John Wiley & Sons, 2005 3. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer, 2011 4. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Second Edition, Elsevier, 2006 5. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook Second Edition, Springer, 2010 6. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications, World Scientific, 2007