SlideShare a Scribd company logo
Pengantar Data Mining
Irwansyah Saputra, S.Kom., M.Kom., MTA
Founder of Multinity Indonesia
Tentang Saya
• Irwansyah Saputra
• Dosen Ilmu Komputer
• Mahasiswa S3 Ilmu Komputer IPB University
• Bidang Kajian: Computational Intelligence &
Optimization (Data mining, machine learning,
artificial intelligence)
Halo semuanya, saya suka belajar tentang segala
hal dan suka berbagi pengetahuan. Saya juga
sering menjadi pembicara di berbagai seminar.
Kontak yang bisa dihubungi:
WhatsApp: 0895323302241
Instagram: @irwansight_
Web: https://irw.one
Disclaimer
Materi ini digunakan sebagai bahan ajar Program Data Mining di
Multinity.id
Silakan gunakan, mohon untuk tidak mengubah template.
Jika Anda memiliki kesulitan dalam memahami materi pada slide
ini, silakan belajar di Multinity.id
Referensi
1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques
Third Edition, Elsevier, 2012
2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine
Learning Tools and Techniques 3rd Edition, Elsevier, 2011
3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases
and Business Analytics Applications, CRC Press Taylor & Francis Group, 2014
4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data
Mining, John Wiley & Sons, 2005
5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press,
2014
6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques,
Springer, 2011
7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery
Handbook Second Edition, Springer, 2010
8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data
Mining of Enterprise Data: Algorithms and Applications, World Scientific,
2007
https://datareportal.com/reports/digital-2020-july-global-statshot
https://datareportal.com/reports/digital-2020-july-global-statshot
https://www.raconteur.net/infographics/a-day-in-data/
https://visual.ly/community/Infographics/technology/big-data
We are drowning in data but
starving for knowledge
John Naisbitt, 1982
Data Transformation
Perbedaan data, informasi, pengetahuan, kebijaksanaan?
Structured & Unstructred Data
Unstructured data is
approximately 80% of the data
that organizations process daily.
https://lawtomated.com/structured-data-vs-unstructured-data-what-are-they-and-why-care/
Tipe Data
Tipe Data
• Variabel merupakan karakter
contoh atau populasi yang menarik
untuk diamati.
• Variabel tersebut dibagi kedalam 2,
yaitu kualitatif & kuantitatif.
• Kualitatif: observasi yang bersifat
data kategorial
• Kuantitatif: observasi yang bersifat
data numerik
Variabel Kualitatif
• Menjelaskan data karakteristik atau
sifat bukan dengan angka.
• Contoh: warna mata, nama negara
di asia, tempat lahir, ranking di
kelas, tingkat kepuasan
pengunjung, nomor hp, dan
lainnya.
Variabel Kuantitatif
• Menjelaskan data hasil dari
perhitungan atau pengukuran.
• Contoh: jumlah pasien yang
berkunjung, suhu ruangan, tekanan
angin pada ban mobil, jumlah gaji
yang dihasilkan, tingkat IQ, jumlah
penjualan mobil, jarak rumah ke
sekolah dan lain sebagainya.
Variabel Kuantitatif
• Dibagi ke dalam 2 jenis, Diskrit dan
Kontinu.
• Diskrit memiliki karakteristik nilai
bulat dan ada batasan antar nilai.
Contoh: jumlah pengunjung mall
dalam satu hari, jumlah mobil yang
terjual
• Kontinu memiliki karakteristik
bertolak belakang dengan diskrit.
Contoh: tekanan angin pada ban,
suhu tubuh orang demam, suhu di
kutub utara, tinggi badan siswa,
pajak yang mesti dibayar
Summary
Tipe Variabel
Merek Komputer
Jenis Kelamin
Warna mata
Diskrit
Jumlah anggota keluarga
Jumlah pasien yang datang
Kontinu
Jumlah pajak yang dibayarkan
Tinggi badan siswa
Suhu ruangan
Kualitatif Kuantitatif
Tingkatan Pengukuran
Tingkatan Pengukuran
• Berdasarkan tingkatan
pengukuran, tipe data
dibagi ke dalam 4 jenis,
nominal, ordinal,
interval dan rasio
Tipe Data Nominal
• Data nominal tidak memiliki
urutan atau tingkatan.
• Bersifat kategorial dan tidak
dapat dihitung secara
matematis.
• Contoh: macam-macam warna,
jenis kelamin, nomor jersey,
merek laptop dan lainnya.
Mutually Exclusive dan Exhaustive*
Mutually Exclusive: Tidak boleh ada di lebih dari satu himpunan.
Exhaustive: harus masuk pada salah satu himpunan. Tidak boleh berada di luar himpunan.
Tipe Data Ordinal
• Data ordinal memiliki
urutan atau tingkatan.
• Bersifat kategorial dan tidak
dapat dihitung secara
matematis.
• Contoh: tingkat kepuasan
pelanggan, jenjang sekolah,
juara perlombaan dan
lainnya.
Tipe Data Interval
• Data interval mirip dengan ordinal
yaitu memiliki tingkatan.
• Perbedaannya adalah nilai pada
data interval dapat dijelaskan
secara matematis.
• Bersifat nominal dan dapat dihitung
secara matematis.
• Tidak dimulai dari nol.
• Contoh: suhu orang demam,
ukuran pakaian (M, L, XL)
Tipe Data Rasio
• Data Rasio mirip dengan interval.
• Perbedaannya adalah nilai pada
data rasio dimulai dari nol poin.
• Bersifat nominal dan dapat dihitung
secara matematis.
• Contoh: upah karyawan, jumlah
mobil yang terjual, berat badan,
tinggi badan
Summary
Apa itu Data Mining?
Data mining
• Ekstraksi pola yang menarik
dari data dalam jumlah besar.
• Suatu pola dikatakan menarik
apabila pola tersebut tidak
sepele, implisit, tidak diketahui
sebelumnya, dan berguna.
• Penggalian data diperlukan
saat data yang tersedia terlalu
banyak
Tahapan Data Mining
Metode Data Mining
Estimasi
Klasifikasi
Prediksi
Klasterisasi
Asosiasi
Cara Kerja Machine Learning
Cara kerja Supervised Learning
• Dipandu oleh guru. Dataset memiliki label/target/class.
• Mayoritas algoritma data mining adalah SL.
• Algoritma bekerja sesuai dengan label/target/class yang dipengaruhi oleh atribut.
Dataset Supervised Learning
Cara kerja Unsupervised Learning
• Mencari kemiripan dalam kelompoknya, dan tidak mirip dengan kelompok lainnya.
• Tidak ada class/target/label pada dataset.
• Clustering dan asosiasi termasuk ke dalam UL
Dataset Unsupervised Learning
Reinforcement Learning
• Belajar dari kesalahan
• Terdiri dari agent, environment, reward.
• Agent mengenali lingkungan.
• Reward didapatkan saat benar. Reward = 0 jika salah. Sehingga tidak akan mengulangi kesalahan
yang sama.
Contoh Penerapan Data Mining
• Estimasi
Estimasi Produksi Cacat
Y = a + bX
Y = -27,02 + 1,56X
Gunakan algoritma
Regresi Linear
Estimasi Produksi Cacat
1. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi
(Variabel X), contohnya: 30°C
Y = -27,02 + 1,56X
Y = -27,02 + 1,56(30)
=19,78
2. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 5
unit, maka berapakah suhu ruangan yang diperlukan untuk
mencapai target tersebut?
5= -27,02 + 1,56X
1,56X = 5+27,02
X= 32,02/1,56
X =20,52
Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target Cacat Produksi
adalah sekitar 20,520C
Contoh Penerapan Data Mining
• Prediksi
Prediksi Harga Saham
Contoh Penerapan Data Mining
• Klasifikasi
Rekomendasi Main Golf
Pengetahuan berupa aturan
pohon, If Then Rules.
Contoh Penerapan Data Mining
• Klasterisasi
Mengelompokkan Pelanggan
Dataset terkait memisahkan
pelanggan berdasarkan panggilan
lokal dan internasional.
Dataset tanpa label.
Jumlah cluster ditentukan dari awal. Pada
kasus ini cluster dibagi ke dalam 2.
Pengetahuan yang didapatkan berupa cluster
Contoh Penerapan Data Mining
• Asosiasi
Kasus Market Basket Analysis
• Contoh dataset tidak semuanya dimunculkan.
• Setelah menerapkan algoritma asosiasi
seperti Apriori, muncul hasil seperti di kanan.
Penjelasan
• Algoritma association rule (aturan asosiasi) adalah algoritma yang
menemukan atribut yang “muncul bersamaan”
• Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan
belanja di supermaket ABC, dimana:
• 200 orang membeli Apel
• dari 200 orang yang membeli Apel, 50 orangnya membeli Pear
• Jadi, association rule menjadi, “Jika membeli apel, maka membeli
Pear”, dengan nilai support = 200/1000 = 20% dan nilai confidence
= 50/200 = 25%
• Algoritma association rule diantaranya adalah: A priori algorithm,
FP-Growth algorithm, GRI algorithm.
Algoritma Dalam Data Mining
Algoritma Data Mining
1. Estimation (Estimasi):
• Linear Regression, Neural Network, Support Vector Machine, etc
2. Prediction/Forecasting (Prediksi/Peramalan):
• Linear Regression, Neural Network, Support Vector Machine, etc
3. Classification (Klasifikasi):
• Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis,
Logistic Regression, etc
4. Clustering (Klastering):
• K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc
5. Association (Asosiasi):
• FP-Growth, A Priori, Coefficient of Correlation, Chi Square, etc
Penerapan Data Mining
• Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa
• Penerapan data mining untuk memprediksi kriteria nasabah kredit
• Penerapan Datamining Pada Ekspor Buah-Buahan Menurut Negara
Tujuan
• Penerapan Datamining Dalam Mengelompokkan Kunjungan
Wisatawan Ke Objek Wisata Unggulan Di Prov. Dki Jakarta
• Penerapan Data Mining Untuk Analisis Pola Pembelian Konsumen
Pada Data Transaksi Penjualan Spare Part Motor

More Related Content

What's hot

Data mining 3 similarity and disimilarity
Data mining 3   similarity and disimilarityData mining 3   similarity and disimilarity
Data mining 3 similarity and disimilarity
IrwansyahSaputra1
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
Adam Superman
 
Data mining 7
Data mining 7Data mining 7
Data mining 7
dedidarwis
 
Data mining
Data miningData mining
Data mining
Agung Apriyadi
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
dedidarwis
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)
Adam Mukharil Bachtiar
 
Matematika Diskrit - 01 pengantar matematika diskrit
Matematika Diskrit - 01 pengantar matematika diskrit Matematika Diskrit - 01 pengantar matematika diskrit
Matematika Diskrit - 01 pengantar matematika diskrit
KuliahKita
 
Contoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyContoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyZaenal Khayat
 
Algoritma penjadwalan proses
Algoritma penjadwalan prosesAlgoritma penjadwalan proses
Algoritma penjadwalan proses
Rakhmi Khalida, M.M.S.I
 
Pertemuan 10
Pertemuan 10Pertemuan 10
Pertemuan 10
Muhamad Edi.S
 
Jawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihanJawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihan
Bina Sarana Informatika
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Mining
dedidarwis
 
Data Flow Diagram
Data Flow DiagramData Flow Diagram
Data Flow Diagram
Sherly Uda
 
Sentiment analysis
Sentiment analysisSentiment analysis
Sentiment analysis
ike kurniati
 
2 konsep sistem digital
2 konsep sistem digital2 konsep sistem digital
2 konsep sistem digital
Danang Erwanto
 
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043
DinaNisrinaRosandi
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
 
Fitur dan Komponen Data Warehouse
Fitur dan Komponen Data WarehouseFitur dan Komponen Data Warehouse
Fitur dan Komponen Data Warehouse
dedidarwis
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
IrwansyahSaputra1
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
Universitas Bina Darma Palembang
 

What's hot (20)

Data mining 3 similarity and disimilarity
Data mining 3   similarity and disimilarityData mining 3   similarity and disimilarity
Data mining 3 similarity and disimilarity
 
Klasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
 
Data mining 7
Data mining 7Data mining 7
Data mining 7
 
Data mining
Data miningData mining
Data mining
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)
 
Matematika Diskrit - 01 pengantar matematika diskrit
Matematika Diskrit - 01 pengantar matematika diskrit Matematika Diskrit - 01 pengantar matematika diskrit
Matematika Diskrit - 01 pengantar matematika diskrit
 
Contoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyContoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzy
 
Algoritma penjadwalan proses
Algoritma penjadwalan prosesAlgoritma penjadwalan proses
Algoritma penjadwalan proses
 
Pertemuan 10
Pertemuan 10Pertemuan 10
Pertemuan 10
 
Jawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihanJawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihan
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Mining
 
Data Flow Diagram
Data Flow DiagramData Flow Diagram
Data Flow Diagram
 
Sentiment analysis
Sentiment analysisSentiment analysis
Sentiment analysis
 
2 konsep sistem digital
2 konsep sistem digital2 konsep sistem digital
2 konsep sistem digital
 
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
Fitur dan Komponen Data Warehouse
Fitur dan Komponen Data WarehouseFitur dan Komponen Data Warehouse
Fitur dan Komponen Data Warehouse
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 

Similar to Data mining 1 pengantar

Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
muhammadarsyad77
 
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
Alvian yudha Prawira
 
093-P01.pdf
093-P01.pdf093-P01.pdf
093-P01.pdf
WawanSnea
 
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptxPertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
DanteHayashi
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
Andri946883
 
Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan Netlytics
Hendro Subagyo
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
NanzalXIV
 
UCD APPROACH ANDY
UCD APPROACH ANDYUCD APPROACH ANDY
UCD APPROACH ANDY
andy rachman
 
Tahap Pelaksanaan Riset Pemasaran
Tahap Pelaksanaan Riset PemasaranTahap Pelaksanaan Riset Pemasaran
Tahap Pelaksanaan Riset Pemasaran
Eri Laksmono
 
Rantai nilai value chain-tm-3
Rantai nilai value chain-tm-3Rantai nilai value chain-tm-3
Rantai nilai value chain-tm-3
SEKOLAH TINGGI ILMU EKONOMI INDONESIA
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
Ocha8
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
SalimSlw
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
YeshaAgusAriwanta
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012
aiiniR
 
4 pengenalan-supervised-dan-unsupervised-learning (1)
4 pengenalan-supervised-dan-unsupervised-learning (1)4 pengenalan-supervised-dan-unsupervised-learning (1)
4 pengenalan-supervised-dan-unsupervised-learning (1)
Nera Ajahh
 
Bab1.pptx
Bab1.pptxBab1.pptx
3. Konsep Data Mining
3. Konsep Data Mining3. Konsep Data Mining
3. Konsep Data Mining
Universitas Serang Raya
 
Pertemuan 1 Pengantar DW
Pertemuan 1 Pengantar DWPertemuan 1 Pengantar DW
Pertemuan 1 Pengantar DW
Endang Retnoningsih
 

Similar to Data mining 1 pengantar (20)

Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
 
093-P01.pdf
093-P01.pdf093-P01.pdf
093-P01.pdf
 
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptxPertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
 
Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan Netlytics
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
 
UCD APPROACH ANDY
UCD APPROACH ANDYUCD APPROACH ANDY
UCD APPROACH ANDY
 
Tahap Pelaksanaan Riset Pemasaran
Tahap Pelaksanaan Riset PemasaranTahap Pelaksanaan Riset Pemasaran
Tahap Pelaksanaan Riset Pemasaran
 
Rantai nilai value chain-tm-3
Rantai nilai value chain-tm-3Rantai nilai value chain-tm-3
Rantai nilai value chain-tm-3
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012
 
4 pengenalan-supervised-dan-unsupervised-learning (1)
4 pengenalan-supervised-dan-unsupervised-learning (1)4 pengenalan-supervised-dan-unsupervised-learning (1)
4 pengenalan-supervised-dan-unsupervised-learning (1)
 
Bab1.pptx
Bab1.pptxBab1.pptx
Bab1.pptx
 
3. Konsep Data Mining
3. Konsep Data Mining3. Konsep Data Mining
3. Konsep Data Mining
 
Pertemuan 1 Pengantar DW
Pertemuan 1 Pengantar DWPertemuan 1 Pengantar DW
Pertemuan 1 Pengantar DW
 

Recently uploaded

Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan  (1).pptxPresentasi Luring (8JP)_ Refleksi Tahunan  (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
muhammadfauzi951
 
Materi pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipaMateri pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipa
sarahshintia630
 
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptxBahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
dwiagus41
 
pemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdfpemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdf
fuji226200
 
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.pptPPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
WewikAyuPrimaDewi
 
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptxTugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
SunakonSulistya
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
WagKuza
 
Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1
RizkyAji15
 
PPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahirPPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahir
yardsport
 
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay..."Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
Muhammad Nur Hadi
 
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
TeguhWinarno6
 
template undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docxtemplate undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docx
ansproduction72
 

Recently uploaded (12)

Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan  (1).pptxPresentasi Luring (8JP)_ Refleksi Tahunan  (1).pptx
Presentasi Luring (8JP)_ Refleksi Tahunan (1).pptx
 
Materi pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipaMateri pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipa
 
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptxBahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
 
pemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdfpemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdf
 
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.pptPPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
 
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptxTugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
 
Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1
 
PPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahirPPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahir
 
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay..."Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
 
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
 
template undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docxtemplate undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docx
 

Data mining 1 pengantar

  • 1. Pengantar Data Mining Irwansyah Saputra, S.Kom., M.Kom., MTA Founder of Multinity Indonesia
  • 2. Tentang Saya • Irwansyah Saputra • Dosen Ilmu Komputer • Mahasiswa S3 Ilmu Komputer IPB University • Bidang Kajian: Computational Intelligence & Optimization (Data mining, machine learning, artificial intelligence) Halo semuanya, saya suka belajar tentang segala hal dan suka berbagi pengetahuan. Saya juga sering menjadi pembicara di berbagai seminar. Kontak yang bisa dihubungi: WhatsApp: 0895323302241 Instagram: @irwansight_ Web: https://irw.one
  • 3. Disclaimer Materi ini digunakan sebagai bahan ajar Program Data Mining di Multinity.id Silakan gunakan, mohon untuk tidak mengubah template. Jika Anda memiliki kesulitan dalam memahami materi pada slide ini, silakan belajar di Multinity.id
  • 4. Referensi 1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third Edition, Elsevier, 2012 2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and Business Analytics Applications, CRC Press Taylor & Francis Group, 2014 4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining, John Wiley & Sons, 2005 5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014 6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer, 2011 7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook Second Edition, Springer, 2010 8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications, World Scientific, 2007
  • 9. We are drowning in data but starving for knowledge John Naisbitt, 1982
  • 10. Data Transformation Perbedaan data, informasi, pengetahuan, kebijaksanaan?
  • 11. Structured & Unstructred Data Unstructured data is approximately 80% of the data that organizations process daily. https://lawtomated.com/structured-data-vs-unstructured-data-what-are-they-and-why-care/
  • 13. Tipe Data • Variabel merupakan karakter contoh atau populasi yang menarik untuk diamati. • Variabel tersebut dibagi kedalam 2, yaitu kualitatif & kuantitatif. • Kualitatif: observasi yang bersifat data kategorial • Kuantitatif: observasi yang bersifat data numerik
  • 14. Variabel Kualitatif • Menjelaskan data karakteristik atau sifat bukan dengan angka. • Contoh: warna mata, nama negara di asia, tempat lahir, ranking di kelas, tingkat kepuasan pengunjung, nomor hp, dan lainnya.
  • 15. Variabel Kuantitatif • Menjelaskan data hasil dari perhitungan atau pengukuran. • Contoh: jumlah pasien yang berkunjung, suhu ruangan, tekanan angin pada ban mobil, jumlah gaji yang dihasilkan, tingkat IQ, jumlah penjualan mobil, jarak rumah ke sekolah dan lain sebagainya.
  • 16. Variabel Kuantitatif • Dibagi ke dalam 2 jenis, Diskrit dan Kontinu. • Diskrit memiliki karakteristik nilai bulat dan ada batasan antar nilai. Contoh: jumlah pengunjung mall dalam satu hari, jumlah mobil yang terjual • Kontinu memiliki karakteristik bertolak belakang dengan diskrit. Contoh: tekanan angin pada ban, suhu tubuh orang demam, suhu di kutub utara, tinggi badan siswa, pajak yang mesti dibayar
  • 17. Summary Tipe Variabel Merek Komputer Jenis Kelamin Warna mata Diskrit Jumlah anggota keluarga Jumlah pasien yang datang Kontinu Jumlah pajak yang dibayarkan Tinggi badan siswa Suhu ruangan Kualitatif Kuantitatif
  • 19. Tingkatan Pengukuran • Berdasarkan tingkatan pengukuran, tipe data dibagi ke dalam 4 jenis, nominal, ordinal, interval dan rasio
  • 20.
  • 21. Tipe Data Nominal • Data nominal tidak memiliki urutan atau tingkatan. • Bersifat kategorial dan tidak dapat dihitung secara matematis. • Contoh: macam-macam warna, jenis kelamin, nomor jersey, merek laptop dan lainnya. Mutually Exclusive dan Exhaustive* Mutually Exclusive: Tidak boleh ada di lebih dari satu himpunan. Exhaustive: harus masuk pada salah satu himpunan. Tidak boleh berada di luar himpunan.
  • 22. Tipe Data Ordinal • Data ordinal memiliki urutan atau tingkatan. • Bersifat kategorial dan tidak dapat dihitung secara matematis. • Contoh: tingkat kepuasan pelanggan, jenjang sekolah, juara perlombaan dan lainnya.
  • 23. Tipe Data Interval • Data interval mirip dengan ordinal yaitu memiliki tingkatan. • Perbedaannya adalah nilai pada data interval dapat dijelaskan secara matematis. • Bersifat nominal dan dapat dihitung secara matematis. • Tidak dimulai dari nol. • Contoh: suhu orang demam, ukuran pakaian (M, L, XL)
  • 24. Tipe Data Rasio • Data Rasio mirip dengan interval. • Perbedaannya adalah nilai pada data rasio dimulai dari nol poin. • Bersifat nominal dan dapat dihitung secara matematis. • Contoh: upah karyawan, jumlah mobil yang terjual, berat badan, tinggi badan
  • 26. Apa itu Data Mining?
  • 27. Data mining • Ekstraksi pola yang menarik dari data dalam jumlah besar. • Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. • Penggalian data diperlukan saat data yang tersedia terlalu banyak
  • 30.
  • 31. Cara Kerja Machine Learning
  • 32. Cara kerja Supervised Learning • Dipandu oleh guru. Dataset memiliki label/target/class. • Mayoritas algoritma data mining adalah SL. • Algoritma bekerja sesuai dengan label/target/class yang dipengaruhi oleh atribut.
  • 34. Cara kerja Unsupervised Learning • Mencari kemiripan dalam kelompoknya, dan tidak mirip dengan kelompok lainnya. • Tidak ada class/target/label pada dataset. • Clustering dan asosiasi termasuk ke dalam UL
  • 36. Reinforcement Learning • Belajar dari kesalahan • Terdiri dari agent, environment, reward. • Agent mengenali lingkungan. • Reward didapatkan saat benar. Reward = 0 jika salah. Sehingga tidak akan mengulangi kesalahan yang sama.
  • 37. Contoh Penerapan Data Mining • Estimasi
  • 38. Estimasi Produksi Cacat Y = a + bX Y = -27,02 + 1,56X Gunakan algoritma Regresi Linear
  • 39. Estimasi Produksi Cacat 1. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi (Variabel X), contohnya: 30°C Y = -27,02 + 1,56X Y = -27,02 + 1,56(30) =19,78 2. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 5 unit, maka berapakah suhu ruangan yang diperlukan untuk mencapai target tersebut? 5= -27,02 + 1,56X 1,56X = 5+27,02 X= 32,02/1,56 X =20,52 Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target Cacat Produksi adalah sekitar 20,520C
  • 40. Contoh Penerapan Data Mining • Prediksi
  • 42.
  • 43. Contoh Penerapan Data Mining • Klasifikasi
  • 44. Rekomendasi Main Golf Pengetahuan berupa aturan pohon, If Then Rules.
  • 45. Contoh Penerapan Data Mining • Klasterisasi
  • 46. Mengelompokkan Pelanggan Dataset terkait memisahkan pelanggan berdasarkan panggilan lokal dan internasional. Dataset tanpa label. Jumlah cluster ditentukan dari awal. Pada kasus ini cluster dibagi ke dalam 2. Pengetahuan yang didapatkan berupa cluster
  • 47. Contoh Penerapan Data Mining • Asosiasi
  • 48. Kasus Market Basket Analysis • Contoh dataset tidak semuanya dimunculkan. • Setelah menerapkan algoritma asosiasi seperti Apriori, muncul hasil seperti di kanan.
  • 49. Penjelasan • Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang “muncul bersamaan” • Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan belanja di supermaket ABC, dimana: • 200 orang membeli Apel • dari 200 orang yang membeli Apel, 50 orangnya membeli Pear • Jadi, association rule menjadi, “Jika membeli apel, maka membeli Pear”, dengan nilai support = 200/1000 = 20% dan nilai confidence = 50/200 = 25% • Algoritma association rule diantaranya adalah: A priori algorithm, FP-Growth algorithm, GRI algorithm.
  • 51. Algoritma Data Mining 1. Estimation (Estimasi): • Linear Regression, Neural Network, Support Vector Machine, etc 2. Prediction/Forecasting (Prediksi/Peramalan): • Linear Regression, Neural Network, Support Vector Machine, etc 3. Classification (Klasifikasi): • Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, Logistic Regression, etc 4. Clustering (Klastering): • K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc 5. Association (Asosiasi): • FP-Growth, A Priori, Coefficient of Correlation, Chi Square, etc
  • 52. Penerapan Data Mining • Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa • Penerapan data mining untuk memprediksi kriteria nasabah kredit • Penerapan Datamining Pada Ekspor Buah-Buahan Menurut Negara Tujuan • Penerapan Datamining Dalam Mengelompokkan Kunjungan Wisatawan Ke Objek Wisata Unggulan Di Prov. Dki Jakarta • Penerapan Data Mining Untuk Analisis Pola Pembelian Konsumen Pada Data Transaksi Penjualan Spare Part Motor