SlideShare a Scribd company logo
1 of 34
Download to read offline
Konsep Data Mining
Wildan Toyib
Outline
Pengertian Dasar
Arsitektur
Tugas Data Mining
Contoh Penggunaan Data Mining
Latar Belakang
3
Mengapa harus Data Mining?
efinisi Data Mining
Pengertian Yang Salah
Ilmu Data Mining
Arsitektur Data Mining -1-
Arsitektur Data Mining -2-
Knowledge Base
◦ Daerah knowledge yang digunakan untuk memberi petunjuk pencarian atau
mengevaluasi hasil pola
Data Mining Engine
◦ Terdiri dari sekumpulan model fungsional seperti characterization, association,
classification, cluster analysis, evaluation and deviation analysis
Arsitektur Data Mining -3-
Pattern Evaluation Module
◦ Komponen yang berinteraksi dengan modul data mining untuk pencarian pola
GUI (Graphical User Interface)
◦ modul yang mempermudah user berinteraksi dengan sistem data mining
gas Data Mining
Metode dalam Data Mining
Predictive - Classification
Menemukan fungsi atau model yang membedakan kelas data
Fungsi atau model tsb dapat berbentuk aturan if-else, descision tree, formula
matematika, atau neural network
Tujuannya untuk memperkirakan kelas dari suatu objek yang labelnya tidak
diketahui
Algoritma : Decision Tree (C4.5), Artificial Neural Network, Naïve Bayes, Genetic
Algorithm, Fuzzy, Case-Based Reasoning, k-Nearest Neighbor
Supervised Method
Contoh
Contoh Lain..
Metode Pohon Keputusan
Lanj..
Predictive – Time Series Analysis
Time series data : sekuens data yang nilainya berubah setiap interval waktu
tertentu.
Time series data dapat dipresentasikan dalam bentuk grafik atau kurva yang
menunjukkan fungsi sebuah variabel data terhadap satuan waktu.
Metode : Neural Network (model Backpropagation, multi layer perceptron)
Aplikasi : memprediksikan indeks harga saham
Contoh : Prediksi dalam pasar
saham
garis yang tegas adalah time-series
data sebenarnya dari nilai saham
Microsoft, dan garis putus-putus
adalah time series model yang
memprediksi nilai saham berdasarkan
nilai saham pada masa lalu.
Predictive - Regression
Regression vs Classification :
◦ Regression diterapkan untuk mengklasifikasikan target data numerik
◦ Classification untuk mengklasifikasikan target data kategorial
Aplikasi : prediksi nilai penjualan yang akan datang berdasarkan trend data
penjualan tahun sebelumnya.
Algoritma : Support Vector Machine (SVM), Generalized Linear Model (GLM)
Descriptive - Clustering
Mengidentifikasi kelompok alami dari data berdasarkan kemiripan atribut
Disebut juga Segmentation
Unsupervised Method : tidak satupun atribut yang digunakan untuk
memandu proses pembelajaran (tidak ada label)
Algoritma : k-Means, k-Medoid, Fuzzy C-Means, Subtractive, Mountain,
Hierarki
Contoh : Data Pelanggan
Terdiri dari dua atribut, yaitu Age
(Umur) dan Income (Pendapatan).
Algoritma Clustering
mengelompokkan kelompok data
kedalam tiga segment berdasarkan
kedua atribut ini.
◦ Cluster 1 : populasi berusia muda
dengan pendapatan rendah
◦ Cluster 2 : populasi berusia menengah
dengan pendapatan yang lebih tinggi
◦ Cluster 3 : populasi berusia tua dengan
pendapatan yang relatif rendah.
Contoh
Lanj..
Descriptive – Association Rule
Disebut juga Market Basket Analysis.
Menganalisa tabel transaksi penjualan dan mengidentifikasi produk-produk
yang seringkali dibeli bersamaan oleh customer
Untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa
yang terjadi guna kepentingan cross-selling
◦ Untuk mencari produk apa yang biasanya terjual bersamaan
◦ Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut.
Ketika orang membeli susu, dia
biasanya membeli keju
Ketika orang membeli pepsi atau
coke, biasanya dia membeli juice
oh Lain
Descriptive – Sequence Analysis
Digunakan untuk mencari pola pada serangkaian kejadian yang disebut
dengan Sequence.
Contoh rangkaian klik pada sebuah website berisi rentetan URL.
Implementasi : memodelkan pembelian oleh pelanggan sebagai sebuah
sequence (rangkaian) data :
◦ Pertama-tama seorang pelanggan membeli komputer
◦ kemudian membeli speaker
◦ dan akhirnya membeli sebuah webcam.
Contoh : Rangkaian Klik pada
Sebuah Website Berita
Setiap node adalah sebuah kategori
URL.
Garis melambangkan transisi antar
kategori URL tersebut.
Setiap transisi dikelompokan dengan
sebuah bobot yang menggambarkan
kemungkinan transisi antara satu
URL dan URL yang lain.
Penerapan Data Mining
Clustering
Tingkat kelulusan
Materi Kuliah Data Mining full

More Related Content

What's hot

K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.pptAdam Superman
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasiIrwansyahSaputra1
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayesdedidarwis
 
Datamining menggunakan algoritma c4.5
Datamining menggunakan algoritma c4.5Datamining menggunakan algoritma c4.5
Datamining menggunakan algoritma c4.5Rosyid Ridlo
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Aprioridedidarwis
 
Materi Data Mining - C4.5
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5dedidarwis
 
13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdfElvi Rahmi
 
Contoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyContoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyZaenal Khayat
 
Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)ahmad haidaroh
 
Penerapan Machine Learning di Industri
Penerapan Machine Learning di IndustriPenerapan Machine Learning di Industri
Penerapan Machine Learning di IndustriBayu Aldi Yansyah
 
Penyederhanaan Fungsi Boolean
Penyederhanaan Fungsi BooleanPenyederhanaan Fungsi Boolean
Penyederhanaan Fungsi BooleanFahrul Razi
 
6 data-understanding-v2
6 data-understanding-v26 data-understanding-v2
6 data-understanding-v2ArdianDwiPraba
 
Metode pencarian heuristik
Metode pencarian heuristikMetode pencarian heuristik
Metode pencarian heuristikBaguss Chandrass
 
Pertemuan 6 Infrastruktur Datawarehouse
Pertemuan 6 Infrastruktur DatawarehousePertemuan 6 Infrastruktur Datawarehouse
Pertemuan 6 Infrastruktur DatawarehouseEndang Retnoningsih
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfElvi Rahmi
 
Materi Struktur Data Tree
Materi Struktur Data TreeMateri Struktur Data Tree
Materi Struktur Data TreeMeta N
 

What's hot (20)

K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasi
 
Data Mining - Naive Bayes
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
 
Datamining menggunakan algoritma c4.5
Datamining menggunakan algoritma c4.5Datamining menggunakan algoritma c4.5
Datamining menggunakan algoritma c4.5
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
Materi Data Mining - C4.5
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5
 
13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf13 - 14 Regresi Linear Sederhana & Berganda.pdf
13 - 14 Regresi Linear Sederhana & Berganda.pdf
 
Contoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyContoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzy
 
Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)
 
Data mining 1 pengantar
Data mining 1   pengantarData mining 1   pengantar
Data mining 1 pengantar
 
Penerapan Machine Learning di Industri
Penerapan Machine Learning di IndustriPenerapan Machine Learning di Industri
Penerapan Machine Learning di Industri
 
Penyederhanaan Fungsi Boolean
Penyederhanaan Fungsi BooleanPenyederhanaan Fungsi Boolean
Penyederhanaan Fungsi Boolean
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
6 data-understanding-v2
6 data-understanding-v26 data-understanding-v2
6 data-understanding-v2
 
Metode pencarian heuristik
Metode pencarian heuristikMetode pencarian heuristik
Metode pencarian heuristik
 
romi-dm-aug2020.pptx
romi-dm-aug2020.pptxromi-dm-aug2020.pptx
romi-dm-aug2020.pptx
 
Pertemuan 6 Infrastruktur Datawarehouse
Pertemuan 6 Infrastruktur DatawarehousePertemuan 6 Infrastruktur Datawarehouse
Pertemuan 6 Infrastruktur Datawarehouse
 
Sistem Pendukung Keputusan
Sistem Pendukung KeputusanSistem Pendukung Keputusan
Sistem Pendukung Keputusan
 
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
 
Materi Struktur Data Tree
Materi Struktur Data TreeMateri Struktur Data Tree
Materi Struktur Data Tree
 

Similar to Materi Kuliah Data Mining full

A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803Alvian yudha Prawira
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningDEDE IRYAWAN
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxArwansyahDipanegara
 
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...ym.ygrex@comp
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfRinnaRachmatika2
 
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxSangrian1
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfHendroGunawan8
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
 
Essential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningCharlez Dbc
 
1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR
1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR
1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIRPutra Christianto Purba
 

Similar to Materi Kuliah Data Mining full (20)

Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
Machine learning dan data mining
Machine learning dan data miningMachine learning dan data mining
Machine learning dan data mining
 
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
 
fuzzyShp
fuzzyShpfuzzyShp
fuzzyShp
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data Mining
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
 
26813 9 arsitektur data mining
26813 9 arsitektur data mining26813 9 arsitektur data mining
26813 9 arsitektur data mining
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
 
093-P01.pdf
093-P01.pdf093-P01.pdf
093-P01.pdf
 
10
1010
10
 
15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining
 
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
 
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
 
Essential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data mining
 
1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR
1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR
1112050_PUTRA CHRISTIANTO PURBA_JURNAL TUGAS AKHIR
 

Recently uploaded

Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Surveikustiyantidew94
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili
 

Recently uploaded (9)

Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Survei
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptx
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptx
 

Materi Kuliah Data Mining full

  • 2. Outline Pengertian Dasar Arsitektur Tugas Data Mining Contoh Penggunaan Data Mining
  • 9. Arsitektur Data Mining -2- Knowledge Base ◦ Daerah knowledge yang digunakan untuk memberi petunjuk pencarian atau mengevaluasi hasil pola Data Mining Engine ◦ Terdiri dari sekumpulan model fungsional seperti characterization, association, classification, cluster analysis, evaluation and deviation analysis
  • 10. Arsitektur Data Mining -3- Pattern Evaluation Module ◦ Komponen yang berinteraksi dengan modul data mining untuk pencarian pola GUI (Graphical User Interface) ◦ modul yang mempermudah user berinteraksi dengan sistem data mining
  • 13. Predictive - Classification Menemukan fungsi atau model yang membedakan kelas data Fungsi atau model tsb dapat berbentuk aturan if-else, descision tree, formula matematika, atau neural network Tujuannya untuk memperkirakan kelas dari suatu objek yang labelnya tidak diketahui Algoritma : Decision Tree (C4.5), Artificial Neural Network, Naïve Bayes, Genetic Algorithm, Fuzzy, Case-Based Reasoning, k-Nearest Neighbor Supervised Method
  • 14.
  • 19. Predictive – Time Series Analysis Time series data : sekuens data yang nilainya berubah setiap interval waktu tertentu. Time series data dapat dipresentasikan dalam bentuk grafik atau kurva yang menunjukkan fungsi sebuah variabel data terhadap satuan waktu. Metode : Neural Network (model Backpropagation, multi layer perceptron) Aplikasi : memprediksikan indeks harga saham
  • 20. Contoh : Prediksi dalam pasar saham garis yang tegas adalah time-series data sebenarnya dari nilai saham Microsoft, dan garis putus-putus adalah time series model yang memprediksi nilai saham berdasarkan nilai saham pada masa lalu.
  • 21. Predictive - Regression Regression vs Classification : ◦ Regression diterapkan untuk mengklasifikasikan target data numerik ◦ Classification untuk mengklasifikasikan target data kategorial Aplikasi : prediksi nilai penjualan yang akan datang berdasarkan trend data penjualan tahun sebelumnya. Algoritma : Support Vector Machine (SVM), Generalized Linear Model (GLM)
  • 22. Descriptive - Clustering Mengidentifikasi kelompok alami dari data berdasarkan kemiripan atribut Disebut juga Segmentation Unsupervised Method : tidak satupun atribut yang digunakan untuk memandu proses pembelajaran (tidak ada label) Algoritma : k-Means, k-Medoid, Fuzzy C-Means, Subtractive, Mountain, Hierarki
  • 23. Contoh : Data Pelanggan Terdiri dari dua atribut, yaitu Age (Umur) dan Income (Pendapatan). Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini. ◦ Cluster 1 : populasi berusia muda dengan pendapatan rendah ◦ Cluster 2 : populasi berusia menengah dengan pendapatan yang lebih tinggi ◦ Cluster 3 : populasi berusia tua dengan pendapatan yang relatif rendah.
  • 26. Descriptive – Association Rule Disebut juga Market Basket Analysis. Menganalisa tabel transaksi penjualan dan mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer Untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan cross-selling ◦ Untuk mencari produk apa yang biasanya terjual bersamaan ◦ Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut.
  • 27. Ketika orang membeli susu, dia biasanya membeli keju Ketika orang membeli pepsi atau coke, biasanya dia membeli juice
  • 29.
  • 30.
  • 31. Descriptive – Sequence Analysis Digunakan untuk mencari pola pada serangkaian kejadian yang disebut dengan Sequence. Contoh rangkaian klik pada sebuah website berisi rentetan URL. Implementasi : memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data : ◦ Pertama-tama seorang pelanggan membeli komputer ◦ kemudian membeli speaker ◦ dan akhirnya membeli sebuah webcam.
  • 32. Contoh : Rangkaian Klik pada Sebuah Website Berita Setiap node adalah sebuah kategori URL. Garis melambangkan transisi antar kategori URL tersebut. Setiap transisi dikelompokan dengan sebuah bobot yang menggambarkan kemungkinan transisi antara satu URL dan URL yang lain.