ARSITEKTUR & MODEL DATA MINING
Part 4
1. Tingkat pertama adalah database tingkat di mana data dan metadata disiapkan dan disimpan.
2. Tingkat kedua disebut Data Mining Aplikasi dimana algoritma memproses data dan menyimpan
hasilnya dalam database.
3. Tingkat ketiga adalah lapisan Front-End, yang memudahkan pengaturan parameter untuk Aplikasi
Data Mining dan visualisasi hasil dalam bentuk ditafsirkan.
MODEL DATA MINING
.
Menggunakan
beberapa variabel
untuk memprediksi
sesuatu atau suatu nilai
yang akan datang
Prediction
Methods
Description
Methods
Mendapatkan pola
penafsiran (human-
interpretable patterns)
untuk menjelaskan
data.
Prediksi Pemodelan
Pemodelan prediktif adalah proses yang
digunakan dalam analisis prediktif untuk
membuat model statistik dari perilaku
masa depan. Predictive analytics adalah
bidang data mining yang bersangkutan
dengan probabilitas peramalan dan tren.
Sebuah model prediktif terdiri dari
sejumlah prediksi, baik faktor variabel
yang mungkin mempengaruhi perilaku
masa depan atau hasil. Dalam
pemasaran, misalnya, jenis kelamin
pelanggan, usia, dan sejarah pembelian
mungkin memprediksi kemungkinan
penjualan masa depan.
Pada pemodelan prediktif, data
dikumpulkan untuk prediktor yang
relevan, model statistik dirumuskan,
prediksi yang dibuat dan model
divalidasi (atau revisi) sebagai data
tambahan telah tersedia. Model ini dapat
menggunakan persamaan linier
sederhana atau jaringan syaraf kompleks
, dipetakan oleh perangkat lunak yang
canggih.
P
emodelan prediktif digunakan secara
luas dalam teknologi informasi.
sistem penyaringan spam, misalnya,
Dalam
pemodelan prediktif kadang-kadang
digunakan untuk mengidentifikasi
kemungkinan bahwa pesan yang
diberikan adalah spam.
clustering Klasifikasi
Decision tree Asosiasition R
ule
Deskriptif
Pemodelan
10/
25/
2020 P
ASKAM
AR
T
OH
ASU
G
IAN
clustering adalah sebuah prosesuntuk
mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga
data dalam satuclustermemilikitingkat
kemiripan yang maksimumdan data
antar clustermemilikikemiripanyang
minimum.
Metode clustering juga harusdapat
mengukurkemampuannyasendiridalam
usaha untuk menemukan suatu pola
tersembunyi pada data yang sedang diteliti.
Terdapat berbagai metode yang dapat
digunakan untuk mengukur nilai kesamaan
antar objek-objek yang dibandingkan
clustering
Suatu metode clustering harus mampu
menangani data dalam jumlah yang besar.
Saat ini data dalam jumlahbesar sudah
sangat umumdigunakan dalam berbagai
bidang misalnyasaja suatudatabase. Tidak
hanya berisi ratusan objek, suatudatabase
dengan ukuranbesar bahkan berisi lebih
dari jutaan objek.
10/
25/
2020 P
ASKAM
AR
T
OH
ASU
G
IAN
Klasifikasi merupakan salah satu topik utama dalam data
mining atau machine learning. Klasifikasi adalah suatu
proses penyajian data dimana data yang digunakan
tersebut mempunyai kelas label atau target.
Klasifikasi bertujuan untuk mengklasifikasikan item data
menjadi satu dari beberapa kelas standar. Sebagai
contoh, suatu program email dapat mengklasifikasikan
email yang sah dengan email spam. Beberapa algoritma
klasifikasi antara lain pohon keputusan, nearest neighbor,
nave bayes, neural networks dan support vector machines.
Classification merupakan teknik mengklasifikasikan data.
Perbedaannya dengan metode clustering terletak pada data,
dimana pada clustering variabel dependen tidak ada,
sedangkan pada classification diharuskan ada variabel
dependen. Contoh algoritma yang menggunakan metode ini ID3
dan K Nearest Neighbors dan lainnya.
10/
25/
2020 P
ASKAM
AR
T
OH
ASU
G
IAN
Decision tree
Decision Tree (PohonKeputusan). Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat terkenal. Metode
pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan
Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel
input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, pohon
keputusan sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari
beberapa teknik lain
10/
25/
2020 P
ASKAM
AR
T
OH
ASU
G
IAN
Pembelajaran aturan asosiasi mencari hubungan antara variabel. Sebagai contoh suatu toko mengumpulkan data kebiasaan
pelanggan dalam berbelanja. Ketika menggunakan pembelajaran aturan asosiasi, toko tersebut dapat menentuan produk
yang sering dibeli bersamaan dan menggunakan informasi ini untuk tujuan pemasaran.
Asosiasition Rule
Association (Asosiasi) merupakan teknik dalam data mining yang mempelajari hubungan antar data. Contoh
penggunaannya seperti untuk menganalisis perilaku mahasiswa yang datang terlambat. jika mahasiswa memiliki jadwal
dengan dosen A dan B
, maka mahasiswa akan datang terlambat.
10/
25/
2020 P
ASKAM
AR
T
OH
ASU
G
IAN
10/
25/
2020 P
ASKAM
AR
T
OH
ASU
G
IAN
SEKIAN DAN TERIMAKASIH

DATA MINING : RSITEKTUR & MODEL DATA MINING

  • 1.
    ARSITEKTUR & MODELDATA MINING Part 4
  • 2.
    1. Tingkat pertamaadalah database tingkat di mana data dan metadata disiapkan dan disimpan. 2. Tingkat kedua disebut Data Mining Aplikasi dimana algoritma memproses data dan menyimpan hasilnya dalam database. 3. Tingkat ketiga adalah lapisan Front-End, yang memudahkan pengaturan parameter untuk Aplikasi Data Mining dan visualisasi hasil dalam bentuk ditafsirkan.
  • 3.
    MODEL DATA MINING . Menggunakan beberapavariabel untuk memprediksi sesuatu atau suatu nilai yang akan datang Prediction Methods Description Methods Mendapatkan pola penafsiran (human- interpretable patterns) untuk menjelaskan data.
  • 4.
    Prediksi Pemodelan Pemodelan prediktifadalah proses yang digunakan dalam analisis prediktif untuk membuat model statistik dari perilaku masa depan. Predictive analytics adalah bidang data mining yang bersangkutan dengan probabilitas peramalan dan tren. Sebuah model prediktif terdiri dari sejumlah prediksi, baik faktor variabel yang mungkin mempengaruhi perilaku masa depan atau hasil. Dalam pemasaran, misalnya, jenis kelamin pelanggan, usia, dan sejarah pembelian mungkin memprediksi kemungkinan penjualan masa depan. Pada pemodelan prediktif, data dikumpulkan untuk prediktor yang relevan, model statistik dirumuskan, prediksi yang dibuat dan model divalidasi (atau revisi) sebagai data tambahan telah tersedia. Model ini dapat menggunakan persamaan linier sederhana atau jaringan syaraf kompleks , dipetakan oleh perangkat lunak yang canggih. P emodelan prediktif digunakan secara luas dalam teknologi informasi. sistem penyaringan spam, misalnya, Dalam pemodelan prediktif kadang-kadang digunakan untuk mengidentifikasi kemungkinan bahwa pesan yang diberikan adalah spam.
  • 5.
    clustering Klasifikasi Decision treeAsosiasition R ule Deskriptif Pemodelan 10/ 25/ 2020 P ASKAM AR T OH ASU G IAN
  • 6.
    clustering adalah sebuahprosesuntuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satuclustermemilikitingkat kemiripan yang maksimumdan data antar clustermemilikikemiripanyang minimum. Metode clustering juga harusdapat mengukurkemampuannyasendiridalam usaha untuk menemukan suatu pola tersembunyi pada data yang sedang diteliti. Terdapat berbagai metode yang dapat digunakan untuk mengukur nilai kesamaan antar objek-objek yang dibandingkan clustering Suatu metode clustering harus mampu menangani data dalam jumlah yang besar. Saat ini data dalam jumlahbesar sudah sangat umumdigunakan dalam berbagai bidang misalnyasaja suatudatabase. Tidak hanya berisi ratusan objek, suatudatabase dengan ukuranbesar bahkan berisi lebih dari jutaan objek. 10/ 25/ 2020 P ASKAM AR T OH ASU G IAN
  • 7.
    Klasifikasi merupakan salahsatu topik utama dalam data mining atau machine learning. Klasifikasi adalah suatu proses penyajian data dimana data yang digunakan tersebut mempunyai kelas label atau target. Klasifikasi bertujuan untuk mengklasifikasikan item data menjadi satu dari beberapa kelas standar. Sebagai contoh, suatu program email dapat mengklasifikasikan email yang sah dengan email spam. Beberapa algoritma klasifikasi antara lain pohon keputusan, nearest neighbor, nave bayes, neural networks dan support vector machines. Classification merupakan teknik mengklasifikasikan data. Perbedaannya dengan metode clustering terletak pada data, dimana pada clustering variabel dependen tidak ada, sedangkan pada classification diharuskan ada variabel dependen. Contoh algoritma yang menggunakan metode ini ID3 dan K Nearest Neighbors dan lainnya. 10/ 25/ 2020 P ASKAM AR T OH ASU G IAN
  • 8.
    Decision tree Decision Tree(PohonKeputusan). Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat terkenal. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, pohon keputusan sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain 10/ 25/ 2020 P ASKAM AR T OH ASU G IAN
  • 9.
    Pembelajaran aturan asosiasimencari hubungan antara variabel. Sebagai contoh suatu toko mengumpulkan data kebiasaan pelanggan dalam berbelanja. Ketika menggunakan pembelajaran aturan asosiasi, toko tersebut dapat menentuan produk yang sering dibeli bersamaan dan menggunakan informasi ini untuk tujuan pemasaran. Asosiasition Rule Association (Asosiasi) merupakan teknik dalam data mining yang mempelajari hubungan antar data. Contoh penggunaannya seperti untuk menganalisis perilaku mahasiswa yang datang terlambat. jika mahasiswa memiliki jadwal dengan dosen A dan B , maka mahasiswa akan datang terlambat. 10/ 25/ 2020 P ASKAM AR T OH ASU G IAN
  • 10.