2. 1. Tingkat pertama adalah database tingkat di mana data dan metadata disiapkan dan disimpan.
2. Tingkat kedua disebut Data Mining Aplikasi dimana algoritma memproses data dan menyimpan
hasilnya dalam database.
3. Tingkat ketiga adalah lapisan Front-End, yang memudahkan pengaturan parameter untuk Aplikasi
Data Mining dan visualisasi hasil dalam bentuk ditafsirkan.
4. Prediksi Pemodelan
Pemodelan prediktif adalah proses yang
digunakan dalam analisis prediktif untuk
membuat model statistik dari perilaku
masa depan. Predictive analytics adalah
bidang data mining yang bersangkutan
dengan probabilitas peramalan dan tren.
Sebuah model prediktif terdiri dari
sejumlah prediksi, baik faktor variabel
yang mungkin mempengaruhi perilaku
masa depan atau hasil. Dalam
pemasaran, misalnya, jenis kelamin
pelanggan, usia, dan sejarah pembelian
mungkin memprediksi kemungkinan
penjualan masa depan.
Pada pemodelan prediktif, data
dikumpulkan untuk prediktor yang
relevan, model statistik dirumuskan,
prediksi yang dibuat dan model
divalidasi (atau revisi) sebagai data
tambahan telah tersedia. Model ini dapat
menggunakan persamaan linier
sederhana atau jaringan syaraf kompleks
, dipetakan oleh perangkat lunak yang
canggih.
Pemodelan prediktif digunakan secara
luas dalam teknologi informasi. Dalam
sistem penyaringan spam, misalnya,
pemodelan prediktif kadang-kadang
digunakan untuk mengidentifikasi
kemungkinan bahwa pesan yang
diberikan adalah spam.
6. clustering adalah sebuah proses untuk
mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga
data dalam satu cluster memiliki tingkat
kemiripan yang maksimum dan data
antar cluster memiliki kemiripan yang
minimum.
Metode clustering juga harus dapat
mengukur kemampuannya sendiri dalam
usaha untuk menemukan suatu pola
tersembunyi pada data yang sedang diteliti.
Terdapat berbagai metode yang dapat
digunakan untuk mengukur nilai kesamaan
antar objek-objek yang dibandingkan
Suatu metode clustering harus mampu
menangani data dalam jumlah yang besar.
Saat ini data dalam jumlah besar sudah
sangat umum digunakan dalam berbagai
bidang misalnya saja suatu database. Tidak
hanya berisi ratusan objek, suatu database
dengan ukuran besar bahkan berisi lebih
dari jutaan objek.
clustering
11/11/2021 PASKAMARTO HASUGIAN
7. 11/11/2021 PASKAMARTO HASUGIAN
Klasifikasi merupakan salah satu topik utama dalam data
mining atau machine learning. Klasifikasi adalah suatu
proses penyajian data dimana data yang digunakan
tersebut mempunyai kelas label atau target.
Klasifikasi bertujuan untuk mengklasifikasikan item data
menjadi satu dari beberapa kelas standar. Sebagai
contoh, suatu program email dapat mengklasifikasikan
email yang sah dengan email spam. Beberapa algoritma
klasifikasi antara lain pohon keputusan, nearest neighbor,
nave bayes, neural networks dan support vector machines.
Classification merupakan teknik mengklasifikasikan data.
Perbedaannya dengan metode clustering terletak pada data,
dimana pada clustering variabel dependen tidak ada,
sedangkan pada classification diharuskan ada variabel
dependen. Contoh algoritma yang menggunakan metode ini ID3
dan K Nearest Neighbors dan lainnya.
8. 11/11/2021 PASKAMARTO HASUGIAN
Decision tree
Decision Tree (Pohon Keputusan). Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat terkenal. Metode
pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan
Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel
input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, pohon
keputusan sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari
beberapa teknik lain
9. 11/11/2021 PASKAMARTO HASUGIAN
Asosiasition Rule
Pembelajaran aturan asosiasi mencari hubungan antara variabel. Sebagai contoh suatu toko mengumpulkan data kebiasaan
pelanggan dalam berbelanja. Ketika menggunakan pembelajaran aturan asosiasi, toko tersebut dapat menentuan produk
yang sering dibeli bersamaan dan menggunakan informasi ini untuk tujuan pemasaran.
Association (Asosiasi) merupakan teknik dalam data mining yang mempelajari hubungan antar data. Contoh
penggunaannya seperti untuk menganalisis perilaku mahasiswa yang datang terlambat. jika mahasiswa memiliki jadwal
dengan dosen A dan B, maka mahasiswa akan datang terlambat.