Pemodelan Data Mining
Data to Knowledge
Data Mining Models
Model Regresi
Model Regresi
Regresi
• Regresi adalah proses untuk
memprediksi nilai kontinu
variable terikat.
• Linier jika hubungan antara
variabel bebas dan terikat
adalah linier
• Non-linier jika jika hubungan
antara variabel bebas dan
terikat adalah non-linier
Model Regresi
Linier, terhubung kuat Linier, terhubung lemah
Hubungan antarvariabel
Linier, kuat Linier, Lemah Non-Linier
Regresi Linier
Koefisien korelasi
Contoh cara menerapkan regresi linier
untuk prediksi CO2 berdasarkan ukuran mesin
x1 (Ukuran Mesin)
Y
(Emisi
CO2)
Plot Data Y vs X
𝑦 = 𝜃0 + 𝜃1 𝑥1
Variabel prediksi
Perpotongan sumbu y gradien
Koefisien garis
Variabel bebas
tunggal
Bagaimana mencari nilai 𝜃0 dan 𝜃1 ?
Estimasi parameter 𝜃0 dan 𝜃1 (𝒎𝒂𝒕𝒆𝒎𝒂𝒕𝒊𝒔)
Prediksi CO2 berdasarkan Ukuran Mesin
Evaluasi Akurasi Regresi
𝑅𝑀𝑆𝐸 =
1
𝑛
𝑗=1
𝑛
𝑦𝑗 − 𝑦𝑗
2
Root Mean Squared Error:
𝑀𝐴𝐸 =
1
𝑛
𝑗=1
𝑛
𝑦𝑗 − 𝑦𝑗
Mean Absolute Error:
Mencerminkan rata-rata error.
𝑀𝑆𝐸 =
1
𝑛
𝑗=1
𝑛
𝑦𝑗 − 𝑦𝑗
2
Mean Squared Error:
Populer karena lebih mengutama
error yang besar.
Error
Pendekatan Evaluasi (Train/Test Split)
prepared
data
reserved test
data
learning data model candidate
selected
algorithm
learning
process
model selection
model refinement
feature selection
model tuning
model
evaluation
model
implementation
Pendekatan Evaluasi (Train/Test Split)
Aplikasi Regresi
• Prediksi Nilai Penjualan per tahun seseorang
• Berdasarkan umur, pendidikan dan pengalaman seorang sales
• Analisis kepuasan pelanggan
• Berdasarkan demografi dan faktor psikologis pelanggan
• Estimasi Harga Rumah
• Berdasarkan luas, jumlah kamar dll
• Gaji Karyawan
• Berdasarkan jenis pekerjaan, pendidikan, jenis kelamin, umur, pengalaman
kerja dll.

08-Model deep learning menggunakan Regresi.pdf