PREDIKSI 
Metode Data Mining 
1 
Data Warehouse & Data Mining 
oleh 
Aty Rachmawati 
Aini Hanifa 
Ridwan Effendi
Outline 
Metode Prediksi 
◦Analisis Regresi 
◦CART 
Penerapan di BI 
Implementasi Tools 
2 
Data Warehouse & Data Mining
Klasifikasi vs Prediksi 
KLASIFIKASI 
PREDIKSI 
Memprediksi label kategorik (diskrit & tak terurut) 
Prediksi Kategorik 
Memprediksi label numerik (kontinu & terurut) 
Prediksi Numerik 
3 
Data Warehouse & Data Mining 
Baik/Buruk 
Tipe A/B/C 
Aman/Berisiko 
Seberapa aman? 
Seberapa berisiko? 
Berapa jumlah pendapatan?
Prediksi Numerik 
Prediksikan 
berapa besar penghasilan yang akan diterima karyawan dengan masa kerja 15 tahun 
Data Warehouse & Data Mining 
4 
Contoh: 
Diberikan data berikut
Regresi Linear 
Regresi Nonlinear 
Model berbasis regresi lainnya 
◦CART (Classification and Regression Tree) 
Metode Prediksi Numerik 
5 
Data Warehouse & Data Mining 
Regresi Linear 
Regresi Nonlinear 
Model berbasis regresi lainnya 
•CART(Classification and Regression Tree)
Analisis Regresi 
Memodelkan hubungan antara satu atau lebih variabel prediktor (independent var.) dan sebuah variabel respons (dependent var.) 
•Regresi Linear Sederhana 
•Regresi Linear Multivariabel 
•Regresi Nonlinear 
6 
Data Warehouse & Data Mining
Contoh Regresi Linear 
Data Warehouse & Data Mining 
7 
Tujuan: mencari persamaan linier (garis lurus) terbaik yang menggambarkan data di atas.
Metode Least Square 
Data Warehouse & Data Mining 
8 
}풆풏 
} 풆ퟒ 
} 풆ퟑ 
} 풆ퟐ 
} 풆ퟏ 
푦=푤1푥+푤0 
Metode untuk meminimalkan error titik data terhadap model regresi 
Luaran: Koefisien regresi
Regresi Nonlinear 
Menerapkan transformasi pada variabel- variabel menjadi model regresi linear 
Contoh: 
푌=푒푤1푥+푤0 
ln(푌)=푤1푥+푤0 
9 
Data Warehouse & Data Mining
CART 
Classification Tree 
Regression Tree 
Data Warehouse & Data Mining 
10
Penerapan di BI (lanj) 
Memprediksi gaji lulusan perguruan tinggi dengan x tahun pengalaman kerja 
11 
Data Warehouse & Data Mining
Penerapan di BI (lanj) 
12 
 Memprediksi berapa lama waktu yang 
diperlukan untuk mengantarkan pesanan 
berikutnya dengan jarak sekian kilometer 
Jarak 
(km) 
Waktu 
(menit) 
0,5 9,95 
1,1 24,45 
1,2 31,75 
5,5 35 
2,95 25,02 
2 16,86 
3,75 14,38 
Data Warehouse & Data Mining
Penerapan di BI (lanj) 
Memprediksi kemajuan syaraf motorik dan skor total dari orang yang mengalami penyakit parkinson stadium awal dengan pengukuran suara biomedis 
13 
Data Warehouse & Data Mining
Deskripsi Data 
Data kriminalitas US 1995 (FBI) 
Variabel Respon :total number of violent crimes per 100K popuation 
Data Warehouse & Data Mining 
14
Model Prediksi 
Why? 
CART dapat melakukan model prediksi yang memiliki variable respon kontinu 
Sederhana, mudah dipahami 
Variable prediktor kategorik dan kontinu 
Data Warehouse & Data Mining 
15
Pra Prosesing Data 
Seleksi atribut 
Missing value 
Data Warehouse & Data Mining 
16
Hasil Prediksi 
Root Mean Square Error= 480.706823727564 
Mean Absolute Error= 315.266224317104 
Relative Absolute Error= 0.796029235366585 
Data Warehouse & Data Mining 
17

Prediksi numerik

  • 1.
    PREDIKSI Metode DataMining 1 Data Warehouse & Data Mining oleh Aty Rachmawati Aini Hanifa Ridwan Effendi
  • 2.
    Outline Metode Prediksi ◦Analisis Regresi ◦CART Penerapan di BI Implementasi Tools 2 Data Warehouse & Data Mining
  • 3.
    Klasifikasi vs Prediksi KLASIFIKASI PREDIKSI Memprediksi label kategorik (diskrit & tak terurut) Prediksi Kategorik Memprediksi label numerik (kontinu & terurut) Prediksi Numerik 3 Data Warehouse & Data Mining Baik/Buruk Tipe A/B/C Aman/Berisiko Seberapa aman? Seberapa berisiko? Berapa jumlah pendapatan?
  • 4.
    Prediksi Numerik Prediksikan berapa besar penghasilan yang akan diterima karyawan dengan masa kerja 15 tahun Data Warehouse & Data Mining 4 Contoh: Diberikan data berikut
  • 5.
    Regresi Linear RegresiNonlinear Model berbasis regresi lainnya ◦CART (Classification and Regression Tree) Metode Prediksi Numerik 5 Data Warehouse & Data Mining Regresi Linear Regresi Nonlinear Model berbasis regresi lainnya •CART(Classification and Regression Tree)
  • 6.
    Analisis Regresi Memodelkanhubungan antara satu atau lebih variabel prediktor (independent var.) dan sebuah variabel respons (dependent var.) •Regresi Linear Sederhana •Regresi Linear Multivariabel •Regresi Nonlinear 6 Data Warehouse & Data Mining
  • 7.
    Contoh Regresi Linear Data Warehouse & Data Mining 7 Tujuan: mencari persamaan linier (garis lurus) terbaik yang menggambarkan data di atas.
  • 8.
    Metode Least Square Data Warehouse & Data Mining 8 }풆풏 } 풆ퟒ } 풆ퟑ } 풆ퟐ } 풆ퟏ 푦=푤1푥+푤0 Metode untuk meminimalkan error titik data terhadap model regresi Luaran: Koefisien regresi
  • 9.
    Regresi Nonlinear Menerapkantransformasi pada variabel- variabel menjadi model regresi linear Contoh: 푌=푒푤1푥+푤0 ln(푌)=푤1푥+푤0 9 Data Warehouse & Data Mining
  • 10.
    CART Classification Tree Regression Tree Data Warehouse & Data Mining 10
  • 11.
    Penerapan di BI(lanj) Memprediksi gaji lulusan perguruan tinggi dengan x tahun pengalaman kerja 11 Data Warehouse & Data Mining
  • 12.
    Penerapan di BI(lanj) 12  Memprediksi berapa lama waktu yang diperlukan untuk mengantarkan pesanan berikutnya dengan jarak sekian kilometer Jarak (km) Waktu (menit) 0,5 9,95 1,1 24,45 1,2 31,75 5,5 35 2,95 25,02 2 16,86 3,75 14,38 Data Warehouse & Data Mining
  • 13.
    Penerapan di BI(lanj) Memprediksi kemajuan syaraf motorik dan skor total dari orang yang mengalami penyakit parkinson stadium awal dengan pengukuran suara biomedis 13 Data Warehouse & Data Mining
  • 14.
    Deskripsi Data Datakriminalitas US 1995 (FBI) Variabel Respon :total number of violent crimes per 100K popuation Data Warehouse & Data Mining 14
  • 15.
    Model Prediksi Why? CART dapat melakukan model prediksi yang memiliki variable respon kontinu Sederhana, mudah dipahami Variable prediktor kategorik dan kontinu Data Warehouse & Data Mining 15
  • 16.
    Pra Prosesing Data Seleksi atribut Missing value Data Warehouse & Data Mining 16
  • 17.
    Hasil Prediksi RootMean Square Error= 480.706823727564 Mean Absolute Error= 315.266224317104 Relative Absolute Error= 0.796029235366585 Data Warehouse & Data Mining 17