SlideShare a Scribd company logo
1 of 37
Linear Regression
Irwansyah Saputra, S.Kom., M.Kom., MTA
Founder of Multinity Indonesia
Tentang Saya
• Irwansyah Saputra
• Dosen Ilmu Komputer
• Mahasiswa S3 Ilmu Komputer IPB University
• Bidang Kajian: Computational Intelligence &
Optimization (Data mining, machine
learning, artificial intelligence)
Halo semuanya, saya suka belajar tentang
segala hal dan suka berbagi pengetahuan. Saya
juga sering menjadi pembicara di berbagai
seminar.
Kontak yang bisa dihubungi:
WhatsApp: 0895323302241
Instagram: @irwansight_
Web: https://irw.one
Disclaimer
Materi ini digunakan sebagai bahan ajar Program Data Mining di
Multinity.id
Silakan gunakan, mohon untuk tidak mengubah template.
Jika Anda memiliki kesulitan dalam memahami materi pada slide
ini, silakan belajar di Multinity.id
Referensi
1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third
Edition, Elsevier, 2012
2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning
Tools and Techniques 3rd Edition, Elsevier, 2011
3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and
Business Analytics Applications, CRC Press Taylor & Francis Group, 2014
4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining,
John Wiley & Sons, 2005
5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014
6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer,
2011
7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook
Second Edition, Springer, 2010
8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining
of Enterprise Data: Algorithms and Applications, World Scientific, 2007
9. Suyanto, DATA MINING: Untuk klasifikasi dan klasterisasi data, Penerbit
Informatika, 2017
Linear Regression
• Regresi adalah analisis statistika yang digunakan untuk menganalisis
dan memahami hubungan antara dua variabel atau lebih.
• Perbedaannya dengan klasifikasi, regresi merupakan prediksi
dengan target yang memiliki tipe data numerik, sedangkan
klasifikasi melakukan prediksi atau pengelompokkan data dengan
target tipe data kategorik.
• Dalam regresi terdapat dua jenis variabel yaitu variabel independen
dan dependen.
Linear Regression
• Variabel independen adalah variabel yang berfungsi sebagai
prediktor atau faktor-faktor yang mempengaruhi target. Contohnya
dalam dataset calon penerima beasiswa, variabel independen
seperti gaji orang tua, nilai IPK, jarak rumah dan lain sebagainya.
• Variabel dependen adalah variabel target yang akan dijadikan
prediksi. Pada contoh dataset calon penerima beasiswa, variabel
dependen adalah keterangan yang berisi “diterima” atau “ditolak”.
• Biasanya regresi memiliki satu variabel dependen dan memiliki lebih
dari satu variabel independen.
• Hubungan bersifat statistik, bukan deterministik.
Linear Regression
• Misalnya pada dataset nilai.csv , terdapat hubungan linear (searah)
antara jam belajar dengan harga nilai yang didapatkan.
Kalau jumlah jam belajarnya adalah
6.5 jam, berapakah nilai yang
didapatkan?
Linear Regression
• Rumus regresi secara umum adalah:
𝑌 = 𝑓 𝑥
Keterangan:
• 𝑌 = variabel dependen. Dalam kasus ini adalah nilai.
• 𝑥 = variabel independen. Dalam kasus ini adalah jumlah jam.
• Kinerja linear regression dapat diukur dengan beberapa pendekatan yaitu
Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Mean
Square Error (MSE), Root Mean Square Error (RMSE), R-squared values, dan
Adjusted R-squared values.
Single Linear Regression
Irwansyah Saputra, S.Kom., M.Kom., MTA
Founder of Multinity Indonesia
Single Linear Regression
• Sesuai dengan namanya, SLR adalah metode sederhana karena terdiri dari
satu variabel independen (X) yang akan memprediksi variabel dependen (Y).
Rumus SLR adalah:
𝑌 = 𝛽0 + 𝛽1𝑋
Keterangan:
• 𝑌 = Variabel terikat (Dependen)
• 𝑋 = Variabel tidak terikat (Independen)
• 𝛽0 = Konstanta, perpotongan garis regresi dengan sumbu Y (nilai estimasi
jika x = 0).
• 𝛽1 = Koefisien regresi (kemiringan); besaran Response yang ditimbulkan
oleh variabel.
Single Linear Regression
• Tahapan dalam melakukan teknik SLR adalah:
 Mencari apakah ada hubungan antara variabel x dan y.
 Menentukan variabel independen (x) dan variabel dependen (y).
 Membuat scatter plot dari variabel x dan y.
 Terlihat gambaran yang didapatkan dari scatter plot, apakah terbentuk
hubungan yang linear? jika ya, maka model regresinya adalah regresi linear
sederhana, kalau tidak linear dapat dicari regresinya.
 Menghitung a dan b.
 Menghitung Ŷ = b_0 + bX, dimana Ŷ = estimasi harga y jika x disubstitusikan
ke dalam persamaan regresi.
 Membuat garis Ŷ = b_0 + b_1 X pada sumbu x dan y.
Contoh Kasus
• Kasus yang akan kita gunakan adalah hubungan antara jam belajar terhadap nilai siswa di
suatu sekolah.
• Jumlah jam belajar diwakili oleh variabel independen bernama “Hours”, sedangkan nilai
siswa diwakili oleh variabel dependen bernama “Scores”. Rincian datasetnya dapat dilihat
sebagai berikut:
Hours 3 5 3 9 4 2 9 6 8 3 8 6 5 3 1
Scores 21 47 27 75 30 20 88 60 81 25 85 62 41 42 17
Penyelesaian
• Jika kita melihat adanya hubungan dua
variabel tersebut, lanjutkan dengan
rumus:
𝑏0 =
𝛴𝑦 𝛴𝑥2
– 𝛴𝑥 𝛴𝑥𝑦
𝑛 𝛴𝑥2 − 𝛴𝑥2
𝑏1 =
𝑛 𝛴𝑥𝑦 – 𝛴𝑥 𝛴𝑦
𝑛 𝛴𝑥2 − 𝛴𝑥2
• Untuk memudahkan perhitungan,
langkah yang harus kita lakukan adalah
mengkuadratkan tiap variabel menjadi
seperti pada tabel berikut:
Hours (x) Scores (y) X2 y2 x.y
2.5 21 6.25 441 52.5
3.2 27 10.24 729 86.4
8.5 75 72.25 5625 637.5
3.5 30 12.25 900 105
1.5 20 2.25 400 30
5.5 60 30.25 3600 330
2.7 25 7.29 625 67.5
7.7 85 59.29 7225 654.5
5.9 62 34.81 3844 365.8
4.5 41 20.25 1681 184.5
3.3 42 10.89 1764 138.6
1.1 17 1.21 289 18.7
49.9 505 267.23 27123 2671
Penyelesaian
• Kemudian masukkan nilai-nilai tersebut ke dalam rumus yang sudah
disediakan sebagai berikut:
• Sehingga kita mendapatkan persamaan baru yaitu:
Ŷ = 𝑏0 + 𝑏1𝑋
Ŷ = 2.327520056 + 9.560516219𝑋
𝑏0 =
𝛴𝑦 𝛴𝑥2
– 𝛴𝑥 𝛴𝑥𝑦
𝑛 𝛴𝑥2 − 𝛴𝑥 2
=
505 267.23 − 49.9 2671
12 267.23 − 49.9 2
= 2.327520056
𝑏1 =
𝑛 𝛴𝑥𝑦 – 𝛴𝑥 𝛴𝑦
𝑛 𝛴𝑥2 − 𝛴𝑥 2
=
12 4392.6 − 72.5 721
15 446.77 − 49.9 2
= 9.560516219
Penyelesaian
Ŷ = 𝑏0 + 𝑏1𝑋
Ŷ = 2.327520056 + 9.560516219𝑋
• Nilai a merupakan intercept, yaitu koefisien yang dimiliki model regresi kita.
Artinya untuk setiap X nol (siswa yang tak belajar sama sekali) ia akan
mendapatkan nilai sebesar 2.327520056.
• Sedangkan b merupakan slope, yaitu kemiringan gradien model regresi kita.
Artinya adalah setiap siswa menambahkan waktu belajar sebanyak 1 jam,
maka nilainya akan bertambah sebanyak 9.560516219.
Penyelesaian
• Setelah kita pahami maksudnya, sekarang saatnya untuk
menggunakan hasil persamaan tersebut pada data uji yang tersisa
yaitu sebagai berikut:
Hours
(x)
Scores
(y)
Persamaan Predicted (Ŷ)
5.1 47 2.327520056 + 9.560516219 5.1 51.08615
9.2 88 2.327520056 + 9.560516219 9.2 90.28427
8.3 81 2.327520056 + 9.560516219 8.3 81.6798
Analisis Residual
• Residual adalah nilai selisih antara nilai aktual dan nilai prediksi.
• residu adalah nilai kuantitatif yang tidak bisa dijelaskan oleh model dan
bersifat acak.
Ŷ = 2.327520056 + 9.560516219𝑋
Hours (x) Scores (y) Predicted (Ŷ) Residual
5.1 47 51.08615 -4.08615
9.2 88 90.28427 -2.28427
8.3 81 81.6798 -0.6798
Analisis Heteroskedastisitas dan
Homoskedastisitas
• Heteroskedastisitas adalah keadaan dimana nilai residu masih memiliki pola
hubungan linear yang kuat dengan variabel independennya.
• Kebalikan dari heteroskedastisitas adalah homoskedastisitas.
(a)
Heteroskedastisitas
(b)
Heteroskedastisitas
(c)
Homoskedastisitas
Analisis Heteroskedastisitas dan
Homoskedastisitas
• “fungsi dari heteroskedastisitas dan homoskedastisitas itu apa? Dan mana
yang harus dihindari dalam analisis regresi linear?”
• Heteroskedastisitas harus dihindari karena nilai residu terikat pada nilai
prediksi. Padahal seharusnya nilai residu bersifat acak dan konstan.
Contohnya, variabel Scores selain diprediksi oleh Hours, juga diprediksi oleh
residu (variabel selain Scores). Sehingga besarnya residu pada tiap siswa
seharusnya bersifat acak.
• Pada kasus ini, yang terjadi adalah homoskedastisitas.
Analisis Mean Absolute Error (MAE)
• Fungsinya untuk menunjukkan nilai kesalahan rata-rata yang error dari nilai
aktual dan nilai prediksi. Rumus MAE dapat dilihat sebagai berikut:
𝑀𝐴𝐸 =
Ŷ − 𝑌
𝑛
Keterangan:
• Ŷ = nilai prediksi
• 𝑌 = nilai aktual
• 𝑛 = jumlah data
• Semakin kecil nilai MAE, artinya semakin bagus model regresi yang dibuat.
Karenanya, MAE sering digunakan untuk mengevaluasi hasil model regresi
karena kemudahan penggunaannya dan menghasilkan perhitungan yang
sangat informatif.
Hours (x) Scores (y)
Predicted
(Ŷ)
Residual |Ŷ-Y|
5.1 47 51.08615 -4.08615 4.08615
9.2 88 90.28427 -2.28427 2.28427
8.3 81 81.6798 -0.6798 0.6798
MAE: 2.350073
Analisis Mean Square Error (MSE)
• MSE memiliki perbedaan sedikit dengan MAE, yaitu adanya fungsi kuadratik
pada perhitungan sehingga didapatkan rumus berikut:
𝑀𝑆𝐸 =
Ŷ − 𝑌
2
𝑛
Keterangan:
• Ŷ = nilai prediksi
• 𝑌 = nilai aktual
• 𝑛 = jumlah data
Hours (x) Scores (y) Predicted (ŷ) Residual (Ŷ-Y)2
5.1 47 51.08615 -4.08615 16.69662
9.2 88 90.28427 -2.28427 5.217889
8.3 81 81.6798 -0.6798 0.462128
MSE: 7.45888
Analisis Mean Square Error (MSE)
• Pertanyaannya mungkin sederhana, “Kapan kita menggunakan MAE dan
MSE?”
 Apakah data kita memiliki nilai outlier? Jika ya, maka gunakan MAE untuk
menghitung evaluasinya.
 Apakah kita yakin bahwa data tersebut adalah nilai outlier? Jika ya, maka
gunakan MAE.
 Apakah kita memiliki data yang tak terduga dan perlu perhatian khusus? Jika
ya, maka gunakan MSE.
Analisis Root Mean Square Error (RMSE)
• Secara teknis, RMSE hanya melakukan akar kuadrat terhadap hasil dari MSE.
• Namun justru dampaknya jadi sangat terlihat, karena angka berlipat ganda
yang dihasilkan oleh MSE menjadi normal kembali akibat RMSE. Rumusnya
adalah:
𝑅𝑀𝑆𝐸 = 𝑀𝑆𝐸 =
Ŷ − 𝑌
2
𝑛
Hours (x) Scores (y) Predicted (ŷ) Residual (Ŷ-Y)2
5.1 47 51.08615 -4.08615 16.69662
9.2 88 90.28427 -2.28427 5.217889
8.3 81 81.6798 -0.6798 0.462128
MSE: 7.45888
RMSE: 2.731095
Analisis Root Mean Square Error (RMSE)
 MAE dan RMSE merupakan teknik evaluasi mencari rata-rata error pada
model regresi, sehingga secara default keduanya bisa digunakan dalam kasus
regresi.
 Jika kita memiliki kasus yang di dalamnya terdapat nilai outlier, maka
menggunakan MAE lebih baik dari pada RMSE.
 Jika kita ingin membandingkan dua model regresi yang berbeda, maka
gunakan RMSE untuk mengevaluasinya.
Analisis Mean Absolute Percentage
Error (MAPE)
• Analisis Mean Absolute Percentage Error (MAPE) digunakan untuk mengukur
keakuratan model regresi yang kita buat dalam melakukan prediksi.
Rumusnya:
𝑀𝐴𝑃𝐸 =
1
𝑛𝑖=1
𝑛 𝑌𝑖 − Ŷ𝑖
𝑌𝑖
× 100%
Keterangan:
• 𝑛 = jumlah data
• 𝑌𝑖 = nilai data aktual sebanyak i .
• Ŷ𝑖 = nilai data prediksi sebanyak i.
Analisis R Square Value
• Ukuran nilai persentase MAPE:
• Berdasarkan perhitungan tersebut, kita bisa melihat hasil MAPE adalah ±
4.04%. Artinya model regresi yang kita buat memiliki keakuratan yang sangat
tinggi dalam memprediksi nilai baru.
Nilai MAPE Keterangan
≤ 10 Hasil prediksi sangat akurat
10 - 20 Hasil prediksi baik
20 - 50 Hasil prediksi layak (cukup baik)
> 50 Hasil prediksi tidak akurat
Hours (x) Scores (y) Predicted (ŷ) Residual |Ŷ-Y|/Y*100
5.1 47 51.08615 -4.08615 8.69393617
9.2 88 90.28427 -2.28427 2.595761364
8.3 81 81.6798 -0.6798 0.839259259
MAPE: 4.042985598
Analisis R Square Value
• R square (R2) merupakan nilai yang berkisar dari 0 – 1 untuk menjelaskan
besarnya kombinasi/variasi dari variabel independen terhadap variabel
dependen.
• Semakin tinggi nilai R2, maka semakin bagus model yang kita buat.
• Contohnya, jika kita memiliki model dengan nilai R2 = 0.97, artinya 97% dari
variabel dependen dapat dijelaskan oleh variabel independen.
𝑅2
= 1 −
𝑆𝑢𝑚 𝑆𝑞𝑢𝑎𝑟𝑒 𝐸𝑟𝑟𝑜𝑟
𝑆𝑢𝑚 𝑆𝑞𝑢𝑎𝑟𝑒 𝑇𝑜𝑡𝑎𝑙
= 1 −
𝑌𝑖 − Ŷ𝑖
2
𝑌𝑖 − Ȳ𝑖
2
Keterangan:
• 𝑌𝑖 = nilai data aktual sebanyak i .
• Ŷ𝑖 = nilai data prediksi sebanyak i.
• Ȳ𝑖 = nilai mean dari Y. Pada kasus ini nilainya adalah 72.
Analisis R Square Value
• Jika kita implementasikan pada kasus kita, maka hasilnya adalah sebagai berikut:
𝑅2
= 1 −
𝑌𝑖 − Ŷ𝑖
2
𝑌𝑖 − Ȳ𝑖
2
𝑅2
= 1 −
962
22.3766393
𝑅2
= 0.97673946
Scores (y) Predicted (ŷ) (Ŷ-Y) (Ŷ-Y)2 Y- Ȳ (Y- Ȳ)2
47 51.08615 -4.08615 16.69662 -25 625
88 90.28427 -2.28427 5.217889 16 256
81 81.6798 -0.6798 0.462128 9 81
SUM 216 223.05022 -7.05022 22.37664 0 962
Mean 72 74.35007333 -2.35007 7.45888 0 320.6666667
R Square: 0.97673946
Multi Class Linear
Regression
Irwansyah Saputra, S.Kom., M.Kom., MTA
Founder of Multinity Indonesia
Multi Class Linear Regression
• MLR digunakan untuk kasus yang memiliki atribut independen lebih dari satu.
• Contohnya, jika pada SLR terdapat kaitan antara jam belajar siswa terhadap nilai
yang didapatkan, maka pada MLR atribut pendukung yang mempengaruhi nilai
siswa tidak hanya jam belajar, bisa juga fasilitas yang dimiliki.
• Fasilitas tersebut adalah variabel independen baru yang mempengaruhi nilai siswa.
• Rumusnya adalah:
𝑌 = 𝛽0 + 𝛽1𝑋1 + ⋯ + 𝛽𝑛𝑋𝑛
• Keterangan:
• 𝑌 = Variabel terikat (Dependen)
• 𝑋 = Variabel tidak terikat (Independen)
• 𝛽0 = Konstanta, perpotongan garis regresi dengan sumbu Y (nilai estimasi jika x = 0).
• 𝛽1 = Koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh variabel.
• 𝑛 = Banyaknya data yang dihitung.
Contoh Kasus
• Kasus yang akan kita gunakan kali ini adalah dataset perpustakaan yang terdiri
dari dua variabel independen dan satu variabel dependen. Berikut rinciannya:
Nama Variabel Jenis Variabel Simbol
jumlah pengunjung per bulan Dependen Y
jumlah buku baru per bulan Independen X1
jumlah member perpustakaan Independen X2
Y 23 7 15 17 23 22 10 14 20 19
X1 10 2 4 6 8 7 4 6 7 6
X2 7 3 2 4 6 5 3 3 4 3
Contoh Kasus
• Kemudian kita buat tabel
bantu untuk memudahkan
dalam perhitungan. Teknik
yang digunakan sama persis
dengan SLR pada
pembahasan sebelumnya.
Hasilnya dapat kita lihat
sebagai berikut:
Tangg
al
Y X1 X2 X1Y X2Y X1X2 X1
2 X2
2
1 23 10 7 230 161 70 100 49
2 7 2 3 14 21 6 4 9
3 15 4 2 60 30 8 16 4
4 17 6 4 102 68 24 36 16
5 23 8 6 184 138 48 64 36
6 22 7 5 154 110 35 49 25
7 10 4 3 40 30 12 16 9
8 14 6 3 84 42 18 36 9
9 20 7 4 140 80 28 49 16
10 19 6 3 114 57 18 36 9
Σ ΣY ΣX1 ΣX2 ΣX1Y ΣX2Y ΣX1X2 ΣX1
2 ΣX2
2
Jumla
h
170 60 40 1122 737 267 406 182
Contoh Kasus
• Selanjutnya, kita buat matriks A dan matriks H dengan rumus sebagai berikut:
𝐴 =
𝑛
𝑋1
𝑋2
𝑋1
𝑋1
2
𝑋1 𝑋2
𝑋2
𝑋1 𝑋2
𝑋2
2
𝐻 =
Y
𝑋1𝑌
𝑋2𝑌
Keterangan:
• 𝑛 = jumlah data yang dimiliki yaitu 10.
𝐴 =
10
60
40
60
406
267
40
267
182
𝐻 =
170
1122
737
Penyelesaian
• Selanjutnya kita akan membuat matriks untuk A1, A2 dan A3 . Caranya adalah
mengubah satu kolom dengan matriks H. Rinciannya sebagai berikut:
 Untuk matriks A1, salin kolom matriks A, lalu ganti kolom pertama dengan matriks H.
 Untuk matriks A2, salin kolom matriks A, lalu ganti kolom kedua dengan matriks H.
 Untuk matriks A3, salin kolom matriks A, lalu ganti kolom ketiga dengan matriks H.
• Seluruh matriks akan berubah menjadi:
𝐴1 =
170
1122
737
60
406
267
40
267
182
𝐴2 =
10
60
40
170
1122
737
40
267
182
𝐴3 =
10
60
40
60
406
267
170
1122
737
10
60
40
60
406
267
40
267
182
10
60
40
60
406
267
Penyelesaian
• Setelah itu, kita akan menentukan matriks b1, b2 dan b3. Rumusnya adalah:
𝑏1 =
det(𝐴1)
det 𝐴
𝑏2 =
det(𝐴2)
det 𝐴
𝑏3 =
det(𝐴3)
det 𝐴
• Karena nilai determinan dari setiap matriks belum ada, maka kita harus mencarinya
terlebih dahulu dengan cara:
(2 Kolom
pertama
Matriks A)
(Matriks A)
Keterangan:
• (+) Garis Diagonal ditarik dari atas ke bawah
• (-) Garis Diagonal datarik dari bawah ke atas
Penyelesaian
• Hasil perhitungannya dapat dilihat sebagai berikut:
𝐷𝑒𝑡 𝐴
= 10 ∗ 406 ∗ 182 + 60 ∗ 267 ∗ 40 + 40 ∗ 60 ∗ 267 − 40 ∗ 406 ∗ 40
− 267 ∗ 267 ∗ 10 − 182 ∗ 60 ∗ 60
𝐷𝑒𝑡 𝐴 = 2830
𝐷𝑒𝑡 𝐴1 = 11570
𝐷𝑒𝑡 𝐴2 = 6610
𝐷𝑒𝑡 𝐴3 = −780
• Setelah kita mendapatkan determinannya, masukkan nilai tersebut ke dalam rumus
tadi:
𝑏1 =
det(𝐴1)
det 𝐴
=
11570
2830
= 4,08834
𝑏2 = 2,3356
𝑏3 = −0,27562
Analisis
• Analisis MSE, RMSE, MAE, Rsquare dapat dilakukan dengan rumus yang sudah
dijelaskan pada sesi Single Linear Regression.

More Related Content

What's hot

Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifierIrwansyahSaputra1
 
Statistika parametrik_teknik analisis regresi
Statistika parametrik_teknik analisis regresiStatistika parametrik_teknik analisis regresi
Statistika parametrik_teknik analisis regresiM. Jainuri, S.Pd., M.Pd
 
Tugas mandiri struktur data
Tugas mandiri struktur dataTugas mandiri struktur data
Tugas mandiri struktur dataAsep Jaenudin
 
Metode simpleks dua fase
Metode simpleks dua faseMetode simpleks dua fase
Metode simpleks dua fasespecy1234
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasiIrwansyahSaputra1
 
Peubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinuPeubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinuAnderzend Awuy
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Miningdedidarwis
 
Peluang dan Distribusi Peluang
Peluang dan Distribusi PeluangPeluang dan Distribusi Peluang
Peluang dan Distribusi Peluangbagus222
 
Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010
Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010
Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010eddie Ismantoe
 
ALJABAR LINEAR ELEMENTER
ALJABAR LINEAR ELEMENTERALJABAR LINEAR ELEMENTER
ALJABAR LINEAR ELEMENTERMella Imelda
 
Modul2 metode regula falsi praktikum metode numerik
Modul2 metode regula falsi praktikum metode numerikModul2 metode regula falsi praktikum metode numerik
Modul2 metode regula falsi praktikum metode numerikJames Montolalu
 
Metode numerik persamaan non linier
Metode numerik persamaan non linierMetode numerik persamaan non linier
Metode numerik persamaan non linierIzhan Nassuha
 
Pertemuan 02 teori dasar himpunan
Pertemuan 02   teori dasar himpunanPertemuan 02   teori dasar himpunan
Pertemuan 02 teori dasar himpunanFajar Istiqomah
 
Contoh soal Metode Simpleks
Contoh soal Metode SimpleksContoh soal Metode Simpleks
Contoh soal Metode SimpleksReza Mahendra
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Adam Mukharil Bachtiar
 
STANDARD SCORE, SKEWNESS & KURTOSIS
STANDARD SCORE, SKEWNESS & KURTOSISSTANDARD SCORE, SKEWNESS & KURTOSIS
STANDARD SCORE, SKEWNESS & KURTOSISErmawati Syahrudi
 

What's hot (20)

Modul VEKTOR
Modul VEKTORModul VEKTOR
Modul VEKTOR
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
 
Statistika parametrik_teknik analisis regresi
Statistika parametrik_teknik analisis regresiStatistika parametrik_teknik analisis regresi
Statistika parametrik_teknik analisis regresi
 
Tugas mandiri struktur data
Tugas mandiri struktur dataTugas mandiri struktur data
Tugas mandiri struktur data
 
Metode simpleks dua fase
Metode simpleks dua faseMetode simpleks dua fase
Metode simpleks dua fase
 
Data mining 4 konsep dasar klasifikasi
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasi
 
Peubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinuPeubah acak diskrit dan kontinu
Peubah acak diskrit dan kontinu
 
Proses Data Mining
Proses Data MiningProses Data Mining
Proses Data Mining
 
Peluang dan Distribusi Peluang
Peluang dan Distribusi PeluangPeluang dan Distribusi Peluang
Peluang dan Distribusi Peluang
 
Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010
Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010
Modul Pratikum Algoritma dan Pemrograman dalam Bahasa Visual C++ 2010
 
ALJABAR LINEAR ELEMENTER
ALJABAR LINEAR ELEMENTERALJABAR LINEAR ELEMENTER
ALJABAR LINEAR ELEMENTER
 
Poisson distribution
Poisson distributionPoisson distribution
Poisson distribution
 
Stat d3 7
Stat d3 7Stat d3 7
Stat d3 7
 
Modul2 metode regula falsi praktikum metode numerik
Modul2 metode regula falsi praktikum metode numerikModul2 metode regula falsi praktikum metode numerik
Modul2 metode regula falsi praktikum metode numerik
 
Rantai Markov 1
Rantai Markov 1Rantai Markov 1
Rantai Markov 1
 
Metode numerik persamaan non linier
Metode numerik persamaan non linierMetode numerik persamaan non linier
Metode numerik persamaan non linier
 
Pertemuan 02 teori dasar himpunan
Pertemuan 02   teori dasar himpunanPertemuan 02   teori dasar himpunan
Pertemuan 02 teori dasar himpunan
 
Contoh soal Metode Simpleks
Contoh soal Metode SimpleksContoh soal Metode Simpleks
Contoh soal Metode Simpleks
 
Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)Data Management (Data Mining Klasifikasi)
Data Management (Data Mining Klasifikasi)
 
STANDARD SCORE, SKEWNESS & KURTOSIS
STANDARD SCORE, SKEWNESS & KURTOSISSTANDARD SCORE, SKEWNESS & KURTOSIS
STANDARD SCORE, SKEWNESS & KURTOSIS
 

Similar to Data mining 8 estimasi linear regression

Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...
Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...
Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...Maninda Edirisooriya
 
Chapter 13 finding relationships
Chapter 13 finding relationshipsChapter 13 finding relationships
Chapter 13 finding relationships201120305
 
Chapter 13 finding relationships
Chapter 13 finding relationshipsChapter 13 finding relationships
Chapter 13 finding relationships201120305
 
Regression vs Neural Net
Regression vs Neural NetRegression vs Neural Net
Regression vs Neural NetRatul Alahy
 
INTRODUCTION TO BOOSTING.ppt
INTRODUCTION TO BOOSTING.pptINTRODUCTION TO BOOSTING.ppt
INTRODUCTION TO BOOSTING.pptBharatDaiyaBharat
 
Unit 3 – AIML.pptx
Unit 3 – AIML.pptxUnit 3 – AIML.pptx
Unit 3 – AIML.pptxhiblooms
 
MODULE_05-Matrix Decomposition.pptx
MODULE_05-Matrix Decomposition.pptxMODULE_05-Matrix Decomposition.pptx
MODULE_05-Matrix Decomposition.pptxAlokSingh205089
 
Iterative Determinant Method for Solving Eigenvalue Problems
Iterative Determinant Method for Solving Eigenvalue ProblemsIterative Determinant Method for Solving Eigenvalue Problems
Iterative Determinant Method for Solving Eigenvalue Problemsijceronline
 
Graph Analysis of Student Model Networks
Graph Analysis of Student Model NetworksGraph Analysis of Student Model Networks
Graph Analysis of Student Model Networksmallium
 
1-tpack-model.pptx
1-tpack-model.pptx1-tpack-model.pptx
1-tpack-model.pptxloantnu1
 
ML_Regression.pptx
ML_Regression.pptxML_Regression.pptx
ML_Regression.pptxhackcheck
 
Ee184405 statistika dan stokastik statistik deskriptif 2 numerik
Ee184405 statistika dan stokastik   statistik deskriptif 2 numerikEe184405 statistika dan stokastik   statistik deskriptif 2 numerik
Ee184405 statistika dan stokastik statistik deskriptif 2 numerikyusufbf
 
G6 m4-g-lesson 26-t
G6 m4-g-lesson 26-tG6 m4-g-lesson 26-t
G6 m4-g-lesson 26-tmlabuski
 

Similar to Data mining 8 estimasi linear regression (20)

Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...
Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...
Lecture 4 - Linear Regression, a lecture in subject module Statistical & Mach...
 
Module-2_ML.pdf
Module-2_ML.pdfModule-2_ML.pdf
Module-2_ML.pdf
 
Chapter 13 finding relationships
Chapter 13 finding relationshipsChapter 13 finding relationships
Chapter 13 finding relationships
 
Chapter 13 finding relationships
Chapter 13 finding relationshipsChapter 13 finding relationships
Chapter 13 finding relationships
 
Chapter 13 finding relationships
Chapter 13 finding relationshipsChapter 13 finding relationships
Chapter 13 finding relationships
 
Regression vs Neural Net
Regression vs Neural NetRegression vs Neural Net
Regression vs Neural Net
 
Machine learning meetup
Machine learning meetupMachine learning meetup
Machine learning meetup
 
Covariance.pdf
Covariance.pdfCovariance.pdf
Covariance.pdf
 
INTRODUCTION TO BOOSTING.ppt
INTRODUCTION TO BOOSTING.pptINTRODUCTION TO BOOSTING.ppt
INTRODUCTION TO BOOSTING.ppt
 
Unit 3 – AIML.pptx
Unit 3 – AIML.pptxUnit 3 – AIML.pptx
Unit 3 – AIML.pptx
 
3ml.pdf
3ml.pdf3ml.pdf
3ml.pdf
 
Recommender System Based On Statistical Implicative Analysis.doc
Recommender System Based On Statistical Implicative Analysis.docRecommender System Based On Statistical Implicative Analysis.doc
Recommender System Based On Statistical Implicative Analysis.doc
 
MODULE_05-Matrix Decomposition.pptx
MODULE_05-Matrix Decomposition.pptxMODULE_05-Matrix Decomposition.pptx
MODULE_05-Matrix Decomposition.pptx
 
Iterative Determinant Method for Solving Eigenvalue Problems
Iterative Determinant Method for Solving Eigenvalue ProblemsIterative Determinant Method for Solving Eigenvalue Problems
Iterative Determinant Method for Solving Eigenvalue Problems
 
Graph Analysis of Student Model Networks
Graph Analysis of Student Model NetworksGraph Analysis of Student Model Networks
Graph Analysis of Student Model Networks
 
1-tpack-model.pptx
1-tpack-model.pptx1-tpack-model.pptx
1-tpack-model.pptx
 
ML_Regression.pptx
ML_Regression.pptxML_Regression.pptx
ML_Regression.pptx
 
2014 11-13
2014 11-132014 11-13
2014 11-13
 
Ee184405 statistika dan stokastik statistik deskriptif 2 numerik
Ee184405 statistika dan stokastik   statistik deskriptif 2 numerikEe184405 statistika dan stokastik   statistik deskriptif 2 numerik
Ee184405 statistika dan stokastik statistik deskriptif 2 numerik
 
G6 m4-g-lesson 26-t
G6 m4-g-lesson 26-tG6 m4-g-lesson 26-t
G6 m4-g-lesson 26-t
 

Recently uploaded

Generative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and MilvusGenerative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and MilvusTimothy Spann
 
Mature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxMature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxolyaivanovalion
 
BabyOno dropshipping via API with DroFx.pptx
BabyOno dropshipping via API with DroFx.pptxBabyOno dropshipping via API with DroFx.pptx
BabyOno dropshipping via API with DroFx.pptxolyaivanovalion
 
Industrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdfIndustrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdfLars Albertsson
 
Unveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data AnalystUnveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data AnalystSamantha Rae Coolbeth
 
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAl Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAroojKhan71
 
CebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptxCebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptxolyaivanovalion
 
Smarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxSmarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxolyaivanovalion
 
Dubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls DubaiDubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls Dubaihf8803863
 
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...Suhani Kapoor
 
Carero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptxCarero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptxolyaivanovalion
 
RA-11058_IRR-COMPRESS Do 198 series of 1998
RA-11058_IRR-COMPRESS Do 198 series of 1998RA-11058_IRR-COMPRESS Do 198 series of 1998
RA-11058_IRR-COMPRESS Do 198 series of 1998YohFuh
 
Midocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFxMidocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFxolyaivanovalion
 
Delhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip CallDelhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Callshivangimorya083
 
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfMarket Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfRachmat Ramadhan H
 
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...Suhani Kapoor
 
Beautiful Sapna Vip Call Girls Hauz Khas 9711199012 Call /Whatsapps
Beautiful Sapna Vip  Call Girls Hauz Khas 9711199012 Call /WhatsappsBeautiful Sapna Vip  Call Girls Hauz Khas 9711199012 Call /Whatsapps
Beautiful Sapna Vip Call Girls Hauz Khas 9711199012 Call /Whatsappssapnasaifi408
 
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Serviceranjana rawat
 

Recently uploaded (20)

Generative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and MilvusGenerative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and Milvus
 
VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...
VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...
VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...
 
Mature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxMature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptx
 
BabyOno dropshipping via API with DroFx.pptx
BabyOno dropshipping via API with DroFx.pptxBabyOno dropshipping via API with DroFx.pptx
BabyOno dropshipping via API with DroFx.pptx
 
Industrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdfIndustrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdf
 
Unveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data AnalystUnveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data Analyst
 
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAl Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
 
CebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptxCebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptx
 
Smarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxSmarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptx
 
Dubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls DubaiDubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls Dubai
 
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
 
Carero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptxCarero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptx
 
RA-11058_IRR-COMPRESS Do 198 series of 1998
RA-11058_IRR-COMPRESS Do 198 series of 1998RA-11058_IRR-COMPRESS Do 198 series of 1998
RA-11058_IRR-COMPRESS Do 198 series of 1998
 
Midocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFxMidocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFx
 
꧁❤ Aerocity Call Girls Service Aerocity Delhi ❤꧂ 9999965857 ☎️ Hard And Sexy ...
꧁❤ Aerocity Call Girls Service Aerocity Delhi ❤꧂ 9999965857 ☎️ Hard And Sexy ...꧁❤ Aerocity Call Girls Service Aerocity Delhi ❤꧂ 9999965857 ☎️ Hard And Sexy ...
꧁❤ Aerocity Call Girls Service Aerocity Delhi ❤꧂ 9999965857 ☎️ Hard And Sexy ...
 
Delhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip CallDelhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls Punjabi Bagh 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
 
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfMarket Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
 
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
 
Beautiful Sapna Vip Call Girls Hauz Khas 9711199012 Call /Whatsapps
Beautiful Sapna Vip  Call Girls Hauz Khas 9711199012 Call /WhatsappsBeautiful Sapna Vip  Call Girls Hauz Khas 9711199012 Call /Whatsapps
Beautiful Sapna Vip Call Girls Hauz Khas 9711199012 Call /Whatsapps
 
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
 

Data mining 8 estimasi linear regression

  • 1. Linear Regression Irwansyah Saputra, S.Kom., M.Kom., MTA Founder of Multinity Indonesia
  • 2. Tentang Saya • Irwansyah Saputra • Dosen Ilmu Komputer • Mahasiswa S3 Ilmu Komputer IPB University • Bidang Kajian: Computational Intelligence & Optimization (Data mining, machine learning, artificial intelligence) Halo semuanya, saya suka belajar tentang segala hal dan suka berbagi pengetahuan. Saya juga sering menjadi pembicara di berbagai seminar. Kontak yang bisa dihubungi: WhatsApp: 0895323302241 Instagram: @irwansight_ Web: https://irw.one
  • 3. Disclaimer Materi ini digunakan sebagai bahan ajar Program Data Mining di Multinity.id Silakan gunakan, mohon untuk tidak mengubah template. Jika Anda memiliki kesulitan dalam memahami materi pada slide ini, silakan belajar di Multinity.id
  • 4. Referensi 1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third Edition, Elsevier, 2012 2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and Business Analytics Applications, CRC Press Taylor & Francis Group, 2014 4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining, John Wiley & Sons, 2005 5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014 6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer, 2011 7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook Second Edition, Springer, 2010 8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications, World Scientific, 2007 9. Suyanto, DATA MINING: Untuk klasifikasi dan klasterisasi data, Penerbit Informatika, 2017
  • 5. Linear Regression • Regresi adalah analisis statistika yang digunakan untuk menganalisis dan memahami hubungan antara dua variabel atau lebih. • Perbedaannya dengan klasifikasi, regresi merupakan prediksi dengan target yang memiliki tipe data numerik, sedangkan klasifikasi melakukan prediksi atau pengelompokkan data dengan target tipe data kategorik. • Dalam regresi terdapat dua jenis variabel yaitu variabel independen dan dependen.
  • 6. Linear Regression • Variabel independen adalah variabel yang berfungsi sebagai prediktor atau faktor-faktor yang mempengaruhi target. Contohnya dalam dataset calon penerima beasiswa, variabel independen seperti gaji orang tua, nilai IPK, jarak rumah dan lain sebagainya. • Variabel dependen adalah variabel target yang akan dijadikan prediksi. Pada contoh dataset calon penerima beasiswa, variabel dependen adalah keterangan yang berisi “diterima” atau “ditolak”. • Biasanya regresi memiliki satu variabel dependen dan memiliki lebih dari satu variabel independen. • Hubungan bersifat statistik, bukan deterministik.
  • 7. Linear Regression • Misalnya pada dataset nilai.csv , terdapat hubungan linear (searah) antara jam belajar dengan harga nilai yang didapatkan. Kalau jumlah jam belajarnya adalah 6.5 jam, berapakah nilai yang didapatkan?
  • 8. Linear Regression • Rumus regresi secara umum adalah: 𝑌 = 𝑓 𝑥 Keterangan: • 𝑌 = variabel dependen. Dalam kasus ini adalah nilai. • 𝑥 = variabel independen. Dalam kasus ini adalah jumlah jam. • Kinerja linear regression dapat diukur dengan beberapa pendekatan yaitu Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), Mean Square Error (MSE), Root Mean Square Error (RMSE), R-squared values, dan Adjusted R-squared values.
  • 9. Single Linear Regression Irwansyah Saputra, S.Kom., M.Kom., MTA Founder of Multinity Indonesia
  • 10. Single Linear Regression • Sesuai dengan namanya, SLR adalah metode sederhana karena terdiri dari satu variabel independen (X) yang akan memprediksi variabel dependen (Y). Rumus SLR adalah: 𝑌 = 𝛽0 + 𝛽1𝑋 Keterangan: • 𝑌 = Variabel terikat (Dependen) • 𝑋 = Variabel tidak terikat (Independen) • 𝛽0 = Konstanta, perpotongan garis regresi dengan sumbu Y (nilai estimasi jika x = 0). • 𝛽1 = Koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh variabel.
  • 11. Single Linear Regression • Tahapan dalam melakukan teknik SLR adalah:  Mencari apakah ada hubungan antara variabel x dan y.  Menentukan variabel independen (x) dan variabel dependen (y).  Membuat scatter plot dari variabel x dan y.  Terlihat gambaran yang didapatkan dari scatter plot, apakah terbentuk hubungan yang linear? jika ya, maka model regresinya adalah regresi linear sederhana, kalau tidak linear dapat dicari regresinya.  Menghitung a dan b.  Menghitung Ŷ = b_0 + bX, dimana Ŷ = estimasi harga y jika x disubstitusikan ke dalam persamaan regresi.  Membuat garis Ŷ = b_0 + b_1 X pada sumbu x dan y.
  • 12. Contoh Kasus • Kasus yang akan kita gunakan adalah hubungan antara jam belajar terhadap nilai siswa di suatu sekolah. • Jumlah jam belajar diwakili oleh variabel independen bernama “Hours”, sedangkan nilai siswa diwakili oleh variabel dependen bernama “Scores”. Rincian datasetnya dapat dilihat sebagai berikut: Hours 3 5 3 9 4 2 9 6 8 3 8 6 5 3 1 Scores 21 47 27 75 30 20 88 60 81 25 85 62 41 42 17
  • 13. Penyelesaian • Jika kita melihat adanya hubungan dua variabel tersebut, lanjutkan dengan rumus: 𝑏0 = 𝛴𝑦 𝛴𝑥2 – 𝛴𝑥 𝛴𝑥𝑦 𝑛 𝛴𝑥2 − 𝛴𝑥2 𝑏1 = 𝑛 𝛴𝑥𝑦 – 𝛴𝑥 𝛴𝑦 𝑛 𝛴𝑥2 − 𝛴𝑥2 • Untuk memudahkan perhitungan, langkah yang harus kita lakukan adalah mengkuadratkan tiap variabel menjadi seperti pada tabel berikut: Hours (x) Scores (y) X2 y2 x.y 2.5 21 6.25 441 52.5 3.2 27 10.24 729 86.4 8.5 75 72.25 5625 637.5 3.5 30 12.25 900 105 1.5 20 2.25 400 30 5.5 60 30.25 3600 330 2.7 25 7.29 625 67.5 7.7 85 59.29 7225 654.5 5.9 62 34.81 3844 365.8 4.5 41 20.25 1681 184.5 3.3 42 10.89 1764 138.6 1.1 17 1.21 289 18.7 49.9 505 267.23 27123 2671
  • 14. Penyelesaian • Kemudian masukkan nilai-nilai tersebut ke dalam rumus yang sudah disediakan sebagai berikut: • Sehingga kita mendapatkan persamaan baru yaitu: Ŷ = 𝑏0 + 𝑏1𝑋 Ŷ = 2.327520056 + 9.560516219𝑋 𝑏0 = 𝛴𝑦 𝛴𝑥2 – 𝛴𝑥 𝛴𝑥𝑦 𝑛 𝛴𝑥2 − 𝛴𝑥 2 = 505 267.23 − 49.9 2671 12 267.23 − 49.9 2 = 2.327520056 𝑏1 = 𝑛 𝛴𝑥𝑦 – 𝛴𝑥 𝛴𝑦 𝑛 𝛴𝑥2 − 𝛴𝑥 2 = 12 4392.6 − 72.5 721 15 446.77 − 49.9 2 = 9.560516219
  • 15. Penyelesaian Ŷ = 𝑏0 + 𝑏1𝑋 Ŷ = 2.327520056 + 9.560516219𝑋 • Nilai a merupakan intercept, yaitu koefisien yang dimiliki model regresi kita. Artinya untuk setiap X nol (siswa yang tak belajar sama sekali) ia akan mendapatkan nilai sebesar 2.327520056. • Sedangkan b merupakan slope, yaitu kemiringan gradien model regresi kita. Artinya adalah setiap siswa menambahkan waktu belajar sebanyak 1 jam, maka nilainya akan bertambah sebanyak 9.560516219.
  • 16. Penyelesaian • Setelah kita pahami maksudnya, sekarang saatnya untuk menggunakan hasil persamaan tersebut pada data uji yang tersisa yaitu sebagai berikut: Hours (x) Scores (y) Persamaan Predicted (Ŷ) 5.1 47 2.327520056 + 9.560516219 5.1 51.08615 9.2 88 2.327520056 + 9.560516219 9.2 90.28427 8.3 81 2.327520056 + 9.560516219 8.3 81.6798
  • 17. Analisis Residual • Residual adalah nilai selisih antara nilai aktual dan nilai prediksi. • residu adalah nilai kuantitatif yang tidak bisa dijelaskan oleh model dan bersifat acak. Ŷ = 2.327520056 + 9.560516219𝑋 Hours (x) Scores (y) Predicted (Ŷ) Residual 5.1 47 51.08615 -4.08615 9.2 88 90.28427 -2.28427 8.3 81 81.6798 -0.6798
  • 18. Analisis Heteroskedastisitas dan Homoskedastisitas • Heteroskedastisitas adalah keadaan dimana nilai residu masih memiliki pola hubungan linear yang kuat dengan variabel independennya. • Kebalikan dari heteroskedastisitas adalah homoskedastisitas. (a) Heteroskedastisitas (b) Heteroskedastisitas (c) Homoskedastisitas
  • 19. Analisis Heteroskedastisitas dan Homoskedastisitas • “fungsi dari heteroskedastisitas dan homoskedastisitas itu apa? Dan mana yang harus dihindari dalam analisis regresi linear?” • Heteroskedastisitas harus dihindari karena nilai residu terikat pada nilai prediksi. Padahal seharusnya nilai residu bersifat acak dan konstan. Contohnya, variabel Scores selain diprediksi oleh Hours, juga diprediksi oleh residu (variabel selain Scores). Sehingga besarnya residu pada tiap siswa seharusnya bersifat acak. • Pada kasus ini, yang terjadi adalah homoskedastisitas.
  • 20. Analisis Mean Absolute Error (MAE) • Fungsinya untuk menunjukkan nilai kesalahan rata-rata yang error dari nilai aktual dan nilai prediksi. Rumus MAE dapat dilihat sebagai berikut: 𝑀𝐴𝐸 = Ŷ − 𝑌 𝑛 Keterangan: • Ŷ = nilai prediksi • 𝑌 = nilai aktual • 𝑛 = jumlah data • Semakin kecil nilai MAE, artinya semakin bagus model regresi yang dibuat. Karenanya, MAE sering digunakan untuk mengevaluasi hasil model regresi karena kemudahan penggunaannya dan menghasilkan perhitungan yang sangat informatif. Hours (x) Scores (y) Predicted (Ŷ) Residual |Ŷ-Y| 5.1 47 51.08615 -4.08615 4.08615 9.2 88 90.28427 -2.28427 2.28427 8.3 81 81.6798 -0.6798 0.6798 MAE: 2.350073
  • 21. Analisis Mean Square Error (MSE) • MSE memiliki perbedaan sedikit dengan MAE, yaitu adanya fungsi kuadratik pada perhitungan sehingga didapatkan rumus berikut: 𝑀𝑆𝐸 = Ŷ − 𝑌 2 𝑛 Keterangan: • Ŷ = nilai prediksi • 𝑌 = nilai aktual • 𝑛 = jumlah data Hours (x) Scores (y) Predicted (ŷ) Residual (Ŷ-Y)2 5.1 47 51.08615 -4.08615 16.69662 9.2 88 90.28427 -2.28427 5.217889 8.3 81 81.6798 -0.6798 0.462128 MSE: 7.45888
  • 22. Analisis Mean Square Error (MSE) • Pertanyaannya mungkin sederhana, “Kapan kita menggunakan MAE dan MSE?”  Apakah data kita memiliki nilai outlier? Jika ya, maka gunakan MAE untuk menghitung evaluasinya.  Apakah kita yakin bahwa data tersebut adalah nilai outlier? Jika ya, maka gunakan MAE.  Apakah kita memiliki data yang tak terduga dan perlu perhatian khusus? Jika ya, maka gunakan MSE.
  • 23. Analisis Root Mean Square Error (RMSE) • Secara teknis, RMSE hanya melakukan akar kuadrat terhadap hasil dari MSE. • Namun justru dampaknya jadi sangat terlihat, karena angka berlipat ganda yang dihasilkan oleh MSE menjadi normal kembali akibat RMSE. Rumusnya adalah: 𝑅𝑀𝑆𝐸 = 𝑀𝑆𝐸 = Ŷ − 𝑌 2 𝑛 Hours (x) Scores (y) Predicted (ŷ) Residual (Ŷ-Y)2 5.1 47 51.08615 -4.08615 16.69662 9.2 88 90.28427 -2.28427 5.217889 8.3 81 81.6798 -0.6798 0.462128 MSE: 7.45888 RMSE: 2.731095
  • 24. Analisis Root Mean Square Error (RMSE)  MAE dan RMSE merupakan teknik evaluasi mencari rata-rata error pada model regresi, sehingga secara default keduanya bisa digunakan dalam kasus regresi.  Jika kita memiliki kasus yang di dalamnya terdapat nilai outlier, maka menggunakan MAE lebih baik dari pada RMSE.  Jika kita ingin membandingkan dua model regresi yang berbeda, maka gunakan RMSE untuk mengevaluasinya.
  • 25. Analisis Mean Absolute Percentage Error (MAPE) • Analisis Mean Absolute Percentage Error (MAPE) digunakan untuk mengukur keakuratan model regresi yang kita buat dalam melakukan prediksi. Rumusnya: 𝑀𝐴𝑃𝐸 = 1 𝑛𝑖=1 𝑛 𝑌𝑖 − Ŷ𝑖 𝑌𝑖 × 100% Keterangan: • 𝑛 = jumlah data • 𝑌𝑖 = nilai data aktual sebanyak i . • Ŷ𝑖 = nilai data prediksi sebanyak i.
  • 26. Analisis R Square Value • Ukuran nilai persentase MAPE: • Berdasarkan perhitungan tersebut, kita bisa melihat hasil MAPE adalah ± 4.04%. Artinya model regresi yang kita buat memiliki keakuratan yang sangat tinggi dalam memprediksi nilai baru. Nilai MAPE Keterangan ≤ 10 Hasil prediksi sangat akurat 10 - 20 Hasil prediksi baik 20 - 50 Hasil prediksi layak (cukup baik) > 50 Hasil prediksi tidak akurat Hours (x) Scores (y) Predicted (ŷ) Residual |Ŷ-Y|/Y*100 5.1 47 51.08615 -4.08615 8.69393617 9.2 88 90.28427 -2.28427 2.595761364 8.3 81 81.6798 -0.6798 0.839259259 MAPE: 4.042985598
  • 27. Analisis R Square Value • R square (R2) merupakan nilai yang berkisar dari 0 – 1 untuk menjelaskan besarnya kombinasi/variasi dari variabel independen terhadap variabel dependen. • Semakin tinggi nilai R2, maka semakin bagus model yang kita buat. • Contohnya, jika kita memiliki model dengan nilai R2 = 0.97, artinya 97% dari variabel dependen dapat dijelaskan oleh variabel independen. 𝑅2 = 1 − 𝑆𝑢𝑚 𝑆𝑞𝑢𝑎𝑟𝑒 𝐸𝑟𝑟𝑜𝑟 𝑆𝑢𝑚 𝑆𝑞𝑢𝑎𝑟𝑒 𝑇𝑜𝑡𝑎𝑙 = 1 − 𝑌𝑖 − Ŷ𝑖 2 𝑌𝑖 − Ȳ𝑖 2 Keterangan: • 𝑌𝑖 = nilai data aktual sebanyak i . • Ŷ𝑖 = nilai data prediksi sebanyak i. • Ȳ𝑖 = nilai mean dari Y. Pada kasus ini nilainya adalah 72.
  • 28. Analisis R Square Value • Jika kita implementasikan pada kasus kita, maka hasilnya adalah sebagai berikut: 𝑅2 = 1 − 𝑌𝑖 − Ŷ𝑖 2 𝑌𝑖 − Ȳ𝑖 2 𝑅2 = 1 − 962 22.3766393 𝑅2 = 0.97673946 Scores (y) Predicted (ŷ) (Ŷ-Y) (Ŷ-Y)2 Y- Ȳ (Y- Ȳ)2 47 51.08615 -4.08615 16.69662 -25 625 88 90.28427 -2.28427 5.217889 16 256 81 81.6798 -0.6798 0.462128 9 81 SUM 216 223.05022 -7.05022 22.37664 0 962 Mean 72 74.35007333 -2.35007 7.45888 0 320.6666667 R Square: 0.97673946
  • 29. Multi Class Linear Regression Irwansyah Saputra, S.Kom., M.Kom., MTA Founder of Multinity Indonesia
  • 30. Multi Class Linear Regression • MLR digunakan untuk kasus yang memiliki atribut independen lebih dari satu. • Contohnya, jika pada SLR terdapat kaitan antara jam belajar siswa terhadap nilai yang didapatkan, maka pada MLR atribut pendukung yang mempengaruhi nilai siswa tidak hanya jam belajar, bisa juga fasilitas yang dimiliki. • Fasilitas tersebut adalah variabel independen baru yang mempengaruhi nilai siswa. • Rumusnya adalah: 𝑌 = 𝛽0 + 𝛽1𝑋1 + ⋯ + 𝛽𝑛𝑋𝑛 • Keterangan: • 𝑌 = Variabel terikat (Dependen) • 𝑋 = Variabel tidak terikat (Independen) • 𝛽0 = Konstanta, perpotongan garis regresi dengan sumbu Y (nilai estimasi jika x = 0). • 𝛽1 = Koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh variabel. • 𝑛 = Banyaknya data yang dihitung.
  • 31. Contoh Kasus • Kasus yang akan kita gunakan kali ini adalah dataset perpustakaan yang terdiri dari dua variabel independen dan satu variabel dependen. Berikut rinciannya: Nama Variabel Jenis Variabel Simbol jumlah pengunjung per bulan Dependen Y jumlah buku baru per bulan Independen X1 jumlah member perpustakaan Independen X2 Y 23 7 15 17 23 22 10 14 20 19 X1 10 2 4 6 8 7 4 6 7 6 X2 7 3 2 4 6 5 3 3 4 3
  • 32. Contoh Kasus • Kemudian kita buat tabel bantu untuk memudahkan dalam perhitungan. Teknik yang digunakan sama persis dengan SLR pada pembahasan sebelumnya. Hasilnya dapat kita lihat sebagai berikut: Tangg al Y X1 X2 X1Y X2Y X1X2 X1 2 X2 2 1 23 10 7 230 161 70 100 49 2 7 2 3 14 21 6 4 9 3 15 4 2 60 30 8 16 4 4 17 6 4 102 68 24 36 16 5 23 8 6 184 138 48 64 36 6 22 7 5 154 110 35 49 25 7 10 4 3 40 30 12 16 9 8 14 6 3 84 42 18 36 9 9 20 7 4 140 80 28 49 16 10 19 6 3 114 57 18 36 9 Σ ΣY ΣX1 ΣX2 ΣX1Y ΣX2Y ΣX1X2 ΣX1 2 ΣX2 2 Jumla h 170 60 40 1122 737 267 406 182
  • 33. Contoh Kasus • Selanjutnya, kita buat matriks A dan matriks H dengan rumus sebagai berikut: 𝐴 = 𝑛 𝑋1 𝑋2 𝑋1 𝑋1 2 𝑋1 𝑋2 𝑋2 𝑋1 𝑋2 𝑋2 2 𝐻 = Y 𝑋1𝑌 𝑋2𝑌 Keterangan: • 𝑛 = jumlah data yang dimiliki yaitu 10. 𝐴 = 10 60 40 60 406 267 40 267 182 𝐻 = 170 1122 737
  • 34. Penyelesaian • Selanjutnya kita akan membuat matriks untuk A1, A2 dan A3 . Caranya adalah mengubah satu kolom dengan matriks H. Rinciannya sebagai berikut:  Untuk matriks A1, salin kolom matriks A, lalu ganti kolom pertama dengan matriks H.  Untuk matriks A2, salin kolom matriks A, lalu ganti kolom kedua dengan matriks H.  Untuk matriks A3, salin kolom matriks A, lalu ganti kolom ketiga dengan matriks H. • Seluruh matriks akan berubah menjadi: 𝐴1 = 170 1122 737 60 406 267 40 267 182 𝐴2 = 10 60 40 170 1122 737 40 267 182 𝐴3 = 10 60 40 60 406 267 170 1122 737
  • 35. 10 60 40 60 406 267 40 267 182 10 60 40 60 406 267 Penyelesaian • Setelah itu, kita akan menentukan matriks b1, b2 dan b3. Rumusnya adalah: 𝑏1 = det(𝐴1) det 𝐴 𝑏2 = det(𝐴2) det 𝐴 𝑏3 = det(𝐴3) det 𝐴 • Karena nilai determinan dari setiap matriks belum ada, maka kita harus mencarinya terlebih dahulu dengan cara: (2 Kolom pertama Matriks A) (Matriks A) Keterangan: • (+) Garis Diagonal ditarik dari atas ke bawah • (-) Garis Diagonal datarik dari bawah ke atas
  • 36. Penyelesaian • Hasil perhitungannya dapat dilihat sebagai berikut: 𝐷𝑒𝑡 𝐴 = 10 ∗ 406 ∗ 182 + 60 ∗ 267 ∗ 40 + 40 ∗ 60 ∗ 267 − 40 ∗ 406 ∗ 40 − 267 ∗ 267 ∗ 10 − 182 ∗ 60 ∗ 60 𝐷𝑒𝑡 𝐴 = 2830 𝐷𝑒𝑡 𝐴1 = 11570 𝐷𝑒𝑡 𝐴2 = 6610 𝐷𝑒𝑡 𝐴3 = −780 • Setelah kita mendapatkan determinannya, masukkan nilai tersebut ke dalam rumus tadi: 𝑏1 = det(𝐴1) det 𝐴 = 11570 2830 = 4,08834 𝑏2 = 2,3356 𝑏3 = −0,27562
  • 37. Analisis • Analisis MSE, RMSE, MAE, Rsquare dapat dilakukan dengan rumus yang sudah dijelaskan pada sesi Single Linear Regression.