1
Machine Learning
Latihan Pertemuan 4
Supervised Learning
Regresi Linear Sederhana
 Regresi linear sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh
mana hubungan sebab akibat antara Variabel Faktor Penyebab (X) terhadap Variabel
Akibatnya (Y)
 Faktor penyebab pada umumnya dilambangkan dengan X atau disebut juga dengan
Predictor sedangkan Variabel Akibat dilambangkan dengan Y atau disebut juga dengan
Response.
 Regresi Linear Sederhana atau sering disingkat dengan SLR(Simple Linear
Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam
produksi untk melakukan peramalan ataupun prediksi tentang karakteristik kualitas
maupun kuantitas.
Contoh penggunaan
Contoh penggunaan analisis regresi linear sederhana dalam kegiatan produksi, antara
lain:
 Hubungan antara lamanya kerusakan mesin dengan kualitas produksi yang dihasilkan
 Hubungan jumlah pekerja dengan output yang diproduksi
 Hubungan suhu ruangan dengan cacat produksi yang dihasilkan
Model Persamaan Regresi
 Y = a + bX
Keterangan:
Y = Variabel Response atau Variabel Vaktor Akibat (Dependen)
X = Variabel Prediktor atau Variabel Faktor Penyebab (Independent)
a = Konstanta, perporongan garis regresi dengan sumbu Y (nilai estimasi jika x = 0)
b = Koefisien regresi (kemiringan/slope): besaran Response yang ditimbulkan oleh
variabel.
Gambar 1. Model persamaan regresi linear sederhana
Besarnya konstanta a dan b dapat ditentukan dengan persamaan:
Y
X
Y = a + bX
a
2
a =
(∑ 𝑌𝑖)(∑ 𝑋𝑖
2
)−(∑ 𝑋𝑖)(∑ 𝑋𝑖𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
− (∑ 𝑋𝑖)2
b =
𝑛 (∑ 𝑋𝑖𝑌𝑖)−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖)2
n = jumlah data
Langkah-langkah Analisis dan Uji Regresi Linear Sederhana
Adapun langkah-langkah yang perlu dilakukan untuk melakukan analisis dan uji regresi
linear sederhana adalah sebagai berikut:
1. Menentukan tujuan dari Analisis Regresi Linear Sederhana
2. Mengidentifikasi variabel Predictor dan variabel Response
3. Melakukan pengumpulan data dalam bentuk table
4. Menghitung 𝑋2
, 𝑌2
, dan XY dan total dari masing-masingnya
5. Mengghitung a dan b menggunakan rumus yang telah ditentukan
6. Membuat model Persamaan Regresi Linear
7. Melakukan prediksi terhadap variabel predictor atau response
8. Uji korelasi
Latihan
 Bangunlah sebuah model regresi (Provokasi = b . Emosi + a) dengan menentukan
b dan a
 Gunakanlah model regresi tersebut untuk memprediksi nilai Provokasi untuk Berita
B4 dan B6
Tabel 1. Pengaruh provokasi terhadap emosi
Terdapat suatu data penelitian tentang 8 berita provokasi yang diprediksi dipengaruhi oleh
emosi.
Bagaimana menganalisisnya?
1. Menentukan tujuan: “Apakah emosi mempengaruhi provokasi berita?
2. Mengidentifikasi variabel Predictor dan variabel Response:
Berita Emosi Provokasi
B1 8 7
B2 2 3
B3 6 7
B4 9
B5 4 2
B6 5
B7 7 8
B8 3 3
3
 X (Variabel bebas/prediktor) = emosi
 Y (Variabel tak bebas/response) = provokasi
3. Melakukan pengumpulan data dalam bentuk tabel
Tabel 2. Contoh tabel
Berita Emosi
(X)
Provokasi
(Y)
B1 8 7
B2 2 3
B3 6 7
B4 9 0
B5 4 2
B6 5 0
B7 7 8
B8 3 3
4. Menghitung X2
, Y2
, XY dan total dari masing-masingnya.
Tabel 3. Tabel data bantu
X 𝐗𝟐 Y 𝐘𝟐 XY
8 64 7 49 56
2 4 3 9 6
6 36 7 49 42
9 81 0 0 0
4 16 2 4 8
5 25 0 0 0
7 49 8 64 56
3 9 3 9 9
Σ 44 284 30 184 177
5. Menghitung a dan b menggunakan rumus yang telah ditentukan.
a =
(∑ 𝑌𝑖)(∑ 𝑋𝑖
2
)−(∑ 𝑋𝑖)(∑ 𝑋𝑖𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
− (∑ 𝑋𝑖)2
=
(30)(284)−(44)(177)
8(284)− (44)2
=
732
336
= 2,1786
b =
𝑛 (∑ 𝑋𝑖𝑌𝑖)−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖)2
=
8(177)−(44)(30)
8(284)− (44)2
(2)
(1)
4
=
96
336
= 0,2857
6. Membuat model Persamaan Garis Regresi
Gambar 2. Persamaan garis regresi
 Setelah didapatkan koefisien a dan b, maka persamaan garisnya adalah:
Y = 2,1786 + 0,2857 X
7. Melakukan prediksi terhadap variabel prediktor atau response
 Prediksikan provokasi jika emosi adalah 9: Y = 2,1786 + 0,2857 X
 Prediksi Y = 2,1786 + (0,2857 * 9) = 4,7499 = 5
 Jadi nilai provokasi untuk berita B4 = 5
 Prediksikan provokasi jika emosi adalah 5: Y = 2,1786 + 0,2857 X
 Prediksi Y = 2,1786 + (0,2857 * 5) = 3,6071 = 4
 Jadi nilai provokasi untuk berita B6 = 4
Tabel 4. Hasil prediksi nilai provokasi untuk berita B4 dan B6
Berita Emosi Provokasi
B1 8 7
B2 2 3
B3 6 7
B4 9 5
B5 4 2
B6 5 4
B7 7 8
B8 3 3
y = 0.2857x + 2.1786
R² = 0.048
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
Provokasi
Emosi
(3)
5
8. Uji Korelasi
 Untuk mengukur kekuatan hubungan antar variabel prediktor X dan response Y,
dilakukan analisis korelasi yang hasilnya dinyatakan oleh suatu bilangan yang dikenal
dengan koefisien korelasi.
 Biasanya analisis regresi sering dilakukan bersama-sama dengan analisis korelasi.
Persamaan koefisien korelasi (r) diekspresikan oleh:
r =
𝑛 ∑ 𝑋𝑖 𝑌𝑖−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
𝑖=1
√[𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖
𝑛
𝑖=1 )
2
]
𝑛
𝑖=1 [𝑛 ∑ 𝑌𝑖
2
𝑛
𝑖=1 −(∑ 𝑌1
𝑛
𝑖=1 )2]
Berdasarkan data tabel, maka koefisien korelasinya adalah:
r =
𝑛 ∑ 𝑋𝑖 𝑌𝑖−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
𝑖=1
√[𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖
𝑛
𝑖=1 )
2
]
𝑛
𝑖=1 [𝑛 ∑ 𝑌𝑖
2
𝑛
𝑖=1 −(∑ 𝑌1
𝑛
𝑖=1 )2]
=
8(177)−(44)(30)
√[8(284)−(44)2 ] [8(184)−(30)2]
=
1.416−1.320
√[2.272−1.936 ] [1.472−900]
=
96
√[336 ] [572]
=
96
√192.192
=
96
438,3970
= 0,2190
 Nilai ini memberi arti bahwa, hubungan variabel bebas/predictor X dengan variabel
terikat/response Y adalah rendah, persentasenya 21%.
Interval Koefisien Tingkat Hubungan
0,00 – 0,19 Sangat rendah
0,20 – 0,399 Rendah
0,40 – 0,599 Sedang
0,60 -0,799 Kuat
0,80 – 1,000 Sangat kuat
(4)
6
 Jadi, provokasi memang rendah pengaruhnya terhadap emosi dalam menanggapi
sebuah berita.
Koefisien Determinasi
 Koefisien determinasi dapat ditentukan dengan mengkuadratkan koefisien korelasi.
 Dari contoh kasus di atas, maka koefisien determinasinya adalah:
𝑟2
= 0,21902
= 0,0480 = 0,05
 Nilai ini berarti bahwa, 5% variabel bebas/predictor X dapat
menerangkan/menjelaskan variabel tak bebas/response Y, sedangkan 95% lainnya
dijelaskan oleh variabel lainnya.
Referensi
Syahid Abdullah, S. M. (2023). Machine Learning. Dalam S. M. Syahid Abdullah, Regresi Linear
Sederhana (hal. 1 - 27). Jakarta: Informatika UNSIA.

Machine Learning Diskusi 4.docx

  • 1.
    1 Machine Learning Latihan Pertemuan4 Supervised Learning Regresi Linear Sederhana  Regresi linear sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh mana hubungan sebab akibat antara Variabel Faktor Penyebab (X) terhadap Variabel Akibatnya (Y)  Faktor penyebab pada umumnya dilambangkan dengan X atau disebut juga dengan Predictor sedangkan Variabel Akibat dilambangkan dengan Y atau disebut juga dengan Response.  Regresi Linear Sederhana atau sering disingkat dengan SLR(Simple Linear Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam produksi untk melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun kuantitas. Contoh penggunaan Contoh penggunaan analisis regresi linear sederhana dalam kegiatan produksi, antara lain:  Hubungan antara lamanya kerusakan mesin dengan kualitas produksi yang dihasilkan  Hubungan jumlah pekerja dengan output yang diproduksi  Hubungan suhu ruangan dengan cacat produksi yang dihasilkan Model Persamaan Regresi  Y = a + bX Keterangan: Y = Variabel Response atau Variabel Vaktor Akibat (Dependen) X = Variabel Prediktor atau Variabel Faktor Penyebab (Independent) a = Konstanta, perporongan garis regresi dengan sumbu Y (nilai estimasi jika x = 0) b = Koefisien regresi (kemiringan/slope): besaran Response yang ditimbulkan oleh variabel. Gambar 1. Model persamaan regresi linear sederhana Besarnya konstanta a dan b dapat ditentukan dengan persamaan: Y X Y = a + bX a
  • 2.
    2 a = (∑ 𝑌𝑖)(∑𝑋𝑖 2 )−(∑ 𝑋𝑖)(∑ 𝑋𝑖𝑌𝑖) 𝑛 ∑ 𝑋𝑖 2 − (∑ 𝑋𝑖)2 b = 𝑛 (∑ 𝑋𝑖𝑌𝑖)−(∑ 𝑋𝑖)(∑ 𝑌𝑖) 𝑛 ∑ 𝑋𝑖 2 −(∑ 𝑋𝑖)2 n = jumlah data Langkah-langkah Analisis dan Uji Regresi Linear Sederhana Adapun langkah-langkah yang perlu dilakukan untuk melakukan analisis dan uji regresi linear sederhana adalah sebagai berikut: 1. Menentukan tujuan dari Analisis Regresi Linear Sederhana 2. Mengidentifikasi variabel Predictor dan variabel Response 3. Melakukan pengumpulan data dalam bentuk table 4. Menghitung 𝑋2 , 𝑌2 , dan XY dan total dari masing-masingnya 5. Mengghitung a dan b menggunakan rumus yang telah ditentukan 6. Membuat model Persamaan Regresi Linear 7. Melakukan prediksi terhadap variabel predictor atau response 8. Uji korelasi Latihan  Bangunlah sebuah model regresi (Provokasi = b . Emosi + a) dengan menentukan b dan a  Gunakanlah model regresi tersebut untuk memprediksi nilai Provokasi untuk Berita B4 dan B6 Tabel 1. Pengaruh provokasi terhadap emosi Terdapat suatu data penelitian tentang 8 berita provokasi yang diprediksi dipengaruhi oleh emosi. Bagaimana menganalisisnya? 1. Menentukan tujuan: “Apakah emosi mempengaruhi provokasi berita? 2. Mengidentifikasi variabel Predictor dan variabel Response: Berita Emosi Provokasi B1 8 7 B2 2 3 B3 6 7 B4 9 B5 4 2 B6 5 B7 7 8 B8 3 3
  • 3.
    3  X (Variabelbebas/prediktor) = emosi  Y (Variabel tak bebas/response) = provokasi 3. Melakukan pengumpulan data dalam bentuk tabel Tabel 2. Contoh tabel Berita Emosi (X) Provokasi (Y) B1 8 7 B2 2 3 B3 6 7 B4 9 0 B5 4 2 B6 5 0 B7 7 8 B8 3 3 4. Menghitung X2 , Y2 , XY dan total dari masing-masingnya. Tabel 3. Tabel data bantu X 𝐗𝟐 Y 𝐘𝟐 XY 8 64 7 49 56 2 4 3 9 6 6 36 7 49 42 9 81 0 0 0 4 16 2 4 8 5 25 0 0 0 7 49 8 64 56 3 9 3 9 9 Σ 44 284 30 184 177 5. Menghitung a dan b menggunakan rumus yang telah ditentukan. a = (∑ 𝑌𝑖)(∑ 𝑋𝑖 2 )−(∑ 𝑋𝑖)(∑ 𝑋𝑖𝑌𝑖) 𝑛 ∑ 𝑋𝑖 2 − (∑ 𝑋𝑖)2 = (30)(284)−(44)(177) 8(284)− (44)2 = 732 336 = 2,1786 b = 𝑛 (∑ 𝑋𝑖𝑌𝑖)−(∑ 𝑋𝑖)(∑ 𝑌𝑖) 𝑛 ∑ 𝑋𝑖 2 −(∑ 𝑋𝑖)2 = 8(177)−(44)(30) 8(284)− (44)2 (2) (1)
  • 4.
    4 = 96 336 = 0,2857 6. Membuatmodel Persamaan Garis Regresi Gambar 2. Persamaan garis regresi  Setelah didapatkan koefisien a dan b, maka persamaan garisnya adalah: Y = 2,1786 + 0,2857 X 7. Melakukan prediksi terhadap variabel prediktor atau response  Prediksikan provokasi jika emosi adalah 9: Y = 2,1786 + 0,2857 X  Prediksi Y = 2,1786 + (0,2857 * 9) = 4,7499 = 5  Jadi nilai provokasi untuk berita B4 = 5  Prediksikan provokasi jika emosi adalah 5: Y = 2,1786 + 0,2857 X  Prediksi Y = 2,1786 + (0,2857 * 5) = 3,6071 = 4  Jadi nilai provokasi untuk berita B6 = 4 Tabel 4. Hasil prediksi nilai provokasi untuk berita B4 dan B6 Berita Emosi Provokasi B1 8 7 B2 2 3 B3 6 7 B4 9 5 B5 4 2 B6 5 4 B7 7 8 B8 3 3 y = 0.2857x + 2.1786 R² = 0.048 0 1 2 3 4 5 6 7 8 9 0 2 4 6 8 10 Provokasi Emosi (3)
  • 5.
    5 8. Uji Korelasi Untuk mengukur kekuatan hubungan antar variabel prediktor X dan response Y, dilakukan analisis korelasi yang hasilnya dinyatakan oleh suatu bilangan yang dikenal dengan koefisien korelasi.  Biasanya analisis regresi sering dilakukan bersama-sama dengan analisis korelasi. Persamaan koefisien korelasi (r) diekspresikan oleh: r = 𝑛 ∑ 𝑋𝑖 𝑌𝑖−(∑ 𝑋𝑖)(∑ 𝑌𝑖) 𝑛 𝑖=1 𝑛 𝑖=1 𝑛 𝑖=1 √[𝑛 ∑ 𝑋𝑖 2 −(∑ 𝑋𝑖 𝑛 𝑖=1 ) 2 ] 𝑛 𝑖=1 [𝑛 ∑ 𝑌𝑖 2 𝑛 𝑖=1 −(∑ 𝑌1 𝑛 𝑖=1 )2] Berdasarkan data tabel, maka koefisien korelasinya adalah: r = 𝑛 ∑ 𝑋𝑖 𝑌𝑖−(∑ 𝑋𝑖)(∑ 𝑌𝑖) 𝑛 𝑖=1 𝑛 𝑖=1 𝑛 𝑖=1 √[𝑛 ∑ 𝑋𝑖 2 −(∑ 𝑋𝑖 𝑛 𝑖=1 ) 2 ] 𝑛 𝑖=1 [𝑛 ∑ 𝑌𝑖 2 𝑛 𝑖=1 −(∑ 𝑌1 𝑛 𝑖=1 )2] = 8(177)−(44)(30) √[8(284)−(44)2 ] [8(184)−(30)2] = 1.416−1.320 √[2.272−1.936 ] [1.472−900] = 96 √[336 ] [572] = 96 √192.192 = 96 438,3970 = 0,2190  Nilai ini memberi arti bahwa, hubungan variabel bebas/predictor X dengan variabel terikat/response Y adalah rendah, persentasenya 21%. Interval Koefisien Tingkat Hubungan 0,00 – 0,19 Sangat rendah 0,20 – 0,399 Rendah 0,40 – 0,599 Sedang 0,60 -0,799 Kuat 0,80 – 1,000 Sangat kuat (4)
  • 6.
    6  Jadi, provokasimemang rendah pengaruhnya terhadap emosi dalam menanggapi sebuah berita. Koefisien Determinasi  Koefisien determinasi dapat ditentukan dengan mengkuadratkan koefisien korelasi.  Dari contoh kasus di atas, maka koefisien determinasinya adalah: 𝑟2 = 0,21902 = 0,0480 = 0,05  Nilai ini berarti bahwa, 5% variabel bebas/predictor X dapat menerangkan/menjelaskan variabel tak bebas/response Y, sedangkan 95% lainnya dijelaskan oleh variabel lainnya. Referensi Syahid Abdullah, S. M. (2023). Machine Learning. Dalam S. M. Syahid Abdullah, Regresi Linear Sederhana (hal. 1 - 27). Jakarta: Informatika UNSIA.