SlideShare a Scribd company logo
Learning the Parameters
Mempelajari parameter untuk jaringan berarti mencari
parameter (𝑊1. 𝑏1. 𝑊2. 𝑏2) yang meminimalisasi error
pada pelatihan data. Bagaimana cara mengdefenisikan
kesalahan? Kami menyebutnya loss function yang
berfungsi mengukur error. Cross-entropy loss (atau
biasa disebut dengan negative log likelihood) yang
umum digunakan pada output softmax. Jika kita
memiliki contoh 𝑁 training dan 𝐶 kelas lalu loss pada 𝑦
untuk label 𝑦 ialah pada rumusan berikut:
𝐿 𝑦, 𝑦 = −
1
𝑁
𝑛∈𝑁 𝑖=𝐶
𝑦 𝑛,𝑖 log 𝑦 𝑛,𝑖
Formula diatas memang terlihat rumit tetapi rumusan ini memang
ditujukan untuk menjumlahkan semua contoh training dan
menambahkan loss (jika kita prediksi kelas ternyata salah).
Semakin jauh dua distribusi kemungkinan 𝑦 (label yang benar)
dan 𝑦 (prediksi) maka akan semakin besar kerugian (loss) yang
akan terjadi. Dengan mencari parameter yang meminimalisasi
kekurangan (loss) sejatinya kita akan memaksimalkan
kemungkinan (likelihood) pada training data kita.
Kita bisa menggunakan gradient descent untuk mencari
minimumnya dan kami akan mengimplementasi gradient
descent yang vanilla version, yang juga biasa disebut dengan
batch gradient descent dengan learning rate yang sudah fix.
Variasi lainnya seperrti SGD (Stochastic Gradient Descent) atau
minibatch gradient descent biasanya menunjukkan performa
lebih baik pada percobaan. Jadi jika anda cukup serius
menggunakan salah satu dari teknik diatas, maka idealnya
anda juga memperbaiki kerusakan pada learning rate
nantinya.
Untuk input, gradient descent membutuhkan gradient
(vector derivatives) untuk fungsi yang hilang (loss)
untuk parameter ini
𝜕𝐿
𝜕𝑊1
,
𝜕𝐿
𝜕𝑏1
,
𝜕𝐿
𝜕𝑊2
,
𝜕𝐿
𝜕𝑏2
. Untuk
menghitung gradient tersebut kami menggunakan
algoritma backpropagation, yang efesien untuk
mengkalkulasi gradient mulai dari ouptunya. Kami tidak
akan membahas lebih detail mengenai
backpropagation tetapi penjelasannya bisa anda
dapatkan di dua link ini ini: 1 dan 2.
Berikut ialah formula untuk backpropagation:
𝛿3 = 𝑦 − 𝑦
𝛿2 = 1 − tanh2 𝑧1 ∘ 𝛿3 𝑊2
𝑇
𝜕𝐿
𝜕𝑊2
= 𝑎1
𝑇
𝛿3
𝜕𝐿
𝜕𝑏1
= 𝛿3
𝜕𝐿
𝜕𝑊1
= 𝑥 𝑇 𝛿2
𝜕𝐿
𝜕𝑏1
= 𝛿2

More Related Content

Similar to Additional Files - Implementing a Neural Network 2

analisis data tikus percobaan materi informatika kelas X.pptx
analisis data tikus percobaan materi informatika kelas X.pptxanalisis data tikus percobaan materi informatika kelas X.pptx
analisis data tikus percobaan materi informatika kelas X.pptx
rulimustiyawan37
 
Laporan Matlab
Laporan MatlabLaporan Matlab
Laporan Matlab
Nadia R N N
 
KECERDASAN__BUATAN_KELOMPOK_4.pptx
KECERDASAN__BUATAN_KELOMPOK_4.pptxKECERDASAN__BUATAN_KELOMPOK_4.pptx
KECERDASAN__BUATAN_KELOMPOK_4.pptx
MuhSiddikDaming
 
Analisis Algoritma - Strategi Algoritma Brute Force
Analisis Algoritma - Strategi Algoritma Brute ForceAnalisis Algoritma - Strategi Algoritma Brute Force
Analisis Algoritma - Strategi Algoritma Brute Force
Adam Mukharil Bachtiar
 
Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...
Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...
Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...
RezaDystaSatria
 
Matlab Tutorial Chapter 2
Matlab Tutorial Chapter 2Matlab Tutorial Chapter 2
Matlab Tutorial Chapter 2
Muhammad Fadlan Ariska
 
Materi algoritma perulangan
Materi algoritma perulanganMateri algoritma perulangan
Materi algoritma perulangan
nungkyreza
 

Similar to Additional Files - Implementing a Neural Network 2 (7)

analisis data tikus percobaan materi informatika kelas X.pptx
analisis data tikus percobaan materi informatika kelas X.pptxanalisis data tikus percobaan materi informatika kelas X.pptx
analisis data tikus percobaan materi informatika kelas X.pptx
 
Laporan Matlab
Laporan MatlabLaporan Matlab
Laporan Matlab
 
KECERDASAN__BUATAN_KELOMPOK_4.pptx
KECERDASAN__BUATAN_KELOMPOK_4.pptxKECERDASAN__BUATAN_KELOMPOK_4.pptx
KECERDASAN__BUATAN_KELOMPOK_4.pptx
 
Analisis Algoritma - Strategi Algoritma Brute Force
Analisis Algoritma - Strategi Algoritma Brute ForceAnalisis Algoritma - Strategi Algoritma Brute Force
Analisis Algoritma - Strategi Algoritma Brute Force
 
Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...
Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...
Panduan Analisis Genome-wide Association Study (GWAS) dalam Software TASSEL (...
 
Matlab Tutorial Chapter 2
Matlab Tutorial Chapter 2Matlab Tutorial Chapter 2
Matlab Tutorial Chapter 2
 
Materi algoritma perulangan
Materi algoritma perulanganMateri algoritma perulangan
Materi algoritma perulangan
 

More from Ron Ashrovy

Sekolah Pasar Modal Level 2
Sekolah Pasar Modal Level 2Sekolah Pasar Modal Level 2
Sekolah Pasar Modal Level 2
Ron Ashrovy
 
Addtional Files for Implementing Neural Network from Scratch
Addtional Files for Implementing Neural Network from ScratchAddtional Files for Implementing Neural Network from Scratch
Addtional Files for Implementing Neural Network from Scratch
Ron Ashrovy
 
Additional Files - For Article RNN
Additional Files - For Article RNNAdditional Files - For Article RNN
Additional Files - For Article RNN
Ron Ashrovy
 
Additional Files - RNN Introduction
Additional Files - RNN IntroductionAdditional Files - RNN Introduction
Additional Files - RNN Introduction
Ron Ashrovy
 
Inquisitive Chatbot
Inquisitive ChatbotInquisitive Chatbot
Inquisitive Chatbot
Ron Ashrovy
 
Summary about Chatbot AIML
Summary about Chatbot AIMLSummary about Chatbot AIML
Summary about Chatbot AIML
Ron Ashrovy
 
Chatbot with Personality integration with Social Media
Chatbot with Personality integration with Social MediaChatbot with Personality integration with Social Media
Chatbot with Personality integration with Social Media
Ron Ashrovy
 
Chatbot with Persona Based
Chatbot with Persona BasedChatbot with Persona Based
Chatbot with Persona Based
Ron Ashrovy
 
Chatbot with Sequence to Sequence
Chatbot with Sequence to SequenceChatbot with Sequence to Sequence
Chatbot with Sequence to Sequence
Ron Ashrovy
 

More from Ron Ashrovy (9)

Sekolah Pasar Modal Level 2
Sekolah Pasar Modal Level 2Sekolah Pasar Modal Level 2
Sekolah Pasar Modal Level 2
 
Addtional Files for Implementing Neural Network from Scratch
Addtional Files for Implementing Neural Network from ScratchAddtional Files for Implementing Neural Network from Scratch
Addtional Files for Implementing Neural Network from Scratch
 
Additional Files - For Article RNN
Additional Files - For Article RNNAdditional Files - For Article RNN
Additional Files - For Article RNN
 
Additional Files - RNN Introduction
Additional Files - RNN IntroductionAdditional Files - RNN Introduction
Additional Files - RNN Introduction
 
Inquisitive Chatbot
Inquisitive ChatbotInquisitive Chatbot
Inquisitive Chatbot
 
Summary about Chatbot AIML
Summary about Chatbot AIMLSummary about Chatbot AIML
Summary about Chatbot AIML
 
Chatbot with Personality integration with Social Media
Chatbot with Personality integration with Social MediaChatbot with Personality integration with Social Media
Chatbot with Personality integration with Social Media
 
Chatbot with Persona Based
Chatbot with Persona BasedChatbot with Persona Based
Chatbot with Persona Based
 
Chatbot with Sequence to Sequence
Chatbot with Sequence to SequenceChatbot with Sequence to Sequence
Chatbot with Sequence to Sequence
 

Recently uploaded

Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
idoer11
 
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdfModul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
MiliaSumendap
 
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdfPulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
MRoyanzainuddin9A
 
manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6
MhdFadliansyah1
 
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
mtsarridho
 
Konsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balitaKonsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balita
Dilasambong
 
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIPPERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
Pemdes Wonoyoso
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
WagKuza
 

Recently uploaded (8)

Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
 
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdfModul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
 
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdfPulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
 
manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6manajer lapangan pelaksana gedung SKK JENJANG 6
manajer lapangan pelaksana gedung SKK JENJANG 6
 
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
Kisi-Kisi Asesmen Madrasah Akidah Akhlak MTs Arridho Tahun Pelajaran 2023-202...
 
Konsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balitaKonsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balita
 
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIPPERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
PERATURAN BUPATI TENTANG KODE KLASIFIKASI ARSIP
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
 

Additional Files - Implementing a Neural Network 2

  • 2. Mempelajari parameter untuk jaringan berarti mencari parameter (𝑊1. 𝑏1. 𝑊2. 𝑏2) yang meminimalisasi error pada pelatihan data. Bagaimana cara mengdefenisikan kesalahan? Kami menyebutnya loss function yang berfungsi mengukur error. Cross-entropy loss (atau biasa disebut dengan negative log likelihood) yang umum digunakan pada output softmax. Jika kita memiliki contoh 𝑁 training dan 𝐶 kelas lalu loss pada 𝑦 untuk label 𝑦 ialah pada rumusan berikut:
  • 3. 𝐿 𝑦, 𝑦 = − 1 𝑁 𝑛∈𝑁 𝑖=𝐶 𝑦 𝑛,𝑖 log 𝑦 𝑛,𝑖 Formula diatas memang terlihat rumit tetapi rumusan ini memang ditujukan untuk menjumlahkan semua contoh training dan menambahkan loss (jika kita prediksi kelas ternyata salah). Semakin jauh dua distribusi kemungkinan 𝑦 (label yang benar) dan 𝑦 (prediksi) maka akan semakin besar kerugian (loss) yang akan terjadi. Dengan mencari parameter yang meminimalisasi kekurangan (loss) sejatinya kita akan memaksimalkan kemungkinan (likelihood) pada training data kita.
  • 4. Kita bisa menggunakan gradient descent untuk mencari minimumnya dan kami akan mengimplementasi gradient descent yang vanilla version, yang juga biasa disebut dengan batch gradient descent dengan learning rate yang sudah fix. Variasi lainnya seperrti SGD (Stochastic Gradient Descent) atau minibatch gradient descent biasanya menunjukkan performa lebih baik pada percobaan. Jadi jika anda cukup serius menggunakan salah satu dari teknik diatas, maka idealnya anda juga memperbaiki kerusakan pada learning rate nantinya.
  • 5. Untuk input, gradient descent membutuhkan gradient (vector derivatives) untuk fungsi yang hilang (loss) untuk parameter ini 𝜕𝐿 𝜕𝑊1 , 𝜕𝐿 𝜕𝑏1 , 𝜕𝐿 𝜕𝑊2 , 𝜕𝐿 𝜕𝑏2 . Untuk menghitung gradient tersebut kami menggunakan algoritma backpropagation, yang efesien untuk mengkalkulasi gradient mulai dari ouptunya. Kami tidak akan membahas lebih detail mengenai backpropagation tetapi penjelasannya bisa anda dapatkan di dua link ini ini: 1 dan 2.
  • 6. Berikut ialah formula untuk backpropagation: 𝛿3 = 𝑦 − 𝑦 𝛿2 = 1 − tanh2 𝑧1 ∘ 𝛿3 𝑊2 𝑇 𝜕𝐿 𝜕𝑊2 = 𝑎1 𝑇 𝛿3 𝜕𝐿 𝜕𝑏1 = 𝛿3 𝜕𝐿 𝜕𝑊1 = 𝑥 𝑇 𝛿2 𝜕𝐿 𝜕𝑏1 = 𝛿2