Residual Learning
- 7. Residual Learning
𝐹(𝑥) = 𝐻(𝑥) − 𝑥라면 출력 𝐻(𝑥)는 𝐻(𝑥) = 𝐹(𝑥) + 𝑥
1. 깊은 Layer도 쉽게 Optimization이 가능
2. 늘어난 깊이로 인해 정확도 개선 가능
- 8. Skip Connection을 사용하면…
1. Deep한 Layer를 쉽게 최적화 시킬 수 있음 (Vanishing/Exploding Gradient를 해결)
2. Skip Layer의 개수를 난수로 설정하면 Ensemble Model을 만들기 좋음