4. Why Knowledge Distillation is Successful?
4
Hypothesis:
1. 배경(background)보다 전경(foreground)를 학습함
2. 각 사물의 특징(visual concepts)들을 동시에
(simultaneously) 학습하는 경향이 있음
3. 처음에는 불필요한(unreliable) 특징(visual concepts)
도 학습하지만 나중에는 해당 특징을 제거
위의 세 가지 가설을 검증하기 위한 세 가지 Metric을 제안함