Estimating Mutual Information for Discrete‐Continuous Mixtures 離散・連続混合の相互情報量の推定Yuya Takashina
NIPS論文読み会@PFN
Gao, Weihao, et al. "Estimating mutual information for discrete-continuous mixtures." Advances in Neural Information Processing Systems. 2017.
https://arxiv.org/abs/1709.06212
23. 主張:weight loss landscapeの尖り具合と汎化ギャップには強い相関がある
[Hao Li et al. 2017]
ρ (w) =
1
N ∑
n
ℓ (f (xn, w), yn)
loss landscapeの定義
g (α) = ρ w + αd
w F
d F
を変化させたときに が書く曲線
α g
lossのweightにノイズをのせたときにlossがどれだけ大きくなるか
d: ガウスノイズ
F: フロベニウスノルム
α
g
33. PAC学習: 仮説集合が有限のときに汎化誤差を扱う枠組み
Ls (h) =
1
N ∑
n
l (h (xn), yn)
L (h) = ED [
l (h (xn), yn)]
notation
訓練誤差
汎化誤差 Dは真の分布
hs = arg min
h
1
N ∑
n
l (h (xn), yn)
学習済みモデル
x,y Sは訓練集合