5. 過学習を防ぐ
22
1
1
( ) { ( , ) }
2 2
N
n n
n
E y x t
w w w%
誤差関数に正則化項(罰金項)を導入
λ : 正則化パラメータ
訓練データとのズレ モデルの複雑さ
λが小さ過ぎる → 訓練データとのズレを小さくすることを重視
複雑なモデルになりやすく過学習を起こしやすい
λが大き過ぎる → 単純なモデルにすることを重視
訓練データとのズレは二の次
結局,λがいくらであれば良いのか分からないと正則化項を導入しても意味がない
15. 低次元での直感との齟齬
半径 r = 1 の球の体積と、r=1と r = 1 – ε の間にある体積の比を考
える
D次元の半径rの球の体積は
*𝐾 𝐷はDのみに依存する定数
D=2ならπ,D=3なら4
3
πなど(演習1.18)
求める比は
D
D DV K r
(1) (1 )
1 (1 )
(1)
DD D
D
V V
V
D=2の場合
1 ε
16. 各次元での体積比
(1) (1 )
1 (1 )
(1)
DD D
D
V V
V
大きなDの場合
・小さなεに対しても1に近い
→εが小さい範囲に体積がつまって
いる
→高次元では球の殆どの体積が表面
に近い薄皮に集中している
(球面集中現象)