More Related Content
More from hiroki yamaoka (13)
PRML5.5
- 4. 最適なMを選ぶアプローチ①
テスト集合に対しての誤差をグラフにプロットし,誤差が最小となる M を選ぶ
4 / 25
手順
1. ネットワーク内の重みベクトルの初期値
をN(0,10)からサンプル
2. 訓練データを用いてNNを学習
3. テスト誤差をプロット
4. 各Mに対して手順1〜3を30回繰り返す
・このアプローチではテスト誤差最小であるM=8が最適なMらしい(Bishop曰く)
(グラフを見ると誤差の最小値はほとんど変わらなさそうだから,個人的には分散の小さいM=4などが
良さそうな気もするが…)
𝐸()ܟ
ܟ
手順4について
Mが大きいほど(パラメータ数は多いので)誤差関数は
複雑であり,パラメータ更新によって局所的極小値に
陥りやすいため,重みのランダムに初期化し,複数回
テスト誤差を検証する必要がある
𝐸()ܟ
𝑀
- 9. 無矛盾性
9 / 25
入力データ 𝔁
パラメータܟ
入力データ 𝔁
パラメータ 𝐰
線形変換
線形変換
学
習
学
習 左図が成り立つ時,無矛盾である
どんな正則化項も無矛盾性をもつべきだが,荷重減衰はこの性質を持たない
(パラメータとバイアスを対等に扱うため)
⇨ 線形変換の下で不変である正則化項が知りたい
重みのリスケーリングとバイアスの移動に対して不変な正則化項は以下の式
第2層の重みの集合第1層の重みの集合
※バイアス項は除かれている
- 18. 適応モデルの不変性
18 / 25
適応モデル (NN)に不変性を獲得させるアプローチ
1. 自分で訓練パターンを変換してデータを水増しする(データ拡張)
・実装が比較的容易
・計算コストが大きい
2.誤差関数に不変性が破られる度合いに対してペナルティを与える(5.5.4)
3.変換しても不変であるような特徴量を抽出する
・職人芸
4.NNの構造に不変性を取り込んだ形にする
・CNNなど
- 19. 接線伝播法(tangent propagation)
19 / 25
誤差関数に不変性が破られる度合いに対してペナルティ(正則化項)を与える
・Ω:不変性の破れについてのペナルティ(正則化関数)
不変性が破られる ⇨ 入力の変換に対して出力が変化しているということ
入力ベクトル𝐱 𝑛の変換に対して,出力の変化量を調べたい
- 21. 接線伝播法(tangent propagation)
21 / 25
出力の変化量を誤差関数を修正するのに利用する
・λは正則化係数
・𝑦 𝑛𝑘はn個目のデータ点でのユニットkの出力
実際の計算では入力を微小変化させることで近似計算できる
変換がL個の場合,対応する正則化項は各変換に対して正則化関数Ωが存在し,
それらの和で正則化項が与えられる