大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック

大域的探索から局所的探索へ
データ拡張 (Data Augmentation)を用いた学習の探索テクニック
学習中にデータを切り替えることで精度を向上させる

背景
● Deep Neural Networksは画像認識など幅広い領域で高いパフォーマンスを達成してきているが、何千ものパラメ
ータを持つ複雑なモデルを限られた学習データで学習することは難しい
● 新しいデータを集めることなく学習データを用いて人工的にデータを生成することで、学習データの多様性を向
上させ、モデルのロバスト性を向上させる手法としてデータ拡張が用いられる
標準的なデータ拡張手法: 縮尺やアスペクト比の調整、ランダムクロップ、水平反転など
複雑なデータ拡張手法: Mixup、Cutout、Cutmixなど
データ拡張 (Data Augmentation)とは
データが足りないデータを加工して使いまわす
データ拡張
拡張データ拡張データ

訓練誤差が増加して汎化誤差が良くなる？
● 機械学習では、オーバーフィッティングに気をつけながら訓練誤差を小さくし、
汎化誤差の小さいモデルを作成する (訓練誤差が小さい → 汎化誤差が小さくなる)
● 一方、データ拡張では、純粋な学習データだけ用いたとき学習よりも訓練誤差が
大きくなる傾向がある (ときには、汎化誤差より大きくなることも)
● 学習時に訓練誤差が大きくなっても、テスト時には拡張データが存在しない純粋
なデータなので、汎化誤差が小さくなれば問題ない
汎化誤差
小大
訓練誤差小 ○ ✕
大 ○ ✕

● 論文
○ タイトル: Data Augmentation Revisited: Rethinking the
Distribution Gap between Clean and Augmented Data
○ 2019年
● 内容
○ データ拡張の新しい戦略であるRefined Data Augmentationを提案
○ 既存のデータ拡張手法のほとんどを改善
○ データ拡張による探索とデータ拡張をしない場合の探索について考
察
論文

● 問題
○ 元データと拡張データの分布の差がモデルの収束を阻害している
○ データ拡張によって、相対的に影響が小さい特徴が無視されてしまう可能性がある
● 提案手法
○ Refined Data Augmentation
● モデル学習を2つのステージに分割
○ 学習の序盤では元データと拡張データを両方使用
○ 学習の終盤では元データのみを使用
提案手法
拡張データ元データ元データ
学習序盤学習終盤
学習終盤では
拡張データを使わない

Refined Data Augmentaionの訓練誤差と汎化誤差
手法概要
● データ拡張の手法としてMixupとAutoAugmentを使用
● 最初の400 epochは拡張したデータを元データに混ぜて学習
● 最後の50 epochは元データのみで学習
結果
● 400 epoch目以降でテストデータに対する誤差が改善

そもそもデータ拡張の役割とは？
● データ拡張は、データの特徴の平均化と分散の正則化に対応
● 影響が大きい特徴はできるだけ保存され、影響が小さい特徴はデータ拡張後
に大きく変更される可能性がある
● データ拡張は事前知識によって関数空間に何らかの制約を与える正則化とし
て機能しており、モデルが主要な特徴に集中することを可能にする (e.g. 数字
画像では水平反転などは使われない)
特徴が残るように
データ拡張
事前知識により
やらないデータ拡張
✕

訓練誤差の等高線図
● データ拡張によって左図(データ拡張なし)から右図(データ拡張あり)で局所
最適の数が減少
→ データ拡張で大域最適への収束が容易になる
● Refined Data Augmentaionでは右図(データ拡張あり)で大域的に探索をし
た後、左図(データ拡張なし)でより詳細な探索をする
データ拡張なしデータ拡張あり

実験: 正解率の比較
● 提案手法はほとんどの場合精度向上
○ 特にMixupにおいて、standard data
augmentationを用いてモデルをrefineするこ
とはCIFAR100で精度を大きく向上
● 他にも交差エントロピー誤差の調査やepoch数とオ
ーバフィッティングや物体検知における有効性に
ついての実験は論文を参照

まとめ
● データ拡張とは、機械学習で十分なデータがないときに、オリジナルデータ
を加工することでデータを増やす手法
● データ拡張は、データの特徴の平均化と分散の正則化に対応
● Refined Data Augmentationでは、学習序盤でデータ拡張を使い、学習の終
盤ではオリジナルデータのみ使用するという戦略を取る
● Refined Data Augmentationによって、データ拡張を用いて大きな特徴を捉
える大域的な探索をした後、細かい特徴を捉える局所的な探索ができる
● 既存のデータ拡張手法に適用することができ、多くの場合で精度を上げるこ
とができた

チャンネル紹介
● チャンネル名: 【経営xデータサイエンスx開発】西岡賢一郎のチャンネル
● URL: https://www.youtube.com/channel/UCpiskjqLv1AJg64jFCQIyBg
● チャンネルの内容
○ 経営・データサイエンス・開発に関する情報を発信しています。
○ 例: アジャイル開発、データパイプライン構築、AIで使われるアルゴリズム4種類など
● noteでも情報発信しています → https://note.com/kenichiro

様々なData Augmentation手法
Mixup
・二つのサンプルをピクセルレベルで線形に組み合わせることによって別画像を生成
・いくつかの変異手法も存在
Cutout
・
Cutmix
・MixupとCutoutの複合
AutoAugment
・強化学習ベースの検索アルゴリズムで最善のdata augmentation戦略を探索
Population Based Augmentation
・Augmentation policy scheduleを探索
Fast AutoAugment
・各policyでtrainingすることを避けることでAutoAugmentを高速化

data augmentationの定式化
Mixupで生成されるx, y
Cutmixで生成されるx, y

Augmentationの仕組みの再考
Mixupで生成されるx, y
Cutmixで生成されるx, y

Augmentationの仕組みの再考
data augmentationの恩恵は2種類考えられる
・経験損失が小さくなること
・augmented dataが大きくなること

Refinementの効果
定義
● T1: AutoAugmentを用いて学習させるepoch数
● T2: refinementを行うepoch数
結果
● refinementがaccuracyを著しく向上させている
● augmented dataに対するオーバーフィッティングを抑制

数式関連
data augmentationにおけるmajor featureとminor featureの扱い

epochごとのエラー曲線
Mixupを除去したepochごとのテストエラー曲線
400 epochでのMixupの除去ではrefinementは起きていない

SVD
・Mixupベースの手法とAutoAugment手法では異なる傾向を示す
・考察: Mixupベースの手法は主にクラス間距離に影響を与えるが、
・AutoAugmentはより多くの特徴を導入して、普遍性を誘導する

交差エントロピー誤差
● clean dataとaugmented dataの分布gapを量的に評価するためにcross entropy (CE)を計
算
○ Mixupがclean dataとaugmented dataの間に最も大きな差異を生んだ

Tiny-ImageNetとImageNetの分類精度
● Tiny-ImageNetとImageNet両方のデータセットで、提案手法が通常のデータ拡張よりも優れて
いる結果となった

物体検知への展望
物体検知での結果
● 事前学習させたMixupとAutoAugmentのモデルは分類タスクでは高い性能を試したが、物体検出タ
スクではオリジナルに劣る結果
● Refinementを行った事前学習モデルは、行わなかったモデルだけでなく、オリジナルモデルよりも
高いmean average precision (mAP)となった
考察
● 分類と違い、物体検出では位置に関する追加の特徴量が必要
● データ拡張は位置に関する特徴量を小さなものとして扱う
● 物体検出には適さない複雑なデータ拡張手法であってもrefinementによってモデルの性能が向上す
る可能性

大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to 大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック

Similar to 大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック (11)

More from 西岡賢一郎

More from 西岡賢一郎 (20)

Recently uploaded

Recently uploaded (11)