Mobility Technologies Co.,Ltd.
24
1. バッチでデータ追加すると似たデータが選ばれてしまう
a. 従来手法は単一のデータを追加して学習することを前提としている
b. 近年では学習に時間がかかるようになったため、バッチで追加する必要性がある
2. 多様性のある入力に対応できない
a. 従来の手法はシンプルな入力を前提としている
3. モデルに強く依存したデータセットになる
a. 途中でモデルが変わると精度が出ないという報告もある
従来の手法で言われる問題点
25.
Mobility Technologies Co.,Ltd.
25
● core-setというデータ集合を代表するデータを特
定する技術をALに適用
● データ全体の多様性を捉えることを目指す
● 追加することでデータ全体と学習データの距離
が最小になるようなデータを追加
● 全部計算するとNP困難なため貪欲法で計算
● 学習データ集合からの距離が最大のデータ
を見つけて追加しこれをN回繰り返す
● 距離計算にはネットワークの最終層から抽出し
たembeddingを使用
Active Learning for Convolutional Neural Networks: A Core-Set Approach
Mobility Technologies Co.,Ltd.
30
● Active Learning Literature Survey, 2009, Burr Settles, Computer Sciences Technical
Report 1648
● Active Learning 入門,
https://www.slideshare.net/shuyo/introduction-to-active-learning-25787487
● Overview of Active Learning for Deep Learning,
https://jacobgil.github.io/deeplearning/activelearning#active-learning-for-convolution
al-neural-networks--a-core-set-approach
● Active Learning for Convolutional Neural Networks: A Core-Set Approach, 2018, Ozan
Sener, ICLR
● Variational Adversarial Active Learning, 2019, Samarth Sinha, ICCV
● BatchBALD: Efficient and Diverse Batch Acquisition for Deep Bayesian Active Learning,
2019, Andreas Kirsch, NeurIPS
● 能動学習:問題設定と最近の話題, 2021, 日野英逸, 日本統計学会誌
参考