Tracking emerges by colorizing videosの紹介
- 2. ◼ 論文
Tracking Emerges by Colorizing Videos
Carl Vondrick, Abhinav Shrivastava, Alireza Fathi, Sergio Guadarrama, Kevin Murphy
(Google Research)
ECCV2018
◼ 概要
⚫ 動画像追跡:認識・幾何・インタラクションのタスクで重要
⚫ 問題:追跡データセットの作成は多大なコストがかかる
→教師なしデータによる自己教師あり学習を導入
⚫ 提案:追跡のための自己教師あり学習を、「動画着色」タスクを解くことによって実現
⚫ ポイント:グレースケール画像から直接色を推定するのではなく、参照画像から色をコピー
概要
2
車を追跡した例
- 4. 4
着色モデルによる着色の例
𝐴𝑖𝑗 𝑐𝑖
𝑦𝑗 =
𝑖
1 2
3 4
0.2 0.2
0.2 0.2
0.2 0.9
0.2 0.2
0.2 0.2
0.2 0.2
0.2 0.2
0.2 0.2
1 2
3 4
類似度行列
ターゲット画像
参照画像
𝑦4 = 𝟎. 𝟗 × 255, 200, 200 + 0.2 × 255, 255, 255 + 0.2 × 255, 255, 255 + 0.2 × 255, 255, 255
1 2 3
𝑗
𝑖
4
4
ターゲット画像中の
画素𝑗
参照画像中の
画素𝑖
課題(3)
参照画像
2x2画像の例
1 2 3 4 1 2 3 4
?
1 2
3 4
1 2
3 4
グレースケール カラー
ターゲット画像
グレースケール カラー
1 2 3 4
1
3
2
4
- 5. 5
着色モデル(学習時)
𝑦𝑗 =
𝑖
𝐴𝑖𝑗𝑐𝑖
𝑓𝑖
𝑇
𝑓𝑗
σ𝑘 exp(𝑓𝑘
𝑇
𝑓𝑗)
ポインタ コピー
ターゲット画像
(時刻𝒕)
参照画像
(時刻は連続不要)
埋め込み
予測
𝑐𝑗
正解
min
𝜃
𝑗
ℒ(𝑦𝑗, 𝑐𝑗)
損失関数
𝜃
参照画像中の1画素のみを参照
するように設計(=ポインタ)
softmax
多クラス交差
エントロピー
※類似した色でも、埋め込み空間で
類似しているとは限らない
- 6. 6
着色モデルの応用
𝑐𝑖 ∈ ℝ𝑑
⚫ 領域追跡:各次元が各カテゴリの確率を示すようなベクトル
⚫ 人物姿勢追跡:各次元が各キーポイントの有無を示すような二値ベクトル
着色タスクでは、これを各画素𝑖におけるカラー情報とした
→置き換えることによって、他のタスクにも応用可能
着色モデルにおけるカラー情報を置き換えることにより、他の様々なタスクに応用可能
領域追跡 人物姿勢追跡
利点:いずれのタスクにおいても学習時に教師データが不要
- 8. 8
◼ 追跡タスクによく用いられる運動モデル
⚫ 等速運動、等加速度運動
⚫ 正規分布に基づくランダムウォーク
→急な運動変化への対応は困難
◼ 提案手法の状態空間モデルとしての理解
𝑥𝑡−1とは独立に、画像から得た𝑢𝑡を運動モデルに導入
⚫ 運動モデル
𝑥𝑡 = 𝐹 𝑥𝑡−1, 𝑢𝑡 + 𝑣𝑡
⚫ 観測モデル
𝑦𝑡 = 𝐻 𝑥𝑡 + 𝑤𝑡
※観測モデルは定義していないが使用可能
𝒖𝒕に着色モデルによる高精度な追跡結果を用いることで、
物体の急な運動変化に対応可能
従来の運動モデルの問題と提案手法
𝑥1 𝑥2
… 𝑥𝑡−1 𝑥𝑡
𝑦1 𝑦2
… 𝑦𝑡−1 𝑦𝑡
観測
状態
𝐹
𝐻
𝑢2
… 𝑢𝑡−1 𝑢𝑡
(参考)
*1 川本一彦, “オプティカルフロー駆動型運動モデルによる適応的な粒子フィルタ,”
Fuzzy System Symposium, 2007.