More Related Content
More from harmonylab (20)
Generating Diverse High-Fidelity Images with VQ-VAE-2
- 2. 背景
深層学習による2つの⽣成モデルタイプ
・Generative Adversarial Networks (GANs) などの暗黙(implicit)のモデル
GANは⾼品質,⾼解像度な画像を⽣成できるようになっているが,
真の分布の多様性を捉えられない,多様性の⽋如(mode collapse)を抱えている
・VAE,フローベース,⾃⼰回帰モデルなどの尤度を⽤いたモデル
尤度ベースは,負の対数尤度NLLを最適化する問題であり,各サンプルの確率に
対して最⼤化するため,mode collapseがない利点がある.
負の対数尤度NLL
図:https://ljvmiranda921.github.io/notebook/2017/08/13/softmax-and-the-negative-log-likelihood/
- 6. VQ-VAE Vector Quantization Variational AutoEncoder
Quantize:量⼦化.アナログ信号などの連続量を,整数などの離散値で近
似的に表現すること.値の精度を落とし,粗い区間に分け直すこと.
E(x): 画像xをエンコーダに⼊⼒した際の出⼒ベクトル(潜在ベクトルz)
コードブックへのマッピングをすることで,離散的な潜在空間に圧縮
(1)