Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
1
DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
"SimPLe", "Improved Dynamics Model", "PlaNet"
近年のVAEベース系列モデルの進展とそのモ...
発表のモチベーション&目的
• モチベーション: モデルベースRL, 気づいたら進展してないか?
• PlaNet: D4PGの50+倍のサンプル効率(DeepMind Control Suit)
• SimPLe: Rainbowの2~10+...
AGENDA
• 前置き
• モデルベースRLと環境モデル
• 環境モデルのRLへの活用法
• 環境モデルの系列モデリングとしての区分
• 論文紹介
• SimPLe
• Improved Dynamics Model
• PlaNet
1 of 74 Ad