Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
DEEP LEARNING JP
[DL Papers]
“Learning to Predict without Looking Ahead: World Models
without Forward Prediction” NeurIPS2...
書誌情報
• 著者:C. Daniel Freeman, Luke Metz, David Ha
• 所属:Google Brain
• 概要:
– 世界モデル研究(a.k.a モデルベース強化学習)系の研究
– 世界モデル研究では、多くの場合...
背景:モデルベース強化学習
• 記法
– s:状態, o:観測, a:行動
– M: モデル(時刻tにおけるsとtから次の時刻のsを予測),
– π:方策(何らかの情報からaを決定)
• モデルベース強化学習では環境のモデルMを学習する
• 活...
1 of 22 Ad