Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
1
DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
“Learning Self-Imitating Diverse Policies (ICLR2019 under review)”
...
書誌情報
•URL
–OpenReview, ArXiv
•著者
–Tanmay Gangwani, Qiang Liu, Jian Peng
–イリノイ大学アーバナ・シャンペーン校
•ステータス
–ICLR2019 under review
...
概要
•背景:強化学習はエピソード報酬・スパース報酬・ノイジー報酬に弱い
–エピソード報酬:エピソードの最後のみ報酬が得られる
–スパース報酬:ある条件下でのみ報酬が得られる(eg. Montezuma’s Revenge )
–ノイジー報酬:...
1 of 14 Ad