Smart Grid Optimization by Deep Reinforcement Learning over Discrete and Cont...Tomoyuki Hioki
Smart Grid Optimization by Deep Reinforcement Learning over
Discrete and Continuous Action Space
The 32nd Annual Conference of the Japanese Society for Artificial Intelligence, 2018
【論文紹介】Deep Mimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills
1. DeepMimic: Example-Guided
Deep Reinforcement Learning of
Physics-Based Character Skills
XUE BIN PENG,
UC Berkeley
PIETER ABBEEL,
UC Berkeley
SERGEY LEVINE,
UC Berkeley
MICHIEL VAN DE
PANNE,
University of British
Columbia
arXiv:1804.02717
SIGGRAPH 2018
7. 6
深層強化学習の応⽤
Duan et al. 2016 :Benchmarking Deep Reinforcement Learning for Continuous Control
Heess et al. 2016 :Continuous control with deep reinforcement learning
深層強化学習によりスキルを習得し,⼀連のモーション⽣成に成功したが,
最先端のkinematic(運動学的)⼿法や⼿動で設計されたモーションには品質が劣る
Heess et al. 2017 :Emergence of Locomotion Behaviours in Rich Environments
深層強化学習の場合、体部運動や特殊な歩⾏状況では不⾃然なモーションをとる
8. 7
深層強化学習の応⽤
Da Silva et al. 2008 :Simulation of Human Motion Data using Short-Horizon
Model-Predictive Control
Lee et al. 2010a :Data-driven Biped Control
従来はKinematic⼿法で、システム上に物理ベースのトラッキングコントローラを
重ねて設計
実際の動きをデータ(Motion Capture Data)に取り込むことで品質を改善できた
深層強化学習エージェントに、モーションキャプチャまたは⼿作業による
アニメーションデータを組み込むことで学習の品質を改善したい