ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement LearningPreferred Networks
Introduction of Deep Reinforcement Learning, which was presented at domestic NLP conference.
言語処理学会第24回年次大会(NLP2018) での講演資料です。
http://www.anlp.jp/nlp2018/#tutorial
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement LearningPreferred Networks
Introduction of Deep Reinforcement Learning, which was presented at domestic NLP conference.
言語処理学会第24回年次大会(NLP2018) での講演資料です。
http://www.anlp.jp/nlp2018/#tutorial
12. 制御分野で頻出 共通 機械学習分野で頻出
特徴 Dynamics
State
Stability
Continuous-time
Discrete-time
Model
Performance
Estimate
Analysis
Cost
Stochastic
Random variable
Distribution
Probability
Log-likelihood
道具 LMI (SDP)
SOS
Optimization
Least-squares
Gradient descent
Greedy
問題 Linear/Nonlinear Complexity High-dimensional
応用 Simulation results
Numerical example
Application Real world
Toy example
𝑶𝑶 𝒏𝒏𝟑𝟑 以下ならOK
線形+α
制御は浮世離れが進んでいる
(単純な非線形)高次
𝑶𝑶(𝒏𝒏)以下が好まれる