Tags
強化学習
prml
機械学習
reinforcement learning
actor critic
sarsa
q学習
決定理論
dqn
ガウス過程
emアルゴリズム
reinforce
方策勾配
ベルマン残差
関数近似
スパースサンプリング
r-max
モデルベース
exponential family
指数型分布族
off policy
モンテカルロ
td学習
on policy
方策オン
方策オフ
方策オン
方策オフ
off policy
on policy
アドバンテージ関数
q-learning
ベルマン方程式
ベルマン作用素
ベルマン作用素
ベルマン方程式
planning
モデルフリー
探索と活用のトレードオフ
プランニング
machine learning
See more
Presentations
(15)Likes
(18)深層生成モデルに基づく音声合成技術
NU_I_TODALAB
•
1 year ago
最適輸送の解き方
joisino
•
2 years ago
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII
•
2 years ago
音声の声質を変換する技術とその応用
NU_I_TODALAB
•
6 years ago
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
•
10 years ago
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
•
4 years ago
階層ベイズと自由エネルギー
Hiroshi Shimizu
•
6 years ago
関数データ解析の概要とその方法
Hidetoshi Matsui
•
3 years ago
古典的ゲームAIを用いたAlphaGo解説
suckgeun lee
•
6 years ago
方策勾配型強化学習の基礎と応用
Ryo Iwaki
•
6 years ago
NIPS2015読み会: Ladder Networks
Eiichi Matsumoto
•
8 years ago
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
•
3 years ago
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
•
3 years ago
[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation (NIPS2018)
Deep Learning JP
•
5 years ago
深層学習の数理
Taiji Suzuki
•
4 years ago
最適化超入門
Takami Sato
•
9 years ago
グラフデータ分析 入門編
順也 山口
•
4 years ago
Reinforcement Learning @ NeurIPS2018
佑 甲野
•
5 years ago
Tags
強化学習
prml
機械学習
reinforcement learning
actor critic
sarsa
q学習
決定理論
dqn
ガウス過程
emアルゴリズム
reinforce
方策勾配
ベルマン残差
関数近似
スパースサンプリング
r-max
モデルベース
exponential family
指数型分布族
off policy
モンテカルロ
td学習
on policy
方策オン
方策オフ
方策オン
方策オフ
off policy
on policy
アドバンテージ関数
q-learning
ベルマン方程式
ベルマン作用素
ベルマン作用素
ベルマン方程式
planning
モデルフリー
探索と活用のトレードオフ
プランニング
machine learning
See more