hiroki yamaoka

1 Follower

15 SlideShares 1 Follower 1 Following

15 SlideShares 1 Follower 1 Following

強化学習 prml 機械学習 reinforcement learning actor critic sarsa q学習決定理論 dqn ガウス過程 emアルゴリズム reinforce 方策勾配ベルマン残差関数近似スパースサンプリング r-max モデルベース exponential family 指数型分布族 off policy モンテカルロ td学習 on policy 方策オン方策オフ方策オン方策オフ off policy on policy アドバンテージ関数 q-learning ベルマン方程式ベルマン作用素ベルマン作用素ベルマン方程式 planning モデルフリー探索と活用のトレードオフプランニング machine learning

See more

Activity
About

PRML2.4 指数型分布族

4 years ago • 1399 Views

RL_chapter1_to_chapter4

3 years ago • 303 Views

強化学習1章

3 years ago • 371 Views

強化学習2章

3 years ago • 436 Views

強化学習3章

3 years ago • 242 Views

強化学習4章

3 years ago • 211 Views

強化学習5章

3 years ago • 175 Views

強化学習6章

3 years ago • 209 Views

PRML5.5

3 years ago • 61 Views

PRML4.3

3 years ago • 40 Views

PRML9.3

3 years ago • 19 Views

PRML6.4

3 years ago • 111 Views

DQN

3 years ago • 36 Views

PRML1.3

3 years ago • 37 Views

PRML1.5

3 years ago • 130 Views

深層生成モデルに基づく音声合成技術

NU_I_TODALAB • 1 year ago

最適輸送の解き方

joisino • 2 years ago

SSII2021 [TS2] 深層強化学習〜強化学習の基礎から応用まで〜

SSII • 2 years ago

音声の声質を変換する技術とその応用

NU_I_TODALAB • 6 years ago

計算論的学習理論入門 -PAC学習とかVC次元とか-

sleepy_yoshi • 10 years ago

Recent Advances on Transfer Learning and Related Topics Ver.2

Kota Matsui • 4 years ago

階層ベイズと自由エネルギー

Hiroshi Shimizu • 6 years ago

関数データ解析の概要とその方法

Hidetoshi Matsui • 3 years ago

古典的ゲームAIを用いたAlphaGo解説

suckgeun lee • 6 years ago

方策勾配型強化学習の基礎と応用

Ryo Iwaki • 6 years ago

NIPS2015読み会: Ladder Networks

Eiichi Matsumoto • 8 years ago

勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)

RyuichiKanoh • 3 years ago

SSII2020SS: グラフデータでも深層学習〜 Graph Neural Networks 入門〜

SSII • 3 years ago

[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation (NIPS2018)

Deep Learning JP • 5 years ago

深層学習の数理

Taiji Suzuki • 4 years ago

最適化超入門

Takami Sato • 9 years ago

グラフデータ分析入門編

順也山口 • 4 years ago

Reinforcement Learning @ NeurIPS2018

佑甲野 • 5 years ago

強化学習 prml 機械学習 reinforcement learning actor critic sarsa q学習決定理論 dqn ガウス過程 emアルゴリズム reinforce 方策勾配ベルマン残差関数近似スパースサンプリング r-max モデルベース exponential family 指数型分布族 off policy モンテカルロ td学習 on policy 方策オン方策オフ方策オン方策オフ off policy on policy アドバンテージ関数 q-learning ベルマン方程式ベルマン作用素ベルマン作用素ベルマン方程式 planning モデルフリー探索と活用のトレードオフプランニング machine learning

See more