Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Model-Free Episodic Control
Neural Episodic Control
M2 塩谷碩彬
2017/4/21
強化学習の進歩により色々凄いことができそう
● Atari
● Alpha Go
● hand eye cordination
● guided policy search
強化学習は進歩したけど、まだ人間に及ばない点も
進歩したところ 人間に及ばないところ
学習の早さ 効率化する手法が数多く提
案されている
one shotをうたう手法も
とはいえ時間かかりすぎ
atariで人間と同等の性能に
なるのに924時間...
1 of 23 Ad