Using neural networks methods in reinforcement learning tasks

1.
Нейросетевые методы в задачахобучения с подкреплением Михаил Бурцев, к.ф.-м.н., НИЦ "Курчатовский институт", МФТИ

2.
ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

3.
ПОСТАНОВКА ЗАДАЧИ

4.
ОСНОВНЫЕ ПОНЯТИЯ

5.
ВЫЧИСЛЕНИЕ ПОЛЕЗНОСТИ

6.
ПРОБЛЕМА “ПРОКЛЯТЬЯ РАЗМЕРНОСТИ”

7.
НЕЙРОСЕТЬ, КАК УНИВЕРСАЛЬНЫЙ АППРОКСИМАТОР

8.
ИГРА - МОДЕЛЬРЕАЛЬНОСТИ

11.
ГЛУБОКОЕ Q-ОБУЧЕНИЕ

12.
ПРОБЛЕМА что-то не сходится…

13.
ПРОИГРЫВАНИЕ ОПЫТА

14.
ЗАМОРОЗКА Q-СЕТИ

15.
ОГРАНИЧЕНИЕ АМПЛИТУДЫ НАГРАДЫ

16.
АРХИТЕКТУРА ГЛУБОКОЙ СЕТИ

18.
SEAQUEST

19.
ЧТО ОБЪЕДИНЯЕТ ЭТИХДВУХ ЛЮДЕЙ?

21.
ALPHAGO

22.
ПОИСК ПО ДЕРЕВУ

24.
DeepMind AlphaGo vsLee Sedol

26.
СПАСИБО ЗА ВНИМАНИЕ!

More Related Content