Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
NAISTスプリングセミナー2017
 多腕バンディット問題とは?
 強化学習の一手法
 当たりの出る確率が未知のスロットを引
き続けて、報酬を最大に
 トランプゲームの大貧民(大富豪)を
プレイする AI(人工知能)の作り方を
学習!...
Upcoming SlideShare
Loading in …5
×

多腕バンディット問題のアルゴリズムを用いた大貧民AI

665 views

Published on

強化学習の技術として近年使用される多腕バンディット問題は、当たりが出る確率の異なる複数台のスロットマシンを回しながら、報酬を最大にするプレイ戦略を求める問題です。本実習では、多腕バンディット問題を解くアルゴリズムを用いて、トランプゲーム「大貧民」をプレイする人工知能(AI)プログラムを作成します。

Published in: Education
  • Be the first to comment

  • Be the first to like this

多腕バンディット問題のアルゴリズムを用いた大貧民AI

  1. 1. NAISTスプリングセミナー2017  多腕バンディット問題とは?  強化学習の一手法  当たりの出る確率が未知のスロットを引 き続けて、報酬を最大に  トランプゲームの大貧民(大富豪)を プレイする AI(人工知能)の作り方を 学習!  多腕バンディット問題を用いて強い AI を 作成  機械学習の知識は不要です。  使用プログラミング言語は任意です。 受講生のスキルに応じた実習内容 です。 多腕バンディット問題のアルゴリズムを用いた大貧民AI 大規模システム管理研究室 http://www-lsm.naist.jp 多腕バンディット問題 ゲーム木探索

×