Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
nishio
1,929 views
部分観測モンテカルロ計画法を用いたガイスターAI
POMCPを用いたガイスターAIの実装
Education
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 8
2
/ 8
3
/ 8
4
/ 8
5
/ 8
6
/ 8
7
/ 8
8
/ 8
More Related Content
PDF
量子アニーリングマシンのプログラミング
by
nishio
PDF
夏プロ報告
by
nishio
PDF
ITと経営
by
nishio
PDF
交渉力について
by
nishio
PDF
If文から機械学習への道
by
nishio
PDF
組織横断型研究室構想
by
nishio
PDF
2017首都大学東京情報通信特別講義
by
nishio
PDF
強化学習その5
by
nishio
量子アニーリングマシンのプログラミング
by
nishio
夏プロ報告
by
nishio
ITと経営
by
nishio
交渉力について
by
nishio
If文から機械学習への道
by
nishio
組織横断型研究室構想
by
nishio
2017首都大学東京情報通信特別講義
by
nishio
強化学習その5
by
nishio
More from nishio
PDF
良いアイデアを出すための方法
by
nishio
PDF
強化学習その4
by
nishio
PDF
強化学習その3
by
nishio
PDF
強化学習その2
by
nishio
PDF
強化学習その1
by
nishio
PDF
線形?非線形?
by
nishio
PDF
機械学習キャンバス0.1
by
nishio
PDF
首都大学東京「情報通信特別講義」2016年西尾担当分
by
nishio
PPTX
勾配降下法の最適化アルゴリズム
by
nishio
PDF
Wifiで位置推定
by
nishio
PDF
ESP8266EXで位置推定
by
nishio
PDF
Raspberry PiでWifiルータを作る
by
nishio
PDF
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
by
nishio
PDF
「ネットワークを作る」ってどういうこと?
by
nishio
PDF
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
by
nishio
PDF
未踏社団でのkintoneの活用
by
nishio
PDF
創造的人材のための知財LT
by
nishio
PDF
コミュニティによる生産性向上のすすめ
by
nishio
PPTX
エンジニアのための学ぶ技術
by
nishio
PDF
ルールベースから機械学習への道 公開用
by
nishio
良いアイデアを出すための方法
by
nishio
強化学習その4
by
nishio
強化学習その3
by
nishio
強化学習その2
by
nishio
強化学習その1
by
nishio
線形?非線形?
by
nishio
機械学習キャンバス0.1
by
nishio
首都大学東京「情報通信特別講義」2016年西尾担当分
by
nishio
勾配降下法の最適化アルゴリズム
by
nishio
Wifiで位置推定
by
nishio
ESP8266EXで位置推定
by
nishio
Raspberry PiでWifiルータを作る
by
nishio
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
by
nishio
「ネットワークを作る」ってどういうこと?
by
nishio
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
by
nishio
未踏社団でのkintoneの活用
by
nishio
創造的人材のための知財LT
by
nishio
コミュニティによる生産性向上のすすめ
by
nishio
エンジニアのための学ぶ技術
by
nishio
ルールベースから機械学習への道 公開用
by
nishio
部分観測モンテカルロ計画法を用いたガイスターAI
1.
部分観測モンテカルロ計画法 を用いたガイスターAI 2017-11-10 サイボウズ・ラボ 西尾泰和
2.
このスライドの目的 2017年11月のGPWでのガイスターAI大会に 提出したAIの中身を簡単に解説することで、 不完全情報要素の推測が重要な状況での AIの作り方に関する研究を促進する。 2 http://www2.matsue-ct.ac.jp/home/hashimoto/geister/
3.
部分観測マルコフ決定過程 ガイスターは状態のすべてが観測されない 「部分観測マルコフ決定過程」(POMDP)である。 その中でも、状態遷移確率が 明示的に与えられない厄介な問題である。 3
4.
部分観測モンテカルロ計画法 そういう状況で使えるのが部分観測モンテカルロ 計画法。 これは状態遷移確率の代わりに、繰り返し実行で きるブラックボックスシミュレータを与え、それ に対するモンテカルロで確率を陽に与えることな く問題を解く。 4 https://papers.nips.cc/paper/4031-monte-carlo-planning-in-large-pomdps
5.
部分観測モンテカルロ計画法 パーティクルフィルタ(aka 逐次モンテカルロ) とモンテカルロ木探索の組み合わせである。 5
6.
パーティクルフィルタ部分 観測できない状態を適当な分布(信念)からサンプ リングして決める。 その状態からシミュレータで相手手番を一手進め どんな手を打つか観察する。 シミュレータの出した手が、現実の手と一致する 物だけを残す。これが新しい信念。相手の手を観 察するたびに信念が更新される。 6
7.
モンテカルロ木探索部分 信念状態からのサンプリングで状態が定まる。 その状態から適当なRollout Policyに従って手を選 び対戦することでどの手の勝率が高いかの情報を 集める。これを木の形で溜めていく。 ある程度情報の集まっている局面についてはTree Policyで手を選択する。(有名なのはUCB1) 7
8.
現状 今回のコンテスト参加プログラムはGithubで 公開しているが、ローカルの実験用のリポジトリ とサーバ接続用クライアントのリポジトリを 締め切り間際にくっつけて無理やりつじつまを合 わせたコードなので、これをベースにするのはお すすめしない。 またParticle Reinvigorationを実装していないので 「思い込みの激しい性格」になっている。 8
Download