Submit Search
Upload
部分観測モンテカルロ計画法を用いたガイスターAI
•
1 like
•
1,912 views
N
nishio
Follow
POMCPを用いたガイスターAIの実装
Read less
Read more
Education
Report
Share
Report
Share
1 of 8
Download now
Download to read offline
Recommended
量子アニーリングマシンのプログラミング
量子アニーリングマシンのプログラミング
nishio
量子アニーリングマシン(イジングマシン)の入力であるイジングモデルの設計方法について
夏プロ報告
夏プロ報告
nishio
2017年夏のプロシンの幹事体験談です
ITと経営
ITと経営
nishio
東工大MOT特別セミナーで講演したスライドです
交渉力について
交渉力について
nishio
交渉力についての雑な解説
If文から機械学習への道
If文から機械学習への道
nishio
機械学習とif文が地続きであることを解説しました。 ver.2 質問への回答を追加し、顧客価値の小問に図を追加してわかりやすくかみ砕きました。
組織横断型研究室構想
組織横断型研究室構想
nishio
第1回 田辺研究会での発表資料
2017首都大学東京情報通信特別講義
2017首都大学東京情報通信特別講義
nishio
2017の首都大学東京情報通信特別講義の講義資料
強化学習その5
強化学習その5
nishio
モンテカルロ計画法
Recommended
量子アニーリングマシンのプログラミング
量子アニーリングマシンのプログラミング
nishio
量子アニーリングマシン(イジングマシン)の入力であるイジングモデルの設計方法について
夏プロ報告
夏プロ報告
nishio
2017年夏のプロシンの幹事体験談です
ITと経営
ITと経営
nishio
東工大MOT特別セミナーで講演したスライドです
交渉力について
交渉力について
nishio
交渉力についての雑な解説
If文から機械学習への道
If文から機械学習への道
nishio
機械学習とif文が地続きであることを解説しました。 ver.2 質問への回答を追加し、顧客価値の小問に図を追加してわかりやすくかみ砕きました。
組織横断型研究室構想
組織横断型研究室構想
nishio
第1回 田辺研究会での発表資料
2017首都大学東京情報通信特別講義
2017首都大学東京情報通信特別講義
nishio
2017の首都大学東京情報通信特別講義の講義資料
強化学習その5
強化学習その5
nishio
モンテカルロ計画法
良いアイデアを出すための方法
良いアイデアを出すための方法
nishio
未踏ジュニアキャンプ2017のメンタープレゼンで話したスライドです
強化学習その4
強化学習その4
nishio
部分観測マルコフ決定過程
強化学習その3
強化学習その3
nishio
関連スライド一覧 https://github.com/nishio/reinforcement_learning
強化学習その2
強化学習その2
nishio
社内勉強会での講演資料
強化学習その1
強化学習その1
nishio
社内勉強会での講演資料
線形?非線形?
線形?非線形?
nishio
機械学習に関して「線形な学習機より非線形な学習機の方がよい」という誤解が根強い。 モデルの表現力は確かに非線形版の方が高い。が、トレードオフとして必要なデータ量も多い。 実際に少ないデータ量で非線形版を使うと何が起こるのか回帰を題材に実験して確認する。
機械学習キャンバス0.1
機械学習キャンバス0.1
nishio
「機械学習や人工知能で解決できないか」という相談を しばしば受ける。特にエンジニアではない人に経営学の言葉で 説明する時に、手持ちの道具では不足を感じる。 「ビジネスモデル」という漠然としたものの設計をわかりやすく するために「リーンキャンバス」というフレームワークが生まれ たみたいに「機械学習・人工知能」 に対してもキャンバスがあれ ばいいのではないか?そこでver. 0.1を作ってみた。
首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分
nishio
2016年首都大学東京「情報通信特別講義」で行なった講義の資料です。
勾配降下法の最適化アルゴリズム
勾配降下法の最適化アルゴリズム
nishio
モメンタム、Nesterov accelerated gradientとAdagrad, Adadelta, Adamについて解説しました。
Wifiで位置推定
Wifiで位置推定
nishio
社内勉強会(話スシ)で話した資料
ESP8266EXで位置推定
ESP8266EXで位置推定
nishio
ESP8266EXで位置推定
Raspberry PiでWifiルータを作る
Raspberry PiでWifiルータを作る
nishio
Raspberry PiをWifiアクセスポイントにする。 DHCPサーバもRaspberry Pi上で動かす。 そしてそのネットワークへのアクセスを、既存のWifiにルーティングする。 その手順を一歩一歩確認しながらやることでネットワークの知識を深める。
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
nishio
Raspberry Piを使えばWifi接続も簡単だがなにぶんサイズや電力消費が大きいのでもっとコンパクトなデバイスを使いたい。 そういうニーズでよく使われているデバイス(ESP-WROOM-02とか)について、用語の整理をしつつ解説する。
「ネットワークを作る」ってどういうこと?
「ネットワークを作る」ってどういうこと?
nishio
未踏ブースト会議2016にて
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
nishio
未踏社団の目的である「ネットワークを作ることでイノベーションを加速」について掘り下げて解説します。
未踏社団でのkintoneの活用
未踏社団でのkintoneの活用
nishio
業界横断的グループウェア構想と未踏社団でのkintoneの活用事例について解説しました。
創造的人材のための知財LT
創造的人材のための知財LT
nishio
2015年未踏忘年会での発表です。
コミュニティによる生産性向上のすすめ
コミュニティによる生産性向上のすすめ
nishio
互恵的コミュニティによって生産性を向上する方法について解説しました
エンジニアのための学ぶ技術
エンジニアのための学ぶ技術
nishio
BPStudy #98で講演した資料です
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用
nishio
このスライドの目的はルールベースは多くのプログラマができている。機械学習への橋渡しを詳細に解説することでツールとして機械学習を活用できる人を増やすことです。
More Related Content
More from nishio
良いアイデアを出すための方法
良いアイデアを出すための方法
nishio
未踏ジュニアキャンプ2017のメンタープレゼンで話したスライドです
強化学習その4
強化学習その4
nishio
部分観測マルコフ決定過程
強化学習その3
強化学習その3
nishio
関連スライド一覧 https://github.com/nishio/reinforcement_learning
強化学習その2
強化学習その2
nishio
社内勉強会での講演資料
強化学習その1
強化学習その1
nishio
社内勉強会での講演資料
線形?非線形?
線形?非線形?
nishio
機械学習に関して「線形な学習機より非線形な学習機の方がよい」という誤解が根強い。 モデルの表現力は確かに非線形版の方が高い。が、トレードオフとして必要なデータ量も多い。 実際に少ないデータ量で非線形版を使うと何が起こるのか回帰を題材に実験して確認する。
機械学習キャンバス0.1
機械学習キャンバス0.1
nishio
「機械学習や人工知能で解決できないか」という相談を しばしば受ける。特にエンジニアではない人に経営学の言葉で 説明する時に、手持ちの道具では不足を感じる。 「ビジネスモデル」という漠然としたものの設計をわかりやすく するために「リーンキャンバス」というフレームワークが生まれ たみたいに「機械学習・人工知能」 に対してもキャンバスがあれ ばいいのではないか?そこでver. 0.1を作ってみた。
首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分
nishio
2016年首都大学東京「情報通信特別講義」で行なった講義の資料です。
勾配降下法の最適化アルゴリズム
勾配降下法の最適化アルゴリズム
nishio
モメンタム、Nesterov accelerated gradientとAdagrad, Adadelta, Adamについて解説しました。
Wifiで位置推定
Wifiで位置推定
nishio
社内勉強会(話スシ)で話した資料
ESP8266EXで位置推定
ESP8266EXで位置推定
nishio
ESP8266EXで位置推定
Raspberry PiでWifiルータを作る
Raspberry PiでWifiルータを作る
nishio
Raspberry PiをWifiアクセスポイントにする。 DHCPサーバもRaspberry Pi上で動かす。 そしてそのネットワークへのアクセスを、既存のWifiにルーティングする。 その手順を一歩一歩確認しながらやることでネットワークの知識を深める。
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
nishio
Raspberry Piを使えばWifi接続も簡単だがなにぶんサイズや電力消費が大きいのでもっとコンパクトなデバイスを使いたい。 そういうニーズでよく使われているデバイス(ESP-WROOM-02とか)について、用語の整理をしつつ解説する。
「ネットワークを作る」ってどういうこと?
「ネットワークを作る」ってどういうこと?
nishio
未踏ブースト会議2016にて
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
nishio
未踏社団の目的である「ネットワークを作ることでイノベーションを加速」について掘り下げて解説します。
未踏社団でのkintoneの活用
未踏社団でのkintoneの活用
nishio
業界横断的グループウェア構想と未踏社団でのkintoneの活用事例について解説しました。
創造的人材のための知財LT
創造的人材のための知財LT
nishio
2015年未踏忘年会での発表です。
コミュニティによる生産性向上のすすめ
コミュニティによる生産性向上のすすめ
nishio
互恵的コミュニティによって生産性を向上する方法について解説しました
エンジニアのための学ぶ技術
エンジニアのための学ぶ技術
nishio
BPStudy #98で講演した資料です
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用
nishio
このスライドの目的はルールベースは多くのプログラマができている。機械学習への橋渡しを詳細に解説することでツールとして機械学習を活用できる人を増やすことです。
More from nishio
(20)
良いアイデアを出すための方法
良いアイデアを出すための方法
強化学習その4
強化学習その4
強化学習その3
強化学習その3
強化学習その2
強化学習その2
強化学習その1
強化学習その1
線形?非線形?
線形?非線形?
機械学習キャンバス0.1
機械学習キャンバス0.1
首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分
勾配降下法の最適化アルゴリズム
勾配降下法の最適化アルゴリズム
Wifiで位置推定
Wifiで位置推定
ESP8266EXで位置推定
ESP8266EXで位置推定
Raspberry PiでWifiルータを作る
Raspberry PiでWifiルータを作る
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
Wifiにつながるデバイス(ESP8266EX, ESP-WROOM-02, ESPr Developerなど)
「ネットワークを作る」ってどういうこと?
「ネットワークを作る」ってどういうこと?
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
「ネットワークを作ることでイノベーションを加速」ってどういうこと?
未踏社団でのkintoneの活用
未踏社団でのkintoneの活用
創造的人材のための知財LT
創造的人材のための知財LT
コミュニティによる生産性向上のすすめ
コミュニティによる生産性向上のすすめ
エンジニアのための学ぶ技術
エンジニアのための学ぶ技術
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用
部分観測モンテカルロ計画法を用いたガイスターAI
1.
部分観測モンテカルロ計画法 を用いたガイスターAI 2017-11-10 サイボウズ・ラボ 西尾泰和
2.
このスライドの目的 2017年11月のGPWでのガイスターAI大会に 提出したAIの中身を簡単に解説することで、 不完全情報要素の推測が重要な状況での AIの作り方に関する研究を促進する。 2 http://www2.matsue-ct.ac.jp/home/hashimoto/geister/
3.
部分観測マルコフ決定過程 ガイスターは状態のすべてが観測されない 「部分観測マルコフ決定過程」(POMDP)である。 その中でも、状態遷移確率が 明示的に与えられない厄介な問題である。 3
4.
部分観測モンテカルロ計画法 そういう状況で使えるのが部分観測モンテカルロ 計画法。 これは状態遷移確率の代わりに、繰り返し実行で きるブラックボックスシミュレータを与え、それ に対するモンテカルロで確率を陽に与えることな く問題を解く。 4 https://papers.nips.cc/paper/4031-monte-carlo-planning-in-large-pomdps
5.
部分観測モンテカルロ計画法 パーティクルフィルタ(aka 逐次モンテカルロ) とモンテカルロ木探索の組み合わせである。 5
6.
パーティクルフィルタ部分 観測できない状態を適当な分布(信念)からサンプ リングして決める。 その状態からシミュレータで相手手番を一手進め どんな手を打つか観察する。 シミュレータの出した手が、現実の手と一致する 物だけを残す。これが新しい信念。相手の手を観 察するたびに信念が更新される。 6
7.
モンテカルロ木探索部分 信念状態からのサンプリングで状態が定まる。 その状態から適当なRollout Policyに従って手を選 び対戦することでどの手の勝率が高いかの情報を 集める。これを木の形で溜めていく。 ある程度情報の集まっている局面についてはTree Policyで手を選択する。(有名なのはUCB1) 7
8.
現状 今回のコンテスト参加プログラムはGithubで 公開しているが、ローカルの実験用のリポジトリ とサーバ接続用クライアントのリポジトリを 締め切り間際にくっつけて無理やりつじつまを合 わせたコードなので、これをベースにするのはお すすめしない。 またParticle Reinvigorationを実装していないので 「思い込みの激しい性格」になっている。 8
Download now