Submit Search
Upload
Open ai universe starter-agent触ってみた
•
0 likes
•
20,583 views
Nakanishi Tetsuhiro
Follow
PyData.Okinawa meetup23で利用したLTの資料です
Read less
Read more
Technology
Report
Share
Report
Share
1 of 27
Download now
Download to read offline
Recommended
Quantum teleportation
Quantum teleportation
YuuOkano
量子オートマトンの計算能力
量子オートマトンの計算能力
YuuOkano
0からコンピュータを作ってみた
0からコンピュータを作ってみた
YuuOkano
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Keiichi Hashimoto
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
Mitsushige Ishiguro
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
NVIDIA Japan
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
Windowsにpythonをインストールしてみよう
Windowsにpythonをインストールしてみよう
Kenji NAKAGAKI
Recommended
Quantum teleportation
Quantum teleportation
YuuOkano
量子オートマトンの計算能力
量子オートマトンの計算能力
YuuOkano
0からコンピュータを作ってみた
0からコンピュータを作ってみた
YuuOkano
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Keiichi Hashimoto
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
Mitsushige Ishiguro
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
NVIDIA Japan
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
Windowsにpythonをインストールしてみよう
Windowsにpythonをインストールしてみよう
Kenji NAKAGAKI
もしAppiumとディープラーニングを組み合わせたら
もしAppiumとディープラーニングを組み合わせたら
Nozomi Ito
Introduction of Unity ML-Agents
Introduction of Unity ML-Agents
Tomohiro Namba
Soft neuro
Soft neuro
ssuser3a4b8c
2010/8/27 TechEd2010 ライトニングトーク
2010/8/27 TechEd2010 ライトニングトーク
Sunao Tomita
1.29.user,user,user
1.29.user,user,user
Tonny Xu
Unity * スマートフォン開発で学んだこと
Unity * スマートフォン開発で学んだこと
Katsutoshi Makino
Infrastructure as CodeでReNom環境構築入門
Infrastructure as CodeでReNom環境構築入門
ReNom User Group
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
LeapMind Inc
TensorFlowで音声認識
TensorFlowで音声認識
祐太 上岡
できる!KickstartとAnsible!
できる!KickstartとAnsible!
Wataru NOGUCHI
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
0621 ndk game
0621 ndk game
cat kaotaro
知っ徳!納徳!Magic Leap 《デバイス編》
知っ徳!納徳!Magic Leap 《デバイス編》
Sadao Tokuyama
OpenNI 3Dセンサープログラミング
OpenNI 3Dセンサープログラミング
Kaoru NAKAMURA
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
TatsuyaKatayama
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
Hideki Takase
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
Takeshi Akutsu
GruntでJavaScript 前作業の自動化!
GruntでJavaScript 前作業の自動化!
leverages_event
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
Kotaro Ogino
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
More Related Content
Similar to Open ai universe starter-agent触ってみた
もしAppiumとディープラーニングを組み合わせたら
もしAppiumとディープラーニングを組み合わせたら
Nozomi Ito
Introduction of Unity ML-Agents
Introduction of Unity ML-Agents
Tomohiro Namba
Soft neuro
Soft neuro
ssuser3a4b8c
2010/8/27 TechEd2010 ライトニングトーク
2010/8/27 TechEd2010 ライトニングトーク
Sunao Tomita
1.29.user,user,user
1.29.user,user,user
Tonny Xu
Unity * スマートフォン開発で学んだこと
Unity * スマートフォン開発で学んだこと
Katsutoshi Makino
Infrastructure as CodeでReNom環境構築入門
Infrastructure as CodeでReNom環境構築入門
ReNom User Group
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
LeapMind Inc
TensorFlowで音声認識
TensorFlowで音声認識
祐太 上岡
できる!KickstartとAnsible!
できる!KickstartとAnsible!
Wataru NOGUCHI
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
0621 ndk game
0621 ndk game
cat kaotaro
知っ徳!納徳!Magic Leap 《デバイス編》
知っ徳!納徳!Magic Leap 《デバイス編》
Sadao Tokuyama
OpenNI 3Dセンサープログラミング
OpenNI 3Dセンサープログラミング
Kaoru NAKAMURA
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
TatsuyaKatayama
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
Hideki Takase
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
Takeshi Akutsu
GruntでJavaScript 前作業の自動化!
GruntでJavaScript 前作業の自動化!
leverages_event
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
Kotaro Ogino
Similar to Open ai universe starter-agent触ってみた
(20)
もしAppiumとディープラーニングを組み合わせたら
もしAppiumとディープラーニングを組み合わせたら
Introduction of Unity ML-Agents
Introduction of Unity ML-Agents
Soft neuro
Soft neuro
2010/8/27 TechEd2010 ライトニングトーク
2010/8/27 TechEd2010 ライトニングトーク
1.29.user,user,user
1.29.user,user,user
Unity * スマートフォン開発で学んだこと
Unity * スマートフォン開発で学んだこと
Infrastructure as CodeでReNom環境構築入門
Infrastructure as CodeでReNom環境構築入門
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
TensorFlowで音声認識
TensorFlowで音声認識
できる!KickstartとAnsible!
できる!KickstartとAnsible!
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
PredictionIOのPython対応計画
PredictionIOのPython対応計画
0621 ndk game
0621 ndk game
知っ徳!納徳!Magic Leap 《デバイス編》
知っ徳!納徳!Magic Leap 《デバイス編》
OpenNI 3Dセンサープログラミング
OpenNI 3Dセンサープログラミング
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
GruntでJavaScript 前作業の自動化!
GruntでJavaScript 前作業の自動化!
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
Recently uploaded
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Recently uploaded
(10)
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Open ai universe starter-agent触ってみた
1.
OpenAI universe-starter-agent 触ってみた
2.
今回の目標 - universe-starter-agentでAtari pongの学習をさせて遊んでみる
3.
学習の最終目標 - 強化学習を利用してアプリゲームなどのレベル上げを自動化したい
4.
5.
6.
OpenAI / universe
とは? - AIの知能を測定・学習するためのソフトウェアプラットフォーム - Universe上でAIエージェントは人間と同じようにコンピュータを利用することで学習 を行わせることができる
7.
OpenAI / universe-starter-agent
とは? - 以前のPyData.Okinawa meetupでも利用した、universeの環境に加えて、 TensorFlowで実装されたA3Cアルゴリズムが最初から実装されている - さまざまなuniverse上の環境を解決できるエージェントらしいが、実際はAtari pong の環境に最適化されているっぽい
8.
環境構築 → プロセスの起動 - リポジトリのREADMEを参照しながらやったらすぐできた - 環境構築がうまくいけばanacondaの仮想環境内でtmuxのセッションが立ち上がる
9.
ps:別々のワーカ間でパラメータを同期させるパラメータサーバ
10.
w-0:方策勾配法で強化学習を行うプロセス(なるほどわからん)
11.
w-1:環境から受け取ったランダムなノイズを利用するプロセス(なるほどわからん)
12.
tb:TenorBoardを動かすプロセス
13.
htop:マシンにかかる負荷を監視できる
14.
学習のようす - 53000ステップ目付近 - 160000ステップ目付近
15.
学習のようす:TensorBoardの global/reward_per_time
16.
所感 - 強化学習の理論の勉強ちょうむずかしそう - 2014年に購入した4CoreのMacを使ってるんですが、はやくもつらくなってきた。。 -
今度はマシンスペックに余裕のある環境(EC2)で構築してみる
17.
大変だったこと - 最近飼い始めたねこ(むぎ君)が邪魔してなかなか作業がはかどらなかった - ねこと強化学習の勉強は相性が悪い可能性あり(突然のCtrl-C!)
18.
ねこのハトムギ君
19.
これからやることリスト - スペックの高いマシンでの - A3Cアルゴリズムの勉強 -
universe-starter-agentのREADMEによると、さまざまな環境で使えるようなので ほかのゲームでも学習を試してみる - ねこと一緒に住んでても快適にコーディングできる術を考える
20.
参考文献 - universe-starter-agent - https://github.com/openai/universe-starter-agent -
OpenAI UniverseでするAtari Pongの強化学習 - http://qiita.com/TSY/items/9ef0db18d40233f023e8 - A3Cという強化学習アルゴリズムで遊んでみた話 - https://www.slideshare.net/mooopan/a3c-62170605
21.
さいごに - おもしろそうだなと思ってくれたそこのかた! - 一緒に勉強しましょう!(土下座)
22.
23.
GitHubのPyData.Okinawaリポジトリにあ るJupyter notebookがDeadKernelになる 人へ
24.
25.
つらみ(´・ω・`)
26.
解決方法 - 気になる方は”IT系バンドマンの日常”でけんさくけんさくぅ
27.
いつもよりはフランクな雰囲気だと 思いますのでなんでも聞いてください
Download now