Submit Search
Upload
Open ai universe starter-agent触ってみた
•
0 likes
•
20,583 views
Nakanishi Tetsuhiro
Follow
PyData.Okinawa meetup23で利用したLTの資料です
Read less
Read more
Technology
Report
Share
Report
Share
1 of 27
Download now
Download to read offline
Recommended
Quantum teleportation
Quantum teleportation
YuuOkano
量子オートマトンの計算能力
量子オートマトンの計算能力
YuuOkano
0からコンピュータを作ってみた
0からコンピュータを作ってみた
YuuOkano
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Keiichi Hashimoto
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
Mitsushige Ishiguro
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
NVIDIA Japan
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
Windowsにpythonをインストールしてみよう
Windowsにpythonをインストールしてみよう
Kenji NAKAGAKI
Recommended
Quantum teleportation
Quantum teleportation
YuuOkano
量子オートマトンの計算能力
量子オートマトンの計算能力
YuuOkano
0からコンピュータを作ってみた
0からコンピュータを作ってみた
YuuOkano
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Global Azure Boot Camp 妖怪は見た!実録Azure事件簿
Keiichi Hashimoto
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
簡単に機械学習(画像)を使おうと思ったけど、駄目だった話
Mitsushige Ishiguro
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
NVIDIA Japan
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
Windowsにpythonをインストールしてみよう
Windowsにpythonをインストールしてみよう
Kenji NAKAGAKI
もしAppiumとディープラーニングを組み合わせたら
もしAppiumとディープラーニングを組み合わせたら
Nozomi Ito
Introduction of Unity ML-Agents
Introduction of Unity ML-Agents
Tomohiro Namba
Soft neuro
Soft neuro
ssuser3a4b8c
2010/8/27 TechEd2010 ライトニングトーク
2010/8/27 TechEd2010 ライトニングトーク
Sunao Tomita
1.29.user,user,user
1.29.user,user,user
Tonny Xu
Unity * スマートフォン開発で学んだこと
Unity * スマートフォン開発で学んだこと
Katsutoshi Makino
Infrastructure as CodeでReNom環境構築入門
Infrastructure as CodeでReNom環境構築入門
ReNom User Group
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
LeapMind Inc
TensorFlowで音声認識
TensorFlowで音声認識
祐太 上岡
できる!KickstartとAnsible!
できる!KickstartとAnsible!
Wataru NOGUCHI
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
0621 ndk game
0621 ndk game
cat kaotaro
知っ徳!納徳!Magic Leap 《デバイス編》
知っ徳!納徳!Magic Leap 《デバイス編》
Sadao Tokuyama
OpenNI 3Dセンサープログラミング
OpenNI 3Dセンサープログラミング
Kaoru NAKAMURA
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
TatsuyaKatayama
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
Hideki Takase
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
Takeshi Akutsu
GruntでJavaScript 前作業の自動化!
GruntでJavaScript 前作業の自動化!
leverages_event
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
Kotaro Ogino
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
More Related Content
Similar to Open ai universe starter-agent触ってみた
もしAppiumとディープラーニングを組み合わせたら
もしAppiumとディープラーニングを組み合わせたら
Nozomi Ito
Introduction of Unity ML-Agents
Introduction of Unity ML-Agents
Tomohiro Namba
Soft neuro
Soft neuro
ssuser3a4b8c
2010/8/27 TechEd2010 ライトニングトーク
2010/8/27 TechEd2010 ライトニングトーク
Sunao Tomita
1.29.user,user,user
1.29.user,user,user
Tonny Xu
Unity * スマートフォン開発で学んだこと
Unity * スマートフォン開発で学んだこと
Katsutoshi Makino
Infrastructure as CodeでReNom環境構築入門
Infrastructure as CodeでReNom環境構築入門
ReNom User Group
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
LeapMind Inc
TensorFlowで音声認識
TensorFlowで音声認識
祐太 上岡
できる!KickstartとAnsible!
できる!KickstartとAnsible!
Wataru NOGUCHI
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
0621 ndk game
0621 ndk game
cat kaotaro
知っ徳!納徳!Magic Leap 《デバイス編》
知っ徳!納徳!Magic Leap 《デバイス編》
Sadao Tokuyama
OpenNI 3Dセンサープログラミング
OpenNI 3Dセンサープログラミング
Kaoru NAKAMURA
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
TatsuyaKatayama
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
Hideki Takase
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
Takeshi Akutsu
GruntでJavaScript 前作業の自動化!
GruntでJavaScript 前作業の自動化!
leverages_event
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
Kotaro Ogino
Similar to Open ai universe starter-agent触ってみた
(20)
もしAppiumとディープラーニングを組み合わせたら
もしAppiumとディープラーニングを組み合わせたら
Introduction of Unity ML-Agents
Introduction of Unity ML-Agents
Soft neuro
Soft neuro
2010/8/27 TechEd2010 ライトニングトーク
2010/8/27 TechEd2010 ライトニングトーク
1.29.user,user,user
1.29.user,user,user
Unity * スマートフォン開発で学んだこと
Unity * スマートフォン開発で学んだこと
Infrastructure as CodeでReNom環境構築入門
Infrastructure as CodeでReNom環境構築入門
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
20180613 [TensorFlow分散学習] Horovodによる分散学習の実装方法と解説
TensorFlowで音声認識
TensorFlowで音声認識
できる!KickstartとAnsible!
できる!KickstartとAnsible!
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
PredictionIOのPython対応計画
PredictionIOのPython対応計画
0621 ndk game
0621 ndk game
知っ徳!納徳!Magic Leap 《デバイス編》
知っ徳!納徳!Magic Leap 《デバイス編》
OpenNI 3Dセンサープログラミング
OpenNI 3Dセンサープログラミング
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
OpenMDAOの最適化を試す(第23回オープンCAE勉強会@関西)
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
IoTアプリ/ロボット開発をリアルタイムOSでレベルアップしませんか? ~高品質な組込み向けオープンソースを開発するTOPPERSプロジェクトのご紹介~
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
GruntでJavaScript 前作業の自動化!
GruntでJavaScript 前作業の自動化!
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
【DevLOVE現場甲子園2013】Software Engineer in Test @ 楽天の検索基盤の現場
Recently uploaded
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
Recently uploaded
(14)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
Open ai universe starter-agent触ってみた
1.
OpenAI universe-starter-agent 触ってみた
2.
今回の目標 - universe-starter-agentでAtari pongの学習をさせて遊んでみる
3.
学習の最終目標 - 強化学習を利用してアプリゲームなどのレベル上げを自動化したい
4.
5.
6.
OpenAI / universe
とは? - AIの知能を測定・学習するためのソフトウェアプラットフォーム - Universe上でAIエージェントは人間と同じようにコンピュータを利用することで学習 を行わせることができる
7.
OpenAI / universe-starter-agent
とは? - 以前のPyData.Okinawa meetupでも利用した、universeの環境に加えて、 TensorFlowで実装されたA3Cアルゴリズムが最初から実装されている - さまざまなuniverse上の環境を解決できるエージェントらしいが、実際はAtari pong の環境に最適化されているっぽい
8.
環境構築 → プロセスの起動 - リポジトリのREADMEを参照しながらやったらすぐできた - 環境構築がうまくいけばanacondaの仮想環境内でtmuxのセッションが立ち上がる
9.
ps:別々のワーカ間でパラメータを同期させるパラメータサーバ
10.
w-0:方策勾配法で強化学習を行うプロセス(なるほどわからん)
11.
w-1:環境から受け取ったランダムなノイズを利用するプロセス(なるほどわからん)
12.
tb:TenorBoardを動かすプロセス
13.
htop:マシンにかかる負荷を監視できる
14.
学習のようす - 53000ステップ目付近 - 160000ステップ目付近
15.
学習のようす:TensorBoardの global/reward_per_time
16.
所感 - 強化学習の理論の勉強ちょうむずかしそう - 2014年に購入した4CoreのMacを使ってるんですが、はやくもつらくなってきた。。 -
今度はマシンスペックに余裕のある環境(EC2)で構築してみる
17.
大変だったこと - 最近飼い始めたねこ(むぎ君)が邪魔してなかなか作業がはかどらなかった - ねこと強化学習の勉強は相性が悪い可能性あり(突然のCtrl-C!)
18.
ねこのハトムギ君
19.
これからやることリスト - スペックの高いマシンでの - A3Cアルゴリズムの勉強 -
universe-starter-agentのREADMEによると、さまざまな環境で使えるようなので ほかのゲームでも学習を試してみる - ねこと一緒に住んでても快適にコーディングできる術を考える
20.
参考文献 - universe-starter-agent - https://github.com/openai/universe-starter-agent -
OpenAI UniverseでするAtari Pongの強化学習 - http://qiita.com/TSY/items/9ef0db18d40233f023e8 - A3Cという強化学習アルゴリズムで遊んでみた話 - https://www.slideshare.net/mooopan/a3c-62170605
21.
さいごに - おもしろそうだなと思ってくれたそこのかた! - 一緒に勉強しましょう!(土下座)
22.
23.
GitHubのPyData.Okinawaリポジトリにあ るJupyter notebookがDeadKernelになる 人へ
24.
25.
つらみ(´・ω・`)
26.
解決方法 - 気になる方は”IT系バンドマンの日常”でけんさくけんさくぅ
27.
いつもよりはフランクな雰囲気だと 思いますのでなんでも聞いてください
Download now