SlideShare a Scribd company logo
1 of 9
強化学習を可視化する
chainerrl-visualizerを動かしてみた
28.Jan.2019
Machine Learning Casual Talks #8 LT
Takashi,MOGAMI
@mogamin
WHO AM I?
Takashi,MOGAMI / @mogamin
ウルシステムズ株式会社
シニアコンサルタント
画像処理(OpenCV)、ディープラーニング系をメインに業務をしておりま
す。最近では強化学習を使った研究開発プロジェクトを推進しています
が、時間を見つけてはkaggleやSIGNATEで技術を磨いております。
- Scrum Master
- AWS Certified Solutions Architect Professional
AGENDA
- 「ありの行列」の話
- 強化学習とは
- 強化学習のつらい所
- chainerrl-visualizer
- try! demo.
※本内容は個人の見解です。所属組織とは一切関係ありません。
強化学習とは
- エージェント(学習の主体)が環境から得られる状態に対し
て、報酬を最大化するように行動を学習する。
- 何がうれしいかというと、正答データがない問題でも報
酬を正しく定義できれば問題を解くことができる。
※https://www.slideshare.net/ssuserf2c42e/20190125-minecraft-129160073
Agent Environment
action
observation, reward
強化学習のつらい所
- 報酬設計がむずい
- いつ報酬を与えるべきか、いつ罰を与えるべきか
- マルチワーカーが苦手
- 画像認識のようにGPUをフルに使えない。CPUパワーに依存する
- シュミレータの開発コストが高い
- 実際の環境、状態を網羅するシュミレータが必要
- マルコフ決定過程をちゃんと成立させて作る
- 状態が変わらなければ意味がないaction?
- 方策設計はどうあるべきか
- いつまでも奇跡、神の手を待っていると永遠に終わらない。
- アルゴリズム部、Deep Q-Network部、超絶 試行錯誤
- やってみないとわからない。評価軸は?まずは可視化が必要!
そこで、Chainerrl-Visualizer
- XXX
すごく簡単。
$ git clone chainerrl-visualizer
$ cd いずれかのexampleフォルダへ...
$ python ./main.py
Chainerrl-Visualizer
- XXX
当該STEPにおけるSTEP時
系列なOUTPUT層の出力値
(100%積上げ)
STEP時系列なOUTPUT層
の出力値(100%積上げ)
その時の画面とGrad-CAM
による特徴抽出の可視化
try! demo.
ありがとうございました。
We are now hiring!
@mogaminまで

More Related Content

What's hot

サンプル発話からVUXを考える
サンプル発話からVUXを考えるサンプル発話からVUXを考える
サンプル発話からVUXを考える紗良 松本 (Ohtani)
 
Fringe81内定者研修2013 yコンベンチャー発表資料
Fringe81内定者研修2013 yコンベンチャー発表資料Fringe81内定者研修2013 yコンベンチャー発表資料
Fringe81内定者研修2013 yコンベンチャー発表資料Yuzuru Tanaka
 
技術者の自分が11年間会社を経営して学んだ7つのこと
技術者の自分が11年間会社を経営して学んだ7つのこと技術者の自分が11年間会社を経営して学んだ7つのこと
技術者の自分が11年間会社を経営して学んだ7つのことHaruo Sato
 
泥臭い受託開発Dev love関西
泥臭い受託開発Dev love関西泥臭い受託開発Dev love関西
泥臭い受託開発Dev love関西Toshiyuki Ohtomo
 
名古屋アジャイル勉強会「モチベーションはどこからくるの?」
名古屋アジャイル勉強会「モチベーションはどこからくるの?」名古屋アジャイル勉強会「モチベーションはどこからくるの?」
名古屋アジャイル勉強会「モチベーションはどこからくるの?」hiroyuki Yamamoto
 
ただのエンジニアチームの改善を謀ったら。。。
ただのエンジニアチームの改善を謀ったら。。。ただのエンジニアチームの改善を謀ったら。。。
ただのエンジニアチームの改善を謀ったら。。。Shoko Kayano
 
Teachme for training
Teachme for trainingTeachme for training
Teachme for trainingKeitaro Shoji
 
アジャイルの本質 - Agile Japan 2019サテライト名古屋
アジャイルの本質 - Agile Japan 2019サテライト名古屋アジャイルの本質 - Agile Japan 2019サテライト名古屋
アジャイルの本質 - Agile Japan 2019サテライト名古屋hiroyuki Yamamoto
 
20210915 株式会社旅武者紹介資料v21.9
20210915 株式会社旅武者紹介資料v21.920210915 株式会社旅武者紹介資料v21.9
20210915 株式会社旅武者紹介資料v21.9yohei yamaguchi
 
オブジェクト指向を学んで図解力、仕事力アップ
オブジェクト指向を学んで図解力、仕事力アップオブジェクト指向を学んで図解力、仕事力アップ
オブジェクト指向を学んで図解力、仕事力アップHaruo Sato
 
[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう
[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう
[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えようShigeki Morizane
 
海外武者修行プログラム Rev.2
海外武者修行プログラム Rev.2海外武者修行プログラム Rev.2
海外武者修行プログラム Rev.2yohei yamaguchi
 
SnapmartにおけるCameraRollから写真の複数枚アップロードの実装
SnapmartにおけるCameraRollから写真の複数枚アップロードの実装SnapmartにおけるCameraRollから写真の複数枚アップロードの実装
SnapmartにおけるCameraRollから写真の複数枚アップロードの実装PIXTA Inc.
 
企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して
企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して
企業主催勉強会BPStudy〜個人が輝くコミュニティを目指してHaruo Sato
 
[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み
[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み
[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩みShigeki Morizane
 

What's hot (17)

サンプル発話からVUXを考える
サンプル発話からVUXを考えるサンプル発話からVUXを考える
サンプル発話からVUXを考える
 
Fringe81内定者研修2013 yコンベンチャー発表資料
Fringe81内定者研修2013 yコンベンチャー発表資料Fringe81内定者研修2013 yコンベンチャー発表資料
Fringe81内定者研修2013 yコンベンチャー発表資料
 
技術者の自分が11年間会社を経営して学んだ7つのこと
技術者の自分が11年間会社を経営して学んだ7つのこと技術者の自分が11年間会社を経営して学んだ7つのこと
技術者の自分が11年間会社を経営して学んだ7つのこと
 
泥臭い受託開発Dev love関西
泥臭い受託開発Dev love関西泥臭い受託開発Dev love関西
泥臭い受託開発Dev love関西
 
名古屋アジャイル勉強会「モチベーションはどこからくるの?」
名古屋アジャイル勉強会「モチベーションはどこからくるの?」名古屋アジャイル勉強会「モチベーションはどこからくるの?」
名古屋アジャイル勉強会「モチベーションはどこからくるの?」
 
ただのエンジニアチームの改善を謀ったら。。。
ただのエンジニアチームの改善を謀ったら。。。ただのエンジニアチームの改善を謀ったら。。。
ただのエンジニアチームの改善を謀ったら。。。
 
Teachme for training
Teachme for trainingTeachme for training
Teachme for training
 
アジャイルの本質 - Agile Japan 2019サテライト名古屋
アジャイルの本質 - Agile Japan 2019サテライト名古屋アジャイルの本質 - Agile Japan 2019サテライト名古屋
アジャイルの本質 - Agile Japan 2019サテライト名古屋
 
shikigaku.pdf
shikigaku.pdfshikigaku.pdf
shikigaku.pdf
 
大規模JavaScript開発
大規模JavaScript開発大規模JavaScript開発
大規模JavaScript開発
 
20210915 株式会社旅武者紹介資料v21.9
20210915 株式会社旅武者紹介資料v21.920210915 株式会社旅武者紹介資料v21.9
20210915 株式会社旅武者紹介資料v21.9
 
オブジェクト指向を学んで図解力、仕事力アップ
オブジェクト指向を学んで図解力、仕事力アップオブジェクト指向を学んで図解力、仕事力アップ
オブジェクト指向を学んで図解力、仕事力アップ
 
[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう
[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう
[XP祭り2017][B-3(1)]DevOps時代のプロジェクトマネージメントを考えよう
 
海外武者修行プログラム Rev.2
海外武者修行プログラム Rev.2海外武者修行プログラム Rev.2
海外武者修行プログラム Rev.2
 
SnapmartにおけるCameraRollから写真の複数枚アップロードの実装
SnapmartにおけるCameraRollから写真の複数枚アップロードの実装SnapmartにおけるCameraRollから写真の複数枚アップロードの実装
SnapmartにおけるCameraRollから写真の複数枚アップロードの実装
 
企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して
企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して
企業主催勉強会BPStudy〜個人が輝くコミュニティを目指して
 
[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み
[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み
[POStudy]大きなSIerの中で「アジャイルな開発で飯を食う」までの歩み
 

Similar to 強化学習を可視化する chainerrl-visualizerを動かしてみた

Azure における強化学習への取り組み
Azure における強化学習への取り組みAzure における強化学習への取り組み
Azure における強化学習への取り組みKeita Onabuta
 
大規模スクラムの失敗から学んだこと #AgileJapan2015
大規模スクラムの失敗から学んだこと #AgileJapan2015大規模スクラムの失敗から学んだこと #AgileJapan2015
大規模スクラムの失敗から学んだこと #AgileJapan2015Itsuki Sakitsu
 
Introduction to Agile - how business and engineer team up
Introduction to Agile - how business and engineer team upIntroduction to Agile - how business and engineer team up
Introduction to Agile - how business and engineer team upKenji Hiranabe
 
アジャイルとスクラムとは 原則、価値、プラクティス
アジャイルとスクラムとは 原則、価値、プラクティスアジャイルとスクラムとは 原則、価値、プラクティス
アジャイルとスクラムとは 原則、価値、プラクティスYasui Tsutomu
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)cvpaper. challenge
 
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成Trainocate Japan, Ltd.
 
大規模並列実験を支えるクラウドサービスと基盤技術
大規模並列実験を支えるクラウドサービスと基盤技術大規模並列実験を支えるクラウドサービスと基盤技術
大規模並列実験を支えるクラウドサービスと基盤技術RyuichiKanoh
 
[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨
[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨
[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨Yuichiro Yamamoto
 
本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」
本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」
本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」Susumu Yamazaki
 
Jupyter勉強会 20160701 at NII
Jupyter勉強会 20160701 at NIIJupyter勉強会 20160701 at NII
Jupyter勉強会 20160701 at NIIaxsh co., LTD.
 
[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ
[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ
[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップShigeki Morizane
 
ID説明資料20130107ver1.0
ID説明資料20130107ver1.0ID説明資料20130107ver1.0
ID説明資料20130107ver1.0Norihiro Oku
 
1028 TECH & BRIDGE MEETING
1028 TECH & BRIDGE MEETING1028 TECH & BRIDGE MEETING
1028 TECH & BRIDGE MEETING健司 亀本
 
インターンシップ制度について
インターンシップ制度についてインターンシップ制度について
インターンシップ制度についてYuichi Morito
 
KLabのエンジニアを支えるカルチャー
KLabのエンジニアを支えるカルチャーKLabのエンジニアを支えるカルチャー
KLabのエンジニアを支えるカルチャーKLab Inc. / Tech
 
あなたのチームの「いい人」は機能していますか?
あなたのチームの「いい人」は機能していますか?あなたのチームの「いい人」は機能していますか?
あなたのチームの「いい人」は機能していますか?Minoru Yokomichi
 
【SQiP2016】楽天のアジャイル開発とメトリクス事例
【SQiP2016】楽天のアジャイル開発とメトリクス事例【SQiP2016】楽天のアジャイル開発とメトリクス事例
【SQiP2016】楽天のアジャイル開発とメトリクス事例Kotaro Ogino
 
No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~
No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~
No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~You&I
 

Similar to 強化学習を可視化する chainerrl-visualizerを動かしてみた (20)

Azure における強化学習への取り組み
Azure における強化学習への取り組みAzure における強化学習への取り組み
Azure における強化学習への取り組み
 
To be sn agile enterprise
To be sn agile enterpriseTo be sn agile enterprise
To be sn agile enterprise
 
大規模スクラムの失敗から学んだこと #AgileJapan2015
大規模スクラムの失敗から学んだこと #AgileJapan2015大規模スクラムの失敗から学んだこと #AgileJapan2015
大規模スクラムの失敗から学んだこと #AgileJapan2015
 
Introduction to Agile - how business and engineer team up
Introduction to Agile - how business and engineer team upIntroduction to Agile - how business and engineer team up
Introduction to Agile - how business and engineer team up
 
アジャイルとスクラムとは 原則、価値、プラクティス
アジャイルとスクラムとは 原則、価値、プラクティスアジャイルとスクラムとは 原則、価値、プラクティス
アジャイルとスクラムとは 原則、価値、プラクティス
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
 
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
 
大規模並列実験を支えるクラウドサービスと基盤技術
大規模並列実験を支えるクラウドサービスと基盤技術大規模並列実験を支えるクラウドサービスと基盤技術
大規模並列実験を支えるクラウドサービスと基盤技術
 
スクラム再入門
スクラム再入門スクラム再入門
スクラム再入門
 
[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨
[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨
[Agile Tour Osaka 2013] プロジェクトを導くしなやかな背骨
 
本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」
本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」
本学部でのアクティブラーニングの導入事例
~コンセプトは「多読と発表」「原理と概念の理解」
 
Jupyter勉強会 20160701 at NII
Jupyter勉強会 20160701 at NIIJupyter勉強会 20160701 at NII
Jupyter勉強会 20160701 at NII
 
[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ
[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ
[Agile Japan 2019]DXを実現するためにユーザ企業とSI企業が 今すぐとるべき3つのステップ
 
ID説明資料20130107ver1.0
ID説明資料20130107ver1.0ID説明資料20130107ver1.0
ID説明資料20130107ver1.0
 
1028 TECH & BRIDGE MEETING
1028 TECH & BRIDGE MEETING1028 TECH & BRIDGE MEETING
1028 TECH & BRIDGE MEETING
 
インターンシップ制度について
インターンシップ制度についてインターンシップ制度について
インターンシップ制度について
 
KLabのエンジニアを支えるカルチャー
KLabのエンジニアを支えるカルチャーKLabのエンジニアを支えるカルチャー
KLabのエンジニアを支えるカルチャー
 
あなたのチームの「いい人」は機能していますか?
あなたのチームの「いい人」は機能していますか?あなたのチームの「いい人」は機能していますか?
あなたのチームの「いい人」は機能していますか?
 
【SQiP2016】楽天のアジャイル開発とメトリクス事例
【SQiP2016】楽天のアジャイル開発とメトリクス事例【SQiP2016】楽天のアジャイル開発とメトリクス事例
【SQiP2016】楽天のアジャイル開発とメトリクス事例
 
No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~
No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~
No Managers, Yes Agile. ~アジャイルなプロジェクト管理とは~
 

強化学習を可視化する chainerrl-visualizerを動かしてみた