Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
Ml15minutes 190330
Report
Rio Kurihara
Follow
Apr. 2, 2019
•
0 likes
3 likes
×
Be the first to like this
Show More
•
762 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Check these out next
【evar7】web担当者forum事例_part3
Shinichiro Oho
俺 と ご褒美 Bot
Masayuki KaToH
アジャイルソフトウェア開発の道具箱
Koichi ITO
connpass特徴と開発の流れ
Ikeda Yosuke
パーソナライズニュースを支えるML業務のまわしかた@Yahoo! JAPAN
Yahoo!デベロッパーネットワーク
【eVar7】web担当者forum part3-6番外編
Shinichiro Oho
Intalio japan special cloud workshop
Daisuke Sugai
20160416 プロジェクトの始め方【超入門】
Kuni Nakaji
1
of
19
Top clipped slide
Ml15minutes 190330
Apr. 2, 2019
•
0 likes
3 likes
×
Be the first to like this
Show More
•
762 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Report
Data & Analytics
2019/3/30に開催されたMachineLearning15minutesの発表資料です。
Rio Kurihara
Follow
Advertisement
Advertisement
Advertisement
Recommended
20180730 ds womens
Rio Kurihara
1K views
•
42 slides
20200605_wids_explainableAI
Rio Kurihara
3.2K views
•
40 slides
いまさら聞けない機械学習の評価指標
圭輔 大曽根
105K views
•
33 slides
機械学習システム開発案件の事例紹介
BrainPad Inc.
3.2K views
•
21 slides
あなたの業務に機械学習を活用する5つのポイント
Shohei Hido
50.6K views
•
36 slides
超スマート社会時代のシステム&ソフトウェア品質知識体系 - SQuBOK 2020 における AI、IoT、クラウド、オープンソース、アジャイル、DevO...
Hironori Washizaki
1.5K views
•
34 slides
More Related Content
Similar to Ml15minutes 190330
(20)
【evar7】web担当者forum事例_part3
Shinichiro Oho
•
1.7K views
俺 と ご褒美 Bot
Masayuki KaToH
•
712 views
アジャイルソフトウェア開発の道具箱
Koichi ITO
•
5.8K views
connpass特徴と開発の流れ
Ikeda Yosuke
•
1.5K views
パーソナライズニュースを支えるML業務のまわしかた@Yahoo! JAPAN
Yahoo!デベロッパーネットワーク
•
9.6K views
【eVar7】web担当者forum part3-6番外編
Shinichiro Oho
•
991 views
Intalio japan special cloud workshop
Daisuke Sugai
•
720 views
20160416 プロジェクトの始め方【超入門】
Kuni Nakaji
•
699 views
スマートフォンアプリエンジニアのための最新プロトタイピング講座
HiroyukiHirota
•
1.4K views
Introduction to NetOpsCoding#2
Taiji Tsuchiya
•
912 views
Moq & Fakes Framework を使った実践的ユニットテスト - BuildInsider
貴志 上坂
•
14.3K views
「まちの本屋の総合情報サイト」の紹介 カスタマイズ編
株式会社 オープンソース・ワークショップ
•
833 views
LT13(前半)Workshipにおけるレコメンドエンジン実装
GIG inc.
•
776 views
20120915 Pythonは本当にBlenderの役に立っているか?
Tetsuo Mitsuda
•
10.1K views
ML Opsのススメ
紀彦 中林
•
3.7K views
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
Preferred Networks
•
14.3K views
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
Shunsuke Nakamura
•
298 views
Microsoft Team Foundation Service 入門
You&I
•
3.7K views
IoTと業務システムをつなぐgRPC/RESTサービスの開発と運用
DeNA
•
6.3K views
Vantan shinsuke miyaki_upload
Shinsuke Miyaki
•
697 views
Recently uploaded
(20)
5cladba wiki
Viya18
•
16 views
#国外文凭办理U of U学位证成绩单
losapab511ockdiaom
•
0 views
Qlik医療データ活用勉強会_第26回_202305.pptx
QlikPresalesJapan
•
0 views
#全套原版1:1精仿约克大学学位证成绩单
pivepar3oflipcom
•
2 views
#国外文凭办理Edgewood学位证成绩单
ronime8068zatcom
•
0 views
#学位证靠谱办Sudbury文凭证书全套
76p522i4nqmocom
•
2 views
#全套原版1:1精仿U of G学位证成绩单
pivepar3oflipcom
•
2 views
★可查可存档〖制作曼尼托巴大学文凭证书毕业证〗
tujjj
•
2 views
#专业办证《Dal毕业证学位证原版精仿》
mibiri4418mevor
•
2 views
#学位证靠谱办泰普迪尼理工学院文凭证书全套
qghfsvkwiqiubridge
•
2 views
#全套原版1:1精仿不来梅大学学位证成绩单
b6f0190421d1rma
•
2 views
#学位证靠谱办乌尔姆大学文凭证书全套
qghfsvkwiqiubridge
•
3 views
#全套原版1:1精仿Leeds学位证成绩单
pivepar3oflipcom
•
2 views
★可查可存档〖制作阿苏萨太平洋大学文凭证书毕业证〗
fgfg45
•
2 views
★可查可存档〖制作麻省大学达特茅斯分校文凭证书毕业证〗
vvvvv24
•
3 views
#学位证靠谱办Spalding文凭证书全套
76p522i4nqmocom
•
2 views
#专业办证《Griffith毕业证学位证原版精仿》
ee61223771acdrman
•
2 views
★可查可存档〖制作堪萨斯大学文凭证书毕业证〗
fgfg45
•
2 views
#专业办证《梅西大学毕业证学位证原版精仿》
ee61223771acdrman
•
2 views
第11回スキル養成講座 講義スライド
keiodig
•
11 views
Advertisement
Ml15minutes 190330
モデルの精度向上を目指す前に考える キホンのキ 2019/3/30 Rio Kurihara ~画像認識の例~
はじめに 本日は私の実体験をもとに、 機械学習サービス開発のPoCで何を気を付けるべきかお話します 2 話すこと • 画像解析モデルを組み込んだサービスを開発するにあたって、 PoCで何を検討すべきか • 失敗談 話さないこと •
画像処理・画像解析の細かい技術 • 画像処理・画像解析以外の話(とはいえ基本的な考え方は共通しているはず)
Ajenda • 機械学習サービス開発の流れ • 実体験をもとにした失敗談 •
まとめ 3
機械学習サービス開発の流れ 4
機械学習サービス開発の流れ 5 PoC プロトタイプ 作成 実地検証 本開発 運用保守 •
何のためのPoC?よく考える。 • 最終的な運用を見据えた上で、PoCで何を検証するかを決める必要がある • なぜ? • 「課題が機械学習で解けるか」「精度がどれくらい出るか」だけをPoCで検証しても、 結局運用上の制約を考慮したらモデル組みなおし・・・等になることもあり得る 本日お話する部分
こわい話 6 PoC プロトタイプ 作成 実施検証 本開発 運用保守 超高精度モデルできたww クオリティ高めのプロトタイプもできたわww
7 PoC プロトタイプ 作成 実施検証 本開発 運用保守 こわい話 作ったはいいけど 現場の人に使ってもらえない・・・
全然運用に耐え得る 精度じゃない・・・ 新商品が出る度に開発に こんな時間かけられないよ・・・ 時間経過とともにモデルの精度が 下がっているような・・・ 本番環境の撮像環境が PoCと違う・・・ PoC貧乏 PoC疲れ
実際に失敗しました
9 今回例に出す麻雀PJの概要 • 画像をインプットにして麻雀牌を検出し、点数計算を自動化したい • サービス/アプリ化しようとしたときに失敗した
←具体例をお話します • 元々は自己研鑽目的だったのでアプリ化なんて考えていなかった プロセスイメージ 入力(画像) ※Sample 牌の識別 役名 1p 2p 3p … 8m 9m p f c 平和 1 1 1 … 0 0 0 0 0 断ヤオ 0 1 1 … 1 0 0 0 0 混一 0 0 0 … 1 1 3 0 0 点数計算 ルールベース
麻雀点数自動計算モデルのユースケース 画像取得 画像前処理 誤判別データの収集 前処理後画像での物体検出 ルールベースの点数計算 継続活用 新しい麻雀牌・マット等への対応 新しい麻雀牌の定義 (アノテーション) 画像収集 モデル性能の評価 モデルの調整と再学習 アプリケ―ションへのデプロイ モデル挙動のモニタリング ユーザーからのFB 挙動NG 評価NG ユーザが使うときの流れ モデルの改良や機能追加のために 開発者が実施する流れ “3000オール” ユーザ アップロード アプリとかサービスを作る時って、こういったユースケースを考えるかと思います
継続活用 新しい麻雀牌・マット等への対応 新しい麻雀牌の定義 (アノテーション) 画像収集 モデル性能の評価 モデルの調整と再学習 アプリケ―ションへのデプロイ モデル挙動のモニタリング ユーザーからのFB 挙動NG 評価NG モデルの改良や機能追加のために 開発者が実施する流れ 麻雀点数自動計算モデルのユースケース 画像取得 画像前処理 誤判別データの収集 前処理後画像での物体検出 ルールベースの点数計算 ユーザが使うときの流れ “3000オール” ユーザ アップロード どのくらいの頻度? 完全自動化? 何を性能とする? 定量評価は? 完全自動化? どの程度の スピードで? どんなフォーマット で出力? アノテーション方法? 質は?量は?誰が? オンプレ? クラウド? カメラの性能は? 撮像環境は? 誰が何を モニタリング? どんなデータが 必要? 頻度?基準? どうやって? カメラの性能は? ユースケースとPoCの設計の紐づけが甘かったことが失敗した原因 ハードウェア?
失敗談 (3つ) 12
継続活用 新しい麻雀牌・マット等への対応 新しい麻雀牌の定義 (アノテーション) 画像収集 モデル性能の評価 モデルの調整と再学習 アプリケ―ションへのデプロイ モデル挙動のモニタリング ユーザーからのFB 挙動NG 評価NG モデルの改良や機能追加のために 開発者が実施する流れ 麻雀点数自動計算モデルのユースケース 画像取得 画像前処理 誤判別データの収集 前処理後画像での物体検出 ルールベースの点数計算 ユーザが使うときの流れ “3000オール” ユーザ アップロード どのくらいの頻度? 完全自動化? 何を性能とする? 定量評価は? 完全自動化? どの程度の スピードで? どんなフォーマット で出力? どうやって? カメラの性能は? アノテーション方法? 質は?量は?誰が? オンプレ? クラウド? カメラの性能は? 誰が何を モニタリング? どんなデータが 必要? 頻度?基準?
失敗談 その1 カメラ性能・撮像環境 14 iPhone撮影 (学習データ) RasPiカメラ撮影 (本番環境) PoCはiPhoneカメラで撮影しNNモデルを構築。本番はRasPiで推論 ⇒
PoCで出ていた検出精度が本番環境で出ない (1000万画素vs500万画素) (見るからに画質がちがう)
継続活用 新しい麻雀牌・マット等への対応 新しい麻雀牌の定義 (アノテーション) 画像収集 モデル性能の評価 モデルの調整と再学習 アプリケ―ションへのデプロイ モデル挙動のモニタリング ユーザーからのFB 挙動NG 評価NG モデルの改良や機能追加のために 開発者が実施する流れ 麻雀点数自動計算モデルのユースケース 画像取得 画像前処理 誤判別データの収集 前処理後画像での物体検出 ルールベースの点数計算 ユーザが使うときの流れ “3000オール” ユーザ アップロード どのくらいの頻度? 完全自動化? 何を性能とする? 定量評価は? 完全自動化? どの程度の スピードで? どんなフォーマット で出力? どうやって? カメラの性能は? アノテーション方法? 質は?量は?誰が? オンプレ? クラウド? カメラの性能は? 誰が何を モニタリング? どんなデータが 必要? 頻度?基準?
16 失敗談 その2 推論時 LINEbot化しようとした 推論時に通信のオーバーヘッドがかかり、Messaging
APIの仕様にひっかかる ユーザー LINE bot サーバ herokuサーバ GPGPU 画像 送信受信 学習 推論 GPGPU LINE bot のシステム構成図
17 失敗談 その3 推論時 通信のオーバーヘッドをなくすために、エッジ推論を試してみた ⇒
SSD(PoCで組んでいた物体検出モデル)が基盤に載らない。MobileNetSSDで モデルを組みなおす ⇒ スピードの問題は無くなったが、精度はがた落ち 画像撮影・物体検出・結果出力 Vision Kit Vision Kitのシステム構成図 GCP MLEngine 推論学習
継続活用 新しい麻雀牌・マット等への対応 新しい麻雀牌の定義 (アノテーション) 画像収集 モデル性能の評価 モデルの調整と再学習 アプリケ―ションへのデプロイ モデル挙動のモニタリング ユーザーからのFB 挙動NG 評価NG モデルの改良や機能追加のために 開発者が実施する流れ 麻雀点数自動計算モデルのユースケース 画像取得 画像前処理 誤判別データの収集 前処理後画像での物体検出 ルールベースの点数計算 ユーザが使うときの流れ “3000オール” ユーザ アップロード どのくらいの頻度? 完全自動化? 何を性能とする? 定量評価は? 完全自動化? どの程度の スピードで? どんなフォーマット で出力? どうやって? カメラの性能は? アノテーション方法? 質は?量は?誰が? オンプレ? クラウド? カメラの性能は? 誰が何を モニタリング? どんなデータが 必要? 頻度?基準? その他の処理の部分でも PoCの設計が甘いことによる失敗は様々起き得ます
まとめ • PoCで精度だけ検証しても、使われないシステム/アプリができてしまう • ユースケースを考えた上で、逆算してPoCの設計をする必要がある •
実際に機械学習サービスを作ってみて、高精度なモデルが作れるだけではユー ザーへの価値提供ができないことを身を以て感じた • ユースケースを踏まえた分析設計、実装ができるようなエンジニアになりたい 19
Advertisement