13. Lv.3 機械学習システムへの進化方法
● 機械学習システムを量産可能な仕組みが必要
● 機械学習基盤で解決 → Googleが提唱する概念
● プロダクション運用までの時間が月単位から週単位へ
● TFXを使うことで Google Playのインストールが2% UP!!
KDD Link here, KDD Video here, Paper Link here, Author Demo Video here .
14. Kubeflow
● kubernetes 上で動く機械学習ツールキット
○ Goal: End to End の機械学習システムを提供
● Current Ver. : 0.2 (2018.12.16 に1.0リリース予定)
○ Simple : 数々の機能を Kubeflowで提供
○ Portable : k8sが動く場所ならどこでも動く
○ Scalable : k8sの機能を使ってスケーラビリティも担保
17. Workflow on Kubeflow
Data
Split
Roll-out Serving Monitoring Logging
Trainer
Building
a
Model
Model
Validation
Training
at Scale
Data
ingestion
Data
Analysis
Data
Transfor-
mation
Data
Validation
Ref: Kubeflow Deep Dive – David Aronchick & Jeremy Lewi, Google (Intermediate Skill Level)
18. Workflow on Kubeflow
Data
Split
Roll-out Serving Monitoring Logging
Trainer
Building
a
Model
Model
Validation
Training
at Scale
Data
ingestion
Data
Analysis
Data
Transfor-
mation
Data
Validation
Ref: Kubeflow Deep Dive – David Aronchick & Jeremy Lewi, Google (Intermediate Skill Level)
22. Pachyderm: 複雑なデータパイプラインの管理
Data
Split
Roll-out Serving Monitoring Logging
Trainer
Building
a
Model
Model
Validation
Training
at Scale
Data
ingestion
Data
Analysis
Data
Transfor-
mation
Data
Validation
Ref: Kubeflow Deep Dive – David Aronchick & Jeremy Lewi, Google (Intermediate Skill Level)
23. Jupyterhub: 協働可能なモデル作成
Data
Split
Roll-out Serving Monitoring Logging
Trainer
Building
a
Model
Model
Validation
Training
at Scale
Data
ingestion
Data
Analysis
Data
Transfor-
mation
Data
Validation
Ref: Kubeflow Deep Dive – David Aronchick & Jeremy Lewi, Google (Intermediate Skill Level)
Katib
26. ● コンテナベースのハイパーパラメータチューニングツール
● Google Vizierと呼ばれるKDD2017で発表されたGoogleの
ブラックボックス最適化の手法からインスパイア
● 特定のDLフレームワークに依存せずにチューニングが可能
a. Random
b. Grid
c. Hyperband
d. Bayesian Optimization
Katib: ハイパーパラメータチューニング
28. Serving: 推論結果をAPIとして提供
Data
Split
Roll-out Serving Monitoring Logging
Trainer
Building
a
Model
Model
Validation
Training
at Scale
Data
ingestion
Data
Analysis
Data
Transfor-
mation
Data
Validation
Ref: Kubeflow Deep Dive – David Aronchick & Jeremy Lewi, Google (Intermediate Skill Level)
TF Serving
32. Overview of Kubeflow
Data
Split
Roll-out Serving Monitoring Logging
Trainer
Building
a
Model
Model
Validation
Training
at Scale
Data
ingestion
Data
Analysis
Data
Transfor-
mation
Data
Validation
Ref: Kubeflow Deep Dive – David Aronchick & Jeremy Lewi, Google (Intermediate Skill Level)
TF Serving
Katib
33. Kubeflow Roadmap
● Ver. 1.0 (2018.12.16)
○ Demo: CI of Kubeflow
■ 新しいデータがロードされると継続的な学習
■ モデル評価
■ 良いモデルをプロダクションへロールアウト
34. Kubeflow Roadmap
● Ver. 1.0 (2018.12.16)
○ Demo: CI of Kubeflow
■ 新しいデータがロードされると継続的な学習
■ モデル評価
■ 良いモデルをプロダクションへロールアウト
ほ、、、本当にできるんですか...?