機械学習プラットフォーム５つの課題とAmazon SageMakerの4つの利点

分散学習にSageMakerが提供するソリューション
機械学習プラットフォーム５つの課題
と
Amazon SageMakerの４つの利点

産業規模データの機械学習
研究の世界ではスケーラビリティへ
対応する多数の研究がある
連続的に進化する巨大なデータセット
を使ったモデルのトレーニングは、困
難でお金がかかる
実際のデータは
変化する
データの変化が機械学習に与える影響は大きい。
データの変化に対応できるプラットフォームが必要となる。
スケーラビリティ + 変化

今回紹介する論文
● 論文
○ タイトル: Elastic machine learning algorithms in amazon sagemaker.
○ 著者: Liberty, Edo, et al.
○ 投稿: Proceedings of the 2020 ACM SIGMOD International Conference on
Management of Data. 2020.
● サマリ
○ 産業規模の機械学習プラットフォームの5つの課題を提示
○ 機械学習プラットフォームの課題に対応するための、Amazonの機械学習プラッ
トフォームであるSageMakerの4つの利点を紹介
○ 産業規模データセットでSageMakerとJVMベースの機械学習アルゴリズムを比較

機械学習プラットフォームの5つの課題
● インクリメンタルトレーニングとモデルの鮮度の維持のサポート
● トレーニングコストの予測性
● 柔軟性とジョブの停止・再開のサポート
● 一時的なデータの使用
● ハイパーパラメータ最適化とモデルのチューニングの自動化
現在の研究やオープンソースでは多くが取り組まれていない

課題1. インクリメンタルトレーニングとモデルの鮮度の維
持のサポート
● データは継続的に生成され続け、静的に変化しないデータセットは稀
● トレーニングコストと精度のトレードオフが発生
○ データの大部分を使ってトレーニングを行うと、正確なモデルが得られるが、コ
ストと時間が非常にかかる
○ 一方、データを少しずつ更新しながらトレーニングを行うと、コストは低いが、
正確な結果が得られない可能性がある
● 産業用機械学習プラットフォームでは、定期的にコストをかけずに既存のモデルの更
新と段階的なモデルトレーニングのサポートが必要
Old New
常に変化し続ける
毎回新しいデータを含めて
学習し直すのは大変

課題2. トレーニングコストの予測性
● 大容量のデータの場合、顧客は事前にトレーニングにかかる時間や費用の大
まかな予測が必要となる
● 一方、スケーラブルなシステムでは事前にコストを見積もることが困難
○ 多くのシステムではインクリメントラーニングの定期実行がサポートされていない
○ 高次元モデルで想定外のパフォーマンスの低下が発生
●トレーニングにかかる時間
●トレーニングにかかる費用

課題3. 柔軟性とジョブの停止・再開のサポート
● 産業規模のデータを扱う機械学習では、作業量が不均衡になることがよくある
○ 例) データサイエンティストがデータ収集やコード作成のために数日間ジョブを実行せ
ずに過ごした後、数百台のマシンでトレーニングジョブを同時に実行
● ジョブを一時停止、再開したい場合も存在
○ 例) ハイパーパラメータチューニングなど
作業量が不均衡
ジョブの停止・再開を
できるようにしたい

課題4. 一時的なデータの使用
● 産業規模の機械学習プラットフォームでは保存されることがないデータストリームも存
在
○ 例) ネットワークトラフィックやビデオストリームなど
● 保存されることがないデータを取り込み、トレーニングすることは困難
○ 一時的なデータを扱える必要がある
● 一時的なデータを扱えるようにする仕組みが必要
通常データ
ビデオストリームデータ

課題5. ハイパーパラメータ最適化とモデルチューニング
● 機械学習プラットフォームはハイパーパラメータ最適化とモデルチューニングをでき
るだけ自動化することが必要
● ハイパーパラメータ最適化とモデルチューニングの自動化は以下の点で重要
○ トレーニングコストの削減
○ 機械学習に精通していないユーザのサポート
自動化により、機械学習に精通していなくても
ハイパーパラメータの最適化とモデルチューニ
ングができる

Amazon SageMaker
● SageMakerとは (https://aws.amazon.com/jp/sagemaker/)
○ 「ML 専用に構築された幅広い一連の機能をまとめて提供することにより、データサイエンティストとデベロ
ッパーが高品質の機械学習 (ML) モデルを迅速に準備、構築、トレーニング、およびデプロイするのを支援」
○ 「ラベル付け、データ準備、特徴エンジニアリング、統計的バイアス検出、自動 ML、トレーニング、調整、
ホスティング、説明可能性、モニタリング、ワークフローなど、ML 開発のあらゆるステップのための専用ツ
ールでイノベーションを加速」
○ チームの生産性を10倍、トレーニングにかかる費用を90％削減、推論にかかる費用を75%削減
○ 「AWS の歴史の中で最も急速に成長しているサービスの 1 つ」
https://aws.amazon.com/jp/sagemaker/

SageMaker: 計算モデル
● SageMakerは分散ストリーミングデータと共有されたモデルのステートを想定
● 目的関数の最適化のためには3つの関数を実装すればよい
○ Initialize (初期化)
■ トレーニングが開始するモデルの初期のステートを設定
○ Update (更新)
■ データストリームとステートを受け取り、それらに応じてステートを更新
○ Finalize (最終状態の決定)
■ ステートを受け取り計算の最終結果を出力
Initialize Update Finalize
SageMakerで必要な3つの関数
ステートを共有

SageMakerの価値
● 顧客はどんなマシンを使ったかは関係なく、時間と費用を減らしたい
● SageMakerの4つの利点
○ 現代的なハードウェアでの実行
○ パラメータサーバによる分散学習とステートマネジメント
○ モデルの抽象化と表現力豊かなステート
○ モデルのチューニングとハイパーパラメータ最適化
どんなマシンを使ったかは重要でないトレーニングにかかる時間と費用が重要

利点1. 現代的なハードウェアでの実行
● シームレスにCPUとGPU間で操作するためにMXNetを使用
○ 機械学習アルゴリズムをテンソル演算子の計算グラフを通して表現し、最適化
○ 演算をデバイスに割当て
○ 効率的に並列計算を実行
https://github.com/ROCmSoftwarePlatform/mxnet

利点2. パラメータサーバによる分散学習とステートマネジメント
● パラメータサーバが全てのトレーニングで使用されるモデルの共有ステートを保存
● パラメータサーバは非同期コミュニケーションを通じて高速に更新されるように設計
● パラメータ更新の一貫性を緩和可能
● MXNetのパラメータサーバであるKVStoreを用いて、共有ステートの抽象化と計算モデル
に必要な集計機能を実装
パラメータサーバ
トレーニング用マシン

利点3. モデルの抽象化と表現力豊かなステート
● 異なるモデル間で共通の動作をさせるために、アルゴリズムの出力を抽象化
● モデルは2つの関数を実装する必要がある
○ score (モデル評価用のスコア関数): デバッグやハイパーパラメータ最適化にも使用
○ evaluate (評価関数): データの一部を受け取りモデルの出力を計算
● ステートから多くの異なるモデルを作成できるように、表現力豊かなステートを
維持できるように設計
○ 例) k-meansでは指定したk_max以下の値kであれば再トレーニングなしで使用可能
ML Model
● score
● evaluate
Expressive
State
Object
Model1
Model2
Model3

利点4. モデルチューニングとハイパーパラメータ最適化
● ストリーミングモデルの一時停止・再開が可能
○ ユーザは毎日モデルにデータを追加可能で、過去のデータを再トレーニングする
必要がない
○ 複数のモデルのトレーニングを同時に行い、結果がよくないものを早期に中止さ
せるというハイパーパラメータ最適化が可能
1月1日のデータ
新しいデータを
追加するだけ
NEW Model1
Model2
Model3
大量のトレーニングを行
い、パフォーマンスが出
ない場合は、トレーニン
グを早期に中止

スケーラブルな機械学習においてSageMakerとJVMベースのソリューション (Apache Spark Mlib,
Mallet) などを比較
1. Linear Learner: 精度は同等で、SageMakerはMLlibより8倍高速、同一時間では2 ~ 3倍コストが
安い
2. Factorization Machine: 線形に近いスケーラビリティ
3. K-Means: SageMakerはMlibより10倍高速、スコアが5 % ~ 8 %改善されながら非常に低コスト
4. Neural topic model (NTM): 5以上のトピック数でNTMはより良いperplexityを示した
5. DeepAR: M4 forecasting competitionにおけるもっとも高精度を達成
SageMakerの性能評価

今後の課題: 前処理
前処理学習予測
SageMakerで処理
分割されたシステムで実施
多くの場合、前処理は分割されたシステムで実施されるため
SageMakerの恩恵を受けられない可能性がある

まとめ
● 機械学習プラットフォームの5つの課題
○ インクリメンタルトレーニングとモデルの鮮度の維持のサポート
○ トレーニングコストの予測性
○ 柔軟性とジョブの停止・再開のサポート
○ 一時的なデータの使用
○ ハイパーパラメータ最適化とモデルのチューニングの自動化
● 顧客は、どんなマシンを使うかよりも、トレーニングにかかる時間と費用をいか
に削減できるかを気にする
● Amazon SageMakerの4つの利点
○ 現代的なハードウェアでの実行
○ パラメータサーバによる分散学習とステートマネジメント
○ モデルの抽象化と表現力豊かなステート
○ モデルのチューニングとハイパーパラメータ最適化
● SageMakerはJVMベースのソリューションよりも高い性能を示した

チャンネル紹介
● チャンネル名: 【経営xデータサイエンスx開発】西岡賢一郎のチャンネル
● URL: https://www.youtube.com/channel/UCpiskjqLv1AJg64jFCQIyBg
● チャンネルの内容
○ 経営・データサイエンス・開発に関する情報を発信しています。
○ 例: アジャイル開発、データパイプライン構築、AIで使われるアルゴリズム4種類など
● noteでも情報発信しています → https://note.com/kenichiro

SageMaker: Algorithms
● 深層学習がますます使用されるようになっているが、オンライン広告のクリ
ック予測などの問題では、古典的な解釈性の高い機械学習アルゴリズムはい
まだに需要が高い
● ストリーミングという条件で幅広く使用され、よく適している古典的なアプ
ローチ
○ Linear Learner
○ Factorization machine
○ K-Means
○ PCA
○ Neural Topic Model
○ DeepARを用いた時系列予測

機械学習プラットフォーム５つの課題とAmazon SageMakerの4つの利点

More Related Content

What's hot

Similar to 機械学習プラットフォーム５つの課題とAmazon SageMakerの4つの利点

More from 西岡 賢一郎

機械学習プラットフォーム５つの課題とAmazon SageMakerの4つの利点

Editor's Notes

More from 西岡賢一郎