Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

AutoML Workshop (2020年1月24日)

460 views

Published on

Deep Learning Lab Workshop Event 2020/01/24

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

AutoML Workshop (2020年1月24日)

  1. 1. AutoML ワークショップ
  2. 2. • Azure Machine Learning ワークスペース をセットアップします。詳細な手順については、下記チュートリアルをご参照ください。 • Azure Machine Learning の環境構築とチュートリアル ・ チュートリアル:Python SDK で初めての ML 実験を作成する ・ チュートリアル: 最初の ML モデルをトレーニングする ※ 価格レベルは、Enterprise Edition を選択してください。 • ml.azure.com にアクセスして、統合開発環境 Azure Machine Learning studio の画面が表示されることを確認します。 • クライアントPC : Windows , Mac を推奨 • ブラウザ : Microsoft Edge or Chrome • Azure Subscription • 共同作成者 (※難しい場合は個人アカウントを準備ください)
  3. 3. • スケール ダウンする前のアイドル時間 (秒) : 600
  4. 4. https://github.com/konabuta/Automated-ML-Workshop
  5. 5. $ cd <ユーザ名フォルダ名> $ git clone https://github.com/konabuta/Automated-ML-Workshop
  6. 6. $ cd Automated-ML-Workshop $ conda env create -f environment.yml $ conda activate automl-workshop $ python -m ipykernel install --user --name automl-workshop --display-name "Python (automl-workshop)" Python 開発環境の準備参考:
  7. 7. Azure Machine Learning
  8. 8. 既製品
  9. 9. … データ準備 実験 モデル運用管理 Orchestrate
  10. 10. AutoML
  11. 11. モデル学習のプロセス アルゴリズム 選択 パラメータ 選択 特徴量 エンジニアリング モデルデータ 学習 モデル探索
  12. 12. • 試行錯誤が楽になる • 誰でも機械学習モデルが作れる (AI の民主化) • モデルを大量に生成できる • 多数セグメントの需要予測・マーケティング etc
  13. 13. Microsoft Research (MSR)
  14. 14. データ ゴール設定 制約条件 Input ベイズ最適化 + 協調フィルタリングを用いた 効率的な機械学習パイプラインの探索 Optimized model 機械学習のプロセスを全自動で構築する最新アプローチ Output
  15. 15. • Microsoft Research の研究結果をベースに開発 • NIPS 2018 にて論文を発表 • 強調フィルタリングとベイズ最適化をメタ学習に採用 • プライバシー保護:データを直接見ない • ONNX 変換をサポート • スケーラブルな計算環境による高速学習 RegressionClassification Time Series Forecasting Supervised Learning Automated Machine Learning の利用メリット
  16. 16. Machine Learning Compute 初期費用なし の従量課金 モデルはオープンソース 自由に利用可能Azure ML studio Python SDK
  17. 17. モデル解釈
  18. 18. interpretml/interpret-community
  19. 19. ※contrib
  20. 20. Plot Description データ探索 データセットの概要を予測値と共に表示します。 グローバルな重要度 上位 K (構成可能な K) 個の重要な特徴をグローバルに表示します。 基になるモ デルのグローバルな動作の理解に役立ちます。 説明の探索 特徴がモデルの予測値の変化、または予測値の確率にどのような影響を与えるか を示します。 特徴の操作の影響を表示します。 重要度の概要 すべてのデータ ポイントにまたがるローカルな特徴量の重要度の値を使用して、各 特徴が予測値に与える影響の分布を表示します。
  21. 21. Plot Description ローカルな重要度 グローバルに上位 K 個 (構成可能な K) の重要な特徴を示します。 特定のデータ ポイントでの基になるモデルのローカルな動作を示すのに役立ちます。 補正の探索 選択されたデータ ポイントの特徴値への変更を許可し、予測値への結果の変更 を観察します。 個別条件付き期待値 (ICE) 特徴値の最小値から最大値への変更を許可します。 特徴が変化したときにデー タ ポイントの予測がどのように変化するかを示すのに役立ちます。
  22. 22. https://docs.microsoft.com/ja-jp/azure/machine-learning/how-to-machine-learning- interpretability https://dllab.connpass.com/event/153453/ https://christophm.github.io/interpretable-ml-book/
  23. 23. konabuta/Automated-ML-Workshop/tree/master/Sample
  24. 24. テーマ データ コード Module 1 与信管理 モデル解釈 hmeq_ja.csv N/A (GUIを利用) Module 2 自動車の価格予測 モデル構築 automobile.csv Automobile-regression-explainer- remote.ipynb Module 3 顧客離反分析 モデル解釈 CATelcoCustomerChurnTrainingSa mple.csv Churn-classification-explainer- remote.ipynb Module 4 時系列予測 モデル構築 & 解釈 automl-sample-notebook- data/nyc_energy.csv Energy-demand-forecasting- explainer-remote.ipynb
  25. 25. リンク:https://www.kaggle.com/ajay1735/hmeq-data 件数:5961レコード 項目 - 説明変数 : 12 - 目的変数 : 1 Kaggle でも公開されているデータ # SASなどの統計ツールのサンプルデータにもなっています。
  26. 26. 新製品の適正価格の求めるために、製品仕様・技術仕様などの変数に基づいて自動車の価格 を予測するモデルを作成します。予測値を参考にして戦略的な価格設定を行います。 メーカー名 エンジンの位置 馬力 ピーク回転数 車両重量 ホイールベース
  27. 27. • 年齢 • 年収 • 電話切断率 • 電話失敗率 • 最終学歴 • 性別 • 結婚有無 ・・・ Churn ?? 通信会社の契約を Churn するかしないかを予測するモデルを構築します。その後、モデルの 解釈を行います。学習データは顧客の個人情報やサービスの利用状況などが含まれます。
  28. 28. https://docs.microsoft.com/ja-jp/azure/machine-learning/ https://github.com/Azure/MachineLearningNotebooks https://github.com/konabuta/ML-tech
  29. 29. https://docs.microsoft.com/ja-jp/azure/machine-learning/how-to-machine-learning- interpretability https://dllab.connpass.com/event/153453/ https://christophm.github.io/interpretable-ml-book/
  30. 30. microsoft/nni
  31. 31. Hyper Parameter Tuning Network Morphism など Neural Architect Search
  32. 32. MICROSOFT CONFIDENTIAL 本資料は情報提供のみを目的としており、本資料に記載されている情報は、本資料作成時点でのマイクロソフトの見解を示し たものです。状況等の変化により、内容は変更される場合があります。本資料に表記されている内容(提示されている条件等 を含みます)は、貴社との有効な契約を通じて決定されます。それまでは、正式に確定するものではありません。従って、本資 料の記載内容とは異なる場合があります。また、本資料に記載されている価格はいずれも、別段の表記がない限り、参考価 格となります。貴社の最終的な購入価格は、貴社のリセラー様により決定されます。マイクロソフトは、本資料の情報に対して 明示的、黙示的または法的な、いかなる保証も行いません。 © 2019 Microsoft Corporation. All rights reserved.

×