DataRobot_APIはじめの一歩_ディベロッパーミートアップvol.1
- 4. Confidential. ©2021 DataRobot, Inc. – All rights reserved
田中 翔
AI Engineer @ DataRobot Japan
DataRobot Japanにはじめて採用されたAI Enginnerとして参画。
日本唯一のAI Engineer。
前職の経験を活かし機械学習モデルの運用やモデルのデプロイに
おいてお客様をサポート
2020 - :AI Engineer @ DataRobot, Inc.
2015 - 2020:Data Analyst/Data Engineer @ Recruit Technologies Co.,Ltd.
最近のAIプロジェクト
• 大手通信企業での需要予測のデプロイ支援
• 大手流通企業でのMLOps導入支援
• 大手広告媒体でのコンバージョン予測のデプロイ支援
4
- 5. Confidential. ©2018 DataRobot, Inc. – All rights reserved
数値/カテゴリ
時系列
テキスト
画像
データからビジネス価値を生み出すAIプラットフォーム
収益向上
コスト削減
リスク管理
新規事業
など など
位置情報
各種
データ
ビジネス
価値
AI Platform
Auto ML / TS
Data Prep ML Ops
アプリ作成
モデルの
管理と監視
What-ifアプリ
最適化アプリ
システム正常性
モデル性能監視
モデルの
作成
特徴量
エンジニアリング
自動特徴量
検出/生成
分類/回帰
異常検知
時系列
特徴量の
インパクト/作用
予測の説明
データ
エンジニア
データアナリスト
データサイエンティスト
ビジネス
ユーザー
インフラ
エンジニア
自動探索
データ修正
ライブラリ機能
データ連携
データの
準備
データの
管理
モデルの
インサイト
AI Success
- 7. Confidential. ©2018 DataRobot, Inc. – All rights reserved
数値/カテゴリ
時系列
テキスト
画像
データからビジネス価値を生み出すAIプラットフォーム
収益向上
コスト削減
リスク管理
新規事業
など など
位置情報
各種
データ
ビジネス
価値
AI Platform
Auto ML / TS
Data Prep ML Ops
アプリ作成
モデルの
管理と監視
What-ifアプリ
最適化アプリ
システム正常性
モデル性能監視
モデルの
作成
特徴量
エンジニアリング
自動特徴量
検出/生成
分類/回帰
異常検知
時系列
特徴量の
インパクト/作用
予測の説明
データ
エンジニア
データアナリスト
データサイエンティスト
ビジネス
ユーザー
インフラ
エンジニア
自動探索
データ修正
ライブラリ機能
データ連携
データの
準備
データの
管理
モデルの
インサイト
AI Success
デベロッパー活躍ポイント1
DataRobot MLOpsによる
モデルのビジネス活用
デベロッパー活躍ポイント2
DataRobot プロダクト全体の自動化
- 8. Confidential. ©2021 DataRobot, Inc. – All rights reserved
はじめに ~WebGUI, SDK, APIの定義~
WebGUI :
・DataRobot:「Chromeで見た画面」
API : Application Programming Interface
・DataRobot API :「DataRobotへの操作指示の受付窓口」
SDK : Software development kit
・DataRobot SDK :「DataRobotへのAPI操作手順を使いやすくしたもの」
Curl -H xxxx post http/app.datarobot.com/admin/user xxxxx
WebGUI
API
SDK
「モデリングをせよ」等のユーザの意思をどう伝えるかの違い。
(内部的にはどの方式であってもAPI通信を実施)
- 9. Confidential. ©2021 DataRobot, Inc. – All rights reserved
はじめに ~SDK ver.とDataRobot ver.~
SaaS /DataRobot
(週次更新)
Enterprise / DataRobot
(年約4回の更新)
v6.1 v6.2 v6.3
・SaaS版 DataRobotの開発が先行
・Enterprise版はSaaS版から定期的に断面として作成される。
・バージョンアップ等の運用性は SaaS版が優れ、データの機密保持性は Enterprise版が優れる。
・機能拡張に合わせ SDKバージョンもアップデート。バージョン毎の互換性に注意。
cloud
v2.21 v2.22 v2.24
DataRobot / SDK v2.23
- 15. Confidential. ©2021 DataRobot, Inc. – All rights reserved
Tips:CSVへの変換 - jqの利用 -
予測結果のjsonをjqコマンドでパース
コピー用のコマンド
python predict.py [input data] | jq -r ".data[] |
[.predictionValues[0].value, .predictionValues[0].label,
.rowId ] | @csv" > output.csv
- 16. Confidential. ©2021 DataRobot, Inc. – All rights reserved
予測の説明なども出力可能!
予測の説明は既出のコードを少しコメ
ントアウトするだけで利用可能!
また、Batch Prediction APIを利用す
るとGCP Cloud StorageやAWS S3な
どをinput/outputに指定可能。もちろ
んDBにも対応。
詳細は予測の使い方の説明は↓
https://app.datarobot.com/docs-jp/predi
ctions/api/new-prediction-api.html (オンプレ
のお客様はオンプレのドメインに変えてください)
Batch Prediction APIに関しては↓
https://app.datarobot.com/docs-jp/predi
ctions/batch/batch-prediction-api/index.
html (オンプレのお客様はオンプレのドメインに変えてください))
- 19. Confidential. ©2021 DataRobot, Inc. – All rights reserved
もちろん時系列にも対応
既知の特徴量の設定
時間間隔は”日”
複数時系列用のカラム ”Store”
use_time_series:時系列を使うかどうか
feature_settings=は特徴量の設定
参考:Python SDK
- 21. Confidential. ©2021 DataRobot, Inc. – All rights reserved
上級者向け
API Reference — DataRobot Python
Client 2.24.0 documentation
Examples — DataRobot Python
Client 2.24.0 documentation