Vertex AIを用いた
時系列データの解析
2021/12/18 機械学習の社会実装勉強会 第6回
- UX企画関連のソフトウェア開発に従事
- 統計・MLを用いた解析機能の開発及び運用を担当
自己紹介
岩澤幸太朗
前回やったこと
- ARIMAモデルの概要
- ARIMAモデルを用いたCOVID-19感染者数予測
【第5回】BigQueryML を用いた時系列データの分析( ARIMAモデル)
◆ ARIMAモデル (自己回帰和分移動平均モデル)
ARMAモデル 次数, p, d, q
d個前の値との差分
復習
→ 過去の自分の値から未来の値を予測 (外的要因は考慮しない )
(ARMA + 和分過程 )
ARモデル MAモデル
ARMAモデル
ARIMAモデル
前回の結果 (ARIMAモデルによるCOVID-19感染者数予測)
予測モデルとしては失敗
反省:時系列データ予測の難しさ
一変量時系列解析
- 日付、 感染者数
多変量時系列解析
- 日付、感染者数、
人出、ワクチン接種者数、
人口統計、気温、...
長期的傾向(トレンド)
- 増加 or 減少
周期性
- 週次
- 季節性 (?)
外的要因 (複数の特徴量)
- 大規模イベント
- 衛生意識の変化
- 変異株の出現
- …
過去の自分の値から
将来の値を予測
本日の内容
- Vertex AI の概要
- Vertex AI を用いた時系列データの解析
- 予測結果の可視化
Vertex AI
MLOps with Vertex AI
https://cloud.google.com/vertex-ai?hl=ja#section-7
*各セルのサービス名称,関係変わっているかも
- Google I/O 21にて発表(一般提供)
- 機械学習ワークフローの統合環境
- AutoML含む各種MLツールへのアクセス
- AutoML
- Vertex AI Workbench
- Deep Learning VM Image
- Vertex AI Data Labeling
- Vertex Explainable AI
- Vertex AI Model Monitoring
- …
AutoML
予測
ハイパーパラメータチューニング
データ前処理
モデルデプロイ
…
データセット読
み込み
AutoML
アンサンブル学習
モデル選択
モデル評価
トレーニング データ(2020-04-01 ~ 2021-10-31)
時間列(日付)+ 時系列識別子(国)+ ターゲット列(感染者数)+ 特徴を表す列
- 欠損値を避ける
- 十分なトレーニング データ
- 10 以上の時系列識別子
.
.
.
参
考:https://cloud.google.com/vertex-ai/docs/datasets/bp-tabular
予測データ(2021-11-01 ~ 2021-11-14 + コンテキスト期間)
→予測日数分の行のTarget 列 (new_confirmed)はNULLにする
.
.
.
Demo
….… ( ^ ω ^ )
- 最新の知見を用いた多変量時系列解析がUI上で実行できた
- 人の手はある程度必要
- 一定のデータセット理解
- 説明変数選択
- 前処理
- 評価指標選択
- 説明性
- Auto MLの料金のご確認を、ご利用は計画的に
所感
参考文献・リンク
コードはこちら
https://github.com/kootr/ml-study-session
Vertex AI AutoML ForecastingでDNNの強力な多変量時系列予測を自動モデリングしてしまおう
Vertex AI ではじめる時系列分析入門
How to build forecasting models with Vertex AI
ML 入門: Vertex AI のラーニングパス
Using AutoML for Time Series Forecasting
GCP: AutoML
AutoMLで破産しないように気をつけたいポイント
GCPのAutoMLを使っていたら12万の請求゙がきてしまった話
Summary of rules for identifying ARIMA models

3. Vertex AIを用いた時系列データの解析