SlideShare a Scribd company logo
1 of 37
1
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
JapanTaxiにおける
SageMaker+αによる
機械学習アプリケーションの本番運用
2019/7/18
JapanTaxi
次世代モビリティ事業部
渡部徹太郎
第6回 Amazon SageMaker事例祭り
2
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
2
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
自己紹介
ID : fetaro
名前:渡部 徹太郎
研究:東京工業大学でデータベースと情報検索の研究(@日本データベース学会)
前職:
- 大手SIer: オンライントレードシステム基盤
- 大手SIer: オープンソース技術部隊 (MongoDB等)
- リクルートテクノロジーズ: ビッグデータ分析基盤 (EMR, Hortonworks, BigQuery, Oracle Exadata)
現職:
- JapanTaxi: データエンジニア
好きなAWSのサービス :
- Lambda
日本AWSユーザ会(JAWS)
ビッグデータ支部
3
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
3
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
データエンジニアです
データ
サイエンティスト
ビジネス
データ
エンジニア
機械学習をビジネスで成功させるために必要な3つの人種
4
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
4
Proprietary and Confidential ©2019 JapanTaxi, Inc. All Rights Reserved
700万DL超 日本No1タクシーアプリ『JapanTaxi』
アプリマップ上で指定したピン位置にタクシーを手配。
全国47都道府県で約7万台と、全国のタクシー車両1/3がアプリで呼べる。
Google Mapsや音声AIなど様々な注文チャネル、決済、経費精算に対応。
*App Annie調べ タクシー配車/ライドシェアアプリ内における、日本国内累計ダウンロード数/月間平均アクティブユーザー数(iOS/Google Play合算値)調査期間:2017年10月1日〜2018年9月30日
*Apple と Apple ロゴは米国および他の国で登録された Apple Inc. の商標です。App Store は Apple Inc.のサービスマークです。Android、Google Play、Google Playロゴは、Google LLC の商標です。
外部注文チャネル 地図・経路検索
Google Maps iphone map
経費精算
Concur MoneyForward
タクシー配車アプリ『JapanTaxi』
海外
KakaoT TaxiGomy route
iphone siri Alexa/echo spot mydaiz LINE clova
Yahoo!乗換案内
外部注文チャネル 音声AI
NAVITIME
5
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
5
Proprietary and Confidential ©2019 JapanTaxi, Inc. All Rights Reserved
タクシー配車アプリ『JapanTaxi』
今いる場所 行きたい場所 呼ぶ
6
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
6
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 ビジネス課題と機械学習による解決
 機械学習アプリケーションの運用
 まとめ
アジェンダ
7
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
ビジネス課題と
機械学習による解決
8
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
8
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
課題:注文キャンセルによる乗車機会の損失
キャンセル注文
車を探す 配車決定を通知
受諾 乗車機会の損失
ユーザー
タクシー会社配車システム
ドライバー
キャンセル通知
迎車開始
9
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
9
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
原因:到着時間の期待値のギャップ
5分くらいで
来るかな?
それなら
他の交通手段を
使おう
キャンセル注文
車を探す 配車決定を通知
受諾 乗車機会の損失
ユーザー
タクシー会社配車システム
ドライバー
キャンセル通知
迎車開始
10分
かかります
10
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
10
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
解決策:期待値調整をするために到着予想時間を表示
5分くらいで
来るかな?
注文
しない
ユーザー
タクシー会社配車システム
ドライバー
注文前
到着時間
予想システム
10分
かかるなら
他を探そう
乗車機会の損失
解決!!
10分
かかります
11
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
11
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
解決手段:ディープラーニングにより注文前到着時間を予測する
候補1
目的地
• ポイント:注文する前なので、お迎え場所に向かうタクシーは確定していない
お迎え場所
候補2
候補3
候補4
12
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
12
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
実装:Attention機構を使った注文前お迎え時間予測モデル
配車候補の車両の特徴量
• 出発地の緯度経度
• お迎え場所緯度経度
• 出発時の方向・速度
• お迎え場所への方向・直線距離
• 直線距離が近い順番
車両以外の環境の特徴量
• 日、曜日、時間
• 祝日、休日
Attention機構
• 機械翻訳や画像認識などで使われ
るネットワーク構造
• 入力に応じて注目するべき特徴量
に大きな重みが付与される
• 実際に配車される車両の重みが大
きくなることを期待
到着時間
13
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
13
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
結果:ABテストの結果
注文率の低下は抑止できた
狙い通り
注文キャンセル率は低下
14
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
機械学習アプリケーションの運用
15
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
15
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
データ収集
前処理・モデル推定
モデルの精度評価
モデルサービング
運用で行うこと
16
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
16
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
データ収集
データウェアハウス
生
データ
アプリ
DB
アプリ
システム
バッチデータ収集
(torocco)
ストリームデータ
収集
(Lambda)
タクシーの
GPS等
DWH
データ
SQL
Kinesis
DataStream
事業システム
ジョブ実行基盤
(マネージドAirflow)
アプリ
データ
= embulk サービス
毎日
実行毎日
実行
リアル
タイム
バッチ
バッチ
リアルタイム
17
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
17
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
データウェアハウス S3
前処理・モデル推定
DWH
データ
ML用
データ
マート
学習
データ
JSON
モデル生成
ジョブ
SageMaker
学習
データ
生成
(Python)
ワークフロー管理
(Jenkins)
SQL
ソースコード
(GitHub)
モデル生成
プログラム
学習データ
生成
プログラム
エンジニア
サイエンティスト
データ加工
SQL
S3
SageMaker
モデル
ジョブ実行基盤
(マネージドAirflow)
毎日実行
エンハンスのときに実行
定期実行
手動実行
18
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
18
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 SageMakerモデルとは
o SageMaker上のオブジェクト
o S3のディレクトリに対応している
o S3のディレクトリには「前処理スクリプト」と「推定済
みモデル」が含まれる
 前処理スクリプト
o Pythonのコード
o データウェアハウスから生成したJSONから特徴量抽出し
て、モデルへの入力(Numpyの配列)に変換する
o 特徴量抽出の例
• 例:「日付」→「曜日の数値」
• 例:「タクシーの位置」→「注文場所からの距離」
 推定済みモデル
o Tensorflowの生成物
前処理・モデル推定
SageMaker
SageMaker
モデルオブジェクト
S3
SageMakerモデル用
ディレクトリ
推定済み
モデル
前処理
スクリプト
SageMakerモデルとは
19
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
19
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 バージョン管理
o ソースコード
• GitHubを利用
• JapanTaxiの開発フローがGitHubメインであるため、CodeCommitは利用せず
o 学習データファイル
• 自前でバージョン管理
• 学習データを生成したソースコードのgitコミット番号をデータ名に付与
o モデル
• SageMakerのモデルのバージョン管理を利用
• モデル名にGitHubのコミットハッシュを付与
前処理・モデル推定
20
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
20
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 ジョブ管理
o 日次自動実行
• 処理量が大きく毎日少しづつ行う必要のある処理
• 実施する処理: ML用データマート生成
• マネージドAirflowの利用
• JapanTaxiの分析基盤の標準ジョブ実行基盤であり、他のデータ収集ジョブと一緒
にまとめて管理
o 手動実行
• モデルをエンハンスする時に実行
• 実施する処理:学習データの作成、モデル推定ジョブの実行、精度評価の実行
• Jenkinsの利用
• 採用理由
• 実行毎にパラメータを変えて実行できる
• 15分以上の長時間処理ができる(Lambdaではダメ)
• 求められるSLAは低く、使う時だけ起動すれば良い(マネージドである必要な
し)
前処理・モデル推定
21
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
21
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
モデルの精度評価
S3
モデル
バッチ推論
SageMaker
Batch transform
jobs
データ
ウェアハウ
ス
S3
ML用
データ
マート
評価用
データ
JSON
評価用
データ
生成ジョブ
(Python)
S3
評価
結果
JSON
データ
ウェアハ
ウス
評価
結果
マート
BIツール
(Tableau)
ロード
(Python)
サイエンティスト
モデル
ワークフロー管理
(Jenkins)
Slack連携
チャット
(Slack)
エンジニア
22
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
22
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 モデルの精度評価とは
o 精度異常しきい値の定義と監視
• 5分以上早く予測してしまった割合の監視
• 5分以上予測がズレた割合の監視
o 予測分布の目視確認
• タクシー会社ごとの予測分布を目視で確認し、前週と比較して大きな違いがないか
 モデル精度評価タイミング
o リリース前
• 過去データでの精度評価
• 本番リリースするのに十分な精度が出せている事を確認
o リリース後
• 最新データでの精度評価
• モデルが経年劣化していないことを確認する
モデルの精度評価
23
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
23
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 推論の種類と使い分け
o 応答速度重視:SageMaker Endpoint
o スループット重視:SageMaker Batch transform jobs→コチラを使う
 SageMaker Batch transform jobsの使い方
o モデルへの入力をファイルに改行区切りで配置
• 設定:S3 data type = “S3Prefix” , Split type = “Line” , Batch strategy = “SingleRecord”
 結果
o Endpointにクエリを投げていたときは3時間かかっていた処理が20分に短縮できた
モデルの精度評価
S3
モデル
SageMaker
Batch transform
jobs
S3
{input 1のJSON}
{input 2のJSON}
・
・
{input NのJSON}
S3
モデル
{input 1の推論結果}
{input 2の推論結果}
・
・
{input Nの推論結果}
24
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
24
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
モデルサービング
S3
新モデル
旧モデル
推論
SageMaker
Endpoint
処理
(Lambda)
API
(API Gateway)
新
JapanTaxi
アプリ
監視
(Amazon CloudWatch)
応答時間 応答時間
エラー率
応答時間
旧
ロード
ロード
ワークフロー管理
(jenkins)
90%
10%
エンジニア
カスタマ
デプロイ時
オンライン デプロイ
アラート
25
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
25
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 カナリアリリース
o カナリアリリースとは
1. 10%だけ新しいモデルに置き換える
2. 問題がなければすべて新しいモデルでリ
リース
o 実現方法
• AWS SageMaker Endpointの機能を利用
• 「ProductionVariants」を複数用意
する
モデルサービング
SageMaker
Endpoint
オートスケール
Application Autoscaling
コンテナ1
新
モデル
コンテナ2
新
モデル ・・・
オートスケール
Application Autoscaling
コンテナ1 コンテナ2
・・・旧
モデル
旧
モデル旧
Production
Variant
新
Production
Variant
26
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
26
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 実測した処理性能
o マシン:ml.m4.xlarge(4vcore, 16G RAM) x 1台
o リクエスト:平均1.4回/秒、最大20回/秒
o Lambda平均応答時間:20ms
• 推論の時間はもっと短い
 なぜこんなに早いのか?
o 入力が10台(タクシー台数) x 50次元 程度であり、ニューラルネットの計算量が多くないため
モデルサービング
27
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
27
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 会場から出た質問
o Lambdaを挟む必要があるのか。API-Gateway から直接 SageMaker Endpointではダメなの
か?
 答え
o いろいろ融通がきくから
o 融通がきいた例
• アプリから飛んでくる電文の仕様が変わることがあったが、Lambdaで仕様変更を吸収す
ることにより、モデルへのインプットを変え無くてすんだ
• 稀にモデルが明らかに異常な値を推論してしまうことがあったが、異常値をLambdaで消
すことにより、アプリには応答しないようにした
モデルサービング
28
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
28
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 MLの概念が整理されてコンポーネント化されている
o トレーニングジョブ/ハイパーパラメータチューニング/モデル/エンドポイント等
o 成果物管理や開発プロセスの設計がしやすい
 ML成果物が整理される
o 学習データ、モデル、バッチ推論ジョブ、エンドポイントが紐付いてトレースできる
 モデルサービングが簡単
o カナリアリリースができる
o API-Gateway + Lambdaとの相性が抜群
所感:SageMakerの良い点
29
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
29
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 「Notebookをそのまま渡せばOK」ではない・・・
o Notebookはサイエンティストの試行錯誤ツール
o 本番化に向けてはバッチ処理化する必要がある
• コンポーネント分割、ログ出力、設定値のファイル化、エラーハンドリング、テスト
コード生成etc...
 開発のプロセスにマッチしたワークフロー管理が無い
o StepFunctionは一連の処理を数珠つなぎには良いが、一つ一つの工程を確認しながら実行す
るには不向き
o 学習データの作成→(人が確認)→モデル推定→(人が確認)→デプロイ
といった開発のフローに乗らない
 定期ジョブを実行するジョブコントローラがない
o マネージドAirflowサービスのようなものがほしい
所感:改善して欲しいポイント
30
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
まとめ
31
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
31
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
 ビジネス課題と機械学習による解決
o JapanTaxiのビジネス課題である注文後キャンセルの課題を機械学習で低減
 機械学習アプリケーションの運用
o データ収集
• TorrocoとKinesis DataStream
o 前処理・モデル推定
• 学習データとモデルのバージョン管理
• 日次自動実行ジョブと手動実行ジョブ
o モデルの精度評価
• 精度異常しきい値監視と予測値分布の目視確認
• リリース前の過去データでの評価と、毎週の最新データでの評価
• SageMaker Batch Transform jobsによる一括推論
o モデルサービング
• API Gateway + Lambda + SageMaker Endpoint
• SageMaker Endpointを用いたカナリアリリース
まとめ
32
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
宣伝
これから取り組もうとしている事
33
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
33
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
34
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
34
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
タクシーから取れるデータを役立てようという試み
センシングカーとしてのタクシー車両
35
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
35
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
1日のタクシー動態の様子
タクシーは常に膨大な数走り回っており、
道沿いのリアルタイムなデータを収集できる
36
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
36
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
一緒に働いてくれる仲間を募集中
クラウド
Kubernetes
車載デバイス(IoT)
自社製の車載デバイスからデータを収集
ディープラーニングの分散処理
オンプレ一切なし
データエンジニアデータサイエンティスト
タクシービッグデータ解析
白線検出
例)ドライブレコーダ動画解析
ガソリンスタンド
料金検出
37
Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
〒102-0094 東京都千代田区紀尾井町3-12
3-12 Kioicho Chiyoda-ku, Tokyo 102-0094 Japan
TEL 03-6265-6265 FAX 03-3239-8115
www.japantaxi.co.jp
文章·画像等の内容の無断転載及び複製等の行為はご遠慮ください。
Proprietary and Confidential ©2017 JapanTaxi, Inc.
All Rights Reserved

More Related Content

What's hot

JJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組みJJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組みRecruit Technologies
 
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~Recruit Technologies
 
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術Yusuke Uchida
 
AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方Shota Suzuki
 
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話Kamonohashi
 
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Recruit Technologies
 
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナーHiroshi Senga
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo!デベロッパーネットワーク
 
GOの機械学習システムを支えるMLOps事例紹介
GOの機械学習システムを支えるMLOps事例紹介GOの機械学習システムを支えるMLOps事例紹介
GOの機械学習システムを支えるMLOps事例紹介Takashi Suzuki
 
<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI
<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI
<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHIKamonohashi
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]DeNA
 
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用Preferred Networks
 
Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Preferred Networks
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例Recruit Technologies
 
情報処理とは何か あとbigdataとか
情報処理とは何か あとbigdataとか情報処理とは何か あとbigdataとか
情報処理とは何か あとbigdataとかTokoroten Nakayama
 
DataEngConf NYC’18 セッションサマリー #2
DataEngConf NYC’18 セッションサマリー #2DataEngConf NYC’18 セッションサマリー #2
DataEngConf NYC’18 セッションサマリー #2gree_tech
 

What's hot (20)

#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
 
JJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組みJJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組み
 
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
 
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
 
AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方AI/MLシステムにおけるビッグデータとの付き合い方
AI/MLシステムにおけるビッグデータとの付き合い方
 
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
 
Googleアシスタントアプリ実際のところ
Googleアシスタントアプリ実際のところ Googleアシスタントアプリ実際のところ
Googleアシスタントアプリ実際のところ
 
LT(自由)
LT(自由)LT(自由)
LT(自由)
 
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.
 
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
 
GOの機械学習システムを支えるMLOps事例紹介
GOの機械学習システムを支えるMLOps事例紹介GOの機械学習システムを支えるMLOps事例紹介
GOの機械学習システムを支えるMLOps事例紹介
 
<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI
<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI
<インフラ管理者向け>チームでのAI開発を支援するAI開発プラットフォームKAMONOHASHI
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
 
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用
 
Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
 
情報処理とは何か あとbigdataとか
情報処理とは何か あとbigdataとか情報処理とは何か あとbigdataとか
情報処理とは何か あとbigdataとか
 
20150625 cloudera
20150625 cloudera20150625 cloudera
20150625 cloudera
 
DataEngConf NYC’18 セッションサマリー #2
DataEngConf NYC’18 セッションサマリー #2DataEngConf NYC’18 セッションサマリー #2
DataEngConf NYC’18 セッションサマリー #2
 

Similar to JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用

Attention機構を使った 配車車両未確定状態における タクシー到着時間予測
Attention機構を使った 配車車両未確定状態における タクシー到着時間予測Attention機構を使った 配車車両未確定状態における タクシー到着時間予測
Attention機構を使った 配車車両未確定状態における タクシー到着時間予測Fumihiko Takahashi
 
JapanTaxi R&Dの取り組み事例
JapanTaxi R&Dの取り組み事例JapanTaxi R&Dの取り組み事例
JapanTaxi R&Dの取り組み事例Fumihiko Takahashi
 
ドライブレコーダーの映像で Scene Text Recognitionする
ドライブレコーダーの映像で Scene Text Recognitionするドライブレコーダーの映像で Scene Text Recognitionする
ドライブレコーダーの映像で Scene Text RecognitionするFumihiko Takahashi
 
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learningドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task LearningFumihiko Takahashi
 
スタートアップが始める機械学習はじめの一歩
スタートアップが始める機械学習はじめの一歩スタートアップが始める機械学習はじめの一歩
スタートアップが始める機械学習はじめの一歩Kimitaka Nakazawa
 
Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)
Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)
Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)Classi_Corp
 
JapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析についてJapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析についてMasatoshi Ida
 
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜Mao Yamaguchi
 
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについてタクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについてTakashi Suzuki
 
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析aitc_jp
 
Talk 1「データインテグレーションとは何か」
Talk 1「データインテグレーションとは何か」Talk 1「データインテグレーションとは何か」
Talk 1「データインテグレーションとは何か」Takeshi Akutsu
 
大規模インフラで考える インフラチームの未来
大規模インフラで考える インフラチームの未来大規模インフラで考える インフラチームの未来
大規模インフラで考える インフラチームの未来Masayuki Ueda
 
AWS における Microservices Architecture と DevOps を推進する組織と人とツール
AWS における Microservices Architecture と DevOps を推進する組織と人とツールAWS における Microservices Architecture と DevOps を推進する組織と人とツール
AWS における Microservices Architecture と DevOps を推進する組織と人とツールAmazon Web Services Japan
 
Pull request時の画面差分取得の自動化
Pull request時の画面差分取得の自動化Pull request時の画面差分取得の自動化
Pull request時の画面差分取得の自動化Shunsuke Maeda
 
チラシルiOSでの広告枠開発
チラシルiOSでの広告枠開発チラシルiOSでの広告枠開発
チラシルiOSでの広告枠開発Satoshi Takano
 
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルリクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルRecruit Technologies
 

Similar to JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用 (20)

Attention機構を使った 配車車両未確定状態における タクシー到着時間予測
Attention機構を使った 配車車両未確定状態における タクシー到着時間予測Attention機構を使った 配車車両未確定状態における タクシー到着時間予測
Attention機構を使った 配車車両未確定状態における タクシー到着時間予測
 
広告における機械学習の適用例とシステムについて
広告における機械学習の適用例とシステムについて広告における機械学習の適用例とシステムについて
広告における機械学習の適用例とシステムについて
 
JapanTaxi R&Dの取り組み事例
JapanTaxi R&Dの取り組み事例JapanTaxi R&Dの取り組み事例
JapanTaxi R&Dの取り組み事例
 
JapanTaxiのAI活用事例
JapanTaxiのAI活用事例JapanTaxiのAI活用事例
JapanTaxiのAI活用事例
 
ドライブレコーダーの映像で Scene Text Recognitionする
ドライブレコーダーの映像で Scene Text Recognitionするドライブレコーダーの映像で Scene Text Recognitionする
ドライブレコーダーの映像で Scene Text Recognitionする
 
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learningドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
 
スタートアップが始める機械学習はじめの一歩
スタートアップが始める機械学習はじめの一歩スタートアップが始める機械学習はじめの一歩
スタートアップが始める機械学習はじめの一歩
 
Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)
Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)
Real Tech Night|LT資料:レガシーなシステムとの連携作業を入社1ヶ月の新人に丸投げするとどうなるか(JapanTaxi)
 
JapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析についてJapanTaxiが保有するデータとデータ分析について
JapanTaxiが保有するデータとデータ分析について
 
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
Ques12_自動テスト ✕ 機械学習 〜自動テスト結果分析は楽になるか?〜
 
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについてタクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
 
Heroku meetup#15 lt
Heroku meetup#15 ltHeroku meetup#15 lt
Heroku meetup#15 lt
 
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
 
stapy_028_talk1
stapy_028_talk1stapy_028_talk1
stapy_028_talk1
 
Talk 1「データインテグレーションとは何か」
Talk 1「データインテグレーションとは何か」Talk 1「データインテグレーションとは何か」
Talk 1「データインテグレーションとは何か」
 
大規模インフラで考える インフラチームの未来
大規模インフラで考える インフラチームの未来大規模インフラで考える インフラチームの未来
大規模インフラで考える インフラチームの未来
 
AWS における Microservices Architecture と DevOps を推進する組織と人とツール
AWS における Microservices Architecture と DevOps を推進する組織と人とツールAWS における Microservices Architecture と DevOps を推進する組織と人とツール
AWS における Microservices Architecture と DevOps を推進する組織と人とツール
 
Pull request時の画面差分取得の自動化
Pull request時の画面差分取得の自動化Pull request時の画面差分取得の自動化
Pull request時の画面差分取得の自動化
 
チラシルiOSでの広告枠開発
チラシルiOSでの広告枠開発チラシルiOSでの広告枠開発
チラシルiOSでの広告枠開発
 
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルリクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
 

More from Tetsutaro Watanabe

データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎Tetsutaro Watanabe
 
ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出Tetsutaro Watanabe
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連Tetsutaro Watanabe
 
巨大なサービスと膨大なデータを支えるプラットフォーム

巨大なサービスと膨大なデータを支えるプラットフォーム
巨大なサービスと膨大なデータを支えるプラットフォーム

巨大なサービスと膨大なデータを支えるプラットフォーム
Tetsutaro Watanabe
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - Tetsutaro Watanabe
 
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法Tetsutaro Watanabe
 
ビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分けビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分けTetsutaro Watanabe
 
MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法Tetsutaro Watanabe
 
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!Tetsutaro Watanabe
 
がっつりMongoDB事例紹介
がっつりMongoDB事例紹介がっつりMongoDB事例紹介
がっつりMongoDB事例紹介Tetsutaro Watanabe
 
初心者向けMongoDBのキホン!
初心者向けMongoDBのキホン!初心者向けMongoDBのキホン!
初心者向けMongoDBのキホン!Tetsutaro Watanabe
 

More from Tetsutaro Watanabe (17)

データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎
 
MLOpsはバズワード
MLOpsはバズワードMLOpsはバズワード
MLOpsはバズワード
 
ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連
 
巨大なサービスと膨大なデータを支えるプラットフォーム

巨大なサービスと膨大なデータを支えるプラットフォーム
巨大なサービスと膨大なデータを支えるプラットフォーム

巨大なサービスと膨大なデータを支えるプラットフォーム

 
WiredTigerを詳しく説明
WiredTigerを詳しく説明WiredTigerを詳しく説明
WiredTigerを詳しく説明
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
 
ビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分けビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分け
 
MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法
 
MongoDB3.2の紹介
MongoDB3.2の紹介MongoDB3.2の紹介
MongoDB3.2の紹介
 
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!
 
がっつりMongoDB事例紹介
がっつりMongoDB事例紹介がっつりMongoDB事例紹介
がっつりMongoDB事例紹介
 
初心者向けMongoDBのキホン!
初心者向けMongoDBのキホン!初心者向けMongoDBのキホン!
初心者向けMongoDBのキホン!
 
MongoDBの監視
MongoDBの監視MongoDBの監視
MongoDBの監視
 

JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用

  • 1. 1 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved JapanTaxiにおける SageMaker+αによる 機械学習アプリケーションの本番運用 2019/7/18 JapanTaxi 次世代モビリティ事業部 渡部徹太郎 第6回 Amazon SageMaker事例祭り
  • 2. 2 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 2 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 自己紹介 ID : fetaro 名前:渡部 徹太郎 研究:東京工業大学でデータベースと情報検索の研究(@日本データベース学会) 前職: - 大手SIer: オンライントレードシステム基盤 - 大手SIer: オープンソース技術部隊 (MongoDB等) - リクルートテクノロジーズ: ビッグデータ分析基盤 (EMR, Hortonworks, BigQuery, Oracle Exadata) 現職: - JapanTaxi: データエンジニア 好きなAWSのサービス : - Lambda 日本AWSユーザ会(JAWS) ビッグデータ支部
  • 3. 3 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 3 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved データエンジニアです データ サイエンティスト ビジネス データ エンジニア 機械学習をビジネスで成功させるために必要な3つの人種
  • 4. 4 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 4 Proprietary and Confidential ©2019 JapanTaxi, Inc. All Rights Reserved 700万DL超 日本No1タクシーアプリ『JapanTaxi』 アプリマップ上で指定したピン位置にタクシーを手配。 全国47都道府県で約7万台と、全国のタクシー車両1/3がアプリで呼べる。 Google Mapsや音声AIなど様々な注文チャネル、決済、経費精算に対応。 *App Annie調べ タクシー配車/ライドシェアアプリ内における、日本国内累計ダウンロード数/月間平均アクティブユーザー数(iOS/Google Play合算値)調査期間:2017年10月1日〜2018年9月30日 *Apple と Apple ロゴは米国および他の国で登録された Apple Inc. の商標です。App Store は Apple Inc.のサービスマークです。Android、Google Play、Google Playロゴは、Google LLC の商標です。 外部注文チャネル 地図・経路検索 Google Maps iphone map 経費精算 Concur MoneyForward タクシー配車アプリ『JapanTaxi』 海外 KakaoT TaxiGomy route iphone siri Alexa/echo spot mydaiz LINE clova Yahoo!乗換案内 外部注文チャネル 音声AI NAVITIME
  • 5. 5 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 5 Proprietary and Confidential ©2019 JapanTaxi, Inc. All Rights Reserved タクシー配車アプリ『JapanTaxi』 今いる場所 行きたい場所 呼ぶ
  • 6. 6 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 6 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  ビジネス課題と機械学習による解決  機械学習アプリケーションの運用  まとめ アジェンダ
  • 7. 7 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved ビジネス課題と 機械学習による解決
  • 8. 8 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 8 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 課題:注文キャンセルによる乗車機会の損失 キャンセル注文 車を探す 配車決定を通知 受諾 乗車機会の損失 ユーザー タクシー会社配車システム ドライバー キャンセル通知 迎車開始
  • 9. 9 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 9 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 原因:到着時間の期待値のギャップ 5分くらいで 来るかな? それなら 他の交通手段を 使おう キャンセル注文 車を探す 配車決定を通知 受諾 乗車機会の損失 ユーザー タクシー会社配車システム ドライバー キャンセル通知 迎車開始 10分 かかります
  • 10. 10 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 10 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 解決策:期待値調整をするために到着予想時間を表示 5分くらいで 来るかな? 注文 しない ユーザー タクシー会社配車システム ドライバー 注文前 到着時間 予想システム 10分 かかるなら 他を探そう 乗車機会の損失 解決!! 10分 かかります
  • 11. 11 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 11 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 解決手段:ディープラーニングにより注文前到着時間を予測する 候補1 目的地 • ポイント:注文する前なので、お迎え場所に向かうタクシーは確定していない お迎え場所 候補2 候補3 候補4
  • 12. 12 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 12 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 実装:Attention機構を使った注文前お迎え時間予測モデル 配車候補の車両の特徴量 • 出発地の緯度経度 • お迎え場所緯度経度 • 出発時の方向・速度 • お迎え場所への方向・直線距離 • 直線距離が近い順番 車両以外の環境の特徴量 • 日、曜日、時間 • 祝日、休日 Attention機構 • 機械翻訳や画像認識などで使われ るネットワーク構造 • 入力に応じて注目するべき特徴量 に大きな重みが付与される • 実際に配車される車両の重みが大 きくなることを期待 到着時間
  • 13. 13 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 13 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 結果:ABテストの結果 注文率の低下は抑止できた 狙い通り 注文キャンセル率は低下
  • 14. 14 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 機械学習アプリケーションの運用
  • 15. 15 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 15 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved データ収集 前処理・モデル推定 モデルの精度評価 モデルサービング 運用で行うこと
  • 16. 16 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 16 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved データ収集 データウェアハウス 生 データ アプリ DB アプリ システム バッチデータ収集 (torocco) ストリームデータ 収集 (Lambda) タクシーの GPS等 DWH データ SQL Kinesis DataStream 事業システム ジョブ実行基盤 (マネージドAirflow) アプリ データ = embulk サービス 毎日 実行毎日 実行 リアル タイム バッチ バッチ リアルタイム
  • 17. 17 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 17 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved データウェアハウス S3 前処理・モデル推定 DWH データ ML用 データ マート 学習 データ JSON モデル生成 ジョブ SageMaker 学習 データ 生成 (Python) ワークフロー管理 (Jenkins) SQL ソースコード (GitHub) モデル生成 プログラム 学習データ 生成 プログラム エンジニア サイエンティスト データ加工 SQL S3 SageMaker モデル ジョブ実行基盤 (マネージドAirflow) 毎日実行 エンハンスのときに実行 定期実行 手動実行
  • 18. 18 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 18 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  SageMakerモデルとは o SageMaker上のオブジェクト o S3のディレクトリに対応している o S3のディレクトリには「前処理スクリプト」と「推定済 みモデル」が含まれる  前処理スクリプト o Pythonのコード o データウェアハウスから生成したJSONから特徴量抽出し て、モデルへの入力(Numpyの配列)に変換する o 特徴量抽出の例 • 例:「日付」→「曜日の数値」 • 例:「タクシーの位置」→「注文場所からの距離」  推定済みモデル o Tensorflowの生成物 前処理・モデル推定 SageMaker SageMaker モデルオブジェクト S3 SageMakerモデル用 ディレクトリ 推定済み モデル 前処理 スクリプト SageMakerモデルとは
  • 19. 19 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 19 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  バージョン管理 o ソースコード • GitHubを利用 • JapanTaxiの開発フローがGitHubメインであるため、CodeCommitは利用せず o 学習データファイル • 自前でバージョン管理 • 学習データを生成したソースコードのgitコミット番号をデータ名に付与 o モデル • SageMakerのモデルのバージョン管理を利用 • モデル名にGitHubのコミットハッシュを付与 前処理・モデル推定
  • 20. 20 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 20 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  ジョブ管理 o 日次自動実行 • 処理量が大きく毎日少しづつ行う必要のある処理 • 実施する処理: ML用データマート生成 • マネージドAirflowの利用 • JapanTaxiの分析基盤の標準ジョブ実行基盤であり、他のデータ収集ジョブと一緒 にまとめて管理 o 手動実行 • モデルをエンハンスする時に実行 • 実施する処理:学習データの作成、モデル推定ジョブの実行、精度評価の実行 • Jenkinsの利用 • 採用理由 • 実行毎にパラメータを変えて実行できる • 15分以上の長時間処理ができる(Lambdaではダメ) • 求められるSLAは低く、使う時だけ起動すれば良い(マネージドである必要な し) 前処理・モデル推定
  • 21. 21 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 21 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved モデルの精度評価 S3 モデル バッチ推論 SageMaker Batch transform jobs データ ウェアハウ ス S3 ML用 データ マート 評価用 データ JSON 評価用 データ 生成ジョブ (Python) S3 評価 結果 JSON データ ウェアハ ウス 評価 結果 マート BIツール (Tableau) ロード (Python) サイエンティスト モデル ワークフロー管理 (Jenkins) Slack連携 チャット (Slack) エンジニア
  • 22. 22 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 22 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  モデルの精度評価とは o 精度異常しきい値の定義と監視 • 5分以上早く予測してしまった割合の監視 • 5分以上予測がズレた割合の監視 o 予測分布の目視確認 • タクシー会社ごとの予測分布を目視で確認し、前週と比較して大きな違いがないか  モデル精度評価タイミング o リリース前 • 過去データでの精度評価 • 本番リリースするのに十分な精度が出せている事を確認 o リリース後 • 最新データでの精度評価 • モデルが経年劣化していないことを確認する モデルの精度評価
  • 23. 23 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 23 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  推論の種類と使い分け o 応答速度重視:SageMaker Endpoint o スループット重視:SageMaker Batch transform jobs→コチラを使う  SageMaker Batch transform jobsの使い方 o モデルへの入力をファイルに改行区切りで配置 • 設定:S3 data type = “S3Prefix” , Split type = “Line” , Batch strategy = “SingleRecord”  結果 o Endpointにクエリを投げていたときは3時間かかっていた処理が20分に短縮できた モデルの精度評価 S3 モデル SageMaker Batch transform jobs S3 {input 1のJSON} {input 2のJSON} ・ ・ {input NのJSON} S3 モデル {input 1の推論結果} {input 2の推論結果} ・ ・ {input Nの推論結果}
  • 24. 24 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 24 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved モデルサービング S3 新モデル 旧モデル 推論 SageMaker Endpoint 処理 (Lambda) API (API Gateway) 新 JapanTaxi アプリ 監視 (Amazon CloudWatch) 応答時間 応答時間 エラー率 応答時間 旧 ロード ロード ワークフロー管理 (jenkins) 90% 10% エンジニア カスタマ デプロイ時 オンライン デプロイ アラート
  • 25. 25 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 25 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  カナリアリリース o カナリアリリースとは 1. 10%だけ新しいモデルに置き換える 2. 問題がなければすべて新しいモデルでリ リース o 実現方法 • AWS SageMaker Endpointの機能を利用 • 「ProductionVariants」を複数用意 する モデルサービング SageMaker Endpoint オートスケール Application Autoscaling コンテナ1 新 モデル コンテナ2 新 モデル ・・・ オートスケール Application Autoscaling コンテナ1 コンテナ2 ・・・旧 モデル 旧 モデル旧 Production Variant 新 Production Variant
  • 26. 26 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 26 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  実測した処理性能 o マシン:ml.m4.xlarge(4vcore, 16G RAM) x 1台 o リクエスト:平均1.4回/秒、最大20回/秒 o Lambda平均応答時間:20ms • 推論の時間はもっと短い  なぜこんなに早いのか? o 入力が10台(タクシー台数) x 50次元 程度であり、ニューラルネットの計算量が多くないため モデルサービング
  • 27. 27 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 27 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  会場から出た質問 o Lambdaを挟む必要があるのか。API-Gateway から直接 SageMaker Endpointではダメなの か?  答え o いろいろ融通がきくから o 融通がきいた例 • アプリから飛んでくる電文の仕様が変わることがあったが、Lambdaで仕様変更を吸収す ることにより、モデルへのインプットを変え無くてすんだ • 稀にモデルが明らかに異常な値を推論してしまうことがあったが、異常値をLambdaで消 すことにより、アプリには応答しないようにした モデルサービング
  • 28. 28 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 28 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  MLの概念が整理されてコンポーネント化されている o トレーニングジョブ/ハイパーパラメータチューニング/モデル/エンドポイント等 o 成果物管理や開発プロセスの設計がしやすい  ML成果物が整理される o 学習データ、モデル、バッチ推論ジョブ、エンドポイントが紐付いてトレースできる  モデルサービングが簡単 o カナリアリリースができる o API-Gateway + Lambdaとの相性が抜群 所感:SageMakerの良い点
  • 29. 29 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 29 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  「Notebookをそのまま渡せばOK」ではない・・・ o Notebookはサイエンティストの試行錯誤ツール o 本番化に向けてはバッチ処理化する必要がある • コンポーネント分割、ログ出力、設定値のファイル化、エラーハンドリング、テスト コード生成etc...  開発のプロセスにマッチしたワークフロー管理が無い o StepFunctionは一連の処理を数珠つなぎには良いが、一つ一つの工程を確認しながら実行す るには不向き o 学習データの作成→(人が確認)→モデル推定→(人が確認)→デプロイ といった開発のフローに乗らない  定期ジョブを実行するジョブコントローラがない o マネージドAirflowサービスのようなものがほしい 所感:改善して欲しいポイント
  • 30. 30 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved まとめ
  • 31. 31 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 31 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved  ビジネス課題と機械学習による解決 o JapanTaxiのビジネス課題である注文後キャンセルの課題を機械学習で低減  機械学習アプリケーションの運用 o データ収集 • TorrocoとKinesis DataStream o 前処理・モデル推定 • 学習データとモデルのバージョン管理 • 日次自動実行ジョブと手動実行ジョブ o モデルの精度評価 • 精度異常しきい値監視と予測値分布の目視確認 • リリース前の過去データでの評価と、毎週の最新データでの評価 • SageMaker Batch Transform jobsによる一括推論 o モデルサービング • API Gateway + Lambda + SageMaker Endpoint • SageMaker Endpointを用いたカナリアリリース まとめ
  • 32. 32 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 宣伝 これから取り組もうとしている事
  • 33. 33 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 33 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
  • 34. 34 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 34 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved タクシーから取れるデータを役立てようという試み センシングカーとしてのタクシー車両
  • 35. 35 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 35 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 1日のタクシー動態の様子 タクシーは常に膨大な数走り回っており、 道沿いのリアルタイムなデータを収集できる
  • 36. 36 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 36 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 一緒に働いてくれる仲間を募集中 クラウド Kubernetes 車載デバイス(IoT) 自社製の車載デバイスからデータを収集 ディープラーニングの分散処理 オンプレ一切なし データエンジニアデータサイエンティスト タクシービッグデータ解析 白線検出 例)ドライブレコーダ動画解析 ガソリンスタンド 料金検出
  • 37. 37 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 〒102-0094 東京都千代田区紀尾井町3-12 3-12 Kioicho Chiyoda-ku, Tokyo 102-0094 Japan TEL 03-6265-6265 FAX 03-3239-8115 www.japantaxi.co.jp 文章·画像等の内容の無断転載及び複製等の行為はご遠慮ください。 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved