2020.12.10
齋藤 智輝
AI技術開発部 アルゴリズムグループ
株式会社 Mobility Technologies
SIG SPATIAL2020
参加レポート
2
項目
01|学会全体概要
02|統計・傾向
03|論文紹介
3
自己紹介
▪ 齋藤 智輝 (@tstomoki )
▪ 職歴
▪ ヤフー株式会社
▪ ナレッジパネルの開発
▪ ユーザ位置情報を用いた研究開発
▪ 画像系ベンチャー企業
▪ 機械学習モデルの開発・導入
▪ 株式会社Mobility Technologies
(JapanTaxi株式会社 2019/10/01~)
▪ AI技術開発部 アルゴリズムグループ
▪ 学生
▪ 木更津工業高等専門学校 で強化学習の研究
▪ 東京大学(学部・大学院)で船舶データ分析の研究
4
01 学会全体概要
5
SIG SPATIAL とは
▪ 地理情報システムを主とした国際学会
▪ 昨年の様子
▪ DiDiやLyftなどもスポンサーとして参加
※ 昨年も齋藤が参加 詳細はMoT Labへ記載
6
開催までの経緯
▪ 当初は北京で開催予定
▪ シアトル => リモート開催に変更
7
スポンサー
▪ 減少
▪ DiDiやLyftも不参加
8
オンライン参加の概要
▪ 開催期間 11/3 – 6 の4日間
▪ PST 8:00 – 18:00 (JST 1:00 - 11:00)で開催
▪ 各発表の動画は全て公開
▪ セッション中はzoomで進行
▪ 録画済みの動画を再生 => QA という流れ
▪ 録画済みの動画はYouTube等で公開
▪ セッション中のzoom進行動画も録画して公開
▪ Slackグループも作成され時間差のQAも可
▪ 懇親用にgather.townが用意
9
サイトの様子 (学会プログラム)
▪ 動画リンクや更新速度も早く便利
▪ サーバ障害や重い動画を
ダウンロードする手間などなく快適
▪ ポスターセッションも同様
▪ 2-3分の動画 + 進行QA
zoom進行の録画
(終了して次の日にはリンクができていた)
論文リンク・録画済み発表動画
zoom進行の録画
論文リンク・録画済み発表動画(短め)
10
サイトの様子 (gather.town ~ 懇親スペース ~ )
▪ 懇親スペース・スポンサースペースが用意
BAR
BEACH
FOYER
11
サイトの様子 (gather.town ~スポンサースペース ~)
▪ 各スポンサーごとの部屋に担当者が待機
▪ 質問は随時Slackで受付(スポンサーチャンネルも用意)
12
▪ 北京で開催
SIG SPATIAL 2021
13
02 統計・傾向
14
参加人数の推移・エリア傾向
▪ リモート開催の影響で大幅増加 (昨年の約2.5倍)
15
参加者のエリア詳細
16
Registration費用内訳
▪ 会員 $180
▪ 非会員 $200
▪ 学生 $100
※ 発表しない場合は(共著者含め)クーポンコードが使える(無料)
17
エリア・分野別参加人数の推移
▪ Asia圏の増加が顕著
▪ Industryも2倍程度の増加
18
参加人数内訳 (Industory)
19
Acceptance Rates
▪ 例年通りの採択率を維持
20
エリア・トピック別Acceptance Rate
▪ 投稿数・Accept数は日本が次点
21
Key phrase別Acceptance Rate
▪ Road networkが圧倒的に多い
22
WorkShop のAcceptance Rate / 参加人数
▪ 学会初日に同時開催 論文数
参加者
23
Best Poster and Demo Paper
24
Best Vision Paper and Best Paper
25
学会コンペ(GISCUP 2020)の結果
26
03 論文紹介 Part 1 by 齋藤
27
Is Reinforcement Learning the Choice of
Human Learners? A Case Study of Taxi
Drivers
Links:
• Paper
• Movie
• Code/Data
28
▪ 中国のタクシードライバーを対象に6ヶ月間の意思決定戦略を評価
▪ 営業効率の良し悪しで分類したドライバー群の戦略の変化が
強化学習の学習方法と類似しているかどうかを検定・考察
Summary
29
▪ 各状態における行動の価値が高くなるように学習するのが強化学習の特徴
▪ Gradientの一部からadvantage functionを定義
Method
営業効率:
𝑖: 𝑤𝑒𝑒𝑘 (1 ≤ 𝑖 ≤ 27)
𝑒: 乗務員(𝑑𝑟𝑖𝑣𝑒𝑟)
𝐸!
"
: 第𝑖週の乗務員𝑒の営業収入
𝑡!
"
: 第𝑖週の乗務員𝑒の稼働時間
𝑄 𝑠, 𝑎 : 状態𝑠で行動𝑎を取ったときの期待報酬
𝑉 𝑠 : 状態𝑠の期待報酬
𝐴 𝑠, 𝑎 : 𝐴𝑑𝑣𝑎𝑛𝑡𝑎𝑔𝑒 𝑓𝑢𝑛𝑐𝑡𝑖𝑜𝑛
状態𝑠において報酬の高い行動𝑎を選べたかどうかの指標
30
▪ 実際の乗務員の営業データから推定して比較
Method
特定セルから特定の隣接セルに移動したドライバーの平均営業効率
特定セルにいたドライバーの平均営業効率
方策関数とadvantage functionの
相関を比較するある状態𝑠からどれだけ行動𝑎を取ったか
状態𝑠と行動𝑎の考え方
31
▪ 高成長した乗務員の成長パターンと
強化学習の学習傾向が類似していた
Results
効率が改善した乗務員群 効率が悪化した乗務員群 効率変化がなかった乗務員群
考察
• 効率変化がなかった乗務員群は自分の持つ
”最適方策”に従っている
• 効果があるのは初心者や低 ~ 中効率で働く乗務員であり、
すでに高効率で稼げるドライバーには効果がない
32
Estimation of Road Transverse Slope
Using Crowd-Sourced Data from
Smartphones
Links:
• Paper
• Movie
33
▪ 車両に取り付けたスマートフォンのセンサーから道路の傾斜角を推定
▪ 異なる端末・車両特性を考慮してクラウドソーシングでデータを収集
▪ センサ特性やノイズを補正しつつ正確に予測
Summary
34
▪ 複数センサ(加速度センサ+ジャイロセンサ)で補正
Method
ジャイロセンサによる推定
- 時間による誤差増大(drift)が大きい
加速度センサによる推定
- 分散が大きい
加速度センサの推定値をベース(Anchor)にして
ジャイロセンサのdriftを推定
固定されていれば、
車両内のスマートフォンから車両の姿勢がわかる
35
▪ 最終的なoffsetは線形計画問題として計算
▪ 経路上の各カーブの全ペアに対してoffsetを計算し、車両ごとの平均
値を採用
Method
𝑜",$: 𝑜𝑓𝑓𝑠𝑒𝑡
𝑐",$: 推定した横断勾配
𝑠",$: 推定した傾斜角
𝑠𝑜",$: 運動力学モデルから計算された傾斜角
横断勾配の範囲(一般的には0.86°-1.12°に収まる)
傾斜角の算出誤差範囲(1°に収まる)
36
▪ テストコースを複数デバイス・車両で走行
Results
Baseline: スマホを使用したSoTA手法(ジャイロセンサ+加速度センサ)
Indiv-Prof: 被験者1人のみのデータを使用
Agg-Prof-Final: 提案手法
*-UnOff: オフセットなしの推定
*-Naive: 線形計画モデルを使用しないオフセット算出による推定
RID: ground truth
クラウドソーシングによる効果
オフセットによる効果
運動力学モデルとの比較
先行研究との比較
37
Optimizing Onsite Food Services at
Scale
Links:
• Paper
• Movie
38
▪ 周辺エリアに集まる大規模な施設のフードサービスの運用を効率化
▪ ピーク時間が異なる車両運用・毎晩10人時間掛けて作成するスケジュール
Summary
画像引用: https://news.microsoft.com/modern-campus/phase/before/
ピーク時間が補完的管理している車両(fleet)
の半分も使えていない
(運用コスト$100/day)
39
▪ 各車両にGPSを搭載し現状の把握
▪ 最適化フレームワーク(UFSO)で探索
Method
ケータリング(イベント)
ウォーターサーバの交換
オペレーションの一般化 問題の難しさ(Domino Effect)
新たにタスクを入れると
到着時間がズレるので
後続タスクをズラさないと成立しない
破壊(destroy)と修復(repair)を繰り返す
VRP手法をベース(ALNS)
Unified Food-Service Optimization(UFSO)
Destroy phase:
・ランダムにイベントを消す
・ランダムに決定した車両数分をタスクの低いものから消す
Repair phase:
・全体の移動時間(Travel Time)が少なくなるように挿入
・アクティブな車両のタスク量を最大化するように挿入
・アクティブな車両のタスク量を最大化し、
車両の移動時間も最小化するように挿入
※タスク量が偏るため車両のみに適用
LPで妥当性を検証
解が探索できれば妥当
イベントの最初と最後の物資到着時刻の差
40
▪ 簡単に下界を算出、実用的な手法を使用して比較
▪ ケータリング部門で半分、
ケータリングとウォーターサーバ部門で半分以上の車両数削減
Results
※ 対象全イベントの80%ile値を使用
ある一週間の結果 ある一週間の結果全イベント 全イベント
41
GIS CUP
Links:
• Movie
• Paper (first place)
• Paper (second place)
42
▪ SIG SPATIALが開催するコンペ
▪ 地理空間ネットワークを用いる問題
▪ 2019年と2020年はほぼ同じ問題
▪ スポンサーから賞金も出る
GIS CUPとは
43
▪ 効率的なFleet Mangerを作るタスク
▪ Agents (タクシー)
▪ 車両数は固定
▪ Resources (ユーザ)
▪ 到着地と共にランダム
に発生
▪ 一定時間で消滅
▪ Road Network(道路情報)
▪ 動的に渋滞も発生
GIS CUP 2020の問題設定
44
GIS CUP 2020の問題設定
▪ 入力 (NewYorkのデータセット)
▪ Road network
▪ Travel time model
▪ 学習・テストデータ
▪ ユーザの発生時刻
▪ ユーザの発生場所
▪ Agent情報
▪ タクシーの全体数
▪ タクシーの初期位置
▪ 目的シナリオ
▪ タクシーの探客時間 (ユーザを探している時間)最小化
▪ ユーザの待機時間 (タクシーを探している時間)最小化
各シナリオ毎に2人ずつの勝者を選出
45
▪ 参加人数的にかなり小規模
GIS CUP 2020の結果
46
GIS CUP 2020の結果
▪ タクシーの探客時間 (ユーザを探している時間)最小化
1. Lingfeng, et al. (Huazhong University Science and Technology)
2. Wenli Li (Microsoft)
▪ ユーザの待機時間 (タクシーを探している時間)最小化
1. Wenli Li (Microsoft)
2. Lingfeng, et al. (Huazhong University Science and Technology)
47
▪ 基本方針: 競合を避けつつHot spotにAgent(Taxi)を配置
GIS CUP 2020の優勝解法 (Agent 最適化シナリオ)
Grid・時間スロットで分割後、
重みを付与
Gridの重み意図
- 乗車数が多いスポットが人気
- 降車数が多いスポットは不人気
一定時間空車状態が続いている
Agentを制限しつつ再割り当て
𝐴𝑔𝑒𝑛𝑡: 𝑎! ⇒ 𝑔𝑟𝑖𝑑: 𝑔"の移動時間
𝑔𝑟𝑖𝑑: 𝑔"内のresource数
𝑔𝑟𝑖𝑑: 𝑔"内のresource数
𝒜 : 𝑖𝑑𝑙𝑒車両数総数
スコア関数
制約条件
近くの車両をアサイン
- ETAはMLPで推定
(曜日・天気情報が重要特徴量)
- 降車イベントを挟んでも
効率的であれば採用
(continuous order dispatch)
※ 地図情報から基本的なETAは算出される
Lingfeng, et al.
(Huazhong University
Science and Technology)
48
▪ 基本方針: 複数の工夫 + パラメータ最適化
GIS CUP 2020の優勝解法 (Resource 最適化シナリオ)
近くの車両をアサイン
- ETAはベース時間に係数を掛けて算出
(車両 - 迎車距離が最も重要)
- 降車イベントを挟んでも
効率的であれば採用
(Next resource assignment)
期限が切れて消滅する客(resource)を
優先(交差点の重みを追加)
客(resource)の多さで
交差点を重み付けして探客
※ resourceが一定以上増えたら随時更新
※ 遠すぎる場所には向かわせない
※ Agent最適化シナリオ解法より再掲
※ 地図情報から基本的なETAは算出される
Baseline (random):
Proposed method:
Wenli Li (Microsoft)
49
▪ DiDi主催のコンペになる予定 (1年前時点での予定と一致)
▪ 対象のデータセットはDiDi Platformのもの (DiDi GAIA Open Dataset)
▪ 賞金が$25,000と高額 (1年前時点では…)
▪ 2021年4月25日に開始予定
来年のGIS CUP

SIGSPATIAL 2020 参加報告資料