Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
GISA学術研究発表Web大会

集計データを用いた
都市圏における人の流れの推定に関する研究
Estimation of Actual People Flow in Urban Area from Aggregated Data

東京大学 ...
背景
近年、交通状況の把握やマーケティング活動の支援、災害発生後の緊急対応といっ
た観点から人の移動軌跡である非集計の位置情報に対するニーズが高まっている。
– 非集計位置情報とは、GPS機能などにより得られる個人の移動軌跡のことで、多数の
デ...
課題
しかし、個々人の移動軌跡である非集計データは、機密性が高く、多くの人が使える
ようになるにはまだまだ時間がかかる可能性がある。
既存の位置情報の例

•

パーソントリップ(PT)調査データ
– 「どのような人が」、「どのような目的
で」...
目的
本研究では、PT調査データから人の流れを推定し、その推定値に観測値を
同化*することで、推定モデルを補正する。それにより現実に近い人の流れ
データの構築を試みた。
⇒ 多様な分野において、こうした非集計位置情報が利用されるようになる
こと...
本研究におけるデータ同化の位置づけ
データ同化:シミュレーションモデルに時空間観測データを統合することで、実際の現
象を再現できるように、数値モデルの再現性を高めることができる技術
input
シミュレーションモデル
• PT調査データ
• 状...
研究手法
1st step: シミュレーショ
ンモデルの構築

PT調査データ

非鉄道利用ODを抽出

複数経路候補の生成による実数拡大

2nd step: データ同化

同化に用いる観測値を準備

データ同化による重み更新

3rd st...
使用データ:シミュレーションモデルの構築
パーソントリップ調査データ
•
•
•

交通調査として最も一般的な調査で、トリップの起終点、目的、交通手段、行動
時間帯などの1日の詳細な交通データを得ることができる。
今回使用したのは、静岡中部都市...
使用データ:データ同化
携帯GPSデータ
•
•
•

ゼンリンデータコムから提供いただいた「流動人口」データを使用した。
利用者の承諾のもと最短5分間隔で自動測位し、位置を記録したGPSデータを1
時間単位、250mメッシュで集計し、拡大係数...
1. 人の流れシミュレーションモデルの構築
•

多様な経路候補の生成

GeoHash

– 経路生成には、最短から順に複数経路を探索す
ることができるPenalty法を用いた。
– PT調査のサブトリップOD間に、5経路ずつ生成
させ、それ...
2. データ同化による推定モデルの向上
Start

時間teまで同化する場合

シミュレーションモデルにおいて、
人々が通過したメッシュ

メッシュリストの取得
時刻 t = 1
当該メッシュを通過した
経路候補の重みを順
番に更新

対象時...
2. データ同化による推定モデルの向上
•

データ同化について
– シミュレーションモデルに観測データを統合することで、数値モデルの再現性
を高めることができる技術
– メッシュリストに観測値と推定値の情報を設定し、メッシュ単位で順番に、経
...
2. 重みの更新手法
・あるトリップのメッシュ通過例

A

B

C

D

E

F

G

H

Destination

I

通過メッシュ:G ,D, E, F
⇒ メッシュG,D,E,Fで合計4回の重み更新がされる

Origin
...
3. 計算回数による経路候補の重みの収束状況
データ同化のパラメータ
・観測値:流動人口データ(集計レベル:250mメッシュ、タイムステップ:24)
・同化の時間幅:0~7時(タイムステップ:6)、メッシュレベル:250m
・収束条件:それぞれ...
3. 推定結果の評価
(1) メッシュ交通量の可視化(6~7時の1時間交通量)

推定結果(10段階自然分類)

携帯GPSによる真値(10段階自然分類)

概ね傾向は似ているが、東海道新幹線上で推定結果が過大に評価されている。
⇒ 非鉄道利用...
3. 推定結果の評価
(2) 携帯GPSによる真値との比較(6~7時の1時間交通量)

1kmメッシュ

500mメッシュ
評価領域が小さくな
ると、真値の絶対数
が小さくなるため、
評価が難しくなる。

250mメッシュ

125mメッシュ
...
まとめと今後の課題
•

データ同化手法を用いて、シミュレーションモデルに観測データを統合することで、
より現実に近い人の流れデータの構築を試みた。
– シミュレーションモデルの構築にPT調査データと携帯GPSの集計データから、より現実
に近い...
Upcoming SlideShare
Loading in …5
×

GISA2013_toida

805 views

Published on

GISA学術研究発表Web大会「集計データを用いた 都市圏における人の流れの推定に関する研究」

  • Be the first to comment

  • Be the first to like this

GISA2013_toida

  1. 1. GISA学術研究発表Web大会 集計データを用いた 都市圏における人の流れの推定に関する研究 Estimation of Actual People Flow in Urban Area from Aggregated Data 東京大学 新領域創成科学研究科 ○戸井田亮祐、関本義秀、金杉洋、樫山武浩、柴崎亮介 1
  2. 2. 背景 近年、交通状況の把握やマーケティング活動の支援、災害発生後の緊急対応といっ た観点から人の移動軌跡である非集計の位置情報に対するニーズが高まっている。 – 非集計位置情報とは、GPS機能などにより得られる個人の移動軌跡のことで、多数の データが集まることで都市における人の流れを把握できる。 – 特に、災害発生後の交通渋滞や帰宅困難者といった二次的災害に適切に対応するた めには、都市内の時々刻々と変化する人の流れをリアルタイムで把握することは重要 である。 Traffic survey Marketing Emergency response Pedestrian traffic survey Tourism activity Navigation 2
  3. 3. 課題 しかし、個々人の移動軌跡である非集計データは、機密性が高く、多くの人が使える ようになるにはまだまだ時間がかかる可能性がある。 既存の位置情報の例 • パーソントリップ(PT)調査データ – 「どのような人が」、「どのような目的 で」、「どこからどこへ」、「どのような 交通手段で」移動したかなどを調べ るアンケート調査。 – 最新の情報が反映できない・詳細な 部分で精度が悪いなどいくつかの問 題がある。 • 携帯GPS集計データ – 携帯電話のGPS機能から得られる位 置情報をメッシュで集計して可視化 したもの。(ゼンリンデータコム「混雑 度マップ」) – PTデータの問題点を克服できるが、 メッシュ集計されたデータの場合、空 間解像度が低い。 色が赤に近い =人が多い 3
  4. 4. 目的 本研究では、PT調査データから人の流れを推定し、その推定値に観測値を 同化*することで、推定モデルを補正する。それにより現実に近い人の流れ データの構築を試みた。 ⇒ 多様な分野において、こうした非集計位置情報が利用されるようになる ことを目指す。 + PT調査データ ⇒ 携帯GPSデータ (集計データ) より現実に近い 人の流れデータ (非集計データ) 4
  5. 5. 本研究におけるデータ同化の位置づけ データ同化:シミュレーションモデルに時空間観測データを統合することで、実際の現 象を再現できるように、数値モデルの再現性を高めることができる技術 input シミュレーションモデル • PT調査データ • 状態変数 (x, y) • 遷移項 PT調査OD間の経路(ノード列) ̶ 所与のODの時空間位置を結ぶ経路候 補上を等速移動 観測値 • 携帯GPSのメッシュ集計データ • 集計レベル:500mメッシュ • タイムステップ:1時間 Destination Origin output 各経路の重みは、観測データに基づいて 更新され、重みが高いほど選ばれやすい 経路となる。 1 2 3 4 5 6 7 8 5
  6. 6. 研究手法 1st step: シミュレーショ ンモデルの構築 PT調査データ 非鉄道利用ODを抽出 複数経路候補の生成による実数拡大 2nd step: データ同化 同化に用いる観測値を準備 データ同化による重み更新 3rd step: 評価 推定結果を評価 6
  7. 7. 使用データ:シミュレーションモデルの構築 パーソントリップ調査データ • • • 交通調査として最も一般的な調査で、トリップの起終点、目的、交通手段、行動 時間帯などの1日の詳細な交通データを得ることができる。 今回使用したのは、静岡中部都市圏における、平成13年(2001年)の調査結果 で、その対象人数は約6.5万人である。 本研究では、鉄道利用ODを除去したデータのみを使用した。 非鉄道利用データ抽出後の諸数 人数 トリップ数 サブトリップ数 滞在 PID単位 61,879 392,472 396,503 225,863 OD単位 64,984 412,060 423,271 237,186 7
  8. 8. 使用データ:データ同化 携帯GPSデータ • • • ゼンリンデータコムから提供いただいた「流動人口」データを使用した。 利用者の承諾のもと最短5分間隔で自動測位し、位置を記録したGPSデータを1 時間単位、250mメッシュで集計し、拡大係数により実数として表現されている。 データの該当者としては、その元となるサービス利用者が現在70~80万人と言 われていることから、人口の約0.5%程度だと推測される。 2011/03/01 12:00~13:00 静岡駅 8
  9. 9. 1. 人の流れシミュレーションモデルの構築 • 多様な経路候補の生成 GeoHash – 経路生成には、最短から順に複数経路を探索す ることができるPenalty法を用いた。 – PT調査のサブトリップOD間に、5経路ずつ生成 させ、それぞれの重み初期値として0.2を与えた。 Origin – 実数拡大する際に、各経路の重みに基づいて、 経路選択することで、より現実に近い人の流れ を推定することができる。 一般的には、属性 ごとの拡大係数に よりPT調査データ を拡大する Destination • 計算時間の短縮 – トリップの起終点(OD)をGeoHash*化することで、ODパターン数を減少させた。 – 探索した経路情報をDBにキャッシュすることで、再度の経路探索をしないようにした。 ⇒ これにより、数日要する作業を、2時間程度にまで短縮できた。 *GeoHash:ジオコーディング方法の1つで、文字列により緯度・経度、その精度を表現できる。今回は、精度120m*150m 9 程度のものを用いた。
  10. 10. 2. データ同化による推定モデルの向上 Start 時間teまで同化する場合 シミュレーションモデルにおいて、 人々が通過したメッシュ メッシュリストの取得 時刻 t = 1 当該メッシュを通過した 経路候補の重みを順 番に更新 対象時刻の観測値を取得 t++ メッシュ単位で重みを更新 メッシュリストを構築 (観測値情報を設定) 重みを標準化する メッシュリストに通過した 推定値の情報を設定 5経路の重み合計値が 1.0になるよう再計算 Yes t < te No 重みは収束し た? Yes End No 10
  11. 11. 2. データ同化による推定モデルの向上 • データ同化について – シミュレーションモデルに観測データを統合することで、数値モデルの再現性 を高めることができる技術 – メッシュリストに観測値と推定値の情報を設定し、メッシュ単位で順番に、経 路候補の重みを更新していく。最後に重みの標準化を行い、収束条件を満た していれば、計算を終了する。 – データ同化のパラメータ ・観測値:流動人口データ(集計レベル:250mメッシュ、タイムステップ:24) ・同化の時間幅:0~7時(タイムステップ:6) ・同化のメッシュレベル:250m ・収束条件:それぞれの経路候補の重み差分が00.1以下 11
  12. 12. 2. 重みの更新手法 ・あるトリップのメッシュ通過例 A B C D E F G H Destination I 通過メッシュ:G ,D, E, F ⇒ メッシュG,D,E,Fで合計4回の重み更新がされる Origin ・重みの更新式 𝑂𝑏𝑠 𝑤(𝑖) = 𝑤(𝑖) × 𝐸𝑠𝑡 𝑤(𝑖) = 𝑤(𝑖) × 𝑂𝑏𝑠 𝐺 𝑂𝑏𝑠 𝐷 𝑂𝑏𝑠 𝐸 𝑂𝑏𝑠 𝐹 + + + ÷4 𝐸𝑠𝑡 𝐺 𝐸𝑠𝑡 𝐷 𝐸𝑠𝑡 𝐸 𝐸𝑠𝑡 𝐹 ⇒ 通過メッシュそれぞれで重みが更新された後、そ の平均値が最終的な重みとなる。 (w(i): 重み、Obs: 観測値、Est: シミュ レーションモデルによる値) 12
  13. 13. 3. 計算回数による経路候補の重みの収束状況 データ同化のパラメータ ・観測値:流動人口データ(集計レベル:250mメッシュ、タイムステップ:24) ・同化の時間幅:0~7時(タイムステップ:6)、メッシュレベル:250m ・収束条件:それぞれの経路候補の重み差分が00.1以下 各経路候補の重み差分(平均値) 0.003 0.0025 0.002 0.0015 79回で収束 0.001 0.0005 0 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 計算回数 重み差分は一時的に上昇したあと、緩やかに収束していることがわかる。 13
  14. 14. 3. 推定結果の評価 (1) メッシュ交通量の可視化(6~7時の1時間交通量) 推定結果(10段階自然分類) 携帯GPSによる真値(10段階自然分類) 概ね傾向は似ているが、東海道新幹線上で推定結果が過大に評価されている。 ⇒ 非鉄道利用者のデータのみを使用した影響だと考えられる。 14
  15. 15. 3. 推定結果の評価 (2) 携帯GPSによる真値との比較(6~7時の1時間交通量) 1kmメッシュ 500mメッシュ 評価領域が小さくな ると、真値の絶対数 が小さくなるため、 評価が難しくなる。 250mメッシュ 125mメッシュ 比較の結果、あまり良い相関は得られなかった。 ⇒ 生成した経路候補が類似してしまい、同化が十分に機能しなかったため。 15
  16. 16. まとめと今後の課題 • データ同化手法を用いて、シミュレーションモデルに観測データを統合することで、 より現実に近い人の流れデータの構築を試みた。 – シミュレーションモデルの構築にPT調査データと携帯GPSの集計データから、より現実 に近い人の流れデータの構築を試みた。 – Penalty法を用いて、 PT調査のそれぞれのOD間に5経路ずつを生成・重みの初期値 0.2を付与して、それを経路候補とすることで、シミュレーションモデルを構築した。 – その経路候補がもつ重みを、収束条件を満たすまで更新し、その重みに基づいた経路 選択をすることで、最適な解を選択できるようにした。 • 推定値を真値と比較したところ、あまり良い相関を得ることはできなかった。 – PCスペックの関係で、24タイムステップ通しての同化ができなかった。 ⇒ 主にメモリ使用量を減らすために、プログラムを軽量化する必要がある。 – Penalty法による経路生成の場合、生成された経路候補が類似していることが多く、同 化が十分に機能しなかった可能性がある。 ⇒ 類似しない経路を生成できるアルゴリズムを考える必要がある。 – 推定結果と真値の比較の際に、評価したメッシュの中には、PT調査の対象地域でない メッシュが多数含まれており、この改善により決定係数が向上する可能性がある。 ⇒ PTデータの対象地域を基に、評価メッシュを再考する必要がある。 16

×