• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
이동진 발제 Understanding mobility based on gps data
 

이동진 발제 Understanding mobility based on gps data

on

  • 259 views

 

Statistics

Views

Total Views
259
Views on SlideShare
259
Embed Views
0

Actions

Likes
0
Downloads
2
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    이동진 발제 Understanding mobility based on gps data 이동진 발제 Understanding mobility based on gps data Presentation Transcript

    • - 이동진
    • Understanding Mobility Based on GPS Data
    • “Ubiquitous Computing” Recognizing human behavior는 유비쿼터스 컴퓨팅에서 중요한 이슈. (pervasive computing system with rich context information) 위치location 기반의 맥락 정보에 대한 연구는 기존에 많이 있었지만 사람들의 Transportation mode, 예를 들어 walking, driving, taking a bus 등을 추측inference하는 연구는 많지 않다. Transportation mode를 알면 뭐가 좋으냐… 어쨌거나 사람들의 행동 유형에 대해서 실시간으로 정보를 얻으니 뭔가 할 수 있겠지……. 예) 다른 사람이 여행기간 동안 남긴 GPS logs를 보고 이동 경로와 방문 장소뿐만이 아니라 이동 수단도 알아 낼 수 있고, 데이터를 기반으로 적절한 이동 수단을 추천받을 수도 있다. 본 연구에서는 GPS logs를 이용하여 사람들의 motion mode를 추측하는 supervised learning 방식 을 제안한다.
    • 왜 이 논문을 읽었나? 1. Cluster Behavior patterns에 대한 관심. 2. 대량의 정량적 데이터 수집의 자동화, 분석에 대한 관심. 3. 행동 데이터를 기반으로 사용자의 future activities도 예상할 수 있지 않을까.. 4. 씽씽이 조사를 하면서 생긴 GPS 데이터를 잘 들여다봐서 의미있는 결과값을 뽑아내고 싶다.
    • Transportation mode를 알아내던 기존 방법들을 살펴보면, 사용자가 manually labeling을 하거나 간단하게 속도velocity를 계산하여 접근하는 방식이 있다. 이 방식의 문제는, 1. 사람들은 일반적으로 하나의 trip 도중 transportation mode를 바꾸는 경우 가 많고, (=하나의 GPS 궤적 안에 두 개 이상의 모드가 있을 때가 많고) 2. 속도는 교통 상황이나 날씨 등에 영향을 많이 받는다. 자동차로 달리는 평균 속도가 자전거처럼 느릴 수도 있으니까.. 우리는 본 연구를 통해서 크게 두 가지의 contribution이 있다: 1. 기존의 방식보다 inference accuracy가 높으면서 교통 상황 등의 요소에도 훨씬 견고한robust 요소들features을 뽑아냈다. 2. Inference performance를 더 높여주는 graph-base의 post-processing 알고 리즘을 제안한다.
    • Architecture of Our approach 본 연구의 approach는 두 파트로 이루어짐 : Offline learning과 online inference. Offline learning에서는 GPS 궤적을 change point를 바탕으로 나누고, 나누어진 segment에서 feature를 뽑아냄. 그리고 density-based clustering 알고리즘으로 해당 공간에 대한 지식을 생성함. Online inference에서는 GPS 궤적이 들어오면 Offline에서 한 것처럼 궤적을 나누고 요소를 뽑아냄. 그리고 추론 모델에 집어넣어 값을 만들고 후처리 과정을 통해 값을 보완함. 추론 학습 ?
    • Segmentation method 본 논문에서는 하나의 GPS trajectory를 몇 개의 segment로 나누는데, 이 방식은 실제 세계real world의 상식을 바탕으로 하였다 : 1. 일반적으로, 사람들은 transportation mode를 바꾸는 순간에 반드시 멈췄다가 다시 움직인다. (버스 정류장, 주차장, 기차역…) 2. 걷기walking는 두 개의 다른 transportation mode의 transition이다. 바꿔서 말하면, Walk Segment의 시작점start point과 끝점end point은 chagne point일 확률이 아주 높다. 그러므로, 먼저 Walk Segment를 찾고 이를 기반으로 궤적의 파티션을 나눈다.
    • Inference Model Heading chage rate(HCR) : 차를 운전하거나 버스를 탔을 경우에는 heading direction을 바꾸는데 제약이 있다. 그에 비해 걷기walking나 자전거 타기는 상대적으로 자유롭다. HCR은 사람들이 단위거리에서 heading direction을 바꾼 빈도를 보여준다. Stop Rate(SR) : 버스는 자동차보다 자주 멈춰선다. 교통신호에도 멈추고, 정류장에서도 멈추고.. 걸어다니는 경우에는 그보다 훨씬 자주 멈춰선다. 사람들과 인사도 하고, 구경도 하고, 버스도 기다리고. Velocity Chage Rate (VCR) :
    • Spatial Knowledge Extraction 사용자들의 GPS logs로부터 공간에 대한 지식을 뽑아내는 과정. 1. Change points의 분포에서 density- based clustering을 통해 points를 몇 개의 node로 나눔. 2. 위에서 만든 node와 edge로 그래프를 만듦. 3. 공간에 indexing 함. 4. 각 egde에서의 tranportation 확률 분 포를 계산함.
    • EXPERIMENTS Features :
    • EXPERIMENTS Evaluation: Trasportation mode의 정확한 예측을 평가하기 위해서, Accuracy by Segment와 Accuracy by Distance에 집중함. N은 segments의 전체 숫자total number, m은 정확하게 예측한 segment의 수.
    • Settings GPS devices: 2초마다 한번씩 위치정보를 기록함. 실험 참여자는 돌아다닐 때 항상 지니고 다님. GPS Data : 65명의 사용자로부터 10달에 걸쳐 데이터를 모음. 참여자들이 데이터에 레이블을 붙임. 2:35:02-2:55:24pm, bike; 2:55:26-3:02:04pm, walk와 같은 식으로.
    • Parameter selection HCR : Heading Change Rate SR : Stop Rate VCR : Velocity Change Rate Chage point-base clusters
    • 지도 위에 chage point-based graph를 올린 것. 각 edge에서 가장 많이 이용되는 Transportation mode가 표시됨. Building Graph
    • Results (1) 단일 요소로 평가했을 때 SR, HCR, VCR의 정확도가 높음을 알 수 있음
    • Results (2) Enhanced Features가 조합되었을 때 가장 나은 퍼포먼스가 나타남.
    • CONCLUSION 본 논문에서 제시하는 HCR, SR, VCR 등의 feature는 사람들의 Transportation mode의 예측에 효과적이다. 향후 Temporal dimension이나 road network등의 요소를 통해 change point based-graph를 강화한다면 더 나은 결과가 나올 수 있을 것.
    • 읽고나서 Transportation mode를 속도, 방향, # of stop 등의 정량적 요소로 예측하는 것은 흥미롭다 아직 딱히 Location-based service에 활용된 예는 보지 못한 것 같은데.. (사용자가 직접 자신의 trip에 labeling을 하는게 가장 정확하긴 하다+딱히 t/m을 알아야할 필요가 없다) Supervised learning말고 Unsupervised learning이 사실 궁금하였으나 LDA, Bayesian network, HMM.. 확률 모델은 따로 스터디를 하면 좋겠다. 대규모의 정량적 데이터는 찔러볼수록 많은 열매가 열리는 것 같다. (알아야 찔러 본다..) 그래도 데이터 분석의 시작은 관찰과 인사이트부터… GPS 데이터로 또 어떤 것을 볼 수 있을까?