More Related Content Similar to 车联网时空数据挖掘及洞察 (11) 车联网时空数据挖掘及洞察3. 3
开源的⻋车联⽹网时空数据
2011
T-Drive trajectory data
sample
10,357 taxis
one-week
15 million trips
2015
Taxi Trajectory Prediction
Taxi Trip Time Prediction
442 taxis
one-year
2015
Driver Telematics Analysis
200 driver
50,000 trips
"telematics fingerprint"
NewYork Taxi
Yellow/Green/Uber
1.3 billion trips
To be continued
20152016
交通线路路通达时间预测
10000+ taxis
one-month
2016
供需预测
某⼆二线城市⼀一个⽉月订单
2 billion trips
11. 11
碰撞案例例分析
-0.4
0
0.4
0
12.5
25
37.5
50
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115
GPS速度 加速度
① ⻋车辆以45公⾥里里/⼩小时的速度⾏行行驶
② 刹⻋车,⻋车辆减速⾄至停⻋车(地图位置为⼗十字路路⼝口)
③ 约50s后,在速度为0时产⽣生⼀一明显加速度
④ ⻋车辆熄⽕火,50分钟后再次启动(图中未显示)
⑤ ⻋车辆停⽌止(地图位置为4S店),之后3天未移动
50s左右
2 3
1
5
4
⻋车辆遇红灯后停⻋车,50s后被后⻋车追尾,送⾄至4S店维修
27. 27
⽤用⻋车习惯特征 – 出⾏行行规律律度分析
将历史轨迹数字化转换
空间索引:聚点编号
时间索引:将时间以较⼩小的间隔离散化
20160509 0 0 0 0 0 0 0 0
20160510 0 0 0 0 0 0 0 0
20160511 0 0 0 0 0 0 0 0
20160512 0 0 0 0 0 0
20160513 0 0 0 0 0 0 0 0
20160514 0 0 0 0 0 0 0 0
20160515 0 0 0 0 0 0
MON A B B A
TUE A B B A
WED A B B A
THU A B B C C A
FRI A B B F
SAT F D D F
SUN F A A C C A
⎡ ⎤
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎣ ⎦
规律律度计算
以天为单位,考察⽤用户轨迹序列列的相似度
具有相同属性的点的本身的相似度更更⾼高
以⽉月为时间窗⼝口,显示最终规律律度
28. 28
特殊⽤用户标记 – 营运性⻋车辆识别
营运性⻋车辆⽐比例例最⾼高的⻋车型 营运性⻋车辆数量量最多的⻋车型
别克GL8
景逸X3
⻨麦柯斯
别克GL8
捷达
桑塔纳
低频访
问地点
每⽇日聚
点种类
有家但
⽆无公司
常去交
通枢纽
⽇日均开
⻋车时⻓长
路路边停
⻋车次数
营运性⻋车辆指数评价模型特征选取 某GL8⾏行行程起⽌止点分布和迁徙(2017.3)
某GL8⾏行行程起⽌止点分布和迁徙(2017.3)
31. 31
⽤用户群体画像 – 城市迁徙
● 东、⻄西城区吸收其他区⼯工作者⽐比例例最多
● 怀柔、顺义的⽤用户多在本区⼯工作
各区住宅和⼯工作同区的⽤用户⽐比例例
0%
23%
45%
68%
90%
昌平区 ⼤大兴区 房⼭山区 海海淀区 ⽯石景⼭山区 通州区
via networkD3
34. 34
UBI⻋车险
初阶UBI
● 按⾥里里程付费的⻋车险
● PAYD, Pay As You Drive
● 在上年年出险次数基础上,添加
⾥里里程或时⻓长等特征来确定保费
的阶段
中阶UBI
● 按驾驶习惯付费的⻋车险
● PHYD, Pay How You Drive
● 在初阶UBI的基础上,基于⼤大数据
添加驾驶⾏行行为等特征的阶段,例例如
⾏行行程中的速度、加速度等
⾼高阶UBI
● 按⻛风险付费的⻋车险
● 在中阶UBI基础上添加时空数据,例例
如:天⽓气信息、区域复杂度、违章系
数等特征来定保费的阶段
挑选可能的特征 有效的⻛风险特征搜集数据 筛选特征精算分析
继续加⼊入新的特征
计算终极事故评定⻛风险系数 精准定价
UBI技术模型
Usage Based Insurance
User Behavior Insurance
35. 35
评分的六⼤大特征
度量量 出⾏行行时段和驾驶时⻓长带来的 ⻛风险
时⻓长、时段
⽤用⾏行行为习惯(规律律度)、道路路熟悉程度
度量量 个⼈人⽤用⻋车习惯的 ⻛风险
安全(危险)操作、(⾮非)⼿手持通话
度量量 因⼿手机造成的分⼼心驾驶的 ⻛风险
基于路路⽹网信息图层、事件图层、空间危险事件图层得到⻛风险地图
以及有空间属性的危险事件识别
度量量 ⾏行行程经过的⻛风险区的累积 有空间属性的极端危险⾏行行为 ⻛风险
平均速度、相对速度、道路路限速
度量量 不不同交通状况下的速度 ⻛风险
三急事件、轨迹曲率半径、
速度(⻆角度)变化平稳性、
速度的切向(法向)分量量平稳性
度量量 ⾏行行程中加速、减速、转弯的 ⻛风险
专注度(限APP⽤用户)
空间
时间
速度
平稳性
特征解耦
⾏行行为评价
画像
发明专利利-《⼀一种基于⻋车联⽹网数据的驾驶⾏行行为评价⽅方法》
36. 36
时间特征
数据来源:DfT data from 2010 - 2012 (over 500,000 RTA casualties)
⼀一天中相对事故⻛风险
交通流量量很低
00:00 02:00 04:00 06:00 08:00 10:00 12:00 14:00 16:00 18:00 20:00 22:00 24:00
早⾼高峰 晚⾼高峰
1.25
3.75
5
2.5
周⼀一⾄至周四
周五
周六
周⽇日
特⼤大
交通
40% 疲劳驾驶
⼀一般
20% 疲劳驾驶
数据来源:交通部⻔门统计结果
疲劳驾驶是⾼高速公路路事故最⼤大起因
时段:不不同时段的道路路交通流量量和⼈人的精神状态
时⻓长:疲劳驾驶⾏行行为极度危险
40. 40
专注度特征(限APP⽤用户)
项⽬目 相对危险度
⼿手机通话 1.3-9.0
拨打/接听电话 2.8
写短信 23.2
数据来源: Young & Salmon Safety Science 50 (2012)
根据研究,不不同的⾏行行为危险度不不同
23:24:30 23:24:35 23:24:5523:24:5023:24:4523:24:40
10s左右
速度 加速度 y轴加速度X轴加速度 z轴加速度
1 2
3
通过APP识别⼿手机操作
⻋车辆发⽣生急减速
速度快速下降
因通话影响驾驶⾏行行为
⼿手机操作 ⼿手机通话
专注度评价
⼿手持 ⾮非⼿手持安全操作 危险操作