论文笔记：Map-Matching for low-sampling-rate GPS trajectories（ST-matching）

news2026/2/8 16:45:17

ACM-GIS 2019

1 Intro

将GPS数据和地图路网数据匹配
提出全局地图匹配算法ST-matching（类似于HMM的思路）
- 考虑了道路网络的空间几何和拓扑结构
  - 如果不考虑拓扑关系，直接进行matching的话，由于GPS信号的不准，可能轨迹会和实际情况差很多
- 考虑的轨迹的速度因素
  - 比如一条高速、一条公路平行，那么如果不考虑速度的话，这样一组GPS信号应该把它放到高速上？还是公路上？

2 问题描述

一个有向图 G(V,E)

给定未加工的 GPS 轨迹 T 和路网 G(V,E),从 G 中寻找路径 P（实际路径匹配轨迹）

每一个点找到这样的一个候选点集合，得到候选点图

- oi是第i个观测点
- $c_i^k$ 是第i个观测点的第k个candidate
- $||c_i^k-o_i||^2=dist(c_i^k,o_i)$
- 时刻 t 的观测点与候选点之间的距离越小,这个候选点是真正的实际点的概率就越大
- ——这里根据经验选择零均值、std为20的正态分布
观测概率不考虑前后GPS定位点，所以容易出现误匹配
3.2.2 空间分析函数
- 如下图，粗实线代表高速公路，细的垂线代表本地道路。
- 采样点（观测点）pi距离第一个候选点比较近，但是如果我们知道前一个采样点和后一个采样点在高速路上，所以理论上应该匹配到第2个采样点
- ST-matching将空间拓扑关系也考虑了进来：【空间传递概率】
  - - 根据t+1和t时刻观测值和候选值的信息，推测从t时刻的观测值ot到t+1时刻的观测值 $o_{t+1}$ 之间的真实路径是ci到cj最短路径的可能性
    - 观测值之前的距离/候选点之间的距离
空间分析函数
- $F_s(c_i \rightarrow c_j)=N(c_j) \cdot V(c_i \rightarrow c_j)$
- 结合了观测概率【几何信息】和传递概率【拓扑信息】
- 如果没有N(cj)的话，那么为了Fs越大越好，||ci-cj||越小越好，最后就会选择距离 $p_{i-1}$ 路径距离最近的candidate了

ST-Matching是全局算法，但是实际中不可能都给出完整路径
——>local ST-matching使用轨迹上的滑动窗口
- 局部候选图是轨迹T的一个子集
- 计算方式和全局算法一样
- 计算一个滑动窗口中的局部候选图后，移动滑动窗口，计算后续的滑动窗口
将轨迹划分为窗口可以：
- 减少平均延迟
- 节省用于在线处理的存储空间
- 但不一定会加快整体处理时间，因为ST匹配算法最昂贵的部分是最短的路径计算（空间分析函数中 $V(c_i \rightarrow c_j)=\frac{||o_{t+1}-o_t||_{euclidean}}{||c_i-c_j||_{route}}$ 的 $||c_i-c_j||_{route}$ ）
为了降低计算复杂度，可以保留到目前为止，得分最高的l个候选点（而不是所有的候选点）
- ——>减少下一个采样点需要计算的最短路径的pair数量
- 当l=1时，退化成增量算法

w=2——>滑动窗口为2，每次只考虑两个时刻组成的子路段
l=1——>每次只保留F值最高的一个候选点，后续st-matching也只会考虑这一个点

【推导过程我不确定，请评论区批评指正】

记轨迹中的采样点个数为n、路网中路段个数为m，每个采样点最多有k个候选点

人工数据
- 首先随机选择两个点
  - 在这两个点之前选择前K段的路径
  - 在这K段路径中，随机选择一条，记作 $G: e_1,e_2,\cdots,e_n$
  - 指定一个采样间隔k'，从G中以这个间隔挑选点 $e_1,e_{1+k'}.\cdots,e_{1+mk'}$
- 用这些挑选出来的点match轨迹，看和ground-truth一不一样
真实数据
- 从GoeLife系统中采集28条轨迹，这些轨迹都手工标注的label（作为ground truth）
- 绿色+蓝色是GPS轨迹，红色是用户的实际轨迹