摘要
准确的交通预测对于城市交通控制和引导至关重要。由于交通流的高度非线性和复杂性,传统方法无法满足中长期预测任务的需求,且往往忽略了空间和时间的依赖关系。本文提出一种新的深度学习框架——时空图卷积网络(STGCN)来解决交通领域的时间序列预测问题。本文没有应用常规的卷积和递归单元,而是在图上形式化问题,并构建具有完整卷积结构的模型,以较少的参数实现更快的训练速度。实验表明,所提出模型STGCN通过对多尺度交通网络进行建模有效地捕获了全面的时空相关性,并在各种真实世界的交通数据集上始终优于最先进的基线。
介绍
交通在每个人的日常生活中起着至关重要的作用。根据2015年的一项调查,美国司机每天花在开车上的时间平均约为48分钟在这种情况下,准确的实时交通状况预测对道路使用者、私营部门和政府都至关重要。广泛应用的交通服务,如流量控制、路线规划、导航等,也在很大程度上依赖于高质量的交通状态评价。多尺度交通预测是城市交通控制与诱导的前提和基础,也是智能交通系统(Intelligent Transportation System, ITS)的主要功能之一。
在交通研究中,通常选择交通流的基本变量,即速度、容量和密度作为监测当前交通状况和预测未来的指标。根据预测时间的长短,交通预测分为短期(5 ~ 30分钟)、中期和长期(30分钟以上)。大多数流行的统计方法(例如,线性回归)能够在短区间预测中表现良好。然而,由于交通流的不确定性和复杂性,这些方法对于相对长期的预测效果较差。
现有的中长期流量预测研究大致可分为动态建模和数据驱动两大类。动态建模使用数学工具(如微分方程)和物理知识通过计算模拟来制定交通问题[Vlahogianni, 2015]。为了达到稳态,模拟过程不仅需要复杂的系统编程,而且需要消耗巨大的计算能力。不切实际的假设和模型之间的简化也会降低预测精度。因此,随着交通数据采集和存储技术的快速发展,一大批研究人员开始将注意力转向数据驱动的方法。经典的统计模型和机器学习模型是数据驱动方法的两个主要代表。在时间序列分析中,自回归综合移动平均(ARIMA)及其变体是基于经典统计的最综合的方法之一[Ahmed and Cook, 1979;Williams和Hoel, 2003]。然而,这类模型受限于时间序列的平稳性假设,且未能考虑到时间序列的时空相关性。因此,这些方法对高度非线性的交通流具有有限的表征能力。近年来,经典的统计模型在交通预测任务上受到机器学习方法的挑战。这些模型可以实现更高的预测精度和更复杂的数据建模,如k近邻算法(KNN)、支持向量机(SVM)和神经网络(NN)。
深度学习方法已经被广泛成功地应用于各种交通任务中。相关工作取得了重大进展,例如深度信念网络(DBN) [Jia等人,2016;黄等人,2014],栈式自编码器(SAE) [Lv等人,2015;陈等,2016]。然而,这些Dense网络很难从输入中联合提取空间和时间特征。此外,在空间属性受限甚至完全缺失的情况下,这些网络的代表能力将受到严重阻碍。
为了充分利用空间特征,一些研究人员使用卷积神经网络(convolutional neural network, CNN)捕获交通网络之间的相邻关系,并在时间轴上使用循环神经网络(recurrent neural network, RNN)。Wu和Tan[2016]通过结合长短期记忆(LSTM)网络[Hochreiter和Schmidhuber, 1997]和一维CNN,提出了一种用于短期流量预测的特征级融合架构CLTFP。尽管CLTFP采用了一种直接的策略,但它仍然首次尝试对齐空间和时间规律。之后,Shi等人[2015]提出了卷积LSTM,这是一种嵌入卷积层的扩展全连接LSTM (FC-LSTM)。然而,常规的卷积操作限制了模型只能处理网格结构(例如图像、视频),而不是一般的领域。同时,用于序列学习的递归网络需要迭代训练,会逐步引入误差累积。此外,众所周知,基于RNN的网络(包括LSTM)很难训练,计算量很大。
为了克服这些问题,提出了多种策略来有效地建模交通流的时间动态和空间依赖关系。为了充分利用空间信息,本文将交通网络建模为一个整体图,而不是将其单独处理(如网格或分段)。为了解决递归网络固有的缺陷,在时间轴上采用了全卷积结构。提出了一种新的深度学习架构——时空图卷积网络,用于交通预测任务。该架构包括几个时空卷积块,它们是图卷积层[Defferrard等人,2016]和卷积序列学习层的组合,以对空间和时间依赖性进行建模。这是首次在交通研究中应用纯卷积结构同时从图结构时间序列中提取时空特征。在两个真实世界的交通数据集上评估了所提出的模型。实验表明,所提出框架在具有多个预设预测长度和网络规模的预测任务中优于现有基线。
预备知识
道路图上的交通预测与图卷积
交通预测是一个典型的时间序列预测问题,即在给定前M个交通观测值的情况下,预测未来H个时间步内最可能的交通测量值(如速度或交通流量)。
【这里介绍了道路图的预测方式及数据表示、图卷积,不进行赘述】
提出模型
网络结构
在本节中,我们详细介绍了所提出的时空图卷积网络(STGCN)架构。如图2所示,STGCN由多个时空卷积块组成,每个时空卷积块形成一个“三明治”结构,中间有两个门控序列卷积层和一个空间图卷积层。每个模块的详细描述如下。
STGCN框架由两个时空卷积块(ST-Conv块)和一个全连接输出层组成。每个ST-Conv块中间包含两个时间门控卷积层和一个空间图卷积层。在每个块内部采用残差连接和瓶颈策略。输入vt−M+1,…,通过ST-Conv块对vt进行统一处理,以一致地探索空间和时间依赖关系。综合特征通过输出层集成以生成最终预测vˆ。
提取空间特征的图卷积网络
交通网络一般以图的形式组织。道路网络的数学表示是自然而合理的。然而,以往的研究忽略了交通网络的空间属性:将交通网络划分为多个区段或网格,忽略了网络的连通性和全局性。即使是网格上的二维卷积,由于数据建模的妥协,也只能粗略地捕获空间局部性。因此,在该模型中,直接在图结构数据上使用图卷积,以提取空间域中高度有意义的模式和特征。虽然通过等式(2)计算图卷积中的核Θ可能由于与图傅里叶基的乘法O(n2)而非常昂贵,但采用了两种近似策略来克服这个问题:切比雪夫多项式近似和一阶近似。