T-GCN:用于交通流预测的时序图卷积网络

news2024/12/26 14:07:19

 1.文章信息

本次介绍的文章是2020年发表在IEEE 智能交通系统汇刊上的《T-GCN: A Temporal Graph Convolutional Network for Traffic Prediction》。

2.摘要

为了同时捕获空间和时间依赖性,本文提出了一种新的基于神经网络的交通流预测方法——时间图卷积网络(T-GCN)模型,该模型将图卷积网络(GCN)和门控循环单元(GRU)相结合。具体来说,GCN用于学习复杂拓扑结构以获取空间相关性,GRU用于学习交通数据的动态变化以获取时间相关性。然后,将T-GCN模型应用于基于城市路网的交通预测。实验证明,我们的T-GCN模型可以从交通数据中获得时空相关性,并且预测结果优于现实交通数据集上的最先进基线模型。

3.介绍

交通预测由于其复杂的时空依赖性,一直是一项具有挑战性的任务:

(1)空间依赖性。交通量的变化主要受城市路网拓扑结构的影响。上游道路交通状况通过传递效应影响下游道路交通状况,下游道路交通状况通过反馈效应[4]影响上游道路交通状况。如图1所示,由于相邻道路之间的影响较强,短期相似度由状态1(上游道路与中游道路相似)变为状态2(上游道路与下游道路相似)。

(2)时间依赖性。交通量随时间动态变化,主要表现为周期性和趋势性。如图2(a)所示,道路上的交通量在一周内呈周期性变化。如图2(b)所示,一天的交通量随时间变化;例如,当前的交通量受到前一刻甚至更长时间的交通状况的影响。

6343f531c8663e85a25545ec2928c5cb.png

e0717be7822c9c42a2df7dcb9a28f503.png

为了解决上述问题,本文主要贡献有:

(1) T-GCN模型集成了图卷积网络和门控循环单元。利用图卷积网络捕获道路网络的拓扑结构,建模道路网络的空间相关性。采用门控循环单元捕捉道路上交通数据的动态变化,建模时间依赖性。T-GCN模型也可以应用于其他时空预测任务。(2) T-GCN模型在不同预测视界下的预测结果均呈现稳态,说明T-GCN模型不仅可以实现短期预测,而且可以用于长期的交通预测任务。                              (3)我们使用两个真实交通数据集来评估我们的方法。结果表明,与所有基线方法相比,该方法的预测误差减小了约1.5% ~ 57.8%,表明T-GCN模型在交通预测方面具有优势。

4.模型建立

题定义:在本研究中,交通预测的目标是根据道路上的历史交通信息,预测一定时间内的交通信息。在我们的方法中,交通信息是一个一般的概念,可以是交通速度、交通流量或交通密度。在不失一般性的前提下,我们在实验部分以交通速度作为交通信息的例子。

定义1:我们使用一个未加权图G = (V, E)来描述道路网络的拓扑结构,我们将每条道路视为一个节点,其中V是道路节点的集合,V = {v1, v2,····,vN}, N是节点的数量,E是边的集合。用邻接矩阵A表示道路之间的连通性,A∈R^(N×N)邻接矩阵只包含0和1的元素。如果两条路之间没有联系,则元素为0;有联系表示为1。

定义2:特征矩阵X^(N×P)。我们将路网中的交通信息作为网络中节点的属性特征,表示为X∈R^(N×P), P表示节点属性特征的个数(历史时间序列的长度),Xt∈R^(N×i)表示i时刻每条道路上的速度。同样,节点属性特征可以是交通速度、交通流量、交通密度等任意交通信息。

因此,时空交通预测问题可以认为是在路网拓扑G和特征矩阵X的前提下,学习映射函数f,然后计算接下来T时刻的交通信息,如式1所示:

6c2c3f3644b4c2165968ae993976ba88.png

其中n是历史时间序列的长度,T是需要预测的时间序列的长度。

概述:在本节中,我们描述了如何使用T-GCN模型来实现基于城市道路的交通预测任务。具体来说,T-GCN模型由图卷积网络和门控循环单元两部分组成。如图3所示,我们首先使用历史n时间序列数据作为输入,利用图卷积网络捕获城市道路网络的拓扑结构,获得空间特征。其次,将获得的具有空间特征的时间序列输入门控循环单元模型,通过单元间的信息传递获取动态变化,获取时间特征;最后,我们通过全连接层得到结果。

84c1146aadb3a295b6ee6250992761fd.png

方法:1)空间依赖建模:GCN模型已成功应用于文档分类、无监督学习和图像分类等领域。给定邻接矩阵A和特征矩阵X, GCN模型在傅里叶域中构造一个滤波器。该滤波器作用于图的节点上,通过节点的一阶邻域捕获节点之间的空间特征,然后将多个卷积层堆叠起来构建GCN模型,表示为: 

 c016295f12192656cfadf786699f1e26.png

在本研究中,选择2层GCN模型来获得空间相关性,其可表示为:

f7acd809c4a38901f3e248bdf2715b37.png

综上所述,我们使用GCN模型从交通数据中学习空间特征。如图4所示,假设节点1为中心道路,GCN模型可以得到中心道路与其周围道路之间的拓扑关系,并对路网拓扑结构和道路上的属性进行编码,进而得到空间依赖关系。

5e19b55fc49a8509f87fee9199412b08.png

2)时间依赖模型:选择GRU模型从交通数据中获得时间依赖性。如图5所示,ht−1表示t-1时刻的隐藏状态;Xt为t时刻的交通信息;Rt为复位门,用于控制对前一时刻状态信息的忽略程度;Ut为更新门,用于控制前一时刻的状态信息进入当前状态的程度;Ct为t时刻存储的内存内容;t时刻的输出状态。GRU以t-1时刻的隐藏状态和当前的流量信息作为输入,得到t时刻的流量信息。该模型在捕获当前时刻的交通信息的同时,仍然保留了历史交通信息的变化趋势,具有时间依赖性的捕获能力。

f563973520b502e316c192de7a072a33.png

3)时序图卷积网络:为了从交通数据中同时获取空间和时间依赖性,我们提出了一种基于图卷积网络和门控循环单元的时间图卷积网络模型(T-GCN)。如图6所示,左侧为时空流量预测过程,右侧为t- gcn单元的具体结构,ht−1为t-1时刻的输出,GC为图卷积过程,ut、rt为t时刻的更新门和复位门,ht为t时刻的输出。具体计算过程如下图所示。f (A, Xt)表示图卷积过程,定义如式3。*表示逐点乘法。W和b代表训练过程中的权重和偏差。

579d3b5de0484a3242aa3cfe587073a0.png

综上所述,T-GCN模型可以处理复杂的空间依赖性和时间动态。一方面,利用图卷积网络捕获城市道路网络的拓扑结构,获得空间相关性;另一方面,采用门控循环单元捕捉道路上交通信息的动态变化,获得时间依赖关系,最终实现交通预测任务。

4)损失函数:在训练过程中,目标是最小化道路上真实交通速度与预测值之间的误差。我们用Yt和d411a8cea08d4ad157e92f76f749011e.png分别表示实际交通速度和预测速度。T-GCN模型的损失函数如式8所示。第一项用于最小化实际交通速度与预测之间的误差。第二项Lreg是L2正则化项,有助于避免过拟合问题,λ是一个超参数。

638203bb05f32a30c3ec3ac21d615497.png

5.实验结果与分析

1.数据说明:在本节中,我们评估了T-GCN模型在两个真实数据集上的预测性能:SZ-taxi数据集和Los-loop数据集。因为这两个数据集都与交通速度有关。在不失一般性的前提下,我们在实验部分采用交通速度作为交通信息。

(1) SZ-taxi。该数据集由深圳市2015年1月1日至1月31日的出租车轨迹组成。我们选取罗湖区156条主要道路作为研究区域。实验数据主要包括两部分。一种是156*156的邻接矩阵,描述道路之间的空间关系。每一行表示一条道路,矩阵中的值表示道路之间的连通性。另一个是特征矩阵,它描述了每条道路上的速度随时间的变化。每一行代表一条路;每一列是不同时间段道路上的交通速度。我们每15分钟统计每条道路上的交通速度。

(2) Los-loop。该数据集由环路检测器实时从洛杉矶县的高速公路上收集。我们选取了207个传感器及其2012年3月1日至3月7日的交通速度。我们每5分钟统计一次交通速度。数据由邻接矩阵和特征矩阵组成。邻接矩阵由交通网络中传感器之间的距离来计算。由于Losloop数据集包含一些缺失数据,我们使用线性插值方法来填充缺失值。

在实验中,将输入数据归一化到区间[0,1]。另外,80%的数据作为训练集,剩下的20%作为测试集。

2.评价指标:我们使用五个指标来评估T-GCN模型的预测性能:

b0c56119c0c74b2fbe8568524050b8b8.png

M为时间样本数;N是道路的数量;148dab00da2818790e74a01319842f61.pnge9bf1f0ec45ffab9c9f6af82f63de95b.png表示真实交通信息,预测第i条道路的第j个时间样本之一,Y和f2ca23b44fdb1a28fd0ac9769a715180.png分别代表6b484b8c3c7c4ac96e17bc770a2851f6.png5fd6324de26999633c45e75a3572854a.png的集合,40d7ea46c71ec9186ef6c472c2db66d8.png是Y的平均值。具体来说,采用RMSE和MAE来衡量预测误差,数值越小,预测效果越好。准确度用于检测预测精度,数值越大,预测效果越好。R2和var计算相关系数,相关系数衡量的是预测结果对实际数据的反映能力,值越大,预测效果越好。

3.模型参数选择:

(1)超参数T-GCN模型的超参数主要包括:学习率、批大小、训练历元、隐藏单元数。在实验中,我们手动调整并设置学习率为0.001,批大小为32,训练epoch为5000。隐藏单元数是T-GCN模型中一个非常重要的参数,不同的隐藏单元数会对预测精度产生很大的影响。为了选择最佳值,我们对不同的隐藏单元进行实验,并通过比较预测结果来选择最优值。在我们的实验中,对于SZ-taxi数据集,我们从[8,16,32,64,100,128]中选择隐藏单元数,并分析其预测精度的变化。如图7所示,横轴表示隐藏单元的数量,纵轴表示不同指标的变化。图7(a)显示了训练集中不同隐藏单元的RMSE和MAE结果。可以看出,当数值为100时,误差最小。图7(b)显示了不同隐藏单元的精度,R2, a n d var的变化。图7(c)和7(d)显示了测试集中的结果。同样,当数字为100时,结果达到最大值。综上所述,当数量设置为100时,预测结果更好。随着隐藏单元数量的增加,预测精度先提高后降低。这主要是因为当隐藏单元大于一定程度时,模型复杂度和计算难度大大增加,导致训练数据出现过拟合。因此,我们在SZ-taxi数据集上的实验中将隐藏单元的数量设置为100。同样,Los-loop的结果如图8(a), 8(b), 8(c), 8(d)所示。可以看出,当隐藏单元数为64时,预测精度最高,预测误差最小。对于输入层,在训练过程中以训练数据集(总数据的80%)为输入,其余数据作为测试过程的输入。T-GCN模型使用Adam优化器进行训练。

daa02ac88dcc68a49acabc7bc091b0ac.png

b945ff8b9c875268a9e7cc80d2cc13a9.png

4.实验结果:表1比较了T-GCN模型与以下基线方法的性能。

0f755ff4e46be542685b70787d270870.png

表一显示了T-GCN模型和其他基线方法在SZ-taxi和Los-loop数据集上对15分钟、30分钟、45分钟和60分钟预测任务的性能。*表示这些值小到可以忽略不计,表明模型的预测效果很差。可以看出,T-GCN模型在所有预测视界的几乎所有评价指标下都获得了最好的预测性能,证明了其对时空交通预测任务的有效性。(1)预测精度高。我们可以发现,基于神经网络的方法,包括T-GCN模型、GRU模型,强调时间特征建模的重要性,通常比其他基线(如HA模型、ARIMA模型和SVR模型)具有更好的预测精度。

(2)时空预测能力。为了验证T-GCN模型是否具有从交通数据中描绘时空特征的能力,我们将T-GCN模型与GCN模型和GRU模型进行了比较。如图9所示,我们可以清楚地看到,基于时空特征的方法(T-GCN)比基于单因素的方法(GCN, GRU)具有更好的预测精度,说明T-GCN模型能够从交通数据中捕捉到时空特征。

c92d551084e29b2b6915e0d1fddd04cb.png

(3)长期预测能力。无论视界如何变化,T-GCN模型通过训练都能获得最好的预测性能,预测结果的变化趋势较小,说明我们的方法对预测视界不敏感。因此,我们知道T-GCN模型不仅可以用于短期预测,也可以用于长期预测。图10(a)显示了不同预测层位下RMSE和Accuracy的变化,分别表示T-GCN模型的预测误差和精度。可以看出,误差增加和精度下降的趋势较小,具有一定的稳定性。图10(b)显示了不同视界上基线的RMSE比较。我们观察到,T-GCN模型无论预测视界如何,都能获得最好的结果。

b0bf752f76ebb25fb1e328c7691cb5a0.png

在实验过程中,我们在数据中加入了两种常见的随机噪声。随机噪声服从高斯分布N∈(0,σ 2),  σ∈(0.2,0.4,0.8,1,2)和泊松分布P(λ), λ∈(1,2,4,8,16)。然后,我们将噪声矩阵的值归一化到0到1之间。使用不同的评估指标,结果如下所示。图11(a)显示了在SZ-taxi数据集上添加高斯噪声的结果,其中横轴表示σ,纵轴表示各评价指标的变化,不同颜色表示不同指标。同样,图11(b)显示了在SZ-taxi数据集上添加泊松噪声的结果。图11(c)和图11(d)是在Losloop数据集上添加高斯噪声和泊松噪声后的结果。可以看出,无论噪声分布如何,指标的变化都很小。因此,T-GCN模型是鲁棒的,能够处理高噪声问题。

5)模型解释:为了更好地理解T-GCN模型,我们在SZ-taxi数据集中选择一条道路,并将测试集的预测结果可视化。图12、图13、图14和图15分别为15分钟、30分钟、45分钟和60分钟预测视界的可视化结果。这些结果表明:(1) T-GCN模型在局部极小/极大值处预测较差。我们推测主要原因是GCN模型在傅里叶域中定义了一个平滑滤波器,并通过不断移动滤波器来捕获空间特征。这一过程导致整体预测结果变化较小,使峰值更平滑。(2)“零出租车值”导致真实交通信息与预测结果存在一定误差。零出租车值是指由于道路上没有出租车,其真实值不为零的交通特征矩阵将被设为零的现象。(3)无论预测视界如何,T-GCN模型总能获得更好的预测结果。T-GCN模型可以捕获道路交通信息的时空特征,得到道路交通信息的变化趋势。此外,T-GCN模型检测高峰时段的开始和结束,预测结果与实际交通速度模式相似。这些性质有助于预测交通拥堵和其他交通现象。

b4085cbd317c185fa8e31a00cbcce534.png

d3c09101db307ce1e67bcb125d91ab17.png

6.结论

本研究开发了一种基于神经网络的交通预测方法T-GCN,该方法将GCN和GRU相结合。我们使用图网络对城市道路网络进行建模,图上的节点表示道路,边表示道路之间的连接关系,道路上的交通信息描述为图上节点的属性。一方面,利用GCN捕获图的空间拓扑结构,获得图的空间相关性;另一方面,引入GRU模型捕捉节点属性的动态变化,获得节点属性的时间依赖性。最后将T-GCN模型应用于交通时空预测。在两个真实交通数据集上进行评估,并与HA模型、ARIMA模型、SVR模型、GCN模型和GRU模型进行比较,T-GCN模型在不同的预测水平下表现出更好的性能。此外,微扰分析说明了我们的方法的鲁棒性。综上所述,T-GCN模型成功地捕捉了交通数据的时空特征,可应用于其他时空任务。

Attention

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

a37e6fa363695856376d81b018156dcf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/539347.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java中的Socket通信和HTTP通信有什麽不同

文章目录 Socket通信HTTP通信两者之间的区别总结 Java中的Socket通信和HTTP通信是两种不同的网络通信方式。Socket通信是一种面向连接的通信协议,而HTTP通信则是基于TCP/IP协议的无连接的应用层协议。在本文中,我将会简要介绍两者的区别,并且…

开放原子训练营(第三季)inBuilder低代码开发实验室初体验

一、活动介绍 开放原子训练营开启inBuilder低代码实验室活动。无论您是计算机行业相关从业者、低代码开发爱好者还是普通用户,都可以基于inBuilder低代码开发平台社区版(基于UBML开源项目的一个可以广泛使用的发行版),体验向导式、…

基于FPGA的车牌识别

基于FPGA进行车牌识别 基于FPGA进行车牌识别 1. 文件说明2. 程序移植说明3. 小小的编程感想 本项目的原理讲解视频已经上传到B站“基于FPGA进行车牌识别”。 本项目全部开源,见我本人的Github仓库“License-Plate-Recognition-FPGA”。 1. 文件说明 小技巧&…

chatgpt赋能Python-pyecharts_雷达图

Pyecharts雷达图:最佳数据可视化工具 Pyecharts是一个流行的Python库,用于创建美观、交互式和动态数据可视化。其中一个强大的工具是雷达图,它可以帮助你更好地理解数据趋势和关系。 现在,我们将深入研究Pyecharts雷达图&#xf…

深度学习 - 49.SIM 搜索兴趣网络 GSU 与 Soft Search 简单实现 By Keras

目录 一.引言 二.GSU 结构分析 1.Input Layer 输入层 2.Embedding Layer 嵌入层 3.Pooling Layer 池化层 4.MLP 深层网络 5.Soft Search 软搜索 三.GSU 结构实现 1.Init 初始化 2.Build 构建 3.call 调用 4.GSU Layer 完整代码 四.GSU 模型训练 1.Input Layer …

日语文法PPT截图1-15

B站课程链接 aspect 关注事件的流动 相当于英语中现在进行时 这些是简体,是不能表达对听话人的礼貌的。 格助词一般只能接在名词后面,表达名词在句子中所做的成分。 副助词除了可以接在名词的后…

UDP和TCP详解

1. UDP 1.1 UDP协议段格式 16位UDP长度, 表示整个数据报(UDP首部UDP数据)的最大长度, 即数据报最大大小为2^16byte 64KB如果校验和出错, 就会直接丢弃 1.2 UDP特点 1.2.1 无连接不可靠 无连接 知道对端的IP和端口号就直接进行传输, 不需要建立连接不可靠 没有确认机制, 没有…

小型双轮差速底盘实现触须避障

1. 功能说明 在R023d机器人车体上安装2个 触须传感器 ,实现机器人小车避障功能。 2. 电子硬件 在这个示例中,我们采用了以下硬件,请大家参考: 主控板 Basra主控板(兼容Arduino Uno)‍ 扩展板 Bigfish2.1扩展…

netstat 连接通信的信息和状态

netstat t 只显示tcpu只显示udpnnum 数字形式显示地址和端口号l listen 显示监听端口 pprogram 显示进程aall 所有连接和监听r显示路由表 netstat -lnp 显示服务监听端口tcpudpsocket ,socket 文件也用来同一台服务器的进程之间通信的。 netsta…

12.2RAC 实例State 为 UNKNOWN

去年10月份接手一个12.2 RAC环境,使用crsctl status res -t查看,发现有个实例状态是UNKNOWN。一直都没有停机维护时间,在测试环境中也没有模拟不出来,原以为删除实例再添加可以解决了。就一直等待维护机会来处理, ASM…

114个ChatGPT全网最热话题

前言 当你使用ChatGPT时,你可能有很多问题需要回答。ChatGPT是一个非常强大的自然语言处理工具,可以用于许多不同的任务,包括聊天机器人、智能客服、文本生成和语言翻译等。 在这篇博客中,我将介绍一些关于如何问ChatGPT的技巧和…

RS-485收发器MS2552可pin对pin兼容THVD1552

THVD15xx 是一系列抗噪 RS-485/RS-422 收发器,专用于在恶劣的工业环境中运行。这些器件的总线引脚可耐受高级别的 IEC 电气快速瞬变 (EFT) 和 IEC 静电放 电 (ESD) 事件,从而无需使用其他系统级保护组件。每个器件由 5V 单电源供电。该系列中的器件具有扩…

【手机建站】安卓Termux+cpolar内网穿透,搭建外网可以访问的网站 - 无公网IP

文章目录 概述1.搭建apache2.安装cpolar内网穿透3.公网访问配置4.固定公网地址5.添加站点 概述 Termux是一个Android终端仿真应用程序,用于在 Android 手机上搭建一个完整的Linux 环境,能够实现Linux下的许多基本操作,不需要root权限Termux就…

常见的dos操作命令

创建abc目录文件(md abc),进入abc文件(cd abc),删除abc文件(rd abc) dir c:\测试 显示指定路径下所有文件和目录的信息 copy c:\测试.txt c:\测试 复制文件命令 ren c:\…

彻底弄懂Java中的toString方法

在Java中,所有的类都默认显式或者隐式继承自Object类,包括你定义的类。而Object类本身有一个toString()方法,用于返回一个表示该对象的字符串,该方法返回的是一个字符串类型的值。 如果你的类没有重写该方法,那么它就会…

【C++】21.智能指针

1.为什么需要智能指针 C无gc new/malloc出来的资源 是需要我们去手动释放 1.忘记释放 2.发生异常安全问题 new/malloc fun()://throw 异常 delete/free 最终都导致资源的泄漏 利用智能指针更好的去解决此类问题 2.智能指针 1RAII RAII(Resource Acquisit…

javaIO之各种流的分类与实际应用

目录 1、初识 Java IO2、传输方式划分3、操作对象划分3.1文件3.2数组(内存)3.3管道3.4基本数据类型3.5缓冲3.6打印3.7对象序列化/反序列化3.8转换 1、初识 Java IO IO,即in和out,也就是输入和输出,指应用程序和外部设备…

Java BIO 和 NIO 使用,有什么区别

Java 中的 I/O 操作主要有两种方式:BIO 和 NIO。BIO(Blocking I/O)是同步阻塞 I/O 模型,而 NIO(Non-Blocking I/O)是异步非阻塞 I/O 模型。这两种 I/O 模型在编写网络应用程序时有着不同的优缺点&#xff0…

Intel® ZTNA RA 23.03 release

摘要 传统的防火墙、入侵检测系统都是基于物理边界的,默认墙内安全,墙外不安全。随着应用程序和用户现在更可能在外围而不是内部,这种安全模型已经不再适用于当今复杂的网络场景。而“零信任”脱离了这种传统的安全模型,不再区别对…

论文浅尝 | 常识问答中的忠诚知识图解释

笔记整理:邹铭辉,天津大学硕士,研究方向为知识图谱 链接:https://aclanthology.org/2022.emnlp-main.743 动机 知识图谱通常被用作常识问答的信息来源,同时也可以用来解释模型对答案的选择。纳入图谱中事实信息的一个常…