基于自适应图卷积网络的轨道交通短时客流预测

news2024/12/23 15:24:45
  •  文章信息

论文题目为《Adaptive graph convolutional network-based short-term passenger flow prediction for metro》的一篇2023年5月发表在Journal of Intelligent Transportation Systems的基于自适应图卷积网络的轨道交通短时客流预测文章。

  •  摘要

随着城市化进程的发展和加快,城市轨道交通系统逐渐成长为一个大型网络,站点间的拓扑结构也变得越来越复杂,使得空间依赖性的捕捉变得越来越困难。多条线路的纵横交错使得站点间呈拓扑分布,传统的图卷积网络是基于先验知识生成的邻接矩阵实现的,无法反映站点之间的实际空间依赖性。为了解决这些问题,本文提出了一种自适应图卷积网络模型(Adapt-GCN),该模型将传统GCN中由先验知识获得的固定邻接矩阵替换为可训练的自适应邻接矩阵。这不仅可以有效地调整相邻站点之间的相关权重,而且可以自适应地捕获非相邻站点之间的空间依赖关系。本文使用上海地铁数据集验证了该模型在提高预测精度和减少训练时间方面的有效性。

  • 介绍

  •  研究意义

随着国内智能交通系统和地铁交通行业的快速发展,智能IC卡开始普及,由此产生了大量的卡数据。在此基础上,可以建立准确有效的客流预测模型,进一步感知客流变化趋势,为城市轨道交通管理者提供有力的决策依据,更好地规划更顺畅的出行路线,为乘客选择更合适的出行时间,从而避免或缓解城市轨道交通拥堵。因此,研究轨道交通客流预测问题具有重要的理论意义和实用价值。

  • 研究综述

关于轨道交通客流预测模型的构建已有大量的研究工作,大致可分为三类。第一类是基于数理统计的模型,如自回归综合移动平均(ARIMA)模型,这类方法只预测了单个站点的客流,这使得唯一可以考虑的因素是时间因素,而不涉及站点之间的空间依赖性。第二类是基于非参数的智能预测模型,如长短期记忆模型(LSTM),这类方法仅对进站或出站的一个方向客流进行预测,并没有实现进站和出站客流的同时预测,这对城市轨道交通的管理部门进行有针对性的安全部署是非常不利的。第三类是基于多特征提取的混合模型,利用卷积神经网络(CNN)从地铁客流图像数据中学习空间特征,并利用双向LSTM从地铁客流时间序列中提取时间特征,最后通过全连接网络融合时空特征,得到客流预测结果,虽然天气、空气条件等多源异构信息的加入可以提高模型的精度,但这些信息的收集和处理难度较大,而且多源数据由于信息冗余和模型结构过于复杂,会导致模型效率低下。

  •  研究贡献

本文主要研究多线路轨道交通网络客流变化的空间特征挖掘,研究思路是基于改进的GCN模型实现对多站进出站客流的同时预测,且要求模型尽可能简单易操作,主要贡献如下:

1、本文研究了地铁客流预测问题,提出了一种新的图卷积模块——自适应图卷积神经网络(Adaptive graph convolution Neural Network, Adapt-GCN),利用自适应技术捕获相邻和非相邻站点之间的空间相关性。

2、将传统GCN中的固定邻接矩阵替换为可训练的自适应邻接矩阵,通过叠加多个Adaptive-GCN层并加入残差网络实现地铁交通的短时客流预测。

3、我们在真实数据集上进行了大量的实验。实验结果表明,我们的模型始终优于所有基线模型。

  • 问题定义

城市轨道交通客流预测问题是一个典型的时空序列预测问题,利用历史r个时间步的观测结果预测未来时间步的各车站进出站客流。本文定义了一个城市范围的城市轨道交通网络结构图,并利用图卷积神经网络(GCN)学习其空间特征。城市轨道交通网络的常见空间特征包括:由于人口密度和POI分布的影响,使得不同车站客流变化具有较强的相似性;由于受热门路线的影响,不同站点之间的客流方向交互作用明显,例如a站的大部分进站乘客将从b站出站,或者a站的出站乘客将主要来自b站。其中,GCN通常用于提取轨道交通路网的空间特征。

  •  轨道交通网络图

在本研究中,我们将城市轨道交通交通网络定义为一个图。轨道交通网络图由节点、边和边的权重组成,通常用图G=(V; E; A)表示,其中V为所有站点的集合,对应于交通网络中每个地铁站点的观测值,E为边的集合,表示站点间的连通性,A为邻接矩阵,表示站点间的是否相邻。

由上述定义可知,城市轨道交通网络图G属于简单无向图,其中A是一个只有0和1个元素的邻接矩阵,对角元素均为0。对于有n个顶点的简单无向图,拉普拉斯矩阵62cbaf6f8f54cf5d5d9beab12cc862bf.png定义为:L=D-A,其中A为邻接矩阵,D为A的度矩阵9dbefb3df3a5a756d71eb3a4cee1d6c9.png,并对拉普拉斯矩阵进行如下的归一化:

bbd3ddd3db73303d706edf47a89dcfa4.png

  • 客流特征

本文使用客流时间序列数据作为地铁网络中每个站点(节点)的属性特征,表示为ba367e47ffeaa76c8e0965a0427fbb73.png,n表示站点个数,r表示属性特征个数,即时间序列的窗口长度,2表示进站和出站客流。如图1所示。图中,Tr表示第r个时间步m个站点的观测客流,Sm表示第m个站点,in_flow和out_flow分别表示进站和出站客流:

19dccc7869d0a9f5496a8e5644202d68.png

图1 客流特征图

  •  模型算法

  • 图卷积网络(GCN)

在本研究中,作者使用了简化的GCN版本。首先,采用一阶近似设置每个图卷积层来处理相邻一层的邻居特征,然后根据分层传播规则叠加多个图卷积层,达到多层邻居特征传播的效果。其感受野的变化效果图2所示。

2c7ec875142a51a224d1c3995660d559.png

图2 GCN感受野的变化

将原始的图卷积公式经过重新缩放和维数泛化,得到最终的图卷积公式如下:

3f6575efeb76a6c9dcf7bf76dafd24d4.png

4043235fc4cd74b82391c3df414ee3ce.png是一个单位矩阵,cf59d9aa4f5030e41ac8b08dd1c2e111.png56253f577dce77b96877a7f41f7d00e3.png为激活函数。上式是经过一层GCN的输出,两层堆叠GCN可表示为:

26d984b7249a64311a92f73be72bed35.png

  • 自适应图卷积网络

传统GCN计算公式可以简化为22f2b6cadeb81f2bd86381eb75c7c4b0.png,此处省略了、激活函数和邻接矩阵的归一化。从简化公式来看,传统GCN将卷积过程分为两步,第一步是通过0f3fccdc73fe6b734516233e710d3ba4.png对自身及其相邻节点的特征信息进行聚合,其中可以认为是邻接矩阵,取值范围为0或1。这种聚合仅仅是自身及其邻近节点的特征信息的总和。第二步是W的特征变化,即挖掘节点间的非线性特征,因此W可称为特征变化矩阵。以图2中的简单拓扑网络为例,该图显示了传统GCN公式中5a8fb551378ed57d5f0a418b0f2e31f5.png的聚合过程,即对自身及其邻居的特征信息进行简单求和。如图3所示,传统GCN的邻接矩阵是固定的,并且在神经网络的整个训练过程中保持不变。

5c690e90a69ae737fec92cb782ee91e6.png

图3 传统GCN

然而,本文认为固定的邻接矩阵使得GCN在聚合节点特征时非常有限,既无法控制自身和相邻节点对结果的影响程度,也无法学习到除自身和相邻节点以外的非相邻节点之间的特征信息。本文设置一个随机初始化的邻接矩阵,通过神经网络的训练进行学习和优化,从而构建一个更适合数据本身的邻接矩阵,该邻接矩阵不需要先验知识,旨在自适应地建模捕获隐藏的空间相关性将这种方法优化后的GCN模型称为自适应图卷积网络(Adaptive graph convolutional network,简称Adapt-GCN)。计算公式如下:

c3bbc3b4c1c8b8426c25491857bb3e56.png

式中,S为Adapt-GCN中随机初始化邻接矩阵,图4为SX在Adapt-GCN中的聚集过程。从图中可以看出,Adapt-GCN中的邻接矩阵S不再是固定的邻接矩阵,而是与邻接矩阵形状相同的随机初始化矩阵。通过对神经网络的训练,不仅可以更自由地学习相邻节点之间的相关性,而且可以通过学习获得非相邻节点之间的相关性。通过将多个Adapt-GCN层叠加并加入残差结构,最后使用融合层,构建本节段地铁交通网络多站进出站客流短时预测模型Adapt-GCN,其结构如图5。

86864bf4777c70a41d6af1b36d08b853.png

图4 Adapt-GCN

50645b2e0fc5a68420049150903fcc0f.png

图5 Adapt-GCN模型结构图

  • 实验

  • 数据集

本文客流数据使用上海地铁数据集,该数据集包含288个地铁站点,站点间拓扑分布如下图:

e483d7f09dc6a036274f8a7e4ff0c110.png

图6 地铁站点分布图

数据范围为2016年7月1日至9月30日,仅对每天5:30-23:45的进出站客流进行预测。对于每个车站,每15分钟统计一次进出站人数,一天共生成73个时间步,92天共生成6716段数据。将所有数据分为训练集、验证集和测试集,大小分别为62天、9天和21天。

  • 评估指标和基准模型

为判断模型的预测效果,采用平均绝对误差(MAE)、均方根误差(RMSE)来量化预测结果的精度,误差计算如下:

43caa9f7e558e8a2ddd8ddf73ebb338d.png

式中,ff11b522999a3e24f50e5a13b633628a.png为第i个测试样本的真实流量值,0e773b74fc9456e897b41ec6ac1102ee.png为第i个测试样本的预测流量值,n为测试样本总数。为了验证模型的有效性,选择STGCN、ResNet、ResGCN、JKResGCN四个经典模型与Adapt-GCN进行性能比较。

  • 预测精度分析

在比较模型中,①STGCN采用两个一维时间门控卷积夹在一个图卷积层中间的三明治结构,形成一个时空卷积块,并通过堆叠四个时空卷积块构建深度图卷积网络。虽然该模型可以同时捕获时空特征,但它将CNN1D输出的特征矩阵作为GCN的输入,与直接从原始输入数据中挖掘空间特征相比,导致GCN对空间特征的捕获不足。②ResNet中的CNN结构适用于普通栅格数据,这显然不适用于一般的拓扑地图数据。③在ResNet中叠加多个GCNs的过程中,出现过平滑的现象,过度消除了数据中的变化和细节。④JK-ResGCN在ResGCN的基础上增加了跳跃知识网络,有效解决了过度平滑问题,但跳跃知识网络将每个GCN层的输出以拼接的方式放入最终的融合层,并且随着GCN层的堆叠,融合层的输入通道数量会增加,这使得融合层在特征学习上花费更多的时间。

表1 精度比较

fb72167dc449e6ae5ebd179338bc3821.png

  • GCN层数量的影响

通过调整GCN的堆叠层数,详细比较了ResGCN、JKResGCN、ResNet和Adapt-GCN四种模型对总客流的预测精度(RMSE)和模型的训练时间。四种模型的对比结果如下图所示。如图所示,无论堆叠GCN层数多少,Adapt-GCN的预测精度都是最优的,尤其是在浅层网络中。这是由于Adaptive-GCN中存在自适应邻接矩阵S,它允许模型捕获浅层网络中较远车站之间的空间相关性。然而,随着数量的增加随着叠加层数的增加,其他三种模型的感受野范围逐渐扩大,Adapt-GCN的精度优势越来越不明显。在训练时间复杂度方面,Adaptive-GCN的训练时间复杂度相对于基于CNN的ResNet要差一些,因为CNN可以更好地进行并行训练。然而,与使用固定邻接矩阵的ResGCN相比,Adapt-GCN特征学习方法变得更加灵活,虽然学习参数的数量增加,但总体训练时间减少。

7961128babe3bc91a78985030d1d2c5d.png8276a48e23093aa837752591d480e44b.png

图7 GCN层的影响

  • 消融实验

为了评估模型中组件的有效性,我们设计了消融实验,并在上海地铁数据集上测试了Adapt-GCN的变体。具体来说,Adapt-GCN w/o residual是指Adapt-GCN模型中残差连接块的移除。下表为去除残留连接后的Adapt-GCN预测结果。从表中可以看出,在上海数据集上,Adapt-GCN优于无残差的Adapt-GCN,说明残差连通性对提高预测性能有积极作用。

表2 消融实验

c9bdaaff275d46f25c4c6d5024020a40.png

  • 邻接矩阵分析

对于上海地铁数据集,描述车站之间连通性的物理地图(静态邻接矩阵)与单层Adapt-GCN训练获得的自适应邻接矩阵分开可视化。对比结果如下图所示:左图为上海地铁数据集中大小为288×288的物理地图,即固定邻接矩阵A,其中暗区值为1,亮区值为0。不同区域的值分别表示不同站点之间的连通性关系。右图为神经网络训练得到的自适应邻接矩阵S,图中颜色越深表示两站相关性越强,颜色越浅表示相关性越弱。自适应邻接矩阵S和固定邻接矩阵A都有明显的对角线,代表了相邻台站之间的强相关性。此外,自适应邻接矩阵S的取值范围比固定邻接矩阵A的取值范围更广,固定邻接矩阵A只有0和1,这表明自适应邻接矩阵S可以更灵活地学习台站之间的相关性。左图中的浅色区域对应右图中的非零元素,这表明单层的Adapt-GCN也可以捕捉到远距离站之间的空间相关性。

8c53c55715086afd5806c2ef2bfbed25.png432870c1b7b06b6d77de159c1497ddce.png

图8 邻接矩阵对比

  • 结论

本文针对于多路线轨道交通网络中的多个站点短时进出站客流预测问题,提出了一种改进的GCN网络。考虑到其站点间在空间分布中的拓扑结构,将传统GCN中的固定邻接矩阵替换为具有相同形状的随机初始化矩阵,并通过神经网络的反向传播过程进行优化。由于该方法不再受固定邻接矩阵的约束,而是允许GCN模型自适应地从数据中学习站之间的拓扑关系,可以充分捕获远距离站之间的空间相关性。实验表明,该模型在实际数据集上的性能优于其他现有方法。另一方面,随机初始化矩阵不再需要真实的站点间拓扑关系,而只需要站点总数,这在很大程度上减轻了邻接矩阵的编制。虽然该模型优于其他方法,但未考虑工作日和周末客流模式差异对客流预测精度的影响。在未来的工作中,我们将更加注重挖掘时间相关性,并考虑时间周期性,例如,每个工作日的早晚高峰通常相似,每个周末的客流模式也相似。我们将考虑时间因素,进一步提高预测精度。

  • Attention

如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1083481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

医疗机构又进化了,一招搞定UPS设备太爽了!

在现代社会中,能源供应的可靠性至关重要,不间断电源(UPS)系统是维持关键设备运行的关键组成部分。UPS监控是一种重要的技术,用于实时监测UPS的性能、电池状态和电力质量。 客户案例 四川某医院是一家大型医疗机构&…

应对优秀解决方案推荐

验证码是保护网站免受自动化 的重要工具,但同时也给实现自动化任务带来一定的困扰。本文将为您介绍如何应对验证码识别难题,并推荐一些优秀的解决方案,帮助您在实际操作中应对验证码识别问题。 1. 验证码识别难题 验证码识别是指将网站上的…

DevExpress Reporting中文教程 - 如何在macOS等系统中生成导出报表文档

DevExpress Reporting是.NET Framework下功能完善的报表平台,它附带了易于使用的Visual Studio报表设计器和丰富的报表控件集,包括数据透视表、图表,因此您可以构建无与伦比、信息清晰的报表。 在本文中,我们将讨论如何在.NET MA…

基于threejs的3d学校示例

源码下载地址在文章末尾! 效果演示 总览 漫游模式 切换黑夜 视频播放 源码下载地址 https://download.csdn.net/download/qq_43185384/88415886

优盘无法格式化?分享简单解决方法!

“我的优盘插入了一个带病毒的电脑中,现在优盘也中毒了,想把它格式化。但是操作的时候却显示优盘无法格式化,这种情况应该怎么办呢?” 优盘,又称USB闪存驱动器。由于其体积小且方便携带,受到广大电脑用户的…

Vega Prime入门教程14.04:CDB测试

本文首发于:Vega Prime入门教程14.04:CDB测试 打开失败 打开vpcdb_yemen_urban.acf 会报错 点击确定后会显示默认界面 这个白天蓝海应该是默认场景。 开启服务 打开LP,点击菜单栏或者工具栏 显示管理界面 切换至rtp界面 点击Start RTP按…

跨境电商需要使用ERP吗?| 跨境电商卖家应如何选择ERP?

复杂多变的市场环境将中国跨境电商行业带到了新的发展阶段。受益于国家对于跨境电商的持续鼓励政策,许多跨境电商企业已经初具规模。积累了较强的产品、供应链能力及一定的独立站运营经验。” 随着跨境电商企业规模升级,平台提供的卖家后台系统往往无法…

ROS为机器人装配激光雷达

移动机器人在环境中获取障碍物的具体位置、房间的内部轮廓等信息都是非常必要的,这些信息是机器人创建地图、进行导航的基础数据,除上面所讲的Kinect,还可以使用激光雷达作为这种场景应用下的传感器。 激光雷达可用于测量机器人和其他物体之间…

希亦CG声波清洗机:眼镜党福利,家庭必备清洗机

对于眼镜党来说最大的烦恼就是每天的佩戴和清洗,清洗是至关重要的,错误的清洗很容易引起镜片损坏,个人一直使用眼镜布清洗,除了费时费力之外清洁度也无法保证。希亦CG声波清洗机正是为了解决这一难题应运而生,可以彻底…

OrcaTerm AI

🙈作者简介:练习时长两年半的Java up主 🙉个人主页:程序员老茶 🙊 ps:点赞👍是免费的,却可以让写博客的作者开心好久好久😎 📚系列专栏:Java全栈,…

论Oracle兼容性,我们需要做什么

作者介绍:王海峰,数据库系统架构师,YashanDB SQL开发负责人,10年以上数据库内核技术开发经验。 Oracle兼容性是目前国产数据库的关键任务之一,其直接影响到商业迁移的成本和竞争力。 我们经常发现,部分国产…

蓝桥杯 题库 简单 每日十题 day13

01 乘积尾零 题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将 所填结果输出即可。如下的10行数据,每行有10个整数,请你求出它们的乘积的末尾有多少个零? 5650 4542 3554 473 946 4114 3871 9073 90 …

【SpringCloud】微服务技术栈入门8 - 黑马旅游微服务项目实战笔记

目录 黑马旅游案例分页查询自动补全安装依赖自定义分词器Completion Suggester 聚合数据聚合的分类Bucket 聚合Metrix 聚合RestClient 实现聚合suggest 查询结果 数据同步同步策略mq 同步 eses 搭设集群 黑马旅游案例 分页查询 前端页面以及对应请求接口已经设置完备&#xff…

制造业单项冠军(国家级、广东省、深圳市)奖励政策及申报对比

制造业单项冠军的头衔含金量极高,是某一细分领域的“领头雁”。下面深科信对“制造业单项冠军”(国家级、广东省级、深圳市级)的认定标准、奖励政策进行梳理 。 2023年9月25日,工信部办公厅正式发布《关于开展2023年制造业单项冠军…

c++视觉处理---Scharr滤波器

Scharr滤波器: cv::Scharr cv::Scharr 是OpenCV库中用于应用Scharr滤波器的函数。Scharr滤波器通常用于图像处理中的边缘检测和特征提取。这是 cv::Scharr 函数的基本用法: cv::Scharr(src, dst, ddepth, dx, dy, scale, delta, borderType);src: 输入…

C语言为什么for不执行?

C语言为什么for不执行? 一个表达式为初始化 第二个表达式为判断 第三个表达式为调整 如图所示,这是一种最常见,同样的,在这个循环当中同样的也能使用到continue和break关键字最近很多小伙伴找我,说想要一些C语言学习资…

1014蓝桥算法双周赛,学习算法技巧,助力蓝桥杯

家人们,我来免费给大家送福利了!!! 【1014蓝桥算法双周赛 】 背景 蓝桥杯全国软件和信息技术专业人才大赛是由工业和信息化部人才交流中心举办的全国性IT学科赛事。参赛高校超过1200余所,累计参赛人数超过40万人。该…

Java对接微信公众号事件监听回调

1. 公众号开启并配置 2. Java代码实现 1. 验证加密工具类 package cn.com.baidu.wxopen.util.wx;import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; import java.util.Arrays;/*** 验证工具类* 2023年10月12日09:47:04* CBC*/ public cla…

mysql8为什么要开启mysql5中原先的表名称大小写不敏感变成大小写敏感

mysql8为什么要开启mysql5中原先的表名称大小写不敏感变成大小写敏感? MySQL 8.0 对于表名的大小写敏感性的默认设置并没有变更。在 UNIX-like 系统中,表名是大小写敏感的,而在 Windows 中,它们是大小写不敏感的。这与文件系统的行为有关。…

【ROS】使用vscode浏览navigation2源码时,提示:没有那个文件或目录

1、问题描述 使用vscode浏览navigation2源码时,头文件下面有波浪线,并提示:没有那个文件或目录。比如没有:geometry_msgs/msg/polygon.h 错误信息: 无法打开源文件 “geometry_msgs/msg/polygon.h” (dependency of “nav2_controller/controller_server.hpp”)C/C++(16…