TRB 2024论文分享:融合Transformer和自监督学习的长时交通流预测模型

news2025/1/17 18:11:36

TRB(Transportation Research Board,美国交通研究委员会,简称TRB)会议是交通研究领域知名度最高学术会议之一,近年来的参会人数已经超过了2万名,是参与人数和国家最多的学术盛会。TRB会议几乎涵盖了交通领域的所有主题,主要包括公路、铁路、水运、航空、管道等诸多领域,接收来自交通系统、交通工程、交通政策、交通管理、交通实际操作、政府研究、学术研究和工业界最新的研究成果。TRB会议的论文反映了交通领域的研究前沿,具有广泛的参考价值。

本文主要介绍我们在长时交通流预测方面的最新研究成果《Hybrid Transformer and Spatial-Temporal Self-Supervised Learning for Long-term Traffic Prediction》,论文的第一作者为朱旺。交通流预测是智能交通系统的重要组成部分,一直是交通领域的研究热点。相较于短时预测,由于误差的积累和数据的时延性,长时交通流预测更具挑战性。此外,以往的模型只是对时空相关性进行建模,而现实生活中不同功能区域的交通模式往往不同,时空异质性在一定程度上也会影响预测效果。基于以上问题,本文设计了一个融合Transformer和自监督学习的长时交通流预测模型。实验结果表明,在自监督任务的辅助下,模型可以更好地捕获交通数据的长时时空特征,从而得到更准确的预测效果。

1. 研究背景与解决的关键问题

交通流预测是智能交通系统的重要组成部分,实时、准确的预测对优化交通流、管理拥堵以及提高整体交通效率至关重要。交通数据是典型的时空数据,交通流预测由于其动态的时间相关性和复杂的空间依赖性,一直是一项具有挑战性的任务。相较于短时预测,由于数据时延性、模型长时记忆困难和预测误差积累等问题,长时交通流预测更具挑战性。本文针对以下挑战进行合理建模:

(1) 模型长时记忆困难

以往的研究中,大多数预测模型都是基于RNN及其变体,如LSTM和GRU等。这类模型在长时记忆问题上有一定的局限性。我们通过多头注意力机制考虑上下文信息,从而更有效地处理长时依赖关系。

(2) 特征捕获不全面问题

不同功能区域的交通模式往往不同,时空异质性在很大程度上影响了模型的预测效果。我们设计了两个自监督学习任务分别对时间异质性和空间异质性进行建模,从而捕获更全面的时空特征,进而提升模型的预测能力。

(3) 数据不全面问题

交通流预测问题本质上是从观测到的数据中学习时空特征,从而对未来一段时间内的数据进行预测。因此数据对预测的影响十分重要。我们设计了一个自适应图增强模块,对交通数据进行自适应增强。

2. 方法

本文提出的基于Transformer和自监督学习的混合模型的整体框架如图1所示。该模型主要由3个模块组成,分别为自适应图增强模块、时空嵌入模块、自监督学习模块。为了增强交通数据的表征,我们引入了一个自适应图增强模块,分别从序列级和拓扑结构级进行数据增强,从而增强模型的鲁棒性。考虑到一般深度学习模型长时记忆困难的问题,我们设计了一个基于Transformer和图卷积的时空嵌入模块,分别对交通数据的时间特征和空间特征进行建模。在时间特征维度,Transformer通过多头注意力机制关注全局信息,从而有效地进行长序列数据的特征捕获。在空间特征维度,我们通过切比雪夫多项式图卷积进行建模,在减少复杂度的同时,可以有效聚合节点信息。此外,考虑到时空异质性对预测的影响,我们设计了两个自监督学习任务分别对时空异质性进行建模,从而提高模型的泛化能力和预测精度。

图1 T-ST-SSL模型的整体框架

3. 实验结果

本文的实验在PeMS04和PeMS08两个公开数据集上进行,通过跨度为一小时的交通速度数据,分别对未来30分钟、45分钟、60分钟的交通速度进行预测。通过MAE、MAPE、RMSE、SMAPE四个评价指标对预测的结果进行全面地评估。相比于7种基线模型,我们提出的模型在长时预测上具有优越的表现。通过对预测结果进行可视化,可以直观地看出,我们的模型拥有更准确的预测结果,同时对数据的拐点更敏感,更能捕获数据的变化。此外,为了验证模型各个模块的有效性,我们进行了消融实验。实验结果表明,我们基于Transformer和图卷积设计的时空嵌入模块可以有效捕获时空特征,在两个自监督学习任务和自适应图增强模块的协同作用下,模型可以更好地进行长时预测。

4. 结论

本文提出了一种融合Transformer和时空异质性自监督学习的模型,有效地解决了长时记忆困难、数据不全面、特征捕获不全面的问题。该模型通过Transformer的自注意机制和图卷积分别对动态的时间相关性和复杂的空间依赖性进行建模,从而捕获长时时空依赖性。为了更好地挖掘交通数据中的时空特征,引入了自适应数据增强方法,对交通信息进行序列级和图结构级的增强。此外,我们设计了两个自监督学习任务对时空异质性进行建模,进一步提高了模型的性能。在两个真实数据集上进行的大量长时交通流预测实验表明,我们的模型展现出了优越的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1392301.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【管理篇 / 升级】❀ 13. FortiOS 7.4固件升级新规则 ❀ FortiGate 防火墙

【简介】飞塔防火墙的固件升级一直是所有厂家中最好的。只要有注册官方帐号,有注册设备,并且只要有一台设备在服务期内,即可下载所有型号的所有版本的固件。即使其它设备服务期已过,也可以通过固件文件手动升级,避免防…

three.js 点按钮,相机飞行靠近观察设备

效果&#xff1a; 代码&#xff1a; <template><div><el-container><el-main><div class"box-card-left"><div id"threejs" style"border: 1px solid red"></div><div class"box-right&quo…

unable to create new native thread 问题处理

目录 unable to create new native thread 问题处理一、背景二、该问题产生可能原因三、处理过程3.1 确认内存是否不足3.2 确认机器线程数达到限制 四、总结 unable to create new native thread 问题处理 一、背景 生产实时集群部分节点的部分任务失败触发自动重启&#xff…

Unity之铰链关节和弹簧组件

《今天闪电侠他回来了&#xff0c;这一次他要拿回属于他的一切》 目录 &#x1f4d5;一、铰链关节组件HingeJoint 1. 实例 2. 铰链关节的坐标属性 ​3.铰链关节的马达属性Motor &#x1f4d5;二、弹簧组件 &#x1f4d5;三、杂谈 一、铰链关节组件HingeJoint 1. 实例 说…

基于Mapbox的Mvt矢量瓦片集成实践

目录 前言 一、数据说明 1、基本数据 2、属性数据 二、Mapbox集成Mvt矢量瓦片 1、关于访问令牌 2、定义html 3、初始地图 4、加载矢量瓦片 5、效果展示 总结 前言 熟悉矢量瓦片的朋友一定知道&#xff0c;在Webgis当中&#xff0c;矢量瓦片的格式除了pbf的格式&#x…

SuperPoint和SuperGlue 的算法介绍及学习应用经验分享

这里写目录标题 I.SuperPoint和SuperGIue的背景介绍特征点提取和匹配特征点的构成基于神经网络的方法优化方向一&#xff1a;增强特征点检测和描述子生成优化方向二&#xff1a;增强匹配和外点去除策略 背景和效果神经网络真的优于传统方案吗&#xff1f;DEMO演示为什么研究 2.…

Servlet系列:两种创建方式(xml,注解)

一、使用web.xml的方式配置&#xff08;Servlet2.5之前使用&#xff09; 在早期版本的Java EE中&#xff0c;可以使用XML配置文件来定义Servlet。在web.xml文件中&#xff0c;可以定义Servlet的名称、类名、初始化参数等。然后&#xff0c;在Java代码中实现Servlet接口&#x…

LeetCode、2336. 无限集中的最小数字(中等,小顶堆)

文章目录 前言LeetCode、2336. 无限集中的最小数字题目链接及类型思路代码题解 前言 博主所有博客文件目录索引&#xff1a;博客目录索引(持续更新) LeetCode、2336. 无限集中的最小数字 题目链接及类型 题目链接&#xff1a;2336. 无限集中的最小数字 类型&#xff1a;数据…

解析HTTP响应的状态码和头部信息

HTTP响应是客户端与服务器之间通信的重要部分。它包含了服务器对客户端请求的回应&#xff0c;以及与该响应相关的各种信息。在HTTP响应中&#xff0c;有两个关键部分&#xff1a;状态码和头部信息。 状态码 状态码是HTTP响应的第一部分&#xff0c;它是一个三位数字的代码&a…

【AI】RTX2060 6G Ubuntu 22.04.1 LTS (Jammy Jellyfish) 部署Chinese-LLaMA-Alpaca-2

下载源码 cd ~/Downloads/ai git clone --depth1 https://gitee.com/ymcui/Chinese-LLaMA-Alpaca-2 创建venv python3 -m venv venv source venv/bin/activate安装依赖 pip install -r requirements.txt 已安装依赖列表 (venv) yeqiangyeqiang-MS-7B23:~/Downloads/ai/Chi…

CCF认证+蓝桥杯习题训练

贪心 *上取整公式* *代码展示* #include <iostream> #include <cstring> #include <algorithm>using namespace std;const int N 1e5 10;typedef long long LL;int v[N] , a[N];int main() {int n , d;cin >> n >> d;for(int i 1 ; i < n…

oracle19C之grant语句

官网地址&#xff1a;GRANT 欢迎关注留言&#xff0c;我是收集整理小能手&#xff0c;工具翻译&#xff0c;仅供参考&#xff0c;笔芯笔芯. 授予 目的 使用GRANT 致赠款声明: 用户和角色的系统权限。 表18-1 列出系统权限(由操作的数据库对象组织)。 注意ANY 例如,系统特权,SEL…

Spring5深入浅出篇:Spring与工厂设计模式简介

Spring5深入浅出篇:Spring与工厂设计模式简介 什么是Spring Spring是⼀个轻量级的JavaEE解决⽅案&#xff0c;整合众多优秀的设计模式轻量级 1. 对于运⾏环境是没有额外要求的开源 tomcat resion jetty收费 weblogic websphere 2. 代码移植性⾼不需要实现额外接⼝JavaEE的解…

java多线程传参数

package com.myThread;public class AdminThread extends Thread{private String name;public void AdminThread(String name){this.name name;}Overridepublic void run() {//线程开始之后执行的代码for (int i 0; i < 100; i) {System.out.print(getName()"线程…

Qt/QML编程之路:slider(34)

滑条slider&#xff0c;有时也成为进度条progressbar&#xff0c;在GUI界面中也是经常用到的。 import QtQuick 2.9 import QtQuick.Controls 2.0 import QtQuick.Layouts 1.2ApplicationWindow {id:rootvisible: truewidth: 1920height: 720//title: qsTr("Hello World&q…

matlab快速入门(读取数据并绘制散点图和拉格朗日插值

目录 1.读取excel&#xff1a;2.注释快捷键&#xff1a;3.数组/矩阵索引&#xff1a;4.绘制散点图&#xff1a;5.拉格朗日插值&#xff1a;5.1分割出非空和空的x和y两组数据&#xff1a;5.2插值&#xff1a;5.3画图&#xff1a; 小结&#xff1a; 1.读取excel&#xff1a; [nu…

《动手学深度学习》学习笔记 第9章 现代循环神经网络

本系列为《动手学深度学习》学习笔记 书籍链接&#xff1a;动手学深度学习 笔记是从第四章开始&#xff0c;前面三章为基础知识&#xff0c;有需要的可以自己去看看 关于本系列笔记&#xff1a; 书里为了让读者更好的理解&#xff0c;有大篇幅的描述性的文字&#xff0c;内容很…

Unity之触发器

目录 &#x1f4d5;一、触发器概念 &#x1f4d5;二、碰撞与触发的区别 &#x1f4d5;三、触发器小实例 一、触发器概念 第一次玩侠盗猎车手是在小学&#xff0c;从那以后就开启了我的五星好市民之路。 下面是小编在小破站截的图&#xff0c;这是罪恶都市最开始的地方&a…

数据结构奇妙旅程之二叉树初阶

꒰˃͈꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好&#xff0c;我是xiaoxie.希望你看完之后,有不足之处请多多谅解&#xff0c;让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN …

深度好文:MySQL体系结构

MySQL采用的是客户/服务器体系结构&#xff0c;实际是有两个程序&#xff0c;一个是MySQL服务器程序&#xff0c;指的是mysqld程序&#xff0c;运行在存放数据库的机器上&#xff0c;负责在网络上监听并处理来自客户的服务请求&#xff0c;根据这些请求去访问数据库的内容&…