AI论文速读 | 2024[IJCAI]时空解耦掩码预训练的时空预测

news2025/1/11 9:55:46

题目: Spatial-Temporal-Decoupled Masked Pre-training for Spatiotemporal Forecasting

作者:Haotian Gao ; Renhe Jiang(姜仁和) ; Zheng Dong ; Jinliang Deng (邓锦亮); Yuxin Ma ; Xuan Song(宋轩)

机构:东京大学,南方科技大学,悉尼大学

arXiv网址https://arxiv.org/abs/2312.00516

Cool Paperhttps://papers.cool/arxiv/2312.00516

代码https://github.com/Jimmy-7664/STD-MAE

关键词:自监督预训练,时空解耦,掩码自编码器,时空预测,异质性

TL; DR: 本研究提出了一种自监督预训练框架STD-MAE,利用时空解耦掩码自编码器(S-MAE和T-MAE)分别在空间和时间维度上重建时空序列,以学习丰富的上下文表示,这些表示可以无缝集成到下游预测器中,提升其性能。


🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要

时空预测技术对于交通、能源和天气等各个领域都具有重要意义。由于复杂的时空异质性,时空序列的准确预测仍然具有挑战性。特别是,当前的端到端模型受到输入长度的限制,因此经常陷入时空幻觉spatiotemporal mirage),即相似的输入时间序列后面跟着不同的未来值,反之亦然。为了解决这些问题,本文提出了一种新颖的自监督预训练框架时空解耦掩码预训练(STD-MAE),它采用两个解耦屏蔽自动编码器沿空间和时间维度重建时空序列。通过这种重建学习的丰富上下文表示可以由下游预测器与任意架构无缝集成,以增强其性能。对六个广泛使用的基准(PEMS03、PEMS04、PEMS07、PEMS08、METR-LA 和 PEMS-BAY)进行了一系列定量和定性评估,以验证 STD-MAE 的最先进性能。

Q: 这篇论文试图解决什么问题?

A: 这篇论文提出了一种新颖的自监督预训练框架,名为Spatial-Temporal-Decoupled Masked Pre-training (STD-MAE),旨在解决时空预测中的一些关键挑战。具体来说,论文试图解决以下问题:

  1. 复杂的时空异质性:时空序列预测的准确性受到时空异质性的挑战,因为时空数据在不同位置(如城市中心与郊区)和不同时间段(如工作日与周末)表现出不同的模式。
  2. 端到端模型的输入长度限制:现有的端到端模型由于其高模型复杂性,通常将输入范围限制在较短的值(通常为12步),这限制了模型捕捉完整的时空依赖性的能力。
  3. 时空幻影(mirage)问题:由于现有模型只能捕捉到片段化的异质性而非完整的异质性,导致模型在面对时空幻影(即相似的输入时间序列可能跟随不同的未来值,反之亦然)时表现不佳。
  4. 学习清晰完整的时空异质性:为了提高模型在时空幻影问题上的鲁棒性,论文提出了通过预训练来学习清晰和完整的时空异质性。

STD-MAE框架通过两个解耦的掩码自编码器(masked autoencoders)分别在空间和时间维度上重建时空序列,从而学习到丰富的上下文表示,这些表示可以无缝地集成到下游预测器中,以增强其性能。论文通过在六个广泛使用的基准数据集上的定量和定性评估来验证STD-MAE的性能。

时空异质性和幻觉

Q: 有哪些相关研究?

A: 论文中提到的相关研究主要涉及以下几个领域:

  1. 时空预测(Spatiotemporal Forecasting):旨在通过分析历史数据来预测未来的时空序列。早期的工作主要依赖于传统的时间序列模型,后来发展到使用循环神经网络(RNNs)和卷积神经网络(CNNs)来更好地建模时空数据。
  2. 图卷积网络(Graph Convolutional Networks, GCNs):一些研究通过将GCNs与时间模型结合,以更好地捕捉网络化道路系统中的时空特征。
  3. 注意力机制(Attention Mechanisms):在时空预测中,注意力机制,特别是变换器(Transformers),已被提出并展现出在捕捉时空关系方面的优越性能。
  4. 掩码预训练(Masked Pre-training):在自然语言处理(NLP)和计算机视觉(CV)中,掩码预训练已成为一种高效的自监督表示学习技术。这种方法通过预测输入中被遮蔽的部分来训练模型,使其能够学习到丰富的上下文表示。
  5. 时间序列数据的预训练技术:最近,研究人员尝试将预训练技术应用于时间序列数据,以获得更优越的隐藏表示。

这些研究为本文提出的STD-MAE框架提供了理论基础和技术背景。

Q: 论文如何解决这个问题?

STD-MAE

A: 论文提出了一种新颖的自监督预训练框架,名为Spatial-Temporal-Decoupled Masked Pre-training (STD-MAE),来解决时空预测中的挑战。以下是解决这个问题的关键步骤和方法:

  1. 时空解耦掩码预训练(Spatial-Temporal-Decoupled Masking):提出了一种新的掩码策略,分别在空间和时间维度上执行掩码和重建任务。这种方法允许模型分别学习空间和时间上的异质性,从而能够更清晰地捕捉到时空数据的复杂性。
  2. 时空解耦掩码自编码器(Spatial-Temporal-Decoupled Masked AutoEncoder):构建了一个由时间自编码器(T-MAE)和空间自编码器(S-MAE)组成的框架,每个自编码器都具有相似的架构。S-MAE沿空间维度应用自注意力,而T-MAE沿时间维度应用自注意力。
  3. 长输入处理:为了处理长输入序列,论文采用了分块嵌入技术,将长输入序列划分为非重叠的小块,并使用全连接层和二维位置编码来获得嵌入表示。
  4. 轻量级解码器:为了重建被掩码的输入,S-MAE和T-MAE使用了轻量级解码器,该解码器由填充层、标准变换层和回归层组成。
  5. 下游时空预测集成:STD-MAE生成的空间和时间表示可以无缝集成到现有的预测器结构中,通过将这些表示添加到预测器的隐藏表示中,可以显著提高下游时空预测器的性能。
  6. 定量和定性评估:通过在六个广泛使用的基准数据集上的实验,展示了STD-MAE在定量和定性上的性能,验证了其在捕捉时空异质性和提高预测准确性方面的有效性。
  7. 超参数研究:论文还进行了超参数研究,包括掩码比例和预训练长度,以找到最佳的模型性能。

通过这些方法,STD-MAE能够有效地学习时空数据的清晰和完整的异质性,并且能够提高下游预测器在复杂时空预测任务中的性能。

Q: 论文做了哪些实验?

数据集

12步预测流量数据集结果

速度数据集结果

在预训练阶段,长输入时间序列的长度( T l o n g T_{long} Tlong)对于不同的数据集分别设置为864、864、864、2016、864和864时间步长。

A: 论文中进行了一系列的实验来验证所提出的Spatial-Temporal-Decoupled Masked Pre-training (STD-MAE)框架的有效性。以下是实验的主要部分:

  1. 实验设置
    • 使用了六个真实世界的时空基准数据集,包括PEMS03、PEMS04、PEMS07、PEMS08、METR-LA和PEMS-BAY。
    • 对数据进行了Zscore标准化处理。
    • 设定了不同的数据集的训练、验证和测试集的比例。
    • 选择了嵌入维度、变换层数量、多头注意力的头数、填充大小等超参数。
  2. 整体性能评估
    • 将STD-MAE与多个基线方法进行了比较,包括ARIMA、VAR、SVR、LSTM、TCN、Transformer以及多种时空模型,如DCRNN、STGCN、ASTGCN、GWNet等。
    • 使用平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)作为评估指标。
  3. 消融实验
    • 设计了四种变体来验证时空掩码机制的有效性,包括仅在空间维度掩码的S-MAE、仅在时间维度掩码的T-MAE、使用时空混合掩码的STM-MAE以及不使用掩码预训练的w/o Mask。
  4. 预测器消融
    • 为了评估STD-MAE的通用性,将其与五种不同的下游预测器进行了集成,包括DCRNN、MTGNN、STID、STAEformer和GWNet。
  5. 超参数研究
    • 研究了掩码比例对模型性能的影响,发现0.25的掩码比例在所有数据集上都能获得最低的误差。
    • 研究了预训练长度对模型性能的影响,测试了一天、三天和一周的预训练长度。
  6. 效率测试
    • 对比了STD-MAE与其他预训练模型的效率,特别是在处理具有大量传感器数据集时的效率。
  7. 案例研究
    • 展示了STD-MAE在预训练阶段的重建准确性,以及在面对时空幻影问题时的预测鲁棒性。

这些实验全面地评估了STD-MAE框架的性能,包括其在不同数据集上的表现、与现有方法的比较、不同变体和超参数对性能的影响,以及其在实际预测任务中的有效性。

消融实验

消融实验2

超参数-掩码率

超参数-预训练输入长度

效率实验

预训练重建准确率

时空幻觉预测

Q: 总结一下论文的主要内容

A: 这篇论文提出了一种新颖的自监督预训练框架,名为Spatial-Temporal-Decoupled Masked Pre-training (STD-MAE),用于改进时空预测任务。以下是论文的主要内容总结:

  1. 问题背景:时空预测对于交通、能源和气象等领域至关重要。由于时空数据的复杂异质性,准确预测时空序列面临挑战。

  2. 现有模型局限:当前的端到端模型受限于输入长度,难以捕捉完整的时空依赖性,容易受到“时空幻影”问题的影响。

  3. STD-MAE框架:提出了一种新的预训练框架,通过两个解耦的掩码自编码器(S-MAE和T-MAE)分别在空间和时间维度上重建时空序列,以学习丰富的上下文表示。

  4. 方法细节

    • 时空解耦掩码:分别在空间和时间维度上执行掩码操作,以捕捉长距离的时空异质性。
    • 自编码器架构:使用自注意力机制分别在空间和时间维度上进行信息编码。
    • 长输入处理:采用分块嵌入技术和二维位置编码来处理长输入序列。
  5. 下游集成:STD-MAE生成的表示可以无缝集成到各种下游预测器中,以增强其性能。

  6. 实验验证:在六个广泛使用的基准数据集上进行了定量和定性评估,验证了STD-MAE在捕捉时空异质性和提高预测准确性方面的有效性。

  7. 消融实验:通过一系列消融实验,展示了时空解耦掩码策略的有效性,并证明了STD-MAE对不同下游预测器的通用性。

  8. 超参数研究:探讨了掩码比例和预训练长度对模型性能的影响,以找到最优的模型配置。

  9. 效率测试:尽管引入了两个解耦的自编码器,STD-MAE在效率上仍然优于其他预训练模型,特别是在处理大量传感器数据集时。

  10. 案例研究:通过案例研究展示了STD-MAE在预训练阶段的重建准确性和在面对时空幻影问题时的预测鲁棒性。

  11. 结论:STD-MAE通过学习清晰和完整的时空异质性,显著提高了时空预测的性能,并为下游预测器提供了一种有效的增强方法。

  12. 案例研究:通过案例研究展示了STD-MAE在预训练阶段的重建准确性和在面对时空幻影问题时的预测鲁棒性。

  13. 结论:STD-MAE通过学习清晰和完整的时空异质性,显著提高了时空预测的性能,并为下游预测器提供了一种有效的增强方法。

论文的贡献在于提出了一种新的预训练方法,可以显著提高时空预测的准确性,并且具有很好的通用性和效率。
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1656769.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python软件安装使用

一、搭建 Python 环境 需要安装的环境主要是两个部分 : 运行环境: Python 开发环境: PyCharm 具体详细安装见此篇博客:Python安装教程 二、创建一个项目 a) 创建一个项目 b) 选择项目所在的位置 , 并选择使用的 Python 解释器 . 注意 , 一般情况下 , PyCh…

活动回顾 |观测云 AI Agent 探索实践

亚马逊云科技“构建全球化软件和互联网新生态——ISV 行业”论坛上,观测云产品架构师刘锐发表了题为“AI Agent 可观测性探索与实践”的主题演讲,不仅展示了观测云在人工智能领域的前沿技术,更强调了在日益复杂的系统环境中,实现有…

软件设计师笔记(一)-基础要点

本文内容来自笔者学习zst 留下的笔记,虽然有点乱,但是哥已经排版过一次,将就着看吧,查缺补漏,希望大家都能通过,记得加上免费的关注!谢谢!csdn贴图真的很废人! 目录 一、…

复杂链表的复制

. - 力扣(LeetCode). - 备战技术面试?力扣提供海量技术面试资源,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/fu-za-lian-biao-de-fu-zhi-lcof/ 代码实现: /* // Defini…

【Qt 学习笔记】Qt常用控件 | 输入类控件 | Slider的使用及说明

博客主页:Duck Bro 博客主页系列专栏:Qt 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ Qt常用控件 | 输入类控件 | Slider的使用及说明 文章编号:…

使用DBeaver连接postgreSql提示缺少驱动

重新安装电脑之后用dbeaver链接数据库的时候,链接PG库一直提示缺少驱动,当选择下载驱动的时候又非常非常慢经常失败,尝试了一下更改源然后下载库驱动就非常快了,当然也包括dbeaver的自动更新。 方法:点击菜单栏【窗口…

数据防泄密

随着各行各业业务数据信息化发展,各类产品研发及设计等行业,都有关乎自身发展的核心数据,包括业务数据、代码数据、 机密文档、用户数据等敏感信息,这些信息数据有以下共性: — 属于核心机密资料,万一泄密…

C语言—操作符详解(操作符、进制转换、原码反码补码、结构体)

1.操作符分类 算术操作符&#xff1a; 、- 、 * 、 / 、%移位操作符&#xff1a;<< >> //移动的是二进制位位操作符&#xff1a;& | ^ //使用二进制位进行计算赋值操作符&#…

Linux系统运维:修改docker容器与宿主机之间的端口映射,解决端口占用问题

目录 一、问题 二、docker端口映射 &#xff08;一&#xff09;docker端口映射定义 1、相关概念&#xff1a; 2、默认情况下&#xff0c;Docker容器会有一个端口映射&#xff1a; 3、端口范围&#xff1a; &#xff08;二&#xff09;配置相关 1、指定端口映射 2、随机…

3D模型如何实现拖拽打开?---模大狮模型网

在当今数字化时代&#xff0c;3D技术的应用已经深入到各行各业&#xff0c;为用户带来了更加丰富、生动的体验。然而&#xff0c;对于一些用户来说&#xff0c;打开和查看3D模型可能会面临一些困难&#xff0c;特别是在无法拖拽打开时。本文将为您揭示解决这一问题的方法&#…

c4d云渲染怎么操作?怎么使用?一文带你了解

Cinema 4D (C4D) 不仅是众多设计师所青睐的卓越三维软件&#xff0c;其自带的高效渲染器以及对云渲染农场的支持&#xff0c;都极大地拓宽了创意和生产的边界。通过利用强大的云计算资源&#xff0c;C4D能够帮助用户轻松克服渲染速度缓慢的难题&#xff0c;从而实现更加流畅和高…

2024人文艺术、社会发展与教育国际会议(ICHASDE2024)

2024人文艺术、社会发展与教育国际会议(ICHASDE2024) 会议简介 2024年国际人文、艺术、社会发展与教育会议&#xff08;ICHASDE2024&#xff09;将在中国昆明举行。会议旨在为从事“人文、艺术、社会发展和教育”的专家、学者、工程师和技术人员提供一个平台&#xff0c;分享…

学习经验分享【36】论文投稿写作(非理工科文章)

业务进一步扩展&#xff0c;可辅导非理工科偏文科性质的论文辅导&#xff0c;有需要评职称但没有时间精力研究的或者其他相关需求的朋友可咨询了解。 人工智能技术在各领域的发展和思考&#xff0c;类似这种主题的文章。

SAP-ABAP-ALV报表

1、功能介绍 什么是ALV报表 2、开发步骤 事物码: SE38创建报表程序SE93生成TCODESE43SE91消息号报表类型:简单报表、复杂报表、报表树 报表组成:查询界面(选择屏幕)、展示界面、功能按钮 基本流程: 重点:数据放在内表里,临时表,放在内存里。 3、开发实战 按标题…

通过命令行设置ipv4

使用管理员打开命令行窗口。管理员权限更高。 使用Netsh查看网络信息. 在更改IP地址和相关信息之前&#xff0c;需要先找到要更改的网络接口的名称&#xff0c;执行以下命令&#xff1a; netsh interface ipv4 show config运行后, WLAN就是待修改的网络的名称。 自动获取i…

如何通过wifi网络将串口数据发送到多个设备

摘要&#xff1a;当lora电台的速率无法满足高速传输时&#xff0c;可以考虑用“串口服务器”。本文介绍一下如何使用TP-LINK的TL-CPE300D实现一对多的数据发送。 当前也有使用lora电台的&#xff0c;但是lora电台支持的速率有限&#xff0c;可能最大支持到9600&#xff0c;甚至…

8.删除有序数组中的重复项 II

文章目录 题目简介题目解答解法一&#xff1a;双指针&#xff08;快慢指针&#xff09;代码&#xff1a;复杂度分析&#xff1a; 题目链接 大家好&#xff0c;我是晓星航。今天为大家带来的是 删除有序数组中的重复项 II 相关的讲解&#xff01;&#x1f600; 题目简介 题目解…

【高阶数据结构】并查集

并查集 并查集1、概念2、根据人找编号 / 根据编号找人&#xff08;简单介绍一下并查集&#xff09;&#xff08;1&#xff09;代码展示&#xff08;2&#xff09;调试结果&#xff08;3&#xff09;优化1&#xff1a;小的往大的合并&#xff08;4&#xff09;优化2&#xff1a;…

如何把逻辑地址转换为物理地址

​ 使用系统架构设计师真题说明&#xff08;2021年&#xff09;某计算机系统页面大小为 4K&#xff0c;进程 P1 的页面变换表如下图示&#xff0c;看 P1 要访问数据的逻辑地址为十六进制 1B1AH&#xff0c;那么该逻辑地址经过变换后&#xff0c;其对应的物理地址应为十六进制&…

基于一种改进小波阈值的微震信号降噪方法(MATLAB)

微震是指岩体由于在人为扰动或自然原因下受力变形&#xff0c;发生破裂过程中能量积聚而释放的弹性波或应力波。微震信号具有信噪比低、不稳定性、瞬时性和多样性等特点。因此&#xff0c;在任何损坏之前都会出现微小的裂缝&#xff0c;这种微小的裂缝是由岩层中应力和应变的变…