SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion

news2024/10/23 4:57:41

SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion

文章目录

  • SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion
    • 1. 论文背景
      • 1.1 通道独立-通道依赖的区别
      • 1.2 论文贡献
    • 2. 模型架构
      • 2.1 SOFTS的主要架构
      • 2.2 STAR 模块
    • 3. 实验结果
      • 3.1 多变量预测结果
      • 3.2 内存和计算使用分析
      • 3.2 鲁棒性(稳定性)分析
    • 4 结论

【论文标题】SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion

【论文地址】https://arxiv.org/abs/2404.14197

【论文源码】https://github.com/Secilia-Cxy/SOFTS

作者】Lu Han

机构】南京大学 人工智能学院

期刊】TKDE 2024

1. 论文背景

多变量时间序列预测在金融、交通管理、能源和医疗保健等多个领域中扮演着至关重要的角色。最近的研究强调了通道独立性在抵抗分布漂移方面的优势,但忽视了通道间的相关性,限制了进一步的改进。一些方法通过使用注意力或混合器等机制来捕捉通道间的相关性,但它们要么引入了过多的复杂性,要么过于依赖相关性,在分布漂移下,尤其是在大量通道的情况下,难以取得满意的结果。

本文介绍最近的一篇探索如何在更好地建模通道(channel)之间的相关性的多元时间序列文章。文章旨在解决通道独立(channel independent)方法缺乏对通道之间相关性的利用,以及通道依赖(channel dependent)方法不够鲁棒的问题。研究者提出了一种新颖的中心化结构传递不同通道的信息,相比于分布式结构如 Attention,Mixer 等中心化的结构,既降低了计算开销,而且提高了对于异常通道的鲁棒性,以更低的复杂度获得更好的性能。

多通道在时序任务上就是可以看成多变量

1.1 通道独立-通道依赖的区别

在多元时间序列领域,存在两种建模方式,一种是通道独立(channel independent)方法,另一种是通道依赖(channel dependent)方法。如下图所示:

image-20240620204726111

通道独立策略将多元时间序列分解为多个单一时间序列,并应用统一的单变量预测模型进行处理。这种方法因其对非平稳数据的强大鲁棒性而受到广泛青睐,但它未能考虑通道间的相互关联,限制了其性能的进一步优化。

相比之下,通道依赖策略通过引入专门的通道信息融合机制来促进通道间的信息交流。然而,这类方法面临两难:一方面,它们可能过度依赖通道间的相关性,从而在面对序列非平稳性时缺乏足够的鲁棒性;另一方面,它们可能采用如注意力机制等复杂的关系建模技术,导致计算复杂度增加,难以在大规模应用中扩展。

因此,如何利用通道独立的鲁棒性,并且设计更鲁棒和高效的通道交互模块,是学术界优化多元时序预测方法所必须要考虑的问题。

1.2 论文贡献

为了解决上述问题,该文章提出了以下 3 个贡献:

1.提出了基于序列核心融合的时间序列(SOFTS)预测器,这是一个基于多层感知机(MLP)的简单模型,它以较低的复杂度展示了最先进的性能。

2.提出了 STAR(STar Aggregate-Redistribute)模块,它是 SOFTS 的基础。STAR 被设计为一个集中结构,使用一个核心来聚合和交换来自各个通道的信息。与注意力机制这样的分布式结构相比,STAR 不仅降低了复杂度,还提高了对通道中异常情况的鲁棒性。

3.通过广泛的实验,研究者验证了 SOFTS 的有效性和可扩展性。同时,STAR 的普适性也在各种基于注意力的时间序列预测器上得到了验证。

2. 模型架构

2.1 SOFTS的主要架构

SOFTS 和 iTransformer 一样,使用序列级别的 embedding,提取每个通道的表示。不同的是,SOFTS 通过一种星型聚合分发模块(STar Aggregate Redistribute module, 简称 STAR)提取不同通道的序列之间的相关性,交换不同序列的信息。最后,SOFTS 通过线性层对每个通道的未来做出预测。

image-20240620205057666

模型主要流程简要分析:如上图,从左往右,有三个通道的序列数据作为输入,三条序列数据分别依次通过MLP操作、Pooling池化操作组成core模块中的三分之一(聚集起来就是整个core)。得到的core再通过Repeat&Concat(复制和拼接操作)分别与原三个输入序列做拼接,此时每个序列都已经拥有了其他两个序列的信息(也就是通道之间的信息交流),最后再通过一个MLP操作和线性层操作得到最后的输出结果。

2.2 STAR 模块

如2.1图中,蓝色框框部分就是作者所说的star模块。

STAR 是整个 SOFTS 方法的核心,它针对性地解决了现有通道交互模块的两个问题:

(1)Attention 等模块需要两两对比不同通道并计算相似度,导致平方级别的复杂度;
(2)这种两两比较易受通道本身的质量影响,而在现实的非平稳数据上,往往存在很多异常通道。

STAR 受到软件工程中星形集中式系统的启发,在该系统中,不是让客户端相互通信,而是有一个服务器中心来聚合和交换信息,其优点是高效且可靠。基于这一思想,STAR 通过一个核心代表所有通道的全局表示,将相互序列交互替换为间接交互。与分布式结构相比,STAR利用了通道统计信息的聚合带来的鲁棒性,从而实现了更好的性能。

image-20240620212650411

具体而言,多个通道的序列表示首先通过一个 MLP 映射,然后通过一个 pooling 操作得到一个核心(core)向量,这个核心向量综合了不同序列的特征,代表了整个序列的全局信息,然后将这个核心向量拼接到每个表示后,并用另一个 MLP 层进行融合。整个过程的计算复杂度只与通道数量,序列长度等呈线性关系。

3. 实验结果

3.1 多变量预测结果

在实验效果上,本文提出的 SOFTS 模型结构在现有的多元时序预测 benchmark 上均取得了比较明显的提升。这些显著的改进表明,SOFTS 模型在多变量时间序列预测任务中具有稳健的性能和广泛的适用性,特别是在具有大量通道的任务中在下表展示出的 24 个结果中,有 21 个是第一,3 个是第二。

image-20240620210412061

3.2 内存和计算使用分析

基于纯 MLP 结构,SOFTS 能以更小的计算和存储代价获得更好的性能。下图(b)展示了在 Traffic 数据集上,不同模型在回看窗口 L=96、预测范围 H=720 和批量大小为 4 时的内存和时间使用情况。尽管基于线性或 MLP 的模型如 DLinear 和 TSMixer 资源消耗较低,但在通道数量较大时表现不佳。下图(a)探讨了图(b)中表现最佳的三种模型在内存需求方面的表现。该图显示,随着通道数量的增加, PatchTST 和 iTransformer 的内存使用量显著上升。相比之下,SOFTS 模型保持了高效的操作,其复杂度与通道数量呈线性关系,有效地处理了大量通道的情况。

image-20240620210504983

3.2 鲁棒性(稳定性)分析

通过 STAR 模块,SOFTS 能够调整异常序列的表征,下图(a)表示了进入 STAR 之前的序列表示,异常的通道出现在远离正常分布的位置,在这种表示上预测仅能获得 0.414 的预测误差,而通过 STAR 调整后,这些通道的表示被重新调整,根据不同序列的特征聚类到类似的正常通道附近,其预测性能也被提升至 0.374,提升幅度达 9%。其性能受通道噪声的影响也更小,如下图©。因此,采用 STAR 结构的 SOFTS 更具鲁棒性。

image-20240620210612777

4 结论

尽管通道独立已被证明是提高多变量时间序列预测鲁棒性的有效策略,但通道间的相关性是进一步提升性能的重要信息。先前的方法在提取相关性时面临着模型复杂性和性能之间的两难困境。在本文中,研究者通过引入Series-cOre Fused Time Series预测器(SOFTS)解决了这一难题。SOFTS 在保持低复杂度的同时,实现了最先进的性能,并且通过创新的STar Aggregate-Redistribute(STAR)模块高效地捕捉了通道间的相关性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1844281.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

家用洗地机哪个牌子的好用性价比高?热销品牌型号推荐

洗地机在市场上越来越受到人们的欢迎,它能够一次性完成吸尘、拖地和清洗的所有步骤,极大地提高了清洁效率,是减轻人们日常清洁负担的优秀家电,为了避免大家盲信挑选机器,我整理了一份洗地机选购指南,帮助大…

基于MATLAB的误码率与信噪比(附完整代码与分析)

目录 一. 写在前面 二. 如何计算误码率 三. 带噪声的误码率分析 3.1 代码思路 3.2 MATLAB源代码及分析 四. 总结 4.1 输入参数 4.2 规定比特长度 4.3 特殊形式比较 一. 写在前面 (1)本文章主要讨论如何仿真误码率随着信噪比变化的图像 &#…

原子性(juc编程)

原子性 概述:所谓的原子性是指在一次操作或者多次操作中,要么所有的操作全部都得到了执行并且不会受到任何因素的干扰而中断,要么所有的操作都不执行,多个操作是一个不可以分割的整体。 //比如说:你喂你女朋友吃冰淇…

户外LED显示屏的发展历程

户外LED显示屏自其问世以来,经历了显著的发展与变革。其技术不断进步,应用场景逐步扩大,并在广告、信息传播等领域发挥了重要作用。本文将梳理户外LED显示屏的发展历程,重点介绍其技术演进和应用拓展。 早期发展:直插式…

一文带你理清同源和跨域

1、概述 前后端数据交互经常会碰到请求跨域,什么是跨域,为什么需要跨域,以及常用有哪几种跨域方式,这是本文要探讨的内容。 同源策略(英文全称 Same origin policy)是浏览器提供的一个安全功能。同源策略限制了从同一个源加载的…

海外盲盒小程序搭建过程的最大挑战:文化差异与本地化

一、引言 随着全球化的深入发展,跨境电商和海外市场的拓展成为许多企业的重要战略方向。盲盒小程序作为一种新兴的消费模式,也在海外市场展现出巨大的潜力。然而,在海外搭建盲盒小程序并非易事,文化差异与本地化问题是其搭建过程…

计算最大数位-第13届蓝桥杯省赛Python真题精选

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第87讲。 计算最大数位&…

Qwen2大模型微调入门实战-命名实体识别(NER)任务(完整代码)

Qwen2是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。 以Qwen2作为基座大模型,通过指令微调的方式做高精度的命名实体识别(NER),是学习入门LLM微调、建立大模型认知的非常好的任务。 使用LoRA方法训练&…

MySQL快速安装(mysql8.0.30区别之前yum安装)

目录 一.初始化环境并解压 二.创建程序用户管理 三.修改mysql目录和配置文件的权限 四.修改配置文件 五.设置环境变量,申明/宣告mysql命令便于系统识别 六.初始化数据库 七.设置系统识别,进行操作 八.初始化数据库密码 九.用户并设置密码 十.赋…

机器学习模型评估之校准曲线

模型校准曲线(Calibration Curve),也称为可靠性曲线(Reliability Curve)或概率校准曲线(Probability Calibration Curve),是一种评估分类模型输出概率准确性的图形工具。它可以帮助我…

STM32 串口通讯

使用STM32的串口通讯,接收串口助手的数据,并且将接收到的数据返回串口,重定义printf功能。 配置引脚信息 由于每次新建工程都需要配置信息,比较麻烦,好在STM32CubeIDE提供了导入.ioc文件的功能,可以帮我们…

达梦8 兼容MySQL语法支持非分组项作为查询列

MySQL 数据库迁移到达梦后,部分GROUP BY语句执行失败,报错如下: 问题原因: 对于Oracle数据库,使用GROUP BY时,SELECT中的非聚合列必须出现在GROUP BY后面,否则就会报上面的错误,达梦…

基于python+tkinter(Gui)的学生信息管理系统

博主介绍: 大家好,本人精通Java、Python、C#、C、C编程语言,同时也熟练掌握微信小程序、Php和Android等技术,能够为大家提供全方位的技术支持和交流。 我有丰富的成品Java、Python、C#毕设项目经验,能够为学生提供各类…

[创业之路-119] :制造业企业的必备管理神器-ERP-主要功能模块说明与系统架构

目录 一、ERP功能的标准化 二、常见的ERP标准化功能 2.1 基础档案 2.2 供应链 2.3 人力资源管理 2.4 资产管理 2.5 生产制造 2.6 财务会计 2.7 管理会计 2.8 CRM客户管理管理 2.9 商业智能分析 三、常见的ERP软件供应商 国内ERP软件供应商 国外ERP软件供应商 四…

2024考古之还在用原始JDBC开发 手搓 案例 实现一个模块的增删改

JDBC案例 将来如果完成的话 就代表对JDBC里面的知识点全部融会贯通了 其实就是对数据的增删改查 我们入门做不出来前端的内容 很正常 准备环境 建表 use mybatis;create table tbl_brand (id int primary key auto_increment,brand_name varchar(20),company_name varcha…

在hue中使用ooize调度ssh任务无法执行成功,无法查看错误

ssh执行失败,但是hue没有给出明确的错误原因: 经过经验分析,原来是服务器上的sh文件用的是doc/window格式,需要使用notepad将格式改为unix之后就可以正常执行。 特此记录,避免遗忘知识点

图标设计新手手册:应用图标尺寸比例全解析

通常我们在App Store中寻找新的应用程序时,首先会快速扫描搜索栏中的一些关键词,然后选择感兴趣的应用程序,在选定的应用页面中查看具体信息,最后决定是否下载。在这一系列操作中,APP图标的大小比例是影响用户体验的关…

大腾智能,基于云原生的国产工业协同平台

大腾智能是一家基于云原生的国产工业软件与数字化协同平台,专注于推动企业数字化转型与升级,为企业提供一系列专业、高效的云原生数字化软件及方案,推动产品设计、生产及营销展示的革新,实现可持续发展。 大腾智能旗下产品 3D模型…

前端构建工具用得好,构建速度提升 10 倍

今天来盘点一下前端构建工具。 Turbopack Turbopack,由Vercel开源,是下一代高性能的JavaScript应用构建工具,目前用于 Next.js 中。Turbopack旨在通过革新JavaScript应用的打包流程来显著提升应用性能,它专注于缩短加载时间&…

小阿轩yx-Tomcat 部署及优化

小阿轩yx-Tomcat 部署及优化 Tomcat 概述 免费的、开放源代码的Web应用服务器Apache软件基金会(Apache Software Foundation)Jakarta项目中的一个核心项目由Apache、Sun和一些公司及个人共同开发而成深受Java爱好者的喜爱,并得到部分软件开发商的认可目前比较流行的Web应用服…