VisionTS:基于时间序列的图形构建高性能时间序列预测模型,利用图像信息进行时间序列预测

news2024/12/30 8:40:19

构建预训练时间序列模型时面临的主要挑战是什么?获取高质量、多样化的时间序列数据。目前构建基础预测模型主要有两种方法:

  1. 迁移学习LLM:通过针对时间序列任务定制的微调或分词策略,重新利用预训练的大型语言模型(LLM),如GPT-4Llama
  2. 从零训练:构建大规模时间序列数据集,并从头开始预训练模型,以期望其能泛化到新数据。

尽管第一种方法可行(因为Transformer是通用计算引擎)但其效果并不理想。第二种方法已经取得了更显著的成功,如MOIRAI、TimesFM、TTM等模型所示。

然而这些模型似乎遵循扩展定律,其性能很大程度上依赖于大量时间序列数据的可用性——这又将我们带回到最初的挑战。

那么如果我们能够利用不同的数据模态,比如图像呢?这种思路可能看似反直觉,但一些研究人员探索了这个假设并取得了突破性的结果。本文将讨论以下几个方面:

  • 图像如何在内部编码序列信息?
  • 利用预训练计算机视觉模型进行时间序列分析的概念
  • VisionTS:一种适用于时间序列数据的预训练Vision Transformer模型。

为什么选择图像?

图像本质上是像素的2D序列。因此图像可以被视为一个数值像素矩阵——展现了真实世界时间序列的典型特征,如趋势、季节性和平稳性。(参见图1

**图1:**来自ImageNet数据集的图像示例,展示了时间序列的典型特征

如前所述,预训练文本模型(迁移学习LLM)已被应用于时间序列任务,但效果有限。

那么,图像模态具有哪些优势?

  • 连续性:时间序列和图像都是连续的数据形式,而文本是离散的。
  • 相似的数据来源:时间序列和图像都直接捕捉环境观测,而文本是认知加工的产物。
  • 可比的信息密度:文本通常意义密集,而图像和时间序列数据作为自然信号具有更多的冗余信息。
  • 序列信息编码:与文本不同,图像本身就包含了时间序列的多种特征(参见图1)。

基于这些原因,图像似乎是一个具有潜力的数据模态。正如Yann LeCun在Lex Fridman的播客中所指出的,仅依靠文本是不足以构建强大的通用人工智能(AGI)的。图像作为更丰富、高维度的数据形式,可能提供对世界更深入的理解。

此外,图像数据的丰富程度远超其他模态——例如,考虑自动驾驶汽车中的激光雷达(LIDAR)每秒捕获和处理的大量数据。

所以关键问题就变成了如何创建一个利用图像进行预测的基础时间序列模型?

论文提出了一个方法是重新利用预训练的计算机视觉模型,将图像重构任务转化为时间序列预测任务——这正是VisionTS所实现的。

掩码自编码视觉Transformer

在介绍VisionTS之前,我们需要先解释其核心机制:视觉掩码自编码器MAE)。

简而言之,MAE的任务是重构一个被部分遮蔽的分块图像(图2):

**图2:**MAE的图像重构任务示意图

MAE的工作原理如下:

  • 将输入图像分割成块,随机遮蔽约75%的块。
  • 仅将可见的块输入编码器——通常是一个Vision TransformerViT)。
  • 编码后的tokens与遮蔽tokens一起输入解码器。
  • 模型通过优化来重构原始图像。
  • 预训练完成后,解码器被移除。

这个过程创建了一个基础视觉模型,能够执行各种下游图像识别任务。

VisionTS利用预训练的MAE作为其核心模型。接下来,我们将详细说明如何将这个模型适配用于时间序列预测任务。

VisionTS模型概述

VisionTS是一种创新的预训练掩码视觉Transformer模型,它巧妙地将图像重构任务转化为时间序列预测。

由于MAE原本是设计用于处理图像的,我们需要将时间序列数据转换为分块图像作为输入。在模型推理后,输出再被转换回时间序列形式,从而生成预测结果。这个过程如图3所示:

**图3:**使用MAE将时间序列转换为图像并生成预测的详细流程

让我们详细分析这个过程:

  1. 首先为时间序列选择一个回溯窗口(L),然后根据其周期性(P)将序列分割成块。这产生了[L/P]个块,它们被堆叠形成一个P × [L/P]大小的2D矩阵。本质上,这个矩阵可以被视为一个灰度图像。
  2. 图像形成后,进行归一化处理。这里存在一个技术挑战:MAE模型是在固定大小为224 × 224像素的ImageNet图像上预训练的,而我们生成的矩阵大小是P × [L/P]。
  3. 为了解决这个尺寸不匹配的问题,采用双线性插值将矩阵调整为(N * S, n * S),其中N是水平块的数量,n代表可见块的数量。n的值由上下文长度(L)与预测长度(H)的比率决定。调整后的图像由(N × n)个可见块和N × (N-n)个遮蔽块组成。例如在图3中,图像包含7×6个可见块和7×1个遮蔽块。
  4. 这些遮蔽块随后被输入到MAE模型中进行解码和重构。
  5. 一旦解码完成,整个过程被反向执行。解码后的块经过双线性插值、反归一化和扁平化处理,将图像转换回一维序列,作为最终的预测输出。

总的来说,在ImageNet上预训练MAE是相对直接的过程。VisionTS的创新之处在于它巧妙地利用MAE进行时间序列预测。

性能评估

作者对VisionTS进行了全面的性能评估。他们将VisionTS与其他基础模型、深度学习模型、机器学习模型以及统计模型进行了比较。评估包括测试VisionTS作为零样本预测器(预测未见数据)的能力,以及探索少样本微调(如何通过在小规模数据上训练来提高性能)的效果。

Monash基准测试

首先使用Monash数据集对VisionTS与其他模型进行了比较。

图4展示了来自29个Monash数据集(在其测试集上)的聚合结果。研究者计算了归一化MAE(。值得注意的是在这个测试中,只有llmtime和VisionTS是作为零样本预测器进行评估的,其他模型都经过了完整的训练。

MOIRAI(另一个预训练模型)在这里没有被归类为零样本预测器,因为它是在除了2个Monash数据集之外的所有数据集上进行了训练。

**图4:**VisionTS与其他主流时间序列模型的性能比较。只有VisionTS和LLMtime是零样本预测器

关键发现:

  • VisionTS在所有模型中排名第二,这充分证明了利用计算机视觉模型进行时间序列分析的潜力。
  • MOIRAI-small模型表现最佳,尽管从技术上讲,它经过了微调。
  • 研究者仅使用了MOIRAI-small版本——如果能包括更大版本的MOIRAI模型进行比较,可能会得到更全面的结果。
  • 无论如何,这些结果都显示了预训练时间序列模型的巨大潜力。

长期预测基准测试

接下来,研究者使用Informer基准测试评估了VisionTS在长期预测任务中的性能。

在这个测试中,VisionTS(作为零样本预测器)与其他深度学习/机器学习模型(这些模型在目标数据集的10%上进行了微调)进行了比较。性能指标包括MAE和MSE(见表1):

表1: VisionTS与ML/DL模型在长期预测任务中的性能比较

重要发现:

  1. VisionTS在总体评分中表现最佳,赢得了最多的胜利。
  2. 预训练模型(无论是在图像还是时间序列上预训练)通常表现优于其他模型。
  3. 这里使用的Monash数据集(Weather和Electricity)并不包含在MOIRAI的预训练数据中,这使得MOIRAI在这种情况下也可以被视为零样本预测器。
  4. Informer、Autoformer和DLinear并非基础模型。如果对这些模型进行完整训练,可能会提高基准测试的竞争性。研究者在后续实验中提供了这些模型完整训练后的结果(见表2)。

研究者还对VisionTS进行了微调后的测试。实验设置保持不变,但所有模型都在目标数据集上进行了完整训练。VisionTS仅进行了轻微的微调(平均1个epoch,只更新层归一化参数)。

结果如表2所示:

**表2:**VisionTS与其他模型在完整训练(full-shot)条件下的预测结果,包括每个预测时间范围的MAE和MSE

从这两个表中得出的关键结论:

  1. VisionTS再次在总体排名中位居第一,获得最多胜利。
  2. 微调显著提升了VisionTS的性能,除了在ETTh1和ETTh2数据集上的改善较小,可能是由于这些数据集的频率较低。
  3. 零样本VisionTS虽然不能超越所有在每个数据集上单独训练的模型,但通过最小程度的微调就能带来显著的性能提升。

作者还分析了上下文长度如何影响模型性能(见图5)。结果表明,随着上下文长度的增加,模型性能普遍得到改善,尤其是在高频数据集中。这一发现与其他预训练模型(如MOIRAI)的结果一致。一般来说,超过1000的上下文长度通常能带来性能提升:

**图5:**不同数据集的最优上下文长度分析。高频数据集(如10分钟间隔的Weather和15分钟间隔的ETTm1)从更长的上下文长度中获益更多

模型参数规模的影响分析

研究者对模型参数规模如何影响性能进行了深入分析。

一般而言,较大的Transformer模型往往能从规模扩展中获益,这一点在早期的研究中已有广泛讨论。对于VisionTS,研究者对不同规模的MAE模型进行了性能基准测试:

表3: *不同规模MAE模型在零样本预测任务中的性能基准

研究者测试了以下三种模型规模:

  • Base:122M参数
  • Large:330M参数
  • Huge:657M参数

有趣的是,Base模型在测试中表现最佳。这可能是因为较大的模型在图像特定特征上出现了过拟合,从而降低了它们在时间序列任务上的迁移能力。值得注意的是MAE是在Imagenet-1k数据集上预训练的,按当前标准来看,这是一个相对较小的数据集。

与传统统计模型的比较

许多现代时间序列模型在评估中往往忽略了与传统统计模型的比较,认为这些传统模型已不具有竞争力。

其实统计基线模型仍然具有重要价值,在某些情况下甚至可能优于更复杂的模型。因此研究者在评估中纳入了几个代表性的统计模型进行比较(见表4):

表4VisionTS与传统统计模型的性能比较。VisionTS的结果基于零样本预测

结果显示,VisionTS在性能上明显优于这些传统统计模型。尽管论文中没有详细说明这些统计模型的具体配置,但如果能包括一些更具竞争力的现代统计方法,如Nixtla库中的AutoARIMA、AutoETS、AutoCES和DynamicOptimizedTheta,或者统计集成方法,比较结果可能会更具说服力和全面性。

尽管如此,VisionTS在零样本预测任务中展现出的性能仍然令人印象深刻。

总结

VisionTS作为一种创新的时间序列基础模型,在预测任务中展现出了卓越的性能。

该模型仍有进一步改进的空间。比如VisionTS仅限于处理单变量时间序列,其可扩展性——即模型如何随着数据规模、训练时间和参数数量的增加而表现——尚未得到充分探索。研究者已经认识到这些局限性,并将其列为未来研究的重点方向。

尽管存在这些限制,VisionTS仍然有力地证明了图像数据可以成为时间序列预测的有效信息来源,在某些方面可能even superior to文本为that我们能够构建更高效、 better performance 的时间序列预测模型。

基于当前的研究成果,我们可以清晰地看到几个有 promising的未来研究方向:

  1. 在更大规模、更多样化的图像数据集上预训练MAE模型
  2. 在时间序列数据上进一步预训练或微调MAE模型
  3. 探索除Vision Transformer之外的其他网络架构

我们将持续关注这一创新时间序列建模方法的发展,期待看到更多突破性的研究成果。

https://avoid.overfit.cn/post/5e61f6f7466c4a5da98b9ee4028f30dd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2185063.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

餐饮重点企业在AI领域的布局,看方大的AI实践

大家好,我是Shelly,一个专注于输出AI工具和科技前沿内容的AI应用教练,体验过300款以上的AI应用工具。关注科技及大模型领域对社会的影响10年。关注我一起驾驭AI工具,拥抱AI时代的到来。 AI已经被应用在餐饮餐厨行业的哪些方面&am…

Spring注解系列 - @Autowired注解

文章目录 使用总结注入原理Autowired 注入过程InjectionMetadataInjectedElement依赖注入查找过程findAutowireCandidates 缓存注入信息 Resource 注解 使用总结 Autowired注解可以自动将所需的依赖对象注入到类的属性、构造方法或方法中,从而减少手动注入依赖的代…

Android Compose的基本使用

前言: Compose这个东西呢,好处我没发现,坏处就是学习成本和低版本兼容. 不过,看在官方力推的份儿上,有空就学一下吧. 当初的kotlin,很多人说鸡肋(包括我)!现在不也咔咔用纯kotlin做项目吗?哈哈哈哈. 未来的事情,谁说得清呢? 首先创建一个专用的Compose项目 对没错!看到E…

体系结构论文(五十三):Featherweight Soft Error Resilience for GPUs 【22‘ MIRCO】

Featherweight Soft Error Resilience for GPUs 一、文章介绍 背景:软错误通常由高能粒子(如宇宙射线和α粒子)打击电路造成的位翻转,可能导致程序崩溃或产生错误输出。随着电子技术的进步,电路对这种辐射引发的软错…

Arduino UNO R3自学笔记14 之 Arduino使用HC-SR04模块如何测量距离?

注意:学习和写作过程中,部分资料搜集于互联网,如有侵权请联系删除。 前言:学习使用HC-SR04模块测距。 1.HC-SR04模块介绍 基本参数: ●使用电压:DC---5V ●静态电流:小于2mA ●电平输出&#…

【计算机网络】传输层UDP和TCP协议

目录 再谈端口号端口号范围划分认识知名端口号查看知名端口号两个问题 UDP协议UDP特点UDP的缓冲区基于UDP的应用层协议 TCP协议TCP协议格式确认应答机制超时重传机制连接管理机制(三次握手与四次挥手)理解TIME_WAIT状态理解CLOSE_WAIT状态滑动窗口快重传…

wsl(1) -- win11环境配置

1.前言 本专栏主要记录了我配置wsl的过程,以便日后回忆。 2. 开启WSL可选功能 打开设置,点击应用,点击可选功能,点击更多Windows功能,查看是否开启了【适用于Linux的Windows子系统】和【虚拟机平台】 3. 更新wsl …

【JavaEE初阶】深入理解多线程阻塞队列的原理,如何实现生产者-消费者模型,以及服务器崩掉原因!!!

前言: 🌈上期博客:【JavaEE初阶】深入解析单例模式中的饿汉模式,懒汉模式的实现以及线程安全问题-CSDN博客 🔥感兴趣的小伙伴看一看小编主页:GGBondlctrl-CSDN博客 ⭐️小编会在后端开发的学习中不断更新~~…

【在Linux世界中追寻伟大的One Piece】System V共享内存

目录 1 -> System V共享内存 1.1 -> 共享内存数据结构 1.2 -> 共享内存函数 1.2.1 -> shmget函数 1.2.2 -> shmot函数 1.2.3 -> shmdt函数 1.2.4 -> shmctl函数 1.3 -> 实例代码 2 -> System V消息队列 3 -> System V信号量 1 -> Sy…

K8S部署流程

一、war打包镜像(survey,analytics,trac系统) 代码打包成war准备tomcat的server.xml文件&#xff0c;修改connector中8080端口为项目的端口 修改前&#xff1a; <Connector port"8080" protocol"HTTP/1.1"connectionTimeout"20000"redirect…

idea环境下vue2升级vue3

在IDEA环境下&#xff0c;Vue2升级Vue3是一个非常重要的主题。在本文中&#xff0c;我们将介绍Vue2和Vue3之间的主要区别&#xff0c;以及如何在IDEA中升级Vue2项目到Vue3。我们还将讨论Vue3的新特性&#xff0c;如Composition API和Teleport等&#xff0c;并提供一些实用的代码…

快速掌握-vue3

是什么 vue2 的升级版&#xff0c; 使用 ts 重构了代码&#xff0c; 带来了 Composition API RFC。 类似于 react hook 的写法。 ts 重构&#xff0c;代码可读性更强vue3.x 使用 Proxy 取代 Vue2.x 版本的 Object.defineProperty实现了 TreeShaking (当 Javascript 项目达到一定…

自闭症寄宿学校:为孩子发掘多重才能

在教育的广阔天地里&#xff0c;每一片土壤都孕育着不同的生命&#xff0c;每一颗种子都蕴含着无限的可能。对于自闭症儿童而言&#xff0c;他们的世界或许更加独特与复杂&#xff0c;但同样充满了未被发掘的潜能与才华。在广州&#xff0c;星贝育园自闭症儿童寄宿制学校正以满…

计算机毕业设计 Java酷听音乐系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

师生健康信息管理:SpringBoot技术突破

第4章 系统设计 4.1 系统体系结构 师生健康信息管理系统的结构图4-1所示&#xff1a; 图4-1 系统结构 登录系统结构图&#xff0c;如图4-2所示&#xff1a; 图4-2 登录结构图 师生健康信息管理系统结构图&#xff0c;如图4-3所示。 图4-3 师生健康信息管理系统结构图 4.2…

【Linux】用虚拟机配置Ubuntu环境

目录 1.虚拟机安装Ubuntu系统 2.Ubuntu系统的网络配置 3.特别声明 首先我们先要下载VMware软件&#xff0c;大家自己去下啊&#xff01; 1.虚拟机安装Ubuntu系统 我们进去之后点击创建新的虚拟机&#xff0c;然后选择自定义 接着点下一步 再点下一步 进入这个界面之后&…

element-ui 通过按钮式触发日期选择器

element ui 写在前面1. 自定义的日期时间组件CustomDatePicker.vue2. 页面效果总结写在最后 写在前面 需求&#xff1a;elementui中日期时间选择器&#xff0c;目前只能通过点击input输入框触发日期选择器&#xff0c;我希望能通过其他方式触发日期选择器同时把input输入框去掉…

Spring的IOC和DI入门案例分析和实现

前言 IOC和DI是spring的核心之一&#xff0c;那我们为什么要使用spring技术呢&#xff1f;spring技术的优点在哪里&#xff1f; spring的特点&#xff1a; 简化开发&#xff0c;降低企业级开发的复杂性框架整合&#xff0c;高效整合其他技术&#xff0c;提高企业级应用的开发与…

【Python报错已解决】TypeError: ‘NoneType‘ object is not callable

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 专栏介绍 在软件开发和日常使用中&#xff0c;BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…

【常读常悟】《大数据之路-阿里巴巴大数据实践》一书读书摘要

【常读常悟】《大数据之路-阿里巴巴大数据实践》一书读书摘要 1、背景2、目录结构3、数据加工链路4、章节摘要4.1 第2章 日志采集4.1.1 日志采集方案4.1.2 采集指标 4.2 第3章 数据同步4.2.1 数据的特点4.2.2 数据同步的三种方式4.2.3 数据同步的最佳实践 4.3 第4章 离线数据开…