时间序列+预训练大模型!最新开源成果性能暴涨42.8%

news2024/11/25 22:34:19

今天我们来聊一个新兴的、创新空间很大的方向:时间序列+预训练大模型。

预训练大模型因为在大规模多领域的数据集上进行训练,能学习到丰富的、跨领域的时间序列表示,在面对新的、没见过的时间序列数据时,它能够表现出更强的泛化性和数据处理能力,实现更高的准确性。

因此关于时间序列+预训练大模型的研究正在快速发展,并且已经在多个领域和应用中有了显著的成果,比如Chronos、清华Timer等,更有提高了42.8%性能的ViTST。

如果有同学有想法发论文,可以从零样本和通用性下手,这俩是这个方向关注的重点。另外为方便大家找参考,我整理了10个时间序列+预训练大模型最新成果,全都已开源可复现。

论文原文+开源代码需要的同学看文末

Time Series as Images: Vision Transformer for Irregularly Sampled Time Series

方法:论文介绍了一种新颖的方法,通过将非规则采样的时间序列转换为线图图像,然后利用预训练的ViT进行时间序列分类,类似于图像分类。该方法不仅简化了专门的算法设计,还具有成为时间序列建模的通用框架的潜力。

创新点:

  • 将不规则采样的时间序列转化为线图图像,利用预训练的ViT进行时间序列分类。这种方法简单而直观,能够处理具有不同特征的时间序列数据,无论其是否规则、结构不同还是尺度不同。

  • ViTST在缺失观测值的情况下展现出的鲁棒性:在“leave-sensors-out”设置中,即使在测试时掩盖了一半的变量,ViTST在绝对F1分数上比领先的专门基线提高了42.8%性能。

Chronos: Learning the Language of Time Series

方法:论文提出了一种通用的预训练时间序列预测模型,名为Chronos,该模型基于语言模型框架,并通过简单的缩放和量化将时间序列标记化为离散的标记,以实现对未来模式的预测。实验证明,Chronos模型在训练语料库中的数据集上显著优于其他方法,并表现出良好的零样本性能。

创新点:

  • Chronos将现有的语言模型体系结构和训练过程最小化地适应于时间序列预测,通过简单的缩放和量化处理,将时间序列离散化为离散的标记序列,然后可以使用现成的语言模型在这个“时间序列语言”上进行训练,而无需对模型体系结构进行任何修改。

  • Chronos引入了数据增强策略,包括TSMixup和KernelSynth,来增强模型的鲁棒性和泛化能力。TSMixup从不同训练数据集中随机抽取一组基本时间序列,并根据它们的凸组合生成新的时间序列;KernelSynth使用高斯过程根据随机组合核函数生成合成时间序列。

Timer: Generative Pre-trained Transformers Are Large Time Series Models

方法:论文提出了一个名为 Timer 的时间序列Transformer,它通过大规模的自回归下一个时间点预测来进行预训练,并针对不同的下游场景进行微调,展现出作为大型时间序列模型(LTSM)的潜力。该模型在大规模时间序列数据上进行了生成式预训练,并在预测、插补和异常检测等任务中展示了优越的性能。

创新点:

  • 引入了一个新的基准数据集UTSD,该数据集经过精心筛选和处理,包含了多个不同领域和难度的时间序列数据,用于评估模型性能。

  • 提出了一种新的时间序列预训练模型Timer,该模型基于Transformer架构,通过生成下一个时间序列标记来进行预训练。

  • 建立了大规模时间序列预训练的评估标准,包括模型大小和数据规模的影响,并与其他先进的时间序列模型进行了比较。

Bidirectional Generative Pre-training for Improving Time Series Representation Learning

方法:论文提出了一种新颖的架构,名为BiTimelyGPT,这是一种用于时间序列数据的预训练模型,通过双向的下一个和上一个时间步的预测任务来改善时间序列的表示学习。

创新点:

  • 提出了一种新的预训练策略BiTimelyGPT,通过整合双向性到生成式预训练中,改进了时间序列表示学习。该方法引入了一种新的Next-Previous-Token Prediction预训练任务,保持了原始数据分布和时间序列的形状,而无需进行任何数据修改。

  • 提出了一种新的双向交替自回归模型(BAAR)框架,在层间交替建模从左到右和从右到左的信息,学习深层双向上下文用于判别任务。

  • 提出的BiTimelyGPT中的前向和后向注意力矩阵都是满秩的,具有表达能力强的表示能力。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“时序预训练”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2035724.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

快速排序效率

为了搞清楚快速排序的效率,我们先从分区开始。分解来看,你会发现它包含两种步骤。 ❏ 比较:每个值都要与轴做比较。 ❏ 交换:在适当时候将左右指针所指的两个值交换位置。 一次分区至少有N次比较,即数组的每个值都要…

打开第四十二天:买卖股票的最佳时机IV、最佳买卖股票时机含冷冻期、买卖股票的最佳时机含手续费

一、买卖股票的最佳时机IV(困难) 题目 文章 视频 这道题目可以说是上一题的进阶版,这里要求至多有k次交易。 确定dp数组以及下标的含义 在上一题中定义了一个二维dp数组,本题其实依然可以用一个二维dp数组。使用二维数组 dp…

wireshark使用介绍及案例分享

一、wireshark介绍 1、定义 wireshark是非常流行的网络封包分析软件,简称小鲨鱼,功能十分强大。可以截取各种网络封包,显示网络封包的详细信息。对应的,linux下的抓包工具是 tcpdump。 1.1、网络基础 参考TCP/IP五层模型,帧结构如下: 帧字段 帧字段含义 Frame 物理层的…

百元蓝牙耳机哪个牌子的比较好?四款百元必入热门机型盘点

一款优秀的蓝牙耳机都能极大提升我们的使用体验,然而,对于大多数消费者而言,高端蓝牙耳机昂贵的价格常常令人望而却步,幸运的是,市场上有很多性价比极高的品牌提供了百元左右的优质选择,那么百元蓝牙耳机哪…

基于STM32开发的智能电能监测系统

目录 引言环境准备工作 硬件准备软件安装与配置系统设计 系统架构硬件连接代码实现 初始化代码控制代码应用场景 家庭电能监测工业用电管理常见问题及解决方案 常见问题解决方案结论 1. 引言 智能电能监测系统通过实时采集电流、电压等电力参数,计算电能消耗&…

FPGA开发——UART串口通信的介绍和回环实验框架构建

一、简介 1、原理 UART(Universal Asynchronous Receiver/Transmitter,通用异步收发器)是一种广泛使用的串行通信协议,特别适用于微控制器、计算机和各种嵌入式设备之间的数据通信。 UART是一种异步串行通信方式,通过…

Prometheus+Grafana-1-基础介绍及安装

一、体系架构(了解) 数据采集流程 说白了就是采集数据->计算是否超过阈值->发起警告 Prometheus查询界面如下 1.报警简介 展现形式:短信,邮件,电话,通讯软件。 阈值(Trigger Value),如达到阈值可以触发预警。…

巨详细的规则引擎 Drools——小白也可食用

巨详细的规则引擎 Drools——小白也可食用 一、问题1.1、传统做法1.2、存在的问题1.3、引入 二、规则引擎概述2.1、什么是规则引擎2.2、使用规则引擎的优势2.3、规则引擎应用场景2.4、Drools介绍 三、Drools入门案例3.1、创建Springboot项目3.2、引入依赖3.3、添加Drools配置类…

鸿蒙(API 12 Beta3版)【投播组件开发指导】分布式媒体会话

通过本开发指导,完成一次音视频跨设备投播。 约束与限制 需同时满足以下条件,才能使用该功能: 设备限制 本端设备:HarmonyOS NEXT Developer Preview0及以上版本的手机设备 远端设备:HarmonyOS NEXT Developer Previ…

动起来!Axure动画的实用技巧

前言 在数字产品的世界中,用户体验的每一个细节都至关重要。 动画,作为一种增强交互性和视觉吸引力的手段,已经成为现代界面设计中不可或缺的元素。 Axure,作为一款强大的原型设计工具,提供了丰富的动画功能&#x…

进程第二部分

1.任务:子进程做的事情和父进程差不多(子承父业) 父进程创建出子进程之后,子进程做的事情与父进程完全不同(自力更生) 2.exec: int exec l(const char *path, const char *arg, ...); int exec v(const c…

python管理mysql

[rootserver1 ~]# pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple //这是设置清华镜像站,提高下载安装速度,如果报错提示找不到config,这是因为版本低,临时使用清华镜像站来升级 pip&…

愤怒的江小白,这几年怎么了?

近日,东方甄选和江小白的纠纷引发了广泛关注。 8月8日晚间,东方甄选直播间中,主播天权在带货某款白酒产品时突然对比点评江小白产品,称江小白“不是白酒”:“你现在去看江小白的包装,上面是没有‘白酒’这…

1Panel 部署 爱影CMS

前言 本文以 爱影CMS 为例提供了一种在 1Panel 面板中在 docker 内运行二进制程序的一种思路。符合 1Panel 基于容器管理并部署应用,实现最小的漏洞暴露面的思路。 环境准备 完整的 1Panel 环境(1Panel 如何安装? / 1Panel Pro 优惠购)服务…

软件测试学习搭子抱团取暖(已有400+)

希望优秀的测试人都聚齐在一起,大家一起解决面试难题,工作上的问题,在解决问题的同时自己也能提升,同时相互交流分享资料等测试面试经验,一起讨论交流呀。定个小目标2000。

除了知云文献翻译外,这几款翻译工具值得推荐!

近年来,市面上涌现出众多优秀的文献翻译工具,其中知云文献翻译凭借其强大的功能受到了广泛好评。然而,除了知云文献翻译外,还有几款翻译工具同样值得推荐。今天,就让我们一起来了解一下! Foxit在线翻译 链…

【Qt】控件介绍

控件概念 一个图形化界面上的内容,在编写代码的时候不需要全部从零开始实现。Qt种已经提供了很多内置的控件(按钮、文本框、单选按钮、复选按钮、下拉框等等),直接进行使用即可。 控件,英文名称widget,控件…

企业源代码加密软件有哪些?2024最好用的十款源代码加密软件

在当今快速发展的技术环境中,企业源代码的安全性至关重要。源代码不仅包含着企业的核心知识产权,还可能涉及敏感的商业数据。因此,选择一款合适的源代码加密软件,对于保护企业资产和避免数据泄露风险至关重要。随着安全技术的不断…

(回溯) LeetCode 47. 全排列||

原题链接 建议先练习:全排列| 一. 题目描述 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 示例 1: 输入:nums [1,1,2] 输出: [[1,1,2],[1,2,1],[2,1,1]]示例 2: 输入&a…

【JavaEE初阶】线程池

目录 📕 引言 🌳 概念 🍀ThreadPoolExecutor 类 🚩 int corePoolSize与int maximumPoolSize: 🚩 long keepAliveTime与TimeUnit nuit: 🚩 BlockingQueue workQueue&#xff1a…