A Survey on Time-Series Pre-Trained Models

news2024/11/24 17:07:07

本文是LLM系列的文章,针对《A Survey on Time-Series Pre-Trained Models》的翻译。

时间序列预训练模型综述

  • 摘要
  • 1 引言
  • 2 背景
    • 2.1 时间序列挖掘任务
      • 2.1.1 时间序列分类
      • 2.1.2 时间序列预测
      • 2.1.3 时间序列聚类
      • 2.1.4 时间序列异常检测
      • 2.1.5 时间序列推测
    • 2.2 深度学习模型用于时间序列
      • 2.2.1 循环神经网络
      • 2.2.2 卷积神经网络
      • 2.2.3 Transformer
    • 2.3 为什么预训练模型
  • 3 TS-PTMs概览
    • 3.1 监督PTMs
      • 3.1.1 基于分类的PTMs
      • 3.1.2 基于预测的PTMs
    • 3.2 非监督的PTMs
      • 3.2.1 基于重建的PTMs
    • 3.3 自监督的PTMs
      • 3.3.1 基于一致性的PTMs
      • 3.3.2 伪标记PTMs
  • 4 实验结果和分析
    • 4.1 PTMs在时间序列分类上的性能
      • 4.1.1 基于监督分类和无监督重构的迁移学习PTM的比较
      • 4.1.2 基于Transformer和一致性的PTMs比较
      • 4.1.3 可视化
    • 4.2 PTMs在时间序列预测上的性能
    • 4.3 PTMs在时间序列异常检测上的性能
  • 5 未来方向
    • 5.1 大规模时间序列数据集
    • 5.2 时间序列的固有性质
    • 5.3 时间序列中的Transformer
    • 5.4 对时间序列的对抗性攻击
    • 5.5 时间序列噪声标签的预训练模型
  • 6 结论

摘要

时间序列挖掘在实际应用中显示出巨大的潜力,是一个重要的研究领域。基于大量标记数据的深度学习模型已成功用于TSM。然而,由于数据注释成本的原因,构建大规模标记良好的数据集是困难的。近年来,预训练模型由于其在计算机视觉和自然语言处理方面的卓越表现,逐渐引起了时间序列领域的关注。在这项综述中,我们对时间序列预训练模型(TS-PTM)进行了全面的回顾,旨在指导对TS-PTM的理解、应用和研究。具体来说,我们首先简要介绍TSM中使用的典型深度学习模型。然后,我们根据预训练技术对TS-PTM进行了概述。我们探索的主要类别包括有监督的、无监督的和自我监督的TS-PTM。此外,还进行了大量的实验来分析迁移学习策略、基于Transformer的模型和具有代表性的TS-PTM的优缺点。最后,我们指出了TS-PTM未来工作的一些潜在方向。源代码位于https://github.com/qianlima-lab/time-series-ptms.

1 引言

作为数据挖掘领域的一个重要研究方向,时间序列挖掘(TSM)已被广泛应用于现实世界中的应用,如金融、语音分析、动作识别和交通流预测。TSM的基本问题是如何表示时间序列数据。然后,可以基于给定的表示来执行各种挖掘任务。由于严重依赖领域或专家知识,传统的时间序列表示(例如,shapelets)非常耗时。因此,自动学习适当的时间序列表示仍然具有挑战性。
近年来,深度学习模型在各种TSM任务中取得了巨大成功。与传统的机器学习方法不同,深度学习模型不需要耗时的特征工程。相反,他们通过数据驱动的方法自动学习时间序列表示。然而,深度学习模型的成功依赖于大量标记数据的可用性。在许多真实世界的情况下,由于数据获取和注释成本的原因,很难构建一个标记良好的大型数据集。
为了减轻深度学习模型对大型数据集的依赖,通常使用基于数据增强和半监督学习的方法。数据增强可以有效地提高训练数据的大小和质量,并已被用作许多计算机视觉任务的重要组成部分。然而,与图像数据增强不同的是,时间序列数据增强还需要考虑时间序列中的时间依赖性和多尺度依赖性等属性。此外,时间序列数据增强技术的设计通常依赖于专家知识。另一方面,半监督方法使用大量未标记的数据来提高模型性能。然而,在许多情况下,即使是未标记的时间序列样本也很难收集(例如,医疗保健中的心电图时间序列数据)。
缓解训练数据不足问题的另一个有效解决方案是迁移学习,它放宽了训练和测试数据必须独立且相同分布的假设。迁移学习通常有两个阶段:预训练和微调。在预训练期间,模型在一些包含大量数据的源域上进行预训练,这些源域是独立的,但与目标域相关。在微调时,对来自目标域的通常有限的数据进行预训练模型(PTM)的微调。
最近,PTM,特别是基于Transformer的PTM,在各种计算机视觉(CV)和自然语言处理(NLP)应用中取得了显著的性能。受这些启发,最近的研究考虑了时间序列数据的时间序列预训练模型(TSPTM)的设计。首先,通过监督学习、无监督学习或自监督学习对时间序列模型进行预训练,以获得适当的表示。然后在目标域上对TS-PTM进行微调,以提高下游TSM任务(例如,时间序列分类和异常检测)的性能。
监督TS-PTM通常通过分类或预测任务进行预训练。然而,难以获得用于预训练的大量标记时间序列数据集往往限制了监督TSPTM的性能。此外,无监督的TS-PTM利用未标记的数据进行预训练,这进一步解决了标记数据不足的限制。例如,基于重建的TS-PTM使用自动编码器和重建损失来预训练时间序列模型。最近,基于对比学习的自监督PTM在CV中显示出了巨大的潜力。因此,一些学者已经开始探索基于一致性的任务设计和伪标记技术,以挖掘时间序列的固有属性。尽管如此,TS PTM的研究仍然是一个挑战。
在这项调查中,我们对TS-PTM进行了全面的回顾。具体来说,我们首先介绍了TSM中使用的各种TSM任务和深度学习模型。然后,我们基于预训练技术提出了TS PTM的分类法(图1)。其中包括有监督的预训练技术(导致基于分类和基于预测的PTM)、无监督的预训练技术(基于重建的PTMs)和自监督的预训技术(基于一致性和基于伪标记的PTMs)。请注意,一些TS-PTM可能使用多个任务(例如,[37]中的预测和重建或[38]中的一致性)进行预训练。为了简化综述,我们根据TS-PTM的核心预训练任务对其进行了分类。
在时间序列分类、预测和异常检测方面进行了广泛的实验,以研究各种迁移学习策略和具有代表性的TS-PTM的优缺点。此外,还讨论了TSPTM的未来发展方向。这项综述旨在让读者全面了解TS-PTM,从早期的迁移学习方法到最近的基于转换和一致性的TS-PTM。主要贡献可概括如下:

  • 我们根据所使用的预训练技术,对现有的TS-PTM进行了分类和全面审查。
  • 我们进行了大量的实验来分析TS-PTM的优缺点。对于时间序列分类,我们发现基于迁移学习的TS-PTM在UCR时间序列数据集(包含许多小数据集)上表现不佳,但在其他公开可用的大时间序列数据集中表现优异。对于时间序列预测和异常检测,我们发现设计一种合适的基于Transformer的预训练技术应该是未来TS-PTM研究的重点。
  • 我们分析了现有TS-PTM的局限性,并在(i)数据集、(ii)Transformer、(iii)固有特性、(iv)对抗性攻击和(v)噪声标签下提出了潜在的未来方向。

本文的其余部分组织如下。第2节提供了TS-PTM的背景。第3节对TS-PTM进行了全面审查。第4节介绍了各种TS-PTM的实验。第5节提出了一些未来的方向。最后,我们在第6节中总结了我们的发现。
在这里插入图片描述

2 背景

2.1 时间序列挖掘任务

2.1.1 时间序列分类

2.1.2 时间序列预测

2.1.3 时间序列聚类

2.1.4 时间序列异常检测

2.1.5 时间序列推测

2.2 深度学习模型用于时间序列

2.2.1 循环神经网络

2.2.2 卷积神经网络

2.2.3 Transformer

2.3 为什么预训练模型

3 TS-PTMs概览

3.1 监督PTMs

3.1.1 基于分类的PTMs

3.1.2 基于预测的PTMs

3.2 非监督的PTMs

3.2.1 基于重建的PTMs

3.3 自监督的PTMs

3.3.1 基于一致性的PTMs

3.3.2 伪标记PTMs

4 实验结果和分析

4.1 PTMs在时间序列分类上的性能

4.1.1 基于监督分类和无监督重构的迁移学习PTM的比较

4.1.2 基于Transformer和一致性的PTMs比较

4.1.3 可视化

4.2 PTMs在时间序列预测上的性能

4.3 PTMs在时间序列异常检测上的性能

5 未来方向

5.1 大规模时间序列数据集

5.2 时间序列的固有性质

5.3 时间序列中的Transformer

5.4 对时间序列的对抗性攻击

5.5 时间序列噪声标签的预训练模型

6 结论

在这项综述中,我们对TS-PTM的发展进行了系统的回顾和分析。在早期关于TS PTM的研究中,相关研究主要基于CNN和RNN模型对PTM进行迁移学习。近年来,基于Transformer和基于一致性的模型在时间序列下游任务中取得了显著的性能,并被用于时间序列预训练。因此,我们针对时间序列分类、预测和异常检测这三个主要任务,对现有的TS-PTM、迁移学习策略、基于Transformer的时间序列方法以及相关的代表性方法进行了大规模的实验分析。实验结果表明,基于Transformer的PTM在时间序列预测和异常检测任务中具有巨大的潜力,而为时间序列分类任务设计合适的基于Transformer的模型仍然具有挑战性。同时,基于对比学习的预训练策略是未来TS-PTM发展的潜在焦点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/770923.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

手打 小份 kubernetes v1.27.3 集群

文章目录 1. 准备2. yum3. 安装 ansible4. 互信5. hosts6. 关闭防火墙、swap、selinux7. 配置系统文件句柄数8. 启用ipvs9. 修改内核参数10. 安装 containerd11. 安装nerdctl12. kubernetes yum13. 部署 kubernetes13.1 安装工具13.2 初始化配置 14. 部署 master15. 部署 node1…

【微信机器人开发

现在并没有长期免费的微信群机器人,很多都是前期免费试用,后期进行收费,或者核心功能需要付费使用的。 这时如果需要群机器人帮助我们管理群聊,建议大家使有条件的可以自己开发微信管理系统。了解微信群机器人的朋友都知道&#x…

iTerm复制粘贴出现00~ 01~

问题 iTerm2中复制粘贴出现如下现象 解决 命令行直接输入printf \e[?2004l 回车

SSH跳转/SCP复制远程目标服务器的高阶使用

在日常开发和运维的过程中,我一般是使用Xshell的工具对linux服务器的相关操作。我说一下我写这篇文章的背景:甲方因为安全需要,给了一台可以通过vpn访问的跳板机,通过这台跳板机去操作另外的十多台应用服务器,那么肯定…

零花钱项目---赚钱

流量卡代理推广 172号卡分销系统开启代理注册,月入过万不是梦 适合人群每天随便发发信息,就能轻松变现。平台的可靠 什么是172号卡分销系统 172号卡分销系统是一个专门用于手机流量卡销售的平台。这个系统主要针对中国的三大运营商——中国移动、中国…

DirectX12(D3D12)基础教程(二十二) ——HDR IBL 等距柱面环境光源加载和解算及 GS 一次性渲染到 CubeMap

前序文章目录 DirectX12(D3D12)基础教程(一)——基础教程 DirectX12(D3D12)基础教程(二)——理解根签名、初识显存管理和加载纹理、理解资源屏障 DirectX12(D3D12&…

并发请求gitlab接口报错500 Internal Server Error

配置环境 Gitalb 14.9 由docker搭建,使用的数据库是内置的postgresql 问题背景 近期发现自研系统在请求调用 gitlab 的 api 接口时,尤其是并发请求同一资源时,我这里是并发创建subgroup这个资源,会得到500的报错,起…

ONNX 推理,精度下降

先看代码: img cv2.imread("65.jpg") img1 img.copy() img2 img.copy() img1 - 112 img1 img1.astype(np.float32) img2 np.float32(img2) img2 - 112 现象:在使用 img1 这种处理方式时,推理结果异常,起码掉点…

SpringBoot错误: 找不到或无法加载主类

1.一般出现这种情况都是配置文件application.properties出现的问题 2.可以尝试 maven clean install 以及rebuild project 3.删除项目里.idea文件 重新导入至IDEA编辑器 选择Maven项目 配置好maven.xml 后重新导入

【Linux】进程间通信——管道/共享内存

文章目录 1. 进程间通信2. 管道匿名管道命名管道管道的特性管道的应用:简易的进程池 3. System V共享内存共享内存的概念共享内存的结构共享内存的使用代码实现 1. 进程间通信 进程间通信(Inter-Process Communication,简称IPC)是…

解锁医疗新时代!互联网医院系统源码助您开启智慧就医新体验

互联网医院系统软件开发之后具有许多优势,下面将介绍其中一些。   提供便利的就医方式:互联网医院系统软件可以让患者享受在线诊疗的便利。患者可以通过手机或电脑随时随地进行在线挂号、在线咨询、在线复诊等操作,不再受制于时间和地点的限…

供应链管理系统有哪些?

1万字干货分享,国内外 20款 供应链管理软件都给你讲的明明白白。如果你还不知道怎么选择,一定要翻到第三大段,这里我将会通过8年的软件产品选型经验告诉你,怎么样才能快速选到适合自己的软件工具。 (为防后续找不到&a…

Python学习笔记-Windows下VirtualEnv+VSCode中虚拟环境配置

1 VirtualEnv简介 VirtualEnv是一个虚拟化环境,是独立开的开发环境,在一个文件夹中创建的独立虚拟环境,可以分隔开不同项目,开发互不影响。 优点如下: 使不同的应用开发环境独立,避免互相干扰环境升级不…

RabbitMq(一)

一、基本概念、常见工作模式以及简单使用 MQ全称Message Queue (消息队列),是在消息的传输过程中保存消息的容器。多用于分布式系统之间进行通信。 小结 MQ消息队列,存储消息的中间件分布式系统通信两种方式:直接远程调用和借助第三方完成间接通信发…

【C语言初阶(18)】结构体

文章目录 前言Ⅰ结构体的声明Ⅱ 结构体的定义Ⅲ 结构体初始化Ⅳ 访问结构体成员⒈结构体变量访问结构体成员⒉结构体指针访问结构体成员 Ⅴ 结构体的嵌套Ⅵ 结构体传参 前言 C 语言提供了一些非常基本的数据类型,如 int、float、double、char 等,这些不同…

基于SpringBoot + EasyExcel + Vue + Blob实现导出Excel文件的前后端完整过程

首先前端发起HTTP请求之后,后端返回一个Excel输出流,然后前端用Blob类型接收数据,并且解析响应头数据以及提取源文件名,最后用a标签完成下载。 一、后端代码 (1)导入阿里巴巴的EasyExcel依赖(…

【C++进阶之路】list的基本使用和模拟实现

文章目录 初步认识①定义②底层原理③迭代器的分类 一、基本使用1.插入结点元素2.删除结点元素3.合并两个有序链表4.将一条链表的某一部分转移到另一条链表5.对链表排序并去重6.vector与list排序的比较 二、模拟实现①要点说明②基本框架③迭代器构造函数- -*->list里的迭代…

HG20202-2014脱脂工程施工及验收规范

为提高脱脂工程施工技术水平,加强施工过程的质量控制,保证施工质量和安全,制定本规范。 本规范适用于化工建设工程中忌油工艺介质系统的设备、管道和管道组成件仪表和仪表组成件等的脱脂。 本规范不适用于下列情况的脱脂: 1、制造领域; 2、工厂停车检修。 设计文件或用户规…

2023云曦期末复现

目录 WEB sign SSTI serialize WEB sign 有10000个 进行bp爆破 能发现 410 和 414长度 还有 420 410 414存在16进制的字符 拼凑出来为 \x66\x6c\x61\x67\x7b\x61\x63\x63\x39\x39\x66\x39\x30\x34\x66\x30\x65\x61\x66\x61\x34\x31\x63\x30\x36\x34\x33\x36\x38\x31\x3…

行为型模式 - 策略模式

概述 先看下面的图片,我们去旅游选择出行模式有很多种,可以骑自行车、可以坐汽车、可以坐火车、可以坐飞机。 作为一个程序猿,开发需要选择一款开发工具,当然可以进行代码开发的工具有很多,可以选择Idea进行开发&…