论文笔记： One Fits All:Power General Time Series Analysis by Pretrained LM

news2026/3/27 19:35:06

1 intro

时间序列领域预训练模型/foundation 模型的研究还不是很多
- 主要挑战是缺乏大量的数据来训练用于时间序列分析的基础模型
——>论文利用预训练的语言模型进行通用的时间序列分析
- 为各种时间序列任务提供了一个统一的框架

论文还调查了为什么从语言领域预训练的Transformer几乎不需要任何改动就可以适应时间序列分析
- —预训练Transformer中的自注意模块通过训练获得了执行某些非数据相关操作的能力
- 这些操作与输入模式上的主成分分析（PCA）密切相关

2 模型

2.1 模型架构

利用自然语言处理预训练的Transformer的参数进行时间序列分析
- 重点关注GPT-2模型
还尝试了其他模型，如BERT和BEiT，以进一步证明跨领域知识传递的通用性存在于广泛的预训练模型中

2.1.1 冻结的预训练块

由于自注意层和前馈神经网络（FFN）包含了来自预训练语言模型的大部分学习知识，因此我们选择在微调时冻结他们

2.1.2 位置嵌入和层归

为了以最小的努力增强下游任务，我们微调了位置嵌入和layer normalization层
- layer normalization 计算均值和方差也是用神经网络计算的，所以也需要微调
机器学习笔记：神经网络层的各种normalization_relu 和 batchnorm的神经元数目一样吗_UQI-LIUWJ的博客-CSDN博客

2.1.3 输入embedding

重新设计和训练输入嵌入层，以将NLP预训练模型应用于各种任务和新的模态
- 将时间序列数据投影到特定预训练模型所需的维度
- 使用linear probing

2.1.4 归一化

数据归一化对于各种模态的预训练模型至关重要
- 除了预训练LM中使用的Layer Normalization外，还加入了一个简单的数据归一化块，即反向实例归一化（reverse instance norm）
- 简单地使用均值和方差对输入时间序列进行归一化，然后将它们添加回输出中

2.1.5 patching

为了提取局部语义信息，论文利用分块（Patching）
- 通过聚合相邻的时间步骤来形成一个基于Patch的Token
- 在normalization 后进行patching

4 实验

4.1 主要结论

4.2 补全

4.3 分类

4.4 异常检测

4.5 长期预测

4.6 短期预测

4.7 few shot 预测

只使用很少的一部分训练数据（10%，5%)

4.8 zero-shot 预测

在A数据集上训练，在B数据集上测试

5 消融实验

5.1 模型的选择

分析了GPT2层数和微调参数的选择。
附录H中的结果表明，与完整或少量层数相比，具有6层的GPT2是一个合理的选择，并且部分冻结可以避免灾难性遗忘，使微调能够在不过拟合的情况下进行。

5.2 预训练的有效性

GPT2（6）在时间序列任务中表现优于GPT2（0）和GPT2随机初始化
- ——>具有预训练参数的GPT2可以在时间序列任务上取得改进
此外，GPT2（6）的表现也优于GPT2非冻结，表明部分冻结也有所帮助。

附录H.2中的结果显示，随机初始化的GPT2（6）在冻结情况下表现不佳，预训练知识对于时间序列任务至关重要。

6 预训练模型在跨领域知识转移方面的普遍性

对BERT和图像预训练领域的BEiT进行了实验
- 知识转移的能力不仅限于基于GPT2的预训练语言模型

7 预训练模型中的Transformer和PCA 对应

证明略

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/929601.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

GEE/PIE遥感大数据处理与典型案例丨数据整合Reduce、云端数据可视化、数据导入导出及资产管理、机器学习算法等

目录专题一：初识GEE和PIE遥感云平台专题二：GEE和PIE影像大数据处理基础专题三：数据整合Reduce 专题四：云端数据可视化专题五：数据导入导出及资产管理专题六：机器学习算法专题七：…

阅读更多...

Spring Cloud Nacos详解

Spring Cloud Nacos详解

目录 1、Spring Cloud Nacos详细介绍2、Spring Cloud Nacos具体案列 Spring Cloud Nacos 是一个由阿里巴巴集团开发的开源分布式系统服务发现、配置管理和服务管理的平台。Nacos 支持多种服务发现方式，包括 DNS 方式、HTTP 和 RPC 方式，同时提供了灵活的…

阅读更多...

GFPGAN 集成Flask 接口化改造

GFPGAN 集成Flask 接口化改造

GFPGAN是一款腾讯开源的人脸高清修复模型，基于github上提供的demo，可以简单的集成Flask以实现功能接口化。 GFPGAN的安装，Flask的安装请参见其他文章。如若使用POSTMAN进行测试，需使用POST方式，form-data的请求体&am…

阅读更多...

camshift, pca,协方差

camshift, pca,协方差

最近复习opencv的东西， 看到camshift https://www.youtube.com/watch?va9KZjQ4e6IA&listPL6Yc5OUgcoTmTGACTa__vnifNA744Cz-q&index30 https://medium.com/claudio.vindimian/understanding-and-implementing-the-camshift-object-tracking-algorithm-pyt…

阅读更多...

【现场问题】oracle 11g 和12c 使用jdbc链接，兼容的问题

【现场问题】oracle 11g 和12c 使用jdbc链接，兼容的问题

oracle不同版本问题是什么寻找解决方式首先Oracle的jdbc链接有几种形式?Oracle 11g的链接是什么呢Oracle 12C的链接是什么呢我的代码是哪种！？发现问题没解决问题代码问题是什么项目上建立Oracle数据源，以前大部分都是，11g的…

阅读更多...

树模型与集成学习：LightGBM

树模型与集成学习：LightGBM

目录树模型与集成学习 LightGBM 的贡献 LightGBM 的贡献：单边梯度抽样算法 LightGBM 的贡献：直方图算法 LightGBM 的贡献：互斥特征捆绑算法 LightGBM 的贡献：深度限制的 Leaf-wise 算法树模型与集成学习树模型是非常好的…

阅读更多...

目标检测(Object Detection)：Fast R-CNN，YOLO v3

目标检测(Object Detection)：Fast R-CNN，YOLO v3

目录目标检测(Object Detection) R-CNN SPPNet Fast R-CNN YOLO v1 YOLO v2 YOLO v3 目标检测(Object Detection) 任务是计算机视觉中非常重要的基础问题，也是解决图像分割、目标跟踪、图像描述等问题的基础。目标检测是检测输入图像是否存在给定类别的物体…

阅读更多...

“梯媒广告商”分众传媒，能否凭借AI更“香”？

“梯媒广告商”分众传媒，能否凭借AI更“香”？

“你没事儿吧？你没事儿吧？没事儿就吃溜溜梅”“婚纱照，想去哪拍，就去哪拍，铂爵旅拍”“0糖0脂0卡，我喝元气森林”……相信不少人都被这些魔性、好记的广告词洗脑过，而这些脍炙人口的经典广告语背…

阅读更多...

ssm+vue农家乐信息平台源码和论文

ssm+vue农家乐信息平台源码和论文

ssmvue农家乐信息平台源码和论文066 开发工具：idea 数据库mysql5.7 数据库链接工具：navcat,小海豚等技术：ssm 1、研究现状国外，农家乐都被作为潜在的发展农村经济，增加农民收入的重要手段，让农户广…

阅读更多...

从开源到商业化：成功的转型策略

从开源到商业化：成功的转型策略

🌷🍁 博主猫头虎带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~🌺 &a…

阅读更多...

研磨设计模式day09原型模式

研磨设计模式day09原型模式

目录场景代码实现有何问题解决方案代码改造模式讲解原型与new 原型实例与克隆出来的实例浅度克隆和深度克隆原型模式的优缺点思考何时选用？ 相关模式场景代码实现定义订单接口 package com.zsp.bike.day08原型模式;/*** 订单的接口*…

阅读更多...

大数据时代的软件开发实践：利用云计算和AI赋能创新

大数据时代的软件开发实践：利用云计算和AI赋能创新

文章目录云计算的赋能弹性资源管理远程协作与分布式开发持续集成和持续交付成本效益人工智能的赋能数据驱动的决策自动化智能预测和优化自适应系统创新的实践方法数据驱动的创新智能化产品开放式创新迭代和反馈 🎈个人主页：程序员小侯 🎐…

阅读更多...

开源的安全性：挑战与机会

开源的安全性：挑战与机会

🌷🍁 博主猫头虎带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~🌺 &a…

阅读更多...

Spring和mybatis整合

Spring和mybatis整合

一、Spring整合MyBatis 1. 导入pom依赖 1.1 添加spring相关依赖(5.0.2.RELEASE) spring-core spring-beans spring-context spring-orm spring-tx spring-aspects spring-web 1.2 添加mybatis相关依赖 mybatis核心：mybatis(3.4.5) Mybatis分页：pagehel…

阅读更多...

基于Python的小区监控图像拼接系统设计与实现【源码+论文+演示视频+包运行成功】

基于Python的小区监控图像拼接系统设计与实现【源码+论文+演示视频+包运行成功】

博主介绍：✌csdn特邀作者、博客专家、java领域优质创作者、博客之星，擅长Java、微信小程序、Python、Android等技术，专注于Java、Python等技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 …

阅读更多...

华为云渲染实践

华为云渲染实践

// 编者按：云计算与网络基础设施发展为云端渲染提供了更好的发展机会，华为云随之长期在自研图形渲染引擎、工业领域渲染和AI加速渲染三大方向进行云渲染方面的探索与研究。本次LiveVideoStackCon 2023上海站邀请了来自华为云的陈普，为大家分…

阅读更多...

研磨设计模式day11代理模式

研磨设计模式day11代理模式

目录场景代码实现编辑解析定义代理模式调用示意图代理模式的特点本质编辑何时选用场景我有一个订单类，包含订单数、用户名和商品名，有一个订单接口包含了对订单类的getter和setter 现在有一个需求，a创建的订单只…

阅读更多...

位运算（包括OR,AND,XOR,NOR,NAND,XNOR，以及0xFF等常见应用）

位运算（包括OR,AND,XOR,NOR,NAND,XNOR，以及0xFF等常见应用）

目录编辑 1、按位与操作 2、按位或操作 3、取反运算 4、异或运算不同为1，相同为0 编辑 5、左移运算 6、右移运算常见用途： C语言位运算讲解： 位运算（包括OR,AND,XOR,NOR,NAND,XNOR，以及&0xFF等常…

阅读更多...

React 项目中引入msal验证以及部分报错处理

React 项目中引入msal验证以及部分报错处理

功能实现如何在React 项目中引入msal身份验证， 微软在官网有提供文档支持，文档包含示例和具体使用的教程，地址如下： https://learn.microsoft.com/zh-cn/azure/active-directory/develop/tutorial-v2-nodejs-webapp-msal 照着文…

阅读更多...

ppt转pdf免费的工具哪个好用？ppt在线转pdf的方法分享

ppt转pdf免费的工具哪个好用？ppt在线转pdf的方法分享

在工作和学习中，将PPT文件转换为PDF格式具有重要意义。PDF文件的大小较小，适用于各种平台和设备，保持了原始文件的内容和格式，具有广泛的可读性和兼容性。那么小编就来为大家详细地说一说“ppt转pdf免费的工具哪个好用?ppt在线转…

阅读更多...

推荐文章

最新文章