这不是危言耸听!时序Transformer颠覆传统,历史级突破!

news2024/9/21 2:39:41

【时间序列+Transformer】在近年来的深度学习领域中备受关注,它通过将Transformer架构应用于时间序列数据,显著提升了模型在长时间依赖建模和复杂模式识别任务中的表现。时间序列+Transformer技术已经在金融预测、气象预报和健康监测等多个领域取得了显著成果,其独特的方法和有效的表现使其成为研究热点之一。

特别是该领域近期再次取得重大突破:iTransformer,在不修改任何模块的情况下,就实现了全面领先!实际上,对Transformer架构进行改进,提升预测效果,一直是迫切需求!主要在于Transformer在时序预测领域一直面临诸多挑战,比如Transformer 计算多头自注意力的方式:二次复杂度,在处理长序列时会产生计算瓶颈,经典的informer模型就由此诞生。

为了帮助大家全面掌握时间序列+Transformer的方法并寻找创新点,本文总结了最近两年时间序列+Transformer】相关的20篇顶会顶刊的研究成果,这些论文的文章、来源以及论文的代码都整理好了,希望能为各位的研究工作提供有价值的参考。

需要的同学扫码添加我

回复“时序Transformer20”即可全部领取

图片

1、Masked Jigsaw Puzzle: A Versatile Position Embedding for Vision Transformers

图片

-这篇文章提出了一种名为Masked Jigsaw Puzzle (MJP) 的新型位置嵌入方法,用于改进视觉变换器(Vision Transformers,ViTs)在处理图像时的隐私保护和性能表现。ViTs在许多视觉任务中表现出色,但其使用的位置嵌入(Position Embeddings,PEs)可能暴露输入图像的空间信息,带来隐私泄露的风险。文章首先通过低维投影技术直观展示了PEs如何学习输入图像块的二维空间关系,从而解释了PEs对ViTs性能提升的原因。

-为了解决PEs带来的隐私问题,文章提出了MJP方法,该方法通过四个核心步骤实现:首先,使用块状随机拼图洗牌算法随机选择并打乱输入图像块;其次,对选中的图像块使用共享的未知位置嵌入,而非原始PEs;接着,为了加强未被打乱图像块的空间关系,引入了密集绝对位置回归(Dense Absolute Localization,DAL)约束;最后,通过这种方式,MJP在保持ViTs准确性的同时,增强了模型对图像块洗牌的一致性,并显著提高了在对抗性攻击下的隐私保护能力。

-实验结果表明,MJP方法在大规模数据集(如ImageNet-1K和ImageNet-C)上不仅提升了性能和鲁棒性,而且在典型的梯度攻击下,通过大幅度提高隐私保护能力,有效地缓解了PEs的隐私泄露问题。此外,文章还探讨了MJP方法在不同遮蔽比例下的准确性、差异性规范和一致性表现,并进行了消融研究,以验证MJP各个组成部分的有效性。

-文章还讨论了MJP方法在隐私保护方面的效果,通过对比分析攻击(Analytic Attack)来评估模型在隐私攻击中的抗攻击性能。结果表明,MJP方法能够显著降低从梯度更新中恢复原始图像的质量,从而提高隐私保护能力。此外,文章还提供了可视化的注意力图,展示了MJP方法如何使ViTs的注意力头呈现更多样化和内容感知的注意力模式,这可能是MJP提升准确性的原因之一。

-最后,文章总结了MJP方法的主要贡献,并指出其在保护用户隐私、提高模型鲁棒性和准确性方面的潜力。MJP方法的提出,为ViTs在处理视觉任务时提供了一种平衡准确性、隐私保护和一致性的新思路。

2、SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete Diffusion Process

图片

-这篇文章介绍了一种名为SegRefiner的模型无关的图像分割细化方法,该方法通过离散扩散过程来增强由不同分割模型产生的物体掩模的质量。SegRefiner的核心思想是将分割细化任务视为一个数据生成过程,并通过一系列去噪扩散步骤来实现。具体来说,SegRefiner接受粗糙的掩模作为输入,并通过预测每个像素的标签和相应的状态转换概率,以条件去噪的方式逐步细化这些掩模。

-文章首先指出,尽管图像和视频分割领域在过去几十年中已经得到了广泛研究,但获取准确和详细的分割掩模仍然是一个挑战,因为这需要模型同时捕获高级语义信息和细粒度的纹理信息。尤其是对于2K或更高分辨率的图像,这一挑战尤为突出,因为它们需要相当的计算复杂性和内存使用。现有的分割算法通常在较小的尺寸上预测掩模,这不可避免地导致了由于下采样过程中细粒度信息的丢失而导致的准确性下降。

-为了解决这个问题,SegRefiner采用了一种新颖的视角,将分割细化视为一个数据生成过程。在训练过程中,SegRefiner通过一个独特的离散扩散过程,逐渐将真实标签掩模转化为粗糙掩模。在推理过程中,该过程则用于从粗糙掩模中采样,并逐步细化掩模。这种方法允许SegRefiner在每次迭代中只关注修正一些“最明显的错误”,并逐步收敛到准确结果,从而降低了单次修正所有错误的难度,并使模型能够处理更具挑战性的例子。

-文章通过在各种分割任务上的广泛实验,展示了SegRefiner的有效性。实验结果表明,SegRefiner在多个方面优于以往的模型无关细化方法。首先,它在不同类型的粗糙掩模上一致地提高了分割度量和边界度量。其次,与以前的模型无关细化方法相比,SegRefiner有显著的性能提升。最后,当应用于高分辨率图像时,SegRefiner展现出强大的捕捉极细细节的能力。

-此外,SegRefiner的源代码和训练模型已在GitHub上公开,以便其他研究人员可以访问和使用。这项工作不仅为图像分割领域提供了一种新的细化策略,也为其他需要数据生成任务的领域提供了一种可能的解决方案。

需要的同学扫码添加我

回复“时序Transformer20”即可全部领取

图片

3、ContiFormer: Continuous-Time Transformer for Irregular Time Series Modeling

图片

-这篇文章提出了一种新型的连续时间变换器(ContiFormer),专为不规律时间序列建模而设计。在现实世界的应用中,如疾病预防、金融决策和地震预测等领域,经常会遇到不规律时间序列数据。这些数据的特点是观测值的生成时间间隔不固定,可能存在由于技术问题或数据质量问题导致的缺失数据。传统的时间序列分析技术在处理这类数据时面临挑战,因为它们通常假设数据是等间隔采样的。

-文章指出,现有的时间序列模型,包括循环神经网络(RNN)和变换器(Transformer)模型,尽管在捕捉复杂模式方面表现出色,但它们在处理连续时间数据范式时存在局限性。此外,神经常微分方程(Neural ODEs)及其变体虽然在处理不规律时间序列方面显示出了有希望的结果,但它们往往无法捕捉序列内部的复杂相关性。

-为了解决这些问题,文章提出了ContiFormer,这是一种将神经ODEs的连续动态建模能力与变换器的注意力机制结合起来的连续时间变换器。ContiFormer通过定义每个观测值的潜在轨迹来捕捉观测值的动态变化,并将变换器中的离散点积扩展到连续时间域,从而在连续动态之间计算注意力。

-文章的贡献可以总结为以下几点:

  1. 引入了一种新颖的连续时间变换器,据作者所知,这是首次将连续时间机制融入变换器的注意力计算中。

  2. 提出了一种新颖的参数化方法,允许在不同时间范围内并行执行连续时间注意力。

  3. 从理论上分析了ContiFormer的表达能力,并展示了多种专门用于不规律时间序列建模的变换器变体可以作为ContiFormer的特例。

  4. 在合成和真实世界数据集上进行了广泛的实验,证明了ContiFormer在不规律时间序列数据上的建模能力和预测性能优于现有模型。

-文章还对ContiFormer的计算复杂性进行了分析,展示了其在不同模型中的性能对比,并讨论了模型的表示能力,证明了ContiFormer能够扩展多种变换器变体。最后,文章通过一系列实验验证了ContiFormer在时间序列插值、分类、事件预测和预测等不同类型的不规律时间序列任务上的有效性,并与现有的强基线模型进行了比较,展示了其优越的性能。

需要的同学扫码添加我

回复“时序Transformer20”即可全部领取

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1870218.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PNAS|这样也可以?拿别人数据发自己Paper?速围观!

还在为数据量小,说服力不足发愁? 想研究脱颖而出、眼前一亮? 想从更高层次的探索微生物的奥秘,发出一篇好文章? 近期,有一篇发表在PNAS(IF11.1)的文章“Deforestation impacts soil biodiversity and ecos…

Swift 周报 第五十六期

文章目录 前言新闻和社区苹果与消费者修改 3500 万美元 iPhone 音响和解协议苹果(AAPL.US)因监管担忧今年不会在欧盟推出 AI 功能苹果暂停高端 Vision 头戴设备研发 计划推出更廉价版 Swift论坛推荐博文话题讨论关于我们 前言 本期是 Swift 编辑组自主整理周报的第五十六期&am…

小红书2024LLM论文分享

2024小红书大模型论文分享 BatchEval基于LLM评估LLM生成文本的质量 ACL2024 https://ypw0102.github.io/ 如果文本评价需要多个维度,需要调整BatchEval么? 目前是完整流程走一遍的,因此没有具体考虑细粒度。 评测连续的数据域,S…

JavaScript中的Date对象,以及常用格式化日期的方法封装

一、Date对象 二、操作Date对象 1、创建Date对象 (1)常用方法 (2)使用示例 2、获取日期 (1)常用方法 (2)使用示例 3、设置日期 (1)常用方法 &…

youlai-boot项目的学习(3) 本地redis、MinIO的安装与配置

youlai-boot项目除了使用mysql数据库、还有redis,以及OSS服务,OSS除了云OSS服务,还有自部署的MinIO服务。 前面我们已经安装好了mysql数据库,那么我们来看看本地redis、MinIO服务怎么部署 环境 mac OS, iterm2&#…

中霖教育怎么样?注册会计师考试难吗?

中霖教育:注册会计师(CPA)考试的难度高吗? 对于不同背景的考生来说,注册会计师考试的挑战程度不同。那些有良好基础和充裕准备时间的考生,通过考试的可能性要超过那些从零开始且准备时间有限的人。 据最近…

YOLO目标检测综述(2024.6月最新!)

1 基本概念 目标检测(Object Detection)是计算机视觉领域的重要任务之一,旨在识别图像或视频中的特定目标并将其位置标记出来。与图像分类任务不同,目标检测要求不仅能够识别目标类别,还需要精确地定位目标的位置。由于…

1.2章节input输入函数语法使用和示例

在Python中,input() 函数用于从用户获取输入。这个函数会等待用户输入一行文本,然后按回车键,最后将输入的文本作为字符串返回。 一、基本语法 当你运行上面的代码时,它会打印出 "请输入一些文字: ",然后等…

.idea文件夹里面iml文件有啥用

.idea文件夹和其中的.iml文件对于IntelliJ IDEA项目非常重要,它们共同构成了IDEA对项目理解的基础。让我们详细了解一下这两者的作用: .idea文件夹 .idea文件夹包含了IntelliJ IDEA项目的所有配置信息,包括但不限于: 编译器设置…

jmeter之接口数据与数据库数据检验!

前言 本文讲解使用jmeter测试接口,然后与数据库里面的数据进行校验对比。本节使用一个新增数据的接口,新增一条数据,然后在数据库里面进行查询,是否能够查询到此条数据。 一、接口环境搭建 1.1 新建一个http请求,写…

3d合并模型一直加载有哪些原因---模大狮模型网

当在3D软件中合并3d模型时,可能会遇到加载时间过长或持续加载的情况。这可能是由以下原因之一引起的: 一:模型复杂度 合并的模型可能非常复杂,包含大量的面片、顶点或纹理等。这会增加加载和处理的时间。解决方法是优化模型&…

希喂生骨肉冻干值得入手吗?拯救瘦弱、增强抵抗力最强主食测评!

希喂生骨肉冻干值得入手吗?很多小姐妹觉着自家猫咪太瘦了、体质不咋好,换季还敏感、掉毛、不吃东西,听说生骨肉冻干好吸收、营养好,可以改善体质、拯救瘦弱、增强抵抗力,为了图省事,开始盲入生骨肉冻干&…

常见的Java开发难题包含解决办法内存泄漏异常处理代码质量和维护

常见的Java开发难题包含解决办法内存泄漏异常处理代码质量和维护 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……) 2、学会Oracle数据库入门到入土用法(创作中……) 3、手把手教你开发炫酷的vbs脚本制作(完善中……) 4、牛逼哄哄的 I…

解决卸载TabX explorer软件后导致系统文件资源管理器无法正常使用问题

最近安装了最新版本的鲁大师,安装过程中不小心同时安装了捆绑软件TabX explorer。这个软件和系统自带的文件资源管理器很像,最后弹出会员到期才发现,这个不是系统文件资源管理器,是第三方的文件资源管理器,就按正常流程…

解锁高效运维新纪元:网络基础设施数字孪生管理工具

随着信息技术的飞速发展,网络基础设施的运维管理变得日益复杂。北京耐威迪科技股份有限公司凭借其创新技术,推出了nVisual网络基础设施数字孪生管理工具,这一革命性的解决方案不仅提升了运维效率,更在成本节约和项目进度上实现了突…

cad报错:由于找不到vcruntime140.dll无法继续执行代码

在现代的工程设计中,计算机辅助设计(CAD)软件已经成为了工程师们不可或缺的工具。然而,在使用CAD软件的过程中,有时我们会遇到一些问题,其中之一就是“找不到vcruntime140.dll”的错误提示。本文将详细介绍…

智慧校园-就业管理系统总体概述

在当代教育与信息技术深度融合的背景下,智慧校园就业管理系统成为了连接学生、高校与企业的重要纽带,它以创新的服务理念和技术手段,重塑了职业规划与就业服务的传统模式。这一系统致力于为即将步入社会的学生们提供全面、个性化的支持&#…

SaaS产品运营:维护四个不同类型的合作伙伴的实战指南

在SaaS(软件即服务)行业的竞争中,与合作伙伴建立并维护良好关系至关重要。不同类型的合作伙伴对于产品的推广、市场覆盖和用户增长都起着不同的作用。如何有效维护这四种类型合作伙伴?看个案例一起学习吧。 一、合作伙伴的四种类型…

使用sorted对字典排序

有时我们需要按照字典数据的键值对进行排序,这个时候就可以用到sorted函数。 import operator dic{"testA":3,"testC":1,"testB":4,"testD":2} dicnsorted(dic.items(),keyoperator.itemgetter(0)) print(dicn) 比如我们要…

DB-GPT Docker部署

感谢阅读 拉取镜像linux判断拉取是否成功的方法windows判断拉取是否成功的方法 模型以及启动容器模型启动容器 界面如下(0.56): 拉取镜像 docker pull eosphorosai/dbgpt:latestlinux判断拉取是否成功的方法 docker images | grep "eo…