结合创新!LSTM+Transformer新成果登Nature,精度高达95.65%

news2025/1/6 20:01:57

推荐一个能发表高质量论文的好方向:LSTM结合Transformer。

LSTM通过门控机制有效捕捉序列中的长期依赖关系,防止梯度消失或爆炸,在处理具有长期依赖性的时间序列数据时有显著优势。而Transformer通过自注意力和多头注意力机制全面捕捉序列依赖,能够同时考虑输入序列中的所有位置,更好地理解上下文关系,实现高效的并行计算。

这种策略结合了两者的优势,在各种序列分析任务中实现了更精确的预测、更好的性能表现、更高的训练效率。比如登上Nature子刊的最新混合架构,以及精度高达95.65%的BiLSTM-Transformer。

本文整理了10种LSTM结合Transformer的创新方案,并简单提炼了可参考的方法以及创新点,希望能给各位的论文添砖加瓦。

论文原文以及开源代码需要的同学看文末

Advanced hybrid LSTM‑transformer architecture for real‑time multi‑task prediction in engineering systems

方法:论文提出了一种新颖的LSTM-Transformer混合架构,专门用于多任务实时预测。该模型结合了LSTM和Transformer架构的核心优势,通过在线学习和知识蒸馏技术,动态适应可变的操作条件并持续吸收新的现场数据。

创新点:

  • 作者提出了一种新颖的LSTM-Transformer混合架构,专门用于多任务实时预测。该模型结合了LSTM和Transformer的核心优势,提供了一种优于传统预测模型的替代方案。

  • 作者使用在线学习技术,使模型能够动态适应变化的操作条件,并不断融入新的现场数据。

  • 作者利用知识蒸馏技术,有效地将大型预训练网络的洞察力转移给较小、预先训练网络,从而在不牺牲计算资源的情况下实现高精度的预测。

A BiLSTM–Transformer and 2D CNN Architecture for Emotion Recognition from Speech

方法:论文提出了一种新的情感识别模型架构,结合了双向长短期记忆(BiLSTM)-Transformer和二维卷积神经网络。BiLSTM-Transformer用于处理音频特征以捕捉语音模式的序列,而2D CNN用于处理梅尔频谱图以捕捉音频的空间细节。通过使用10折交叉验证方法验证模型的能力,该方法应用于Emo-DB和RAVDESS两个主要的语音情感识别数据库,并分别达到了95.65%和80.19%的高精度。

创新点:

  • 提出了将双向长短期记忆(BiLSTM)-Transformer和二维卷积神经网络(2D CNN)结合的模型架构。这种创新的整合方法在理解和解释语音中的情感线索方面提供了新的可能性。

  • 运用t-SNE算法,通过可视化评估了不同特征组合的有效性,并确定了在Emo-DB和RAVDESS数据库中具有最佳区分度的特征组合。

LSTTN: A Long-Short Term Transformer-based Spatio-temporal Neural Network for Traffic Flow Forecasting

方法:本文提出了一种名为LSTTN的新型交通流量预测框架,该框架综合考虑了历史交通流量中的长期特征和短期特征,以获得更准确的预测结果。LSTTN模型通过集成长期趋势、周期性和短期趋势的特征来改善预测准确性。

创新点:

  • 提出了一种基于Transformer的交通流量预测框架LSTTN,该框架可以充分利用长时间序列中的长期趋势和周期性特征,以提高预测准确性。

  • 在提出的框架中设计了具体的模块,包括使用掩码子序列Transformer进行预训练,通过堆叠的1D扩张卷积层提取长期趋势,以及使用动态图卷积层提取周期性特征。

  • 在四个实际数据集上进行了实验评估,结果表明LSTTN模型在所有预测时间段上都优于基线模型。在四个真实世界的数据集上相比基线模型实现了最小5.63%和最大16.78%的性能提升。

SwinLSTM: Improving Spatiotemporal Prediction Accuracy using Swin Transformer and LSTM

方法:本文提出了一种新的循环单元SwingLSTM,它融合了Swin Transformer块和简化的LSTM,并基于此构建了一个用于时空预测任务的预测网络。

创新点:

  • 提出了一种新的架构用于时空预测任务,能够高效地建模空间和时间依赖关系。
    • 新的架构可以有效地捕捉时空依赖关系。

    • 通过对各种数据集(包括Moving MNIST,TaxiBJ,Hu-man3.6m和KTH)的广泛实验,证明了该方法的出色性能。

  • 提出了一种新的循环单元,称为SwinLSTM,能够高效地提取时空表示。
    • SwinLSTM将Swin Transformer模块和简化的LSTM集成在一起,取代了ConvLSTM中的卷积结构,从而提高了预测准确性。

    • SwinLSTM在Moving MNIST,TaxiBJ,Human3.6m和KTH等四个数据集上取得了出色的性能。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“LT结合”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1626781.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenHarmony实战开发-媒体查询 (@ohos.mediaquery)

概述 媒体查询作为响应式设计的核心,在移动设备上应用十分广泛。媒体查询可根据不同设备类型或同设备不同状态修改应用的样式。媒体查询常用于下面两种场景: 针对设备和应用的属性信息(比如显示区域、深浅色、分辨率)&#xff0…

21.基础乐理-等音调扩展篇、为何一共十五个大调

首先 等音调 的概念是基于 等音 的概念,比如下图中的音名:因为用的按键相同,音名不同,所以被称为等音调 然后音名一共有35个,如下图:所以在理论上它会有35个大调,但是人总是倾向于选择简单、简洁…

一个不太好用的弹出层jquery.colorbox第二次点击不出来的解决方法

使用jquery.colorbox的时候第一次正常显示,但第二次的时候不显示。 需要先移除,再重新点击即可,代码如下 $.colorbox.remove();$.colorbox({href: url,iframe: true,width: options.width || 800,height: options.height || 600 });

企业应该如何选择适合的ERP?

今天跟大家聊一点不一样的。一直写了很多关于企业内部系统集成的文章和案例,很多人私信我又或者是很多客户在做数字化选型的时候会问到我一个问题,那就是“ERP改如何去选择,金蝶跟用友该怎么选?”。因为做集成这个领域也有十多年了…

宁盾2FA双因子认证助力某城商行TCE平台达到密评要求

《密码法》规定,法律、行政法规和国家有关规定要求使用商用密码进行保护的关键信息基础设施,其运营者应当使用商用密码进行保护,自行或者委托商用密码检测机构开展商用密码应用安全性评估。商用密码应用安全性评估(简称&#xff1…

小红书KOL推广应该注意什么?

小红书上的KOL往往具有极大影响力,可以协助品牌快速构建产品形象,并短时间内为品牌带来大量热度和搜索量,引导消费。品牌通过与达人进行合作推广,也可以借鉴达人的影响力,提高品牌的信任度和转化率。 不过网红达人推广…

SpringBoot源码阅读2-自动配置

SpringBoot源码阅读2-自动配置 在传统的Spring应用中,开发者需要手动配置一系列Web应用的核心组件,例如DispatcherServlet用于处理请求分发、ViewResolver用于视图解析、CharacterEncodingFilter用于字符编码过滤等。 然而在SpringBoot中只要引入了spr…

4 -26

4-26 1 英语单词100个一篇六级翻译 2 div 4 补题目 3 概率论期中卷子一张,复习复习。 4 备课ing 晚上出去炫饭,串串香,无敌了。 中间一些模拟题是真的恶心,思维题是真的想不到,感觉自己就是一个废物呢。 1.是将一个数…

Neo-reGeorg明文流量

Neo-reGeorg 1 同IP对,同一个URI,第一个TCP流是“GET”请求,随后的TCP流请求为“POST”。(jsp\jspx\php) 2 第一个TCP流中,GET只有一个会话。(jsp\jspx\php),响应body79…

本地体验最强开源模型Llama3+Qnw(支持Windows和Mac)

一键运行大模型本地软件(含模型):点击下载 Meta放出Llama3模型了,也应该是这段时间里的一个科技大新闻了。 Llama一直都是开源大语言模型的领头羊驼。 而Llama3又是所有羊驼中最新的领头羊。 可以简单地来看一下官方的对比数据…

03_Scala变量和数据类型

文章目录 [toc] **变量和数据类型****1.注释****2.变量和常量****3. 标识符的命名规范****4.scala的字符串****5.键盘输入****5.1 StdIn.readLine()****5.2 从文件中读取数据****5.3 Scala向外写数据** 变量和数据类型 1.注释 和Java完全一样 ** ** 2.变量和常量 var name…

Gin的中间件执行流程与用法

一、背景 我们在使用Gin框架进行Web开发的时候,基本上都会遇到登录拦截的场景。 例如某些接口必须在登录以后才能访问,根据登录用户的信息以及权限,拿到属于自己的数据, 反之,没登录过则直接拒绝访问。 那么我们怎么做到这些登录…

实现SpringMVC底层机制(二)

文章目录 1. 动态获取spring配置文件1.修改SunWebApplicationContext.java2.修改SunDispatcherServlet.java 2.自定义Service注解1.需求分析2.编写Monster.java3.自定义Service注解4.编写Service接口MonsterService.java5.编写Service实现类MonsterServiceImpl.java6.修改SunWe…

嵌入式Linux学习——Ubantu初体验

Ubuntu 和Windows 的最大差别 Windows中的每一个分区都对应着一个盘符,盘符下可以存放目录与文件,而在Ubantu中没有盘符的概念,只有目录结构。实际上不同的目录可能挂载在不同的分区之下,如果想要查看当前目录位于磁盘的哪个分区…

代码随想录算法训练营Day9 | 双指针总结归纳:

截止目前为止,已经刷过十道有关于双指针的题了: 1.对于数组而言,数组上的元素不能做到删除,只能进行覆盖,通过两个指针在一个for循环下完成两个for循环的工作,提升了效率 2.字符串中定义两个指针&#xff…

第三篇:Python编程基础:掌握核心语法与开发技巧

Python编程基础:掌握核心语法与开发技巧 1 引言 在这个信息化迅速蔓延的世界中,Python语言如同钥匙一般开启了通往各种可能性的大门。无论你是数据科学家、网络工程师、机器学习专家,还是仅仅对自动化办公感兴趣的办公室人员,Pyt…

汽车驾驶3D模拟仿真展示系统更立体直观

随着新能源汽车的普及,它已成为现代生活中不可或缺的交通工具。并且国产车的崛起,其设计与零部件制造水平已能与合资车相媲美,因此汽车维修技能的学习变得尤为重要。汽车维修3D仿真教学软件应运而生,为广大学员提供了一个直观、高…

【产品经理修炼之道】- 携程酒店业务

这篇文章里,作者以携程为参照对象进行了业务分析,一起来看看本文作者关于携程酒店业务的思考。想了解OTA、或者酒店业务的同学们,或许可以来看看本文的思路。 本文是以携程为参照对象做的一个业务分析,系列一共有三期&#xff0c…

【鸿蒙】通知

一、概要 Android的Notification。 说到通知,就想到了推送。 通知这块可以做到不像Android一样需要集成各家厂商的推送了,不知道是否有建立独立的推送系统 这是官网上介绍的跨APP进行的IPC通知。实际在Android开发过程中,可能这种场景会相对…

【产品经理修炼之道】- 导航架构设计

目录 一、导航是什么 二、导航的作用 三、导航的分类 四、导航菜单的广度与深度 五、导航的颜色 六、导航的形态 七、导航的研究 八、导航的设计 九、导航改版案例分享 总结 每个网页的设计都需要包括导航,那么导航架构该如何设计?作者结合之前…