【文章学习系列之模型】DLinear

news2024/11/25 2:53:47

本章内容

  • 文章概况
  • 模型流程
  • 实验
    • 定量结果
    • 定性结果
    • 其他对比
  • 总结

文章概况

《Are Transformers Effective for Time Series Forecasting?》是2023年发表于AAAI上的一篇文章。该文章以“Transformer在时序预测中是否有效”为论点展开讨论,并提出一种非Transformer系列的简易网络模型。

模型流程

在这里插入图片描述
该模型主体思路借鉴了ARIMA的分解思路,将原先时序数据分解为趋势项和残差项,并分别经过全连接层,最终求和获得预测结果。其中趋势项使用是对原始数据做平均池化所得,残差项是原始数据和池化所得数据的差值。

作者认为该模型具有四点优势:
1.路径短,捕获的长短期关系效果好
2.更少的内存、参数和更快的推理速度
3.结构简单,可解释性探索相对容易
4.超参数少,不需要过多地针对参数进行调优

实验

本文的实验部分主要针对Transformer在时序预测中是否有效展开讨论。

定量结果

在这里插入图片描述
在这里插入图片描述
同一组实验中,红色为最佳结果,蓝色为第二佳结果,可以看出Dlinear占据着更多的优势结果,总体而言优于前人已有的模型方法。因此,Transformer系列模型在时序预测中并不如简单的全连接模型有效。

定性结果

在这里插入图片描述
文中对三种数据集上的预测结果进行可视化。很显然发现Transformer系列模型无法捕捉这些数据的规律,预测结果远不如Dlinear。这从预报任务的多样性说明了Transformer系列模型的不足。

其他对比

该部分作者针对以下几个方面展开讨论。
回顾窗口的大小: 回顾长度越长,Transformer系列模型效果保持不变或逐渐恶化,Dlinear则显著提高。
训练的数据量: 多数情况下,减少数据集降低了误差,表明在数据达到一定规模后,数据集大小并不是限制模型预测能力的因素。
不同的编码策略: Transformer系列模型的核心模块的各不相同,最佳编码策略的选取也不尽相同。
模型效率: 和普通Transformer模型相比,各类衍生模型加入了众多的创新元素,虽然一定程度上有所提高,但带来了更多的训练参数和推理时间。这削弱了推导基于内存高效Transformer的方法的重要性。

总结

这篇论文使用一个简单的模型超过了众多Transformer系列复杂模型,不禁让我深思:时序预测中Transformer的发展是否真的有效?文中做了多种实验,均表现出Transformer在时序预测中大可不必且不如全连接的结论。或许追逐了这么多复杂模型的探索,尝试一些简单的模型会有不一样的风景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/518555.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SwiftUI 4.0 中 List 显示层级数据的子视图在展开和收起操作时无动画的解决

问题现象 在 SwiftUI 4.0(iOS 16+)中,一个超简单 List 视图层级子视图的收放操作竟然没有动画,这着实有点让人不爽: 从上图可以看到:我们在点击 List 子项时不仅毫无收放动画可言,而且在展开时还有卡顿,显得非常生硬。 以上代码在目前最新的 iOS 16.4.1(a) 系统中测试…

自动化测试如何做?接口自动化测试框架必备的9个功能,测试老鸟总结...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 当你准备使用一个…

PyQt5桌面应用开发(13):QGraphicsView框架

本文目录 PyQt5桌面应用系列PyQt5 与艺术codeQGraphicsView Framework几何QGraphicsView应用QGraphicsItem应用keyPressEvent QObject cross QThread/thread总计 PyQt5桌面应用系列 PyQt5桌面应用开发(1):需求分析 PyQt5桌面应用开发&#xf…

【Linux】进程控制(文件操作符收尾+重定向)

上一回进程与文件系统我们主要看了很多文件描述符的知识 1.如何理解一切皆文件? 每个设备被打开时,OS给每个文件创建一个自己的struct file 里面填充自己的属性以及自己的缓冲区,其中还有函数指针,里面保存函数地址,通…

京东CEO徐雷突然退休,CFO许冉接任成为首位女CEO

我是卢松松,点点上面的头像,欢迎关注我哦! 京东集团重大人事变动,京东集团CEO徐雷将退休,才49岁,CFO许冉将成为京东集团新任CEO。京东将迎来首位女CEO。 徐雷在48岁被任命为京东CEO,49岁退休。…

IS220PRTDH1A固态过载继电器不会产生热量以方便跳闸

IS220PRTDH1A固态过载继电器不会产生热量以方便跳闸 一旦触发动作发生,双金属片冷却并自行重塑,自动重新启动电路。电机在过载未消除的情况下重新启动,并会一次又一次地点火和重新启动。(假设自动重启 这种类型的继电器也可以配备…

Python的画图模块turtle使用详解

简介:Turtle是Python语言中一个很流行的简单的绘图工具。你可以把它理解为一个小海龟,只听得懂有限的指令。它在一个横轴为x、纵轴为y的坐标系原点,(0,0)位置开始,它根据一组函数指令的控制,在这个平面坐标系中移动&am…

【中级软件设计师】—(下午题)试题三精讲总结(四十二)

【中级软件设计师】—(下午题)试题三精讲总结(四十二) 一、关系 二、UML中的图 A包含B,那么A执行操作前必须要先执行B 试题一(2021年下半年) 试题2(2021年上半年) 官方…

【C++初阶】类和对象下篇

⭐博客主页:️CS semi主页 ⭐欢迎关注:点赞收藏留言 ⭐系列专栏:C初阶 ⭐代码仓库:C初阶 家人们更新不易,你们的点赞和关注对我而言十分重要,友友们麻烦多多点赞+关注,你们的支持是我…

板材激光切割机切割穿孔时注意的几个问题

激光切割设备广泛应用于钣金、五金制品、钢结构、汽车配件、广告、工艺品等行业,成为加工行业不可缺少的环节。在厚板加工中穿孔时间占很大比重,随着加工板材越来越厚,板材激光切割机切割穿孔也会相应地增加难度。 激光切割机两种常见的穿孔方…

druid 远程命令执行 (CVE-2021-25646)

漏洞原理 该漏洞主要就是根据Jackson解析特性(解析name为""时)会将value值绑定到对象(JavaScriptDimFilter,type为javascript时指定的)的对应参数(config)上,造成JavaScriptDimFilter中function属性中的javascript代码被执行。攻击者可以构造…

Redis高级数据结构HyperLogLog

HyperLogLog(Hyper[ˈhaɪpə(r)])并不是一种新的数据结构(实际类型为字符串类型),而是一种基数算法,通过HyperLogLog可以利用极小的内存空间完成独立总数的统计,数据集可以是IP、Email、ID等。 如果你负责开发维护一个大型的网站,有一天产品…

pytorch移植华为mindspore记录

因为某个需求,需要把原来pytorch的神经网络移植到华为的mindspore上 这边记录下遇到的坑 附上mindspore的官方教程: https://mindspore.cn/tutorials/zh-CN/r2.0/advanced/compute_graph.html 这边附上需要移植的网络,以tensorflow和pytorch…

LeetCode 链表OJ分享

目录 删除排序链表中的重复元素回文链表剑指Offer 06.从尾到头打印链表复制带随机指针的链表 删除排序链表中的重复元素 链接: link 题目描述: 题目思路: 本题思路使用双指针,以示例二为例如下图: 如果head->val等于next-&…

ihateniggers:针对Python开发者的Windows远控木马分析

背景 墨菲安全实验室在持续监测开源软件仓库中的投毒行为,5 月 9 日起发现 4 个包含 “ihateniggers” 远程控制木马的 Python 包被 nagogygmail.com 邮箱关联的账号发布到 PyPI 仓库,试图针对Windows系统下 Python 开发者进行攻击。木马利用了discord、…

各种顺序表和链表的实现代码

目录 一、什么是线性表 二、顺序表 2.1什么是顺序表 2.2静态顺序表的代码实现 2.3动态顺序表的代码实现 三、链表 3.1什么是链表 3.2不带头单向不循环链表的代码实现 3.3带头双向循环链表的代码实现 四、顺序表和链表的区别 一、什么是线性表 线性表是n个具有相同特性…

(十五)数据编辑——图形编辑①

数据编辑——图形编辑① 数据编辑包括几何数据和属性数据的编辑。几何数据的编辑主要是针对图形的操作,即图形编辑,包括平行线复制、缓冲区生成、镜面反射、图层合并、结点操作、拓扑编辑等。属性编辑主要包括图层要素属性的添加、删除、修改、复制、粘…

谷歌落子,我们对中国大模型的期待应该是什么?

对中国大模型厂商而言,市场期待的,也恰是这些真正可落地的应用和实践。这些实践可以在社交,在电商,在低代码,在供应链,也更可以在一个个中国产业数字化转型的新洼地。 作者|思杭 皮爷 出品|产业家 在微软G…

裸辞5个月,面试了37家公司,终于.....

上半年裁员,下半年裸辞,有不少人高呼裸辞后躺平真的好快乐!但也有很多人,裸辞后的生活五味杂陈。 面试37次终于找到心仪工作 因为工作压力大、领导PUA等各种原因,今年2月下旬我从一家互联网小厂裸辞,没想…

执行增删改查时的结果处理

查询最终走到PreparedStatementHandler类的query方法,执行查询后调用DefaultResultSetHandler类的handleResultSets方法 1.处理返回的普通实体类 DefaultResultSetHandler类的handleResultSets方法 继续本类的handleResultSet方法 通过 handleRowValues 方法来…