【文章学习系列之模型】SCALEFORMER

news2024/11/20 15:16:36

本章内容

  • 文章概况
  • 模型结构
  • 主要方法
    • 多尺度框架
    • 跨尺度标准化
    • 模型输入编码
    • 损失函数
  • 实验结果
  • 消融实验
    • 跨尺度标准化
    • 自适应损失函数
  • 总结

文章概况

《SCALEFORMER: ITERATIVE MULTI-SCALE REFINING TRANSFORMERS FOR TIME SERIES FORECASTING》是2023年发表于ICLR上的一篇论文。作者发现在对不同时间尺度预测的尝试下,逐渐细化预测颗粒有利于时序预测,因此在论文中提出了一种通用多尺度框架,实验表明显著提高前人Transformer系列模型的实验效果。

在这里插入图片描述
论文链接
代码链接

模型结构

在这里插入图片描述
X e n c X^{enc} Xenc经过池化层下采样得到 X i e n c X^{enc}_{i} Xienc X i − 1 o u t X^{out}_{i-1} Xi1out经过上采样得到 X i d e c X^{dec}_{i} Xidec X i e n c X^{enc}_{i} Xienc X i d e c X^{dec}_{i} Xidec经过Cross-Scale Normalization后得到标准化之后的两组数据,随后将这两组数据输入预测模型中。需要注意的是 X i − 1 o u t X^{out}_{i-1} Xi1out是上一个 s t e p i − 1 step_{i-1} stepi1步骤模型的输出,而当 i = 1 i=1 i=1时, X 0 o u t X^{out}_{0} X0out取0。

主要方法

多尺度框架

在这里插入图片描述
多尺度主要体现在两个地方,一个是模型中 s t e p step step迭代 m + 1 m+1 m+1次,遍历 S S S中所有尺度因子,另一个是每次 s t e p step step包含一对上下采样AvgPool和Upsample。

跨尺度标准化

在这里插入图片描述

如上图所示,多尺度框架导致了数据分布将发生变化。因此为了缓解分布差距,作者将上下采样之后的数据进行联合标准化,换言之就是放一起算。

在这里插入图片描述

模型输入编码

常规三要素:数值编码、时间编码、位置编码

损失函数

使用MSE,对异常值敏感,MSELoss抛弃;
使用Huber,没异常值效果不佳,HuberLoss抛弃;
最后选择自适应损失函数
在这里插入图片描述

我还没看,有兴趣的可以去了解一下 论文链接

实验结果

在这里插入图片描述
以上对比了作者所提框架+前人模型的效果变化情况,实验表明效果提升显著。
(更多实验结果见附录)

消融实验

跨尺度标准化

在这里插入图片描述
有无标准化前后对比,可以看出确实标准化之后的曲线更加稳定,同时也更接近真实情况。

在这里插入图片描述
上表为无归一化和原始模型的实验对比,可以发现没有了跨尺度标准化操作,所提框架总体上并不如原始模型效果好。通过以上两种角度的对比,作者再一次确认了跨尺度标准化的重要性。

自适应损失函数

在这里插入图片描述
基准为前人原始结果,-A为使用自适应损失函数,-MS为使用多尺度框架和MSELoss,-MSA为本文所提方法。总体而言,红色竖条更短、MSE误差更小。由此可以一定程度上表明自适应损失函数和多尺度框架的的有效性。

总结

在文章的最后,作者还将所提方法应用于概率预测以及非Transformer系列的模型中,从实验结果看是可行的。这篇论文发现了多尺度采样在时序预测中的可探索性,刚好也印证了年初我写的一个时序模型的效果,同样也是类似多尺度采样建模,效果还不错,重要的是参数量很少、跑得很快。另外值得提出的是,作者没有按照以往构建新模型的方式进行创新探索,而是对前人模型的外围框架进行创新,在模型已经卷到现在的情况下,这无疑不是一个新的研究思路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/591168.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

硬件工程师-BUCK开关电源设计

一、电感的伏安特性 电感线圈通电之后,会产生磁场,磁场是有一定极性的,而且磁场分布,是一个封闭的回路。在线圈的内部磁力线是比较密集的,磁场的强度是比较强的,外面空气中的的这个磁力线是比较稀疏的&…

【Unity3D】调整屏幕亮度、饱和度、对比度

1 屏幕后处理流程 调整屏幕亮度、饱和度、对比度,需要使用到屏幕后处理技术。因此,本文将先介绍屏幕后处理流程,再介绍调整屏幕亮度、饱和度、对比度的实现。 屏幕后处理即:渲染完所有对象后,得到一张屏幕图像&#xf…

Centos6.5环境Nginx 1.16.1升级到1.24.0版本

一、背景 2023年4月11日,官方发布了Nginx最新稳定版,版本号为 1.24.0。该版本是基于1.23.x(1.23.0 - 1.23.4)开发版的Bug修复,以及一些新特性的加入,而形成的稳定版。安全部门扫描后,发现现场不…

车载ECU休眠唤醒-TJA1145

前言 首先,请教大家几个小小问题,你清楚: 什么是TJA1145吗?你知道休眠唤醒控制基本逻辑是怎么样的吗?TJA1145又是如何控制ECU进行休眠唤醒的呢?使用TJA1145时有哪些注意事项呢? 今天&#xff…

chatgpt赋能python:Python中如何输入中文——从安装到常见问题解决

Python中如何输入中文——从安装到常见问题解决 Python是一门广泛使用的编程语言,其优秀的开源性、易用性、灵活性以及庞大的生态圈也令越来越多的人选择Python。但是对于初学者来说,如何正确输入中文常常成为一个问题。本篇文章从安装、常见问题解决、…

LeetCode 560 和为 K 的子数组

LeetCode 560 和为 K 的子数组 来源:力扣(LeetCode) 链接:https://leetcode.cn/problems/subarray-sum-equals-k/description 博主Github:https://github.com/GDUT-Rp/LeetCode 题目: 给你一个整数数组 …

ChatGPT的4个不为人知却非常实用的小功能

今天重点介绍四个ChatGPT很实用的小功能。 一、停止生成 如果在ChatGPT输出内容的过程中,我们发现结果不是自己想要的,可以直接点击“Stop generating”按钮,这样它就会立即停止输出。 二、复制功能 在ChatGPT返回对话的右侧,有三…

在vue中集成高德地图amap-jsapi-loader

前往高德地图开发平台高德开放平台 | 高德地图API 一:申请高德key 去高德官网去创建一个属于自己的地图应用 (得到key和秘钥) 。 首先,我们要注册一个开发者账号,根据实际情况填写,身份写个人:…

制作嵌入式busybox rootfs系统

1、busybox下载 BusyBox 此篇使用版本BusyBox 1.31.1 (stable) 2、设置交叉编译环境变量 source environment-setup-aarch64-poky-linux或者其他架构的编译链工具 3、busybox编译设置 cd busybox-1.31.1 修改根目录Makefile中的CROSS_COMPILE和ARCH参数 比如ARCH ? ar…

Flask-RESTful的使用

Flask-RESTful的使用 Flask-RESTful基本使用安装定义资源Resources创建API实例添加资源到API运行Flask应用 请求处理请求解析参数校验 响应处理数据序列化定制返回格式 其他功能蓝图装饰器集合路由命名规范路由名称 Flask-RESTful Flask-RESTful是一个用于构建RESTful API的扩展…

中台分类

大家好,我是易安,之前我们谈到过中台的概念,以及如何落地中台。今天我就带你一起看一看,行业常见的中台分类。 业务中台与数据中台 业务中台 业务这个词,其实是有些宽泛的,我听到很多人口中说的业务都不是…

RK3588平台开发系列讲解(驱动基础篇)设备树常用 of 函数

平台内核版本安卓版本RK3588Linux 5.10Android 12文章目录 一、查找节点的 of 函数二、获取属性值的 of 函数三、实验示例3.1、查找的节点代码3.2、获取属性内容代码沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 设备树描述了设备的详细信息,这些信息包括数字类型的…

Web安全神器-Burpsuite社区版/专业版下载、安装及使用教程

一、Burpsuite下载 Burp Suite是进行Web应用安全测试的一个集成平台,无缝融合各种安全工具并提供全面的接口适配,支持完整的Web应用测试流程,从最初的映射和应用程序的攻击面分析到发现和利用安全漏洞等领域均适用,同时还可以做抓…

TYAN 于Computex2023 展示支持第四代英特尔至强可扩展处理器的新款服务器

【台北讯2023年5月30日】隶属神达集团,神雲科技旗下服务器通路领导品牌TYAN(泰安),于2023 台北国际计算机展(Computex 2023)5月30日至6月2日展览期间,在台北世贸南港展览1馆4楼 M0701a摊位展示最…

pyest+appium实现APP自动化测试

目录 01、appium环境搭建 2、搭建pythonpytestappium环境 3、安装pycharm搭建项目编写脚本 4、执行测试 绵薄之力 01、appium环境搭建 安装nodejs http://nodejs.cn/ 为什么要安装nodejs? 因为appium这个工具的服务端是由nodejs语言开发的 安装jdk&#x…

设计模式之~工厂系列

目录 简单工厂模式 工厂方法模式 简单工厂 VS 工厂方法 抽象工厂模式: 拓展: 利用简单工厂模式优化抽象工厂 利用反射抽象工厂 进行优化 反射配置文件抽象工厂进行优化 简单工厂模式 优点:简单工厂模式的最大优点在于工厂类包含…

基于深度学习的高精度家禽猪检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度家禽猪检测识别系统可用于日常生活中或野外来检测与定位家禽猪目标,利用深度学习算法可实现图片、视频、摄像头等方式的家禽猪目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5目标检…

函数(C语言程序设计)

目录 一、函数定义 二、函数调用 三、递归函数 四、局部变量和全局变量 一、函数定义 1、无参函数的定义 类型名 函数名() /*函数首部*/ { 函数体 } 或 类型名 函数名(void) /*函数首部*/ { 函数体 } void类型的函数不…

玻璃制品行业丨外贸业务管理难点及解决方案

玻璃作为一种重要的建筑材料,在国际贸易中一直占有一定的份额。随着国外市场需求量的不断增加,对玻璃制品的技术含量要求越来越高,需要在研发方面的投入也逐步加大。由于国际市场竞争激烈,想要做玻璃制品行业的外贸公司&#xff0…

Linux静态库文件

静态库的优点 不想让用户知道自己的代码实现,却又让用户使用功能,就将写好的代码放到库文件中(也可以减少每次源码进行编译的时间,.c文件到可执行文件需要时间)。方法如下 ar crv libtemp.a fitst.o second.o//demo …