【论文下饭】PatchTST中的channel-independence

news2024/11/24 11:59:57

PatchTST中的channel-independence

  • 总结
    • Patching
    • Channel-independence

A Time Series is Worth 64 Words: Long-term Forecasting with Transformers
时间:2022
引用:8 ICLR 2023
代码:https://github.com/yuqinie98/PatchTST
中文参考:
A Time Series is Worth 64 Words(PatchTST模型)论文解读
Transformer在时间序列预测中不如线性模型?ICLR 2023最新回复来了!
Nie Y, Nguyen N H, Sinthong P, et al. A Time Series is Worth 64 Words: Long-term Forecasting with Transformers[J]. arXiv preprint arXiv:2211.14730, 2022.

总结

文中提出两点创新点:
(1)Patching
(2)Channel-independence

Patching

因为时间序列,某个时间步前后时刻的值十分接近,所以可以使用patching聚合。
good:

  • 减少了训练时GPU内存的占用
  • 可以使得模型看到更长的历史序列,提高了预测的性能。

bad:

  • 损失了时间序列的分辨率,也就是说颗粒度更大了。

Channel-independence

将时间序列的每个变量单独考虑,即单独送入Transformer中。
good:

  • 作者说,能减少过拟合的发生。但博主认为,Channel-independence相当于变相增加了训练的数据。

bad:

  • 缺少了序列变量之间的交互,这对于某些下游任务来说,可能是十分重要的。

1. 模型总览
在这里插入图片描述

图1 PatchTST结构总览。

2. 数据集

在这里插入图片描述


以下内容为论文附录中提及的Channel-independence的好处:

3. 消融实验

B - batch size.
M - number of variables.
N - number of patches.
P - patch size.
S - patch stride.
  • Only channel-independence: P(patch的长度)和S(patch的步长)设置为1。
  • Only patching:改变输入格式。BM x N x P -> B x N x MP。namely channel-mixing with patching.
  • Original TST: 指的是TST KDD2021。

Channel-independence的优势:
(1)Adaptablity:每个(变量的)时间序列都分别输入Transformer中,每个时间序列都有自己的Attention Map。这意味着不同的时间序列可以学习到不同的注意力模式。而Channel-mixing的方法,所有的序列都共享相同的注意力模式,这有可能是对性能有害的,因为每个变量的时间序列可能有自己不同的行为模式。

图6 揭示了有趣的现象,不相关的时间序列的预测 依赖于 不同的注意力模式,while 相似的序列可以产生相似的(注意力)图。

(2)Channel-mixing需要更多的训练数据来达到 channel-independence的性能表现。学习 不同channel之间的相关性 的灵活性 也是一把双刃剑,因为它需要更多的数据来学习不同channel、不同时间步之间的信息。然而,channel-independence的模型只需要关注 时间轴 上的信息即可。
为了验证这个假设,我们进行了实验。使用不同训练数据大小,如图7。可以很明显看到,channel-independence的方法随着训练数据的增加,收敛更快。我们广泛使用的这些数据集(Table 2所示),可能对于有监督学习来说,都太小了。

(3)Channel-independence的模型更不同过拟合。如图7,Channel-mixing的模型很快就过拟合了,而Channel-independence的模型却不会。

Channel-independence更多的技术优势:
(1)可以学习不同序列间的空间相关性:尽管我们没有在这篇文章中做充足的研究,但Channel-independence的设计可以自然的扩展到学习cross-channel的关系(使用比如图神经网络的方法)。
(2)多任务学习的损失函数 可以添加到不同的时间序列中。
(3)对噪声的容忍性:如果噪声在某一个序列中处于主导地位,那么这个噪声将会被映射到其他序列的隐空间中(如果使用channel-mixing的方法)。Channel-independence的方法可以缓解这种情况,通过在noisy channels中重新训练这个noisy.(?)

Channel independence can mitigate this problem by only retaining the noise in these noisy channels. We can further alleviate the noise by introducing smaller weights to the objective losses that associate with noisy channels.

请添加图片描述

图6 截取了一部分

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/555460.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件开发人技能变现方案来啦~

java单体服务Uniapp客户端 欢迎大家来关注java单体服务Uniapp客户端模式开发应用程序这个模式下产品的特点互联网大厂产品特点小服务小产品-存在价值普通人慢慢挣小钱 欢迎大家来关注 你好! 这可能是你第一次来“莹未来”这里,郑重欢迎您。如果你想学习…

firewalld防火墙详细介绍

目录 一、firewalld概述 二、firewalld与iptables的区别 1.位置不同 2.配置存储位置不同 3.规则运行不同 4.防火墙类型不同 三、firewalld区域的概念 四、firewalld防火墙9个区域 1、trusted(信任区域) 2、public(公共区域&#xf…

JavaScript中的tab栏切换制作(排他思想)

文章目录 实现效果图排他思想tab栏切换制作思路代码部分 实现效果图 整个页面分为2个部分,tab_list部分(上半部分)和tab_con部分(下半部分) tab_list部分包含5个li,它们分别与tab_con部分的5个div盒子一一…

Eyeshot Fem 2023.1 你选Fem还是Ultimate Crack

Eyeshot Fem--当然选Fem Everything in Ultimate, plus Geometry meshing and Finite Element Analysis. Scope Modules Image Gallery Features Scope Eyeshot Fem edition is designed for Geometry meshing and Finite Element Analysis. Modules Geometric modules includ…

《终结拖延症》重新拥有计划每天的自信和控制力

关于作者 威廉区瑙斯, 美著名心理治疗 专家 , 拥有 超过 30 年 心的 理治疗 经 ,验 他 专 精的研究 领域 , 是 为 代 都 市 群提 供负 面 心 理 引 导 和 治疗 , 比 如 抑郁 、 心 理 亚健 康 、 拖 延 症 等 等 。 除…

redis未授权访问漏洞利用+redis日志分析

redis未授权访问漏洞利用redis日志分析 redis未授权访问 远程连接redis kali: redis-cli -h IP redis常用语句 set key “value” 设置键值对 get key 获得值 incr intkey 数字类型值加1 keys * 获取当前数据库中所有的键 config set dir /home/test 设置工作目录 config set…

VMware ESXi 6.5 U3 Final - ESXi 6 系列最终版下载

VMware ESXi 6.5 U3 Final - ESXi 6 系列最终版下载 VMware ESXi 6 Standard 请访问原文链接:https://sysin.org/blog/vmware-esxi-6/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org VersionRelease NameRelease …

weblogic CVE-2014-4210 SSRF漏洞

CVE-2014-4210 SSRF漏洞 Weblogic 中存在一个SSRF漏洞,利用该漏洞可以发送任意HTTP请求,进而可以攻击内网中Redis、Fastcgi等脆弱组件 该漏洞存在于/uddiexplorer/SearchPublicRegistries.jsp SSRF:服务端请求伪造,伪造存在该漏洞…

Spring : XML配置 JavaBean源码解析

文章目录 前言一、xml 加载 Bean 对象总结XML加载Bean对象 前言 跟着大佬走!!!! https://github.com/DerekYRC/mini-spring 提示:以下是本篇文章正文内容,下面案例可供参考 一、xml 加载 Bean 对象 大家先…

企业型OV,增强型EV证书开通审核流程

选购 OV、EV型证书需要是企业用户,申请过程中需要提交企业资料。 选择证书品牌及型号 管理中心补全审核资料 下载“确认函”签字盖章并扫描,再上传。 审核部门联系确认企业信息,(过需要7-10个工作日) 审核通过&…

单商户高级版商城系统v2.3.0更新啦~

​likeshop单商户高级版商城系统更新至v2.3.0版本~主要更新内容如下: 新增 商品增加限购功能 小程序新版本更新提示 商品分类创建后可以显示该分类下有多少商品 积分商品列表新增封面图 商品支持批量移动分类 后台产品正版检测 优化 分销功能关闭时&#xff…

网络安全 2023 年为什么如此吃香?事实原来是这样....

前言 “没有网络安全就没有国家安全”。当前,网络安全已被提升到国家战略的高度,成为影响国家安全、社会稳定至关重要的因素之一。 网络安全行业特点 1、就业薪资非常高,涨薪快 2021年猎聘网发布网络安全行业就业薪资行业最高人均33.77万…

机器学习基础知识之预测性能评价指标

文章目录 预测性能评价思路1、均方误差(Mean Square Error,MSE)2、均方根误差(Root Mean Square Error,RMSE)3、平均绝对误差(Mean Absolute Error,MAE)4、平均绝对百分比…

多线程-线程创建方式1:继承Thread类

线程创建方式1:继承Thread类 概述 Java语言的JVM允许程序运行多个线程,使用java.lang.Thread类代表线程,所有的线程对象都必须是Thread类或其子类的实例。Thread类的特性 每个线程都是通过某个特定Thread对象的run()方法来完成操作的&#…

LeetCode:1049.最后一块石头的重量II 494.目标和 474.一和零

1049.最后一块石头的重量II 题目 有一堆石头&#xff0c;用整数数组 stones 表示。其中 stones[i] 表示第 i 块石头的重量。 每一回合&#xff0c;从中选出任意两块石头&#xff0c;然后将它们一起粉碎。假设石头的重量分别为 x 和 y&#xff0c;且 x < y。那么粉碎的可能…

pygam第5课——自制音乐播放器

前言&#xff1a;前几节课我们已经学会了很多知识点&#xff0c;欢迎大家可以去考古一下 今天我们将学习加载音乐&#xff0c;并且自制一个音乐播放器&#xff0c;界面功能包括&#xff1a; 加载背景封面上一首开始\暂停下一首重播随机播放快进 效果展示(GIF所以你们听不到声…

day6 广播及实现

什么是广播 数据包发送方式只有一个接受方&#xff0c;称为单播 如果同时发给局域网中的所有主机&#xff0c;称为广播 只有用户数据报(使用UDP协议)套接字才能广播 广播地址&#xff1a; 一个网络内主机号全为1的IP地址为广播地址 发到该地址的数据包被所有的主机接收 255…

MT6833(天玑 700)处理器参数_芯片规格_性能介绍

MT6833&#xff08;天玑700&#xff09;是一款出色的基带处理器&#xff0c;具有许多优秀的功能&#xff0c;并且采用了强大的八核CPU&#xff0c;其中包括两个主频高达2.2GHz的Arm Cortex-A76核心。此外&#xff0c;他还配备了LPDDR4X内存和UFS 2.2存储&#xff0c;大大提高了…

MyBatis中的#{}和${}有什么区别?

首先#{} 和 ${} 都是参数占位符&#xff0c;其中#{}是预编译处理&#xff0c;${}是字符直接进行替换。预编译处理是指&#xff1a;MyBatis 在处理#{}时&#xff0c;会将 SQL 中的 #{} 替换为?号&#xff0c;使⽤ PreparedStatement 的 set ⽅法来赋值。直接替换是指MyBatis 在…

【谷粒商城笔记】2. 创建项目与运行

1. 创建微服务项目 共分为下面五个 商品服务product 存储服务ware 订单服务order 优惠券服务coupon 用户服务member 1.1 新建github/gitee项目 首先去github新建项目 在IDEA中导入项目 从版本控制(Version Control)新建Project 选择路径和git链接 1.2 创建微服务 新建…