时序必读论文06|PITS : 基于非依赖策略学习时序patch特征表示

news2024/11/13 10:11:14

图片

论文标题:LEARNING TO EMBED TIME SERIES PATCHES INDEPENDENTLY

下载地址:https://arxiv.org/pdf/2312.16427v1.pdf

开源代码:https://github.com/seunghan96/pits

前言

之前的文章我们读了Patch TST,建议大家阅读原论文,毕竟是基础,我的论文解读放在下方。

客观讲,Patch方法目前在时间序列领域几乎等同于attention,用了确实比没用好。这篇文章就是继patch TST之后的另一篇,但从题目名字可以看出该文章工作重点是学习patch的特征表示方法。

具体来说,作者对比了 patch independent和patch dependent 两种方法,所产生的特征的优劣。按照作者说法,patch independent 方法结构简单、参数少,效果好。

patch 依赖和独立

理解这个任务,首先要知道为什么对时间序列数据进行patch后,还有依赖和独立一说。这是因为大多数模型,包括patch TST在做预测的时候,为了提高特征表征能力,都增加了自监督表示学习策略。就像训练文本大模型一样,可以遮住一句话中的一些词,然后预测这些被遮住的词,或者用遮住的词预测其周围的词语。在PatchTST中,作者也是故意随机移除输入序列的一部分内容,并训练模型恢复缺失的内容。

  • patch dependent,PD:参考transformer,用周围patch预测被遮住patch,引入attention等交互机制。很好理解,因为对被遮蔽对象的预测依赖于周围的patch。重点:在本文中是预测被遮蔽的patch

  • patch independent,PI:基于重构策略,利用未被遮蔽的patch进行重构(reconstruction,或者说是预测)

按照作者的说法,在时间序列这一领域,预测被mask的patch是不必要的。通过实验其实可以发现,在PD任务上预训练的Transformer,在分布发生变化的情况下无法预测测试数据的,但在PI任务上预训练的模型表现出对此更为鲁棒的特性。换句话说,只需要用patch自己本身的信息就能实现预测,文中称之为patch independent建模。

下图对比了PI和PD方法的差别,PI方法(图2a左),只单独使用Linear或MLP,patch之间没有交互;PD方法,使用MLP-Mixer、Transformer结构融合不同patch信息,这里patch是有交互的。显然,PD方法参数量和模型结构更加复杂,且考虑到了上下文信息,按理说效果应该更好?

patch 依赖和独立

Patch Independence for Time Series,PITS

图片

本文的模型结构部分如图所示,由于摒弃了MLP- Mixer和Transformer,模型结构非常清晰(简单),就是Linear+MLP,核心就是编码然后重构。注意重构有两种策略:一种所有patch拼接后,过FC和MLP,然后重构;第二种是每个patch过FC和MLP,然后逐个重构,作者采用了第二种,即channel /Patch independent建模重构。

为什么说是channel /Patch independent?因为每个变量单独过MLP,多个变量共享MLP参数,同样的,每个patch单独过MLP,多个patch共享MLP参数。

对比学习

图片

按作者论文中的说法,对比学习主要用来学习patch之间的关系,分层次地捕捉相邻的时间序列信息,所以我个人认为“独立”也是相对而言的。

对比学习需要两个视图来生成正样本,作者通过如下遮蔽策略实现了这一点:mask掉50%的patch,将该序列及与其mask完全相反的序列作为两个视图,使用对比学习的目标进行优化。需要注意的是,遮蔽的目的是为了为对比学习生成两个视图;它不影响提出的补丁独立任务,并且在使用提出的补丁独立架构时不需要额外的前向传播,因此额外的计算成本可以忽略不计。

如上图所示,论文使用了一种层次建模方法进行对比学习,并计算每个层次上的最大池化和聚合损失。然后,模型学习在一个视图中找到缺失的补丁信息,通过将与另一个视图和其他视图的相似性进行对比,从而使模型能够层次化地捕捉相邻的时间序列信息,实现从细粒度到粗粒度的对比学习。

实验结果

从实验结果来看,本文提出的方法相对于最先进的基于Transformer的模型,在时间序列预测和分类性能上都有所提升,同时在参数数量、训练和推断时间方面更为高效。

图片


欢迎大家关注我的公众号【科学最top】,专注于时序高水平论文解读,回复‘论文2024’可获取,2024年ICLR、ICML、KDD、WWW、IJCAI五个顶会的时间序列论文整理列表和原文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2135698.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构修炼——顺序表和链表的OJ题练习

目录 一、顺序表相关OJ题1 移除元素题目解析 2 合并两个有序数组题目解析 二、链表相关OJ题1 移除链表元素题目解析 2 反转链表题目解析 3 链表的中间结点题目解析 4 合并两个有序链表题目解析 5 链表的回文结构题目解析 6 相交链表题目解析 7 环形链表的判断题目解析 8 环形链…

共享单车轨迹数据分析:以厦门市共享单车数据为例(四)

副标题:共享单车与地铁接驳距离探究——以厦门市为例 关于轨道交通站点接驳范围的研究早已屡见不鲜,通常认为以站点为圆心、800米作为地铁站直接的服务范围是合理的。近年来,随着轨道、公交和慢行交通三网融合概念的提出,慢行交通…

9.第二阶段x86游戏实战2-初识易语言

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 本次游戏没法给 内容参考于:微尘网络安全 工具下载: 链接:https://pan.baidu.com/s/1rEEJnt85npn7N38Ai0_F2Q?pwd6tw3 提…

喜报 | 大势智慧荣获国家级专精特新重点“小巨人”企业荣誉称号

近日,湖北省经济和信息化厅发布了《关于2024年拟支持专精特新重点“小巨人”企业名单的公示》。武汉大势智慧科技有限公司(后简称“大势智慧”)凭借在实景三维AI领域的卓越技术表现和创新能力,成功上榜并通过公示期,荣…

预算不多怎么选一款开放式耳机?四款亲测好用的蓝牙耳机推荐

挑选开放式耳机可以从以下几个方面入手: 关注佩戴舒适度: 外观设计:开放式耳机有耳挂式、夹耳式等多种设计。耳挂式耳机通常佩戴较为稳固,适合运动时使用;夹耳式耳机相对轻便,但可能需要一定时间适应其佩…

多核DSP(6000系列)设计与调试技巧培训

​课程介绍: 为帮助从事DSP开发工程师尽快将DSP技术转化为产品,在较短时间内掌握DSP设计技术和问题的解决方法,缩短产品开发周期、增强产品竞争力、节省研发经费。我们特组织了工程实践和教学经验丰富的专家连续举办了多期DSP C6000的培训&a…

六氟化硫密度微水在线监测配套5孔M12格兰头航空插头插座

我们将为大家介绍如何使用六氟化硫密度微水在线监测配套5孔M12格兰头连接器。在本教程中,我们将向您展示简单易懂的步骤,让您轻松掌握。 所需材料: 1. 六氟化硫密度微水在线监测器 2. 5孔M12格兰头连接器 3. 电源线 4. 符合要求的电缆 5…

批量视频压缩需要怎么压缩?2024帮助你快速进行视频压缩的软件

批量视频压缩需要怎么压缩?2024帮助你快速进行视频压缩的软件 批量视频压缩是处理大量视频文件时常见的需求,特别是当你需要减小视频大小以便存储或上传时。以下是5款帮助你快速进行视频压缩的软件,它们操作简单,功能强大&#x…

三、k8s中的控制器的使用

一 什么是控制器 官方文档: 工作负载管理 | Kubernetes 控制器也是管理pod的一种手段 自主式pod:pod退出或意外关闭后不会被重新创建 控制器管理的 Pod:在控制器的生命周期里,始终要维持 Pod 的副本数目 Pod控制器是管理pod…

Java高级Day41-反射入门

115.反射 反射机制 1.根据配置文件re.properties指定信息,创建Cat对象并调用hi方法 SuppressWarnings({"all"}) public class ReflectionQuestion {public static void main(String[] args) throws IOException {//根据配置文件 re.properties 指定信息…

最新热点!结合创新!小样本学习+CLIP:超好上手的思路,爽发顶会顶刊

今天给大家推荐一个很好上手的创新思路:小样本学习CLIP。 这个思路的优势在于:通过利用CLIP模型强大的跨模态表征能力,再结合小样本学习技术,我们就可以在仅提供少量标注样本的情况下,快速适应新的任务,在…

elementui组件el-upload实现批量文件上传

el-upload组件上传文件时,每传一个文件会调一次接口,所以当上传多个文件的时候,有 n 个文件就要调 n 次接口。 刚好之前工作中遇到使用el-upload组件批量上传文件的需求,来看看怎么实现。 思路: 1.取消组件的自动上…

【C++】vector常见用法

🔥个人主页🔥:孤寂大仙V 🌈收录专栏🌈:C从小白到高手 🌹往期回顾🌹:[C]string类 🔖 流水不争,争的是滔滔不息。 文章目录 一、vector的介绍vector…

KubeCon China 回顾|快手的 100% 资源利用率提升:从裸机迁移大规模 Redis 到 Kubernetes

大家下午好,我是来自 ApeCloud 的吴学强,非常高兴能够在 KubeCon 做分享。今天的分享由我和来自快手的刘裕惺同学共同完成,我们分享的主题是将大规模的 Redis 实例从裸机迁移到 Kubernetes 上来提高资源的利用率。 我们今天的议题包括几个方…

价值流与核心理论框架对比解析:企业业务架构优化的全景指南

企业架构优化中的理论框架选择 随着数字化转型和全球竞争的加剧,企业管理者越来越意识到优化业务流程以提升竞争力的重要性。然而,在众多优化方法中,企业如何选择最适合自己的理论框架成为一大挑战。由The Open Group发布的《价值流指南》系…

配电房监控 配电柜监测系统方案简介@卓振思众

在当今迅速发展的电力行业中,配电柜监测系统的作用越来越受到重视。作为配电系统的核心组件,配电柜不仅承担着电力分配的关键任务,还面临着安全性和稳定性的重要挑战。为了确保电力供应的连续性和可靠性,配电柜监测系统应运而生&a…

鼎捷新一代PLM 荣膺维科杯 “2023年度行业优秀产品奖”

近日,由中国高科技行业门户OFweek维科网主办的“全数会2024(第五届)中国智能制造数字化转型大会暨维科杯工业自动化及数字化行业年度评选颁奖典礼”在深圳隆重举办。这不仅是中国工业自动化及数字化行业的一大品牌盛会,亦是高科技…

vue2基础系列教程之todo的实现及面试高频问题

关键知识点 v2里面,当在同一个元素或组件上同时使用v-for和v-if,v-for的权限高于v-if v-show和v-if的区别主要有 v-if是惰性的,v-show是及时的v-if值为false时,不会生成dom,v-show不管值是true或false,都会生成dom,修改的是dom的display属性…

画图方法总结

1、画两天线段的代码 #画图 import matplotlib.pyplot as plt from matplotlib import font_manager font_path simfang.ttf # 替换为实际的字体文件路径 font_prop font_manager.FontProperties(fnamefont_path, size12) # 设置字体大小 plt.figure() plt.plot(csv_data[…

标准库、HAL库、LL库

目录 举例理解 概念理解 标准库(Standard Peripheral Library,SPL) 2. HAL库(Hardware Abstraction Layer) 3. LL库(Low-Layer Library) 总结区别 如何选择 实际应用中的结合使用 代码…