文献阅读(48)—— 长序列time-series预测【Informer】

news2025/1/24 10:48:39

文献阅读(48)—— 长序列time-series预测【Informer】

文章目录

  • 文献阅读(48)—— 长序列time-series预测【Informer】
    • 先验知识/知识拓展
    • 文章结构
    • 文章方法
      • 1. 文章核心网络结构
        • (1) 传统意义上的transformer应用在LSTF上的局限
        • (2)informer的contributions
      • 2. 自注意力机制
      • 3. Encoder:支持在有限的内存空间处理输入长序列
      • 4. Decoder:一次性生成长序列预测输出值
        • (1)generative inference
      • 5. loss function
    • 文章结果
      • 1. 单变量长序列time-series预测
      • 2. 多变量长序列time-series预测
      • 3.模型参数的敏感性分析
      • 4. ProbSparse 自注意力机制
      • 5. 生成式的decoder设计
      • 6.整体计算性能
    • 总结
      • 1. 文章优点
      • 2. 文章不足
      • 可借鉴点/学习点?

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting
在这里插入图片描述
AAAI(被评为AAAI2021最佳!足见其内容和实力!)

先验知识/知识拓展

  • 现在很多模型对于短时间序列(未来几天,几个时间点)的预测性能还不错,但是当遇到长时间序列(未来一年甚至未来几年)模型的预测性能下降
  • 长序列长时间预测依赖于模型有较高的预测能力,这要求精确有效的捕获输入和输出之间长期的依赖关系
  • LSTM模型的性能与输入序列的长度呈负相关。随着输入序列长度的增加,模型的性能下降
    在这里插入图片描述

文章结构

  • 摘要
  • introduction
  • preliminary
  • methodology★
  • experiment★
  • results and analysis★
  • conclusions

文章方法

1. 文章核心网络结构

作者提出了以encoder-decoder为主要架构的Informer(看名字大家应该可以想到transformer了,是的,它的思想就是借鉴了transformer,很多地方的设计思想都源于transformer!)用于解决长序列时间序列预测(Long Sequence Time-series Forecasting) [LSTF]
在这里插入图片描述

(1) 传统意义上的transformer应用在LSTF上的局限

  • 自注意力机制导致时间复杂度达到L²
  • 当遇到长序列时,内存的利用率达到JL²,和序列长度的平常成正比——瓶颈!
  • 长期输出的速度慢!!效率低,传统的模型得到的输出类似于RNN是step-by-step 的(根据当下预测的结果去预测下一个结果,步步紧密依赖)
    在这里插入图片描述

(2)informer的contributions

  • ★ 提高了LSTF的预测性能,可以有效的捕捉到长期的输入和输出之间的依赖关系
  • 提出probsparse自注意力机制,时间复杂度和空间复杂度都为O(L log(L))
  • 提出了自注意力蒸馏,序列从(96——>48)逐渐缩小,使长序列也不受影响
  • 生成式的decoder,可以一次性输出未来的预测结果,代替了之前step-by-step的想法
    在这里插入图片描述
    在这里插入图片描述

2. 自注意力机制

  • 传统意义上的自注意力机制:
    在这里插入图片描述
    每个qkv都是一个矩阵,那么第i行的q的注意力可以写为:
    在这里插入图片描述
  • 作者发现在矩阵中很多位置之间是没有必然联系的,就出现了长尾现象。(只有少数点之间有相关性,绝大部分点都没有很大的关联性的。)因此作者提出了一个概念就是针对这种现象,主需要找到那些具有强相关性的q,对其进行自注意力机制,对于那些没有必然联系的q,直接赋值为平均值。
  • 因为是分布,所以这个地方引入KL散度来衡量两个分布的相似性,对于和平均有很大差异的q进行自注意力机制的计算,和平均没有明显差异的直接赋平均值
    在这里插入图片描述
  • 根据上述提到的这种方法,精简后的自注意力机制为:
    在这里插入图片描述

3. Encoder:支持在有限的内存空间处理输入长序列

  • encoder用于提取长序列输入的依赖性
  • 自注意力蒸馏:encoder特征作为ProbSparse 自注意力机制的输出,encoder生成的特征是和value值做相关后的结果
  • 使用蒸馏的方式减少了输入序列的长度(96变48)(使用maxpooling)
    在这里插入图片描述
    就很奇妙!

4. Decoder:一次性生成长序列预测输出值

  • 使用generative inference缓解长序列预测速度下降的问题

(1)generative inference

  • decoder部分由两部分组成:start-token 和 target-token
    请添加图片描述
    可以理解为先教他学一会儿,剩下的自己生成。其中target-token是有时间戳的。

5. loss function

  • MSE
  • MAE
    不做详细介绍,关于loss可见之前的blog[几种常见的loss函数]

文章结果

1. 单变量长序列time-series预测

在这里插入图片描述

2. 多变量长序列time-series预测

在这里插入图片描述

3.模型参数的敏感性分析

从左到右依次是:

  • 输入长度(48和168)对预测长度的影响
  • ProbSparse 自注意力机制中控制信息的带宽
  • The Combination of Layer Stacking(这个我看文献没懂,我准备去源码中理解,看起老像是将两者拼接的程度系数)
    在这里插入图片描述

4. ProbSparse 自注意力机制

在这里插入图片描述

5. 生成式的decoder设计

在这里插入图片描述

6.整体计算性能

在这里插入图片描述

总结

1. 文章优点

  • 能发在AAAI上已经是最大最亮的优点了吧!!够亮了!!
  • encoder部分分析了长尾问题,提出了一个稀疏性的自注意力机制。找到相关性大的重点关注,其他部分赋予平均值
  • decoder部分使用部分已知值作为结果的一部分
  • 文章写的真的很好,大家都去给我读!!

2. 文章不足

  • 小趴菜不配评论

可借鉴点/学习点?

  • 全篇都值得我学!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/396896.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构4——线性表3:线性表的链式结构

基本概念 ​ 链式存储结构用一组物理位置任意的存储单元来存放线性表的数据元素。 ​ 这组存储单元既可以是连续的又可以是不连续的甚至是零散分布在任意位置上的。所以链表中元素的逻辑次序和物理次序不一定相同。而正是因为这一点,所以我们要利用别的方法将这些…

Kafka消息中间件(Kafka与MQTT区别)

文章目录KafkaKafka重要原理Topic 主题Partition 分区Producer 生产者Consumer 消费者Broker 中间件Offset 偏移量Kafka与mqtt区别Kafka Kafka是一个分布式流处理平台,它可以快速地处理大量的数据流。Kafka的核心原理是基于发布/订阅模式的消息队列。Kafka允许多个…

C++基础——C++面向对象之重载与多态基础总结(函数重载、运算符重载、多态的使用)

【系列专栏】:博主结合工作实践输出的,解决实际问题的专栏,朋友们看过来! 《QT开发实战》 《嵌入式通用开发实战》 《从0到1学习嵌入式Linux开发》 《Android开发实战》 《实用硬件方案设计》 长期持续带来更多案例与技术文章分享…

MySQL8.0.16存储过程比5.7.22性能大幅下降

MySQL8.0.16存储过程比5.7.22性能大幅下降 1、背景 从5.7.22迁移数据库到8.0.16,发现存储过程执行性能大幅下降。原来在5版本上执行只需要3-5秒,到8版本上居然要达到上万秒。 5版本: call Calculation_Week() OK 时间: 3.122s 8版本&#x…

移动通信(16)信号检测

常见的信号检测算法一般包括以下几类检测算法:最优、线性和非线性。最优检测算法:最大似然算法线性检测算法:迫零检测算法和最小均方误差检测算法非线性检测算法:串行干扰消除检测算法球形译码检测算法属于一种次优检测算法&#…

凤凰游攻略

凤凰游攻略1 装备📦1.1 证件1.2 日常用品1.3 药品1.4 衣物1.5 洗漱用品2 交通🚗3 住宿🏠4 美食🍕5 拍照📷5.1 租苗族服5.1.1 单租服装5.1.2 服装化妆5.2 一条龙旅拍6 路线🗺️景点🏙️7 注意⚠️…

计算机网络的166个概念你知道几个 第十二部分

计算机网络安全安全通信的四大要素:机密性、保温完整性、端点鉴别和运行安全性。机密性:报文需要在一定程度上进行加密,用来防止窃听者截取报文。报文完整性:在报文传输过程中,需要确保报文的内容不会发生改变。端点鉴…

java StringBuilder 和 StringBuffer 万字详解(深度讲解)

StringBuffer类介绍和溯源StringBuffer类常用构造器和常用方法StringBuffer类 VS String类(重要)二者的本质区别(含内存图解)二者的相互转化StringBuilder类介绍和溯源StringBuilder类常用构造器和常用方法String类,St…

0308java基础-注解,反射

一,注解 1.什么是注解: Annotation是从jdk5.0开始引入的新技术作用: 不是程序本身,可以对程序作出解释可以被其他程序读取格式: 以注释名在代码中存在,还可以添加一些参数值SuppressWarnings(value"…

0103 MySQL06

1.事务 1.一个事务其实就是一个完整的业务逻辑 如:转账,从A账户向B账户转账10000,将A账户的钱减去10000(update),将B账户的钱加上10000(update),这就是一个完整的业务逻…

【Mybatis】| 如何创建MyBatis的工具类

目录🌟更多专栏请点击👇一、前言二、实现过程1. 创建一个ThreadLocal对象2. 初始化SqlSessionFactory3. 获取并存储sqlSession对象4. 关闭sqlSession对象三、 总代码🌟更多专栏请点击👇 专栏名字🔥Elasticsearch专栏e…

向2022年度商界木兰上榜女性致敬!

目录 信息来源: 2022年度商界木兰名单 简介 评选标准 动态 榜单 为你心中的2023商界女神投上一票 信息来源: 2022年度商界木兰榜公布 华为孟晚舟获商界木兰最高分 - 脉脉 【最具影响力女性】历届商界木兰榜单 中国最具影响力的30位商界女性名单…

基于Vue+Vue-cli+webpack搭建渐进式高可维护性前端实战项目

本文是专栏《手把手带你做一套毕业设计毕业设计》的实战第一篇,将从Vue脚手架安装开始,逐步带你搭建起一套管理系统所需的架构。当然,在默认安装完成之后,会对文件目录进行初步的细化拆分,以便后续功能迭代和维护所用。…

经典100道mysql的面试题

100道mysql的面试题 目录100道mysql的面试题1. MySQL 索引使用有哪些注意事项呢?索引哪些情况会失效索引不适合哪些场景索引的一些潜规则2. MySQL 遇到过死锁问题吗,你是如何解决的?3. 日常工作中你是怎么优化SQL的?4. 说说分库与…

字体反爬慢慢总结破解方式

什么是字体反爬 网页开发者自己创造一种字体,因为在字体中每个汉字都有其代号,那么以后再网页中不会直接显示这个文字的效果。而是显示其代号,因此即使获取了网页的文本内容。也只是获取到文字的代号,而不是文字本身。 简单来说&…

逻辑优化基础-shannon decomposition

1. 简介 在逻辑综合中,香农分解(Shannon decomposition)是一种常用的布尔函数分解方法。它将一个布尔函数分解为两个子函数的和,其中每个子函数包含一个布尔变量的取反和非取反的部分。 具体来说,假设对于一个布尔函…

Mysql 索引特点

承接上文Mysql Server原理简介聚簇索引、二级索引、联合索引分别具备什么样的特点?聚簇索引数据跟索引放在一起的叫聚簇索引;数据和索引分开存储的叫非聚簇索引;innodb存储引擎,数据和文件都放在ibd文件中,实际的数据是…

在教学中常被问到的几个vue3.x与typescript的问题,统一解答

在教学当中,学生在学习vue3.x时,常常会问到typescript和vue3.x之间的关系,感觉这两个技术总是绑在一起的,下面老赵来统一解答一下: 那学vue3.x,为什么要求也要掌握typescript Vue 3.x是一个使用TypeScript编…

「ML 实践篇」机器学习项目落地

文章目录1. 项目分析1. 框架问题2. 性能指标2. 获取数据1. 准备工作区2. 下载数据3. 查看数据4. 创建测试集3. 数据探索1. 地理位置可视化2. 寻找相关性3. 组合属性4. 数据准备1. 数据清理2. Scikit-Learn 的设计3. 处理文本、分类属性4. 自定义转换器5. 特征缩放6. 流水线5. 选…

Linux入门介绍及Linux文件与目录结构

前言 本文小新为大家带来 Linux 入门介绍及Linux 文件与目录结构 相关知识,具体内容包括Linux入门介绍(包括:Linux概述,Linux与Windows区别,CentOS 下载地址),Linux文件与目录结构等进行详尽介绍…