引言

在以往的时序预测中，大部分使用的是基于统计和机器学习的一些方法。然而，由于深度学习在时间序列的预测中表现并不是很好，且部分论文表述，在训练时间方面，用 Transformer、Informer 、Logtrace 等模型来做时间序列预测的效果甚至不如通过多层感知机与线性回归做加权。

基于以上背景，近年来，学术界针对时间序列的特点，设计了一系列的深度学习架构模型。本篇文章将介绍 N-BEATS、N-BEATSx、N-HiTS、FEDformer 以及 DeepTiMe 五个最新深度学习架构模型。

模型介绍

N-BEATS 与 N-BEATSx 是加拿大一家公司最先提出。N-HiTS 是在 N-BEATS 的基础上做了一些改进。FEDformer 是由阿里达摩院发表一个基于傅立叶变换和小波变换用于深度模型做提取特征工作的模型。DeepTiMe 是利用元学习的思想，在非常简单的神经网络上结合随机傅立叶特征即可取得很好的预测效果。

N-BEATS

在时间序列预测当中，算法大致分为基于回归与基于分解两大类。N-BEATS 则是一种基于时间序列分解的算法。

基于学界以及工业界的应用经验，在时间序列预测中，分解算法会更加鲁棒。因此，如何将上述分解思想应用与深度学习之中，是这篇文章的一个重要出发点，另一个出发点则是解决针对深度学习在做时间序列预测时所面临的可解释性不强等问题。

下图为 N-BEATS 模型的整体网络架构。可以明显看出 N-BEATS 属于分类模型，即该模型是将神经网分成单个 Stack。如图所示， N-BEATS 模型的神经网络被分成了 M 个 Stack，每一个 Stack 两个输出值，一个向右传递值和一个向下传递值。最终，汇总每一个 Stack 向右传递的值便作为该模型的综合输出。此时，每一个 Stack 输出结果便可以看成每一个 Stack 上时间序列预测的结果。此外，每一个 Stack 由很多个 Block 组成，Block 与 Block 之间连接方式为残差连接，每个 Block 使用的是全连接神经网络。

在这里插入图片描述

为解决深度学习在做时间序列预测时可解释性不强的问题，该模型作者采用了两种方法。如下图所示，假设该模型只设计两个 Stack，一个 Stack 用于输出该模型的趋势，另一个 Stack 用于输出该模型的周期。在 Stack 用于输出趋势时，该 Stack 输出的值作为多样式的系数，随后用该多样式函数来拟合它的趋势。相对来说，这种方法是较为原始的。

在这里插入图片描述

在Stack 用于输出周期时，该 Stack 输出的值作为傅立叶级数的系数。

在这里插入图片描述

最后，将上述两个值加起来，即可得到整个网络的输出。反之，如果预测趋势出现问题，则有可能为第一个 Stack 出问题，如果预测周期出现问题，则有可能是第二个 Stack 出问题。

下图为 N-BEATS 模型在 M4、M3 以及其他数据集上的一些表现。可以看出，相比与深度学习、时间序列等其他模型，N-BEATS 模型在部分指标下的结果是较为显著的。

在这里插入图片描述

N-BEATSx

由于 N-BEATS 只能进行单指标时间序列预测的问题，因此，N-BEATSx 在 N-BEATS 的基础上对神经网络做了部分改动以实现多指标时间序列预测。即在预测过程中，输入的值不局限于时间序列，也可以是外部变量，以此实现多对一的预测。如下图所示，N-BEATSx 模型的网络架构与 N-BEATS 基本一致，没有出现额外的变化。即 N-BEATSx 可以理解为加了外部变量的 N-BEATS。

在这里插入图片描述

如下图所示，左侧是未输入外部变量的 N-BEATS，残差较大。右侧是加了外部变量的 N-BEATSx，预测结果更准确。

在这里插入图片描述

N-HiTS

N-HiTS 与前两个模型的网络结构一致，不同点在于在 Stack 方面，N-HiTS 是通过多重采样的方式将时间序列分成高频和低频。若时间序列如下图左上角所示，例如，可以通过每隔100个点采样一次的方式得到低频采样信息。为实现与其他时间序列对齐并各个预测结果相加，随后做插值。此外，如需获取高频采样信息，只需将采集频次提高即可。

信息采集完成后，传递至每个 Stack 中，随后进行预测。如果发现预测趋势出现问题，则可通过分析低频、高频信息的方式定位问题根源。

在这里插入图片描述