机器学习周报第33周

news2025/1/11 9:50:41

目录

  • 摘要
  • Abstract
  • 一、文献阅读
    • 1.1 论文标题
    • 1.2 论文摘要
    • 1.3 论文背景
    • 1.4 过去研究
    • 1.5 论文介绍
      • 1.5.1 论文模型
      • 1.5.2 时空交互学习模块(Spatiotemporal Interactive Learning Module)
      • 1.5.3 动态图推理模块(Dynamic Graph Inference Module)
      • 1.5.4 动态图卷积模块(Dynamic Graph Convolution Module)

摘要

本周学习了一篇基于STFGNNs的多变量时间序列预测的论文,论文的模型为DSTIGNN(动态时空交互图神经网络),主要包括如下四个模块:时空交互学习模块(Spatiotemporal Interactive Learning Module)、动态图推理模块(Dynamic Graph Inference Module)、动态图卷积模块(Dynamic Graph Convolution Module)以及输出模块(Output Module)。动态图推理模块通过融合两类异构信息对变量之间的动态空间关联进行建模,并与动态图卷积模块相结合,在空间维度上进行信息传播。同时,利用下采样操作和多个样本卷积模块联合捕获多分尺度时间相关性。随后,这些模块被集成到一个时空交互学习框架中,实现了时间和空间特征的同步捕获。在6个基准数据集上进行了大量实验,实验结果表明,DSTIGNN表现出了最先进的性能。

Abstract

This week, We learned a paper on multivariate time series forecasting based on STFGNNs. The model of the paper is DSTIGNN (Dynamic Spatio-Temporal Interaction Graph Neural Network), which mainly includes the following four modules: Spatiotemporal Interactive Learning Module, Dynamic Graph Inference Module, Dynamic Graph convolution module Convolution Module) and Output Module. The dynamic graph inference module models the dynamic spatial association between variables by fusing two types of heterogeneous information, and combines it with the dynamic graph convolution module to propagate information in the spatial dimension. At the same time, the down-sampling operation and multiple sample convolution modules are used to jointly capture the multi-subscale temporal correlation. Subsequently, these modules are integrated into a spatio-temporal interactive learning framework, which enables the simultaneous capture of temporal and spatial features. Extensive experiments are conducted on six benchmark datasets, and the experimental results show that DSTIGNN exhibits the state-of-the-art performance.

一、文献阅读

1.1 论文标题

Dynamic spatiotemporal interactive graph neural network for multivariate time series forecasting

1.2 论文摘要

多变量时间序列(MTS)预测对于复杂现实现象的决策具有重要意义。然而,变量内部的非线性时间相关性和变量之间的动态空间相关性使得准确的MTS预测具有挑战性。目前,有许多研究人员构建了各种时空图神经网络(spatiotemporal graph neural networks,STGNNs)并将其应用于该领域。然而,现有的方法大多使用单一类型的信息构建图结构,并分别捕获时间和空间特征。这些因素会导致模型无法提取完整的时空特征,从而限制其性能。为克服这些限制,本文提出动态时空交互图神经网络(DSTIGNN),一种用于MTS预测的新型STGNN。所提出的动态图推理模块(dynamic graph inference module,DGIM)通过融合两类异构信息对变量之间的动态空间关联进行建模,并与动态图卷积模块(dynamic graph convolution module,DGCM)相结合,在空间维度上进行信息传播。同时,利用下采样操作(downsampling operations)和多个样本卷积模块(sample convolution modules,SCM)联合捕获多分尺度时间相关性。随后,这些模块被集成到一个时空交互学习框架中,实现了时间和空间特征的同步捕获。在6个基准数据集上进行了大量实验,实验结果表明,DSTIGNN表现出了最先进的性能。

1.3 论文背景

多变量时间序列(MTS)预测的目标是通过揭示历史数据之间的模式和关系来预测未来数据。数据科学和人工智能技术的进步,将MTS预测提升为数据驱动决策和优化的重要工具。MTS预测广泛应用于能源、天气、交通等领域,包括电力负荷预测、天气预测、交通流量预测等。准确的MTS预测对于使个人能够做出明智的决定和驾驭不确定的未来至关重要。MTS预测的困难在于捕获每个变量内在的非线性时间相关性。必须充分考虑多个变量之间的相互作用和影响,这种相关性可能会随着时间的推移而变化。近年来,深度学习因其能够从数据中自动学习最优的特征表示而得到迅速普及。许多研究人员开始构建基于深度学习的方法,用于MTS预测领域的应用。例如,有许多方法结合了循环神经网络(RNNs)和卷积神经网络(CNNs),以捕获变量内的时间相关性和变量之间的空间相关性。然而,CNN具有全局聚合属性,阻止了它们捕获变量之间的成对依赖关系,这可能会限制模型的性能。最近,图神经网络(GNNs)的出现能够用来解决这个问题。GNN将MTS中的每个变量视为图结构中的一个节点,变量之间的成对依赖关系视为图结构中的边。然后通过图结构进行信息传播,允许每个节点与其相邻节点交互并学习其特征表示。因此,许多研究人员开始将GNNs与其他深度神经网络结合在专用时空图神经网络(STFGNNs)中以提高模型的预测性能。

1.4 过去研究

目前,STGNNs可以根据其架构和构造的图结构进行分类。从STGNNs的架构来看,这些网络通常将GNNs与注意力机制(Attention)、CNN或RNN相结合,以捕获MTS中的时空依赖关系。然而,与基于CNN和基于RNN的方法相比,这种方法在捕获短期依赖方面相对较低效,并且可能受到内存和计算资源的限制。基于CNN的方法通常使用时间卷积网络(TCN)来有效捕获数据中的时间依赖关系,然后将其与以串行或并行方式捕获空间依赖关系的GNN相结合以预测MTS。然而,这些方法忽略了时间和空间特征之间的相互作用,潜在地削弱了时空相关性。基于循环神经网络的方法通常使用循环神经网络及其变体,长短期记忆网络(LSTM)和门控循环单元(GRU)可以有效地提取时间特征。这些方法通常将GNN嵌入到RNN单元中,以同步捕获空间和时间依赖关系。基于RNN的方法考虑了时空特征之间的相互作用,但可能面临梯度爆炸或消失等挑战。尽管现有方法在MTS预测任务中取得了很好的效果,但仍然存在一定的局限性。此外,这些方法在捕获时序依赖关系时往往忽略了时间序列的特性,如季节性和趋势性。在论文Spatial-Temporal Interactive Dynamic Graph Convolution Network for Traffic Forecasting中率先将时间序列的特性与时空交互学习相结合,在交通数据上取得了优异的预测性能。然而,他们的模型采用了单层结构,这在一定程度上限制了其对其他时间序列数据中可能存在的各种依赖关系的适用性。因此,设计一个灵活高效的模型,同时考虑时空交互学习和时间序列的特性,是一项具有挑战性的任务。无论STGNNs的架构如何,都需要建立信息传播的图结构。因此,构建一个合适的图结构也是非常重要的。

根据构造的图结构,STGNNs可以根据预定义图、自适应图(动态图)进行分类。基于预定义图的方法通常基于先验知识或单一规则构建图结构,如空间距离、Pearson相关系数、动态时间规整(dynamic time warping)等。虽然这些预定义的图可以在一定程度上反映节点之间的因果关系,但对于抽取节点之间的复杂关系还不够。自适应图的出现很好地解决了这个问题。它们对节点信息进行参数化,并自适应地学习变量之间的空间关系。然而,预定义图结构和自适应图结构都是静态的,缺乏建模节点之间动态空间关联的能力。如下图(a)所示,四条不同颜色的折线代表四个不同传感器处的交通流。从图中可以看出,节点间的空间关联随时间变化,每个时间步长的空间关联可以建模为图结构。这个问题促使研究人员构建动态图。论文Dynamic and Multi-faceted Spatio-temporal Deep Learning for Traffic Speed Forecasting通过分配三个节点嵌入矩阵和一个可学习的核心张量在每个时间步骤计算动态图。节点嵌入可以将节点映射为捕捉节点之间内在结构信息的潜在信息,通常以空间维度表示。论文Learning the Evolutionary and Multi-scale Graph Structure for Multivariate Time Series Forecasting使用膨胀卷积来提取序列内的多尺度时间相关性,然后在每一层网络中递归地构建演化动态图。虽然两组都取得了很好的效果,但它们只考虑了单一的信息来构建动态图。如下图(b)所示,每个传感器处的车流量不仅受到实时车流量的影响,还受到固定道路结构的影响。因此,需要将这两类异构信息结合起来建模动态空间关联。由于不同类型的异构信息可能会相互限制或排除,因此平衡这些信息是一个挑战。
在这里插入图片描述

1.5 论文介绍

为了克服这些挑战,本文提出了DSTIGNN。为了有效地建模动态空间关联,设计了一个新的动态图推理模块(DGIM),利用节点嵌入信息和动态输入信息来推断最优的动态图。同时,引入GRU层来平衡这两类异构信息。生成的动态图作为动态图卷积(DGCN)模块的输入,实现信息传播。此外设计了一种用于MTS预测的分层时空交互学习架构。该架构通过将MTS下采样为子序列并使用多个样本卷积(SConv)模块来提取多分尺度时间特征,其中每个SConv模块由两个不同的卷积filter组成。然后,将多个SConv模块与DGCN模块集成,以同步捕获非线性时间相关性和动态空间相关性。
本文为基于GNNs的MTS预测提供了一个详细的问题表述。使用图来建模变量之间的关联,将每个变量看作图结构中的一个节点,变量之间的关联看作图结构中的一条边。

1.5.1 论文模型

DSTIGNN的总体架构如下,其核心思想是利用异构信息对动态空间关联进行建模,并通过考虑时间序列特性的交互式学习架构同步捕获时间和空间相关性。该模型采用由动态图推理模块、多个时空层(ST层)和输出模块组成的分层结构,如下图(a)所示。每个ST层由3个时空交互学习模块组成,以二叉树结构排列,有利于在多种尺度下捕获时空特征。初始输入X首先被送入1 × 1卷积以获得初始特征表示H,如下图(b)所示。然后,每个STIL模块将数据下采样为两个子序列,然后将它们馈送到交互式学习结构中,以同步提取时间和空间相关性。该结构主要由样本卷积模块和动态图卷积模块组成。样本卷积模块用于捕获数据中的时间相关性,如下图(e)所示。另一方面,利用动态图卷积模块捕获数据中的空间相关性,如下图©所示。如下图(d)所示,动态图推理模块旨在根据两类异构信息推断出动态图,对节点之间的动态空间关联进行建模,作为动态图卷积模块的输入之一。在每个ST层的末尾,将捕获到的特征按照原始时间顺序集成到一个新的序列中。通过残差拼接将其与原始序列相结合,得到最终的序列表示。通过堆叠多个ST层来获得深度时空特征。最后,通过由ReLU激活函数和两个1 × 1卷积层组成的输出模块得到预测结果。
在这里插入图片描述

1.5.2 时空交互学习模块(Spatiotemporal Interactive Learning Module)

时间序列数据有一个独特的性质,即当将数据下采样为两个序列时,原始数据中的时间关系在很大程度上得到保留。受此启发,设计了一个STIL模块,通过下采样操作将原始MTS分割为两个子序列,然后通过样本卷积模块和动态图卷积模块之间的交互学习同步捕获时间和空间相关性。从递归思维中汲取灵感,设计了一个具有三个STIL模块的二叉树结构,对多个子序列进行建模,并捕获多分尺度时空特征。Fig.1(b)显示了STIL模块的结构。给定输入H \in R^{W \times N \times D},其中W表示窗口长度,N表示节点数,D表示通道数。分裂操作根据奇偶索引排列将H分为两个子序列H_{even}\in R^{W/2\times N\times D}和H_{odd}\in R^{W/2\times N\times D}。这些子序列的尺度较低,但仍然保留了大多数时间关系。通过交互结构传递它们,从两个独立捕获时间相关性的样本卷积模块开始。Fig.1(e)显示了样本卷积的结构,由两个不同的卷积核组成,便于从数据中提取不同但有价值的时间特征。然后,将提取的时间特征输入到动态图卷积模块中以捕获空间相关性。最后,两个子序列在动态图卷积模块中相互学习共享参数权重,完成初始时空交互学习过程。形式上,第一个交互式学习可以定义如下:
在这里插入图片描述

1.5.3 动态图推理模块(Dynamic Graph Inference Module)

对于基于STGNN的模型,图结构的精确构建至关重要。已有研究倾向于构建预定义或自适应的图,但它们是静态的,无法反映节点之间的时变关系。最近的研究从单一的动态信息推断出动态图,取得了较好的结果。然而,动态空间关联往往受到多种类型信息的影响。为解决这个问题,本文提出一种新的DGI模块,旨在基于两种不同类型的异构信息来建模节点之间的动态空间关联:动态输入信息和内在结构信息。DGI模块的架构如Fig.1(d)所示。具体来说,给定时间步t的动态输入信息X_{t}\in R^{N\times F},其中F表示初始节点维度。使用CNN提取特征,得到X’{t}\in R^{N\times d},其中d是节点嵌入维度。同时,初始化一个节点嵌入字典E{d} \in R^{N\times d}作为内在结构信息。节点嵌入促进了将每个节点的信息映射到低维向量表示中,从而能够在训练期间推断结构信息。为了有效地利用两类异构信息,并缓解它们之间潜在的冲突或约束,使用GRU层进行平衡。GRU层的数学表达式为:
在这里插入图片描述

1.5.4 动态图卷积模块(Dynamic Graph Convolution Module)

图卷积主要通过聚合相邻节点的信号来提取和利用每个节点的特性。论文Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting是将交通流视为图结构上的扩散过程的先驱,使捕获节点之间的空间相关性成为可能。这种直观的建模方法已经在众多时空建模任务中得到了验证。具体地,对于输入序列X \in R^{W\times N\times D}、带有自环的归一化邻接矩阵A和参数矩阵W_{k},扩散图卷积的形式化表示如下:
在这里插入图片描述
其中M表示输出,K是扩散步骤的数量。P^{k} \in R^{N\times N}表示转移矩阵的幂级数,同时P=D{-1}A,其中D是A的度矩阵。这个过程是针对无向图的。对于有向图,图卷积的扩散过程具有前向和后向两个方向。P_{f}=D{-1}{f}A为正向转移矩阵,P{b}=D{-1}_{b}A{T}为逆向转移矩阵。形式上,对于有向图,扩散图卷积可以表示为:
在这里插入图片描述
这些图卷积方法是针对静态图设计的。本文提出一种图卷积的动态变体。这种动态图卷积是基于从动态图推理模块获得的动态推断图。动态图卷积模块的架构如Fig.1©所示。它在不同的时间步骤执行图卷积,以捕获节点之间不断演化的空间关系。重要的是要强调,论文的动态图是规范化的,可以认为等同于P。因此,动态图卷积的表述可以表示为:
在这里插入图片描述
其中H_{S}和H_{D}分别表示样本卷积模块和动态图卷积模块的输出。W_{c}是模型参数。在本研究中,将K设为2。通过上面的等式,能够捕获节点之间的空间特征。回想一下,在5.2.1节中,论文使用动态图卷积模块和样本卷积模块构建了一个时空交互学习模块。该模块的目的是通过有效地同步捕获时间和空间相关性来提高MTS预测的准确性。
最后,算法1中概述了DSTIGNN的训练过程。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1522826.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Uniapp有奖猜歌游戏系统源码,附带流量主

有奖猜歌游戏是一款基于uni-app、uniCloud、uniAD 开发的小游戏,通过猜歌曲、观看广告赚取现金奖励。 游戏基本特征 玩家可以通过猜歌、做任务等方式直接获取现金奖励 玩家可以通过猜歌、拆红包、做任务等方式获取金币奖励,当金币累积到一定数量可以兑…

C++之类和对象(3)

目录 1. 再谈构造函数 1.1 构造函数体赋值 1.2 初始化列表 1.3 explicit 2. static成员 2.1 概念 3. 友元 3.1 友元函数 3.2 友元类 4. 内部类 5. 匿名对象 6. 拷贝对象时编译器做出的优化 1. 再谈构造函数 1.1 构造函数体赋值 class Date { public:Date(int year2024…

实现界面跳转及注册界面编写(AndroidStudio)

目录 一、代码 二、最后效果 一、代码 1.先新建一个activity文件 2.注册界面的代码如下&#xff1a; <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:la…

(附数据集)基于lora参数微调Qwen1.8chat模型的实战教程

基于lora微调Qwen1.8chat的实战教程 日期&#xff1a;2024-3-16作者&#xff1a;小知运行环境&#xff1a;jupyterLab描述&#xff1a;基于lora参数微调Qwen1.8chat模型。 样例数据集 - qwen_chat.json&#xff08;小份数据&#xff09; - chat.json&#xff08;中份数据&…

Tuxera NTFS 2023安装使用教程 Tuxera NTFS破解版 Tuxera NTFS for Mac优惠

对于必须在Windows电脑和Mac电脑之间来回切换的Mac朋友来说&#xff0c;跨平台不兼容一直是一个巨大的障碍&#xff0c;尤其是当我们需要使用NTFS格式的硬盘在Windows和macOS之间共享文件时。因为Mac默认不支持写入NTFS磁盘。 为了解决这一问题&#xff0c;很多朋友会选择很便捷…

vscode插件开发-发布插件

安装vsce vsce是“Visual Studio Code Extensions”的缩写&#xff0c;是一个用于打包、发布和管理VS Code扩展的命令行工具。 确保您安装了Node.js。然后运行&#xff1a; npm install -g vscode/vsce 您可以使用vsce轻松打包和发布扩展&#xff1a; // 打包插件生成name…

RansomwareSim:一款功能强大的勒索软件模拟研究学习工具

关于RansomwareSim RansomwareSim是一款功能强大的勒索软件模拟研究学习工具&#xff0c;该工具是为网络安全教育和培训目的开发的模拟勒索软件应用程序&#xff0c;它旨在为广大研究人员演示勒索软件如何加密系统上的文件并与命令和控制服务器通信&#xff0c;以更好地了解勒…

“一键解锁复古魅力:底片效果瞬间生成!“

时光荏苒&#xff0c;岁月如梭。你是否曾怀念那些旧时光里&#xff0c;老照片所散发出的独特韵味&#xff1f;那种历经岁月沉淀的底片效果&#xff0c;仿佛能带我们回到那些被遗忘的角落&#xff0c;重温那些温馨的瞬间。 首先第一步&#xff0c;我们要进入视频剪辑高手&#…

java数据结构与算法刷题-----LeetCode376. 摆动序列

java数据结构与算法刷题目录&#xff08;剑指Offer、LeetCode、ACM&#xff09;-----主目录-----持续更新(进不去说明我没写完)&#xff1a;https://blog.csdn.net/grd_java/article/details/123063846 文章目录 1. 贪心2. 动态规划3. 优化版动态规划 1. 贪心 解题思路&#x…

【强化学习笔记一】初识强化学习(定义、应用、分类、性能指标、小车上山案例及代码)

文章目录 第1章 初识强化学习1.1 强化学习及其关键元素1.2 强化学习的应用1.3 强化学习的分类1.3.1 按任务分类1.3.2 按算法分类 1.4 强化学习算法的性能指标1.5 案例&#xff1a;基于Gym库的智能体/环境接口1.5.1 安装Gym库1.5.2 使用Gym库1.5.3 小车上山1.5.3.1 有限动作空间…

软考80-上午题-【面向对象技术3-设计模式】-结构型设计模式03

一、外观模式 1-1、意图 为子系统中的一组接口提供一个一致的界面。 Facade 模式定义了一个高层接口&#xff0c;这个接口使得这一子系统更加容易使用。 1-2、结构 Facade 知道哪些子系统类负责处理请求&#xff1a;将客户的请求代理给适当的子系统对象。Subsvstem classes …

Mock.js了解(Mock就是模拟一个后端,Postman模拟前端)

JSON5 Node.js Vue CLI与Mock.js Jquery与Mock.js Mock与分页

Linux - 线程互斥和互斥锁

文章目录 前言一、为什么要线程互斥原子性 二、互斥锁互斥锁的创建与销毁互斥锁进行互斥 前言 前几节课&#xff0c;我们学习了多线程的基础概念&#xff0c;这节课&#xff0c;我们来对线程互斥和互斥锁的内容进行学习。 一、为什么要线程互斥 首先我们要明白&#xff0c;对…

openGauss学习笔记-244 openGauss性能调优-SQL调优-典型SQL调优点-统计信息调优

文章目录 openGauss学习笔记-244 openGauss性能调优-SQL调优-典型SQL调优点-统计信息调优244.1 统计信息调优244.1.1 统计信息调优介绍244.1.2 实例分析&#xff1a;未收集统计信息导致查询性能差 openGauss学习笔记-244 openGauss性能调优-SQL调优-典型SQL调优点-统计信息调优…

JVM学习-底层字节码的执行过程

目录 1.一个简单的程序分析 2. a&#xff0c;a&#xff0c;a--在JVM中的执行过程 3. 一个好玩的xx 4.方法调用的字节码分析、多态的实现、对象头 5. try-catch-finally的字节码分析 5.1 try-catch 5.2 try-catch-finally 5.3特殊情况 5.3.1 try和finally块中都出现了re…

第18节 动态规划一讲

1假设有排成一行的N个位置记为1~N&#xff0c;N一定大于或等于2 开始时机器人在其中的M位置上(M一定是1~N中的一个) 如果机器人来到1位置&#xff0c;那么下一步只能往右来到2位置&#xff1b; 如果机器人来到N位置&#xff0c;那么下一步只能往左来到N-1位置&#xff1b; 如果…

GiT: Towards Generalist Vision Transformer through Universal Language Interface

GiT: Towards Generalist Vision Transformer through Universal Language Interface 相关链接&#xff1a;arxiv github 关键字&#xff1a;Generalist Vision Transformer (GiT)、Universal Language Interface、Multi-task Learning、Zero-shot Transfer、Transformer 摘要 …

BigDecimal保留两位小数失败问题

文章目录 背景问题解决如何测试代码 背景 测试时发现在线swagger测试会自动处理BigDecimal小数点后面的数字&#xff0c;就是有零的会都给你去掉&#xff0c;比如9.000与9.500到最后都会被swagger处理成9跟9.5。使用postman测是最准的&#xff0c;测出来的就是9.000跟9.500。 …

Rocky Linux 基本工具的安装

1.系统安装后先查看ip地址 ip addr 2.安装net工具 &#xff1a;ifconfig yum install net-tools 3.安装gcc &#xff1b;选择都选 y yum install gcc yum install gcc-c 4.安装tcl yum install -y tcl 5.安装lsof &#xff08;端口查看工具&#xff09; yum install l…

MySQL实现事务隔离的秘诀之锁

在MySQL中&#xff0c;有多种锁类型&#xff0c;我们先了解三种概念的锁&#xff0c;以便对接下来的内容有更好理解。 表级锁&#xff08;Table Lock&#xff09;&#xff1a;对整个表加锁&#xff0c;其他事务无法修改或读取该表的数据&#xff0c;但可以对其他表进行操作。页…