基于排名的股票预测的关系时态图卷积网络(RT-GCN)

news2024/11/27 9:38:26

为了充分利用股票之间的关系,获得最高收益,提出了一种关系时态图卷积网络(RT-GCN)。
 

标题:Relational Temporal Graph Convolutional Networks for Ranking-Based Stock Prediction

链接:https://ieeexplore.ieee.org/document/10184655

会议:ICDE

 

摘要:

股票预测是《金融科技》中颇具吸引力的话题。然而,传统的股票预测方法存在两个缺陷:(1)一些方法侧重于股票的时间模式,将每只股票建模为独立的个体,而忽略了它们之间的关系。有些模型考虑了股票之间的关系,但采用两步法(即先捕捉时间模式,再考虑关系相关性),使得模型复杂且效率低下;(2)它们将股票预测建模为回归(预测股价)或分类任务(预测股票趋势),不能优化投资目标,即从未来预期收益最高的交易所市场中选择最好的股票。为了充分利用股票之间的关系,获得最高收益,提出了一种关系时态图卷积网络(RT-GCN)。我们首先将股票及其日常特征之间的关系建模为一个关系-时态图。然后,我们应用RTGCN和三种关系感知策略来实现对每只股票的关系时态特征提取。最后,以学习排名的方式反馈特征进行评分计算,得分最高的股票代表未来投资收益最高。大量实验证明了该方法的有效性和高效性
 

01


 

创新点
 

  • 为了充分利用每只股票的关系和时间信息,我们将股票关系和每只股票的时间特征建模为关系时间图,这是RT-GCN应用的基础,也是我们模型高效的前提。
  • 我们提出RT-GCN 用于基于排名的股票预测任务。该模型采用纯卷积结构构建,可同时捕获时间动态和关系依赖性,从而实现更快的训练速度。这样的改进对于短期股票交易系统来说意义重大。
  • 我们在RT-GCN 中设计了三种关系感知传播策略来满足股票预测任务的需求。 • 在纳斯达克、纽约证券交易所和中证指数数据集上进行的大量实验表明,RT-GCN 在有效性和效率方面可以超越最先进的方法

02


 

RT-GCN模型架构

上图是最基本的RT-GCN的架构。RT-GCN 运行的关系时间图的图示。该关系时间图由通过时间边缘(表示为黑色实线)连接的三个关系图组成。在每个关系图中,股票通过关系边(表示为蓝色实线)连接。

我们提出的框架的插图。RT-GCN模块上方的循环标志代表RT-GCN网络可以堆叠成为更深的网络。

每个关系-时间图卷积层(RT-GCN)由关系卷积结构时间卷积结构组成,输入数据将首先经过关系卷积,然后经过时间卷积。关系卷积结构旨在通过聚合其邻居信息和利用时间卷积结构来丰富每个节点的表示,以通过跨连续时间步提取关键信息来压缩时间维度。在 RT-GCN 层之后添加平均池化层以生成每只股票的表示。该表示将被馈送到全连接层以计算排名分数。整个模型通过反向传播以端到端的方式进行训练。我们将在下面详细介绍每个模块。

简单来说,模型主要关系卷积结构和时间卷积结构组成,然后添加时间池化层和全连接层计算股票排名分数。下面介绍这两个模块。

03


 

关系图卷积(Relational Graph Convolution)

提出了三种不同的策略来充分利用股票之间的这些关系。这三种策略是通过不同的关系感知函数R来实现的,R可以以关系矩阵 为输入返回不同的加权邻接矩阵A。下面,我们详细介绍如何设计这三种策略。

1)统一策略:第一个策略是最简单的, 它忽略了股票之间的不同关系,而对待股票之间的不同关系所有股票对都是相同的,因为这些不同的关系在图表中传播信息方面发挥着熟悉的作用。

回想一下, 是定义的关系矩阵,N为股票节点,K为边的类型,并且 有了定义好的邻接矩阵A,GCN模型就可以对每个图关系卷积(GR)进行操作。请注意,在卷积过程中,不同时间步长的所有 图关系卷积 (关系-时序卷积图)共享相同的 A。

2)权重策略:然而,第一种策略是粗糙的,因为它忽略了不同的关系可能会导致两只股票之间不同的影响。为了克服这个缺点,我们在图上传播信息时应用非均匀系数,如下式所示:

其中 w 和 b 是要学习的参数。作为策略 1,在卷积过程中,不同时间步长的所有 图关系卷积 (关系-时序卷积图)也共享相同的 A。该策略更具关系性,因为它可以使用不同的关系向量作为输入返回不同的权重。

3)时间敏感策略:上述两种策略的共同限制是不同时间步长的所有关系图共享相同的权重。然而,股票市场是高度动态的,因此股票的状态和关系的强度可能会在不同的时间步长中不断变化。不同时间步长的所有关系图的固定权重无疑会限制我们的模型能力。例如,在前面图1(b)的例子中,苹果公司的股价在新版本产品发布期间对Lens股票的影响比平常更大。为了解决这个问题限制,我们将时间敏感的传播过程定义为等式:
 

这里, , 是股票i和j在时间步长t的特征,n是 的维度, 和b是可训练参数.

具体地说,第一项通过使用两只股票在当前时间步长的特征来衡量两只股票之间的相关性。我们采用缩放的点积来计算这一项,利用它来计算图中两个节点的权重。第二项与策略二·相同,返回关系向量的关系权重。与上述两种策略不同,该策略可以为GRT中的每个GR分配一个唯一的加权邻接矩阵。由于它同时考虑了两只股票之间的时间相关性和关系重要性,因此它是一种优势策略,比其他两种策略更适合于股票预测。

03


 

时间卷积(Temporal Convolution)

提出的时间卷积架构构建了时间卷积网络(TCN)模块。TCN 使用一维滤波器通过因果卷积 来捕获时间依赖性,如图 4 所示,其中时间 t 的输出仅与前一层中时间 t 及更早时间的元素进行卷积,因此可以有 没有从未来到过去的泄漏。例如,第 2 层中的 仅与第 1 层中的 、 和 进行卷积,并且不依赖于第 1 层中时间步 t + 1 和 t + 2 处的任何未来。 这样,未来就不会泄漏到过去。为了捕获输入特征的较长距离依赖性,我们改变滤波器移动步幅以通过零填充扩展感受野组合。等式 (6) 给出了由滤波器 操作的第 t 元素 上的 TCN 数学表达式:

我们还在 TCN 层之后添加了残差连接 [,以简化网络训练并将权重归一化 应用于卷积滤波器。此外,在每个 TCN 层之后添加了一个空间 dropout以进行正则化。

04


 

池化和预测(Pooling and Prediction)

经过 RT-GCN 处理后,我们可以获得关系时间图的关系时间特征 ,H 是时间卷积组件处理后的最终时间维度,N 是股票数量,F 是 经过关系卷积组件处理后的库存特征维度。接下来,我们使用 stride=H 的平均池化层来生成每个股票的表示 (文章的这里我认为应该是 )。最后,每只股票的表示将被输入到全连接层以计算排名分数 。我们使用均方误差损失 来优化模型,以最小化预测回报率和实际回报率之间的差异,并与成对排名感知损失 配合,以维持排名股票的相对顺序。

其中, 是真实排名, 是预测排名分数,RELU是激活函数。因此,我们的模型的最终损失函数可以写为Eq(9):

其中,β是所有可学习参数的集合,λ是L2正则化的权重,α是回归损失和排名损失之间的平衡参数.

实验结果


 

实验(EXPERIMENTS)

数据集:
 

维基关联和行业关联数据统计。

所有基线的性能比较。 “-”表示无法计算该指标,因为无法计算股票利润排名。

结论


 

结论(CONCLUSION)

提出了一种基于排名的股票预测的关系时间图卷积网络(RT-GCN),以充分利用股票之间的关系,实现股票投资的最高收益。我们首先将股票之间的关系及其每日特征建模为关系时间图。然后,我们应用图卷积网络和三种提出的关系感知策略来提取每个节点(股票)的关系时间特征。最后,将这些特征以学习排名的方式计算排名得分,得分最高的股票代表未来最高的投资收益。纳斯达克、纽约证券交易所和中证指数的实验结果证明了我们提出的模型的有效性和效率。

欢迎添加公众号,获取更多时间序列文章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2219421.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android15之解决gdb:Remote register badly formatted问题(二百三十六)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【…

2024全国大数据与计算智能挑战赛火热报名中!

一年一度的 全国大数据与计算智能挑战赛震撼来袭! 报名速通: https://www.datafountain.cn/special/BDSSF2024 大数据与决策(国家级)实验室连续三年组织发起全国大数据与计算智能挑战赛,旨在深入挖掘大数据应用实践中亟…

STM32传感器模块编程实践(九) VL53L0X激光红外测距传感器简介及驱动源码

文章目录 一.概要二.VL53L0X测距原理三.VL53L0X主要特性四.VL53L0X硬件参考设计五.模块接线说明六.模块通讯协议介绍七.光学盖玻片介绍八.STM32单片机与VL53L0模块实现距离测量实验1.硬件准备2.软件工程3.软件主要代码4.实验效果 九.小结 一.概要 VL53L0X是一款由ST&#xff0…

通过PHP与API的结合,开启电商数据集成的新篇章

在数字化转型的浪潮中,电子商务数据的集成对于企业来说变得越来越重要。无论是在线零售商还是品牌商,都需要实时访问商品数据以优化库存管理、制定定价策略、提升客户体验。PHP,作为服务端脚本语言的佼佼者,为开发者提供了强大的工…

调查显示软件供应链攻击增加

OpenText 发布了《2024 年全球勒索软件调查》,强调了网络攻击的重要趋势,特别是在软件供应链中,以及生成式人工智能在网络钓鱼诈骗中的使用日益增多。 尽管各国政府努力加强网络安全措施,但调查显示,仍有相当一部分企…

【verilog】3_8-4_16数选器

文章目录 前言一、实验原理二、实验过程三、实验结果参考文献 前言 进行 实验 一、实验原理 二、实验过程 三、实验结果 代码 timescale 1ns/1ns module decoder_38_tb ; reg a; reg b; reg c; wire [7:0]data;decoder_38 u0 (.a(a),.b(b),.c(c),.data(data) ); init…

pandas-使用技巧

pandas-使用技巧 简单技巧 仅个人笔记使用,感谢点赞关注 简单技巧 pd.to_dict():Dataframe格式数据转字典数据pd.dropna():去nan值& | ~:pd逻辑运算符pd.isnan():判断是否为nan值pd.concat:多个pd拼接…

关于武汉芯景科技有限公司的限流开关芯片XJ6241开发指南(兼容LTC4411)

一、芯片引脚介绍 1.芯片引脚 二、系统结构图 三、功能描述 1.CTL引脚控制VIN和VOUT的通断 2.CTL引脚控制STAT引脚的状态 3.输出电压高于输入电压加上–VRTO的值,芯片处于关断状态

揭秘Map与Set的键值奥秘与集合魅力,解锁高效数据魔法

文章目录 前言➰一、关联式容器1.1 关联式容器的概述1.2 关联式容器的工作原理1.3 关联式容器的核心特性 ➰二、键值对2.1 键值对的基本概念2.2 键值对在C中的实现 ➰三、树形结构的关联式容器3.1 树形结构的特点3.2 使用场景 ➰四、set的使用与定义4.1 set的基本特性4.2 set的…

OpenCV高级图形用户界面(11)检查是否有键盘事件发生而不阻塞当前线程函数pollKey()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 轮询已按下的键。 函数 pollKey 无等待地轮询键盘事件。它返回已按下的键的代码或如果没有键自上次调用以来被按下则返回 -1。若要等待按键被按…

软件压力测试如何进行?深圳软件测试机构分享

软件压力测试是每个重要软件测试工作的一部分,是一种基本的软件质量保证行为。压力测试不是在常规条件下运行手动或自动测试,而是在计算机数量较少或系统资源匮乏的条件下运行测试。通常要进行软件压力测试的资源包括内部内存、CPU 可用性、磁盘空间和网…

算法day-1

数组 数组是存放在连续内存空间上的相同类型数据的集合。数组的下标或者索引是从0开始的. 数组的优点 快速访问:通过索引可以在常数时间内(O(1))访问数组中的任意元素。顺序存储:数组中的元素在内存中是连续的&…

Codeforces 979 Div2 A-D (D. QED‘s Favorite Permutation详解)

比较开心能做出D A 原题 A. A Gift From Orangutan 思路 找到最大值最小值差值乘n - 1 即可 代码 #include <bits/stdc.h> #define int long long#define F(i, a, b) for (int i (a); i < (b); i) #define dF(i, a, b) for (int i (a); i > (b); i--)using…

C#学习笔记(一)

C#学习笔记&#xff08;一&#xff09; 简介第一章 上位机开发环境之 VS 使用和.NET 平台基础一、安装软件二、创建项目三、第一个Hello world四、解决方案与项目五、Debug 和 Release 的区别六、代码的生产过程七、CLR的其它功能 简介 C# .NET工控上位机开发 在工控领域&…

Nuxt.js 应用中的 build:before 事件钩子详解

title: Nuxt.js 应用中的 build:before 事件钩子详解 date: 2024/10/20 updated: 2024/10/20 author: cmdragon excerpt: build:before 钩子在 Nuxt.js 中是一种有力的工具,使开发者能够在应用的构建流程开始之前进行自定义处理和配置。在处理动态需求和配置时,开发者可以…

深度解析RLS(Recursive Least Squares)算法

目录 一、引言二、RLS算法的基本思想三、RLS算法的数学推导四、RLS算法的特点五、RLS算法的应用场景六、RLS算法的局限性七、总结 一、引言 在自适应滤波领域&#xff0c;LMS&#xff08;Least Mean Squares&#xff09;算法因其计算简单、实现方便而广受欢迎。然而&#xff0…

C++ 哈希桶和封装unordered_map和unordered_set

目录 哈希桶的概念 哈希桶的结构 哈希桶的结点 哈希桶的类 Insert插入函数 Find查找函数 Erase删除函数 哈希的两种仿函数(int) 和(string) 哈希表的改造 ​编辑 迭代器 改造 unordered_map和unordered_set的封装 前言 上一篇文章讲的哈希表&#xff0c;属于闭散…

解决k8s集群中安装ks3.4.1开启日志失败问题

问题 安装kubesphere v3.4.1时&#xff0c;开启了日志功能&#xff0c;部署时有三个pod报错了 Failed to pull image “busybox:latest”: rpc error: code Unknown desc failed to pull and unpack image “docker.io/library/busybox:latest”: failed to copy: httpRead…

【D3.js in Action 3 精译_034】4.1 D3 中的坐标轴的创建(中篇):定义横纵坐标轴的比例尺

当前内容所在位置&#xff08;可进入专栏查看其他译好的章节内容&#xff09; 第一部分 D3.js 基础知识 第一章 D3.js 简介&#xff08;已完结&#xff09; 1.1 何为 D3.js&#xff1f;1.2 D3 生态系统——入门须知1.3 数据可视化最佳实践&#xff08;上&#xff09;1.3 数据可…

京存助力北京某电力研究所数据采集

北京某电力研究所已建成了一套以光纤为主&#xff0c;卫星、载波、微波等多种通信方式共存&#xff0c;分层级的电力专用的网络通信架构体系。随着用电、配电对网络的要求提高&#xff0c;以及终端通信入网的迅速发展&#xff0c;迫切地需要高效的通信管理系统来应对大规模、复…