用于高频交易预测的最优输出LSTM

news2024/12/26 23:18:39

用于高频交易预测的最优输出LSTM

J.P.Morgan的python教程

Content

本文提出了一种改进的长短期记忆(LSTM)单元,称为最优输出LSTM(OPTM-LSTM),用于实时选择最佳门或状态作为最终输出。这种单元采用浅层拓扑结构,具有最小的回顾期,并且支持在线训练。通过在美国和北欧股票的限价单簿(LOB)中进行测试,证明了OPTM-LSTM在高频交易预测任务中的有效性,特别是在预测LOB中间价格方面,相较于其他循环神经网络,它具有更低的预测误差。

第一章:引言(Introduction)

高频交易(HFT)在美国股票市场交易活动中占比超过50%。HFT过程中,信号和交易在几纳秒内分析和执行,这种速度要求为参与者提供了利用其基础设施和专业技术知识的机会。文章中提到了限价单簿(LOB)的概念,这是HFT活动的一种形式,其中流动性提供者和流动性接受者形成订单流动动态。文章还涉及了快速订单流动信息分析的重要性,特别是预测限价单簿的下一个中间价格,这是实验协议的主要目标。预测下一个中间价格等同于在线或逐刻预测,这在数据规模消化和时间不规则性检查方面是一个挑战。这些挑战可以通过特定类型的神经网络(NN)适当处理,特别是循环神经网络(RNN)家族中的长短期记忆神经网络(LSTM)。LSTM在多个领域,包括金融和算法交易中,已经显示出良好的预测能力。文中还提到了HFT LOB数据集的研究需要模型能够解析所有相关信息而无处理延迟。此外,文章讨论了构建实时在线机器学习实验协议的挑战,不仅仅是工程目标(即LOB的中间价格预测),还包括开发适合基于较少训练周期的短期训练的动态调整的NN。

第二章:相关工作(Related Work)

LSTM网络已被用于预测中间价格的变动,并在预测能力方面表现优异。此外,通过引入注意力机制,LSTM的预测性能得到了进一步提升。还有研究将LSTM与注意力机制结合,用于预测股票价格的跳跃。LSTM还被用于市场做市策略的实施。LSTM单元的架构基于一系列预定义的操作,这些操作基于对内部计算顺序、门/状态数量和单元输出信息的假设。文中提到了一些研究,这些研究根据信息流调整LSTM内部门的顺序,但这些方法存在一些限制,例如调整或消除RNN门并不直接与最终预测目标相关联。此外,文中还提到了一些简化的LSTM单元结构,以及对LSTM单元中最重要的门进行修改的建议。还有一些研究提出了更轻量级的RNN单元。文中还提到了LSTM网络的更复杂变体,例如peephole LSTM和双向LSTM,这些变体在预测开盘、最高、最低和收盘股票价格方面有效。LSTM还被用作混合模型,与CNN结合用于股票价格预测。尽管这些模型在预测方面表现出色,但它们在处理高速信息流时不够灵活,因为LSTM单元在训练和学习期间保持静态,并且与预测任务脱节。

第三章:提出的方法(Proposed Method)

高频交易限价单簿(LOB)的行为特征是股票库存的快速变化,这直接影响股票价格。为了有效应对这种动态变化,提出的长短期记忆(LSTM)网络需要能够迅速识别这些变化并提供优化的建议或信息。

图片

文章提出了一种自适应的LSTM单元架构,称为OPTM-LSTM单元,它与现有的RNN单元在两个关键方面有所不同:首先,LSTM单元的门和状态被视为特征,并通过内部特征重要性机制来衡量它们处理在线信息流的能力;其次,该机制作为一个非预测性监督回归问题,依赖于代表当前已知LOB中间价格的标签。

图片

OPTM-LSTM单元的核心思想是改进LSTM单元的原始机制,通过在线评估内部门和状态的重要性来重新排列和选择LSTM单元的最终输出。这一过程涉及到一个内部的非预测性监督回归问题,该问题与主要的预测目标(即预测下一个中间价格)相似但不相同。

OPTM-LSTM单元的工作机制基于两个关键组件:简单的优化方法(遵循梯度下降学习算法)和非预测性监督回归问题。这两个组件在LSTM单元内部结合,优化结果随后传递给下一个LSTM单元。

在结构上,OPTM-LSTM单元包含与原始LSTM单元相同数量的门和状态,以及相同数量的输出。不同之处在于,在生成两个输出张量(即时间t的隐藏和细胞状态)之前,会进行一个基于内部非预测性监督回归的特征重要性计算。

特征存储库(Feature Repo)是一个包含六个内部门和状态的集合,基于梯度下降学习算法更新的梯度权重这些组件结合在一起,通过计算每个内部门或状态的平均重要性来确定哪个状态或门是最重要的特征。

图片

此外,文章还提供了在线梯度下降算法的描述,以及对OPTM-LSTM单元的时间和空间复杂性的分析。这包括前向传播和反向传播(BPTT)的复杂性分析。

图片

LSTM架构的主要优势在于包括保留信息和延迟梯度消失或爆炸的问题。文章还提到了通过实验方法观察到的LSTM单元内部状态和门的行为特征,这些观察结果支持了开发OPTM-LSTM单元的决策。

第四章:实验(Experiments)

实验部分旨在验证OPTM-LSTM单元在高频交易(HFT)预测任务中的性能。实验的目标是预测限价单簿(LOB)的下一个中间价格,这是一个在线回归预测任务,不依赖于时间信息,而是依赖于每个交易事件的最新信息。

数据集和实验协议:

  • 实验使用了包括美国和北欧的高流动性和低流动性股票的数据集,数据遵循ITCH协议,确保了市场数据的超低延迟。

  • 数据集涵盖了2015年的前两个月的两支美国股票和2010年的两支北欧股票的交易数据。

  • 实验采用了渐进式训练方法,训练集包含高达2000万次交易事件,测试集则使用了1000次交易事件。

性能评估:

  • 性能通过均方误差(MSE)来评估,这是衡量预测准确性的常用指标。

  • 实验结果基于原始数据和两种不同的数据归一化方法:最小-最大归一化(MinMax)和Z分数标准化(Zscore)。

实验设置:

  • 实验比较了OPTM-LSTM单元与其他几种循环神经网络(RNN)结构,包括标准LSTM、带有注意力机制的LSTM、双向LSTM、GRU以及LSTM和CNN的混合模型。

  • 还包括了两个基线模型:一个基于LOB数据输入的朴素回归器和一个基于中间价格的持续性算法。

训练和测试:

  • 训练过程采用了在线学习的方法,其中模型在每个交易事件后立即更新。

  • 测试过程则是在训练集之后立即进行,以评估模型对新数据的预测能力。

结果:

  • OPTM-LSTM在多个数据集上展示了较低的MSE分数,表明其在预测任务中的优越性能。

  • 与其他RNN模型相比,OPTM-LSTM在不同的数据大小和归一化设置下均表现出更好的稳定性和预测准确性。

图片

图片

局限性和未来研究方向:

  • 尽管OPTM-LSTM在实验中表现出色,但研究的局限性在于所使用的股票数量有限,且交易时间范围受限。

  • 未来的研究可以探索更广泛的股票样本和更长的交易时间范围,以及将OPTM-LSTM应用于其他在线预测任务的可能性。

第五章:总结和未来研究方向(Conclusion and Future Research)

本文总结了OPTM-LSTM单元在高频交易(HFT)预测任务中的优势,包括其在多个数据集上实现的低预测误差和快速适应市场变化的能力,并指出了研究的局限性,如股票样本数量和交易时间范围的限制,同时提出了未来研究的方向,例如将OPTM-LSTM应用于其他在线预测任务,以及进一步优化模型以处理更广泛的市场数据和交易场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2184583.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CSS 盒子属性

1. 盒子模型组成 1.1 边框属性 1.1.1 四边分开写 1.1.2 合并线框 1.1.3 边框影响盒子大小 1.2 内边距 注意: 1.3 外边距 1.3.1 嵌套块元素垂直外边距的塌陷 1.4 清除内外边距 1.5 总结

使用YOLO11训练自己的数据集【下载模型】-【导入数据集】-【训练模型】-【评估模型】-【导出模型】

目录 前言:一、下载模型二、导入数据集三、训练自己的数据集四、验证数据集五、测试数据集 前言: YOLO11于2024年9月30日由YOLOv8团队正式发布,为了让我们能够趁热打铁早发论文,接下来让我们仔细研究一下如何使用YOLO11训练自己的…

通信协议感悟

本文结合个人所学,简要讲述SPI,I2C,UART通信的特点,限制。 1.同步通信 UART,SPI,I2C三种串行通讯方式,SPI功能引脚为CS,CLK,MOSI,MISO;I2C功能引…

六、输入输出管理

1.输入输出程序接口 由于各种设备的操作所提供的参数或者返回值都不同,也很难做到以设备独立性软件向上提供统一的接口,但是可以将设备进行分类,每一类设备由一种统一的接口操作。 ①字符设备接口 get/put 系统调用:向字符设备读/写一个字符…

Redis篇(Redis原理 - RESP协议)

目录 一、简介 二、Redis通信协议 基于Socket自定义Redis的客户端 三、Redis内存回收 1. 过期key处理 1.1. 惰性删除 1.2. 周期删除 1.3. 知识小结 2. 内存淘汰策略 一、简介 Redis是一个CS架构的软件,通信一般分两步(不包括pipeline和PubSub&a…

【Linux系统编程】第二十六弹---彻底掌握文件I/O:C/C++文件接口与Linux系统调用实践

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】 目录 1、回顾C语言文件接口 1.1、以写的方式打开文件 1.2、以追加的方式打开文件 2、初步理解文件 2.1、C文件接口 3、进一步理…

街道办事处智慧查询系统方案——未来之窗行业应用跨平台架构

一、政务公开建设的必要性 1.1.1使用便捷 人民的生活因为科学技术的发展,发生了翻天覆地的变化,也是实现智能化社区发展的重要发展环节,并在触摸一体机设备的运用中,“社区办事查询软件”运用,基本能够实现***科学技…

【优选算法】(第十五篇)

目录 和为k的⼦数组(medium) 题目解析 讲解算法原理 编写代码 和可被K整除的⼦数组(medium) 题目解析 讲解算法原理 编写代码 和为k的⼦数组(medium) 题目解析 1.题目链接:. - 力扣&am…

【EXCEL数据处理】000010 案列 EXCEL文本型和常规型转换。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来,方便查看。

前言:哈喽,大家好,今天给大家分享一篇文章!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 【EXCEL数据处理】000010 案列 EXCEL单元格格式。EXCEL文本型和常规型转…

TypeScript 算法手册 【归并排序】

文章目录 1. 归并排序简介1.1 归并排序定义1.2 归并排序特点 2. 归并排序步骤过程拆解2.1 分割数组2.2 递归排序2.3 合并有序数组 3. 归并排序的优化3.1 原地归并排序3.2 混合插入排序案例代码和动态图 4. 归并排序的优点5. 归并排序的缺点总结 【 已更新完 TypeScript 设计模式…

nature reviews genetics | 基因调控网络方法总结

–https://doi.org/10.1038/s41576-023-00618-5 Gene regulatory network inference in the era of single-cell multi-omics 留意更多内容,欢迎关注微信公众号:组学之心 研究团队和单位 Julio Saez-Rodriguez—Heidelberg University Ricard Arge…

Let‘s Encrypt 的几个常用命令

Lets Encrypt 是免费的 ssl 证书提供商,在当前纷纷收费的形式下,这是一个良心厂家,虽然使用起来略微繁琐。坚决抵制某 cxxn 站,竟然开始有辣么多收费的东西。这里记录几个常用的命令(使用环境Ubuntu 24)&am…

Proxmox使用tc给虚拟机限速,实现不对等网速——浪浪云

文章目录 前言第一步查看虚拟机的虚拟网卡名字第二部 设置上传速度限制第三部 设置下载速度限制第四部 验证是否成功查看队列调度器查看过滤器 第五步 如何解除网卡限速 前言 由于proxmox虚拟机限速只能限速对等,但是我想让下载和上传速度不对等,例如上传…

录屏软件大比拼:四款必备工具助你轻松录制精彩瞬间!

哎呀,说到电脑录屏这事儿,我这个办公室小文员可是深有体会啊!平时工作里,经常需要录个会议啊、做个教程啊,或者分享个操作技巧给同事们看。市面上的录屏软件多得数不清,但我最常用的几款工具。今天就来跟大…

Vue3 proxy跨域代理

一、跨域问题 假设vue项目的运行地址为:http://localhost:5173,此时我们想要调用后端服务的rest api,而后端接口暴露的地址为:https://192.168.1.1:8080/user。 可以发现前端服务与后端服务的域名是不同的,默认情况下…

C语言 | Leetcode C语言题解之第445题两数相加II

题目: 题解: struct ListNode* addTwoNumbers(struct ListNode* l1, struct ListNode* l2){int stack1[100];int stack2[100];int top1 0;int top2 0;int carry 0;int sum 0;struct ListNode* temp NULL;struct ListNode* head NULL;while (l1) {…

基于ssm大学生自主学习网站的设计与实现

文未可获取一份本项目的java源码和数据库参考。 1、毕业论文(设计)的背景及意义: (1)研究背景 目前,因特网是世界上最大的计算机互联网络,它通过网络设备将世界各地互相独立的不同规模的局域…

五、Drf权限组件

五、权限组件 权限组件=[权限类,权限类,权限类…] 执行所有权限类的has_permission方法,通过返回True,不通过返回False 默认情况下,所有的权限类都通过,才返回True 5.1简单应用权限组件 #ext.per class MyPermission1(BasePermission):def has_permission(self, requ…

Redis篇(Redis原理 - 网络模型)

目录 一、用户空间和内核态空间 二、阻塞IO 三、非阻塞IO 四、IO多路复用 五、IO多路复用-select方式 六、IO多路复用模型-poll模式 七、IO多路复用模型-epoll函数 八、网络模型-epoll中的ET和LT 九、网络模型-基于epoll的服务器端流程 十、网络模型-信号驱动 异步IO…

Linux安装RabbitMQ安装

1. RabbitMQ介绍 1.1 RabbitMQ关键特性 异步消息传递:允许应用程序在不直接进行网络调用的情况下交换消息。 可靠性:支持消息持久化,确保消息不会在系统故障时丢失。 灵活的路由:支持多种路由选项,包括直接、主题、…