【AI大模型】股票价格预测精度增强,基于变分模态分解、PatchTST和自适应尺度加权层

news2024/9/27 19:21:09

简介

股票价格指数是金融市场和经济健康的晴雨表,准确预测对投资决策至关重要。股票市场的高频交易和复杂行为使得预测具有挑战性,需开发稳定、准确的预测模型。研究表明,估值比率、数据驱动模型(如支持向量机)、股票价格比率和回报分散等因素均能增强股票价格的可预测性。

目前的股票价格预测方法可以分为两种:

  • **多变量预测:**利用宏观经济、政策、技术指标及历史股价等多种因素,适合长期趋势预测,但短期预测中变量过多可能引入噪声,影响模型性能。

  • **单变量预测:**仅使用历史股价数据,假设所有因素的影响已反映在价格变化中,更适合短期预测,且适合数据驱动模型提取高维特征。

本文聚焦于单一股票指数的价格预测。

股票价格预测分为传统统计方法和数据驱动方法。传统方法(如ARIMA、ARCH)对非平稳数据预测不可靠。数据驱动方法(如机器学习、深度学习)在处理非线性和高维数据上表现优越。机器学习方法如支持向量机(SVM)和决策树优于传统方法。深度学习模型(CNN、RNN、注意力机制)在金融预测中日益重要。Transformer模型通过自注意力机制捕捉长程依赖和复杂时间模式。PatchTST模型通过分段时间序列数据提高长期预测性能,适合股票价格预测。本研究采用PatchTST作为预测模型。

尽管Transformer模型在时间序列预测中表现出色,但直接从单一模型获得满意的预测准确性仍具挑战性。本文提出了结合机器学习/深度学习与分解-集成技术的复合预测框架,通过将时间序列数据分解为多个独立子序列进行预测。使用独立成分分析(ICA)、小波分解、经验模态分解(EMD)等方法进行时间序列分解,最近变分模态分解(VMD)显示出优越的分解和特征表示能力。

本文提出的VMD+PatchTST与自适应尺度加权层(ASWL)框架,通过VMD分解、PatchTST学习时间模式和ASWL优化资源分配,显著提高了股票价格预测的准确性。VMD+PatchTST与ASWL框架在多个股票指数数据集上表现优越,实验结果显示其在模型评估指标上超越其他方法。ASWL创新性地引入了自适应尺度加权,优化了多变量时间序列预测中的资源分配,显著降低了预测误差。

VMD+PatchTST与ASWL复合预测框架在SP500、DJI、SSEC和FTSE数据集上表现优异。MSE值分别为7.69、51.67、13.29和19.91;sMAPE值分别为0.42%、0.24%、0.46%和0.29%。本框架在预测准确性和泛化能力上优于以往模型。

方法

本文提出的框架包含三个部分:VMD分解模块、PatchTST预测模型和自适应尺度加权层。原始序列通过VMD模块分解为多个子序列。预测模型在训练数据集上学习,自适应尺度加权层负责训练过程中的损失修正。预测模型处理测试数据集,生成预测子序列,最终在集成模块中汇总得到最终预测序列。

变分模态分解

变分模态分解(VMD)是一种新颖的时频分析方法,能将多成分时间序列分解为多个单成分的幅度调制(AM)和频率调制(FM)信号。VMD克服了传统经验模态分解(EMD)中的端点效应和伪成分问题,且在复杂的非线性和非平稳时间序列中表现出更强的鲁棒性。VMD通过变分优化过程将原始时间序列S(t)分解为K个带宽受限的内在模态函数s_m(t)及其对应的中心频率v_m(t)。

带宽约束通过L2范数梯度的解调信号估计来估算。

引入二次惩罚项α和拉格朗日乘子λ,将重构约束问题转化为无约束问题。

采用交替方向乘子法(ADMM)求解,迭代应用相关方程直至满足终止条件,最终输出VMD算法的结果。

预测模型

Transformer模型在时间序列建模中的应用:Transformer基于注意力机制,适用于非线性和非平稳的金融数据预测,旨在实现风险分散和超额收益。

PatchTST模型的优势:

  • **Patching模块:**处理不同时间步的tokens,将其聚合为子序列,捕捉局部和全局语义信息。

  • **通道独立性:**每个输入token包含单一时间序列的信息,强调特征的重要性,减少过拟合。

  • **模型架构:**PatchTST包含四个主要组件:前向过程、Patching、Transformer编码器和实例归一化。

  • **前向过程:**将多变量时间序列分解为多个单变量时间序列,输入到通道独立的Transformer中进行预测。

  • **Patching模块:**将单变量时间序列分割为多个patches,保持信息完整性。

  • **Transformer编码器:**使用标准Transformer编码器提取输入信号的潜在表示,通过可学习的线性投影和位置编码保持时间顺序一致性。

自适应尺度加权层

VMD将时间序列S(t)分解为多个IMFs X1:L,每个IMF包含多尺度特征。预测模型从每个IMF学习,生成预测输出x ˆ L+1:L+T,最终预测通过求和得到x ˆ。数据归一化至0-1范围,导致缺乏尺度信息。多变量时间序列的总损失函数简单相加,忽视IMFs的频率和尺度差异。

引入自适应尺度加权层(ASWL),动态调整各子序列的权重,增强模型预测能力。ASWL通过线性层整合多尺度信息,赋予高低频成分不同的损失权重。最终预测结果通过元素乘法替代简单加法。

实验设置

数据

使用全球股指的日收盘价验证方法,数据来源于Wind数据库。选取四个股指:SP500、DJI、SSEC、FTSE,时间范围为2000年1月至2024年6月。每个股指的有效观察数分别为:6,123、6,145、5,920、5,893。数据集分为五个部分,每部分80%用于训练,20%用于测试。SP500指数的VMD分解显示,早期IMFs范围大,反映低频特征;后期IMFs范围小,反映高频特征。

**评估指标
**

使用均方误差(MSE)和对称平均绝对百分比误差(sMAPE)评估模型预测结果。

基线和模型参数

为了评估预测模型性能,选择CNN-LSTM、Informer、Autoformer、非平稳Transformer、Prophet、ARIMA作为基线。直接比较这些时间序列预测模型的表现。将变分模态分解(VMD)与深度预测模型结合,预测四个股票价格数据集,展示性能提升。

引入ASWL,比较各模型性能。

结果和分析

单模型预测表现

PatchTST在四个股票指数价格预测中,MSE和sMAPE表现优异,仅次于Non-stationary Transformer。SP500数据集sMAPE值:Informer 12.68%,Autoformer 3.68%,Non-stationary Transformer 1.12%,PatchTST 1.38%,CNN-LSTM 5.69%,Prophet 8.9%,ARIMA 40.38%。ARIMA因无法有效处理非平稳和非线性时间序列而被排除后续实验。CNN-LSTM虽表现不如Autoformer和Non-stationary Transformer,但仍可选。Transformer模型普遍具有强预测能力,De-stationary Attention和PatchTST的分块方法是其关键因素。直接建模序列仍面临准确性挑战。

VMD增强深度模型的性能

VMD增强的深度模型中,VMD+PatchTST在四个股票指数数据集上表现最佳,MSE和sMAPE显著低于单一预测模型,尤其在DJI数据集上表现突出。VMD有效地将复杂时间序列分解为不同频率的子序列,提升模型学习效果。VMD+CNN-LSTM和VMD+Autoformer表现相近,但不及VMD+PatchTST,后者在捕捉数据模式上更为有效。在IMF分解分析中,VMD+PatchTST在高频成分(IMF9)预测中表现优异,而VMD+Informer在低频成分(IMF0)上表现良好,但在高频成分上效果不佳。VMD+CNN-LSTM在低频成分预测中表现不佳,显示出捕捉长期趋势的不足。结果强调了模型选择和频率分解技术(如VMD)在非平稳金融时间序列预测中的重要性。

使用VMD、ASWL和深度模型增强预测

IMFs表示股票指数的低频到高频分解序列,其规模逐渐减小,影响MSE和sMAPE值。引入ASWL模块以在模型训练中纳入IMFs的原始规模信息。VMD+PatchTST与ASWL在四个股票指数数据集上表现优异,MSE分别减少42.28%、23.63%、25.60%和13.89%。VMD+PatchTST与ASWL在所有数据集中MSE和sMAPE最低,优于VMD+Informer和VMD+Autoformer。VMD+Non-stationary Transformer与ASWL表现良好,但不及VMD+PatchTST。

VMD+深度模型结合ASWL框架在IMFs分析中表现出色,尤其在低频IMFs(IMF0-2)上,MSE和sMAPE显著降低。在DJI数据集中,VMD+PatchTST与ASWL的MSE分别减少38.26%、35.55%和14.20%。ASWL有效捕捉IMF的尺度信息,数据规模增加时,预测性能提升更明显。VMD+PatchTST在高频IMFs预测中也表现优异,FTSE数据集IMF9的MSE为1.3338,sMAPE为40.62%。

VMD+PatchTST与ASWL模型在SP500数据集的预测表现良好,特别是在IMFs 1-3中准确性突出。IMFs 1-3捕捉了主要的中频成分,有助于准确预测股票价格的主要趋势。ASWL的引入改善了高频IMFs(如IMF9)的预测性能,减少了预测波动和误差。ASWL通过自适应加权机制优化了不同频率成分对最终预测的影响,提高了短期波动和噪声的处理能力。

预测结果总结

股票价格序列的非平稳性和复杂性使得单一模型难以准确预测。PatchTST模型通过其拼接机制在股票指数价格预测中表现优越。VMD与深度模型结合显著降低股票指数价格预测误差,VMD+PatchTST效果最佳。ASWL模块通过引入尺度信息进一步提升预测性能,减少低频子序列的误差并降低高频子序列的波动。

总结

本文提出了一种新颖的股票指数价格预测框架,结合变分模态分解(VMD)、PatchTST和自适应尺度加权层(ASWL)。首先使用VMD将原始价格序列分解为多个具有可管理特征的IMF。对每个IMF应用PatchTST以有效捕捉和建模时间模式。ASWL模块用于整合尺度信息,提升预测性能。最终预测通过聚合所有IMF的结果获得。方法的新颖性在于VMD与PatchTST和ASWL的结合,充分利用了分解、时间模式建模和自适应加权的优势。

实验和比较分析验证了VMD-PatchTST-ASWL框架的有效性和效率。

未来工作将扩展到其他多变量时间序列预测任务,如能源价格预测、负荷预测和风速预测,以验证模型的多样性和鲁棒性。

2024最新全套大模型学习资料:大模型学习成长路线、书籍&学习文档、视频教程、项目实战、面试题汇总等,免费分享~

有需要的同学可以通过【微信扫描下方二维码】,即可免费领取!!!

一、大模型学习成长路线

学习新技能,方向至关重要。 正确的学习路线图可以为你节省时间,少走弯路;方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

二、大模型书籍&学习文档

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)

在这里插入图片描述

在这里插入图片描述

三、大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

四、大模型实战项目

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

五、大模型面试题汇总

面试,不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

上述的资料已经全部打包好,有需要这份全套的大模型学习资料的同学,可以通过【微信扫描下方二维码】,免费领取!!!

机会总是留给有准备的人。 如果你需要学习大模型,那么请不要犹豫,立刻行动起来!早掌握,早享受。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2165665.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习 | 使用scikit-learn学习Python中的PCA(主成分分析)

为什么选择PCA? 当有许多输入属性时,很难将数据可视化。在机器学习领域有一个非常著名的术语“维度诅咒”。基本上,它指的是数据集中的属性数量越多,对机器学习模型的准确性和训练时间产生不利影响。主成分分析(PCA&a…

使用Postman工具接口测试

文章目录 一、接口1.1 接口的概念1.2 接口的类型 二、接口测试2.1 概念2.2 原理2.3 特点 三、HTTP协议3.1 http协议简介3.2 URL格式3.3 HTTP请求3.3.1 请求行3.3.2 请求头3.3.3 请求体 3.4 HTTP响应3.4.1 状态行3.4.2 响应头3.4.3 响应体 3.4 传统风格接口3.5 RESTful风格接口 …

二网络复习

软路由: 1. ikuai 实现了一个多宽带线路的一个聚合可用家庭环境 2. Linux通过开启路由转发模拟路由器 (仅学习使用) #开启路由转发命令 vim /etc/sysctl.conf net.ipv4.ip_forward 1 sys…

C++学习笔记----8、掌握类与对象(一)---- 对象中的动态内存分配(1)

1、FRIENDS c允许类声明为其它类,其它类的成员函数,或者非成员函数为friend。可以访问protected与private数据成员与成员函数。例如,假设你有两个类Foo与Bar。你可以指定Bar类是Foo类的一个friend: class Foo {friend class Bar;…

《声入人心》团综重启,芒果能否再造一个群像神话?

随着《声入人心》团综《吾湖音乐局》于9月20日宣布重启,芒果的又一群像综艺“杀”回了市场。 从2018年音综市场冲出的一匹黑马,到2024年“声人”分散在影视综各个领域,这六年间芒果上演了无数次“狼来了”,但这一次团综是真的来了…

实现一个超轻量级实例分割网络的思路

文章目录 前言一、基本思路二、picodet三、yolact三、picodetyolact总结 前言 在某些工业领域,由于成本问题算力有限,只能实时跑一些超轻量级网络,拿目标检测来说,例如yolo-fast,pp-picodet这些。如果要跑实例分割&am…

魅思-视频管理系统 getOrderStatus SQL注入漏洞复现

0x01 产品简介 魅思-视频管理系统是一款集成了视频管理、用户管理、手机端应用封装等功能的综合性视频管理系统。该系统不仅以其强大的视频管理功能、灵活的用户管理机制、便捷的手机端应用封装功能以及高安全性和现代化的界面设计,成为了市场上备受关注的视频管理系统之一。…

分布式数据库——HBase基本操作

启动HBase: 1.启动hadoop,进入hadoop的sbin中 cd /opt/hadoop/sbin/ 2.初始化namenode hdfs namenode -format 3.启动hdfs ./start-all.sh 4.启动hbase cd /opt/hbase/bin ./start-hbase.sh 5.使用jps查看进程 jps 以下图片则是hbase启动成功~ 运行HBase ./hbase sh…

软考中项第3版新教程变化,2张表格看到底

近期正在着手做《信息系统项目管理师一站通关》书友会的见面礼包时,无意中在电脑中翻到不知道什么时候保存的2张表格,出处已经记不得了,这2张表格对软考中项第3版新教程的变化点总结的言简意赅,有价值分享出来给你。 第1张表格如下…

使用C计算数码管段码

前言 平时使用数码管时为了避免使用跳线往往不会按照顺序焊接数码管的段选引脚,为了焊接的方便段选引脚可能会焊接的乱七八糟的,此时标准的段码表就用不了了,需要重新去计算。因为在焊接时为了考虑布线可能每次焊的顺序都会有不同&#xff0c…

使用vite+react+ts+Ant Design开发后台管理项目(三)

前言 本文将引导开发者从零基础开始,运用vite、react、react-router、react-redux、Ant Design、less、tailwindcss、axios等前沿技术栈,构建一个高效、响应式的后台管理系统。通过详细的步骤和实践指导,文章旨在为开发者揭示如何利用这些技术…

使用AI进行需求分析的案例研究

生成式 AI 的潜在应用场景似乎无穷无尽。虽然这令人兴奋,但也可能让人不知所措。因此,团队在使用这项技术时需要有明确的目标:关键是要明确生成式 AI 在团队工作中能产生哪些实质性影响。 在软件工程中,一个引人注目的应用场景是…

QMT如何获取股票基本信息?如上市时间、退市时间、代码、名称、是否是ST等。QMT量化软件支持!

获取股票概况 包含股票的上市时间、退市时间、代码、名称、是否是ST等。 #获取合约基础信息数据 该信息每交易日9点更新 #内置Python 提示 旧版本客户端中,函数名为ContextInfo.get_instrumentdetail 调用方法 内置python ContextInfo.get_instrument_detai…

全连接神经网络

这里写目录标题 全连接神经网络vs前馈神经网络基于全连接神经网络的手写数字识别使用Pytorch实现纯Python实现 全连接神经网络的局限 端到端学习 深度学习有时也称为端到端机器学习(end-to-end machine learning)。这里所说的端到端是指从一端到另一端的…

西门子因为TC在与PTC及达索的混战中占据优势,西门子与SAP的合作价值几何?(2)

今天这篇文章是通过腾讯会议先录了一个视频然后转录的,看看效果怎么样。 主要是我昨天写了一篇公众号的文章,这篇文章是转自国外的一个记者。写的是他对这个工业软件三巨头西门子、达索和PTC之间的竞争做的一个访谈性质的文章,谈了他的一些看…

1.1.5 计算机网络的性能指标(上)

信道: 表示向某一方向传送信息的通道(信道!通信线路)一条通信线路在逻辑上往往对应一条发送信道和一条接收信道。 速率: 指连接到网络上的节点在信道上传输数据的速率。也称数据率或比特率、数据传输速率。 速率单…

python常见的魔术方法

什么是魔术方法 Python类的内置方法,各自有各自的特殊功能,被称之为魔术方法 常见的魔术方法有以下: __init__:构造方法 __str__:字符串方法 __lt__:小于、大于符号比较 __le__:小于等于、大于等于符合比较 __eq__:等于符合比较__init__ c…

【论文速看】DL最新进展20240925-医学图像分割、目标跟踪、图像超分

目录 【医学图像分割】【目标跟踪】【图像超分】 【医学图像分割】 [2024] UU-Mamba: Uncertainty-aware U-Mamba for Cardiovascular Segmentation 论文链接:https://arxiv.org/pdf/2409.14305 代码链接:https://github.com/tiffany9056/UU-Mamba 在深…

【NLP】循环神经网络--RNN学习.day3

一.初步认识RNN 循环神经网络(Recurrent Neural Network, RNN)是一种用于处理序列数据的深度学习模型。与传统的静态神经网络相比,RNN 可以有效处理输入数据的时间序列特性。这使得 RNN 在处理自然语言处理(NLP)、时间…

【Python报错已解决】TypeError: forward() got an unexpected keyword argument ‘labels‘

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 专栏介绍 在软件开发和日常使用中,BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…