用NeuralProphet预测股价:AI金融新利器(附源码)

news2025/2/7 5:57:08

作者:老余捞鱼

原创不易,转载请标明出处及原作者。

写在前面的话:我用NeuralProphet模型预测了股票价格,发现其通过结合时间序列分析和神经网络算法,确实能提供比传统Last Value方法更精准的预测。经过一系列超参数调优,其预测效果更是显著,如果你也对AI金融股价预测感兴趣,这篇文章会给你带来不少启发。

一、NeuralProphet 概述

在本文中,我们将尝试用 NeuralProphet 来预测股票价格。NeuralProphet 是由 Meta 公司开发的,据说比之前的 Prophet 软件包更强大。在之前的文章中,我们用 Prophet 做过类似的任务,但效果不太理想。这次,我们将看看 NeuralProphet 是否能带来更好的表现。根据 NeuralProphet 官网的介绍:

NeuralProphet - 使用标准深度学习方法融合传统时间序列算法,基于 PyTorch 构建,灵感来自 Facebook Prophet 和 AR-Net。

NeuralProphet 采用可分解的时间序列模型,其模型组件包括趋势、季节性、事件效应和回归效应。它们的组合公式为:

y(t) = T(t) + S(t) + E(t) + F(t) + A(t) + L(t),

where 

T(t) = Trend at time t
S(t) = Seasonal effects at time t
E(t) = Event and holiday effects at time t
F(t) = Regression effects at time t for future-known exogenous variables
A(t) = Auto-regression effects at time t based on past observations
L(t) = Regression effects at time t for lagged observations of exogenous variables

这种可分解的时间序列在预测领域非常常见。在文章的后半部分,我们会详细讲解如何调整上述方程中的各个组成部分,以便更好地优化预测结果。

官网地址如下:NeuralProphet

二、目的

我们的核心任务是利用过去 N 天的历史数据,预测 Vanguard 全市场 ETF(VTI)每日调整后的收盘价。为了实现这一目标,我们使用了 VTI 从 2013 年 1 月 2 日到 2018 年 12 月 28 日共 6 年的历史价格数据。这些数据可以从雅虎财经轻松获取,下载后的数据集结构如下所示。通过这个项目,我们旨在验证 NeuralProphet 模型在股价预测中的表现,并探索其在实际投资分析中的应用潜力。

我们总共有 1509 天的数据可供使用。整个数据集中的调整后收盘价图如下所示:

我们使用以下公式计算每日收益

其中,r(t) 和 p(t) 分别表示第 t 天的日收益率和调整后收盘价。为了观察每日收益的分布情况,我们绘制了下面的分布图:

如上图所示,分布图非常接近高斯分布。为了进一步验证这一点,我们使用 scipy.stats 软件包绘制概率图,如下所示。对于 scipy.stats 中的概率图,默认情况下是将样本分布与高斯分布进行比较。与红色直线的拟合度越高,则与高斯分布的拟合度越高。我们观察到,除了极端值(约 > +/- 2.5)外,每日回报的分布与高斯分布的拟合程度相当高。

为了全面评估 NeuralProphet 的性能,仅仅在单一日期进行一次预测是远远不够的。因此,我们将在数据集中的多个不同日期进行多次预测,并取这些预测结果的平均值作为最终评估依据。在每次预测中,我们都会将 NeuralProphet 方法与 Last Value 方法进行对比,以更客观地衡量 NeuralProphet 的准确性和稳定性。这种方法不仅能减少随机误差的影响,还能更好地反映模型在实际应用中的表现。

为了评估我们方法的有效性,我们将使用均方根误差 (RMSE)、平均绝对百分比误差 (MAPE) 和平均绝对误差 (MAE) 指标。对于所有指标,数值越小,预测效果越好。

三、训练和验证

为了进行预测,我们需要将数据分为训练集和验证集。具体来说,我们将使用 3 年的数据(约 756 天,按每年 252 个交易日计算)作为训练集,并用接下来 1 年的数据(252 天)作为验证集。这意味着每次预测都需要 1,008 天的数据(756 天训练 + 252 天验证)。模型会在训练集上进行训练,而验证集则用于调整超参数。

为了优化超参数,我们采用了移动窗口验证法。举个例子,假设我们总共有 896 天的数据,并希望在第 857 天进行为期 40 天的预测。根据经验,对于预测范围 H,我们通常每隔 H/2 天进行一次预测。通过 756 天的训练集,我们可以进行 4 次验证(如下图所示)。我们会计算这 4 次验证的误差指标(如 RMSE、MAPE 等),并取其平均值。最终,选择误差平均值最小的超参数组合作为最佳模型配置。确定最佳超参数后,我们将在第 857 天进行预测并报告结果。这种方法不仅能提高模型的稳定性,还能更准确地评估其在实际应用中的表现。

在下文中,我们将首先对数据集的第 1009 天进行预测,预测期限为 21 天(注意,一个月约有 21 个交易日,不包括周末)。对于 NeuralProphet,我们将使用前 1008 天作为训练集和验证集,如上文所述,按 756:252 的比例分割。我们将在下一节首先解释最后值方法。

四、Last Value

在"Last Value"方法中,预测值直接采用最近一次的观测值。具体到我们的应用场景,就是将当前的调整后收盘价预测为前一天的调整后收盘价。这种方法具有以下特点:

  • 实现简单,计算成本最低。
  • 无需进行任何超参数调整。
  • 常被用作评估更复杂预测模型的基准。

基于该方法,我们对数据集第1009天进行了21天期限的预测。这种朴素预测方法虽然简单,但在某些情况下可能表现出令人惊讶的有效性,特别是在时间序列具有较强持续性的情况下。

上述预测的 RMSE 为 1.89,MAPE 为 1.59%,MAE 为 1.80。

五、运行预测


5.1 无超参数调整的 NeuralProphet

要使用 NeuralProphet 运行预测,请使用下面的代码。

from neuralprophet import NeuralProphet, set_random_seed

train_size = 252*3                     # Use 3 years of data as train set
val_size = 252                         # Use 1 year of data as validation set
train_val_size = train_size + val_size # Size of train+validation set
i = train_val_size                     # Day to forecast
H = 21                                 # Forecast horizon

set_random_seed(random_seed) # Set a random seed for reproducibility

m = NeuralProphet()
m.set_plotting_backend("plotly-static")
metrics = m.fit(df_nprophet[i-train_val_size:i])

# Create dataframe with the dates we want to predict
future = m.make_future_dataframe(df_nprophet[i-train_val_size:i], n_historic_predictions=True, periods=H)

# Predict
forecast = m.predict(future)

为了快速直观,我们使用 Prophet 绘制预测图:

m.plot(forecast)

这个模型结构较为基础,其初始配置包括趋势项、每周周期性变化以及年度周期性变化。您可以根据以下方式单独查看每个组成部分的内容。

m.plot_components(forecast);

请注意观察就会发现,周季节性曲线图几乎是平的,这意味着 NeuralProphet 无法检测到周内差异。

单个系数的数值也可以绘制成如下图所示,以获得更深入的了解。

m.plot_parameters()

请注意,上面显示的 "季节性:年图 "和 "季节性:周图 "是成分图的一个周期。

在上图的预测中,显示的是股票收益预测。我们可以使用代码将其转换为价格:

# Convert back to price
est_adj_close = []
prev_tg = df.loc[i-1, 'adj_close']
for n in range(H):
    est_adj_close.append((float(preds_list.iloc[n])/100+1)*prev_tg)
    prev_tg = (float(preds_list.iloc[n])/100+1)*prev_tg

之后,股票价格的预测结果如下。

上述预测的 RMSE 为 1.60,MAPE 为 1.35%,MAE 为 1.52。

5.2 带有超参数调整功能的 NeuralProphet - Changepoints

时间序列的轨迹通常会发生突变。这种变化点检测的强度可以通过参数 n_changepoints 来调整。增加 n_changepoints 会使趋势更灵活,导致过度拟合。减少 n_changepoints 会降低趋势的灵活性,导致拟合不足。默认情况下,该参数设置为 10。

在偏移量 m 的基础上,再将增长率 k 乘以自起点 t0 起的时间差 (t1-t0),就得到了 t1 时刻的趋势效应。

trend(t1) = m + k(t1 - t0) = trend(t0) + k(t1-t0)

测试 n_变化点的值为 2、5、10、15 和 20。对于 n_changepoints 的每个值,我们使用训练集和验证集进行预测,结果如下:

上述过程共耗时 8 分钟。接下来,我们使用这个值在测试集上运行预测。结果如下所示。

上述预测的 RMSE 为 2.75,MAPE 为 2.35%,MAE 为 2.65。

5.3 带有超参数调整的 NeuralProphet - Monthly Seasonality


每月的季节性可以在 NeuralProphet 中这样设置:

m = NeuralProphet()
m = m.add_seasonality(name="monthly", period=30.5, fourier_order=3)


NeuralProphet 中的季节性是借助傅立叶项来建模的。上述傅立叶阶数指的是用于估计季节性的偏和中的项数。

使用 2、4、6、8 和 10 的傅立叶阶数值进行测试。对于每个傅立叶阶数值,我们使用训练集和验证集进行预测,结果如下:

上述过程总共耗时 8 分钟。接下来,我们使用这个值在测试集上进行预测。结果如下所示。


上述预测的 RMSE 为 2.19,MAPE 为 1.87%,MAE 为 2.12。

5.4 带有超参数调整功能的 NeuralProphet - 活动和假期

在节假日期间,股市的走势可能会受到影响。以“圣诞反弹”现象为例,这是指股市在圣诞节期间通常会出现的上涨趋势。NeuralProphet 在进行市场预测时能够将这些特定事件纳入考量。为此,我们首先需要创建一个事件数据框,如下所示,这一步骤可以通过导入CSV文件轻松完成。

事件可以在 NeuralProphet 中这样设置(events 就是上图所示的数据帧):

m = NeuralProphet()
m.add_events("hols", lower_window=lower_window, upper_window=upper_window)
history_df = m.create_df_with_events(df, holidays)
m.fit(history_df)
future = m.make_future_dataframe(history_df, events_df=events, n_historic_predictions=True, periods=H)
forecast = m.predict(future)

窗口大小超参数将假期扩展到日期周围的 [lower_window, upper_window]天数。为简单起见,假设 lower_window 和 upper_window 的大小相同,即 lower_window = upper_window = 窗口大小。我们将测试窗口大小的值 0、1 和 2。对于每个窗口大小值,我们使用训练集和验证集进行预测,结果如下:

过程共耗时 5 分钟。接下来,我们使用这个值在测试集上进行预测。结果如下所示。

预测的 RMSE 为 2.05,MAPE 为 1.74%,MAE 为 1.96。

5.5 带有超参数调整功能的 NeuralProphet - 自回归

自回归是一种时间序列模型,它使用前一时间步的观测值作为回归方程的输入,以预测下一时间步的值。

NeuralProphet 中的自回归由 n_lags 参数决定。我们将测试 n_lags 的值 0、2、5 和 10。对于每个 n_lags 值,使用训练集和验证集进行预测,结果如下:

上述过程共耗时 7 分钟。接下来,我们使用这个值在测试集上运行我们的预测。结果如下所示。

预测的 RMSE 为 1.18,MAPE 为 0.89%,MAE 为 1.01。

5.6 带有超参数调整功能的 NeuralProphet - 结合所有超参数

下一步将测试超参数的组合,找出最佳的超参数集。以网格搜索方式测试上述每个超参数组合总共需要 5 * 5 * 3 * 4 * 7 分钟 = 35 小时。为了节省时间,参考上述结果,只用以下值进行测试:

n_changepoints_list = [2, 5]
fourier_order_list = [6, 8]
window_list = [1]         
n_lags_list = [0, 2] 

此外,我们还尝试了上述超参数,首先是不带事件超参数的超参数,其次是带事件超参数的超参数。以下是不带事件超参数的结果。

以下是使用事件超参数得出的结果。

从上面可以看出,n_changepoints、fourier_order、window 和 n_lags 的最佳值分别为 2、6、1、2 和使用事件。接下来,我们使用这些值在测试集上运行我们的预测。结果如下所示。

上述预测的 RMSE 为 1.04,MAPE 为 0.81%,MAE 为 0.91。

经过对所有超参数的细致优化,我们在第1009天的预测中,利用NeuralProphet模型取得了卓越的表现。在完成超参数的全面调整后,该模型在RMSE、MAPE和MAE指标上均达到了最低值,超越了包括Last Value基准在内的其他所有预测方法。接下来,我们将探究NeuralProphet模型在其他日期的预测成效。

5.7 多日预测

在审视了上述超参数调整带来的成果之后,我们计划将这种方法扩展应用,以对连续多天进行预测。我们的预测将从数据集的第1009天起步,并以42天为周期进行新一轮预测。鉴于数据集包含1509天的数据,我们将执行共计12轮的预测。每轮预测都将覆盖未来21天的时间范围。同时,对于每一天t的预测,我们都将应用之前确定的最优超参数配置。

从上文中可以明显看出,并非所有的预测结果都是理想的。有些日期的预测方向和幅度与实际值相当接近,然而在其他日期,预测的方向和幅度则与实际值相去甚远。以下展示了每项预测的性能指标结果。

让我们将上述结果与下图所示的 " Last Value "方法进行比较。

NeuralProphet 在12次预测中的平均RMSE为2.15,平均MAPE为1.41%,平均MAE为1.88。相比之下,Last Value方法的平均RMSE为2.53,平均MAPE为1.69%,平均MAE为2.26。在这些指标上,NeuralProphet 显然表现更为优异。这一结果颇为有趣,因为在我的先前实验中,使用的是Prophet而非NeuralProphet,那时Last Value方法的表现更为突出。在这个案例中,NeuralProphet 的贡献不容小觑。

六、观点总结

  • NeuralProphet 在股价预测中表现卓越:文章通过对比 Last Value 方法和 Prophet 模型,证实 NeuralProphet 在预测股价时具有更高的准确性,成为金融分析中的新利器。
  • 超参数调优是提升模型性能的关键:作者通过调整 changepoints、fourier_order、window_size 和 n_lags 等超参数,展示了如何优化模型,从而显著提升预测效果。
  • 事件和假期对股市影响不可忽视:文章强调了节假日和特殊事件对股价波动的重要性,提醒我们在建模时需充分考虑这些因素,以提高预测精度。
  • 自回归显著提升预测准确性:通过引入自回归参数 n_lags,NeuralProphet 能够更好地捕捉时间序列中的动态变化,从而大幅提升预测的可靠性。
  • NeuralProphet 具备高度灵活性和扩展性:作者通过添加事件数据框架和调整季节性参数,展示了 NeuralProphet 如何适应复杂的市场环境,满足多样化的预测需求。
  • 多日预测实验证明 NeuralProphet 的优越性:在多次预测实验中,NeuralProphet 的 RMSE、MAPE 和 MAE 指标均优于 Last Value 方法,展现了其在股价预测领域的巨大潜力。

代码地址:Stocks2025/StockReturnsPrediction_fh21/StockReturnsPrediction_v9_neuralprophet.ipynb at master · alexyu2013/Stocks2025 · GitHub

谢您阅读到最后,希望本文能给您带来新的收获。码字不易,请帮我点赞、分享。祝您投资顺利!如果对文中的内容有任何疑问,请给我留言,必复。


本文内容仅限技术探讨和学习,不构成任何投资建议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2294128.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习-103-RAG技术之通过分块技术提升RAG的效果

文章目录 1 RAG中的分块技术1.1 RAG是什么1.2 分块chunking是什么1.3 分块的重要性1.4 分块的技巧2 固定字符大小分块2.1 固定字符大小分块的优缺点2.2 自定义分块代码2.3 LangChain的CharacterTextSplitter3 递归字符文本分割3.1 递归字符文本分割的优缺点3.2 LangChain的Recu…

【B站保姆级视频教程:Jetson配置YOLOv11环境(六)PyTorchTorchvision安装】

Jetson配置YOLOv11环境(6)PyTorch&Torchvision安装 文章目录 1. 安装PyTorch1.1安装依赖项1.2 下载torch wheel 安装包1.3 安装 2. 安装torchvisiion2.1 安装依赖2.2 编译安装torchvision2.2.1 Torchvisiion版本选择2.2.2 下载torchvisiion到Downloa…

Java进阶14 TCP日志枚举

Java进阶14 TCP&日志&枚举 一、网络编程TCP Java对基于TCP协议得网络提供了良好的封装,使用Socket对象来代表两端的通信端口,并通过Socket产生IO流来进行网络通信。 1、TCP协议发数据 1.1 构造方法 方法 说明 Socket(InetAddress address…

[LVGL] 在VC_MFC中移植LVGL

前言: 0. 在MFC中开发LVGL的优点是可以用多个Window界面做辅助扩展 1.本文基于VC2022-MFC单文档框架移植lvgl8 2. gitee上下载lvgl8.3 源码,并将其文件夹改名为lvgllvgl: LVGL 是一个开源图形库,提供您创建具有易于使用的图形元素、漂亮的…

Crewai框架配置回调函数

官方文档里只指提了一句 不过不太难,在crew.py文件里配置一下就行了,下面是一个demo,这个函数会在research_task任务执行完触发(配置LLM这里请看我这篇博客) from crewai import Crew, Process, Agent, Taskfrom src.…

拧紧“安全阀”,AORO-P300 Ultra防爆平板畅通新型工业化通信“大动脉”

在油气管道泄漏的浓烟中,在矿道坍塌的密闭空间里,在洪水肆虐的救援现场,传统通讯设备频频失效的困境已成为历史。AORO-P300 Ultra防爆平板集5G通讯、红外感知、应急照明等实用功能于一体,以军工级防护与全场景智能应用&#xff0c…

基于docker搭建Kafka集群,使用KRaft方式搭建,摒弃Zookeeper

KAFKA基于docker使用KRaft进行集群搭建 环境:已成功搭建kafka服务 可点击链接跳转至安装kafka-3.8.0版本 并启用SASL认证 教程 使用基于Zookeeper方式搭建集群教程 kafka-3.8.0版本 并启用SASL认证 教程 搭建kafka-ui可视化工具 192.168.2.91 192.168.2.92 192…

CAD导入与解析,助力工业数据可视化高效呈现

背景 在企业的日常设计与管理中,CAD图纸早已成为不可或缺的重要资产,多年来知识积累的载体,凝聚了大量的心血与智慧。然而,CAD图纸往往只作为静态文件保存,应用场景较为有限。在数字经济时代,如何让CAD图纸…

基于docker部署kafka-3.8.0版本,并开启SASL认证模式

1、下载安装包 (1)https://kafka.apache.org/downloads 下载如下图版本 2、解压安装包 执行tar -xvf kafka_2.13-3.8.0.tgz命令对安装包进行解压。 3、增加配置文件 (1)进入 /kafka_2.13-3.8.0/config 目录 (2&a…

从零开始人工智能Matlab案例-KNN的二维数据分类

基于K最近邻(K-Nearest Neighbors, KNN)算法的二分类案例,包含完整MATLAB代码、算法原理和核心思想说明。此案例使用合成数据集,无需复杂数据预处理,适合快速理解。 案例:基于KNN的二维数据分类 目标&…

Spring AOP 扫盲

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…

DeepSeek 提示词之角色扮演的使用技巧

老六哥的小提示:我们可能不会被AI轻易淘汰,但是会被“会使用AI的人”淘汰。 在DeepSeek的官方提示库中,有“角色扮演(自定义人设)”的提示词案例。截图如下: 在“角色扮演”的提示词案例中,其实…

python3中错误与异常初识

一. 简介 在 编写 Python时,经常会遇到一些报错信息。接下来开始学习 Python3 中错误和异常。 本文首先初步了解一下 Python3中的错误和异常。 二. python3 中错误与异常初识 Python 中有两种错误:语法错误与异常。 1. 语法错误 Python 的语法错误…

【图像处理】- 基本图像操作

基本图像操作详解 基本图像操作是图像处理的基础,涵盖了对图像进行简单但重要的变换。以下是几种常见的基本图像操作及其详细说明: 1. 裁剪 (Cropping) 描述:从原始图像中提取一个矩形区域。 实现方法: 使用图像的坐标系指定…

Attention is All You Need-Transformer模型论文精读+架构分析--简单易懂版

Foreword写在前面的话: 大家好,我是一名刚开始学习Transformer的新手。这篇文章是我在学习Transformer过程中的一些笔记和心得,希望能和同样在学习人工智能深度学习模型的朋友们分享。由于我的知识有限,文章中可能存在错误或不准确…

Qt跨屏窗口的一个Bug及解决方案

如果我们希望一个窗口覆盖用户的整个桌面,此时就要考虑用户有多个屏幕的场景(此窗口要横跨多个屏幕),由于每个屏幕的分辨率和缩放比例可能是不同的,Qt底层在为此窗口设置缩放比例(DevicePixelRatio&#xf…

Spark--算子执行原理

一、sortByKey SortByKey是一个transformation算子,但是会触发action,因为在sortByKey方法内部,会对每个分区进行采样,构建分区规则(RangePartitioner)。 内部执行流程 1、创建RangePartitioner part&…

javaEE-6.网络原理-http

目录 什么是http? http的工作原理: 抓包工具 fiddler的使用 HTTP请求数据: 1.首行:​编辑 2.请求头(header) 3.空行: 4.正文(body) HTTP响应数据 1.首行:​编辑 2.响应头 3.空行: 4.响应正文…

windows版的docker如何使用宿主机的GPU

windows版的docker使用宿主机的GPU的命令 命令如下 docker run -it --nethost --gpus all --name 容器名 -e NVIDIA_DRIVER_CAPABILITIEScompute,utility -e NVIDIA_VISIBLE_DEVICESall 镜像名效果 (transformer) rootdocker-desktop:/# python Python 3.9.0 (default, Nov 15 …

【C++】STL——list的使用

目录 💕1.带头双向链表List 💕2.list用法介绍 💕3.list的初始化 💕4.size函数与resize函数 💕5.empty函数 💕6.front函数与back函数 💕7.push_front,push_back,pop_front,pop_back函数…