时间序列预测(十五)——有关Python项目框架的实例分析

news2024/11/30 9:53:29

#1024程序员节|征文#

在之前的学习中,已经对时间序列预测的相关内容有了大致的了解。为了进一步加深理解,并能够将所学知识应用于实际中,我决定找一个完整的Python框架来进行深入学习。经过寻找,我终于找到了一篇非常具有参考价值的源代码,非常感激。

接下来,我将详细记录自己的学习过程和心得,以便更好地掌握和应用时间序列预测技术。

这个项目的目录结构如下,展示了一个使用不同深度学习框架(Keras、PyTorch 和 TensorFlow)来进行股票价格预测的 Python 框架,包含多个模型文件和预测图像。

stock_predict_with_LSTM-master
│
├── data                                  # 存放数据集
│   └── stock_data.csv
│
├── figure                                # 存放预测结果的图像
│   ├── continue_predict_high_with_pytorch.png
│   ├── continue_predict_low_with_pytorch.png
│   ├── predict_high_with_pytorch.png
│   └── predict_low_with_pytorch.png
│
├── model                                 # 存放不同框架下的模型文件
│   ├── __pycache__                       # Python 缓存目录
│   │    ├── __init__.cpython-38.pyc
│   │    └── model_pytorch.cpython-38.pyc
│   ├── __init__.py                       # 包声明文件
│   └── model_pytorch.py                  # PyTorch 模型实现
│
├── .gitignore                            # Git忽略文件,列出不提交到仓库的文件类型
├── LICENSE                               # 项目的许可证
├── main.py                               # 项目的主入口,通常是执行的主程序
├── README.md                             # 项目说明文档,介绍如何运行和使用该项目
├── requirements.txt                      # 列出项目依赖的 Python 包

一、data文件

该文件夹主要用于存放数据集,这里只有一个数据集,是.csv文件,部分数据如下图所示。

index_codedateopencloselowhighvolumemoneychange
sh0000011990/12/20104.3104.3999.98104.39197000850000.044109
sh0000011990/12/21109.07109.13103.73109.1328000161000.045407
sh0000011990/12/24113.57114.55109.13114.5532000311000.049666
sh0000011990/12/25120.09120.25114.55120.251500065000.04976
sh0000011990/12/26125.27125.27120.25125.27100000537000.041746
sh0000011990/12/27125.27125.28125.27125.28660001046007.98E-05
sh0000011990/12/28126.39126.45125.28126.45108000880000.009339

二、figure文件夹

该文件夹主要用于存放不同框架(如 PyTorch、Keras、TensorFlow)进行股票高价和低价预测的结果图像。

、model文件夹

1、__pycache__文件夹

 __pycache__ 目录是 Python 自动生成的,用于存储已编译的字节码文件(.pyc 文件)。这些文件通常不需要手动编辑或提交到版本控制系统中,但 .gitignore 文件(后面介绍)通常会包含规则来忽略这些文件。

2、__init__.py文件

主要是用于声明 model是一个 Python 包,可以被导入到其他模块中。文件夹里为空。

主要展示使用Keras的深度学习框架来构建 LSTM 模型进行股票预测

3、model_pytorch.py文件(主要学习)

主要展示使用PyTorch的深度学习框架来构建 LSTM 模型进行股票预测

(1)定义模型类

定义一个名为Net的类,包含了LSTM(长短期记忆)层和全连接层。这个模型通过LSTM层处理时间序列数据,捕获数据中的长期依赖关系,然后通过全连接层将LSTM的输出(形状是 [batch_size, sequence_length, hidden_size])映射到期望的输出大小(形状是[batch_size, hidden_size])。

# 定义模型类  
class Net(Module):  
    '''  
     定义包含LSTM和全连接层的PyTorch模型,用于时间序列预测。
    '''  
    # 其中,Config 是一个用于配置模型训练、验证和预测过程的参数集合,
    # 通常定义在一个单独的配置文件或类中(这里定义在main.py)。它包含关于模型结构、训练设置、数据路径等的关键参数。
    def __init__(self, config):  
        super(Net, self).__init__()  
        # 初始化LSTM层:输入为config.input_size,隐藏单元为config.hidden_size,层数为config.lstm_layers  
        # batch_first=True表示输入张量的第一个维度是批次大小,dropout=config.dropout_rate指定在LSTM层之间应用的dropout率,以防止过拟合。 
        self.lstm = LSTM(input_size=config.input_size, hidden_size=config.hidden_size,  
                         num_layers=config.lstm_layers, batch_first=True, dropout=config.dropout_rate)  
        # 初始化全连接层 :用于将LSTM的最后输出映射为期望的输出大小 
        self.linear = Linear(in_features=config.hidden_size, out_features=config.output_size)  
  
    def forward(self, x, hidden=None):  
        # 前向传播  
        lstm_out, hidden = self.lstm(x, hidden)  
        # 提取LSTM的最后时间步输出,输入到全连接层  
        linear_out = self.linear(lstm_out[:, -1, :])  
        return linear_out, hidden  

lstm_out[:, -1, :] 仅提取了 LSTM 输出的最后一个时间步的数据。其中 : 表示选择所有样本(在第一个维度上);-1 表示选择最后一个时间步(在第二个维度上),这并不是说第二个维度“消失了”,而是说它在这个特定的索引操作中不再以原来的大小存在,被“压缩”了; : 表示选择该时间步的所有隐藏状态特征(在第三个维度上)。因此,这个操作的结果是一个形状为 [batch_size, hidden_size] 的张量。 属于单步预测。

(2)定义训练函数  
def train(config, logger, train_and_valid_data):  

这里的输入有三个:

Config 是用于配置模型的参数集合,logger 用于输出训练日志,train_and_valid_data 是包含训练和验证数据的元组或列表(train_X, train_Y, valid_X, valid_Y)

a、首先要分离数据,并创建数据加载器

分离成训练和验证两个数据集,这里使用DataLoaderTensorDataset创建数据加载器,可以分批次输入数据并计算损失,降低对计算资源的需求

  # 创建DataLoader  
    train_loader = DataLoader(TensorDataset(train_X, train_Y), batch_size=config.batch_size)  
    valid_loader = DataLoader(TensorDataset(valid_X, valid_Y), batch_size=config.batch_size) 
  • TensorDataset(train_X, train_Y) 将训练集特征和目标打包到一起,使得 DataLoader 能够一次性处理对应的输入和目标
  • DataLoader 用于将 TensorDataset 生成的小批次数据集,用 config.batch_size 指定每个批次的样本数量。

b、设置设备,并将模型移动到指定设备

device = torch.device("cuda:0" if config.use_cuda and torch.cuda.is_available() else "cpu") 

这段代码用于检测用户配置和系统是否满足 GPU 的使用条件。如果满足(即use_cuda=True 且系统检测到 GPU),则选择 cuda:0(第一个 GPU)作为训练设备;否则,选择 cpu

之后将模型移动到指定设备

    # 初始化模型并移动到指定设备  

    model = Net(config).to(device)  

这里还涉及到 “增量训练”,

 # 增量训练(如果配置中启用了增量训练)  ,加载已保存的模型参数 
    if config.add_train:  
        model.load_state_dict(torch.load(config.model_save_path + config.model_name))  

具体介绍可参考这篇文章介绍:

时间序列预测(十三)——增量训练(Incremental Learning)-CSDN博客

c、初始化优化器和损失函数

使用Adam优化器来更新模型参数。使用均方误差(MSE)作为损失函数。

d、 训练循环

在所有的训练周期(epoch)内都要进行俩个模式:训练模式和评估模式。

        model.train()  # 设置模型为训练模式  

在训练模式下,遍历训练数据加载器,进行前向传播、计算损失、反向传播和参数更新。根据配置决定是否清除隐藏状态的梯度。如果启用了可视化,则绘制训练损失。

这里损失计算时会有问题,需要将_train_Y 的形状与pred_Y 形状(二维)匹配,以便能够正确计算损失

            _train_Y = _train_Y[:, -1, :]  # 选择最后一个时间步的输出,形状为 [64, 2]

结束后,设置模型为评估模式。

        model.eval()  # 设置模型为评估模式  

遍历验证数据加载器,计算验证损失。计算并输出当前轮次的训练和验证损失。如果启用了可视化,则绘制每个轮次的训练和验证损失。

这里也有问题,需要将_valid_Y 的形状与pred_Y 形状(二维)匹配,以便能够正确计算损失

            _valid_Y = _valid_Y[:, -1, :]  # 选择最后一个时间步的输出,形状 [64, 2]

最后还设置了早停机制。

if valid_loss_cur < valid_loss_min:  
            valid_loss_min = valid_loss_cur  
            bad_epoch = 0  
            # 保存最优模型  
            torch.save(model.state_dict(), config.model_save_path + config.model_name)  
        else:  
            bad_epoch += 1  
            if bad_epoch >= config.patience:   # 若验证集损失未减小,则提前终止训练 
                logger.info(" The training stops early in epoch {}".format(epoch))  
                break  

根据早停机制,如果验证损失达到新低(即当前验证损失小于之前记录的最小验证损失),则保存模型并重置早停计数器;否则(即,验证损失没有改善),则增加早停计数器,如果早停计数器超过了配置的耐心值(patience),则提前终止训练。

有关训练模式和评估模式的区别可以参考下面这篇文章:

时间序列预测(十二)——训练模式、评估模式和预测模式的区别-CSDN博客

(3)定义预测函数  
def predict(config, test_X):  

这里的输入有两个:

Config 是用于配置模型的参数集合,test_X:是测试数据集。

之后和训练函数有些相似

a、创建数据加载器

# 转换测试数据为Tensor  
    test_X = torch.from_numpy(test_X).float()  
    test_set = TensorDataset(test_X)  
    test_loader = DataLoader(test_set, batch_size=1)  
  

 b、设置设备,并将模型移动到指定设备

device = torch.device("cuda:0" if config.use_cuda and torch.cuda.is_available() else "cpu")  
    model = Net(config).to(device)  
    model.load_state_dict(torch.load(config.model_save_path + config.model_name))  

c、进行预测

首先,将模型设置为评估模式

 model.eval()  

之后,遍历测试数据加载器,对于每个批次的数据:将数据移动到指定的设备上,使用模型进行预测,并更新隐藏状态。

这里还会使用 torch.squeeze(pred_X, dim=0) 移除预测结果中多余的维度(这是由于数据加载器 DataLoader 的批次大小设为1(batch_size=1),那么预测结果 pred_X 的形状会是 [1, sequence_length, features],其中第一个维度(批次维度)仅包含单个元素。为简化后续处理,可移除该批次维度,使 pred_X 形状变为 [sequence_length, features]。)。

也使用 torch.cat((result, cur_pred), dim=0) ,将每次预测的结果cur_pred在指定的维度(这里是维度0,即行的方向)上与result进行拼接,添加到result中,从而汇总所有的预测结果。

        data_X = _data[0].to(device)  
        pred_X, hidden_predict = model(data_X, hidden_predict)  
        cur_pred = torch.squeeze(pred_X, dim=0)  # 移除多余的维度  
        result = torch.cat((result, cur_pred), dim=0)  # 拼接预测结果  

最后使用 detach() 方法将 result从计算图中分离,并移动到CPU上,使用 .numpy() 方法将Tensor转换为NumPy数组,以便后续处理。

    return result.detach().cpu().numpy() 

四、剩下的文件

1、.gitignore:

用于告诉 Git 哪些文件或文件夹不应该提交到版本控制系统中。通常包含 .pyc 缓存文件、虚拟环境文件等。

2、LICENSE:

项目的开源许可证,指明项目的使用权利和限制。这里是一个宽松的开源许可证Apache许可证2.0

3、main.py:

该文件是项目的主入口,应该包含整个项目的运行逻辑。通常从这里加载数据、构建模型并进行训练和预测。

(1)配置类 (Config)

a、数据参数

定义特征列和目标列的索引,设置预测的天数。

b、网络参数

包括输入输出大小、LSTM层数、隐藏层大小、dropout概率和时间步长。

c、训练参数

训练和验证的设置(如批量大小、学习率、训练周期等),并配置随机种子以确保结果可复现。

d、路径参数

定义数据、模型、图形和日志文件的保存路径,并创建必要的目录。

(2)数据处理类 (Data)

a、数据读取

    def read_data(self):

读取CSV文件,如果处于调试模式 (debug_mode),则只读取部分数据(debug_num 行)。否则,读取的数据包含特定的特征列 (feature_columns)。最后返回数据值和列名

b、获取训练和验证数据

    def get_train_and_valid_data(self):

从归一化后的数据中提取特征数据和标签数据,根据是否连续训练 (do_continue_train),采用不同的方式生成训练样本 (train_x 和 train_y),使用 train_test_split 方法划分训练集和验证集。

c、获取测试数据

    def get_test_data(self, return_label_data=False) -> np.ndarray:

从归一化后的数据中提取测试特征数据,根据时间步长 (time_step) 生成测试样本 (test_x)。

如果 return_label_data 为 True,则同时返回标签数据。

(3) 日志记录函数 (load_logger)
def load_logger(config: Config) -> logging.Logger:

创建和配置日志记录器,根据配置决定是否将日志输出到屏幕 (do_log_print_to_screen) 和文件 (do_log_save_to_file)。

(4)绘图函数 (draw)
def draw(config: Config, origin_data: Data, logger, predict_norm_data: np.ndarray):

用于绘制真实值和预测值的函数,便于可视化模型的预测效果。

可能是前面形状的修改,导致这里predict_datalabel_data也出现了形状问题,做了一些修改的。

这里还有问题,在修改中,,,,,

(5)主函数(main)
def main(config):
(6if __name__ == "__main__"(最重要、必不可少)

这部分代码是Python脚本的标准做法,用于确保当脚本被直接运行时才执行某些代码。

a、导入 argparse库,

b、创建并配置 argparse 解析器

parser = argparse.ArgumentParser()  
# 可以根据需要添加更多参数  
args = parser.parse_args()

创建一个 ArgumentParser 实例,并调用 parse_args 方法来解析命令行参数

c、创建配置实例并设置属性

con = Config()  # 创建配置实例  
for key in dir(args):  # 遍历 args 的所有属性  
    if not key.startswith("_"):  # 排除内部属性  
        setattr(con, key, getattr(args, key))  # 将属性值赋给配置

创建了一个 Config 类的实例,用于存储配置信息。然后,遍历 args 对象的所有属性,将这些属性的值复制到 con 配置对象中。这里使用一个条件来排除以 _ 开头的属性,这些属性通常是 argparse 内部使用的。

d、运行主函数

main(con)  # 运行主函数

最后,这行代码调用 main 函数,并将配置对象 con 作为参数传递给它。

4、README.md:

这个文件通常提供项目的介绍和使用说明,帮助用户理解如何设置和运行项目。

5、requirements.txt:

该文件主要是列出项目的依赖包。本项目的依赖包如下:

pandas>=1.0.0
argparse
tensorflow>=2.5.0
matplotlib>=3.0.2
numpy>=1.14.6
scipy>=1.1.0
torch>=1.8.0
scikit-learn>=0.20.0
visdom

要安装 requirements.txt 文件中列出的所有依赖,可以使用 Python 的包管理工具 pip

在命令行中,导航到包含 requirements.txt 文件的目录,并运行以下命令:

pip install -r requirements.txt

这里的 -r 选项告诉 pip 从一个文件中读取依赖包列表,并进行安装。

到此就完全讲解结束了,以下是运行结果

五、运行结果

总结:

经过学习,可以做以下几点拓展:

  • 多步预测:可以尝试为多步预测的时间序列预测模型。
  • 更多模型:可以尝试加入更多的时间序列预测模型,如 GRU(Gated Recurrent Unit)或双向 LSTM,并观察它们与现有模型的表现对比。
  • 新的数据集:可以尝试将该框架应用到其他时间序列数据集上,如温度预测、电力负荷预测等,以扩展其应用场景。

参考文章:

hichenway/stock_predict_with_LSTM: Predict stock with LSTM supporting pytorch, keras and tensorflow (github.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2225927.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电脑技巧:如何进行磁盘测速?

磁盘测速是指通过专业工具或系统自带功能&#xff0c;测量硬盘的读写速度。这一过程能够帮助用户了解磁盘的性能瓶颈&#xff0c;并为硬件升级或系统优化提供数据依据。特别是在处理大量数据或运行高负载应用时&#xff0c;磁盘速度是决定系统性能的关键因素。 影响磁盘速度的因…

Web 核心指标优化之 INP 篇

这篇文章是我在公司做 INP 优化经验分享的演讲稿。 大家好&#xff0c;今天我要做的分享是关于 INP 的一些优化经验。 概念 首先&#xff0c;什么叫 INP 呢。 INP 的全称叫 Interaction to Next Pain &#xff0c;翻译过来就是从交互到下一次绘制的延迟。这是 Google 提出来的…

C#与C++互操作时的数据类型对应

C#和C在互操作时&#xff0c;会涉及到数据类型对应的问题&#xff0c;如果数据类型用得不对&#xff0c;就会得不到想要的结果&#xff0c;严重的情况下&#xff0c;可能还会导致程序崩溃。这里做一下相关知识点的总结。 说明&#xff1a; 1. 表格第一列是Visual C中的数据类型…

【Docker大揭秘】

Docker 调试一天的血与泪的教训&#xff1a;设备条件&#xff1a;对应的build preparation相应的报错以及修改 作为记录 构建FASTLIO2启动docker获取镜像列出镜像运行containerdocker中实现宿主机与container中的文件互传 调试一天的血与泪的教训&#xff1a; 在DOCKER中跑通F…

numpy——数学运算

一、标量——矢量 import numpy as npa 3.14 b np.array([[9, 5], [2, 7]])print(a) print(b)# ---------- 四则运算 ---------- print(a b) # np.add print(a - b) # np.subtract print(a * b) # np.multiply print(a / b) # np.divide 二、矢量——矢量 import nump…

Claude Financial Data Analyst:基于Claude的金融数据分析工具!免费开源!

大家好&#xff0c;我是木易&#xff0c;一个持续关注AI领域的互联网技术产品经理&#xff0c;国内Top2本科&#xff0c;美国Top10 CS研究生&#xff0c;MBA。我坚信AI是普通人变强的“外挂”&#xff0c;专注于分享AI全维度知识&#xff0c;包括但不限于AI科普&#xff0c;AI工…

MPC模型预测控制与RL强化学习的差异性

模型预测控制&#xff08;Model Predict Control&#xff0c;MPC&#xff09; 模型预测控制与强化学习的差异性调研 概述 MPC 是一种使用数学模型在有限时间内实时优化控制系统的技术&#xff0c;自二十世纪六七十年代问世以来&#xff0c;已广泛应用于化学工程、炼油、先进…

Java:String类(超详解!)

一.常用方法 &#x1f94f;1.字符串构造 字符串构造有三种方法&#xff1a; &#x1f4cc;注意&#xff1a; 1. String是引用类型&#xff0c;内部并不存储字符串本身 如果String是一个引用那么s1和s3应该指向同一个内容&#xff0c;s1和s2是相等的&#xff0c;应该输出两…

《深度学习》模型的部署、web框架 服务端及客户端案例

目录 一、模型的部署 1、模型部署的定义与目的 1&#xff09;定义 2&#xff09;目的 2、模型部署的步骤 1&#xff09;导出模型 2&#xff09; 部署模型 3&#xff09;测试模型 4&#xff09;监控模型 3、模型部署的方式 1&#xff09;云端部署 2&#xff09;嵌入…

autMan奥特曼机器人-对接Docker版本NTQQ详细教程

准备 1、准备一台服务器&#xff0c;amd64/arm64都可以&#xff0c;配置最好还是2核保底吧。 2、准备一个VNC软件。1Remote&#xff1a;点此下载 3、准备手机登陆机器人QQ号&#xff0c;扫码 NTQQ相关 NTQQ一键脚本&#xff08;适用于小白支持autMan/无界&#xff09; 复制以…

linux标准 I/O

FILE 指针标准输入、标准输出和标准错误检查或复位状态I/O 缓冲控制文件 I/O 内核缓冲的标志直接 I/O&#xff1a;绕过内核缓冲stdio 缓冲 FILE 指针 FILE 是一个结构体数据类型&#xff0c;它包含了标准 I/O 库函数为管理文件所需要的所有信息&#xff0c;包括用于实际I/O 的…

基于Spring Boot的宿舍管理系统设计与实现(源码+定制+开发)宿舍信息管理平台、智能宿舍系统开发、学生宿舍管理平台设计、宿舍入住与信息管理

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…

单节点kubernetes-1.20二进制部署

文章目录 一, 集群拓扑二&#xff0c;架构图三&#xff0c;前置准备1.环境准备1.1操作系统初始化配置&#xff08;1&#xff09;关闭防火墙&#xff08;2&#xff09;关闭selinux&#xff08;3&#xff09;关闭swap&#xff08;4&#xff09;根据规划设置主机名&#xff08;5&a…

[简易版] 自动化脚本

前言 uniapp cli项目中没办法自动化打开微信开发者工具&#xff0c;需要手动打开比较繁琐&#xff0c;故此自动化脚本就诞生啦~ 实现 const spawn require("cross-spawn"); const chalk require("picocolors"); const dayjs require("dayjs&quo…

实战教程:利用Docker容器化技术部署Szurubooru图像分享平台

实战教程&#xff1a;利用Docker容器化技术部署Szurubooru图像分享平台 一、Szurubooru介绍1.1 Szurubooru简介1.2 主要特点1.3 主要使用场景 二、本次实践规划2.1 本地环境规划2.2 本次实践介绍 三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker comp…

numpy——索引切片

一、索引和切片 import numpy as npx np.arange(48).reshape(6, 8) print(x)# 选取第二行 print(x[1]) #从0开始&#xff0c;取得第2行# 选取第二行, 第二列 print(x[1][1])# 选取第三行到最后一行, 第一列到最后一列 print(x[2:,2:])# 花式索引 (1, 1) 和 (4, 4) print(&quo…

MPP音视频总结

基础篇 1.常用图像格式介绍 常用图像像素格式 RGB 和 YUV。 1.1RGB RGB分类通常指的是将图像或颜色按照RGB&#xff08;红、绿、蓝&#xff09;颜色空间进行分组或分类。RGB图像格式通常包括RGB24&#xff08;RGB888&#xff09;、RGB32、RGBA、RGB565等。 RGB24是一种常用…

【CSS】入门详解

你是否曾经浏览网页时&#xff0c;被一些网站精美的布局、炫酷的动画和赏心悦目的色彩所吸引&#xff1f;这背后神奇的力量就是 CSS&#xff08;层叠样式表&#xff09;。CSS 就像网页的化妆师&#xff0c;它负责网页的样式和布局&#xff0c;让原本枯燥的 HTML 结构变得生动有…

AttributeError: module ‘pandas‘ has no attribute ‘datetime‘

今天在进行时间序列问题处理时候&#xff0c;发生如下报错&#xff1a; AttributeError: module pandas has no attribute datetime 因为在新的pands版本中pandas已不再支持datetime模块。 from datetime import datetime 需要导入datetime库。 原代码&#xff1a; impor…

2025选题|基于Hadoop的物品租赁系统的设计与实现

作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验&#xff0c;被多个学校常年聘为校外企业导师&#xff0c;指导学生毕业设计并参与学生毕业答辩指导&#xff0c;…