25.读写文件

news2026/4/10 18:57:35

到目前为止，我们讨论了如何处理数据，以及如何构建、训练和测试深度学习模型。

然而，有时我们希望保存训练的模型，以备将来在各种环境中使用（比如在部署中进行预测）。

此外，当运行一个耗时较长的训练过程时，最佳的做法是定期保存中间结果，以确保在服务器电源被不小心断掉时，我们不会损失几天的计算结果。

因此，现在是时候学习如何加载和存储权重向量和整个模型了。

1. 加载和保存张量

对于单个张量，我们可以直接调用load和save函数分别读写它们。这两个函数都要求我们提供一个名称，save要求将要保存的变量作为输入。

import torch
from torch import nn
from torch.nn import functional as F

x = torch.arange(4)
torch.save(x,'x-file') # 把矩阵x存在文件x-file中，会在当前目录中存储

x2 = torch.load("x-file") # 将存储在文件中的数据读回内存
x2

在这里插入图片描述

在这里插入图片描述
文件类型是二进制类型的，存一个只有一个元素的tensor就占747B，里面是pytorch自定义的格式。

我们可以存储一个张量列表，然后把它们读回内存。

y = torch.zeros(4)
torch.save([x,y],'x-files')
x2,y2 = torch.load('x-files')
(x2,y2)

在这里插入图片描述

我们甚至可以写入或读取从字符串映射到张量的字典。当我们要读取或写入模型中的所有权重时，这很方便。

mydict = {'x':x,'y':y}
torch.save(mydict,'mydict')
mydict2 = torch.load('mydict')
mydict2

在这里插入图片描述

2. 加载和保存模型参数

保存单个权重向量（或其他张量）确实有用，但是如果我们想保存整个模型，并在以后加载它们，单独保存每个向量则会变得很麻烦。毕竟，我们可能有数百个参数散布在各处。

因此，深度学习框架提供了内置函数来保存和加载整个网络。需要注意的一个重要细节是，这将保存模型的参数而不是保存整个模型。

例如，如果我们有一个3层多层感知机，我们需要单独指定架构。因为模型本身可以包含任意代码，所以模型本身难以序列化。因此，为了恢复模型，我们需要用代码生成架构，然后从磁盘加载参数。让我们从熟悉的多层感知机开始尝试一下。

class MLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.hidden = nn.Linear(20,256)
        self.output = nn.Linear(256,10)
        
    def forward(self, x):
        return self.output(F.relu(self.hidden(x)))
    
net = MLP()
X = torch.randn(size=(2, 20))
Y = net(X)

接下来，我们将模型的参数存储在一个叫做“mlp.params”的文件中。

# state_dict()可以得到所有parameter的字符串到parameter的映射
# 把MLP所有的参数存成一个字典，字典是参数名到value值的映射
torch.save(net.state_dict(),'mlp.params')

为了恢复模型，我们实例化了原始多层感知机模型的一个备份。这里我们不需要随机初始化模型参数，而是直接读取文件中存储的参数。

clone = MLP()
clone.load_state_dict(torch.load('mlp.params'))
clone.eval()

train()模式（net.train()）和eval模式（net.eval()）。一般的神经网络中，这两种模式是一样的，只有当模型中存在dropout和batchnorm的时候才有区别。

在这里插入图片描述

由于两个实例具有相同的模型参数，在输入相同的X时，两个实例的计算结果应该相同。让我们来验证一下。

Y_clone = clone(X)
Y_clone == Y

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/97344.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

25.读写文件

1. 加载和保存张量

2. 加载和保存模型参数

相关文章

English Learning - L1-3 从此没有不会的表达(上) 2022.12.12 周一

Okhttp源码分析实践（三）【WebDemo的简单实现】

vue3 provide与inject进行状态管理

WebRTC：P2P音视频通话基础概述

css样式补充，项目前置认知，精灵图，背景图片大小，阴影，过渡，SEO简介

1_MyBatis入门-1_认识框架

java高级--Elasticsearch

Linx基础（8）shell基础

【谷歌新作】Transformer杀入机器人领域，RT-1：97%成功率，轻松完成700多条控制指令

ZYNQ之FPGA学习----SPI协议驱动模块仿真实验

m基于K-means聚类算法和神经网络的模糊控制器设计matlab仿真

React学习23（redux基本使用）

JavaScript中的4种for循环

IIS 使用 office365 SMTP relay

《小白WEB安全入门》02. 开发篇

math_基本导数公式@积分公式@部分推导

【C++天梯计划】1.13 广搜(BFS)(search widely)

解释最小二乘法（最小平方法）？

【财务】FMS财务管理系统---应收管理

SAP Gateway Foundation Client Proxy 的使用方法