采用自动微分进行模型的训练

news2025/2/21 4:19:48

自动微分训练模型

简单代码实现：

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个简单的线性回归模型
class LinearRegression(nn.Module):
    def __init__(self):
        super(LinearRegression, self).__init__()
        self.linear = nn.Linear(1, 1)  # 输入维度是1，输出维度也是1

    def forward(self, x):
        return self.linear(x)

# 准备训练数据
x_train = torch.tensor([[1.0], [2.0], [3.0]])
y_train = torch.tensor([[2.0], [4.0], [6.0]])

# 实例化模型、损失函数和优化器
model = LinearRegression()
criterion = nn.MSELoss()  # 均方误差损失函数
optimizer = optim.SGD(model.parameters(), lr=0.01)  # 随机梯度下降优化器

# 训练模型
epochs = 1000
for epoch in range(epochs):
    # 前向传播
    outputs = model(x_train)
    loss = criterion(outputs, y_train)

    # 反向传播
    optimizer.zero_grad()  # 清空之前的梯度
    loss.backward()  # 自动计算梯度
    optimizer.step()  # 更新模型参数

    if (epoch+1) % 100 == 0:
        print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.4f}')

# 测试模型
x_test = torch.tensor([[4.0]])
predicted = model(x_test)
print(f'预测值: {predicted.item():.4f}')

代码分解：

1.定义一个简单的线性回归模型：

LinearRegression 类继承自nn.Module，这是所有神经网络模型的基类。
在 __init__ 方法中，定义了一个线性层 self.linear，它的输入维度是1，输出维度也是1。

forward 方法定义了数据在模型中的传播路径，即输入 x 经过 self.linear 层后得到输出。

class LinearRegression(nn.Module):
    def __init__(self):
        super(LinearRegression, self).__init__()
        self.linear = nn.Linear(1, 1)  # 输入维度是1，输出维度也是1

    def forward(self, x):
        return self.linear(x)

2.准备训练数据：

x_train 和 y_train 分别是输入和目标输出的训练数据。每个张量表示一个样本，x_train 中的每个元素是一个维度为1的张量，因为模型的输入维度是1。
```
x_train = torch.tensor([[1.0], [2.0], [3.0]])
y_train = torch.tensor([[2.0], [4.0], [6.0]])
```

3.实例化模型，损失函数和优化器：

model 是我们定义的 LinearRegression 类的一个实例，即我们要训练的线性回归模型。
criterion 是损失函数，这里选择了均方误差损失（MSE Loss），用于衡量预测值与实际值之间的差异。

optimizer 是优化器，这里选择了随机梯度下降（SGD），用于更新模型参数以最小化损失。

model = LinearRegression()
criterion = nn.MSELoss()  # 均方误差损失函数
optimizer = optim.SGD(model.parameters(), lr=0.01)  # 随机梯度下降优化器

4.训练模型：

这里进行了1000次迭代的训练过程。
在每个迭代中，首先进行前向传播，计算模型对 x_train 的预测输出 outputs，然后计算损失 loss。

调用 optimizer.zero_grad() 来清空之前的梯度，然后调用 loss.backward() 自动计算梯度，最后调用 optimizer.step() 来更新模型参数。

epochs = 1000
for epoch in range(epochs):
    # 前向传播
    outputs = model(x_train)
    loss = criterion(outputs, y_train)

    # 反向传播
    optimizer.zero_grad()  # 清空之前的梯度
    loss.backward()  # 自动计算梯度
    optimizer.step()  # 更新模型参数

    if (epoch+1) % 100 == 0:
        print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.4f}')

5.测试模型：

x_test 是用来测试模型的输入数据，这里表示输入为4.0。
model(x_test) 对 x_test 进行前向传播，得到预测结果 predicted。

predicted.item() 取出预测结果的标量值并打印出来。

x_test = torch.tensor([[4.0]])
predicted = model(x_test)
print(f'预测值: {predicted.item():.4f}')

运行结果：

运行结果如下：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1924461.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

采用自动微分进行模型的训练

自动微分训练模型

简单代码实现：

代码分解：

1.定义一个简单的线性回归模型：

2.准备训练数据：

3.实例化模型，损失函数和优化器：

4.训练模型：

5.测试模型：

运行结果：

运行结果如下：

相关文章

python:使用matplotlib库绘制图像（四）

DockerCompose介绍，安装，使用

深入理解Java泛型：概念、用法与案例分析

Transformer模型：Encoder的self-attention mask实现

docker-compose安装PolarDB-PG数据库

Linux - 综合使用shell脚本，输出网站有效数据

zigbee开发工具：2、zigbee工程建立与配置

STM32智能交通灯系统教程

Python游戏开发：四连珠（内附完整代码）

视频监控汇聚平台：通过SDK接入大华DSS视频监控平台的源代码解释和分享

《昇思25天学习打卡营第2天|02快速入门》

【算法】平衡二叉树

炒鸡清晰的防御综合实验（内含区域划分，安全策略，用户认证，NAT认证，智能选路，域名访问）

用SurfaceView实现落花动画效果

【算法专题】快速排序

小公司的Git工作流程

信息学奥赛初赛天天练-46-CSP-J2020阅读程序2-进制转换、十进制转k进制、等比数列通项公式、等比数列求和公式应用

java各种锁介绍

DEBUG:jeston卡远程ssh编程

【kubernetes】Helm包管理器基本概念与Chart实战