【深度学习】1.手动LogisticRegression模型的训练和预测

news2026/2/12 21:40:22

通过这个示例，可以了解逻辑回归模型的基本原理和训练过程，同时可以通过修改和优化代码来进一步探索机器学习模型的训练和调优方法。

步骤：

生成了一个模拟的二分类数据集：通过随机生成包含两个特征的数据data_x，并基于一定规则生成对应的二分类标签数据data_y。
创建了一个手动实现的逻辑回归模型LogisticRegressionManually，其中包括：
- 初始化函数__init__：初始化模型的权重参数w和偏置参数b。
- 前向传播函数forward：计算给定输入数据的预测值。
- 损失函数loss_func：定义了交叉熵损失函数，用于评估模型的预测性能。
- 训练函数train：在每个epoch中，遍历数据集的每个样本，计算预测值、损失值、梯度，并利用梯度下降法更新模型参数。
实例化LogisticRegressionManually类，然后调用train方法对模型进行训练。
在训练过程中，打印每个epoch的损失值。

演示:

# 生成模拟的二分类数据集，其中X数据是随机生成的，Y数据根据一定规则生成。

import torch
import torch.nn.functional as F

n_items = 1000
n_features = 2
learning_rate = 0.001
epochs = 100

# 置了随机种子，以确保每次运行代码时生成的随机数相同，从而使结果具有可重现性。
torch.manual_seed(123) 
# 生成了一个大小为(1000, 2)的张量data_x，其中包含1000个样本，每个样本具有2个特征。这里使用torch.randn生成标准正态分布的随机数作为数据，并将数据类型转换为float。
data_x = torch.randn(size=(n_items, n_features)).float()
# 成了标签数据data_y，通过对第一个特征乘以0.5和第二个特征乘以1.5的差值进行判断，如果差值大于0就将标签设为1，否则为0。这样生成了一个二分类标签数据集，同样将数据类型转换为float。
data_y = torch.where(torch.subtract(data_x[:, 0]*0.5, data_x[:, 1]*1.5) > 0, 1., 0.).float()

# print(data_x)
# print(data_y)

# 在每个epoch中，遍历数据集的每个样本，计算预测值、损失值、梯度，利用梯度下降法更新模型参数。通过这种方式训练模型可以逐渐优化模型参数，以达到更好的预测效果。

class LogisticRegressionManually(object):
    # 初始化函数__init__
    def __init__(self):
        # w是一个大小为(n_features, 1)的张量，用于存储权重参数，并且设置了requires_grad=True表示需要计算梯度；
        self.w = torch.randn(size=(n_features, 1), requires_grad=True)
        # b是一个大小为(1, 1)的张量，用于存储偏置参数，并且设置了requires_grad=True
        self.b = torch.zeros(size=(1, 1), requires_grad=True)
    # 前向传播函数forward
    def forward(self, x):
        # 过矩阵乘法计算预测值y_hat：将参数w转置后与输入数据x相乘，并加上偏置b后通过F.sigmoid函数进行激活，最终返回激活后的预测值。
        y_hat = F.sigmoid(torch.matmul(self.w.transpose(0, 1), x) + self.b)
        return y_hat
    # 损失函数loss_func
    @staticmethod
    def loss_func(y_hat, y):
        # 定义了交叉熵损失函数。通过计算实际标签y和预测值y_hat之间的交叉熵损失来评估模型的预测性能。
        return -(torch.log(y_hat)*y + (1-y)*torch.log(1-y_hat))
    # 训练函数train
    def train(self):
        # 在每个epoch中，遍历数据集中的每个样本
        for epoch in range(epochs):
            for step in range(n_items):
                # 利用模型的前向传播函数forward计算当前样本的预测值y_hat。
                y_hat = self.forward(data_x[step])
                # 获取当前样本的真实标签y
                y = data_y[step]
                # 调用损失函数loss_func计算预测值与真实标签之间的损失。
                loss = self.loss_func(y_hat, y)
                # 利用反向传播计算损失对模型参数的梯度
                loss.backward()
                # 进入torch.no_grad()上下文管理器，保证在该范围内的操作不会被记录用于自动微分。
                with torch.no_grad():
                    # 更新权重参数w和偏置参数b，通过梯度下降法更新参数，learning_rate是学习率。
                    self.w.data -= learning_rate * self.w.grad
                    self.b.data -= learning_rate * self.b.grad
                # 清零梯度，以便进行下一次参数更新时重新计算梯度。
                self.w.grad.data.zero_()
                self.b.grad.data.zero_()
            print("Epoch: %03d, Loss: %.3f" % (epoch, loss.item()))

lrm = LogisticRegressionManually()
lrm.train()

结果:

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1699467.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【深度学习】1.手动LogisticRegression模型的训练和预测

相关文章

Android Compose 九：interactionSource 的使用

WordPress安装memcached提升网站速度

《拯救大学生课设不挂科第四期之蓝桥杯是什么？我是否要参加蓝桥杯？选择何种语言？如何科学备赛？方法思维教程》【官方笔记】

webpack5生产模式

跨平台之用VisualStudio开发APK嵌入OpenCV（三）

2024年【危险化学品经营单位安全管理人员】考试及危险化学品经营单位安全管理人员考试资料

Zoho Campaigns邮件营销怎么发邮件？

电量计量芯片HLW8110的前端电路设计与误差分析校正.pdf 下载

用Prometheus全面监控MySQL服务：一篇文章搞定

深度学习面试问题总结（21）| 模型优化

ic基础|时钟篇05：芯片中buffer到底是干嘛的？一文带你了解buffer的作用

leecode 637 二叉树的层平均值

2024年5月26日 (周日) 叶子游戏新闻

WEB攻防【1】——ASP应用/HTTP.SYS/短文件/文件解析/Access注入/数据库泄漏

微服务下认证授权框架的探讨

elementui中表格使用树形数据且固定一列时展开子集移入时背景色不全问题(父级和子级所展示的字段是不一样的时候)

【单片机】STM32F070F6P6 开发指南（一）STM32建立HAL工程

树形结构简化操作

关于XtremIO 全闪存储维护的一些坑(建议)

Leetcode260