一层5x1神经网络绘制训练100轮后权重变化的图像

news2025/1/18 9:03:17

要完成这个任务,我们可以使用Python中的PyTorch库来建立一个简单的神经网络,网络结构只有一个输入层和一个输出层,输入层有5个节点,输出层有1个节点。训练过程中,我们将记录权重的变化,并在训练100轮后绘制出权重变化的图像。以下是步骤和代码的详细解释:

  1. 构建网络:网络由一个全连接层组成,没有激活函数,因为我们只关注权重的变化。
  2. 数据准备:随机生成一些输入数据和目标数据用于训练。
  3. 训练网络:使用均方误差损失和随机梯度下降优化器。
  4. 记录权重:在每轮训练后记录权重。
  5. 绘制权重变化图:训练完成后,使用matplotlib绘制权重的变化。

这张图展示了一个简单神经网络中5个权重在100轮训练过程中的变化。每条线代表一个权重值如何随着训练轮次的增加而变化。你可以看到,权重随着训练过程呈现不同程度的变化,这反映了模型在尝试适应数据的过程中权重的更新情况。

在这段代码中,weights_history[:, 0, i] 用于从存储的权重历史记录中提取特定的权重值,以便绘制。下面是这个表达式的详细分析:

  • weights_history 是一个记录了每一训练轮次后模型权重的列表,该列表在每次迭代时被转换为一个PyTorch张量。这个张量的形状是 [100, 1, 5]

    • 第一个维度(100)代表训练轮次的数量。
    • 第二个维度(1)代表输出层的节点数,这里是1,因为我们的模型是从5个输入到1个输出的线性层。
    • 第三个维度(5)代表输入层的节点数,也就是权重的数量,因为我们的线性层有5个输入。
  • weights_history[:, 0, i] 的分解:

    • : 选择weights_history张量中所有的100个训练轮次。
    • 0 选择输出层中第一个(也是唯一一个)节点的权重。
    • i 这是一个从0到4变化的索引,用于选择5个输入中的一个特定权重。

因此,当你使用 weights_history[:, 0, i],它实际上在每一训练轮次中选取一个特定的输入权重,并跟踪这个权重是如何随着时间变化的。在上面的代码中,这种方式被用来绘制每个输入对应权重随训练轮次变化的图形,展示了每个权重如何随着模型训练进行而更新。

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import numpy as np

# 定义一个简单的线性模型
class SimpleLinearModel(nn.Module):
    def __init__(self):
        super(SimpleLinearModel, self).__init__()
        self.linear = nn.Linear(5, 1)  # 5个输入节点,1个输出节点

    def forward(self, x):
        return self.linear(x)

# 生成一些随机数据
inputs = torch.randn(100, 5)  # 100个样本,每个样本5个特征
targets = torch.randn(100, 1)  # 100个目标值    

# 初始化模型
model = SimpleLinearModel()

# 损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 用于记录权重的列表
weights_history = []

# 训练模型
for epoch in range(100):  # 训练100轮
    # 前向传播
    outputs = model(inputs)
    loss = criterion(outputs, targets)

    # 反向传播和优化
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    # 记录权重
    weights_history.append(model.linear.weight.data.numpy().copy())

# 转换为numpy数组
weights_history = np.array(weights_history)

# 创建subplot
fig, axs = plt.subplots(5, 1, figsize=(10, 15))
for i in range(5):  # 对于5个输入特征的每一个权重绘图
    axs[i].plot(weights_history[:, 0, i], label=f'Weight {i+1}')
    axs[i].set_title(f'Weight {i+1} Changes Over 100 Epochs')
    axs[i].set_xlabel('Epoch')
    axs[i].set_ylabel('Weight Value')
    axs[i].legend()

plt.tight_layout()
plt.savefig("test")

上述代码实现了一个简单的神经网络训练,并绘制了每个输入特征的权重变化。以下是代码的详细步骤分析:

  1. 导入库

    • 导入了 torchtorch.nn 用于神经网络的构建和训练。
    • 导入 matplotlib.pyplot 用于绘制图像。
  2. 定义模型

    • 定义了一个简单的线性模型 SimpleLinearModel,包含一个全连接层 linear,输入5个特征输出1个值。
  3. 初始化模型、损失函数和优化器

    • 实例化了模型 model
    • 使用均方误差损失函数 criterion,适合回归问题。
    • 使用随机梯度下降优化器 optimizer,学习率设置为0.01。
  4. 准备数据

    • 生成了随机输入数据 inputs 和目标数据 targets,分别有100个样本,输入有5个特征,输出有1个目标值。
  5. 训练过程

    • 创建一个空列表 weights_history 用于记录每轮训练后的权重。
    • 进行100轮训练,在每轮中:
      • 计算模型的输出 outputs
      • 计算损失 loss
      • 清空梯度,进行反向传播,更新权重。
      • 记录当前的权重,保存到 weights_history 中。
  6. 数据转换和绘图

    • weights_history 转换为 numpy 数组,以便于处理。
    • 使用 plt.subplots 创建5个子图,每个子图显示一个输入特征的权重变化。
    • 遍历每个输入特征的权重数据,绘制在相应的子图上:
      • axs[i].plot(...) 绘制第 i 个输入特征的权重变化曲线。
      • 设置子图的标题、坐标轴标签和图例。
    • 使用 plt.tight_layout() 使子图布局紧凑整齐。
    • 显示绘制好的图像。

每个子图显示了对应输入特征的权重在100轮训练中的变化情况。这种细分展示方法有助于观察每个权重如何随着训练过程逐步调整和收敛。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1977073.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

显示学习5(基于树莓派Pico) -- 彩色LCD的驱动

和这篇也算是姊妹篇,只是一个侧重SPI协议,一个侧重显示驱动。 总线学习3--SPI-CSDN博客 驱动来自:https://github.com/boochow/MicroPython-ST7735 所以这里主要还是学习。 代码Init def __init__( self, spi, aDC, aReset, aCS) :"&…

数据结构(5.4_2)——树和森林的遍历

树的先根遍历(深度优先遍历) 若树非空,先访问根结点,再依次对每棵子树进行先根遍历 树的先根遍历序列和这棵树相应二叉树的先序序列相同。 伪代码: //树的先根遍历 void PreOrder(TreeNode* R) {if (R ! NULL) {visit(R);//访问根结点w…

【WRF安装第四期(Ubuntu)】搭建WRF编译所需系统-WRF和WPS模型的安装

WRF安装第四期:搭建WRF编译所需系统-WRF和WPS模型的安装 1 WRF的编译安装(Building WRF)1.1 进入Build_WRF文件夹1.2 下载WRFV4.01.3 解压WRF安装包1.4 安装WRF选择#1:34选择#2:32 1.5 检查WRF是否安装成功1.5.1 WRF安…

ai文案生成器,文案自动生成好简单

随着科技的不断进步,AI在各个领域中扮演着越来越重要的角色。其中,ai文案生成器的出现给广告和市场营销行业带来了一场革命。曾经需要耗费大量时间和精力的文案创作过程,如今可以通过ai文案生成器轻松自动完成。这一创新技术的出现&#xff0…

什么是药物临床试验?

药物临床试验是指在人体上进行的新药试验研究,旨在确定新药的疗效、安全性、药代动力学和药效学。临床试验不仅帮助确认药物是否对特定疾病或症状有效,还帮助识别和评估药物的副作用和风险。 药物临床试验(Clinical Trial,CT&…

数据结构:带索引的双链表IDL

IDLindexed double list 如图,下方是一个双链表,上方是索引。索引储存为结构体数组,结构体内包括一个指针,和长度。 假设索引只有一个,这时,它应该指向双链表的中间,这样才能提高搜索效率。称…

深入探索可擦除可编程只读存储器(EPROM)DS2502P+TR 1K位只添加存储器

DS2502PT&R产品描述: DS2502PT&R 为1K位只添加存储器,用于识别并存储产品的相关信息。产品批号或特殊的产品信息可以通过最少的接口访问—例如,微控制器的一个端口引脚。DS2502PT&R 具有一个工厂光刻注册码,其中包括…

UE5 大鹅的点击移动 第三人称

文章目录 一、创建动画蓝图二、创建 Location 地标三、Character 和 PlayerControl 的控制四、实现效果 一、创建动画蓝图 这里以 UE5 从零开始制作跟随的大鹅-CSDN博客 创建的动态资产创建动画蓝图;需要用到的资产列表有:大鹅的骨骼网格体,…

【大模型从入门到精通4】openAI API 分类

这里写目录标题 分类理解 SYSTEM 和 USER 在 AI 对话中的角色System MessageUser Message工作原理示例分类示例更多分类示例理论问题理论 分类 理解 SYSTEM 和 USER 在 AI 对话中的角色 在分类任务中,通常需要向模型提供一个需要将其分类到预定义类别中的文本场景…

【数据结构与算法】堆顶删除

堆顶的删除 一.堆顶出列的原理二.堆顶出列的实现1.覆盖最大元素并出列2.向下调整成为堆 三.堆排序四,总结 一.堆顶出列的原理 还记得我们刚开始说的嘛,如果我想要拿出最大的,那么下一个最大的会花落谁家. 那么就需要用到堆顶出列的原理了. 然后我们再对顶节点,进行向下调整就可…

9-springCloud集成nacos config

本文介绍spring cloud集成nacos config的过程。 0、环境 jdk 1.8maven 3.8.1Idea 2021.1nacos 2.0.3 1、项目结构 根项目nacos-config-sample下有两个module,这两个module分别是两个springboot项目,都从nacos中获取连接mysql的连接参数。我们开工。 …

被遗忘的哑终端 —— 键盘键位演变的启发者

注:机翻,未校对。 The Forgotten World of Dumb Terminals 被遗忘的哑终端世界 A quick journey through the lost age of “glass teletypes.” 快速穿越失落的“玻璃电传打字机”时代。 From the earliest days of digital computers, researchers o…

【C++】-----继承(复杂的多继承及虚拟继承)

目录 前言 一、多继承 认识 继承顺序 二、菱形继承 三、菱形虚拟继承(重难点) 认识 底层原理(细致) 四、继承与组合 五、总结 前言 在前面我们所举的例子都是单继承,就是一个子类只有一个直接父类的关系&…

用Manim在图形和坐标轴上画线条

用Manim在图形和坐标轴上画线条 .画图像函数的切线 angle_of_tangent(x, graph, dx1e-08) angle_of_tangent(x, graph, dx1e-08)是 Manim 中用于计算图形在给定点的切线角度的函数。以下是对该函数参数的解释: 参数说明 x: 这是你想要计算切线角度的 x 坐标。在…

C++进阶之C++11

个人主页:点我进入主页 专栏分类:C语言初阶 C语言进阶 数据结构初阶 Linux C初阶 算法 C进阶 欢迎大家点赞,评论,收藏。 一起努力,一起奔赴大厂 目录 一.列表初始化 1.1一切皆可用列表初始化 1.2init…

代码随想录 day 29 贪心

第八章 贪心算法 part03 134. 加油站 本题有点难度,不太好想,推荐大家熟悉一下方法二 https://programmercarl.com/0134.%E5%8A%A0%E6%B2%B9%E7%AB%99.html 135. 分发糖果 本题涉及到一个思想,就是想处理好一边再处理另一边,不…

MySQL基础操作全攻略:增删改查实用指南(上)

本节目标: CRUD : Create, Retrieve , Update , Delete 新增数据 查询数据 修改数据 删除数据 1. CRUD 注释:在 SQL 中可以使用 “-- 空格 描述 ” 来表示注释说明 CRUD 即增加(Create)、查询(Retrieve)、更新(Update)、…

什么是 IDR —— Linux 内核中的一种整数管理机制

文章目录 1 什么是 IDR1.1 IDR 的设计目的 2 IDR 的结构和实现2.1 核心数据结构2.2 常用操作2.2.1 分配 ID2.2.2 查找指针2.2.3 删除映射 2.3 IDR 的优点 3 Linux 内核中的整数 ID3.1 作用3.2 常见的整数 ID 示例 4 为什么要将整数 ID 与指针关联4.1 举例说明4.2 好处4.3 示例代…

学习笔记-Cookie、Session、JWT

目录 一、验证码的生成与校验 1. 创建生成验证码的工具类 2. 写一个 Controller 3. 实现验证码验证 1. 获取验证码 2. 验证码请求过程 3. 验证码的校验 4. 原理说明 5. 验证 6. 总结 二、JWT登录鉴权 1. 为什么要做登录鉴权? 2. 什么是 JWT 3. JWT相比…

MATLAB优化模型(2)

一、前言 在MATLAB中实现动态规划、图论、网络流模型(如最短路、最大流、最小生成树)的优化模型,可以通过多种方法完成,但通常会依赖于MATLAB内置的函数或工具箱,比如Optimization Toolbox、Graph Theory Toolbox等。以…