PyTorch 中神经网络库torch.nn的详细介绍

news2025/1/23 9:10:07

1. torch.nn   

torch.nn 是 PyTorch 深度学习框架中的一个核心模块,它为构建和训练神经网络提供了丰富的类库

以下是 torch.nn 的关键组成部分及其功能:

  1. nn.Module 类

    nn.Module 是所有自定义神经网络模型的基类。用户通常会从这个类派生自己的模型类,并在其中定义网络层结构(如卷积层、全连接层等)以及前向传播函数(forward pass):nn.Module 是所有自定义神经网络结构的基础类。当你需要创建一个深度学习模型时,通常会继承这个类,并在其中定义模型的层(Layer)结构以及前向传播(forward pass)逻辑。在子类中通过调用 super().__init__() 初始化父类,并定义各种层作为实例变量,如卷积层(nn.Conv2d)、全连接层(nn.Linear)、激活函数等。必须实现 forward(self, input) 方法,该方法描述了输入数据如何经过网络中的各个层并生成输出。 详细内容请见PyTorch的nn.Module类的详细介绍。
  2. 预定义层(Modules)

    包括各种类型的层组件,例如:
    • 更多其他层,包括但不限于 LSTM、GRU、Dropout、BatchNorm、Embedding 等。
    • 正则化层:如批量归一化 nn.BatchNorm1dnn.BatchNorm2d 等。
    • 池化层:nn.MaxPool1dnn.MaxPool2dnn.AvgPool2d 用于下采样特征图。
    • 激活函数:如 nn.ReLUnn.Sigmoidnn.Tanh 等非线性激活层。
    • 卷积层:nn.Conv1dnn.Conv2dnn.Conv3d 分别用于一维、二维和三维数据的卷积操作,常应用于图像识别、语音处理等领域。
    • 全连接层:nn.Linear 用于实现线性变换,常见于多层感知机(MLP)中。
  3. 容器类

    • nn.Sequential:允许将多个层按顺序组合起来,形成简单的线性堆叠网络。
    • nn.ModuleList 和 nn.ModuleDict:可以动态地存储和访问子模块,支持可变长度或命名的模块集合。
  4. 损失函数(Loss Functions)

    torch.nn 包含了一系列用于衡量模型预测与真实标签之间差异的损失函数,例如:
    • 对数似然损失:nn.NLLLoss 配合LogSoftmax层使用于分类任务。
    • 均方误差损失:nn.MSELoss 适用于回归任务。
    • 交叉熵损失:nn.CrossEntropyLoss 常用于分类任务。
    • 更多针对特定任务定制的损失函数,如 nn.BCEWithLogitsLoss 用于二元分类任务。
    • 这些函数用于计算模型预测结果与实际目标之间的差异,作为优化的目标。
  5. 实用函数接口(Functional Interface)nn.functional(通常简写为 F),包含了许多可以直接作用于张量上的函数,它们实现了与层对象相同的功能,但不具有参数保存和更新的能力。比如,可以使用 F.relu() 直接进行 ReLU 操作,或者 F.conv2d() 进行卷积操作。

  6. 初始化方法

    torch.nn.init 提供了一些常用的权重初始化策略,比如 Xavier 初始化 (nn.init.xavier_uniform_()) 和 Kaiming 初始化 (nn.init.kaiming_uniform_()), 这些对于成功训练神经网络至关重要。

通过 torch.nn,开发者能够快速构建复杂的深度学习模型,并利用 PyTorch 动态计算图特性进行高效训练和推理。此外,该模块还与 torch.optim 配合,方便地进行权重优化;以及与 DataLoader 结合以组织和迭代训练数据。

2. torch.nn 的使用方法

      使用方法通常包括以下步骤:

  • 继承 nn.Module 类创建自定义模型,并在构造函数 __init__() 中定义需要的层结构。
  • 实现 forward(self, input) 方法,描述如何通过定义好的层计算输出。
  • 创建模型实例并传入必要的参数进行初始化。
  • 使用优化器 (torch.optim) 对模型的可学习参数进行优化,结合数据加载器 (torch.utils.data.DataLoader) 加载数据集,并在一个循环中迭代执行前向传播、计算损失、反向传播和参数更新。
Python
1import torch
2import torch.nn as nn
3
4# 定义一个简单的全连接神经网络模型
5class SimpleNet(nn.Module):
6    def __init__(self, input_size, hidden_size, num_classes):
7        super(SimpleNet, self).__init__()
8        self.fc1 = nn.Linear(input_size, hidden_size)
9        self.relu = nn.ReLU()
10        self.fc2 = nn.Linear(hidden_size, num_classes)
11
12    def forward(self, x):
13        out = self.fc1(x)
14        out = self.relu(out)
15        out = self.fc2(out)
16        return out
17
18# 创建模型实例
19model = SimpleNet(input_size=784, hidden_size=128, num_classes=10)
20
21# 定义损失函数和优化器
22criterion = nn.CrossEntropyLoss()
23optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
24
25# 假设我们有一个数据批次
26inputs = torch.randn(64, 784)  # 输入张量
27labels = torch.randint(0, 10, (64,))  # 标签张量
28
29# 正向传播计算预测结果
30outputs = model(inputs)
31
32# 计算损失
33loss = criterion(outputs, labels)
34
35# 反向传播和参数更新
36optimizer.zero_grad()  # 清零梯度缓冲区
37loss.backward()  # 反向传播求梯度
38optimizer.step()  # 更新模型参数

以上是一个简单的例子展示了如何定义模型、损失函数和优化器,并进行一次训练迭代的过程。在实际应用中,还需要根据具体问题设计更复杂的网络结构和训练流程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1425047.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue3 watch和watchEffect

Watch监听ref定义的数据 1.ref数据基本数据类型 let sumref(0) const stopWatchwatch(sum,(new,old)>{ If(new>10){ stopWatch() } console.log(‘sum数据变化了’) })2.ref数据为对象类型,监听的是对象的地址值,若想监听…

一篇文章带你弄懂MySQL事务!(事务特性ACID、并发读的问题、事务的隔离等级、Read View 原理、可重复读和读提交分别怎么工作)

文章目录 一、什么是事务?二、事务有哪些特性?(ACID)三、认识事务的提交和回滚四、并行事务会引发什么问题?1.脏读2.不可重复读3.幻读 五、事务的隔离级别六、Read View 在 MVCC 里如何工作的?七、可重复读…

【PyRestTest】高级使用

本节主要涉及PyRestTest的高级特征的详细使用,主要指:generators(生成器), variable binding(变量绑定), data extraction(数据提取), content validators(文本验证) 它们是如何组合在一起的? 模板和上下文 测试和基准测试可以使用变量来模板化动态配置。使用基础的…

钉钉机器人关键词推送

钉钉机器人只勾选关键词,不选其它校验方式,只会校验发送内容中是否包含关键词 例如我设置关键词是robot {"msgtype": "text","text": {"content": "robot:抢票成功!"},"at":{"isAtAl…

【产业实践】使用YOLO V5 训练自有数据集,并且在C# Winform上通过onnx模块进行预测全流程打通

使用YOLO V5 训练自有数据集,并且在C# Winform上通过onnx模块进行预测全流程打通 效果图 背景介绍 当谈到目标检测算法时,YOLO(You Only Look Once)系列算法是一个备受关注的领域。YOLO通过将目标检测任务转化为一个回归问题,实现了快速且准确的目标检测。以下是YOLO的基…

安全防御第五次作业

拓扑图及要求如下: 实验注意点: 先配置双机热备,再来配置安全策略和NAT两台双机热备的防火墙的接口号必须一致双机热备时,请确保vrrp配置的虚拟IP与下面的ip在同一网段如果其中一台防火墙有过配置,最好清空或重启&…

操作日志应记录编辑的前后内容变化

总体思路是增加一个注解类,将注解加到要进行记录变化的Java类属性上却可。 上代码: 1. 实现注解类: Target(ElementType.FIELD) Retention(RetentionPolicy.RUNTIME) public interface FieldName {String value();boolean isIgnoreNull()…

lombok导致的IndexOutOfBoundsException

一、问题描述 ERROR 25152 --- [1.190-81-exec-9] o.a.c.c.C.[.[.[/].[dispatcherServlet] : Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Request processing failed; nested exception is org.mybatis.spring.MyBatisSyste…

ElementUI Form:Switch 开关

ElementUI安装与使用指南 Switch 开关 点击下载learnelementuispringboot项目源码 效果图 el-switch.vue &#xff08;Switch 开关&#xff09;页面效果图 项目里el-switch.vue代码 <script> export default {name: el_switch,data() {return {value: true,value1: …

Linux内核编译-ARM

步骤一、下载源码及交叉编译器后解压 linux kernel官网 ARM GCC交叉编译器 步骤二、安装软件 sudo apt-get install ncurses-dev sudo apt-get install flex sudo apt-get install bison sudo apt install libgtk2.0-dev libglib2.0-dev libglade2-dev sudo apt install libs…

【wine】Ubuntu 22.04 x86_64 源码编译 wine 9.1 编译版本不能启动微信,apt安装版本可以使用微信

git clone https://gitee.com/winehq/wine.git git checkout wine-9.1 x86_64 注意&#xff08;没有--enable-win32选项&#xff01;&#xff09; sudo apt install build-essential git libtool m4 autoconf automake pkg-config libc6-dev-i386 zlib1g-dev libncurses5-de…

人工智能时代:AI提示工程的奥秘 —— 驾驭大语言模型的秘密武器

文章目录 一、引言二、提示工程与大语言模型三、大语言模型的应用实践四、策略与技巧五、结语《AI提示工程实战&#xff1a;从零开始利用提示工程学习应用大语言模型》亮点内容简介作者简介目录获取方式 一、引言 随着人工智能技术的飞速发展&#xff0c;大语言模型作为一种新…

经典左旋,指针面试题

今天给大家带来几道面试题&#xff01; 实现一个函数&#xff0c;可以左旋字符串中的k个字符。 例如&#xff1a; ABCD左旋一个字符得到BCDA ABCD左旋两个字符得到CDAB 我们可以先自己自行思考&#xff0c;下面是参考答案&#xff1a; 方法一&#xff1a; #define _CRT_SEC…

MongoDB安装以及卸载,通过Navicat 15 for MongoDB连接MongoDB

查询id&#xff1a; docker ps [rootlocalhost ~]# docker stop c7a8c4ac9346 c7a8c4ac9346 [rootlocalhost ~]# docker rm c7a8c4ac9346 c7a8c4ac9346 [rootlocalhost ~]# docker rmi mongo sudo docker pull mongo:4.4 sudo docker images 卸载旧的 sudo docker stop mong…

【脑电信号处理与特征提取】P7-涂毅恒:运用机器学习技术和脑电进行大脑解码

运用机器学习技术和脑电进行大脑解码 科学研究中的大脑解码 比如2019年在Nature上一篇文章&#xff0c;来自UCSF的Chang院士的课题组&#xff0c;利用大脑活动解码语言&#xff0c;帮助一些患者恢复语言功能。 大脑解码的重要步骤 大脑解码最重要的两步就是信号采集和信号…

【Linux】Daemon守护进程详解

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;Linux系列专栏&#xff1a;Linux基础 &#x1f525; 给大家…

JAVASE进阶:String常量池内存原理分析、字符串输入源码分析

&#x1f468;‍&#x1f393;作者简介&#xff1a;一位大四、研0学生&#xff0c;正在努力准备大四暑假的实习 &#x1f30c;上期文章&#xff1a;JAVASE进阶&#xff1a;内存原理剖析&#xff08;1&#xff09;——数组、方法、对象、this关键字的内存原理 &#x1f4da;订阅…

嵌入式人工智能/深度学习/神经网络导论

加我微信hezkz17进入嵌入式人工智能技术研究开发交流答疑群 1 嵌入式人工智能&#xff0c;嵌入式深度学习含义&#xff1f; &#xfffc; 嵌入式人工智能&#xff08;Embedded Artificial Intelligence&#xff09;是指将人工智能技术应用于嵌入式系统中&#xff0c;使其具备…

计算机网络_1.4 计算机网络的定义和分类

1.4 计算机网络的定义和分类 一、计算机网络的定义&#xff08;无唯一定义&#xff09;二、计算机网络的分类&#xff08;从不同角度分类&#xff09;1、交换方式2、使用者3、传输介质4、覆盖范围5、拓扑结构 笔记来源&#xff1a; B站 《深入浅出计算机网络》课程 一、计算机…

11张宝藏GIS开发思维导图,重点清晰,建议带走!

在GIS开发过程中&#xff0c;涉及大量的数据、地图、工具和技术。通过思维导图&#xff0c;我们可以将这些复杂的元素进行可视化&#xff0c;更好地理解和整理思路&#xff0c;提高开发效率。 同时思维导图利用了色彩、线条、关键词、图像等元素&#xff0c;可以加强记忆的可能…