从基础到卷积神经网络（第13天）

news2026/2/14 19:00:01

1. PyTorch 神经网络基础

1.1 模型构造

1. 块和层

首先，回顾一下多层感知机

import torch 
from torch import nn
from torch.nn import functional as F

net = nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))

X = torch.rand(2, 20) # 生成随机输入（批量大小=2， 输入维度=20）
net(X) # 输出（批量大小=2, 输出维度=10）

在这里插入图片描述

2. 自定义块

自定义MLP实现上一节的功能

class MLP(nn.Module): # 定义nn.Mudule的子类
    def __init__(self): 
        super().__init__() # 调用父类
        self.hidden = nn.Linear(20, 256) # 定义隐藏层
        self.out = nn.Linear(256, 10) # 定义输出层
        
    def forward(self, X): # 定义前向函数
        return self.out(F.relu(self.hidden(X))) # X-> hidden-> relu-> out

实例化MLP的层，然后再每次调用正向传播函数时调用这些层

net = MLP()
net(X)

在这里插入图片描述

3. 实现Sequential类

class MySequential(nn.Module):
    def __init__(self, *args):
        super().__init__()
        for block in args:
            self._modules[block] = block
        
    def forward(self, X):
        for block in self._modules.values():
            X = block(X)
        return X

net = MySequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))
net(X)

在这里插入图片描述

4. 在正向传播中执行代码

class FixedHiddenMLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.rand_weight = torch.rand((20, 20), requires_grad=False) # 加入随机权重
        self.linear = nn.Linear(20, 20)

    def forward(self, X):
        X = self.linear(X)
        X = F.relu(torch.mm(X, self.rand_weight) + 1) # 输入和随机权重做矩阵乘法 + 1（偏移）-》激活函数
        X = self.linear(X)
        while X.abs().sum() > 1: # 控制X小于1
            X /= 2
        return X.sum() # 返回一个标量

net = FixedHiddenMLP()
net(X)

5. 混合搭配各种组合块的方法

class NestMLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.net = nn.Sequential(nn.Linear(20, 64), nn

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1092978.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

从基础到卷积神经网络（第13天）

1. PyTorch 神经网络基础

1.1 模型构造

1. 块和层

2. 自定义块

3. 实现Sequential类

4. 在正向传播中执行代码

5. 混合搭配各种组合块的方法

相关文章

Java电子病历编辑器项目源码采用B/S（Browser/Server）架构

27 mysql 组合索引的存储以及使用

Leetcode刷题笔记--Hot61-70

安卓camera2获取到的YUV420_888格式详解

软件设计师_面向对象_学习笔记

芯片学习记录TLP291-4

快速排序全面详解

终极Whois查询工具：优雅美观、功能强大、信息全面

Android组件通信——Service（二十七）

java js 经纬度转换大地坐标(高斯投影坐标)与经纬度互相转换

C++笔记之如何给 `const char*` 类型变量赋值

使用JAVA发送邮件

芯片学习记录SN74HC14DR

jwt的使用概念工具类与切入spa项目

C++笔记之std::async的用法

leetCode 1035.不相交的线动态规划 + 滚动数组（最长公共子序列）

3.4 构造方法

学习记忆——数学篇——代数——记忆宫殿——卧室

Mysql高级——事务（2）

默认关闭idea2020的注释doc的rendered view模式(阅读模式)