【Pytorch】神经网络的基本骨架

news2025/7/13 8:31:21

【Pytorch】神经网络的基本骨架

- nn.module的基本使用
- 卷积操作
- 神经网络卷积层
- 最大池化的使用-池化层

nn.module的基本使用

nn.module是所有神经网络的基本类，其他的所有神经网络都是继承该类，在此基础上进行修改。

在这里插入图片描述

上面的forward函数，首先进行卷积操作，然后进行一次非线性操作，然后进行卷积操作，非线性操作

module的简单使用

import torch
from torch import nn

class Tudui(nn.Module):

    #  初始化 父类
    def __init__(self):
        super().__init__()

    def  forward(self,input):
        output = input + 1
        return output
    
tudui  =Tudui()

x = torch.tensor(1.0)
output = tudui.forward(x)

print(output)

卷积操作

使用卷积核对输入的图像进行操作

在这里插入图片描述

stride=1 卷积核走一步

在这里插入图片描述

卷积之后的输出

在这里插入图片描述

二维卷积

import torch

#  导入卷积函数
import torch.nn.functional as F

#  输入二维矩阵 模拟一个图像
input = torch.tensor([[1,2,0,3,1],
                    [0,1,2,3,1],
                    [1,2,1,0,0],
                    [5,2,3,1,1],
                    [2,1,0,1,1]])

# 卷积核
kernel = torch.tensor([[1,2,1],
[0,1,0],
[2,1,0]])

#  batchsize 1 一个channel  5 x 5的图像
input = torch.reshape(input,(1,1,5,5))
kernel = torch.reshape(kernel,(1,1,3,3))

print(input.shape)
print(kernel.shape)


#  进行卷积操作  步长为1
output = F.conv2d(input,kernel,stride = 1)
print(output)


#  卷积步长为2
output = F.conv2d(input,kernel,stride = 2)
print(output)

#  填充1
output = F.conv2d(input,kernel,stride = 1,padding = 1)
print(output)

在这里插入图片描述

神经网络卷积层

一个卷积核

在这里插入图片描述

两个卷积核
在这里插入图片描述

in_channels:输入通道数由输入图像通道数决定
out_channels；输出通道数由卷积核数量进行决定也代表最终输出通道数
kernel_size:卷积核大小控制输出大小
stride:步长，也控制输出大小

import torchvision
from torch.utils.data import DataLoader
from torch import nn
from torch.nn import Conv2d
from tensorboardX import SummaryWriter
import torch


# 转换成tensor张量形式 下载测试数据集
dataset = torchvision.datasets.CIFAR10("../data",train = False,transform = torchvision.transforms.ToTensor(),download = True)

#  每次取出64长图片
dataloader = DataLoader(dataset,batch_size = 64)


class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        #  6个卷积核 n x n

        #  比如图片是3 x 3的 使用6 个 3 x 3的卷积核进行卷积操作  得到6个输出  每一个卷积核不一样
        self.conv1 = Conv2d(in_channels = 3,out_channels=6,kernel_size=3,stride =1,padding=0)

    #  前向传播
    def forward(self,x):
        x = self.conv1(x)
        return x


tudui = Tudui()
print(tudui)


writer = SummaryWriter("../logs")

step = 0

for data in dataloader:
    imgs,targets = data # 拆分元组
    output = tudui.forward(imgs)

    #  打印原始大小 64 3 32 32
    print(imgs.shape)

    #  每次取出64张图片  每张图片原本是3个channel 经过卷积操作变成6个channel  每张图片都是30 x 30大小
    print(output.shape)

    writer.add_images("input",imgs,step)

    #  对output 进行一次reshape 然后进行显示 64 6 30 30  -》 ？3 30 30  将图片转换成三通道
    output = torch.reshape(output,(-1,3,30,30))
    writer.add_images("output",output,step)

    step = step + 1

最大池化的使用-池化层

每次取出卷积核范围内最大的那个数字

如果cell_model = true表示图像中的数字不足以覆盖卷积核仍然取出最大值

在这里插入图片描述

Input: N C H W N 代表batchsize C代表通道数

import torch
from torch import nn
from torch.nn import MaxPool2d




input  = torch.tensor([[1,2,0,3,1],
                       [0,1,2,3,1],
                       [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]],dtype=torch.float32)

#  改变tensor的形状
input = torch.reshape(input,(-1,1,5,5))

print(input.shape)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        #  定义池化操作 最大卷积操作
        self.maxpool1 = MaxPool2d(kernel_size = 3,ceil_mode = True)

    #  前向传播
    def forward(self,input):
        output = self.maxpool1(input)
        return output
    
tudui = Tudui()
#  前向传播
output = tudui.forward(input)
print(output)