PyTorch-nn.Module

news2025/1/18 16:56:06

目录

1. 基本操作

2. 卷积操作

2.1 torch.nn.functional — conv2d

2.2 torch.nn.Conv2d

3. 池化层

4. 非线性激活

4.1 使用ReLU非线性激活

4.2 使用Sigmoid非线性激活

5. 线性激活

6. PyTorch的一些图像模型 

1. 基本操作

import torch
from torch import nn

class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()

    def forward(self, input):
        output = input + 1
        return output

my_module1 = MyModel()
x = torch.tensor(1.0)
output = my_module1(x)
print(output)  # tensor(2.)

2. 卷积操作

2.1 torch.nn.functional -- conv2d

图片来源于:b站up主 我是土堆

注意conv2d为二维卷积,conv1d为一维卷积。

nn_conv.py

import torch
import torch.nn.functional as F

# 输入图像
input = torch.tensor([
    [1, 2, 0, 3, 1],
    [0, 1, 2, 3, 1],
    [1, 2, 1, 0, 0],
    [5, 2, 3, 1, 1],
    [2, 1, 0, 1, 1]
])
# 卷积核
kernel = torch.tensor([
    [1, 2, 1],
    [0, 1, 0],
    [2, 1, 0]
])
input = torch.reshape(input, (1, 1, 5, 5))
kernel = torch.reshape(kernel, (1, 1, 3, 3))
print(input.shape, kernel.shape)
output = F.conv2d(input, kernel, stride=1)
print(output)

torch.Size([1, 1, 5, 5]) torch.Size([1, 1, 3, 3])
tensor([[[[10, 12, 12],
          [18, 16, 16],
          [13,  9,  3]]]])

stride(步长)若为2:

output2 = F.conv2d(input, kernel, stride=2)
print(output2)

 tensor([[[[10, 12],
          [13,  3]]]])

padding为1时,相当于在外侧填充了值为0的两行和两列:

output3 = F.conv2d(input, kernel, stride=1, padding=1)
print(output3)

tensor([[[[ 1,  3,  4, 10,  8],
          [ 5, 10, 12, 12,  6],
          [ 7, 18, 16, 16,  8],
          [11, 13,  9,  3,  4],
          [14, 13,  9,  7,  4]]]])

2.2 torch.nn.Conv2d

介绍:

in_channels -- 输入的通道数

out_channels -- 根据卷积核数,如in_channels=1,卷积核有两个,则out_channels=2

nn_conv2d.py

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10('./dataset', train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader = DataLoader(dataset, batch_size=64)

class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        # 我们的图像是三通道的(RGB)
        # 3×3大小的卷积核一共有6个,因为输出为6个,每个卷积核有3通道
        self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)

    def forward(self, x):
        x = self.conv1(x)
        return x

myModule1 = MyModule()

writer = SummaryWriter('./logs')
step = 0
for data in dataloader:
    imgs, targets = data
    output = myModule1(imgs)
    print(imgs.shape)  # torch.Size([64, 3, 32, 32])
    print(output.shape)  # torch.Size([64, 6, 30, 30])
    output = torch.reshape(output, (-1, 3, 30, 30))  # 不知道多少时填-1,会帮你自动计算,相当于batch_size多了
    writer.add_images('input', imgs, step)
    writer.add_images('output', output, step)
    step = step + 1
writer.close()

注意:output要进行reshape是因为tensorboard在放图片时,没有六通道的处理。于是我们相当于把六通道分成2个三通道,匀出来的分给了batch_size,这样batch_size的数量就扩大了两倍。在不知道具体数为多少时,我们可以用-1代替。

3. 池化层

图片来源于:b站up主 我是土堆

说明:若没有设置步长,则默认为kernel_size大小。若Ceil_model设置为True,则不够3×3的部分也会保留进行计算;如果Ceil_model设置为False,则不够3×3的部分直接舍去,不进行计算。

N—batch_size  C—Channels

nn_maxpool.py

import torch
from torch import nn
from torch.nn import MaxPool2d

input = torch.tensor([
    [1, 2, 0, 3, 1],
    [0, 1, 2, 3, 1],
    [1, 2, 1, 0, 0],
    [5, 2, 3, 1, 1],
    [2, 1, 0, 1, 1]
], dtype=torch.float32)
# -1——batch_size数,1——通道数
input = torch.reshape(input, (-1, 1, 5, 5))

# print(input.shape)  # print(input.shape)#

class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=True)

    def forward(self, x):
        output = self.maxpool1(x)
        return output

myModule1 = MyModule()
output = myModule1(input)
print(output)

Note:要将input转为浮点数。 

tensor([[[[2., 3.],
          [5., 1.]]]])

若ceil_model=False:

tensor([[[[2.]]]])

最大池化的目的:保留输入的特征,同时把数据量减小。 

nn_maxpool.py

import torch
import torchvision
from torch import nn
from torch.nn import MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10('./dataset', train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader = DataLoader(dataset, batch_size=64)

class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=False)

    def forward(self, x):
        output = self.maxpool1(x)
        return output

myModule1 = MyModule()

writer = SummaryWriter('./logs')
step = 0
for data in dataloader:
    imgs, targets = data
    writer.add_images('input', imgs, step)
    output = myModule1(imgs)
    writer.add_images('output', output, step)
    step = step + 1
writer.close()

4. 非线性激活

4.1 使用ReLU非线性激活

Note:inplace

图片来源于:b站up主 我是土堆

nn_relu.py

import torch
from torch import nn
from torch.nn import ReLU

input = torch.tensor([
    [1, -0.5],
    [-1, 3]
])
# batch_size,channel,HW
input = torch.reshape(input, (-1, 1, 2, 2))

class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        self.relu1 = ReLU()

    def forward(self, x):
        output = self.relu1(x)
        return output

myModule1 = MyModule()
output = myModule1(input)
print(output)

tensor([[[[1., 0.],
          [0., 3.]]]])

4.2 使用Sigmoid非线性激活

 

import torch
import torchvision
from torch import nn
from torch.nn import ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10('./dataset', train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader = DataLoader(dataset, batch_size=64)

class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        self.relu1 = ReLU()
        self.sigmoid1 = Sigmoid()

    def forward(self, x):
        output = self.sigmoid1(x)
        return output

myModule1 = MyModule()

writer = SummaryWriter('logs')
step = 0
for data in dataloader:
    imgs, targets = data
    writer.add_images('input', imgs, step)
    output = myModule1(imgs)
    writer.add_images('output', output, step)
    step = step + 1
writer.close()

5. 线性激活

nn_linear.py

import torch
import torchvision
from torch import nn
from torch.nn import Linear
from torch.utils.data import DataLoader

dataset = torchvision.datasets.CIFAR10('./dataset', train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader = DataLoader(dataset, batch_size=64)

class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        self.linear1 = Linear(196608, 10)  # in_features,out_features

    def forward(self, x):
        output = self.linear1(x)
        return output

myModule1 = MyModule()

for data in dataloader:
    imgs, targets = data
    # print(imgs.shape)  # torch.Size([64, 3, 32, 32])
    # output = torch.reshape(imgs, (1, 1, 1, -1))
    # print(output.shape)  # torch.Size([1, 1, 1, 196608])
    # 可以使用torch.flatten来拉成一维向量
    output = torch.flatten(imgs)
    # print(output.shape)  # torch.Size([196608])
    output = myModule1(output)
    # print(output.shape)  # torch.Size([10])

6. PyTorch的一些图像模型 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/576205.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

日撸 Java 三百行day54-55

文章目录 说明day54 基于 M-distance 的推荐1. M-distance 理解2.代码理解1.代码中变量的解读2.leave-one-out测试3.计算MAE(平均绝对误差)4.计算RMSE(均方根误差) day55 基于 M-distance 的推荐(续)1.基于用户和基于项目的推荐2.…

ASEMI代理长电可控硅BT134的工作原理,BT134的应用领域

编辑-Z 本文将对可控硅BT134的工作原理及应用领域进行详细阐述。首先,我们将介绍可控硅BT134的基本概念和工作原理;其次,我们将探讨可控硅BT134在电力电子领域的应用;接着,我们将分析可控硅BT134在家用电器中的应用&a…

一种使用Java的快速将Web中表格转换成Excel的方法

背景 随着后疫情时代的到来,在过去的2022年,全国的经济情况,想必是很多学者和研究对象都非常关心的事。而这些数据在国家统计局网站上都有相应的记录。通过分析这些数据,可以从某一个角度来验证和观察当下的经济情况。 全国共计有…

Less基础速学 —— 嵌套、变量、注释、

关于CSS的预处理有读者了解到的就有主流的这三种:less 、sass/sacc 和 stylus,那么在使用这些CSS的预处理器,有浏览器的用法和服务器端的方法,例如使用Node来通过NPM包管理工具下载安装less在服务端来跑,那么在浏览器上…

go渲染静态html引擎模版

写个小例子介绍一下渲染html引擎模板的使用&#xff0c;大致目录结果如下&#xff1a; templates目录下三个html内容如下: index.html <title>模板1</title><link rel"stylesheet" href"/css/index.css" /><h1 class"text&quo…

数据链路层:差错检测

1.数据链路层&#xff1a;差错检测 笔记来源&#xff1a; 湖科大教书匠&#xff1a;差错检测 声明&#xff1a;该学习笔记来自湖科大教书匠&#xff0c;笔记仅做学习参考 比特差错&#xff1a;比特在传输过程中1可能变为0&#xff0c;0可能变为1 误码率BER&#xff1a;传输错误…

数据链路层:以太网/ARP协议

本文将分享数据链路层的相关知识点&#xff1a;以太网、以太网帧格式、MAC地址、MTU和ARP协议 以太网 "以太网" 不是一种具体的网络, 而是一种技术标准; 既包含了数据链路层的内容, 也包含了一些物理层的内容。例如: 规定了网络拓扑结构, 访问控制方式, 传输速率等。…

Linux学习笔记 --- Linux用户和权限

一. 认知root用户 目标&#xff1a;1. 了解什么是root用户(超级管理员) 2. 掌握用户切换的相关命令 3. 掌握sudo命令 root用户&#xff08;超级管理员&#xff09; 无论是Windows、MacOS、Linux均采用多用户的管理模式进行权限管理。 在Linux系统中&#xff0c;拥有…

STM32 UDS Bootloader开发-需求篇

文章目录 前言内存分配UDS诊断协议需求CAN ID及时间参数诊断服务Bootloader诊断服务 APP诊断服务DID刷写流程预编程主编程后编程 总结 前言 最近断断续续的在做基于STM32F103的UDS Bootloader,没有项目驱动&#xff0c;只是自己感兴趣。目前基本已经可以实现功能了&#xff0c…

关于 OpenCV 图像处理工具包 imutils 简单认知

写在前面 博文内容涉及 基本的图像处理工具包 imutils 的简单介绍以及使用Demo理解不足小伙伴帮忙指正 对每个人而言&#xff0c;真正的职责只有一个&#xff1a;找到自我。然后在心中坚守其一生&#xff0c;全心全意&#xff0c;永不停息。所有其它的路都是不完整的&#xff0…

2023年真无线蓝牙耳机品牌有哪些推荐?无线蓝牙耳机选购指南

今天就来给大家测评一下2023年最受用户欢迎的蓝牙耳机&#xff0c;在不断地测试耳机&#xff0c;并挖掘好的耳机出来&#xff0c;不得不说&#xff0c;蓝牙和麦克风以及音频技术的驱动的迭代更新&#xff0c;性能确实惊叹不已。 对于刚接触无线耳机的小白来说&#xff0c;选购…

【服务器】支付宝SDK接口调试

​ 文章目录 1.测试环境2.本地配置3. 内网穿透3.1 下载安装cpolar内网穿透3.2 创建隧道 4. 测试公网访问5. 配置固定二级子域名5.1 保留一个二级子域名5.2 配置二级子域名 6. 使用固定二级子域名进行访问 转发自cpolar内网穿透的文章&#xff1a;Java支付宝沙箱环境支付&#…

低代码的“钱景”——专业的事交给专业的人来做

你需要知道的低代码 低代码通常是指一种可视化的开发方法&#xff0c;用较少的代码、较快的速度来交付应用程序&#xff0c;相似的概念还有“无代码”&#xff0c;也是一种开发方法&#xff0c;通常是面向非技术性员工&#xff0c;让业务人员也可以成为“技术人员”&#xff0…

首发Yolov8涨点神器:华为诺亚2023极简的神经网络模型 VanillaNet---VanillaBlock助力检测,实现暴力涨点

强烈推荐:博主多个数据集亲测有效,实现暴力涨点,可快速迁移到论文创新性十足,刚新鲜出炉的论文,华为诺亚共同提出!!! 1.VanillaNet 论文:https://arxiv.org/pdf/2305.12972.pdf 来自华为诺亚、悉尼大学的研究者们提出了一种极简的神经网络模型 VanillaNet,以极简主义…

表情包APP小程序制作开发功能有哪些?

表情包小程序在实际的开发过程中所具备的功能都是至关重要的&#xff0c;功能完善好操作才能更受用户青睐。表情包小程序制作开发功能包括但不仅限于以下几点&#xff1a; 1、热门表情包推荐。表情包制作小程序为用户推荐最热门的表情包&#xff0c;让用户可以紧跟当下流…

串口屏-迪文10寸T5串口屏简单上手

先看效果 调试所需软件 DGUS上位机 下载链接 调试所需硬件 SD卡一张 读卡器一个 USB转TTL一个 DGUS上位机调试 点击新建工程(会让你选尺寸) 分别生成0号字库和DWIN ICL文件 0号字库文件在你软件的安装目录可以找到 ICL文件输出到你能找到的位置 等会要用 添加背景图片 …

异常检测论文1

本文仅作为个人阅读文献&#xff0c;做笔记记录。 <> \usepackage[dvipsnames]{xcolor} 一、摘要部分&#xff1a; 我们发现&#xff0c;现有的数据集偏向于局部结构异常&#xff0c;如划痕、凹痕或污染。特别是&#xff0c;它们缺乏违反逻辑约束形式的异常&#xff0…

【redis】Stream、String 超详细介绍

文章目录 一、Stream1.1 写入数据XADD条目 ID 的格式 1.2 获取数据XRANGE 和 XREVRANGEXREAD 监听新条目非阻塞形式阻塞形式 1.3 消费者组XGROUP 创建消费者组XREADGROUP 通过消费者组消费XACK 确认消息消费者组示例 1.4 XPENDING 和 XCLAIM 认领 其他消费者 的待处理消息XPEND…

(2022,MaskedGAN)掩蔽的生成对抗网络是数据高效生成学习者

Masked Generative Adversarial Networks are Data-Efficient Generation Learners 公众号&#xff1a;EDPJ 目录 0. 摘要 1. 简介 2. 相关工作 3. 方法 3.1 任务定义 3.2 掩蔽的生成对抗网络 3.3 理论见解 4. 实验 4.1 在 CIFAR-10、CIFAR-100 和 ImageNet 上使用…

算法基础学习笔记——④前缀和\差分\双指针\位运算

✨博主&#xff1a;命运之光 ✨专栏&#xff1a;算法基础学习 目录 ✨前缀和 ✨一维前缀和 &#x1f353;一维前缀和模板&#xff1a; ✨二维前缀和 &#x1f353;二位前缀和模板&#xff1a; 前言&#xff1a;算法学习笔记记录日常分享&#xff0c;需要的看哈O(∩_∩)O&a…