PyTorch深度学习实战(3)——小试牛刀:CIFAR-10分类

news2024/12/24 0:38:38

下面尝试从零搭建一个PyTorch模型来完成CIFAR-10数据集上的图像分类任务,步骤如下。

(1)使用torchvision加载并预处理CIFAR-10数据集。

(2)定义网络。

(3)定义损失函数和优化器。

(4)训练网络,并更新网络参数。

(5)测试网络。

1 CIFAR-10数据加载及预处理

CIFAR-10是一个常用的彩色图片数据集,它有10个类别:airplane、automobile、bird、cat、deer、dog、frog、horse、ship和truck。每张图片大小都是$3\times32\times32$,即3通道彩色图片,分辨率为$32\times32$。下面举例说明如何完成图像加载与预处理:

In: import torch as t
    import torchvision as tv
    import torchvision.transforms as transforms
    from torchvision.transforms import ToPILImage
    show = ToPILImage() # 可以把Tensor转成Image,Jupyter可直接显示Image对象In: # 第一次运行程序torchvision会自动下载CIFAR-10数据集,
    # 数据集大小约为100M,需花费一些时间,
    # 如果已经下载好CIFAR-10数据集,那么可通过root参数指定
    
    # 定义对数据的预处理
    transform = transforms.Compose([
            transforms.ToTensor(), # 转为Tensor
            transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)), # 归一化
                                 ])
    # 训练集
    trainset = tv.datasets.CIFAR10(
                        root='./pytorch-book-cifar10/', 
                        train=True, 
                        download=True,
                        transform=transform)
    
    trainloader = t.utils.data.DataLoader(
                        trainset, 
                        batch_size=4,
                        shuffle=True, 
                        num_workers=2)
    
    # 测试集
    testset = tv.datasets.CIFAR10(
                        './pytorch-book-cifar10/',
                        train=False, 
                        download=True, 
                        transform=transform)
    
    testloader = t.utils.data.DataLoader(
                        testset,
                        batch_size=4, 
                        shuffle=False,
                        num_workers=2)
    
    classes = ('plane', 'car', 'bird', 'cat', 'deer', 
               'dog', 'frog', 'horse', 'ship', 'truck')
 
 Out:Files already downloaded and verified
    Files already downloaded and verifiedDataset

对象是一个数据集,可以按下标访问,返回形如(data, label)的数据,举例说明如下:

In: (data, label) = trainset[100]
    print(classes[label])
    
    # (data + 1) / 2目的是还原被归一化的数据
    show((data + 1) / 2).resize((100, 100))Out:ship

Dataloader是一个可迭代对象,它将Dataset返回的每一条数据样本拼接成一个batch,同时提供多线程加速优化和数据打乱等操作。当程序对Dataset的所有数据遍历完一遍后,对Dataloader也完成了一次迭代:

In: dataiter = iter(trainloader)     # 生成迭代器
    images, labels = dataiter.next() # 返回4张图片及标签
    print(' '.join('%11s'%classes[labels[j]] for j in range(4))) 
    show(tv.utils.make_grid((images + 1) / 2)).resize((400,100))

Out:  horse        frog       plane        bird

2 定义网络

拷贝上面的LeNet网络,因为CIFAR-10数据集中的数据是3通道的彩色图像,所以将self.conv1中第一个通道参数修改为3:

In: import torch.nn as nn
    import torch.nn.functional as F
    
    class Net(nn.Module):
        def __init__(self):
            super(Net, self).__init__()
            self.conv1 = nn.Conv2d(3, 6, 5) # 将第一个通道参数修改为3
            self.conv2 = nn.Conv2d(6, 16, 5)  
            self.fc1   = nn.Linear(16 * 5 * 5, 120)  
            self.fc2   = nn.Linear(120, 84)
            self.fc3   = nn.Linear(84, 10) # 类别数为10
    
        def forward(self, x): 
            x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2)) 
            x = F.max_pool2d(F.relu(self.conv2(x)), 2) 
            x = x.view(x.size()[0], -1) 
            x = F.relu(self.fc1(x))
            x = F.relu(self.fc2(x))
            x = self.fc3(x)        
            return x
 
    net = Net()
    print(net)Out:Net(
        (conv1): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))
        (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
        (fc1): Linear(in_features=400, out_features=120, bias=True)
        (fc2): Linear(in_features=120, out_features=84, bias=True)
        (fc3): Linear(in_features=84, out_features=10, bias=True)
    )

3 定义损失函数和优化器

这里使用交叉熵nn.CrossEntropyLoss作为损失函数,随机梯度下降法作为优化器:

In: from torch import optim
    criterion = nn.CrossEntropyLoss() # 交叉熵损失函数
    optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

4 训练网络

所有网络的训练流程都是类似的,也就是不断地执行如下流程。

(1)输入数据。

(2)前向传播、反向传播。

(3)更新参数。

In: for epoch in range(2):  
        running_loss = 0.0
        for i, data in enumerate(trainloader, 0):
            # 输入数据
            inputs, labels = data
            
            # 梯度清零
            optimizer.zero_grad()
            
            # forward + backward 
            outputs = net(inputs)
            loss = criterion(outputs, labels)
            loss.backward()   
            
            # 更新参数 
            optimizer.step()
            
            # 打印log信息
            running_loss += loss.item()
            if i % 2000 == 1999: # 每2000个batch打印一下训练状态
                print('[%d, %5d] loss: %.3f' \
                      % (epoch+1, i+1, running_loss / 2000))
                running_loss = 0.0
    print('Finished Training')
 
 Out:[1,  2000] loss: 2.228
    [1,  4000] loss: 1.890
    [1,  6000] loss: 1.683
    [1,  8000] loss: 1.592
    [1, 10000] loss: 1.513
    [1, 12000] loss: 1.478
    [2,  2000] loss: 1.387
    [2,  4000] loss: 1.368
    [2,  6000] loss: 1.346
    [2,  8000] loss: 1.324
    [2, 10000] loss: 1.300
    [2, 12000] loss: 1.255
    Finished Training

这里仅训练了2个epoch(遍历完一遍数据集称为1个epoch),下面来看看网络有没有效果。将测试图片输入到网络中,计算它的label,然后与实际的label进行比较:

In: dataiter = iter(testloader)
    images, labels = dataiter.next() # 一个batch返回4张图片
    print('实际的label: ', ' '.join(\
                '%08s'%classes[labels[j]] for j in range(4)))
    show(tv.utils.make_grid(images / 2 - 0.5)).resize((400, 100))
 
 Out:实际的label:       cat     ship     ship    plane

接着计算网络预测的分类结果:

In: # 计算图片在每个类别上的分数
    outputs = net(images)
    # 得分最高的那个类
    _, predicted = t.max(outputs.data, 1) 
    
    print('预测结果: ', ' '.join('%5s'% classes[predicted[j]] for j in range(4)))
 
Out:预测结果:    cat  ship  ship  ship

从上述结果可以看出:网络的准确率很高,针对这四张图片达到了75%的准确率。然而,这只是一部分图片,下面再来看看在整个测试集上的效果:

In: correct = 0 # 预测正确的图片数
    total = 0 # 总共的图片数
 
    # 由于测试的时候不需要求导,可以暂时关闭autograd,提高速度,节约内存
    with t.no_grad():
        for data in testloader:
            images, labels = data
            outputs = net(images)
            _, predicted = t.max(outputs, 1) 
            total += labels.size(0)
            correct += (predicted == labels).sum()
    
    print('10000张测试集中的准确率为: %f %%' % (100 * correct // total))

Out:10000张测试集中的准确率为: 52.000000 %

训练结果的准确率远比随机猜测(准确率为10%)好,证明网络确实学到了东西。

5 在GPU上训练

就像把Tensor从CPU转移到GPU一样,模型也可以类似地从CPU转移到GPU,从而加速网络训练:

In: device = t.device("cuda:0" if t.cuda.is_available() else "cpu")
    net.to(device)
    images = images.to(device)
    labels = labels.to(device)
    output = net(images)
    loss= criterion(output,labels)
    
    lossOut:tensor(0.5668, device='cuda:0', grad_fn=<NllLossBackward>)

6 小结

本文给出了一个PyTorch快速入门指南,具体包含以下内容。

  • Tensor:类似NumPy数组的数据结构,它的接口与NumPy的接口类似,可以方便地互相转换。
  • autograd:为Tensor提供自动求导功能。
  • nn:专门为神经网络设计的接口,提供了很多有用的功能,如神经网络层、损失函数、优化器等。
  • 神经网络训练:以CIFAR-10分类为例,演示了神经网络的训练流程,包括数据加载、网络搭建、模型训练及模型测试。

通过本文的学习,可以大概了解PyTorch的主要功能,并能够使用PyTorch编写简单的模型。从下一篇开始,将深入系统地讲解PyTorch的各部分知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1983773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

P32调试技巧1、2

实用调试技巧 什么是bug?调试是什么&#xff1f;有多么重要&#xff1f;debug和release的介绍windows环境调试介绍一些调试的实例如何写出好的&#xff08;易于调试&#xff09;代码编程常见的错误 什么是bug&#xff1f; 第一次被发现的导致计算机错误的飞蛾&#xff0c;也是…

Modbus -- TCP协议

MODBUS TCP协议是一种基于TCP/IP协议的Modbus变种&#xff0c;它允许Modbus协议在以太网网络上运行&#xff0c;使得设备之间可以通过IP网络交换数据。 一:协议概述 modbus_TCP协议:走的是网口&#xff0c;所以需要创建TCPclient对象进行通信,和modubus-RTU协议最大的区别是&a…

proxfier的使用和设置

1,安装proxifier工具 2&#xff0c;安装之后配置代理设置 3&#xff0c;首先点击彩色卷部分 4&#xff0c;修改配置文件&#xff0c;并且配置代理协议为https ip为127.0.0.1 端口为8888 &#xff08;注意下面图片 default一定为直连) 5&#xff0c;设置代理服务器&#xff…

怎样配置虚拟机IP

目录(三步走) 配置本机IP 配置虚拟机外部IP 配置虚拟机内部IP 参考链接: 配置本机IP 打开“网络和共享中心”——>更改“适配器设置” 找到“VMnet8”,然后右键“属性”,弹出下列窗口 输入本机IP(你目前电脑的IP) win系统可以用的命令:IPconfig 一共有AB两位,…

为什么我3d模型选择面选不到?---模大狮模型网

在展览3D模型设计行业中&#xff0c;设计师常常面临诸多技术挑战&#xff0c;其中之一是在模型编辑过程中遇到选择面的困难。这不仅影响了设计工作效率&#xff0c;还可能影响最终作品的质量和展示效果。本文将探讨在3D模型设计中为何会遇到“为什么我3D模型选择面选不到?”这…

【51单片机仿真】基于51单片机设计的钟表定时闹钟系统仿真源码设计文档演示视频——完整资料下载

演示视频 设计内容 &#xff08;1&#xff09;使用 DS1302 结合字符型 LCD12864 显示器设计一个简易的定时闹钟 LCD 时钟。程序执行后 LCD 显示“00&#xff1a;00&#xff1a;00” &#xff08;2&#xff09;K1—设置现在的时间&#xff0c;年闪烁&#xff0c;再按 K1 键月闪…

淘宝小程序踩坑记录

最近搞了一套淘宝小程序配合淘宝店铺直接跳转&#xff0c;类似于扭蛋机那种机制&#xff0c;真是一路坎坷&#xff0c;一步一个坑&#xff0c;这里记录一下&#xff08;前端&#xff09;&#xff1b;淘宝小程序文当中心 编译相关 用uni-app没有淘宝小程序独有的编译环境&…

EdgeWorkers 最佳实践丨助力流媒体创新

近日亚太区 Akamai EdgeWorkers 首届编程挑战赛圆满落幕。参赛团队充分利用 Akamai 的智能边缘平台&#xff0c;探索无服务器计算的应用潜力。爱奇艺等获胜团队凭借 Akamai EdgeWorkers 和 EdgeKV 产品开发功能&#xff0c;将 DNS 解析时间降低 40% 。 一、云上竞逐&#xff0…

21LTR-Scene打靶渗透【附POC】(权限提升)

靶机下载地址&#xff1a;21LTR: Scene 1 ~ VulnHub21LTR: Scene 1, made by JayMaster2000. Download & walkthrough links are available.https://www.vulnhub.com/entry/21ltr-scene-1,3/ 1. 主机发现端口扫描目录扫描【192.168.2.120】 1.1. 主机发现 nmap -sn 192.…

牛客周赛 Round 54 (A~E)

#牛客周赛 Round 54 &#xff08;A~E&#xff09; 前言&#xff1a; 以后会定时更新很多比赛的题解 希望借此让自己坚持赛后补题 要不然写完就结束 自己水平没有一点提高 本人很菜所以不会更新 太难的题 加油&#xff01;&#xff01;&#xff01;1. ​清楚姐姐的糖葫芦…

落笔成画!Krita+ComfyUI解锁AI实时绘图

原文链接&#xff1a;落笔成画&#xff01;KritaComfyUI解锁AI实时绘图 (chinaz.com) 安装前提&#xff1a;电脑本地已经安装过ComfyUI且能正常运行 首先我们到Krita的官网下载Krita&#xff0c;我们直接下载最新的安装就可以了&#xff0c;安装过程非常简单&#xff0c;选择…

SQL注入之sqli-labs靶场第一关

手工注入less-1 1.找注入点 通过 ?id1 and 12--没有发现变化&#xff0c;尝试闭合发现注入点 字符型注入&#xff0c;单引号闭合 2.猜解字段数量 发现字段数量为3 3.通过union联合查询判断回显点 发现回显点2&#xff0c;3&#xff0c; 4&#xff0c;进行信息收集 数据库…

在PyCharm社区版中切换中文界面的操作方法

在PyCharm社区版中切换中文界面&#xff0c;可以按照以下步骤操作&#xff1a; 打开PyCharm社区版&#xff0c;点击顶部菜单栏的 "File"&#xff08;文件&#xff09;。在下拉菜单中选择 "Settings"&#xff08;设置&#xff09;&#xff0c;或者使用快捷…

SSM整合快速学习

目录 步骤&#xff1a; 一、环境搭建 1.创建JdbcConfig配置类 2.创建JdbcConfig配置类 3.创建MybatisConfig配置类 4.创建jdbc.properties 5.创建SpringMVC配置类 6.创建Web项目入口配置类 二、功能模块开发 步骤1:创建数据库及表 步骤2:编写模型类 步骤3:编写Dao接…

Unlikely argument type for equals(): int seems to be unrelated to Long

代码审查不规范&#xff1a; Unlikely argument type for equals(): int seems to be unrelated to Long check package code_check;public class Obj {public Obj(){}private Long mail;public Long getMail(){return mail;}public void setMail(Long mail){this.mail mail;…

【OpenCV C++20 学习笔记】提取图片中的水平和垂直对象

提取图片中的水平和垂直对象 原理实操——去除五线谱的五线二进制化提取垂直对象完善边缘和最终输出图片黑白反转平滑 完整代码 其他图片元素提取实践提取水平线条提取音符轮廓 原理 在腐蚀和膨胀操作中&#xff0c;通过卷积核(kernel)&#xff0c;或者结构元素(structuring e…

在优化微信、支付宝小程序用户体验时有哪些关键指标

在优化小程序用户体验时&#xff0c;有几个关键指标需要特别关注&#xff0c;这些指标不仅能够帮助评估当前的用户体验状况&#xff0c;还能为后续的优化工作提供明确的方向。以下是一些关键指标及其解释&#xff1a; 1. 日活跃用户&#xff08;DAU&#xff09; 是指每天使用…

搭建Mybatis,实现数据库增删改

在pom.xml文件中粘贴下列&#xff0c;加载maven依赖 <?xmlversion"1.0"encoding"UTF-8"?> <projectxmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation&…

2024年武汉东湖高新区职称第二批次开始了

众所周知&#xff0c;武汉市东湖高新区职称一年两批次&#xff0c;今年下半年第二批水平能力测试报名也已经开始了&#xff0c;请注意报名时间&#xff0c;别错过&#xff01;&#xff01; 2024年武汉东湖高新区第二批次水测报名时间&#xff1a;&#xff08;一&#xff09;网上…

letcode 分类练习 哈希表 242.有效的字母异位词 349. 两个数组的交集 202. 快乐数 1. 两数之和

letcode 分类练习 哈希表 242.有效的字母异位词 349. 两个数组的交集 202. 快乐数 1. 两数之和 242.有效的字母异位词349.两个数组的交集202.快乐数1.两数之和 242.有效的字母异位词 分别定义两个字母哈希表就可以了 class Solution { public:bool isAnagram(string s, strin…