Pytorch入门实战 P2-CIFAR10彩色图片识别

一、前期准备

1、数据集CIFAR10

2、判断自己的设备，是否可以使用GPU运行。

3、下载数据集，划分好训练集和测试集

4、加载训练集、测试集

5、取一个批次查看下

6、数据可视化

二、搭建简单的CNN网络模型

三、训练模型

1、设置超参数

2、编写训练函数

3、编写测试函数

4、正式训练

四、模型训练结果可视化

五、模型训练结果：

🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊 | 接辅导、项目定制

这周的实战内容，主要使用的数据集是CIFAR10数据集。用来验证彩色图片的识别。

一、前期准备

1、数据集CIFAR10

我们使用的数据集的文档地址：Datasets — Torchvision 0.17 documentation

简单介绍下CIFAR10数据集：

CIFAR-10数据集由60000张32 × 32彩色图像组成，分为10个类，每个类有6000张图像。

有50000张训练图像和10000张测试图像。

2、判断自己的设备，是否可以使用GPU运行。

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(device)

3、下载数据集，划分好训练集和测试集

import torchvision.datasets

# 下载训练集
train_ds = torchvision.datasets.CIFAR10('data',
                                        train=True,
                                        transform=torchvision.transforms.ToTensor(),
                                        download=True)
# 下载测试集
test_ds = torchvision.datasets.CIFAR10('data',
                                       train=False,
                                       transform=torchvision.transforms.ToTensor(),
                                       download=True)

4、加载训练集、测试集

# 使用dataloader加载数据集,并设置好batch_size
batch_size = 32
train_dl = torch.utils.data.DataLoader(train_ds,
                                       shuffle=True,
                                       batch_size=batch_size)
test_dl = torch.utils.data.DataLoader(test_ds,
                                      batch_size=batch_size)

5、取一个批次查看下

# 取一个批次，查看下数据
imgs,labels = next(iter(train_dl))
print(imgs.shape)   #  数据的shape为：[batch_size,channel,height,weight]  
'''
    对于CIFAR10,这里的shape是 [32,3,32,32]，即 因为取得是train_dl的数据，batch_size为32；
    channel为3是因为，是彩色图片RGB的3通道，如果是黑白图片，则channel为1；剩下的32x32是高度和宽度；
'''

6、数据可视化

即：展示下取到的数据。

# 数据可视化
plt.figure(figsize=(20,5))
for i, imgs in enumerate(imgs[:20]):
    npimg = imgs.numpy().transpose((1,2,0))   
            #.numpy()用于将Tensor转换为一个Numpy数组。transpose是Numpy数组的一个方法，用于重新排列数组的维度。
    plt.subplot(2, 10, i+1)
    plt.imshow(npimg, cmap=plt.cm.binary)
    plt.axis('off')
plt.show()

运行结果展示：

二、搭建简单的CNN网络模型

CNN（卷积神经网络），需要注意其结构、层与层之间的连接关系以及各层的功能。

①卷积层：负责提取特征。（通常使用局部连接和权值共享方式，这有助于减少网络的参数数量和计算复杂度。）

②池化层：负责降低数据的空间尺寸和计算复杂度。

③全连接层：负责将提取的特征映射到输出类别。

# 构建简单的CNN网络
num_classes = 10
class Model(nn.Module):
    def __init__(self):
        super().__init__()

        # 特征提取
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)
        self.pool1 = nn.MaxPool2d(2)
        self.conv2 = nn.Conv2d(64, 64, kernel_size=3)
        self.pool2 = nn.MaxPool2d(2)
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3)
        self.pool3 = nn.MaxPool2d(2)

        # 分类网络
        self.fc1 = nn.Linear(512, 256)
        self.fc2 = nn.Linear(256, num_classes)

    # 前向传播
    def forward(self,x):
        x = self.pool1(F.relu(self.conv1(x)))
        x = self.pool2(F.relu(self.conv2(x)))
        x = self.pool3(F.relu(self.conv3(x)))

        x = torch.flatten(x, start_dim=1)  # 线性层+激活函数  是构建复杂模型的基础
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# 打印并加载模型
model = Model().to(device)
print(model)