文章目录
- Log
- 一、Torchvision
- 1. CIFAR10
- ① 介绍
- ② 使用
- 2. 与 Transforms 结合使用
- 总结
Log
2022.11.28接着开启新的一章
2022.11.29继续学习
一、Torchvision
- 视频教程中 Torchvision v0.9.0文档
- Torchvision 官方文档
- Torchvision Datasets API 文档
1. CIFAR10
① 介绍
- CIFAR10数据集介绍
- 该数据集包括 60,000 张 32×32 像素的彩色图片,共有 10 个类别,每个类别有 6,000 张图像
- 50,000 张是训练图片,10,000 张是测试图片
- 图片示例如下:
② 使用
- 加载训练集和测试集:
import torchvision
train_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=True, download=True)
test_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=False, download=True)
- 其中的参数:
root
:数据集的路径train
:如果为True
则创建数据集,如果为False
则创建测试集download
:为True
则从网络上下载数据集到root
路径下,如果该路径下已有数据集则不进行下载。
- 输出测试集中的第一个:
print(test_set[0])
- 得到:
(<PIL.Image.Image image mode=RGB size=32x32 at 0x1F775353A30>, 3)
。其中3
代表的是该测试样例对应的映射到整数上的类别 - 查看对应的类别:
print(test_set.classes)
['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
- 将测试样例的图片和标签分开输出:
img, target = test_set[0]
print(img) #<PIL.Image.Image image mode=RGB size=32x32 at 0x21F1E533A60>
print(target) #3
- 先查看图片:
img.show()
-
由于该数据集的图片是 32×32 像素的,所以不是很清晰:
-
再查看对应的类别的名称:
print(test_set.classes[target]) # cat
2. 与 Transforms 结合使用
- 在创建数据集的时候新增一个参数,用到上一章学到的内容将原始的
PIL
类型的图片转换成ToTensor
类型的图片:
dataset_transform = torchvision.transforms.Compose([
torchvision.transforms.ToTensor()
])
train_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=True, transform=dataset_transform, download=True)
test_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=False, transform=dataset_transform, download=True)
- 之后就可以将
ToTensor
类型的图片显示到tensorboard
中了:
writer = SummaryWriter("log-CIFAR10")
for i in range(10):
img, target = test_set[i]
writer.add_image("test_set-CIFAR10", img, i)
writer.close()
总结
- 本文以 C I F R 10 \rm CIFR10 CIFR10 为例介绍了 T o r c h v i s i o n \rm Torchvision Torchvision 中数据集的使用方法,以及如何结合 T r a n s f o r m s \rm Transforms Transforms 使用数据集。