PyTorch（四）Torchvision 与 Transforms

news2025/7/6 5:13:20

文章目录

- Log
一、Torchvision
- 1. CIFAR10
- - ① 介绍
  - ② 使用
- 2. 与 Transforms 结合使用
总结

Log

2022.11.28接着开启新的一章
2022.11.29继续学习

一、Torchvision

视频教程中 Torchvision v0.9.0文档
Torchvision 官方文档
Torchvision Datasets API 文档

1. CIFAR10

① 介绍

CIFAR10数据集介绍
该数据集包括 60,000 张 32×32 像素的彩色图片，共有 10 个类别，每个类别有 6,000 张图像
50,000 张是训练图片，10,000 张是测试图片
图片示例如下：

② 使用

加载训练集和测试集：

import torchvision

train_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=True, download=True)
test_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=False, download=True)

其中的参数：
- root：数据集的路径
- train：如果为 True 则创建数据集，如果为 False 则创建测试集
- download：为 True 则从网络上下载数据集到 root 路径下，如果该路径下已有数据集则不进行下载。
输出测试集中的第一个：

print(test_set[0])

得到：(<PIL.Image.Image image mode=RGB size=32x32 at 0x1F775353A30>, 3)。其中 3 代表的是该测试样例对应的映射到整数上的类别
查看对应的类别：

print(test_set.classes)
['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

将测试样例的图片和标签分开输出：

img, target = test_set[0]
print(img)		#<PIL.Image.Image image mode=RGB size=32x32 at 0x21F1E533A60>
print(target)	#3

先查看图片：

img.show()

由于该数据集的图片是 32×32 像素的，所以不是很清晰：
再查看对应的类别的名称：

print(test_set.classes[target])	# cat

2. 与 Transforms 结合使用

在创建数据集的时候新增一个参数，用到上一章学到的内容将原始的 PIL 类型的图片转换成 ToTensor 类型的图片：

dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
train_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=True, transform=dataset_transform, download=True)
test_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=False, transform=dataset_transform, download=True)

之后就可以将 ToTensor 类型的图片显示到 tensorboard 中了：

writer = SummaryWriter("log-CIFAR10")
for i in range(10):
    img, target = test_set[i]
    writer.add_image("test_set-CIFAR10", img, i)
writer.close()

在这里插入图片描述

总结

本文以 $\rm CIFR10$ 为例介绍了 $\rm Torchvision$ 中数据集的使用方法，以及如何结合 $\rm Transforms$ 使用数据集。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/47060.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

HBuilder X实现banner轮播图

HBuilder X实现banner轮播图

第一步还是去仔细阅读官方文档，找到组件下面的内置组件里面的swiper，如图所示官方是提供了一个用来制作轮播图的滑块视图容器：swiper 一般来说，轮播图的图片地址是由后端返回给前端遍历显示在页面上的，所以基本的结构…

阅读更多...

世界杯的“中国元素”昂扬大国担当，点面科技全新推出的多模态多功能移动终端踏上卡塔尔征途！

世界杯的“中国元素”昂扬大国担当，点面科技全新推出的多模态多功能移动终端踏上卡塔尔征途！

本次世界杯中国足球队没有参加，但是在世界杯的赛场上到处都有中国元素。中国承建的卢赛尔体育场卡塔尔世界杯主体育场——卢赛尔球场由中国铁建以总承包身份承建，引发了全球瞩目。在本届世界杯赛事中，该场馆将承担包括决赛在内的10场比赛&…

阅读更多...

idea手动创建webapp（在main文件夹下）

idea手动创建webapp（在main文件夹下）

SSM自学笔记文章目录一、Maven使用正常情况首先不使用骨架创建好Maven项目然后选择Project Structure...选择要创建webapp的模块修改路径二、Maven不正常工作时一、Maven使用正常情况首先不使用骨架创建好Maven项目然后选择Project Structure… 选择要创建webapp的模块选好…

阅读更多...

前置微小信号放大器在光声技术的血管识别研究中的应用

前置微小信号放大器在光声技术的血管识别研究中的应用

实验名称：前置微小信号放大器在光声技术的血管识别研究中的应用研究方向：生物识别技术测试目的： 利用MATLAB对光声血管进行识别：1、对光声血管图库的图像进行预处理包括归一化、二值化、平滑、细化和毛刺修剪得到细化图像&#…

阅读更多...

0109 蓝桥杯真题12

0109 蓝桥杯真题12

/* * 观察下面的现象,某个数字的立方，按位累加仍然等于自身。 * 1^3 1 * 8^3 512 5128 * 17^3 4913 491317 ... *请你计算包括1,8,17在内，符合这个性质的正整数一共有多少个？ *填写该数字，不要填写任何多余的内…

阅读更多...

【DevPress】V2.4.3版本发布，增加内容收录管理

【DevPress】V2.4.3版本发布，增加内容收录管理

DevPress V2.4.3版本于2022年11月10日发版，增加内容收录模块，方便用户内容收录。一、该版本功能包含 1、新需求 1）控制台增加内容收录管理模块，包括收录内容额度管理、自动收录功能、基于内容搜索做收录以及收录内容列表。 - …

阅读更多...

凯利公式 - Kelly formula

凯利公式 - Kelly formula

欢迎关注沉睡者IT，点上面关注我 ↑ ↑ 凯利公式的概述凯利公式是一条可应用在投资资金和赌注的公式。应用于多次的随机赌博游戏，资金的期望增长率最高，且永远不会导致完全损失所有资金的后果。它假设赌博可无限次进行，而且没有下…

阅读更多...

Netty进阶——粘包与半包（滑动窗口)

Netty进阶——粘包与半包（滑动窗口)

TCP 以一个段（segment）为单位，每发送一个段就需要进行一次确认应答（ack）处理，但如果这么做，缺点是包的往返时间越长性能就越差。为了解决此问题，引入了窗口概念，窗口大小…

阅读更多...

微慕积分商城插件

微慕积分商城插件

微信小程序专业版在第一个正式版发布的时候，就推出了积分系统。用户登录小程序、签到、发表文章、评论文章、发表话题、回复话题、点赞、赞赏、付费阅读后都可以获得相应的积分。但这个积分攒了足够多后，有什么用呢？可以用于积分阅读文章&…

阅读更多...

论文代码测试

论文代码测试

一、代码所属论文 1. Document Image Enhancement with GANs - TPAMI journal 代码中的介绍提供了处理四种情况的模型，这四种模型功能分别为 ： 1）二值化图片文字; 2）清晰化图片中模糊文字; 3）去除图片水印; 4&…

阅读更多...

FPGA----ZCU106基于axi-hp通道的pl与ps数据交互（全网唯一最详）

FPGA----ZCU106基于axi-hp通道的pl与ps数据交互（全网唯一最详）

1、大家好，今天给大家带来的内容是，基于AXI4协议的采用AXI-HP通道完成PL侧数据发送至PS侧（PS侧数据发送至PL侧并没有实现，但是保留了PL读取PS测数据的接口） 2、如果大家用到SoC这种高级功能，那大家应该对于…

阅读更多...

系列ML.Net 学习篇【一】——初识机器学习

系列ML.Net 学习篇【一】——初识机器学习

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家，但毕竟需要了解和知道其运转原理，因此自我进行了学习进化，决定在机器学习上有所进展，结合.NET技术的ML.NET,把机器学习的技能提升一个Level，如果你也有兴趣…

阅读更多...

vue学习31~39（列表过滤+列表排序+vue检测data中的数据+收集表单数据+过滤器）

vue学习31~39（列表过滤+列表排序+vue检测data中的数据+收集表单数据+过滤器）

1.14 列表过滤 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevice-wid…

阅读更多...

VM虚拟机三种网络配置详解(桥接、NAT、仅主机)

VM虚拟机三种网络配置详解(桥接、NAT、仅主机)

在学习网络配置之前，需要搞明白有关于网络的一些基本概念，什么是ip，子网掩码，网段，网关？这里只做最简单的解释，实际上远远不止这些。网络名词 ip 在现实生活中，这么大的一个中国…

阅读更多...

bootstrap标签和导航条件组件学习（七）

bootstrap标签和导航条件组件学习（七）

标签和导航条件组件这里的标签是不能切换的，它是静态的，在JavaScrapt插件里面是是可以切换页面的需要配合插件加选中状态： 它是自适应屏幕宽度： 胶囊式标签下拉菜单： 复制代码放到页面中： div 的class…

阅读更多...

KubeEdge设备接入的mqtt调试

KubeEdge设备接入的mqtt调试

kubeedge的设备接入是用mqtt进行转接的。但是如果遇到一些问题需要排查问题时，希望可以查看终端发的mqtt消息。目前 mosquitto 没有看到有进行消息查看的机制（也可能我不知道） EMQ可以进行消息查看。 1.安装EMQ 快速开始 | EMQX 5.0 文…

阅读更多...

数据存储——声音存储

数据存储——声音存储

声音数字化一、声音的采样（一）信号分类1.模拟信号2. 数字信号（二）存储1、采样2.量化3.编码1.数字音频的技术指标2.未经压缩的数字音频的数据量（字节（8bit））总结声音的数字化过程一、…

阅读更多...

[附源码]SSM计算机毕业设计校园一卡通管理信息系统台JAVA

[附源码]SSM计算机毕业设计校园一卡通管理信息系统台JAVA

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： SSM mybatis Maven Vue 等等组成，B/S模式 M…

阅读更多...

zabbix监控Nginx

zabbix监控Nginx

目录一、环境准备二、部署Nginx被监控端三、自定义Nginx监控key 四、给目标主机创建监控项一、环境准备搭建zabbix基础环境 zabbix基础环境部署参照：zabbix基础环境部署_桂安俊kylinOS的博客-CSDN博客以下实验部署均基于上述环境二、部署Nginx被监控端…

阅读更多...

芯片级解密YMTC NAND Xtacking 3.0技术

芯片级解密YMTC NAND Xtacking 3.0技术

长江存储YMTC自从2016年成立以来，一直在吸引外界的关注。作为NAND国产厂商，被寄予厚望。在2018年FMS闪存峰会发布了Xtacking 1.0的NAND架构，凭借该技术荣获了“最具创新初创闪存企业”。在2019年又发布了Xtacking 2.0的NAND架构。根据官网介…

阅读更多...

推荐文章

最新文章