PyTorch(四)Torchvision 与 Transforms

news2025/1/23 13:10:14

文章目录

    • Log
  • 一、Torchvision
    • 1. CIFAR10
      • ① 介绍
      • ② 使用
    • 2. 与 Transforms 结合使用
  • 总结


Log

2022.11.28接着开启新的一章
2022.11.29继续学习


一、Torchvision

  • 视频教程中 Torchvision v0.9.0文档
  • Torchvision 官方文档
  • Torchvision Datasets API 文档

1. CIFAR10

① 介绍

  • CIFAR10数据集介绍
  • 该数据集包括 60,000 张 32×32 像素的彩色图片,共有 10 个类别,每个类别有 6,000 张图像
  • 50,000 张是训练图片,10,000 张是测试图片
  • 图片示例如下:
    在这里插入图片描述

② 使用

  • 加载训练集和测试集:
import torchvision

train_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=True, download=True)
test_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=False, download=True)
  • 其中的参数:
    • root:数据集的路径
    • train:如果为 True 则创建数据集,如果为 False 则创建测试集
    • download:为 True 则从网络上下载数据集到 root 路径下,如果该路径下已有数据集则不进行下载。
  • 输出测试集中的第一个:
print(test_set[0])
  • 得到:(<PIL.Image.Image image mode=RGB size=32x32 at 0x1F775353A30>, 3)。其中 3 代表的是该测试样例对应的映射到整数上的类别
  • 查看对应的类别:
print(test_set.classes)
['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
  • 将测试样例的图片和标签分开输出:
img, target = test_set[0]
print(img)		#<PIL.Image.Image image mode=RGB size=32x32 at 0x21F1E533A60>
print(target)	#3
  • 先查看图片:
img.show()
  • 由于该数据集的图片是 32×32 像素的,所以不是很清晰:
    在这里插入图片描述

  • 再查看对应的类别的名称:

print(test_set.classes[target])	# cat

2. 与 Transforms 结合使用

  • 在创建数据集的时候新增一个参数,用到上一章学到的内容将原始的 PIL 类型的图片转换成 ToTensor 类型的图片:
dataset_transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
train_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=True, transform=dataset_transform, download=True)
test_set = torchvision.datasets.CIFAR10(root="../dataset/CIFAR10", train=False, transform=dataset_transform, download=True)
  • 之后就可以将 ToTensor 类型的图片显示到 tensorboard 中了:
writer = SummaryWriter("log-CIFAR10")
for i in range(10):
    img, target = test_set[i]
    writer.add_image("test_set-CIFAR10", img, i)
writer.close()

在这里插入图片描述


总结

  • 本文以 C I F R 10 \rm CIFR10 CIFR10 为例介绍了 T o r c h v i s i o n \rm Torchvision Torchvision 中数据集的使用方法,以及如何结合 T r a n s f o r m s \rm Transforms Transforms 使用数据集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/47060.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HBuilder X实现banner轮播图

第一步还是去仔细阅读官方文档&#xff0c;找到组件下面的内置组件里面的swiper&#xff0c;如图所示 官方是提供了一个用来制作轮播图的滑块视图容器&#xff1a;swiper 一般来说&#xff0c;轮播图的图片地址是由后端返回给前端遍历显示在页面上的&#xff0c;所以基本的结构…

世界杯的“中国元素”昂扬大国担当,点面科技全新推出的多模态多功能移动终端踏上卡塔尔征途!

本次世界杯中国足球队没有参加&#xff0c;但是在世界杯的赛场上到处都有中国元素。 中国承建的卢赛尔体育场 卡塔尔世界杯主体育场——卢赛尔球场由中国铁建以总承包身份承建&#xff0c;引发了全球瞩目。在本届世界杯赛事中&#xff0c;该场馆将承担包括决赛在内的10场比赛&…

idea手动创建webapp(在main文件夹下)

SSM自学笔记 文章目录一、Maven使用正常情况首先不使用骨架创建好Maven项目然后选择Project Structure...选择要创建webapp的模块修改路径二、Maven不正常工作时一、Maven使用正常情况 首先不使用骨架创建好Maven项目 然后选择Project Structure… 选择要创建webapp的模块 选好…

前置微小信号放大器在光声技术的血管识别研究中的应用

实验名称&#xff1a;前置微小信号放大器在光声技术的血管识别研究中的应用 研究方向&#xff1a;生物识别技术 测试目的&#xff1a; 利用MATLAB对光声血管进行识别&#xff1a;1、对光声血管图库的图像进行预处理包括归一化、二值化、平滑、细化和毛刺修剪得到细化图像&#…

0109 蓝桥杯真题12

/* * 观察下面的现象,某个数字的立方&#xff0c;按位累加仍然等于自身。 * 1^3 1 * 8^3 512 5128 * 17^3 4913 491317 ... *请你计算包括1,8,17在内&#xff0c;符合这个性质的正整数一共有多少个&#xff1f; *填写该数字&#xff0c;不要填写任何多余的内…

【DevPress】V2.4.3版本发布,增加内容收录管理

DevPress V2.4.3版本于2022年11月10日发版&#xff0c;增加内容收录模块&#xff0c;方便用户内容收录。 一、该版本功能包含 1、新需求 1&#xff09;控制台增加内容收录管理模块&#xff0c;包括收录内容额度管理、自动收录功能、基于内容搜索做收录以及收录内容列表。 - …

凯利公式 - Kelly formula

欢迎关注沉睡者IT&#xff0c;点上面关注我 ↑ ↑ 凯利公式的概述 凯利公式是一条可应用在投资资金和赌注的公式。应用于多次的随机赌博游戏&#xff0c;资金的期望增长率最高&#xff0c;且永远不会导致完全损失所有资金的后果。它假设赌博可无限次进行&#xff0c;而且没有下…

Netty进阶——粘包与半包(滑动窗口)

TCP 以一个段&#xff08;segment&#xff09;为单位&#xff0c;每发送一个段就需要进行一次确认应答&#xff08;ack&#xff09;处理&#xff0c;但如果这么做&#xff0c;缺点是包的往返时间越长性能就越差。 为了解决此问题&#xff0c;引入了窗口概念&#xff0c;窗口大小…

微慕积分商城插件

微信小程序专业版在第一个正式版发布的时候&#xff0c;就推出了积分系统。用户登录小程序、签到、发表文章、评论文章、发表话题、回复话题、点赞、赞赏、付费阅读后都可以获得相应的积分。但这个积分攒了足够多后&#xff0c;有什么用呢&#xff1f;可以用于积分阅读文章&…

论文代码测试

一、代码所属论文 1. Document Image Enhancement with GANs - TPAMI journal 代码中的介绍提供了处理四种情况的模型&#xff0c;这四种模型功能分别为 &#xff1a; 1&#xff09;二值化图片文字; 2&#xff09;清晰化图片中模糊文字; 3&#xff09;去除图片水印; 4&…

FPGA----ZCU106基于axi-hp通道的pl与ps数据交互(全网唯一最详)

1、大家好&#xff0c;今天给大家带来的内容是&#xff0c;基于AXI4协议的采用AXI-HP通道完成PL侧数据发送至PS侧&#xff08;PS侧数据发送至PL侧并没有实现&#xff0c;但是保留了PL读取PS测数据的接口&#xff09; 2、如果大家用到SoC这种高级功能&#xff0c;那大家应该对于…

系列ML.Net 学习篇【一】——初识机器学习

由于公司项目涉及到机器学习和图像识别,虽然我并不是算法专家&#xff0c;但毕竟需要了解和知道其运转原理&#xff0c;因此自我进行了学习进化&#xff0c;决定在机器学习上有所进展&#xff0c;结合.NET技术的ML.NET,把机器学习的技能提升一个Level&#xff0c;如果你也有兴趣…

vue学习31~39(列表过滤+列表排序+vue检测data中的数据+收集表单数据+过滤器)

1.14 列表过滤 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevice-wid…

VM虚拟机三种网络配置详解(桥接、NAT、仅主机)

在学习网络配置之前&#xff0c;需要搞明白有关于网络的一些基本概念&#xff0c;什么是ip&#xff0c;子网掩码&#xff0c;网段&#xff0c;网关&#xff1f;这里只做最简单的解释&#xff0c;实际上远远不止这些。 网络名词 ip 在现实生活中&#xff0c;这么大的一个中国…

bootstrap标签和导航条件组件学习(七)

标签和导航条件组件 这里的标签是不能切换的&#xff0c;它是静态的&#xff0c;在JavaScrapt插件里面是是可以切换页面的 需要配合插件 加选中状态&#xff1a; 它是自适应屏幕宽度&#xff1a; 胶囊式标签下拉菜单&#xff1a; 复制代码放到页面中&#xff1a; div 的class…

KubeEdge设备接入的mqtt调试

kubeedge的设备接入是用mqtt进行转接的。但是如果遇到一些问题需要排查问题时&#xff0c;希望可以查看终端发的mqtt消息。 目前 mosquitto 没有看到有进行消息查看的机制&#xff08;也可能我不知道&#xff09; EMQ可以进行消息查看。 1.安装EMQ 快速开始 | EMQX 5.0 文…

数据存储——声音存储

声音数字化一、声音的采样&#xff08;一&#xff09;信号分类1.模拟信号2. 数字信号&#xff08;二&#xff09;存储1、采样2.量化3.编码1.数字音频的技术指标2.未经压缩的数字音频的数据量&#xff08;字节&#xff08;8bit&#xff09;&#xff09;总结 声音的数字化过程一、…

[附源码]SSM计算机毕业设计校园一卡通管理信息系统台JAVA

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

zabbix监控Nginx

目录 一、环境准备 二、部署Nginx被监控端 三、自定义Nginx监控key 四、给目标主机创建监控项 一、环境准备 搭建zabbix基础环境 zabbix基础环境部署参照&#xff1a;zabbix基础环境部署_桂安俊kylinOS的博客-CSDN博客 以下实验部署均基于上述环境 二、部署Nginx被监控端…

芯片级解密YMTC NAND Xtacking 3.0技术

长江存储YMTC自从2016年成立以来&#xff0c;一直在吸引外界的关注。作为NAND国产厂商&#xff0c;被寄予厚望。在2018年FMS闪存峰会发布了Xtacking 1.0的NAND架构&#xff0c;凭借该技术荣获了“最具创新初创闪存企业”。 在2019年又发布了Xtacking 2.0的NAND架构。根据官网介…