数据集相关类代码回顾理解 | StratifiedShuffleSplit\transforms.ToTensor\Counter

news2024/9/19 10:51:10

【PyTorch】图像多分类项目

目录

StratifiedShuffleSplit

transforms.ToTensor

Counter


StratifiedShuffleSplit

sss = StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=0)

创建StratifiedShuffleSplit对象,用于将数据集划分为训练集和测试集。

  • n_splits=1:划分次数为1,大于1则多次划分,每次划分生成一组新训练集和新测试集。
  • test_size=0.2:测试集比例为0.2,即测试集的大小占总样本的20%
  • random_state=0:随机种子为0,类似random的种子,保证每次抽样到的数据一样 

StratifiedShuffleSplit是scikit-learn库中的一个类,用于创建训练集和测试集的划分,同时保持每个类别中的样本比例一致。核心思想:分层抽样。

StratifiedShuffleSplit 类的工作原理:

先根据每个类别的样本数量将数据集划分为尽可能相等的子集(分层)

然后在这些子集中随机选择样本拆分创建训练集和测试集(随机拆分)

插入空格更好理解:Stratified Shuffle Split分层随机拆分类!

transforms.ToTensor

data_transformer = transforms.Compose([transforms.ToTensor()])

 transforms.ToTensor()的作用是将PIL图像或NumPy数组转换为PyTorch张量,并且将图像的像素值从[0, 255]范围缩放到[0.0, 1.0]范围,即在[0.0, 1.0]范围内对像素值进行归一化。转换后的张量形状为(C, H, W)

Compose是 torchvision.transforms 模块的一个类,创建一个Compose对象时,需要传入一个包含一个或多个变换操作的列表。Compose对象一般包含四个变换操作:调整图像大小、从中心裁剪图像、将图像转换为张量以及归一化。

 

Counter

counter_train=collections.Counter(y_train)

用于统计图像标签,即每类标签图像数量,Counter是用于计数的子类字典。例如PyTorch torchvision包中STL-10数据集的训练数据集:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1962809.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

农业物联网气象站的工作原理

TH-NQ10农业物联网气象站是一款集成了物联网与气象技术的创新设备,它在现代农业中扮演着重要角色,为农业生产提供了精准、实时的气象数据支持。以下是对农业物联网气象站的详细介绍: 定义与特点 农业物联网气象站通过物联网技术将气象观测设…

详解校门外的树(树状数组)

前言 在看之前建议先看一下 【学习笔记】详解树状数组-CSDN博客 题目 思路 建立两个树状数组,维护左括号与右括号。 假设有一个长度为10的数轴,我们要将区间[ 2 , 5 ]中种树,这时,我们将 2 处放一个左括号 ” ( ” ,5处放一个 ” )” &…

负载均衡的作用、负载均衡常用处理方式、四层和七层负载均衡的区别、及配置方法

一、负载均衡的作用 解决服务器的高并发压力,提高应用程序的处理性能; 提供故障转移,实现高可用; 通过添加或减少服务器数量,增强网站的可扩展性; 在负载均衡器上进行过滤,可以提高系统的安…

FreeModbus学习——定时器

FreeModbus版本:1.6 协议栈初始化时会初始化定时器: eMBInit → eMBRTUInit → xMBPortTimersInit( ( USHORT ) usTimerT35_50us ) 协议栈使能时会使能定时器: eMBEnable → pvMBFrameStartCur → eMBRTUStart → vMBPortTimersEnable 定时…

【Vulnhub系列】Vulnhub_Dr4g0n_b4ll 靶场渗透(原创)

【Vulnhub系列靶场】Vulnhub_Dr4g0n_b4ll靶场渗透 原文转载已经过授权 原文链接:Lusen的小窝 - 学无止尽,不进则退 (lusensec.github.io) 一、环境搭建 选择打开.ovf 文件 配置名称和路径 打开后调整网络连接模式为【NAT】即可 二、信息收集 1、主机…

MySQL安装教程(保姆级)

1. 首先要了解自己的计算机 打开设置——系统——系统信息 然后就可以知道自己计算机的类型了。 2. 下载MySQL 2.1. 来到MySQL官网 点击进入 我们下拉页面,可以找到DOWNLOADS 页面默认给咱们选择最新的版本,咱们不用,咱们尽量选一个稳定的版…

解决vscode+UE5中vscode无法识别头文件,无法函数无法跳转,也无法自动补全的问题。

一、概述 接上一条博客,虽然解决了报错的问题,但是实际上的问题却没有解决,无论我怎么点击,其都无法完成跳转,也无法完成自动补全的问题。 在网络上搜索了很多资料后,发现是在使用vscode时候UE5在vscode中的…

对零基础想转行网络安全同学的一点建议

最近有同学在后台留言,0基础怎么学网络安全?0基础可以转行做网络安全吗?以前也碰到过类似的问题,想了想,今天简单写一下。 我的回答是先了解,再入行。 具体怎么做呢? 首先,你要确…

深入源码:解析SpotBugs (5)BugReportor

常见的 Bug 定位后,通过 bugReport的reportBug(BugInstance) 方法,将bug 发布出来。 一般的 Detector 经检测后会调用 bugReportor.reportBug 方法或者 BugAccumulator.accumulateBug 。 在GUI中,分析结束后会在下框…

2024年投放必应bing国内广告,顶级技巧与策略!

随着企业对于高效、精准的广告投放需求日益增强,微软必应Bing广告平台以其独特的优势,正成为众多品牌投放广告的理想选择。云衔科技凭借其专业的必应Bing国内广告开户及代运营服务,助力企业精准触达目标受众,实现品牌影响力和市场…

ESP-ADF适配到自定义开发板中

ESP-ADF适配到自定义开发板中 前言:项目开发完了,来记录一下开发过程。 安装: 这里采用vscode+ESP-IDF+ESP-ADF的开发方式。 安装esp-idf的方法很简单,网上都是,这里不说了。想用esp-adf那么你idf的环境肯定是已经搭建好了。 安装adf也很简单,一步完成。 按下F1,选…

软考网工:2024年下半年各地区报名时间(附赠真题)

根据软考办《关于2024年度计算机技术与软件专业技术资格(水平)考试工作安排及有关事项的通知》(计考办〔2024〕1号)可以得知,2024年下半年网络工程师将于8月19日至9月15日开放考务管理服务平台,各地组织报名。 各地2024年下半年网络工程师报名时间不同&…

科普文:万字梳理高性能 Kafka快的8个原因

概叙 科普文:万字详解Kafka基本原理和应用-CSDN博客 科普文:万字梳理31个Kafka问题-CSDN博客 我们都知道 Kafka 是基于磁盘进行存储的,但 Kafka 官方又称其具有高性能、高吞吐、低延时的特点,其吞吐量动辄几十上百万。 在座的…

绝密!OceanBase OBCP备考模拟题讲解(1)

博主首页 : 「源de爸讲数据库」每天优先更新OceanBase OBCP题库及全网独家超详细题目解析! 现如今,一大批国产数据库随着国产化浪潮,已经逐步被越来越多的人认可。OceanBase便是其中一个优秀代表。 做这个日更专题,…

麒麟V10系统统一认证子系统国际化

在适配麒麟V10系统统一认证子系统国际化过程中, 遇到了很多的问题,关键是麒麟官方的文档对这部分也是粗略带过,遇到的问题有: (1)xgettext无法提取C源文件中目标待翻译的字符串。 (2)使用msgf…

【Python正则-驯化】一文学会通过Python中的正则表达式提取文本中的网址

【Python正则-驯化】一文学会通过Python中的正则表达式提取文本中的网址 本次修炼方法请往下查看 🌈 欢迎莅临我的个人主页 👈这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合,智慧小天地! 🎇 免费获取相关内容…

Redis 与 Scrapy:无缝集成的分布式爬虫技术

1. 分布式爬虫的概念 分布式爬虫系统通过将任务分配给多个爬虫节点,利用集群的计算能力来提高数据抓取的效率。这种方式不仅可以提高爬取速度,还可以在单个节点发生故障时,通过其他节点继续完成任务,从而提高系统的稳定性和可靠性…

Gooxi荣获2024年深圳市计算机行业协会最具成长奖

近日,由深圳市计算机行业协会举办的2024年度深圳市计算机行业协会年中工作会议圆满落幕。本次会议邀请了多位行业专家以及深圳地区的理事会成员、企业家参会。会议的重点是总结上半年的经验,分析行业热点与痛点,探讨以新质生产力促进高质量发…

网络安全等级保护:上下文中的API安全性

网络安全等级保护:什么是API安全? 上下文中的API安全性 应用程序编程接口安全性位于多个安全学科的交叉点,如图所示。其中最重要的是以下三个领域: 1.信息安全(InfoSec)涉及在信息的整个生命周期中保护信…

Kettle下载安装

环境说明 虚拟机:Win7;MySql8.0 主机:Win11;JDK1.8;Kettle 9.4(Pentaho Data Integration 9.4)(下载方式见文末) 安装说明 【1】解压后运行Spoon.bat 【2】将jar包 复…