卷积神经网络（五）---图像增强的方法

卷积神经网络（五）---图像增强的方法

news2025/4/25 17:26:08

前面的部分专注于卷积神经网络的层结构介绍，同时还介绍了到目前为止比较出名的卷积神经网络，接着使用比较复杂的卷积神经网络提高了 MNIST 数据集的准确率。下面将从另外的角度——图像增强的方面入手，提高模型的准确率和泛化能力。

一直以来，图像识别这一计算机视觉的核心问题都面临很多挑战，同一个物体在不同情况下都会得出不同的结论。

对于一张照片，我们看到的是一些物体，而对于计算机而言，它看到的是一些像素点，如图 4.23所示。

如果拍摄照片的照相机位置发生了改变，那么拍得的图片对于我们而言，变化很小，但是对于计算机而言，图片的像素变化是很大的。拍照时的光照条件也是很重要的一个影响因素：光照太弱，照片里的物体会和背景融为一体，它们的像素点就会很接近，计算机就无法正确识别出物体，如图4.24所示。

除此之外，物体本身的变形也会对计算机识别造成障碍，比如一只猫是趴着的，计算机能够识别它，但如果猫换了一个姿势，变成躺着的状态，那么计算机就无法识别了，如图 4.25所示。

最后，物体本身会隐藏在一些遮蔽物中，这样物体只呈现局部的信息，计算机也难以识别，如图4.26所示。

针对这些问题，我们希望能够对原始图片进行增强，在一定程度上解决部分问题在 PyTorch 中已经内置了一些图像增强的方法，不需要再繁琐地去实现，只需要简单的调用。

torchvision.transforms 包括所有图像增强的方法。

第一个函数是 Scale，对图片的尺度进行缩小和放大；
第二个函数是 CenterCrop，对图像正中心进行给定大小的裁剪；
第三个函数是 RandomCrop，对图片进行给定大小的随记裁剪；
第四个函数是 RandomHorizaontalFlip，对图片进行概率为 0.5 的随机水平翻转；
第五个函数是 RandomSizedCrop，首先对图片进行随机尺寸的裁剪，然后对裁剪的图片进行一个随机比例的缩放，最后将图片变成给定的大小，这在 InceptionNet 中比较流行；
最后一个是 Pad，对图片进行边界零填充。

上面介绍了 PyTorch 内置的一些图像增强的方法，还有更多的增强方法，可以使用 OpenCV或者 PIL 等第三方图形库实现。在网络的训练中图像增强是一种常见、默认的做法，对多任务进行图像增强之后都能够在一定程度上提升任务的准确率。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1960446.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

C# 弃元的详解与示例

C# 弃元的详解与示例

文章目录 1. 什么是弃元？2. 弃元的语法3. 弃元的应用场景4. 示例代码5. 总结在C# 7.0及更高版本中，弃元（Discard）是一个新的语言特性，允许开发者在特定情况下忽略某些值。这在处理元组、解构操作或其他只需要部分值的…

阅读更多...

【区块链+绿色低碳】泸州：“绿芽积分”号召全民绿色减碳 | FISCO BCOS应用案例

【区块链+绿色低碳】泸州：“绿芽积分”号召全民绿色减碳 | FISCO BCOS应用案例

2021 年 6 月 5 日， 首个基于“绿普惠云”所构建的政府级碳普惠平台“泸州市‘绿芽积分’”在生态环境部 2021 年六五世界环境日国家主场活动中展示，并跻身进入生态环境部“提升公民生态文明意识行动计划”2021 十佳公众参与案例。 “绿普惠云”是为政…

阅读更多...

精通推荐算法11：基于异构图游走的Graph Embedding

精通推荐算法11：基于异构图游走的Graph Embedding

DeepWalk、Line和Node2vec对图结构数据进行随机游走，成功将其转化为一个序列问题，并利用Word2vec训练得到节点的Embedding向量。但它们都基于同构图，其节点均属于同一种类型。但现实世界的数据网络大多基于异构图，其节点类型以及节…

阅读更多...

【Linux】全志Tina配置log串口信息以及env信息的方法

【Linux】全志Tina配置log串口信息以及env信息的方法

一、文件位置 V:\f1c100s\Evenurs\f1c100s\tina\device\config\chips\c200s\configs\F1C200s\linux\env-3.10.cfg 二、文件内容三、介绍 console：串口信息 version：版本信息 appAB：ab区信息 cma：cma容量四、总结在此文…

阅读更多...

【HarmonyOS】鸿蒙中如何获取资源文件的指定类型 fd，string，Uint8Array，RawFileDescriptor

【HarmonyOS】鸿蒙中如何获取资源文件的指定类型 fd，string，Uint8Array，RawFileDescriptor

【HarmonyOS】鸿蒙中如何获取资源文件的指定类型 fd，string，Uint8Array，RawFileDescriptor 一、问题背景： 众所周知，在鸿蒙中的资源分为media和rawfile。两者的区别对标android工程一致，后者是其他类型文…

阅读更多...

高月供，高负债，有没有好的办法去解决？

高月供，高负债，有没有好的办法去解决？

朋友们，有没有过这样的经历，觉得手里那堆贷款账户和每个月高高的月供，就像两座大山压得你喘不过气？特别是想从网贷的高利贷坑跳到银行的低息怀抱，却屡遭拒绝，那种无力感和自我怀疑，简直让人崩溃…

阅读更多...

【城市数据集】世界城市数据库和访问门户工具WUDAPT

【城市数据集】世界城市数据库和访问门户工具WUDAPT

世界城市数据库和访问门户工具WUDAPT WUDAPTLCZ分类具体步骤参考在城市气候研究中，用于描述城市特征的数据集一般采用基于类别的传统方法，将城市地区分为数量有限的类型，从而导致精确度下降。越来越多的新数据集以亚米微尺分辨率描述城市的…

阅读更多...

嵌入式学习Day17---Linux软件变编程

嵌入式学习Day17---Linux软件变编程

目录编辑一、Linux 系统 1.1.Linux服务器 1.2.Linux嵌入式 1.3.Linux系统上的软件开发 1.操作系统 2.Linux内核 3.man手册 1.4.shell命令 1.基本命令 2.文件查看命令 3.文件查找命令 4.压缩解压文件 5.其他命令 6.通配符 7.管道 8.重定向 1.5.虚拟机上网 1.NAT模式 …

阅读更多...

JS学习（变量、数据类型、运算符以及流程控制语句）

JS学习（变量、数据类型、运算符以及流程控制语句）

目录一、变量二、数据类型三、运算符四、类型转换 （1）字符串类型转为数字 （2）其他类型转为boolean（这些全部都是自动转换） 五、流程控制一、变量 （1）var：声…

阅读更多...

2024西安铁一中集训DAY26 ---- 模拟赛（最短路 + 实数域二分 + 线段树 + 并查集（平面图欧拉定理））

2024西安铁一中集训DAY26 ---- 模拟赛（最短路 + 实数域二分 + 线段树 + 并查集（平面图欧拉定理））

文章目录前言时间安排与成绩题解A. 江桥的蓝紫灯（最短路）B. 江桥的破坏行动（实数域二分）C. 江桥的最小值（线段树）D. 江桥的山谷（并查集，平面图欧拉定理） 前言感觉是做…

阅读更多...

Android NDK 编译 libcurl支持https

最后在使用NDK中使用libcurl，由于不同的安卓设备，版本不一样；使用so时，会导致报错dlopen时找不到某函数或出错。最后直接使用libcurl.a后，目前在几款盒子上测试均能正常工作。 libcurl需要支持https得提前编译两个库…

阅读更多...

LLM评估 | 大模型评估方法调研--论文解读（持续更新ing!!!）

LLM评估 | 大模型评估方法调研--论文解读（持续更新ing!!!）

目录 LLM-based NLG Evaluation: Current Status and ChallengesAdaptEval: Evaluating Large Language Models on Domain Adaptation for Text SummarizationThe Potential and Challenges of Evaluating **Attitudes, Opinions, and Values** in Large Language ModelsEvalLM…

阅读更多...

揭秘高效语音转文字工具：让沟通更便捷

揭秘高效语音转文字工具：让沟通更便捷

嘿，各位办公室的小伙伴们，今儿咱们来聊聊那些能让咱们文员生活大变样的神器——特别是那些能把咱们嘴里嘟囔的话儿，瞬间变成电脑里整整齐齐文字的语音转文字工具。说起来，自从有了这些宝贝，我感觉自己都快能飞起来了&a…

阅读更多...

VUE 3.0 如何新建项目详细教程附环境搭建推荐

VUE 3.0 如何新建项目详细教程附环境搭建推荐

本人新入手一台电脑，需要安装各种环境配置，顺便把过程记录一下，方便自己以后查看，也欢迎大家参考交流。目录一、环境搭建： 1.Node.js安装 2.国内淘宝镜像设置 3.安装vue 环境二、新建vue项目 1.vue脚手架新建…

阅读更多...

昇思25天学习打卡营第21天|FCN图像语义分割案例：从数据集下载到模型推理

昇思25天学习打卡营第21天|FCN图像语义分割案例：从数据集下载到模型推理

目录 MindSpore 版本管理与数据集下载准备图像分割数据集的定义、处理与获取训练集数据的图像展示基于 MindSpore 的 FCN8s 图像分割模型定义图像分割模型的预训练模型加载与评估指标定义基于 CPU 的 FCN8s 模型训练配置与准备 FCN8s 模型的权重加载与评估数据集的评…

阅读更多...

大模型系列5--卷积神经网络

大模型系列5--卷积神经网络

卷积神经网络 1. 背景2. 架构2.1. 卷积2.1.1. 单卷积层（多Channel输出）2.2.2. 多层卷积（卷积堆叠）2.2.3. 卷积关键参数2.2.4. 卷积常用计算公式 2.2. 池化层（pooling） 3. 经典网络结构3.1. VGG-163.2. ResN…

阅读更多...

燃气安全无小事，一双专业劳保鞋让你步步安心！

燃气安全无小事，一双专业劳保鞋让你步步安心！

燃气作为我们日常生活中不可或缺的能源之一，为我们的生活提供了极大便利，其安全性往往被忽视在忙碌的日常生活背后。然而，燃气事故一旦发生，后果往往不堪设想，轻则财产损失，重则危及生命。因此，…

阅读更多...

【Linux】全志Tina配置AB区分区升级包

【Linux】全志Tina配置AB区分区升级包

一、文件位置 V:\f1c100s\Evenurs\f1c100s\tina\target\allwinner\generic\configs\sw-subimgs-ab.cfg 二、文件内容三、介绍在第七行，可以设置产生的升级包是a区或是b区，使用ab区的名称来区分，ab区名称查询方法详见文章： …

阅读更多...

angular入门基础教程(八）表单之双向绑定

angular入门基础教程(八）表单之双向绑定

绑定表单数据为了让表单使用 Angular 的特性实现数据绑定，需要导入 FormsModule。这个比 vue 要繁琐点，不复杂，但是比 react 的自己手动实现要方便，ng 帮我们实现了双向绑定 import { Component } from "angular/core&qu…

阅读更多...

金蝶云星空历史库存信息批量计算生成

金蝶云星空历史库存信息批量计算生成

文章目录金蝶云星空历史库存信息批量计算生成业务背景需求背景参考开发步骤创建单据《历史库存信息》界面表结构需要生成日期库存信息的日期范围存储为表创建日期表使用递归插入数据创建存储过程1，根据日期生成计算当日库存，生成《历史库存信息》创建存储过程2，根据日期范围…

阅读更多...

推荐文章

最新文章