【计算机视觉】Image Data Augmentation算法介绍合集(二)

news2025/1/10 1:45:52

文章目录

    • 一、Random Grayscale
    • 二、GridMask
    • 三、Adversarial Color Enhancement
    • 四、Population Based Augmentation
    • 五、MaxUp
    • 六、SuperpixelGridCut, SuperpixelGridMean, SuperpixelGridMix
    • 七、InstaBoost
    • 八、Random Mix-up
    • 九、Sample Redistribution
    • 十、Batchboost
    • 十一、CutBlur
    • 十二、DiffAugment

一、Random Grayscale

随机灰度是一种图像数据增强,以概率将图像转换为灰度。

在这里插入图片描述

二、GridMask

GridMask 是一种数据增强方法,可随机删除输入图像的某些像素。 与其他方法不同,该算法去除的区域既不是连续区域,也不是 dropout 中的随机像素。 相反,该算法会删除具有不连续像素集的区域,如图所示。

我们将设置表示为

在这里插入图片描述

三、Adversarial Color Enhancement

对抗性颜色增强是一种通过梯度下降优化滤色器来生成不受限制的对抗性图像的方法。

在这里插入图片描述

四、Population Based Augmentation

基于群体的增强(PBA)是一种数据增强策略(PBA),它生成非平稳增强策略计划而不是固定增强策略。 在 PBA 中,我们将增强策略搜索问题视为超参数调度学习的一个特例。 它利用基于群体的训练 (PBT),这是一种超参数搜索算法,可联合优化网络参数及其超参数,以最大限度地提高性能。 PBT 的输出不是最优的超参数配置,而是经过训练的模型和超参数时间表。

在 PBA 中,我们只对学习的时间表感兴趣并丢弃子模型结果(类似于 AutoAugment)。 然后,可以使用这种学习到的增强计划来改进同一数据集上不同(即更大且训练成本更高)模型的训练。

PBT执行如下。 首先,随机初始化并并行训练固定的模型群体。 在一定的时间间隔,“利用和探索”过程应用于表现较差的群体成员,其中模型克隆表现更好的模型的权重(即,利用),然后扰乱克隆模型的超参数以进行搜索 超参数空间(即探索)。 由于模型的权重被克隆并且从未重新初始化,因此所需的总计算量是训练单个模型的计算量乘以群体大小。

在这里插入图片描述

五、MaxUp

MaxUp 是一种对抗性数据增强技术,用于提高机器学习模型的泛化性能。 这个想法是通过一些随机扰动或变换生成一组增强数据,并最小化增强数据的最大或最坏情况损失。 通过这样做,我们隐式地引入了针对随机扰动的平滑性或鲁棒性正则化,从而提高了生成性能。 例如,在高斯扰动的情况下,MaxUp 渐近等价于使用损失的梯度范数作为惩罚来鼓励平滑。

在这里插入图片描述

六、SuperpixelGridCut, SuperpixelGridMean, SuperpixelGridMix

Karim Hammoudi、Adnane Cabani、Bouthaina Slika、Halim Benhabiles、Fadi Dornaika 和 Mahmoud Melkemi。 SuperpixelGridCut、SuperpixelGridMean 和 SuperpixelGridMix 数据增强,arXiv:2204.08458,2022。https://doi.org/10.48550/arxiv.2204.08458

在这里插入图片描述

七、InstaBoost

InstaBoost 是一种利用现有实例掩码注释进行实例分割的数据增强技术。

在这里插入图片描述
在这里插入图片描述

八、Random Mix-up

R-Mix(随机混合)是混合系列数据增强方法。 它将随机混合与显着性引导混合相结合,产生快速且高性能的过程,同时保留显着性引导混合的良好特性,例如低预期校准误差和高弱监督对象定位精度。

在这里插入图片描述

九、Sample Redistribution

样本重新分配是一种用于人脸检测的数据增强技术,它根据基准数据集的统计数据通过大规模裁剪来增强训练样本。 在训练数据增强期间,从原始图像中裁剪出方形补丁,并具有随机大小原始图像的短边。 为了为步长 8 生成更多正样本,随机大小范围。 当裁剪框超出原始图像时,平均 RGB 值会填充缺失的像素。

其动机是为了在固定 VGA 分辨率(即 640×480)下进行有效的人脸检测,WIDER FACE 中的大多数人脸(78.93%)小于 32×32 像素,因此它们是通过浅层阶段进行预测的。 为了为这些浅层阶段获得更多的训练样本,使用了样本重新分配(SR)。

在这里插入图片描述

十、Batchboost

Batchboost 是 MixUp 的一种变体,它不是只混合两个图像,而是将许多图像混合在一起。

在这里插入图片描述

十一、CutBlur

CutBlur 是一种专门为低级视觉任务设计的数据增强方法。 它剪切低分辨率补丁并将其粘贴到相应的高分辨率图像区域,反之亦然。 Cutblur 的关键直觉是使模型不仅能够学习“如何”,而且能够学习“在哪里”超分辨率图像。 通过这样做,模型可以理解“多少”,而不是盲目地学习将超分辨率应用于每个给定的像素。

在这里插入图片描述

十二、DiffAugment

可微增强 (DiffAugment) 是一组可微图像变换,用于在 GAN 训练期间增强数据。 这些变换应用于真实图像和生成图像。 它使梯度能够通过增强传播回生成器,在不操纵目标分布的情况下正则化判别器,并保持训练动态的平衡。 作者在实验中首选三种变换选择:翻译、剪切和颜色。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1017546.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

人工智能前景如何?人工智能所对应到企业中是什么样的岗位呢?

目录 分布式计算在硕士阶段主要是在干什么呢,主要修的课程是些什么呢? 分布式计算所对应到企业中是什么样的岗位呢? 分布式计算前景如何? 人工智能在硕士阶段主要是在干什么呢,主要修的课程是些什么呢?…

vue国际化教程

需求背景 项目需求要做国际化,结果网上找了好几篇文章,没有一个可以一次性搞定,现在这里总结一下。首先,我们分为两部分处理,一个是前端页面的静态文字,这个由前端vue.json自行处理。第二部分就是后端的错…

基于springboot漫画管理系统springboot001

摘 要 随着信息技术和网络技术的飞速发展,人类已进入全新信息化时代,传统管理技术已无法高效,便捷地管理信息。为了迎合时代需求,优化管理效率,各种各样的管理系统应运而生,各行各业相继进入信息管理时代&…

vue+element-ui el-descriptions 详情渲染组件二次封装(Vue项目)

目录 1、需求 2.想要的效果就是由图一变成图二 ​编辑 3.组件集成了以下功能 4.参数配置 示例代码 参数说明 5,组件 6.页面使用 1、需求 一般后台管理系统,通常页面都有增删改查;而查不外乎就是渲染新增/修改的数据(由输入框变成输…

十四、流式编程(2)

本章概要 中间操作 跟踪和调试流元素排序移除元素应用函数到元素在 map() 中组合流 中间操作 中间操作用于从一个流中获取对象,并将对象作为另一个流从后端输出,以连接到其他操作。 跟踪和调试 peek() 操作的目的是帮助调试。它允许你无修改地查看…

CMU 15-445 Project #3 - Query Execution(Task #1、Task #2)

文章目录 一、题目链接二、准备工作三、SQL 语句执行流程四、BusTub 表结构五、Task #1 - Access Method Executors5.1 顺序扫描执行器5.2 插入执行器5.3 删除执行器5.4 索引扫描执行器 六、Task #2 - Aggregation & Join Executors6.1 聚合执行器6.2 循环连接执行器6.3 索…

设计模式Java实战

文章目录 一、前置1.1 目的1.2 面向对象1.3 接口和抽象类 二、七大设计原则2.1 单一职责2.2 接口隔离原则2.3 依赖倒转原则2.4 里氏替换原则2.5 开闭原则2.6 不要重复原则2.7 迪米特最少知道法则 三、23种设计模式3.1创建型:创建对象3.1.1 单例模式定义最佳实践场景…

【基础篇】ClickHouse 表引擎之集成Kafka

文章目录 0.前言1.集成示例官方教程示例1:示例2:配置Kerberos 支持 虚拟列 参考文档 0.前言 ClickHouse为了方便与Kafka集成,提供了一个名为Kafka引擎的专用表引擎。Kafka引擎允许你在ClickHouse中创建一个表,这个表的数据源来自…

react的状态管理简单钩子方法

1.recoil useProvider文件: import { atom, useRecoilState } from recoil;const initState atom({key: initState,default: {state: [],}, })// 将业务逻辑拆分到一个单独文件中,方便进行状态管理 export interface StateProps {id: number;text: string;isFini…

学习Node js:raw-body模块源码解析

raw-body是什么 raw-body的主要功能是处理HTTP请求体的原始数据。它提供了以下核心功能: 解析请求体:可以从HTTP请求中提取原始数据,包括文本和二进制数据。配置选项:通过配置项,可以设置请求体的大小限制、编码方式…

主题教育活动知识竞赛小程序界面分享

主题教育活动知识竞赛小程序界面分享

Git - Git 工作流程

文章目录 Git WorkFlow图解小结 Git WorkFlow Git Flow是一种基于Git的工作流程,确实利用了Git作为分布式版本控制系统的优势。 本地代码库 (Local Repository): 每个开发者都维护自己的本地代码库,这是Git分布式性质的体现。本地代码库包含了完整的项目…

清华发力了,EUV光刻机技术取得重大突破,外媒:没想到如此快

日前媒体纷纷传言清华研发成功EUV光刻机,这个其实夸大了事实,不过却也确实是EUV光刻机的重大突破,将绕开ASML等西方垄断的EUV光刻技术路线,开辟一条全新的道路。 据了解清华研发成功的并非是EUV光刻机,而是可用于EUV光…

输入M*N阶矩阵A和B,用函数编程计算并输出A与B之和

#include<stdio.h> #define M 2 #define N 3 void scanfjuzhen(int arr[M][N])//向二维数组输入数据 {int i 0;int j 0;for (i 0; i < M; i){for (j 0; j < N; j)scanf("%d", &arr[i][j]);} } void sumjuzhen(int a[M][N], int b[M][N],int c[M]…

性能测试 —— Jmeter 常用三种定时器

1、同步定时器 位置&#xff1a;HTTP请求->定时器->Synchronizing Timer 当需要进行大量用户的并发测试时&#xff0c;为了让用户能真正的同时执行&#xff0c;添加同步定时器&#xff0c;用户阻塞线程&#xff0c;知道线程数达到预先配置的数值&#xff0c;才开始执行…

Rust踩雷笔记(7)——一个链表题例子初识裸指针

题目在这https://leetcode.cn/problems/palindrome-linked-list/&#xff0c;leetcode 234的回文链表&#xff0c;思路很简单&#xff0c;就是fast和slow两个指针&#xff0c;fast一次移动两个、slow一次一个&#xff0c;最后slow指向的链表反转后和head比较就行了。 很简单一…

趣解设计模式之《新娘到底叫啥名啊?》

〇、小故事 前一段时间&#xff0c;在网上流传了这么一段视频&#xff0c;视频是一对新人的婚礼现场&#xff0c;主持人让新郎当着众多亲戚朋友的面&#xff0c;大声对新娘表达自己的爱意&#xff0c;小伙子自信满满大声的对众人说&#xff1a;“我爱你&#xff0c;周秀楠&…

ddns有什么作用?无公网IP怎么将内网IP端口映射外网访问

DDNS是什么&#xff1f; DDNS英文全称Dynamic Domain Name Server&#xff0c;中文含义是指动态域名服务。很多普通路由器或者智能路由器设置中&#xff0c;都可以找到DDNS&#xff08;动态DNS&#xff09;功能。 上面的解释可能过于专业&#xff0c;其实DDNS通俗点说&#xf…

Alpaca构建方式探秘:低成本构造指令数据增强LLM

原博客地址&#xff1a;Alpaca: A Strong, Replicable Instruction-Following Model github地址&#xff1a;https://github.com/tatsu-lab/stanford_alpaca Alpaca简介 Alpaca是斯坦福大学在Meta开源的大模型LLaMA 7B基础上使用自构建的52K指令数据重新训练得到的增强模型&am…

Android Studioc打印+查看日志

目录 Logcat 写入日志 查看应用日志 Logcat 写入日志 错误&#xff1a;Log.e(String, String)警告&#xff1a;Log.w(String, String)信息&#xff1a;Log.i(String, String)调试&#xff1a;Log.d(String, String)详细程度&#xff1a;Log.v(String, String) 查看应用日志 …