城市管理违规行为智能识别 Task3学习心得

news2024/9/22 19:33:30

本次学习主要针对数据集增强和模型预测

1、数据增强:

1)将四张训练图像组合成一张,增加物体尺度和位置的多样性。

2)复制一个图像的随机区域并粘贴到另一个图像上,生成新的训练样本

3)图像的随机旋转、缩放、平移和剪切,增加对几何变换的鲁棒性

4)通过线性组合两张图像及其标签创造合成图像,增加特征空间的泛化

5)一个支持多种增强技术的图像增强库,提供灵活的增强管道定义

6)对图像的色相、饱和度和亮度进行随机变化,改变颜色属性

7)沿水平轴随机翻转图像,增加对镜像变化的不变性。

比起我之前做的分类分割任务,yolo这边的数据增强用了更多的方法,我一般只用3、5、7,yolo还多了很多图片组合来增强数据

2、设置训练参数:

imgsz: 训练时的目标图像尺寸,所有图像在此尺寸下缩放。(这个我用高分辨率试了,效果相对好一点)

save_period: 保存模型检查点的频率(周期数),-1 表示禁用。

device: 用于训练的计算设备,可以是单个或多个 GPU,CPU 或苹果硅的 MPS。(不用管) optimizer: 训练中使用的优化器,如 SGD、Adam 等,或 'auto' 以根据模型配置自动选择。(这个我直接用Adam,感觉是最通用的)

momentum: SGD 的动量因子或 Adam 优化器的 beta1。

weight_decay: L2 正则化项。

warmup_epochs: 学习率预热的周期数。

warmup_momentum: 预热阶段的初始动量。

warmup_bias_lr: 预热阶段偏置参数的学习率。

box: 边界框损失在损失函数中的权重。

cls: 分类损失在总损失函数中的权重。

dfl: 分布焦点损失的权重。

后面基本上都没有管,怕越调越差

3、YOLO 模型预测行为和性能

参数名类型默认值描述
conffloat0.25置信度阈值,用于设置检测对象的最小置信度。低于此阈值的检测对象将被忽略。调整此值有助于减少误报。
ioufloat0.7非最大值抑制(NMS)的交并比(IoU)阈值。较低的值通过消除重叠的边界框来减少检测数量,有助于减少重复项。
imgszint 或 tuple640推理时定义图像的大小。可以是单个整数(如640),用于将图像大小调整为正方形,或(height, width)元组。合适的尺寸可以提高检测精度和处理速度。
augmentboolFALSE启用预测时的数据增强(TTA),可能通过牺牲推理速度来提高检测的鲁棒性。

除了imgs之外我都没管,设置为1024


本次实验完成后效果不太好,上一次的Task2可以跑到0.08,而这两次同样使用yolov8x只跑出来0.006,调整的参数主要在数据增强

又调了几次,都卡在一样的值了,不知道哪里出了问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2096096.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

day25 Java基础——面向对象两万字详解!(纯干货)

day25 Java基础——面向对象两万字详解!(纯干货) 文章目录 day25 Java基础——面向对象两万字详解!(纯干货)1. 类与对象的关系类(Class)对象(Object)类与对象…

gitee绑定公钥后依旧无法使用_gitee push添加公钥无效

解决: 步骤按照官网操作即可:gitee官方说明 看看远程地址是否使用的http模式,是的话换ssh模式

Adobe Acrobat Reader的高级功能详解

​ 大家好,我是程序员小羊! 前言: Adobe Acrobat Reader是广泛使用的PDF查看器,其不仅可以用于查看和打印PDF文件,还具有一些高级功能,可以提升用户的PDF文档处理效率。以下是对Adobe Acrobat Reader的一些…

RH850系列芯片深度剖析 1.7-启动流程解析

RH850系列芯片深度剖析 1.7-启动流程解析 文章目录 RH850系列芯片深度剖析 1.7-启动流程解析一、简介二、启动相关文件说明三、启动相关的段四、启动流程4.1 启动文件启动4.1.1 寄存器初始化4.1.2 时钟初始化4.1.3 模块Standby寄存器初始化4.1.4 启动从核4.1.5 硬件初始化4.1.5…

vector模拟实现迭代器失效

目录 1.vector和vector> 1.1两者的区别 1.2遍历的方法 2.vector模拟实现的准备 3.reserve出现的问题及解决方案 4.遍历vector的三种方式 5.关于typename的使用 6.insert导致的迭代其实失效问题 6.1因为扩容导致的迭代器失效 6.2因为插入数据倒置的迭代器失效 1.vec…

【精彩回顾·成都】成都 UG 生成式 AI 工作坊:AI 革命下的商业模式创新!

文章目录 前言一、活动介绍二、精彩分享内容及活动议程2.1、亚马逊云科技社区情况和活动介绍2.2、《浅谈 AIGC 商业化》2.3、《AI 浪潮下的产品落地》2.4、现场互动情况2.5、休息茶歇时间2.6、《AI 赋能商业革新:智能化转型的策略与实践》2.7、《动手实践&#xff1…

GAMES104:10+11游戏引擎中物理系统的基础理论算法和高级应用-学习笔记

文章目录 概览一,物理对象与形状1.1 对象 Actor1.2 对象形状Actor Shape 二,力与运动2.1 牛顿定律2.2 欧拉法2.2.1 显式欧拉法Explicit (Forward) Euler’s Method2.2.2 隐式欧拉法 Implicit (Backward) Euler’s Method2.2.3 半隐式欧拉法 Semi-implici…

【iOS】通过第三方库Masonry实现自动布局

目录 前言 约束 添加约束的规则 使用Masonry自动布局 Masonry的常见使用方法 补充 前言 在暑期完成项目时,经常要花很多时间在调试各种控件的位置上,因为每一个控件的位置都需要手动去计算,在遇到循环布局的控件时,还需要设…

使用文件系统管理硬件设备

1、描述一个文件系统 介绍如何使用文件系统来管理计算机系统中所有的硬件设计和磁盘 之前直接在sys_open/sys_read/sys_read中对具体的tty设备的打开、读写进行操作,并且只是非常粗浅地介绍了文件系统的一些概念。接下来将正式引入文件系统 由于文件系统需要考虑不…

从FasterTransformer源码解读开始了解大模型(2.4)代码通读05

从FasterTransformer源码解读开始了解大模型(2.4)代码解读05-ContextDecoder的前向01 写在前面的话 ContextDecoder部分是用于处理输入部分的组件层,在这一层中,会对所有输入的input ids进行处理,计算Attention&…

全国大学生数学建模比赛——关联规则

一、问题背景与关联规则适用性 在数学建模比赛中,常常会遇到需要分析大量数据以寻找变量之间潜在关系的问题。关联规则分析作为一种数据挖掘技术,特别适用于这种场景。例如,在一些实际问题中,可能需要从众多的因素中找出哪些因素之…

基于Python的量化交易回测框架Backtrader初识记录(一)

版权声明:本文为博主原创文章,如需转载请贴上原博文链接:基于Python的量化交易回测框架Backtrader初识记录(一)-CSDN博客 前言:近期以来,对股市数据获取及预处理算是告一段落,下一步…

Java-多线程机制

上篇我提到一些多线程的基本使用方法,但并没有说到底层原理,你或许会有一些疑问,为什么不直接调用Run方法而是要用start方法启动线程?多线程到底是怎样执行的?接下来我会详细带你了解多线程的机制原理。 多线程的底层…

Leetcode114将二叉树转换为链表(java实现)

来看下本题的题目描述: 本题想让我们将二叉树转换为单链表,可以发现,左边的二叉树转换为右边的链表是使用的中序遍历,根 左 右 所以本道题的思路就是可以先用一个集合以中序遍历收集元素,然后再构建单链表。 class S…

[pytorch] --- pytorch基础之tensorboard使用

0 tensorboard介绍 TensorBoard是一个用于可视化机器学习实验结果的工具,可以帮助我们更好地理解和调试训练过程中的模型。 在PyTorch中,我们可以使用TensorBoardX库来与TensorBoard进行交互。TensorBoardX 是一个PyTorch的扩展,它允许我们…

Android Codec2 CCodec (七)IConfigurable

上一篇文章我们了解了接口参数的定义,这一节我们简单梳理一下参数获取、配置以及参数反射过程。 1、IConfigurable 通过之前的介绍我们了解到,Codec2模块的功能实现与配置实现是相互分离的,Codec2框架设计了一组API用于获取与模块关联的配置…

2.4 定时器与TIM中断

文章目录 时钟与时钟树stm32时钟树可以手动把系统时钟72mhz改成其他的吗?ST公司给的外围设备配置文件 的 默认配置说明 定时器什么是定时器定时器的类型 时钟与时钟树 频率:如72Mhz即为每秒72M个脉冲 时钟的源头 晶振 时钟树的分支 分频器:…

超越在线翻译百度!揭秘3款工具,工作学习快人一步

在如今这个信息爆炸的时代,我们经常需要用到不同的语言。无论是看外国文章、写邮件给国外朋友,还是和外国客户聊天,语言不通都是个大问题。不过,科技的进步带来了很多在线翻译工具,百度翻译就是其中很受欢迎的一个。但…

U盘文件目录损坏难读?数据重生方案

在数字化时代的洪流中,U盘作为便携的存储介质,承载着无数人的重要数据与回忆。然而,当U盘不幸遭遇文件或目录损坏,导致数据无法读取时,这份便携与便捷瞬间化为乌有,留下的只有无尽的焦虑与困扰。本文将深入…

爆改YOLOv8|利用可改变核卷积AKConv改进yolov8-轻量涨点

1,本文介绍 AKConv(可改变核卷积)是一种改进的卷积操作方法,其核心在于动态调整卷积核的形状和大小。与传统卷积层固定核大小不同,AKConv 通过引入可学习的机制,使卷积核在训练过程中能够自适应地调整&…