「解析」YOLOv4模型小结

news2025/2/23 3:33:42

Paper Yolo v4: https://arxiv.org/abs/2004.10934
Scaled-YOLOv4: Scaling Cross Stage Partial Network
Source code:https://github.com/AlexeyAB/darknet

在这里插入图片描述

Bag of Freebies(BoF)

只增加训练成本，但是能显著提高精度，并不影响推理速度；
数据增强，调整亮度、对比度、色调、随机缩放、剪切、翻转、旋转等；
网络正则化：Dropout、Dropblock等；
类别不平衡，损失函数设计；

Self-adversarial-training(SAT)

通过引入噪音点来增加网络难度；

Dropblock

dropout是随机选择点，dropblock是失效一些区域

Label Smothing

神经网络最大的缺点：过拟合，别让它太自信
eg：原来的标签为： $\times (1-0.1)+0.1/2 =[0.05, 0.095]$

GIoU

DIoU

DIoU-NMS

之前使用NMS来决定是否删除一个框，现在改用DIoU-NMS

公式 $s_i = \begin{cases} s_i & IoU-R_{DIoU}(M,B_i)<\epsilon \\ 0 &IoU-R_{DIoU}(M,B_i) \ge \epsilon \end{cases} \qquad R_{DIoU} = \frac{\rho^2(b,b^{gt})}{c^2}$

不仅考虑了IoU的值，还考虑了两个Box中心点之间的距离
其中M表示高置信度候选框，Bi 就是遍历各个框跟置信度高的重合情况

网络结构升级

Bag of Specials(BoS)

增加稍许推断代价，但可以提高模型精度的方法
网络细节部分加入了很多改进，引入了各种能让特征提取更好的方法
注意力机制，网格细节设计，特征金字塔等，
引入了近年部分优秀的创新

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/669065.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Kubernetes使用Istio

Kubernetes使用Istio

Kubernetes使用Istio 1、基本概念 1.1、流量方向南北流量（NORTH-SOURTH-TRAFFIC）：客户端到服务器之间通信的流量东西流量(EAST-WEST-TRAFFIC)：指的是服务器和服务器之间的流量 1.2、Service Mesh 2、安装Istio 2.1、下载 …

阅读更多...

【编译、链接、装载九】静态链接

【编译、链接、装载九】静态链接

【编译和链接九】静态链接一、demo二、空间与地址分配1、相似段合并三、即虚拟地址VMA（Virtual Memory Address）四、重定位1、add调用2、printf调用——同add2、shared 五、重定位表六、符号解析七、c相关问题1、重复代码消除2、全局构造与析构3、C与A…

阅读更多...

从创建到维护：掌握package.json的最佳实践

从创建到维护：掌握package.json的最佳实践

文章目录 I. 介绍什么是package.jsonpackage.json的作用npm与package.json的关系 II. 创建package.jsonnpm init自动生成package.jsonpackage.json各个字段的含义 III. dependencies和devDependenciesdependencies和devDependencies的区别安装依赖包安装依赖包的版本更新依赖包…

阅读更多...

Flink 学习十 FlinkSQL

Flink 学习十 FlinkSQL

Flink 学习十 Flink SQL 1. FlinkSQL 基础概念 flink sql 基于flink core ,使用sql 语义方便快捷的进行结构化数据处理的上层库; 类似理解sparksql 和sparkcore , hive和mapreduce 1.1 工作流程整体架构和工作流程数据流,绑定元数据 schema ,注册成catalog 中的表 table …

阅读更多...

【C语言复习】第七篇、关于C语言关键字的知识

【C语言复习】第七篇、关于C语言关键字的知识

目录第一部分、常见关键字 1、数据类型关键字 2、流程控制类关键字第二部分、常用的关键字 1、typedef（类型重定义/类型重命名） 2、static（易混淆const） 2.1、static修饰局部变量 2.2、static修饰全局变量 2.3、static修饰…

阅读更多...

9.创建provider实例

9.创建provider实例

创建provider网络 controller节点创建一个provider 网络，网络类型为 external 对于 provider 网络来说，实例通过 2 层（桥接网络）连接到提供商网络。参数说明： --share： 允许所有项目都可以使用该网络…

阅读更多...

深度学习-【图像分类】学习笔记8 ShuffleNet

深度学习-【图像分类】学习笔记8 ShuffleNet

文章目录 8.1 ShuffleNet v1 v2理论讲解ShuffleNet v1ShuffleNet v2 8.2 使用Pytorch搭建ShuffleNet 8.1 ShuffleNet v1 v2理论讲解 ShuffleNet v1 论文链接：https://readpaper.com/paper/2963125010 Channel shuffle 相关链接：深度学习-【图像分类】…

阅读更多...

车载以太网 - 传输层 - TCP/IP

车载以太网 - 传输层 - TCP/IP

目录一、传输层基础介绍传输层主要包括两种协议传输层端口号二、UDP通信 UDP协议介绍 UDP 通信特点: UDP Segment结构 UDP通信过程三、TCP通信 TCP通信特点: TCP Segment结构一、传输层基础介绍传输层的寻址方式：端口号包括传输层的寻址方式&…

阅读更多...

几个SQL的高级写法

几个SQL的高级写法

一、ORDER BY FLELD() 自定义排序逻辑 MySql 中的排序 ORDER BY 除了可以用 ASC 和 DESC，还可以通过 ORDER BY FIELD(str,str1,...) 自定义字符串/数字来实现排序。这里用 order_diy 表举例，结构以及表数据展示： ORDER BY FIELD(str,str1,..…

阅读更多...

chatgpt赋能python：Python支持跨平台软件开发

chatgpt赋能python：Python支持跨平台软件开发

Python支持跨平台软件开发作为一种高级编程语言，Python 以其丰富的库和跨平台支持而备受开发人员欢迎。Python 通过将应用程序的可移植性最大化，使得开发人员可以轻松地在不同的操作系统平台上构建和部署软件。跨平台支持 Python 支持各种不同的操作…

阅读更多...

三子棋都玩过吧，那C语言现造一个呢？？？

三子棋都玩过吧，那C语言现造一个呢？？？

目录前言三子棋简介棋盘介绍规则介绍程序设计基本流程游戏逻辑菜单界面打印创建棋盘并初始化打印棋盘玩家落子电脑落子判断胜负 1.判定是否和棋 2.判定胜负代码总汇 ✅Game.h 头文件 ✅Game.c ✅Test.c 前言 🥰想必各位大佬们上学的…

阅读更多...

编译安装以及升级Nginx

编译安装以及升级Nginx

目录一、前言 1、简介 2、 Nginx模块 3、与Apache的差异 4、优点二、编译安装 1、关闭防火墙 2、安装依赖包 3、创建运行用户与组 4、编译安装 5、检测配置文件是否正确 6、添加系统服务三、版本升级四、总结一、前言 1、简介 Nginx是一个高性能的HTTP和反…

阅读更多...

chatgpt赋能python：Python散点图连线——一种美妙的可视化方法

chatgpt赋能python：Python散点图连线——一种美妙的可视化方法

Python散点图连线——一种美妙的可视化方法散点图连线是一种常用的可视化方法，可以展示不同维度之间的关系和趋势。在Python中，我们可以使用多种库来绘制散点图连线，例如matplotlib、seaborn和plotly等。本文将介绍如何使用matplotlib和plo…

阅读更多...

数学公式库mathjs 安装使用教程

数学公式库mathjs 安装使用教程

Math.js 是个JavaScript 和 Node.js 的扩展数学库。它包括了灵活的表达式解析器，提供数字，大数值，复杂数值，单位，矩阵等等集成的解决方案。Math.js 很强大又易于使用。特性支持数值，大数值&#xff0c…

阅读更多...

医疗IT绝缘监测应用

医疗IT绝缘监测应用

近年来，随着医疗技术的迅猛发展，电子电气相关医疗设备在医院中的应用越来越广泛，各类疾病治疗也越来越依赖医疗电气设备。人们对医院医疗环境提出更高要求，传统的建筑、电气等设计已难以充分保障其人身安全。患者及医务人员已深陷…

阅读更多...

每日学术速递6.10

每日学术速递6.10

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Unifying (Machine) Vision via Counterfactual World Modeling 标题：通过反事实世界建模统一（机器）视觉作者：Daniel M. Bear, K…

阅读更多...

LFS11.3在VMware安装后需要做的准备

LFS11.3在VMware安装后需要做的准备

参考lfs 11.3和Blfs 11.3 先简单罗列一下要做的步骤，后续有机会再补充一下细节，遇到问题欢迎读者留言。 1、配置vmware中的网络连接使用vmware net8 net模式，选用VMnet 配置网络连接/etc/sysconfig/ 目录下ifconfig.*** （***为…

阅读更多...

RK3588平台开发系列讲解（AI 篇）什么是RKNPU

RK3588平台开发系列讲解（AI 篇）什么是RKNPU

文章目录一、RKNPU的发展历史二、RKNPU单核架构三、RKNPU性能计算四、RKNPU应用场景沉淀、分享、成长，让自己和他人都能有所收获！😄 📢本篇章主要讲解什么是RKNPU。一、RKNPU的发展历史二、RKNPU单核架构三、RKNPU性能计算 NPU算力是指每秒可以处理的运算次数，通常…

阅读更多...

基于Hata模型的BPSK调制信号小区覆盖模拟matlab完整程序分享

基于Hata模型的BPSK调制信号小区覆盖模拟matlab完整程序分享

基于Hata信道模型的BPSK调制信号小区覆盖模拟matlab仿真，对比VoIP, Live Video,FTP/Email 完整程序： clc; clear; close all; warning off; addpath(genpath(pwd)); % Random bits are generated here. bits = randi([0, 1], [50,1]); M = 2; t = 1:1:50; trans = pskmod(bi…

阅读更多...

支持硬件加速的opencv编译

支持硬件加速的opencv编译

背景为了降低cpu的使用率提升系统的接入能力，需要将编解码模块移至GPU处理，opencv默认的发行版中不支持GPU加速，所以需要重新编译opencv使其支持GPU硬件加速。读者本文的读者须具备一定的Linux使用经验，如常规软件安装等操作…

阅读更多...

推荐文章

最新文章