【目标检测中对IoU的改进】GIoU,DIoU,CIoU的详细介绍

news2025/2/27 20:04:35

文章目录

  • 1、IoU
  • 2、GIoU(Generalized Intersection over Union)
  • 3、DIoU
  • 4、CIoU

1、IoU

  • IoU为交并比,即对于pred和Ground Truth:交集/并集
    在这里插入图片描述

1、IoU可以作为评价指标使用,也可以用于构建IoU loss = 1 - IoU
缺点:
2、对于pred和GT相交的情况下,IoU loss可以被反向传播,因为IoU不为0,可以计算梯度。但是二者不相交的话,梯度将会为0,无法优化。
3、pred和GT不相交时,IoU为0,因此无法判断二者距离是远还是近
在这里插入图片描述
4、IOU不能反映两个物体如何重叠(相交方式)。两种情况下的IOU均为0.14,但(a)中两框要比(b)中的相交更整齐一些。
在这里插入图片描述

2、GIoU(Generalized Intersection over Union)

  • 考虑到上述IoU的缺点,在GIoU中做了改进。
    在这里插入图片描述
  • C是包含A与B的最小框,即两个框的外接矩形框
    在这里插入图片描述

1、GIoU对不相交的情况下,不为0,因此使用GIoU loss = 1 - GIoU可以进行梯度的反向传播
2、GIoU可以反应二者的相交情况,对的更齐时GIoU更大,例如上面的第二幅图
3、GIoU可以更好的反应pred和GT之间的距离情况
在这里插入图片描述

3、DIoU

  • DIoU主要考虑了如下的情况
    在这里插入图片描述
  • 即pred完全在GT内部,IoU和GIoU就相同了,不能判断pred中心位置是否接近GT中心
  • 因此,DIoU Loss是在IoU Loss基础上引入一个距离惩罚项,定义如下:
    在这里插入图片描述
  • 上述损失函数中,b,bgt分别代表了anchor框和目标框的中心点,且$$代表的是计算两个中心点间的欧式距离。c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离,相当于做了归一化:d/c,如下图所示。
    在这里插入图片描述

1、与GIoU loss类似,DIoU loss在与目标框不相交时,梯度不为0,可以进行优化。
2、收敛更快:DIoU loss可以直接最小化两个目标框的距离,而GIOU loss优化的是两个目标框之间的面积,因此比GIoU loss收敛快得多。
3、对于包含两个框在水平方向和垂直方向上这种情况,DIoU损失可以使回归非常快,而GIoU损失几乎退化为IoU损失

  • DIoU要比GIoU更加符合bbox回归的机制,将GT与pred之间的距离,重叠率以及尺度都考虑进去,使得目标框回归变得更加稳定,不会像IoU和GIoU一样出现训练过程中发散等问题。

4、CIoU

  • 考虑到pred和GT之间的长宽比也是很重要的,因此CIOU Loss又引入一个box长宽比的惩罚项:
    在这里插入图片描述
    在这里插入图片描述

参考链接:https://blog.csdn.net/leonardohaig/article/details/103394369

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/896418.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

学渣的愤怒!自考本科能不能不考英语和数学?

英语和高数哪个更难? 这是自考生们最头大的两个科目。 自考高数有多难? 高数主要有微积分、线性代数和概率论三个部分。 其中微积分是基础、也是重要的一部分,不仅涉及到很多抽象概念和符号运算,还需要具备良好的计算能力和逻…

Nginx的介绍

本资料转载于传智教育-解锁你的IT职业薪未来,仅用于学习和讨论,如有侵权请联系 视频地址:04-Nginx的优点_哔哩哔哩_bilibili 资源文档:链接:https://pan.baidu.com/s/1RlFl92FdxRUqc858JSxPSQ 提取码:12…

Air780EG —— 合宙4G定位解决方案

定位模式: 外部单片机控制模式(常见于AT固件客户): 开机 -> 搜星 -> 定位成功 -> 上报 -> 关机 780E自行控制模式(常见于二次开发客户,AT用户也可以使用): 开机 -> 搜星 -> 定位成功 -> 模块休眠,关闭GP…

【LVS】3、LVS+Keepalived群集

为什么用它,为了做高可用 服务功能 1.故障自动切换 2.健康检查 3.节点服务器高可用-HA Keepalived的三个模块: core:Keepalived的核心,负责主进程的启动、维护;调用全局配置文件进行加载和解析 vrrp:实…

【时间序列】WWW 2023时间序列相关论文汇总

WWW 会议为交叉,新兴,综合领域的顶级会议,属于CCF A类,几乎计算机的任何一个领域都可以投WWW,是计算机交叉学科领域最具影响力的会议之一。WWW 每年的录用率非常低,今年共录用了365篇论文,录用率…

一文读懂辣“度”火锅--德庄食品的数字化转型

“红汤锅里捞世界,九宫格里分乾坤。”在四川和重庆,火锅算是城市的招牌,这些地区火锅类快消产品也大为盛行。沸腾的火锅,也带动了火锅底料市场的增长,尤其是在“懒”“宅”经济的催生下,火锅底料更是备受年…

使用 Python 获取 Redis 数据库中的所有键

如果你了解 JSON,就会熟悉 Redis 设计系统。 它使用键值结构和分布式内存方法来实现弹性数据库。 哈希、列表、集合、排序集合、字符串、JSON 和流是 Redis 支持的众多数据结构之一。 这个开源数据库支持不同的语言,包括 Python,如果您正在使…

常见前端基础面试题(HTML,CSS,JS)(三)

JS 中如何进行数据类型的转换? 类型转换可以分为两种,隐性转换和显性转换 显性转换 主要分为三大类:数值类型、字符串类型、布尔类型 三大类的原始类型值的转换规则我就不一一列举了 数值类型(引用类型转换) Numbe…

攻防世界-reverse-no-strings-attached

题目描述 菜鸡听说有的程序运行就能拿Flag? 下载文件后,看下文件信息,是一个可执行程序 思路分析 逆向出代码,发现关键点在这里 这里有个解密函数,解密出v2和我们的输入v1进行对比,能够匹配上就OK&…

IO流知识点+(文件上传、下载+压缩文件等)

一 常见IO介绍 1 根据数据流向分类 输入流:把数据从其他设备读取到内存,以InputStream,Reader结尾 输出流:把数据从内存中写出到其他设备,以OutputStream、Writer结尾 2 根据数据类型分类 字节流:已字节为单位&#xf…

MATLAB R2022a 安装教程(超详细!附下载链接)

目录 1、Matlab下载2、安装3、破解 1、Matlab下载 感谢博主tianyvHon的分享! 下载地址:https://pan.baidu.com/s/1iKaBGrWEFX13rG74K7ywRQ#list/path%2F 提取码:uicz 2、安装 下载完成后,右键点击R2022a_Windows.iso文件&#…

06-微信小程序-注册程序-场景值

06-微信小程序-注册程序 文章目录 注册小程序参数 Object object案例代码 场景值场景值作用场景值列表案例代码 注册小程序 每个小程序都需要在 app.js 中调用 App 方法注册小程序实例,绑定生命周期回调函数、错误监听和页面不存在监听函数等。 详细的参数含义和使…

【数据结构】栈和队列常见题目

文章目录 有效的括号用队列实现栈两个队列实现栈一个队列实现栈用栈实现队列设计循环队列最小栈栈的压入&弹出序列逆波兰表达式队列:先进先出 栈:后进先出 有效的括号 https://leetcode.cn/problems/valid-parentheses/ class Solution {public:bool isValid(string s) {…

YOLOv5、v8改进:引入SKAttention注意力机制

目录 1.简介 2.YOLOv5改进 2.1增加以下SKAttention.yaml文件 2.2common.py配置 2.3yolo.py配置 1.简介 论文链接:https://arxiv.org/pdf/1903.06586.pdf 最近对卷积神经网络中的“自适应调整感受野”这样的操作很感兴趣,从字面的意思可以理解&…

跨境电商ERP源码大揭秘,让你少走弯路

本文将深入介绍跨境电商ERP源码的重要性以及如何选择和应用它们,让你的电商业务更高效、顺畅。 跨境电商ERP源码的重要性 提升管理效率 跨境电商运营面临着众多挑战,如订单管理、库存追踪和财务报告等。跨境电商ERP源码能够集成这些功能,帮…

《算法竞赛·快冲300题》每日一题:“树与排列”

《算法竞赛快冲300题》将于2024年出版,是《算法竞赛》的辅助练习册。 所有题目放在自建的OJ New Online Judge。 用C/C、Java、Python三种语言给出代码,以中低档题为主,适合入门、进阶。 文章目录 题目描述题解C代码Java代码Python代码 “ 树…

Java云原生框架Quarkus初探

Java云原生框架Quarkus初探 Quarkus 介绍 Quarkus 是一个云原生,容器优先的Java应用框架,它号称是超音速和亚原子的框架,主要特点是构建速度、启动速度快和占用资源少等特点。它为OpenJDK HotSpot和GraalVM量身定制, 根据Java库和…

table表头颜色 element plus

原图 预期 css :deep(.el-table__header) {background-color: #F5F7FA;} :deep(.el-table tr) {background-color: rgba(0,0,0,0);} :deep(.el-table th.el-table__cell) {background-color: rgba(0,0,0,0);}

飞机打方块(一)菜单界面制作

一、创建项目 修改配置 新建anim,Prefabs,Scene,Script文件夹分别用于存放动画,预制资源,场景,脚本 新建场景和脚本, 1.游戏名称 新建title节点并修改属性: 2.开始游戏按钮 1.新建…

浙大mem项目备考上岸的三大“顽疾”

大家好!不知道至今为止你是否已经在浙大mem项目的备考路上,随着今年提前批面试结束,相信有一部分考生已经获得了“优秀”资格,而有一部分考生则还没来得及申请,无论是哪种情况杭州达立易考教育都建议大家坚持自己的备考…