06- 算法解读 Fast R-CNN (目标检测)

news2024/11/14 5:23:35

要点:

  • Fast R-CNN 属于 Two-stage detector

回归损失参考:https://www.cnblogs.com/wangguchangqing/p/12021638.html


Fast R-CNN算法

Fast R-CNN 是作者 Ross Girshick R-CNN 后的又一力作。同样使用 VGG16 作为网络的 backbone 与R-CNN相比训练时间快9倍,测试推理时间快213倍,准确率从 62%提升至66% ( Pascal VOC 数据集上 )
Fast R-CNN算法 流程可分为3个步 骤:
  • 一张图像生成1K~2K个 候选区域 ( 使用 Selective Search 方法)
  • 将图像输入网络得到相应的 特征图 ,将 SS算法 生成的候选框投影 到特征图上获得相应的 特征矩
  • 将每个特征矩阵通过 ROI pooling 层缩放到 7x7大小的特征图 ,接着 特征图展平通过一系列全连接层得到预测结

2.1 一次性计算整张图像特

R-CNN 依次将候选 框区域输入卷积神 经网络得到特征。

Fast-RCNN将整张图像送入网络,紧接着从 特征图像上提取相应的候选区域。这些候选 区域的特征不需要再重复计算。

2.2 RoI Pooling Layer

RoI Pooling Layer(感兴趣区域池化层)是用于从卷积特征图中提取感兴趣区域的一种机制。RoI指的是Region of Interest(感兴趣区域),它是指在输入图像中通过目标检测算法得到的边界框。

RoI Pooling Layer的作用就是将不同大小的RoI区域映射为相同大小的输出。具体来说,它首先将每个RoI区域划分成固定大小的子区域,然后对每个子区域做最大池化操作,得到一个固定大小的输出。这样做的好处是可以保证不同大小的RoI区域都能够被处理,并且将它们映射为相同大小的输出特征图,便于后续的分类和回归任务。不限制输入图像的尺寸

2.3 分类器

输出N+1个类别的概率(N为检测目标的种类, 1为背景)共N+1个节点

2.4 边界框回归器

输出对应N+1个类别的候选边界框回归参数(dx, dy, dw, dh),共(N+1)x4个节点

边界框回归器

输出对应N+1个类别的候选边界框回归参数(dx, d_y, d_w, d_h),共(N+1)x4个节点

G^x = P_wd_x (P) + P_x

G^y = P_h d_y (P) + P_y

G^w = P_w exp(d_w (P))

G^h = P_h exp(d_h (P))

P_x , P_y , P_w , P_h  分别为候选框的中心x,y坐标,以及宽高

G^x , G^y , G^w , G^h 分别为最终预测的边界框中心x,y坐标,以及宽高

2.5 Multi-task loss

 

 2.6 Cross Entropy Loss 交叉熵损失

1. 针对多分类问题(softmax输出,所有输出概率和为1)

 2. 针对二分类问题sigmoid输出,每个输出节点之间互不相干)

 

2.7 Fast R-CNN

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/505398.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

您应该使用WhatsApp电子商务的3个理由

随着WhatsApp进军电子商务领域并扩大其为企业提供的服务种类,它正迅速成为客户参与的完美工具和对话式商务的绝佳平台。使用WhatsApp作为主要渠道向客户销售商品和服务的前景产生了WhatsApp电子商务一词。 WhatsApp已被加冕为世界领先的消息传递平台。对于最终用户来…

二十三、SQL 数据分析实战(10个简单的SQL题目)

文章目录 题目1: 比赛名单整理题目2: 热门游戏排行题目3: 社区生鲜App覆盖分析题目4: 社区团购行为分析题目5: 统计字符出现次数题目6: 找出各类别商品销量最高的商品题目7: 找出每个部门薪资第二高的员工题目8: 游戏玩家登录情况分析题目9: 用户首单消费金额题目10: 参与优惠活…

这可能是你读过最透彻的TCC方案讲解|分布式事务系列(三)

本文从两个场景说起,详细描述了TCC的详细过程,以及对比2PC有什么区别,适用什么样的场景。 点击上方“后端开发技术”,选择“设为星标” ,优质资源及时送达 在面试前复习 TCC 的时候你是不是这样做的:百度TC…

百度再掀智能手机风云:推出小度AI智能手机

我是卢松松,点点上面的头像,欢迎关注我哦! 太突然了!百度进军手机市场,据报百度也要进军手机市场了。5月底发布首款AI智能手机。目前这款新机处于发布前的最后准备阶段。 这款智能手机将采用百度的AI技术,预计会具备…

react如何渲染包含html标签元素的字符串

如何渲染包含html标签元素的字符串 最近有个搜索替换的需求,用户可以输入关键字信息来匹配出对应的数据,然后对其关键字进行标记显示,如下图所示: 实现上面的需求的思路就是前端去判断检索内容,将内容中对应的关键字…

又失眠了!

下班晚,洗漱之后,就这个点了,睡不着,爬上来和大家随意 BB 几句。 一个人成长的过程,也是自我认同感不断增强的过程,在这个过程中,一个稳定的精神内核不断夯实,你不会为谁的贬低而诚惶…

Linux性能监控与调优工具

Linux性能监控与调优工具 文章目录 Linux性能监控与调优工具1.使用top、 vmstat、 iostat、 sysctl等常用工具2.使用高级分析手段, 如OProfile、 gprof4.使用LTP进行压力测试5.使用Benchmark评估系统 除了保证程序的正确性以外, 在项目开发中往往还关心性…

体验讯飞星火认知大模型,据说中文能力超越ChatGPT

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言&#x1f4d…

Nature | 生成式人工智能如何构建更好的抗体

疫情高峰期,研究人员竞相开发一些首批有效的COVID-19治疗方法:从已经康复的人的血液中分离出来的抗体分子。 现在,科学家已经证明,生成式人工智能(AI)可以通过一些繁琐的过程提供捷径,提出增强抗…

代码随想录算法训练营day29 | 491.递增子序列,46.全排列,47.全排列 II

代码随想录算法训练营day29 | 491.递增子序列,46.全排列,47.全排列 II 491.递增子序列解法一:回溯(map进行数层去重)解法二:回溯(仅针对本题,不具有普适性) 46.全排列解法…

有一说一,这是我看到的全网最新最全的SpringBoot后端接口规范了

一、前言 一个后端接口大致分为四个部分组成:接口地址(url)、接口请求方式(get、post等)、请求数据(request)、响应数据(response)。虽然说后端接口的编写并没有统一规范…

一个.Net功能强大、易于使用、跨平台开源可视化图表

可视化图表运用是非常广泛的,比如BI系统、报表统计等。但是针对桌面应用的应用,很多报表都是收费的,今天给大家推荐一个免费.Net可视化开源的项目! 项目简介 基于C#开发的功能强大、易于使用、跨平台高质量的可视化图表库&#…

Shiro 入门概述

目录 是什么 为什么要用 Shiro Shiro 与 SpringSecurity 的对比 基本功能 原理 是什么 Apache Shiro 是一个功能强大且易于使用的 Java 安全(权限)框架。Shiro 可以完 成:认证、授权、加密、会话管理、与 Web 集成、缓存 等。借助 Shiro 您可以快速轻松 地保护…

Linux 中的文件锁定命令:flock、fcntl、lockfile、flockfile

在 Linux 系统中,文件锁定是一种对文件进行保护的方法,可以防止多个进程同时访问同一个文件,从而导致数据损坏或者冲突。文件锁定命令是一组用于在 Linux 系统中实现文件锁定操作的命令,它们可以用于对文件进行加锁或解锁&#xf…

直击中国国际金融展:实在智能携多项科技成果亮相,展现数字金融力量

4月25日-27日,中国国际金融展于北京首钢会展中心成功举办。作为我国规格最高、历史最久的金融科技展,本次展会以“荟萃金融科技成果,展现数字金融力量,谱写金融服务中国式现代化新篇章”为主题,吸引了众多国内金融机构…

企业邮箱选购,需关注哪些重要因素?

企业邮箱选择考虑哪些问题?应该从企业邮箱安全、企业邮箱的稳定性、企业邮箱专业、方便迁移到新的企业邮箱、企业邮箱邮件的到达率、功能强大的企业邮箱、企业邮箱手机客户端设置等方面考虑。 1.企业邮箱安全 企业邮箱应考虑病毒防治能力。Zoho Mail企业邮箱从物理安…

华硕笔记本系统更新后开机自动蓝屏怎么U盘重装系统?

华硕笔记本系统更新后开机自动蓝屏怎么U盘重装系统?有用户将自己的华硕笔记本进行系统升级之后,遇到了开机自动蓝屏的情况。遇到这个问题我们怎么去进行解决呢?接下来一起来看看怎么通过U盘重装系统的方法解决此问题吧。 准备工作&#xff1a…

【计算机组成原理】第五章 中央处理器

系列文章目录 第一章 计算系统概论 第二章 运算方法和运算器 第三章 多层次的存储器 第四章 指令系统 第五章 中央处理器 第六章 总线系统 第七章 外围设备 第八章 输入输出系统 文章目录 系列文章目录前言第五章 中央处理器5.1 CPU功能和组成5.1.1 CPU的功能5.1.2 CPU的基本…

中文修改润色平台-中文写作润色软件有哪些

中文语言润色软件 中文语言润色软件是一种基于自然语言处理技术,旨在提高中文文本的语言风格、表达能力和可读性的工具。中文语言润色软件可以自动检测和纠正文本中出现的语法、拼写、标点符号以及其他笔误等语言问题,并给出相应的纠正建议和修改意见。…

2022年5月、11月网络工程师真题详解

请点击↑关注、收藏,本博客免费为你获取精彩知识分享!有惊喜哟!! 2022年5月网络工程师科目二真题 试题一: 某分支机构网络拓扑图如 1-1 所示,该网络通过 BGP 接收总部网络路由,设备 1 与设备…