【科研小小白】Faster R-CNN论文阅读笔记+与FAST RCNN区别对比+个人补充知识

【科研小小白】Faster R-CNN论文阅读笔记+与FAST RCNN区别对比+个人补充知识

news2025/4/5 5:58:55

论文阅读笔记

在这里插入图片描述

网络结构

在这里插入图片描述

整个Faster R-CNN可以分为三部分：

**backbone：**共享基础卷积层，用于提取整张图片的特征。例如VGG16，或Resnet101，去除其中的全连接层，只留下卷基层，输出下采样后的特征图。
**RPN：**候选检测框生成网络（Region Proposal Networks）。
**Roi pooling与分类网络：**对候选检测框进行分类，并且再次微调候选框坐标（在RPN中，网络会根据先前人为设置的anchor框进行坐标调整，所以这里是第二次调整）。输出检测结果。

————————————————
其余参考:
原文链接：https://blog.csdn.net/weixin_62371528/article/details/136059666
【个人整理】faster-RCNN的背景、结构以及大致实现架构（一）https://cloud.tencent.com/developer/article/1441555
【个人整理】faster-RCNN的训练过程以及关键点总结
https://cloud.tencent.com/developer/article/1441554

个人手写笔记：

在这里插入图片描述

个人基础知识补充【问了AI也参考了一些其他文献】

换一些之前没有好好打基础欠下的债T T
在这里插入图片描述

与FAST RCNN区别对比

相比FASTER-RCNN，主要两处不同:
(1)使用RPN(Region Proposal Network)代替原来的Selective Search方法产生建议窗口；
(2)产生建议窗口的CNN和目标检测的CNN共享

改进:

(1) 如何高效快速产生建议框？

FASTER-RCNN创造性地采用卷积网络自行产生建议框，并且和目标检测网络共享卷积网络，使得建议框数目从原有的约2000个减少为300个，且建议框的质量也有本质的提高.

————————————————
作者：尚学堂java学院 https://www.bilibili.com/read/cv11584179/ 出处：bilibili

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1687027.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

SMERF，使用SD地图来增强模型的拓扑感知

SMERF，使用SD地图来增强模型的拓扑感知

论文链接 2311.04079v1 (arxiv.org)https://arxiv.org/pdf/2311.04079v1 研究背景理解道路的拓扑关系是自动驾驶中很重要的一个环节，以往这个部分都是通过HD地图，及高精度地图的数据训练来实现的。高精度地图具备很多的标注信息和很明确的语义信息&a…

阅读更多...

docker 指定jdk11镜像执行jar

docker 指定jdk11镜像执行jar

dockerfile :下载jdk11 并将上传的jar 放入jdk11容器/root，改名为app.jar vi dockerfile 。。。。内容见下图 # 构建jdk11镜像 docker build -t demo . # 也可以通过jdk11镜像（前提有jdk11镜像）外挂载目录方式运行jar docker run --name d…

阅读更多...

使用小技巧：PREEvision权限管理进阶篇

使用小技巧：PREEvision权限管理进阶篇

Review 在《浅谈PREEvision权限管理》一文中，我们介绍了如何在PREEvision中初始化一个权限模型，但只有模型还不够，我们需要对各个用户在不同Project中进行权限的配置，以及在EEA工程中对各个Package配置权限。 Roles and Right …

阅读更多...

成都青年AI人才崭露头角，知了汇智科技助力孵化营大放异彩

成都青年AI人才崭露头角，知了汇智科技助力孵化营大放异彩

5月18日-19日，为期两天的成都国际商贸城青年（大学生）AI应用孵化营活动在热烈的氛围中圆满落幕。本次活动由成都国际商贸城、成都成商数字科技有限公司、成都知了汇智科技有限公司及成都电商职教集团联合举办，旨在为青年&#xff0…

阅读更多...

Project Reactor 响应式编程

Project Reactor 响应式编程

Project Reactor 响应式编程什么是响应式编程响应式编程（Reactive Programming）是一种编程范式，致力于处理异步数据流和变化。它的核心思想是构建响应于变化的系统，即当数据流或事件发生变化时，系统能够自动地调整…

阅读更多...

iOS单元测试覆盖率报告导出功能实现

iOS单元测试覆盖率报告导出功能实现

一、插件安装在Mac电脑上，安装slather插件。插件地址：https://github.com/SlatherOrg/slather 安装命令： gem install slather二、在Xcode上设置Code Coverage，Targets指定XXX 三、在终端切换到项目根目录下，执行单…

阅读更多...

HTML静态网页成品作业(HTML+CSS)——魅族商城首页网页(1个页面)

HTML静态网页成品作业(HTML+CSS)——魅族商城首页网页(1个页面)

🎉不定期分享源码，关注不丢失哦文章目录一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码五、源码获取一、作品介绍 🏷️本套采用HTMLCSS，未使用Javacsript代码，共有1个页面。二、作品演示三、代…

阅读更多...

Nginx - 常用的控制请求处理和响应生成的指令的高阶用法和最佳实践

Nginx - 常用的控制请求处理和响应生成的指令的高阶用法和最佳实践

文章目录指令列表returnbreakrewriteifproxy_passtry_files 执行顺序基础用法高阶使用最佳实践指令列表 return 作用：用于立即结束当前请求的处理并生成响应。用法：return code [text]; code 是 HTTP 状态码，如 200、301、404 等。text 是…

阅读更多...

GitLab集成DingTalk（超级详细）

GitLab集成DingTalk（超级详细）

目录参考文档1 简介2 集成方法2.1 钉钉测操作2.2 极狐GitLab侧操作2.3 钉钉群内操作参考文档钉钉集成 1 简介极狐GitLab集成钉钉，可以在群组中机器人或者直接与机器人创建一对一的聊天框发送消息。当您未将钉钉账户和极狐GitLab 账户进行绑定时，机…

阅读更多...

Blazor 下支持 Azure AD 的多套登录方案

Blazor 下支持 Azure AD 的多套登录方案

比如上图配置了两套不同的登录方案，各有自己的 TenantId 和 ClientId ，要同时支持他们的登录（其实在同一套 TenantId 和 ClientId 里面配置多个登录账户不就好了，但是......那套登录的管理是在客户自己的Azure AD账户管理下的&…

阅读更多...

C++BuilderXE 如何让listView按文件名数字排序而非字母排序

C++BuilderXE 如何让listView按文件名数字排序而非字母排序

int m_nDataColSort0; bool IsAsctrue; void __fastcall TForm1::RzListView4Compare(TObject *Sender, TListItem *Item1, TListItem *Item2, int Data, int &Compare) { if(m_nDataColSort0) { //按列表第二列排序 //CompareCompareText(Item1->SubItems-…

阅读更多...

新书发布——《机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps》

新书发布——《机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps》

内容简介机器学习大数据平台的构建、任务实现与数据治理你需要构建安全、稳定的数据平台，需要可以扩展到任何规模的工作负载。当项目从实验室进入生产环境时，你需要确信它可以应对现实工作中的挑战。本书能够帮助你实现这些需求，将讲述如…

阅读更多...

ARM9驱动开发基础概念

ARM9驱动开发基础概念

2、arm9的通用寄存器有几个？ 3、异常向量表中irq的异常向量是多少？ 4、cpsr中的那几位是用来设置工作模式的？ 5、r13,r14,15别名是什么？有什么作用？ r13栈顶指针 ：它用于实现堆栈指针操作，实…

阅读更多...

安装测缝计安装事项详解

安装测缝计安装事项详解

在建筑和工程领域，测量缝隙和裂缝的准确性对于工程质量和安全性至关重要。测缝计作为一种专业的测量工具，能够帮助工程师和施工人员准确测量和监测建筑结构的缝隙情况，进而采取合适的修复和加固措施，保证建筑物的稳定性和安全性。…

阅读更多...

YOLOv8独家改进：KAN系列 | 「一夜干掉MLP」的KAN ，全新神经网络架构一夜爆火

YOLOv8独家改进：KAN系列 | 「一夜干掉MLP」的KAN ，全新神经网络架构一夜爆火

💡💡💡创新点：来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 KAN。该方法在准确性和可解释性方面表现优于 MLP。而且，它能以非常少的参数量胜过以更大参数量运行的 MLP。 KAN 在边上具有激活函数，而 MLP 在节点上具有激活函数。KAN 似乎比 MLP 的参数效率更…

阅读更多...

预约直播丨ETLCloud训练营：ETL中多流数据合并与运算专题

预约直播丨ETLCloud训练营：ETL中多流数据合并与运算专题

在大数据处理领域，一个至关重要的步骤是对多源数据流进行汇聚与融合，进而开展深度处理与剖析。此操作对于构建高效数据仓库、实现数据动态变化的实时洞察，以及驾驭复杂事件流的处理机制尤为关键。过程涉及从多样化的数据源中抽取信息&#xf…

阅读更多...

【408精华知识】Cache类题目解题套路大揭秘

【408精华知识】Cache类题目解题套路大揭秘

有关Cache的题目，需要理解Cache的工作原理，也即给出一个地址，要知道如何在Cache中寻找或者如何将其从主存中复制入Cache，同时理解Cache中具体是如何存储的，包含三种存储方式，分别是直接映射、全相联映射、组…

阅读更多...

最有效的企业数据防泄漏手段 | 数据泄漏防护系统推荐

最有效的企业数据防泄漏手段 | 数据泄漏防护系统推荐

随意信息安全意识不断提高，企业纷纷寻求高效的数据防泄漏手段。在众多解决方案中，这五款软件各具特色，但它们的共同目标都是确保企业数据的安全性和保密性。接下来，我们将逐一介绍这五款软件的特点和优势。 1、Ping 32 Ping32…

阅读更多...

前端面试项目细节重难点（已工作｜做分享）

前端面试项目细节重难点（已工作｜做分享）

面试官提问：需求场景：页面上有一个单选框，有是否两个选项：当用户选择是，出现一个输入框，用户可以输入内容，给后端的保存接口传入参数radio和content这两个字段，值分别是用户选项和输…

阅读更多...

【Python】如何在Python中创建GUID UUID

【Python】如何在Python中创建GUID UUID

基本原理 GUID（全局唯一标识符）和UUID（通用唯一标识符）都是用来在分布式系统中唯一标识信息的。在Python中，我们可以使用内置的uuid模块来生成这些唯一标识符。 UUID有几种不同的版本，每种版本都有其特定…

阅读更多...

推荐文章

最新文章