论文阅读笔记
网络结构
整个Faster R-CNN可以分为三部分:
**backbone:**共享基础卷积层,用于提取整张图片的特征。例如VGG16,或Resnet101,去除其中的全连接层,只留下卷基层,输出下采样后的特征图。
**RPN:**候选检测框生成网络(Region Proposal Networks)。
**Roi pooling与分类网络:**对候选检测框进行分类,并且再次微调候选框坐标(在RPN中,网络会根据先前人为设置的anchor框进行坐标调整,所以这里是第二次调整)。输出检测结果。
————————————————
其余参考:
原文链接:https://blog.csdn.net/weixin_62371528/article/details/136059666
【个人整理】faster-RCNN的背景、结构以及大致实现架构(一)https://cloud.tencent.com/developer/article/1441555
【个人整理】faster-RCNN的训练过程以及关键点总结
https://cloud.tencent.com/developer/article/1441554
个人手写笔记:
个人基础知识补充【问了AI也参考了一些其他文献】
换一些之前没有好好打基础欠下的债T T
与FAST RCNN区别对比
相比FASTER-RCNN,主要两处不同:
(1)使用RPN(Region Proposal Network)代替原来的Selective Search方法产生建议窗口;
(2)产生建议窗口的CNN和目标检测的CNN共享
改进:
(1) 如何高效快速产生建议框?
FASTER-RCNN创造性地采用卷积网络自行产生建议框,并且和目标检测网络共享卷积网络,使得建议框数目从原有的约2000个减少为300个,且建议框的质量也有本质的提高.
————————————————
作者:尚学堂java学院 https://www.bilibili.com/read/cv11584179/ 出处:bilibili