目标检测(6)—— YOLO系列V2

news2024/11/28 0:50:47

一、YOLOV2改进的概述

做的改进如下图:

在这里插入图片描述

  • Batch Normalization 批量归一化层

不加BN层,网络可能学偏,加上归一化进行限制。
从今天来看,conv后加BN是标配。

在这里插入图片描述

  • 更大的分辨率

V1训练的时候使用224×224,测试用448×448。
V2训练的时候可以进行10个epoch448×448的微调。训练测试用一样大小的数据集。
在这里插入图片描述

  • 网络架构的改变

使用DarkNet19,借鉴了Alex和VGG的思想。所有的层都采用的卷积层,没有采用全连接层,全连接层容易过拟合,训练的也慢。
经过5次降采样,h/32,w/32,结果为13。V1版本的7×7太小。
实际输入416×416,希望416/32=奇数,中心点好选。
卷积核的卷积核为3×3,1×1,借鉴了VGG,19个卷积层。1×1是为了省参数。
DarkNet深度自己选择

在这里插入图片描述

  • 聚类提取先验框

比如数据集里100w个标注好的框,为了使得先验框更加符合实际要求,使用K-means,K=5,聚成5类(都是实际的值),5类中都有一个中心点(h,w),将这些(h,w)做成先验框。
正常的距离:欧氏距离。
在YOLO中的距离:用1-IOU
K越大,越精确,K=5的时候,平均IOU还可以,再往上走的时候,走势不明显。

在这里插入图片描述

  • Anchor Box先验框

MAP值没有提升:框多了,不一定每个框都能做对。
recall提升了:框多了,之前不能框出来了可以框出来了。

在这里插入图片描述

  • Directed Location Prediction

直接预测相对位置,相对网格的偏移量。

在这里插入图片描述
预测的偏移量:tx,ty,tw,th,实际的预测值bx,by,bw,bh看下面的计算结果
黑色:先验框
蓝色:预测的框

蓝色的点是预测的框的中心点,学的是蓝色点相对于当前网格左上角点的相对位置(图中所标的红色的点),是0-1之间的。所以无论怎么偏移,都不会飘出这个网格了。
这里的cx,cy都是1,换一个网格就不是了。
δ是sigmoid。

  • 计算方式

tw和th预测的是对数,所以转换回来。
pw和ph是等比例缩小后在特征图中的大小。(V2里面就是输入尺寸/32,因为做了5次降采样)。pw和ph是聚类得到的先验框,是已知条件。
计算出来后要进行还原,×32

在这里插入图片描述
在这里插入图片描述

  • 感受野

在这里插入图片描述
参数少。
在这里插入图片描述
channel数=卷积核数=得到的特征图数
在这里插入图片描述
最后的感受野太大了,适合捕捉比较大的目标,所以会导致小物体的丢失。
前面层的感受野较小,可以把前面的特征图进行融合。
把前面胖点的特征图拆成4个瘦的特征图,再拼在一起。
胖的:26×26×512拆成4×13×13×512
瘦的:13×13×1024
最后拼成4×512+1024

在这里插入图片描述

  • Multi-Scale多尺度

网络都是卷积,不用固定图片尺寸大小。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/3838.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

胡扯推荐算法(协同)及其dome实现

文章目录前言推荐系统定义基本分类相似度计算欧式距离皮尔逊系数余弦相似度协同过滤案例数据定义相似度计算推荐svd奇异值分解优化完整代码总结前言 打瞌睡遇到送枕头的感觉真爽嘿嘿 BoyC啊 废话不多说,开始吧。 推荐系统定义 推荐系统(Recommendation System,…

张益唐与黎曼猜想

一个人活在世界上,可以有不同层次的贡献,有正的有负的。唐山烧烤店打人的那种人,就是典型的负的贡献。正的贡献有大有小,像我这样开发一个小软件,写一段小博文,这是小的贡献;像张益唐这样&#…

zlMediaKit 9 ThreadPool模块

semaphore.h TaskQueue.h threadgroup.h ThreadPool.h ThreadPool semaphore 基于条件变量和锁实现的信号量post和wait语义 #include <mutex> #include <condition_variable>namespace toolkit {class semaphore { public:explicit semaphore(size_t initia…

Linux命令从入门到实战 ----查找文件和目录压缩和解压缩

文章目录搜索查找find查找文件和目录locate快速定位文件路径grep 过滤查找| 管道符which命令用于查找文件。whereis压缩和解压缩gzip/gunzip 压缩zip/unzip压缩tar打包总结搜索查找 find查找文件和目录 find指令将从指令指定目录下向下遍历其各个子目录&#xff0c;将满足条件…

算法60天:day46

算法60天&#xff1a;day46动态规划-单词拆分动态规划-多重背包问题动态规划-背包总结动态规划-单词拆分 力扣链接 class Solution { public:bool wordBreak(string s, vector<string>& wordDict) {unordered_set<string> wordSet(wordDict.begin(),wordDict…

RabbitMQ消息发送和接收(实例)

消息发送&#xff1a; 1.首先启动rabbitmq 2.查看防火墙状态&#xff0c;如果是开启状态则需要关闭防火墙 3.通过浏览器访问rabbitmq控制台&#xff0c;ip15672端口号 &#xff0c;例如http://192.168.174.129:15672 登录时输入自己的此前设置的登录名和密码 4.打开idea,创建r…

农产品果蔬商城交易系统(Java+Web+MySQL)

目录 摘要 I Abstract II 前言 1 1 课题简介 2 1.1 选题背景 2 1.2 课题的意义 2 1.3 系统目标 3 2. 可行性研究 5 2.1 技术可行性 5 2.2 经济可行性 5 2.3 操作可行性 5 2.4 法律可行性 6 3. 需求分析 7 3.1 系统需要解决的主要问题 7 3.2 系统具备的基本功能 7 3.3 数据流图…

MySQL开篇:简单的库操作,表操作,数据类型

✨博客主页: 心荣~ ✨系列专栏:【MySQL】 ✨一句短话: 难在坚持,贵在坚持,成在坚持! 文章目录一. 什么是MySQL二. 基础库操作1. 创建数据库2. 查看所有数据库3. 选中数据库4. 删除数据库三. 设置数据库的编码字符集四. MySQL数据类型1. 数值类型2. 字符串类型3. 日期数据类型五…

_Linux 动态库

文章目录0. 前言1. 生成动态库1.1 我们把静态库和动态库打包1.2 当动静库同时存在的时候默认生成的是动态库1.3 -static2. 动态库的使用2.1 运行动态库的方法3. 库文件名称和引入库的名称0. 前言 链接&#xff1a;静态库文章 上一章我们讲解了静态库的生成和两种使用&#xff…

Netty架构设计

目录 Selector模型 SelectableChannel Channel注册到Selector SelectionKey 遍历SelectionKey 事件驱动 责任链模式 Selector模型 Java NIO是基于Selector模型来实现非阻塞IO&#xff0c;Netty底层基于Java NIO实现的&#xff0c;因此也使用了Selector模型。 Selector提…

Go语言五大主流web框架

以下 star数截止2022年11月份 1.Gin&#xff08;64.1K&#xff09; 项目简介&#xff1a;Gin 是一个用 Go (Golang) 编写的 HTTP Web 框架。 它具有类似 Martini 的 API&#xff0c;但性能比 Martini 快 40 倍。 仓库地址&#xff1a;https://github.com/gin-gonic/ginhttps…

TensorRt安装和命令行测试

1、选择TensorRt版本 安装tensorrt前&#xff0c;需要先了解自己的显卡算力、架构等&#xff0c;点击 算力列表链接 对号入座。 这里仅展示RTX和Titan系列&#xff0c;其他系列可在当前网页选择。 1.1、cuda版本 首先需要安装cuda&#xff0c;其版本并不是最新就好&#xf…

基于SSM跨境电商网站的设计与实现/海外购物平台的设计

通过对跨境电商网站的编写&#xff0c;使得自己对于javaweb技术和数据库理论有了更深的认识。课题设计javaweb&#xff0c;能够学习网页编程知识。此课题设计的知识有HTML&#xff0c;CSS和MVC模式等。还跟javaScript的知识有关。在不断的学习过程中提高自己的编程能力。本跨境…

TCP/IP网络参考模型

目录 TCP/IP四/五层模型 应用层常见协议——传输数据PDU 传输层协议——传输数据段 端口号 TCP面向连接服务 UDP无面向连接服务 网络层协议——传输数据包 IP协议 数据链路层——传输数据帧 Ethernet帧格式 IEEE802.3帧格式 TCP/IP四/五层模型 标准定义的TCP/IP模型…

使用idea自动开发springMVC程序及表单标签

1.新建项目 选择Spring—>SpringMVC——>Download 点击next&#xff0c;起好项目名称project name&#xff0c;我这里项目名是MVCTag&#xff0c;选择好项目的路径project location&#xff0c;然后点击确定就会自动加载SpringMVC所需要的全部jar包 项目新建完成&…

【Spring5】基于注解的Bean管理简直是Spring中的Spring

文章目录1 什么是注解2 基于注解方式实现对象的创建3 组件扫描配置的细节4 基于注解实现属性的注入4.1 几种注解概述4.2 Autowire注解演示4.3 Qualifier注解演示4.4 Value注解演示5 纯注解的开发模式写在最后1 什么是注解 注解是代码中特殊的标记&#xff0c;格式如下&#xf…

Latex论文排版

O、部分参考&#xff1a; https://blog.csdn.net/qq_41982200/article/details/123051883?spm1001.2014.3001.5506 https://blog.csdn.net/qq_27353621/article/details/127170340 一、基础知识 1、空一行 → 分一段 空很多行也只是分一段 2、加粗、斜体 3、新章节 4…

JAVA学习笔记(二)

JAVA学习笔记 包1.1基本使用 2.2包的命名 2.3常用的包 2.4使用细节 访问修饰符面向对象 3.1面向对象三大特征 封装、继承、多态 3.2封装介绍 3.3封装的理解和好处 3.4封装的实现步骤 3.5构造器和setXXX结合 3.6继承&#xff08;细节&#xff09; 3.7super基本用法 3.8super给…

Kotlin基础学习笔记之第六章——kotlin的类型系统

一、本章简介 与java相比&#xff0c;kotlin中引入了一些新特性&#xff0c;他们是提升代码可读性的基本要素&#xff0c;比如&#xff1a;对可空的类型和只读集合的支持。与此同时&#xff0c;kotlin去掉了一些java类型系统中不必要的或者有问题的特性&#xff0c;比如把数组作…

docker安装mysql同步数据到linux与docker容器卷

可以去dockerhub搜索mysql寻找命令 docker run -p 3310:3306 --name mysql57 -v /home/mysql/conf:/etc/mysql/conf.d -v /home/mysql/datadir:/var/lib/mysql -e MYSQL_ROOT_PASSWORD123456 -d mysql:5.7 -e配置启动容器mysql 需要配置密码 -v 是绑定容器卷到linux 上 …