MMDetection库中的一些模块介绍

news2024/10/7 16:16:16

本文目前仅包含1个主干网络和1个颈部网络。如果有机会,会继续补充更多模型。
若发现内容有误,欢迎指出。

  MMDetection的图像数据一般会经历如下步骤/模块:

训练阶段
测试阶段
图像
主干网络
颈部网络
检测头
损失函数计算
预测结果生成

  下面分别介绍各部分的一些典型模型。

1. 主干网络(BACKBONES)

1.1 CSPDarkNet

  该网络是YOLOX和YOLOv5的主干网络。
在这里插入图片描述

  • 初始化参数:
参数名称数据类型默认值含义取值说明
archstr‘P5’选择基本结构可为’P4’或’P5’,表示使用4阶段或5阶段的网络(分别对应一种预定义的基本结构)
arch_overwriteList(List)None自定义网络结构None表示使用基本结构;否则为自定义网络结构,外层列表的长度为阶段数(图中最上方虚线框结构的重复次数),内层列表的格式为[int, int, int, bool, bool],分别表示in_channels,out_channels,num_blocks,add_identity,use_spp。其中每一阶段的in_channels应和上一阶段的out_channels相同;num_blocks为CSPLayer中DarkbottleNeck的数量(图中 N N N);add_identity为True表示DarkbottleNeck有skip connection操作;use_spp为True表示使用SPP。
deepen_factorfloat1.0-与num_blocks相乘,放缩每个阶段CSPLayer的DarkNetBottleNeck数
widen_factorflo​​​​​​​at1.0-与in_channels和out_channels相乘,放缩通道维度
use_depthwiseboolFalse是否使用深度卷积为True时会使用深度可分离卷积替代每阶段第一个普通卷积
spp_kernal_sizesTuple(int)-SPP中的池化核大小池化操作的数量等于该参数长度
out_indicesTuple(int)-输出特征图对应的阶段序号-
conv_cfgdict卷积类型默认为Conv2d设置卷积类型配置文件格式
norm_cfgdict归一化类型默认为BN设置归一化类型配置文件格式
act_cfgdict激活函数类型默认为Swish设置激活函数类型配置文件格式
frozen_stagesint-1训练时固定参数的层数前frozen_stages层会在训练时固定参数
norm_evalboolFalse是否在训练时将BN层设置为评估模式-
  • forward函数:
参数名称数据类型默认值含义取值说明
xTensor(float)-输入图像大小为 ( B , 3 , H , W ) (B,3,H,W) (B,3,H,W)
返回值List(Tensor(float))返回值多尺度图像特征每个元素对应out_indices中一个阶段的输出特征图

2.颈部网络(NECKS)

2.1 YOLOXPAFPN

  该网络是YOLOX的颈部网络,可与CSPDarkNet这一主干网络搭配。
在这里插入图片描述

  • 初始化参数:
参数名称数据类型默认值含义取值说明
in_channelsTuple(int)-输入通道数长度需要和输入特征图的尺度数相同(若主干网络为CSPDarkNet,则其值应该与CSPDarkNet的out_indices阶段输出通道数相同)
out_channelsint-末端卷积的输出通道数-
use_depthwiseboolFalse是否使用深度卷积为True时会使用深度可分离卷积替代bottom-up下采样的普通卷积
up_sample_cfgdictdict(scale_factor=2, mode=’nearest’)上采样设置两项分别为上采样倍数和插值方法
num_csp_blocksint-CSPLayer中DarkNetBottleNet的数量CSPLayer的结构见1.1节图
conv_cfgdict卷积类型默认为Conv2d设置卷积类型配置文件格式
norm_cfgdict归一化类型默认为BN设置归一化类型配置文件格式
act_cfgdict激活函数类型默认为Swish设置激活函数类型配置文件格式
  • forward函数:
参数名称数据类型默认值含义取值说明
inputsList(Tensor(float))-多尺度图像特征可直接使用CSPDarkNet的输出
返回值List(Tensor)返回值更新后的多尺度图像特征-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/19876.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript 防抖与节流

目录1 函数1.1 调用函数1.2 闭包2 防抖与节流2.1 定义2.2 区别2.3 应用场景3 防抖3.1 非立即执行3.1.1 一般写法3.1.2 Vue2 中写法3.1.3 过程3.2 立即执行3.2.1 一般写法3.2.2 Vue2 中写法3.2.3 过程1 函数 应用防抖节流首先需理解以下知识 1.1 调用函数 js 函数内部 return…

电影售票系统

项目介绍 基于SpringBoot ,Mybatis, Vue 的电影售票及影院管理系统(前后端分离),具体功能见 下面演示截图 需要安装的软件 Java8 MySQL5.7或以上 Navicat或者其他管理工具 IDEA或者Eclipse Node.js 14或以上 运行项…

PLC学习笔记(三):PLC结构(2)

目录: PLC学习笔记(一):概述 PLC学习笔记(二):PLC结构(1) PLC学习笔记(三):PLC结构(2) 🦁&…

SpringBoot+Mybaits搭建通用管理系统实例八:系统权限控制实现

一、本章内容 实现自定义权限控制,通过自定义PermissionEvaluator实现操作权限的检测及控制,关于权限控制模型有ACL, DAC, MAC, RBAC, ABAC等,具体原理可参考:【权限系统设计】ACL, DAC, MAC, RBAC, ABAC 模型的不同应用场景 完整课程地址 二、开发视频 SpringBoot+Mybaits…

《操作系统-真象还原》12. 进一步完善内核

文章目录Linux 的系统调用系统调用的实现 —— 图解系统调用的实现 —— 代码触发中断寻找 IDT 中断描述符执行对应的中断例程中断例程中通过用户传入的功能号去执行对应的功能函数关于 printf你需要知道可变参数的原理Linux 中的可变参数原理Linux 中的可变参数实现printf 只是…

【微服务】SpringCloud轮询拉取注册表及服务发现源码解析

💖 Spring家族及微服务系列文章 ✨【微服务】SpringCloud微服务剔除下线源码解析 ✨【微服务】SpringCloud微服务续约源码解析 ✨【微服务】SpringCloud微服务注册源码解析 ✨【微服务】Nacos2.x服务发现?RPC调用?重试机制? ✨【微…

机器学习:支持向量机SVM的SVC和SVR

支持向量机SVMSVM的工作原理及分类支持向量机的原理线性可分的SVM非线性可分的支持向量机支持向量机分类SVC支持向量机回归SVRSVR原理SVR模型时间序列曲线预测SVM的工作原理及分类 支持向量机的原理 支持向量机(Support Vector Machine,SVM)是一种二类分类器&…

积极融入信创生态 | 思腾合力软件产品完成多个信创产品适配

从2019年我国提出发展信创产业,2020年迈入信创发展元年,到2022信创开始向行业深水区迈进,逐渐延伸到金融、电信等重点行业、核心业务中,开启了“行业信创元年”。一个真正的“大信创”时代已开启,一个数万亿规模的市场…

MybatisPlus---从入门到深化

目录 MyBatisPlus入门 MyBatisPlus介绍 ​编辑Spring集成MyBatisPlus SpringBoot集成MyBatisPlus MyBatisPlus_CRUD 添加 CRUD_相关注解 修改 删除 查询 条件构造器 全局配置 ActiveRecord_概念 ActiveRecord_增删改查 MyBatisPlus插件_插件概述 MyBatisPlus插件_…

超神之路 数据结构 3 —— Stack栈实现及应用

栈也是一种线性表结构,相较于数组,栈对应的操作是数组的子集,我们只要实现从一端添加元素,并从这个一端取出元素,这一端我们称呼它为栈顶,正是由于这种结构,它具有“后入先出”(LIFO…

PTA题目 计算工资

某公司员工的工资计算方法如下:一周内工作时间不超过40小时,按正常工作时间计酬;超出40小时的工作时间部分,按正常工作时间报酬的1.5倍计酬。员工按进公司时间分为新职工和老职工,进公司不少于5年的员工为老职工&#…

基于jsp+mysql+ssm健身信息交流网站-计算机毕业设计

项目介绍 随着全民健身运动的兴起,越来越多的人走进了健身房,而传统的管理模式已不能适应现代健身机构的发展趋势,如何增强健身房会员卡的管理和完善客户服务,成了健身房发展的当务之急。健身信息管理系统的研究与开发&#xff0…

文本摘要实战:基于句子相似度矩阵构建图结构实现文本摘要 代码+数据

任务描述: 自动文本摘要(Text Summarization)是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。自动的文本摘要是非常具有挑战性的,当我们作为人类总结一篇文章时,我们通常会完整地阅读它以发展我们的理解,然后写一个摘要突出其要点。由于计算机缺乏…

计算机毕业设计springboot+vue基本微信小程序的码高教育课后在线小程序

项目介绍 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,码高教育课后在线小程序的设计与开发被用户普遍使用,为方便用户能够可以随时进行码高教育课后在线小程序的设计与开…

HTML期末大学生网页设计作业----锤子手机 1页

⛵ 源码获取 文末联系 ✈ Web前端开发技术 描述 网页设计题材,DIVCSS 布局制作,HTMLCSS网页设计期末课程大作业 | 在线商城购物 | 水果商城 | 商城系统建设 | 多平台移动商城 | H5微商城购物商城项目 | HTML期末大学生网页设计作业,Web大学生网页 HTML&a…

java计算机毕业设计ssm基于JAVA的网上购物系统-商城购物网站

项目介绍 本网上购物网站是针对目前商城的实际需求,从实际工作出发,对过去的网上购物存在的问题进行分析,完善用户的使用体会。采用计算机系统来管理信息,取代人工管理模式,查询便利,信息准确率高,节省了开支,提高了工作的效率。 本系统结合计算机系统的结构、概念、模型、原理…

【机器学习】红酒数据集和加利福尼亚的房价数据的随机森林算法详解

一.随机森林 1.1随机森林的构建 bootstrap参数代表的是bootstrap sample,也就是“有放回抽样”的意思,指每次从样本空间中可以重复抽取同一个样本(因为样本在第一次被抽取之后又被放回去了) 假设,原始样本是”苹果&…

【POJ No. 3253】 围栏修复 Fence Repair

【POJ No. 3253】 围栏修复 Fence Repair 北大OJ 题目地址 这道题其实我们 之前就做过了 https://blog.csdn.net/weixin_44226181/article/details/127064923 当时我们 是在学习哈夫曼树 【题意】 约翰想修牧场周围的篱笆,需要N 块(1≤N ≤20000&…

CMake中if的使用

CMake中的if命令用于有条件地执行一组命令&#xff0c;其格式如下&#xff1a; if(<condition>)<commands> elseif(<condition>) # optional block, can be repeated<commands> else() # optional block<commands> endif() 根据Co…

HTML5期末大作业:旅游网页设计与实现——旅游风景区网站HTML+CSS (1)

⛵ 源码获取 文末联系 ✈ Web前端开发技术 描述 网页设计题材&#xff0c;DIVCSS 布局制作,HTMLCSS网页设计期末课程大作业 | 游景点介绍 | 旅游风景区 | 家乡介绍 | 等网站的设计与制作 | HTML期末大学生网页设计作业&#xff0c;Web大学生网页 HTML&#xff1a;结构 CSS&…