人工智能——大白话熟悉目标检测基本流程

news2024/12/26 7:46:50

👦👦一个帅气的boy,你可以叫我Love And Program
🖱 ⌨个人主页:Love And Program的个人主页
💖💖如果对你有帮助的话希望三连💨💨支持一下博主

大白话熟悉目标检测基本流程

  • 前言
  • 数据集
  • 数据加载类
  • 主干网络(Backclone)
  • 颈部网络
  • 头部网络

前言

最近重拾目标检测,发现目标检测的基本流程都忘干净了,所以只能着手重新学习,下面来分享一下最近学习目标检测的一些基础知识,只有知道整个事件的基本流程才能加强对目标检测的理解,从而推进项目的进展。

数据集

       在进行所有人工智能检测前我们必需准备的工作之一是获取数据集,目标检测算法根据流行的不同模型分为使用voc数据集(也就是xml数据集)、txt数据集、或是coco数据集(也就是json数据集),所以很多时候需要用代码将数据集转换成我们需要的格式。但是其进行下一步创建数据加载类时大都以一种形式将获取到的边界框、类别、旋转角度等特征呈现使用,这里我不确定是不是都全转换成txt文件传入,但是最后形成的特征格式如下图,文件位置非必须)
在这里插入图片描述
       简单来说就是不论是哪个数据集,放到数据加载类里都是一样的形式,所谓那些主流算法需要使用特定格式数据集只是人家就写了这一部分转换的代码而已,或许是因为团队不一样,公司不一样,所以不必在这一部分过于纠结。

YOLO算法使用txt文件读取,需要把voc格式转换成txt格式,或是更改yaml文件使用voc格式,具体内容请读者自行搜索。

Farst RCNN系列可以直接读取voc数据集。
MMDetection可以直接使用coco数据集。

数据加载类

       整理好特征数据,接下来就是合理分配他们,但是这并不能像进行回归预测那样一股脑全部塞进去,受各方面影响,需要分批次进行训练,也就是平时经常听到的bach size,将数据传输给主干网络。
       同时在此对数据进行相应预处理,在上述划分数据集之前,我们可以进行数据增强,做个裁剪、加黑边、旋转、图像融合、Mosaic随即拼接都是可以的,在深入可以修改图像的一系列HSV参数,加入随机抖动等操作增加数据集数量。

主干网络(Backclone)

       此时数据已经处理好了,接下来我们需要将处理好的数据传入主干网络,主干网络是目标检测任务的基本特征提取器,我们可以理解为进行了一次相比颈部网络较为笼统地特征提取,最终传递所需n个输出特征层传入颈部网络。又因为适用场合不同,又分为更深且连接密集的主干网络和轻量级网络,分别用于研究突破和用于工业、现场使用。
       主干网络具体代码咱们就不讨论了,网上已经有很多实例了,本文主要是疏通一下目标检测的整体流程,可以分享一下主干网络主要用的思想就是大家耳熟能详的那几种算法->VGG16/ResNet/CSPDarknet53/MobileNet系列等等

颈部网络

       主干网络产生的输出特征层传入颈部网络,颈部网络的作用是提取一些更复杂的特征,这一块就相对来说更加细节,相对流行的有FPN(特征金字塔),对特征进行多尺度融合;还有 SPP 模块,扩宽感受野,增强对特征图的提取能力,防止过拟合…
       这一部分也是相当多的,但他们的本质都是将特征进行进一步处理,使特征的相关性更加紧密,这样训练的模型鲁棒性更好,最后训练出实际应用的目标检测模型。如果将目标检测比作做一个精美的木雕的话,数据集就是原材料,主干网络就是雕一个大概原型,颈部网络就是细细雕刻每一个部位,最后的头部网络便是将对应目标木雕分销到各自需要的地方。

头部网络

       通过前面网络训练的特征头部网络负责检测与定位,通过loss损失函数和非极大值抑制计算选取出最佳边界候选框位置,最后用mAP指标评价->通俗一点讲就是用来预测最后展示目标的类别和位置。

本文主要介绍目标检测的一个基本流程,仅供熟悉一些通用的操作,并没有过多的分析具体步骤,了解分析相应代码的时候应该先看哪一部分,不能盲目分析,只有找对基本步骤才能一步一步进行剖析拆解

如有错误,请及时指出,感谢支持

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/22053.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

天然产物化合物库在肥胖中的潜在靶点 | MedChemExpress

脂肪有分类?都说“燃脂”,但很少有人了解脂肪组织。其实脂肪组织主要分为两类:白色脂肪组织 (WAT) 和棕色脂肪组织 (BAT)。白色脂肪以甘油三酯的形式储存多余的能量,而棕色脂肪则通过消耗能量产热,在保暖和抵抗肥胖中起…

31.nacos集成Feign和Gateway实例(springcloud)

一、项目nacos-client-a 1.pom.xml文件 新增了springcloud的依赖 新增了springcloud的依赖管理 新增了feign依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://…

ArcMap10.6以上版本添加天地图底图

文章目录 申请天地图服务Key在ArcMap10.7中添加天地图服务注意点 申请天地图服务Key 天地图API&#xff1a;http://lbs.tianditu.gov.cn/server/MapService.html 需要登录后进入控制台&#xff0c;申请免费的Key&#xff1a; 在ArcMap10.7中添加天地图服务 天地图API提供…

(十)Spring之回顾反射机制

文章目录反射机制四要素Spring反射机制底层原理上一篇&#xff1a;&#xff08;九&#xff09;Spring之Bean的循环依赖问题反射机制四要素 反射机制调用方法&#xff0c;一般涉及到4个要素&#xff1a; 调用哪个对象的哪个方法传什么参数返回什么值 一般分为这几个步骤&…

Mysql语法二:表的增删改查(简单查询)

目录 1.新增&#xff08;Create) C 1.1 单行数据全列插入 1.2&#xff1a;多行新增指定列插入 1.3&#xff1a;思考题 2.查询&#xff08;Retrieve&#xff09;R 简单查询 2.1&#xff1a;指定列查询 2.2&#xff1a;查询字段为表达式 2.3&#xff1a;别名 as 2.4&…

计算机专业毕业设计演示视频(论文+系统)_kaic

演示链接https://ssm2.oss-cn-beijing.aliyuncs.com/jspSSM201%E5%A4%A7%E5%AD%A6%E7%94%9F%E7%AC%AC%E4%BA%8C%E8%AF%BE%E5%A0%82%E5%AD%A6%E5%88%86%E6%88%90%E7%BB%A9%E6%B4%BB%E5%8A%A8%E6%8A%A5%E5%90%8Dvue.mp4https://ssm2.oss-cn-beijing.aliyuncs.com/jspSSM205%E6%97…

操作系统之进程

操作系统 操作系统图解 这个图详细说明了计算机整个框架&#xff0c;系统调用&#xff0c;操作系统内核和驱动程序三个统称为操作系统&#xff0c;应用程序通过操作系统提供的api来调用硬件设备&#xff0c;而对于硬件设别来说&#xff0c;每个计算机的硬件设备的种类和厂家不…

RNA-seq 保姆教程:差异表达分析(一)

介绍 RNA-seq 目前是测量细胞反应的最突出的方法之一。RNA-seq 不仅能够分析样本之间基因表达的差异&#xff0c;还可以发现新的亚型并分析 SNP 变异。本教程[1]将涵盖处理和分析差异基因表达数据的基本工作流程&#xff0c;旨在提供设置环境和运行比对工具的通用方法。请注意&…

L2搭载率连续两个月站上30%大关,车企加速产业链整合

进入新的行业发展周期&#xff0c;车企的智能化挑战越来越大&#xff0c;也催生新一轮整合热潮。对于全球数百家中小型智能汽车技术公司来说&#xff0c;「上岸」时机已经到来。 本周&#xff0c;全球第四大汽车制造商Stellantis宣布&#xff0c;收购总部位于匈牙利的人工智能…

在 Solidity 中 ++i 为什么比 i++ 更省 Gas?

前言 作为一个初学者&#xff0c;“在 Solidity 中 i 为什么比 i 更省 Gas&#xff1f;” 这个问题始终在每个寂静的深夜困扰着我。也曾在网上搜索过相关问题&#xff0c;但没有得到根本性的解答。最终决定扒拉一下它们的字节码&#xff0c;从较为底层的层面看一下它们的差别究…

多进程编程

系列文章目录 多进程编程 VS 多线程编程_crazy_xieyi的博客-CSDN博客 文章目录 前言一、进程创建二、进程等待前言 Java对操作系统提供的多进程编程接口这些操作进行了限制&#xff0c;最终给用户只提供了两个操作&#xff1a;进程创建和进程等待。 一、进程创建 创建出一个…

Android 基础知识3-1项目目录结构

上一章我们创建了Hello Word项目&#xff0c;代码是由ADT插件自动生成的&#xff0c;我们没有对其进行编码&#xff0c;所以没有对其框架进行分析。其实每一个平台都有自己的结构框架&#xff0c;所以我们对Android项目的结构也进行分析。 与一般的Java项目一样&#xff0c;src…

Qt 学习(二) —— Qt工程基本文件详解

目录1. pro文件内容解释2. main文件内容解释3. widget.cpp/widget.h文件内容解释4. ui_widget.h文件内容解释5. widget.ui文件内容解释以Widget窗口部件项目为例&#xff0c;新建的工程目录有如下几个文件&#xff1a; QtCreator软件将他们做了如下分组&#xff0c;包含三个文件…

idea快捷搜索键

目录 1、shift shift 双击 2、Ctrl F在当前类中&#xff0c;页中进行查找相关方法等 3、CtrlShiftN按【文件名】搜索文件 4、CtrlH 查看类的继承关系 5、Alt F7 查看类在哪儿被使用 idea全局搜索的快捷键 1、shift shift 双击 可以搜索任何东西。类、资源、配置项…

运行写在字符串中的Python代码 exec(‘‘‘print(1)‘‘‘)

【小白从小学Python、C、Java】 【Python-计算机等级考试二级】 【Python-数据分析】 运行写在字符串中的Python代码 exec(print(1)) [太阳]选择题 请问对以下Python代码说法错误的是&#xff1f; print("【执行】exec(print(1))") exec(print(1)) myFuncsumab prin…

CTF秀web2

CTF秀web21.分析题目2.解题2.1信息收集3.2获取数据库3.3获取数据库表3.3获取表信息3.uinon注入语句3.1 判断注入3.2 信息收集3.3注入语句1.分析题目 如上图所示&#xff0c;可以看到是sql注入的题目&#xff0c;进入题目看看&#xff0c;题目页面如下&#xff1a; 如上图所示&a…

fastjson反序列化漏洞

1.fastjson反序列化漏洞原理 我们知道fastjson在进⾏反序列化时会调⽤⽬标对象的构造&#xff0c;setter&#xff0c;getter等⽅法&#xff0c;如果这些⽅法内部 进⾏了⼀些危险的操作时&#xff0c;那么fastjson在进⾏反序列化时就有可能会触发漏洞。 我们通过⼀个简单的案例…

kubernetes 资源管理

kubernetes 资源管理 资源管理介绍 在kubernetes中&#xff0c;所有的内容都抽象为资源&#xff0c;用户需要通过操作资源来管理kubernetes。 kubernetes的本质上就是一个集群系统&#xff0c;用户可以在集群中部署各种服务&#xff0c;所谓的部署服务&#xff0c;其实就是在…

纳睿雷达冲刺上市:产能利用率不足仍要扩产,毛利率持续下滑

上海证券交易所信息显示&#xff0c;广东纳睿雷达科技股份有限公司&#xff08;下称“纳睿雷达”&#xff09;的IPO进程已有8个月未有变化&#xff0c;上一次更新信息还是2022年3月10日。而证监会网站则显示&#xff0c;已向纳睿雷达发出了注册阶段三次问询问题&#xff0c;最新…

创建线程的几种方式

创建线程的几种方式 文章目录创建线程的几种方式一、继承 Thread 类二、实现 Runnable 接口三、实现 Callable 接口&#xff0c;并结合 Future 实现四、通过线程池创建线程五、前三种创建线程方式对比继承Thread实现Runnable接口实现Callable接口参考链接一、继承 Thread 类 通…