基于深度学习的目标检测模型综述

news2024/11/25 5:32:19

基于深度学习的目标检测模型综述

  • 一 概论
    • 目标检测主要挑战
    • 评估指标
  • 二 展望

一 概论

目标检测是目标分类的自然延伸,目标分类仅旨在识别图像中的目标。目标检测的目标是检测预定义类的所有实例并通过轴对齐的框提供其在图像中的初略定位。检测器应能够识别所有目标类的实例并在其周围绘制边界框。这通常被视为一种监督学习问题。

目标检测主要挑战

计算机视觉在过去的十年取得了长足的进步,但是扔面临一些重大挑战。其中一些网络在实际应用中面临的关键挑战有:

  • 同类别的内部变异:在同一对象的实例之间存在同类别的内部变异在自然界中相对普遍。这种变异可能是由于各种原因,比如:遮挡、光照、姿态、视角等。这些不受限制的外部因素对对象的外观有戏剧性的影响。预期对象可能存在非刚性变形,或者被旋转、缩放或模糊化 。一些对象可能有不显眼的周围环境,使得提取变得困难。
  • 分类数量:可供分类的物体类别数量庞大,这使得解决此问题变得具有挑战性。此外,它还需要更多高质量的标注数据,而这种数据很难获取。使用较少的示例来训练检测器事一个开放性的研究问题。
  • 效率:当前的模型需要高计算资源来生成准确的检测结果。随着移动设备和边缘设备变得越来越普遍,高效率的物体检测器对于计算机视觉领域的进一步发展至关重要。
    在这里插入图片描述
    在这里插入图片描述

评估指标

目标检测器使用多个标准来衡量检测器的性能,如每秒帧数(FPS),精度和召回率。但是,平均精度均值是最常见的评估指标。精度是从交并比导出的,即地面真值和预测的边界框之间的重叠区域和并集区域的比率。设置阈值以确定检测是否正确。如果IOU超过阈值,则被归类为真正例,如果IOU低于它,则被归类为假正例。如果模型未能检测到标签真值中存在的对象,则被称为假负例。精度衡量的是正确预测的百分比,而召回率衡量的是真正预测与真值相关的方面。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

二 展望

目标检测在过去十年取得了巨大的进展。在某些狭窄领域,算法几乎达到了人类的准确性水平,然而仍然存在许多令人兴奋的挑战需要解决。

  • AutoML(自动机器学习):使用自动神经架构搜索(NAS)确定目标检测器特征以及是一个积极发展的领域。搜索算法是复杂且消耗资源巨大的。
  • 轻量级检测器:尽管轻量级网络通过与完整模型匹配的分类错误已经显示出巨大的潜力,但在检测准确性方面仍然存在超过50%的差距。随着越来越多的设备上机器学习应用进入市场,对小型,高效且同样准确的模型的需求会增加。
  • 弱监督/少样本检测:大多数最先进的目标检测模型实在数百万个边界框注释的数据上进行训练的,而注释数据需要时间和资源,这种训练方法无法扩展。通过使用弱监督数据,即图像级别标记的数据,可以显著降低这些成本。
  • 领域迁移:领域迁移是指在特定源任务的标记图像上训练的模型在不同但相关的目标任务上的应用。它鼓励重用已训练的模型并减少对大型数据集可用性的依赖,以实现高准确性。
  • 3D目标检测:3D目标检测对于自动驾驶来说是一个特别重要的问题。尽管模型已经达到了很高的准确性,但是低于人类水平性能的部署将带来安全担忧。
  • 视频中的目标检测:目标检测器是为了在单个图像上执行而设计的,这些图像彼此之间缺乏关联。利用帧之间的时空关系进行目标识别是一个尚未解决的问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1101577.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python数据挖掘入门进阶与实用案例:自动售货机销售数据分析与应用

文章目录 写在前面01 案例背景02 分析目标03 分析过程04 数据预处理1. 清洗数据2.属性选择3.属性规约 05 销售数据可视化分析1.销售额和自动售货机数量的关系2.订单数量和自动售货机数量的关系3.畅销和滞销商品4.自动售货机的销售情况5.订单支付方式占比6.各消费时段的订单用户…

乾坤qiankun(微前端)样式隔离解决方案--使用插件替换前缀

一、前言 qiankun作为微前端的一种融合方式,目前也比较成熟,但是由于各类开发技术选型非常繁多,导致了在项目中配置不同,解决别人的问题,不一定能解决自己的问题。 使用的js框架的不同或版本的不同:vue/r…

手部关键点检测3:Pytorch实现手部关键点检测(手部姿势估计)含训练代码和数据集

手部关键点检测3:Pytorch实现手部关键点检测(手部姿势估计)含训练代码和数据集 目录 手部关键点检测3:Pytorch实现手部关键点检测(手部姿势估计)含训练代码和数据集 1. 前言 2.手部关键点检测(手部姿势估计)方法 (1)Top-Down(自上而下)方法 (2)Bot…

mac虚拟机安装homebrew时的问题

安装了mac虚拟机&#xff0c;结果在需要通过“brew install svn”安装svn时&#xff0c;才注意到没有下载安装homebrew。 于是便想着先安装homebrew&#xff0c;网上查的教程大多是通过类似以下命令 “ruby <(curl -fsSkL raw.github.com/mxcl/homebrew/go)” 但是都会出现…

防火墙管理工具增强网络防火墙防御

防火墙在网络安全中起着至关重要的作用。现代企业具有多个防火墙&#xff0c;如&#xff1a;电路级防火墙、应用级防火墙和高级下一代防火墙&#xff08;NGFW&#xff09;的复杂网络架构需要自动化防火墙管理和集中式防火墙监控工具来确保边界级别的安全。 网络防火墙安全和日…

STM32F0的TIM1高级定时器(未完待续)

文章目录 1.高级、通用和基本定时器的区别2.TIM1高级定时器介绍2.1 时基单元2.1.1寄存器2.1.2 预分频器2.1.3 计数器2.1.4 重复计数器 2.2 计数时钟2.3 捕捉/比较通道2.3.1 通道结构 输出类型14-12&#xff1a;定时器霍尔传感器配置结构定义 函数14-100 1.高级、通用和基本定时…

探索云原生技术之容器编排引擎-Kubernetes/K8S详解(8)

❤️作者简介&#xff1a;2022新星计划第三季云原生与云计算赛道Top5&#x1f3c5;、华为云享专家&#x1f3c5;、云原生领域潜力新星&#x1f3c5; &#x1f49b;博客首页&#xff1a;C站个人主页&#x1f31e; &#x1f497;作者目的&#xff1a;如有错误请指正&#xff0c;将…

【Python微信机器人】第一篇:在windows11上编译python

前言 我打算写一个系列&#xff0c;内容是将python注入到其他进程实现inline hook和主动调用。本篇文章是这个系列的第一篇&#xff0c;后面用到的案例是注入python到PC微信实现基本的收发消息。文章着重于python方面的内容&#xff0c;所以对于微信找收发消息的call不会去讲过…

挚文集团:股票回购速度、收入指引均不及预期,令投资者失望

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 挚文集团未来将不再公布MAU数据 今年6月初&#xff0c;挚文集团(MOMO)在公布2023年第一季度业绩时透露&#xff0c;“陌陌应用的月活跃用户(MAU)”已经从去年3月的1.109亿下降到了今年3月的1.065亿&#xff0c;同比下降了-…

大数据Hadoop之——部署hadoop+hive+Mysql环境(window11)

一、安装JDK8 【温馨提示】对应后面安装的hadoop和hive版本&#xff0c;这里使用jdk8&#xff0c;这里不要用其他jdk了&#xff0c;可能会出现一些其他问题。 1&#xff09;JDK下载地址 http://www.oracle.com/technetwork/java/javase/downloads/index.html 按正常下载是需要…

【Python语义分割】Segment Anything(SAM)模型交互式分割+掩膜保存(三)

我之前分享了Segment Anything&#xff08;SAM&#xff09;模型的基本操作&#xff0c;这篇给大家分享下交互式语义分割代码&#xff0c;可以通过鼠标点击目标物生成对应的掩膜&#xff0c;同时我还加入了掩膜保存的代码。 1 Segment Anything介绍 1.1 概况 Meta AI 公司的 S…

HarmonyOS 音视频开发概述

在音视频开发指导中&#xff0c;将介绍各种涉及音频、视频播放或录制功能场景的开发方式&#xff0c;指导开发者如何使用系统提供的音视频 API 实现对应功能。比如使用 TonePlayer 实现简单的提示音&#xff0c;当设备接收到新消息时&#xff0c;会发出短促的“滴滴”声&#x…

【API篇】三、转换算子API(上)

文章目录 0、demo数据1、基本转换算子&#xff1a;映射map2、基本转换算子&#xff1a;过滤filter3、基本转换算子&#xff1a;扁平映射flatMap4、聚合算子&#xff1a;按键分区keyBy5、聚合算子&#xff1a;简单聚合sum/min/max/minBy/maxBy6、聚合算子&#xff1a;归约聚合re…

第三章 内存管理 七、具有快表的地址变换结构

目录 一、什么是快表 二、快表有什么用&#xff1f; 例子&#xff1a; 三、快表和慢表同时查询 四、局部性原理 五、总结 一、什么是快表 快表&#xff0c;又称联想寄存器&#xff08;TLB&#xff0c;translation lookaside buffer)&#xff0c;是一种访问速度比内存快很…

教程更新 | 持续开源 RK3568驱动指南-驱动基础进阶篇

《iTOP-RK3568开发板驱动开发指南》手册文档更新&#xff0c;手册内容对应视频教程&#xff0c;后续资料会不断更新&#xff0c;不断完善&#xff0c;帮助用户快速入门&#xff0c;大大提升研发速度。 ✦ 第一篇 驱动基础 第1章 前言 第2章 你好&#xff01;内核源码 第3章 …

如何部署WampServer并结合cpolar内网穿透工具实现公网访问本地服务?

文章目录 前言1.WampServer下载安装2.WampServer启动3.安装cpolar内网穿透3.1 注册账号3.2 下载cpolar客户端3.3 登录cpolar web ui管理界面3.4 创建公网地址 4.固定公网地址访问 前言 Wamp 是一个 Windows系统下的 Apache PHP Mysql 集成安装环境&#xff0c;是一组常用来…

苏东坡在元丰五年

北宋神宗元丰二年&#xff08;1079年&#xff09;十二月二十八日&#xff0c;震惊朝野上下的“乌台诗案” 正式结案&#xff1a;“祠部员外郎、直史馆苏轼责授检校水部员外郎、黄州团练副使&#xff0c;本州安置、不得签书公事&#xff0c;令御史台差人转押前去。” 元丰三年&…

PAM从入门到精通(三)

接前一篇文章&#xff1a;PAM从入门到精通&#xff08;二&#xff09; 本文参考以下博文&#xff1a; PAM模块详解及sudo命令 PAM 的应用开发和内部实现源码分析 PAM详解&#xff08;一&#xff09;PAM介绍 Linux进阶_PAM认证机制 Oracle Solaris 10 开发者安全性指南 ——…

[Jdk版本不一致问题 ]终端查看jdk版本不一致

目录 前言: 原因 是因为环境变量配置在读取的时候 顺序不一致,或者有多个jdk版本 安装 去对应环境变量 里面查找对应 jdk配置的路径信息: 前言: cmd 终端 在查看java版本的时候, 发现 使用java -version 显示的是 :1.8 版本, javac -version 显示的是 javac11 版本 原因 是因…

Linux | 一篇文章带你深刻理解粘滞位

目录 前言 一、为什么需要粘滞位 二、粘滞位是什么&#xff1f; 三、怎么设置粘滞位 前言 关于粘滞位的学习&#xff0c;首先你得了解Linux下的权限&#xff0c;当然&#xff0c;文章会稍稍带着复习关键知识点&#xff0c;具体关于权限&#xff0c;请移步 Linux权限 一、为…