【人脸检测】——Sample and Computation Redistribution for Efficient Face Detection论文简读

news2024/11/24 22:43:33

人脸检测

摘要

在非受控人脸检测方面已经取得了巨大的进步,但低计算成本和高精度的高效人脸检测仍然是一个开放的挑战。作者提出了两种简单而有效的方法:样本再分配(SR)和计算再分配(CR)。在WIDER FACE上进行的大量实验表明,所提出的SCRFD家族具有SOTA的效率和精度权衡。特别是,SCRFD-34GF的性能比最好的竞争对手TinaFace高出3.86%,同时在VGA分辨率图像的gpu上比TinaFace快3倍以上。

1. 简介

图像分辨率的影响
直接将分类网络的主干用于目标检测是次优的。最近的CR-NAS重新分配了不同分辨率之间的计算。这基于观察到计算在不同分辨率之间的分配对有效感受野(ERF)有很大影响,并影响检测性能。在BFbox中,由于COCO和WIDER FACE之间存在巨大的尺度分布差距,因此观察到相同的主干在COCO上的一般目标检测任务和WIDER FACE上的人脸检测任务之间表现不一致。基于这一观察,BFbox设计了一个面向人脸的搜索空间,包括主干和颈部。ASFD发现在目标检测中常用的特征增强模块,在人脸上并不一定有效

本文中探索了在固定的VGA分辨率(即640×480)下进行高效的人脸检测,而不是使用大尺度进行测试,以降低计算成本。在这种尺度设置下,WIDER FACE中的大多数人脸(78.93%)小于32×32像素,因此它们由浅层阶段预测。为了在这些浅层阶段获得更多的训练样本,作者首先提出了一种通过**大型裁剪策略进行样本再分配(SR)**的方法。

2. TinaFace 回顾

a. 不同尺度精度图
b. 不同stage的计算量
在这里插入图片描述
68%计算量主要来自于1/4 scale的head部分,head部分占了整个网络的79%

3. 方法

基于对TinaFace的上述分析和以下精心的实验,作者在人脸检测设计上提出了以下效率改进,条件是(1)测试尺度限制在VGA分辨率(640)内,(2)步幅为4的特征图上没有锚点。具体而言,作者在步幅为8的特征图上铺设{16,32}的锚点,在步幅为16的特征图上铺设{64,128}的锚点,在步幅为32的特征图上铺设{256,512}的锚点。由于测试尺度较小,大多数人脸将在步幅为8的位置预测。因此,作者首先调查了不同尺度特征图之间正训练样本的再分配(第4.1节)。然后,作者探索了不同尺度特征图之间以及不同组件(即主干、颈部和头部)之间的计算再分配,给定预定义的计算预算。

3.1 样本采样

在这里插入图片描述
在训练数据增强期间,从原始图像中裁剪出正方形块,其随机大小来自原始图像短边的[0.3,1.0]集合。为了为步幅8生成更多的正样本,作者将随机大小范围从[0.3,1.0]扩大到[0.3,2.0]。当裁剪框超出原始图像时,平均RGB值填充缺失的像素。如图4(a)所示,在使用所提出的大型裁剪策略后,32以下的人脸更多。此外,尽管在大型裁剪策略下会有更多极小的人脸(例如<4×4),但由于锚匹配不成功,这些地面真实人脸将在训练期间被忽略。如图4(b)所示,在一个时期内,尺度为16的正锚点从72.3K增加到118.3K,尺度为32的正锚点从95.9K增加到115.1K。通过将更多训练样本重新分配到小尺度,检测微小人脸的分支可以得到更充分的训练。

3.2 模型结构搜索
xxxx省略

4. 实验

结果
在这里插入图片描述
其他模型只是用原始预训练的模型,并没有在VGA尺度上微调。那和SCRFD比较应该不公平。

消融实验
在这里插入图片描述
小尺寸采样策略提点明显。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/472287.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

H7-TOOL的CANFD Trace全解析功能制作完成,历时一个月(2023-04-28)

为了完成这个功能&#xff0c;差不多耗费了一个月时间&#xff0c;精神状态基本已经被磨平了。 当前已经支持&#xff1a; 1、LUA小程序控制&#xff0c;使用灵活。 2、采用SWD接口直接访问目标板芯片的CANFD外设寄存器和CANFD RAM区实现&#xff0c;支持USB&#xff0c;以太网…

docker登录harbor、K8s拉取镜像报http: server gave HTTP response to HTTPS client

docker登录harbor、K8s拉取镜像报http: server gave HTTP response to HTTPS client 当搭建完docker私有仓库后&#xff0c;准备docker login http://ip:端口 登录时会包如下错误 当我们使用docker私有仓库中的镜像在K8s集群中部署应用时会包如下错误 以上错误根据报错信息可…

执行增删改查时获取SQL语句

查询为例 查询方法由SqlSessionTemplate中创建DefaultSqlSession&#xff0c;然后执行DefaultSqlSession的selectList方法。 然后继续执行查询方法 执行executor.query方法&#xff0c;executor为CachingExecutor类型。 如果引入了pagehelper依赖&#xff0c;这里执行前会进…

【Android -- 开源库】数据库 Realm 的基本使用

简介 Realm 是一个 MVCC &#xff08;多版本并发控制&#xff09;数据库&#xff0c;由Y Combinator公司在2014年7月发布一款支持运行在手机、平板和可穿戴设备上的嵌入式数据库&#xff0c;目标是取代 SQLite。Realm 本质上是一个嵌入式数据库&#xff0c;他并不是基于 SQLit…

论文笔记:Model-ContrastiveFederatedLearning

0 简介 论文&#xff1a;Model-ContrastiveFederatedLearning 代码&#xff1a;https://github.com/QinbinLi/MOON 相关链接&#xff1a;本文主要是将SimCLR对比学习的思想迁移到联邦学习中&#xff0c;关于SimCLR的介绍见https://blog.csdn.net/search_129_hr/article/detail…

云计算主要学些什么技术内容?零基础能学会吗?

云计算主要学些什么技术内容&#xff1f;零基础能学会吗&#xff1f; 随着信息技术的不断发展&#xff0c;云计算作为一种新兴的技术&#xff0c;在当今社会中起到了越来越重要的作用&#xff0c;尤其是在数字化发展领域&#xff0c;不管是传统企业还是新经济领域&#xff0c;人…

Arthas--ognl表达式

背景 arthas执行ognl表达式&#xff0c;获取对应的jvm对象数据。ognl学习&#xff0c;可以查看上篇&#xff1a;https://xiaopanjia.blog.csdn.net/article/details/130425414 基本语法 ognl express -c {hashCode} --classLoaderClass {当前的全路径 ClassLoader 信息} -x …

windbg查看64位dump文件踩过的坑:没有二进制文件导致堆栈异常

项目上线了64位的软件&#xff0c;发现dump解析时堆栈不全&#xff0c;很多奇怪的地址&#xff1a; 64位只有pdb&#xff0c;没有二进制文件&#xff1a; 64位有pdb&#xff0c;也有二进制文件&#xff1a; 64位的这个问题把二进制文档和pdb放在一起就正常了。32位的发现没有…

不停机修复mysql主从数据同步错误导致服务器磁盘占满问题

事情的现象&#xff1a; 线上生产环境mysql服务器采用主从结构。突然告警从库服务器磁盘占用高。经过磁盘空间检查&#xff0c;主要是/mysql/data目录使用100%&#xff08;直接占满了&#xff09;&#xff0c;进入目录后发现被文件slave-relay-bin.*系列文件占满了。常理数据不…

28.Mybatis的入门

目录 一、Mybatis。 &#xff08;1&#xff09;Mybatis的简介。 &#xff08;2&#xff09;Mybatis的快速入门。 &#xff08;2.1&#xff09;快速入门。 &#xff08;2.2&#xff09;UserMapper.xml文件。 &#xff08;2.3&#xff09;sqlMapConfig.xml文件。 &#…

基于DSP+FPGA+ADS1282支持32Bit高精度数据采集方案(一)

3.1 系统需求分析 3.1.1 系统功能设计要求 本硬件处理平台的主要任务有三类&#xff0c;一是数据采集&#xff0c;包括采集惯性测量元件 的输出信号&#xff0c;接收外部系统校正信息&#xff0c;如 GPS 信息等&#xff1b;二是数据处理与计算&#xff0c;包 括惯性测量…

分享一个CSS的垂帘效果

先上效果图&#xff1a; 再上代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><style>html, body, canvas {-webkit-user-select: none;-moz-user-select…

[JAVA]前后端分离智慧校园电子班牌系统源码微信带小程序

1. 开发语言&#xff1a;JAVA 2. 数据库&#xff1a;MySQL 3. 后端框架&#xff1a;Spring boot 4. 前端框架&#xff1a;VUE2 5. 电子班牌&#xff1a; Android 7.1 6. 小程序&#xff1a;原生语言开发 7. 多学校Saas 模式 在大数据平台下&#xff0c;对应用系统进行统…

研报精选230428

目录 【行业230428华安证券】环保行业框架分析 【个股230428华西证券_视源股份】收入表现优于行业&#xff0c;平板盈利提升 【个股230428中银证券_长海股份】23Q1业绩承压&#xff0c;行业库存、出口现好转信号 【个股230428国信证券_星宇股份】一季度归母净利润环比增长9%&am…

Web3 游戏全景图:各类玩家群像解读

作者&#xff1a;lesleyfootprint.network 主要观点 即使市场深陷寒冬&#xff0c;但 web3 游戏每天依然有八十万的用户。 Web3 游戏正在逐步完善&#xff0c;从 DeFi 演变出的 Web3 游戏 &#xff0c;到增强了叙事的 X2E&#xff0c;再到 AAA 游戏和元宇宙。 未来&#xff…

同为科技(TOWE)科普与雷电相关的基本知识

前 言 雷电是伴有闪电和雷鸣的放电现象&#xff0c;壮观而又有点令人生畏。雷电一般产生于对流发展旺盛的积雨云中&#xff0c;常伴有强烈的阵风和暴雨&#xff0c;有时还伴有冰雹和龙卷风。夏季雷电时有发生&#xff0c;虽然常见&#xff0c;但你真的了解雷电吗&#xff1f;这…

停车场管理系统的设计与实现_kaic

目 录 1 概 述 1.1研究背景 1.2研究现状 1.3研究内容 2 相关技术简介 2.1 JSP技术 2.2 JAVA技术 2.3 MYSQL数据库 2.4 B/S结构 3 系统需求分析 3.1 系统可行性分析 3.1.1 操作可行性 3.1.2 经济可行性 3.1.3 技术可行性 3.2 系统性能分析 3.3系统流程分析 3.3.1注册流程 3.3.…

关于Prompt Engineering你该了解啥?OpenAI应用研究负责人帮你梳理了

‍来源 | 机器之心 微信号&#xff1a;almosthuman2014 随着 ChatGPT、GPT-4 等模型的兴起&#xff0c;人们对如何创建提示以获得想要的输出越来越感兴趣。研究者对特定提示的响应可能很难预测&#xff0c;并且会因模型的不同而不同。本文来自 OpenAI 的翁丽莲&#xff08;Lili…

【C语言】深度剖析数据在内存中的存储

简单不先于复杂&#xff0c;而是在复杂之后。 目录 1. 数据类型介绍 1.1 类型的基本归类 2.整型在内存中的存储 2.1 原码、反码、补码 2.2 大小端介绍 2.3 练习 2.3.1 练习1 2.3.2 练习2 3.2.3 练习3 2.3.4 练习4 2.3.5 练习5 2.3.6 练习6 2.3.7 练习7 …

linux jstat 简介

本文目录一览&#xff1a; 1、Linux使用jstat命令查看jvm的GC情况2、linux怎么监控 jvm内存 jstat3、Linux系统监控要用到哪些命令4、linux上如何安装jstatd服务 Linux使用jstat命令查看jvm的GC情况 Linux 使用jstat命令查看jvm的GC情况 命令格式 jstat命令命令格式&#…