【EfficientDet】《EfficientDet:Scalable and Efficient Object Detection》

news2025/1/12 13:21:59

在这里插入图片描述

CVPR-2020


文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
    • 4.1 BiFPN
    • 4.2 EfficientDet
  • 5 Experiments
    • 5.1 Datasets
    • 5.2 EfficientDet for Object Detection
    • 5.3 EfficientDet for Semantic Segmentation
    • 5.4 Ablation Study
  • 6 Conclusion(own)


1 Background and Motivation

现在的轻量级网络 only focus on a specific or a small range of resource requirements

Is it possible to build a scalable detection architecture with both higher accuracy and better efficiency across a wide spectrum of resource constraints.

本文在 efficientNet 的基础上,

  • 提出 bi-directional feature pyramid network (BiFPN) ,双向特征金字塔
  • 提出 compound scaling method,不仅 scale 主干,也同时 scale 特征金字塔,scale 头部检测器,

使得目标检测器(分割器)更快更准

在这里插入图片描述

2 Related Work

  • One-Stage Detectors
  • Multi-Scale Feature Representations
  • Model Scaling

3 Advantages / Contributions

  • BiFPN
  • compound scaling method(主干 / 金字塔 / 头)

4 Method

在这里插入图片描述
注意会 repeated

4.1 BiFPN

efficient bidirectional cross-scale connections and weighted feature fusion.

在这里插入图片描述
在这里插入图片描述
P 6 t d P_6^{td} P6td 表示 intermediate feature at level 6

特征图融合的时候做了加权,有如下两种方式

(1)Softmax-based fusion

O = ∑ i e w i ε + ∑ j e w j O = \sum_i \frac{e^{w_i}}{\varepsilon + \sum_j e^{w_j}} O=iε+jewjewi

缺点速度比较慢

(2)Fast normalized fusion

O = ∑ i w i ε + ∑ j w j O = \sum_i \frac{w_i}{\varepsilon + \sum_j w_j} O=iε+jwjwi

效果和 Softmax-based fusion 差不多,速度快很多

金字塔采用的卷积都是 depthwise separable convolution

4.2 EfficientDet

在这里插入图片描述
(1)EfficientDet Architecture

one-stage 的框架

金字塔会重复堆叠

(2)Compound Scaling

uses a simple compound coefficient φ to jointly scale up all dimensions of backbone network, BiFPN network, class/box network, and resolution.

在这里插入图片描述

2.1 主干网络的缩放采用的是 EfficientNet 的 B0~B6

2.2 BiFPN network 的缩放规则是

在这里插入图片描述
W 表示 width,也即通道数,D 表示 depth,也即重复的次数

2.3 Box/class prediction network 的缩放规则是

W 同 BiFPN,
在这里插入图片描述

2.4 Input image resolution 的缩放规则是

在这里插入图片描述

5 Experiments

5.1 Datasets

COCO

5.2 EfficientDet for Object Detection

在这里插入图片描述
速度
在这里插入图片描述

5.3 EfficientDet for Semantic Segmentation

use P2 for the final per-pixel classification
在这里插入图片描述

5.4 Ablation Study

COCO validation set

(1)Disentangling Backbone and BiFPN
在这里插入图片描述
设计的 BiFPN 还是特别的猛

(2)BiFPN Cross-Scale Connections
在这里插入图片描述
weighted + BiFPN 最猛

(3)Softmax vs Fast Normalized Fusion

在这里插入图片描述
效果仅差一点点,速度快了一些
在这里插入图片描述
横坐标应该是迭代次数,特征图融合的权重数值上(纵坐标)还是没有太大差异的

(4)Compound Scaling
在这里插入图片描述
一起 scale 效果最好

6 Conclusion(own)

金字塔也可以堆叠

scale 也可以包含金字塔和头部结构一起

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/537961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RocketMQ你不得不了解的 Rebalance机制源码分析

这里是weihubeats,觉得文章不错可以关注公众号小奏技术,文章首发。拒绝营销号,拒绝标题党 RocketMQ版本 version: 5.1.0 RocketMQ中consumer消费模型 在了解RocketMQ的Rebalance机制之前,我们必须先简单了解下rocketmq的消费模型 我们知道…

chatgpt赋能Python-left函数_python

Left 函数在Python中的使用及其优点 在Python编程语言中,字符串处理是不可避免的任务。Python提供了许多内置函数来处理字符串,其中left()函数是其中一个非常重要的函数。本文将介绍left()函数的用法、优点和一些实例,以便更好的理解该函数。…

redis高级篇(2)---主从

一)搭建主从架构: 单节点Redis的并发能力是有限的,所以说要想进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离,因为对于Redis来说大部分都是读多写少的场景,更多的要进行读的压力,最基本都要是…

【Android学习专题】java基本语法和概念(学习记录)

学习记录来自菜鸟教程 Java 变量 Java 中主要有如下几种类型的变量 局部变量 在方法、构造方法或者语句块中定义的变量被称为局部变量。变量声明和初始化都是在方法中,方法结束后,变量就会自动销毁类变量(静态变量) 类变量也声…

chatgpt赋能Python-libreoffice_python宏

介绍 LibreOffice是一套免费开源的办公软件,其中包含一个强大的Python宏系统,可以使用Python编写脚本来增强办公软件的功能。本文将介绍LibreOffice Python宏是什么,如何使用Python编写宏,并提供一些示例,以便读者可以…

去付款--支付宝沙箱的简单测试

alipay-demo 进入开发者中心–开发工具–沙箱–设置公钥 搜索电脑网上支付–查看Demo–查看配置类–查看业务逻辑 我们的基础配置类主要是初始化我们的alipay客户端 真正去付款的时候是提交了一个form表单达到一个真正的支付jsp,java代码首先初始化我买的Alipay客户端&#xf…

瑞吉外卖 - 新增分类功能(11)

某马瑞吉外卖单体架构项目完整开发文档,基于 Spring Boot 2.7.11 JDK 11。预计 5 月 20 日前更新完成,有需要的胖友记得一键三连,关注主页 “瑞吉外卖” 专栏获取最新文章。 相关资料:https://pan.baidu.com/s/1rO1Vytcp67mcw-PD…

网安学习踩坑经验篇

回想学习网络安全一年来,踩了不少坑走了不少弯路,在此稍作总结,希望可以帮助那些想要入门 web 安全或者是想打CTF的同学们一些建议 坑点 先总结一下,我在学习中遇到的坑点 只看视频,眼高手低,不练习&…

【嵌入式Linux】设备树基本语法

设备树基本语法 1_总领-本期设备树视频要怎么讲?讲什么?_哔哩哔哩_bilibili 基本的 特殊的 中断控制 描述GIC控制器 时钟 CPU GPIO 个数,保留范围(起始、长度),个数对应的名字 GPIO映射-这个脚被用了换一…

chatgpt赋能Python-numpy_归一化

NumPy归一化:理解数据规范化的重要性 什么是归一化? 在数据科学和机器学习中,归一化是预处理数据的一种常用技术。归一化是指将数据缩放到一个特定的范围内,通常是0到1或-1到1之间。 例如,我们可能比较一家医院的三…

渗透测试--5.3.使用john破解密码

前言 由于Linux是Internet最流行的服务器操作系统,因此它的安全性备受关注。这种安全主要靠口令实现。 Linux使用一个单向函数crypt()来加密用户口令。单向函数crypt()从数学原理上保证了从加密的密文得到加密前的明…

Java笔记_22(反射和动态代理)

Java笔记_22 一、反射1.1、反射的概述1.2、获取class对象的三种方式1.3、反射获取构造方法1.4、反射获取成员变量1.5、反射获取成员方法1.6、综合练习1.6.1、保存信息1.6.2、跟配置文件结合动态创建 一、反射 1.1、反射的概述 什么是反射? 反射允许对成员变量,成…

基于IC5000烧录器使用winIDEA烧写+调试程序(S32K324的软件烧写与调试)

目录 一、iSYSTEM简介二、如何使用iSYSTEM winIDEA烧写调试程序2.1 打开winIDEA:2.2 新建一个Workspace;2.3 硬件配置:2.4 选择CPU芯片型号:2.5 加载烧写文件:2.6 开始烧录程序:2.7 程序调试Debug:2.7.1 运行程序&…

PCL点云处理之单点选择的交互操作(一百六十七)

PCL点云处理之单点选择的交互操作(一百六十七) 一、效果展示二、实现代码一、效果展示 交互选择点,输出点信息,具体如下图所示 二、实现代码 #include <pcl/io/pcd_io.h> #include <pcl/point_types.h> #include <pcl/visualization/pcl_visu

Spring Cloud Alibaba(二)Nacos统一配置管理

目录 一、为什么需要配置中心 二、常用的配置中心 Nacos 的几个概念 三、Nacos配置中心的使用 &#xff08;一&#xff09;properties格式 1、导入依赖 2、在配置中心新建配置 3、修改配置文件名为bootstrap.yml 4、在微服务中添加nacos config服务地址的配置 5、测试…

chatgpt赋能Python-numpy精度

Numpy精度介绍 Numpy是一个用于进行科学计算的Python库&#xff0c;它提供了多维数组对象以及一系列用于操作数组的函数。Numpy的广泛使用使其成为数据科学中的重要组成部分。然而&#xff0c;Numpy中的精度问题却常常被忽视。 浮点数精度问题 在Numpy中&#xff0c;浮点数是…

STL与string类的认识及简单使用

STL与string类的认识及简单使用 一、STL二、string类构造函数容量操作访问及遍历操作迭代器 修改操作非成员函数重载关系运算符重载getline 三、总结 一、STL STL(standard template libaray-标准模板库)&#xff1a;是C标准库的重要组成部分&#xff0c;不仅是一个可复用的组…

【计算机毕设】基于SringBoot+Vue的校园二手交易平台(含支付)

在导师的严格指导下&#xff0c;我的毕业设计终于完成了&#xff0c;毕设被推优算是给大学生活画上了圆满的句号&#xff0c;几个月的努力也没白费。在开发的过程中收获了很多&#xff0c;也遇到很多问题&#xff0c;但因怕时间来不及&#xff08;根本不知道截止时间TvT&#x…

点餐小程序实战教程04-餐品分类及餐品数据源设计

我们已经利用一定篇幅实现了店铺信息展示的功能,本篇我们来实现一下点餐的逻辑。点餐的逻辑有以下: 用户打开点餐页面,利用侧边栏导航来切换菜品初始状态用户未点餐,显示一个加号的图标点击加号显示数量,需要将菜品加入购物车,购物车显示选购菜品的数量和总价点击减号可以…