Efficientdet源码详解

news2025/1/10 16:11:03

1.参数配置 

      最重要的参数配置如下 

-p:配置文件,需要在project文件夹下新建配置文件
 -c:efficientdet的版本,efficientdet B0-B7
 -n:windows为0,linix根据自己的需求修改
 --batch_size:batch大小
 '--data_path:数据集路径
 -p data --batch_size 16

其中,在运行时,需要在project文件夹下新建配置文件,并指定在-p下。其中,mean/std/anchors_scales/anchors_ratios一般不用修改。

2.dataloader数据读取

数据读取部分做得比较简单,没有使用过多的数据增强策略

数据读取部分如下:

  • 从json中取出图片名称,并读取图片,并归一化至0-1之间
  • 取出对应的标签,并将x,y,w,h转为x1,y1,x2,y2
  • 数据增强,仅仅进行标准化、平移、翻转等操作,最后,将图像resize到指定大小
class CocoDataset(Dataset):
    def __init__(self, root_dir, set='train2017', transform=None):

        self.root_dir = root_dir
        self.set_name = set
        self.transform = transform
        # 若是自己创建的coco数据,可以在此指定名称
        self.coco = COCO(os.path.join(self.root_dir, 'annotations', 'instances_' + self.set_name + '.json'))
        self.image_ids = self.coco.getImgIds()

        self.load_classes()

    def load_classes(self):

        # load class names (name -> label)
        categories = self.coco.loadCats(self.coco.getCatIds())
        categories.sort(key=lambda x: x['id'])

        self.classes = {}
        for c in categories:
            self.classes[c['name']] = len(self.classes)

        # also load the reverse (label -> name)
        self.labels = {}
        for key, value in self.classes.items():
            self.labels[value] = key

    def __len__(self):
        return len(self.image_ids)

    def __getitem__(self, idx):
        # 从json中取出图片名称,并读取图片,并归一化至0-1之间
        img = self.load_image(idx)
        # 取出对应的标签,并将x,y,w,h转为x1,y1,x2,y2
        annot = self.load_annotations(idx)
        sample = {'img': img, 'annot': annot}
        if self.transform:
            # 数据增强,仅仅进行标准化、平移、翻转等操作,最后,将图像resize到指定大小
            sample = self.transform(sample)
        return sample

    def load_image(self, image_index):
        image_info = self.coco.loadImgs(self.image_ids[image_index])[0]
        path = os.path.join(self.root_dir, self.set_name, image_info['file_name'])
        img = cv2.imread(path)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

        return img.astype(np.float32) / 255.

    def load_annotations(self, image_index):
        # get ground truth annotations
        annotations_ids = self.coco.getAnnIds(imgIds=self.image_ids[image_index], iscrowd=False)
        annotations = np.zeros((0, 5))

        # some images appear to miss annotations
        if len(annotations_ids) == 0:
            return annotations

        # parse annotations
        coco_annotations = self.coco.loadAnns(annotations_ids)
        for idx, a in enumerate(coco_annotations):

            # some annotations have basically no width / height, skip them
            if a['bbox'][2] < 1 or a['bbox'][3] < 1:
                continue

            annotation = np.zeros((1, 5))
            annotation[0, :4] = a['bbox']
            annotation[0, 4] = a['category_id'] - 1
            annotations = np.append(annotations, annotation, axis=0)

        # transform from [x, y, w, h] to [x1, y1, x2, y2]
        annotations[:, 2] = annotations[:, 0] + annotations[:, 2]
        annotations[:, 3] = annotations[:, 1] + annotations[:, 3]

        return annotations

3.backbone

backbone采用efficientnet,详见博客:Efficientnet网络详解及构建_樱花的浪漫的博客-CSDN博客_efficientnet网络 \

需要注意的是,深度可分离卷积在pytorch的实现上,通过指定groups参数实现。

 4.BiFPN

         首先,FPN实现了高维特征和低维特征的融合,PANet通过自上而下和自上而下的路径实现了更高程度的特征融合。但是,BiFPN做了两个方面的改进:(1)PANet进行特征融合时,是通过Concat的,一般高层和低层的特征贡献程度相同,BiFPN在特征融合时,通过一组可学习的归一化权重参数调整各层贡献程度。(2)BiFPN堆叠多层实现更高维度的特征融合。

         在源码的实现上,单个BiFPN有两个核心,

  • 第一个是可学习参数的设定。首先,为各层生成一组可学习的权重参数,经过relu激活函数保证权重参数为正。对于权重参数的归一化,论文作者认为softmax归一化太慢,因此采用最简单的归一化:
  •  第二个是特征融合,对于特征融合,由于训练了一组权重参数,因此采用add比concat更适宜。在从上到下的路径时,特征融合由三部分组成,如上图(d)所示

最后,对提取的特征分别做分类和回归。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/97725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Flask框架】——20 请求钩子

在客户端和服务器交互的过程中&#xff0c;有些准备工作或扫尾工作需要处理&#xff0c;比如&#xff1a; 在请求开始时&#xff0c;建立数据库连接&#xff1b; 在请求开始时&#xff0c;根据需求进行权限校验&#xff1b; 在请求结束时&#xff0c;指定数据的交互格式。 …

Dubbo 1 分布式系统中的相关概念 1.1 大型互联网项目结构目标

Dubbo 【黑马程序员Dubbo快速入门&#xff0c;Java分布式框架dubbo教程】 【非常重要就完事儿 了】 1 分布式系统中的相关概念 文章目录Dubbo1 分布式系统中的相关概念1.1 大型互联网项目结构目标1.1.1 传统项目 和 互联网项目1.1.2 互联网项目特点1.1.3 大型互联网项目架构…

【2022.12.17】备战春招Day12——每日一题 + 76. 最小覆盖子串 + 24. 两两交换链表中的节点

【每日一题】1764. 通过连接另一个数组的子数组得到一个数组 题目描述 给你一个长度为 n 的二维整数数组 groups &#xff0c;同时给你一个整数数组 nums 。 你是否可以从 nums 中选出 n 个 不相交 的子数组&#xff0c;使得第 i 个子数组与 groups[i] &#xff08;下标从 0…

C++绘制菱形(曼哈顿距离求解:贼快!!!)

思路&#xff1a; 1.双重for循环遍历输出是最基本的 2.了解曼哈顿距离 &#xff08;1&#xff09;菱形的输入一定是奇数 &#xff08;2&#xff09;我们是思想是填充 * 怎么填呢&#xff1f;我们来画图看看 以 3*3 的矩阵为例子&#xff01; 我们来看看 距离是怎么定义的…

LInux进程优先级和nice值

文章目录一 定义描述二 查看nice值2.1 使用top命令交互式查看nice值2.2 使用ps命令查看nice值2.3 查看程序调度策略三 修改nice值3.1 启动特定nice值的进程3.2 更改现有进程的nice级别一 定义描述 大部分情况下&#xff0c;计算机需要运行的进程数超过了计算机拥有CPU的核心数…

[附源码]Python计算机毕业设计后疫情时期社区居民管理系统Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等…

uni-app卖座电影多端开发纪实(二):搭建导航

@创建4个Tab页 创建一个测试页hello 在pages目录上右键,新建页面执行如图操作,即可全自动生成页面组件+页面注册(pages.json)pages.json 中会生成这么一个玩意,就是页面声明了 pages:[{"path" : "pages/hello/hello","style" :

#ubuntu# 自动挂载硬盘 文件无权限Permission denied

操作前&#xff0c;切记做好备份工作。。。。 有时候我们服务器或电脑使用自动挂载硬盘后&#xff0c;发现没有权限。即使使用chmod 666 xxx也无济于事。无法让非root用户对该硬盘具有完全权限。 可以看到挂载的硬盘容量为1T 如果没有数据的话&#xff0c;可以尝试重新格式化硬…

老字号品牌营销杂志老字号品牌营销杂志社老字号品牌营销编辑部2022年第23期目录

中华老字号故事 全素斋 王红; 1 老字号研究《老字号品牌营销》投稿&#xff1a;cnqikantg126.com 刍议数字赋能天津老字号创新发展的路径 刘宝亮; 2-4 湖南老字号招牌广告的特征、价值与影响研究 毛凌云; 5-7 品牌与营销 西秦刺绣的传播路径研究——以“秦绣工…

爬虫?不是,mitmproxy帮你采集微信公众号留言

前言 有位朋友需要收集公司微信公众号的文章的留言&#xff0c;但苦于微信公众平台没有提供留言的API&#xff0c;所以朋友需要在每一篇文章下面去手动复制粘贴&#xff0c;朋友觉得很麻烦&#xff0c;于是来找到我&#xff01;遂有此文。 下一篇&#xff0c;将结合uiautomatio…

Linux——进程管理

动态监控进程 介绍 top与ps命令很相似。它们都用来显示正在执行的进程。Top与ps最大的不同之处&#xff0c;在于top在执行一段时间可以更新正在运行的进程。 基本语法 top [选项] 选项说明 查看的时候&#xff08;大写锁定要开启&#xff09;P就按CPU的使用率来排序&#…

c语言指针和存储值的格式,对地址中数据的读取

数值存储方式 以int型为例&#xff0c;当有四个字节时&#xff0c;位权大的内存地址较高 *(char*)(0x61FE1C))的含义分析&#xff0c;首先将地址做为一个字符变量的首地址&#xff0c;实际也就只有一个字节。最外层的*表示取这个地址下的值 一个实例 # include "stdio.…

致同会计事务所2023实习生招募

审计实习生 【工作职责】 1. 在项目经理或项目高级人员的指导下&#xff0c;完成项目的部分审计工作&#xff1b; 2. 完成工作底稿的编制、整理和归档工作&#xff0c;使其达到相关技术规范要求&#xff1b; 3. 在审计过程中发现问题及时与项目经理或项目高级人员沟通&…

【Python机器学习】PCA降维算法讲解及二维、高维数据可视化降维实战(附源码 超详细)

需要全部代码请点赞关注收藏后评论区留言私信~~~ 维数灾难 维数灾难是指在涉及到向量计算的问题中&#xff0c;当维数增加时&#xff0c;空间的体积增长得很快&#xff0c;使得可用的数据在空间中的分布变得稀疏&#xff0c;向量的计算量呈指数倍增长的一种现象。维数灾难涉及…

基于蒙特卡洛的电动车有序充放电(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️❤️&#x1f4a5;&#x1f4a5;&#x1f4a5; &#x1f4dd;目前更新&#xff1a;&#x1f31f;&#x1f31f;&#x1f31f;电力系统相关知识&#xff0c;期刊论文&…

JAVA类和对象重点笔记及理解(一)

1.类创建对象的详细过程 创建完成&#xff0c;dog就成了一个实例&#xff08;对象&#xff09;&#xff0c;具有属性和方法 Dog类的属性&#xff1a;一般叫做成员变量 Dog类的方法&#xff1a;一般叫做成员方法 类是对象的抽象&#xff0c;对象是类的具体实例。 2.JAVA的数据…

git checkout 命令详解

1. 前言 2. 创建分支 3. 切换分支 4. 撤销更改 1. 前言 git checkout 命令用于创建、切换分支或恢复工作树文件。 最常用的两种用法 # 切换分支git checkout <branch># 创建并切换到新分支git checkout -b <branch> 2. 创建分支 当我们需要以当前分支为起点创建一…

spring @annotation 注解

切入点函数&#xff1a;用于执行切入点函数 1.execution 1.最为重要的切入点函数&#xff0c;功能最全 2.可以执行方法切入点表达式&#xff0c;可以执行类切入点表达式&#xff0c;可以执行包切入点表达式 弊端&#xff1a;书写比较麻烦 2.args 1.作用&#xff1a;主要用…

计算机毕设Python+Vue校园疫情防控系统(程序+LW+部署)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 Ma…

[ 数据结构 -- 手撕排序算法第四篇 ] 选择排序

文章目录前言一、常见的排序算法二、直接选择排序2.1 单趟排序基本思想2.2 优化三、选择排序测试四、选择排序的时间复杂度五、直接选择排序的特性前言 手撕排序算法第四篇&#xff1a;选择排序&#xff01; 从本篇文章开始&#xff0c;我会介绍并分析常见的几种排序&#xff…