PicoDet代码学习记录

PicoDet代码学习记录

news2025/7/12 10:39:44

推理步骤

[picodet_s_320_coco.yml]

Infer.py main()->run()
Trainer.py __init__() self.model = create(cfg.architecture)
1. Picodet.py from_config()->__init__()
  1. head = create(cfg['head'], **kwargs)时候调用：
    1. Layers.py MultiClassNMS __init__()
  2. Pico_head.py PicoHead __init__()
Trainer.py predict()
1. 逐个data，outs = self.model(dat
2. Picodet.py get_pred()->_forward()
  1. Inputs [1,3,320,320]

Backbone output

Neck output

Head output Pico_head.py forward()

post_process output

调用gfl_head.py post_process()

->decode()：patch中逐图像处理，图像中逐个feature map处理

->get_bboxes_single()

->get_single_level_center_point：

bbox_pred的[1,x,y,32]：reg_max==8

x = F.softmax(x.reshape([-1, self.reg_max + 1]), axis=1)

x = F.linear(x, self.project).reshape([-1, 4])

再乘以stride

根据当前feature map的stride调整点坐标

找到cls_score的前nms_pre的值，

->bbox_utils.py distance2bbox 根据points的[x，y]和distance的(left, top, right, bottom)，结合图像尺寸[320,320]，获取bounding box的左上和右下坐标[x1,y1,x2,y2]

Mlvl_bboxes坐标根据原图resize的scale映射回原图

->nums()：

->layers.py MultiClassNMS __call__()

->ops.py multiclass_nums()

筛选score大于阈值score_threshold的bbox
选择前nms_top_k的bbox
基于nms_threshold和nms_eta的自适应阈值NMS过滤IOU高的框
保留前keep_top_k的bbox

Coco_utils.py get_infer_results
1. json_results.py get_det_res 转变数据类型，保存bbox和score
2. visualizer.py visualize_results 在原图上根据bbox绘制框
  1. visualizer.py draw_bbox 小于阈值不绘制
3. visualizer.py save_result 结果保存txt

二、模型分析

backbone

基于ShuffleNetV2，根据PP-LCNet进行优化，称为ESNet(Enhanced ShuffleNet)

改变1：给每个块增加SE，SE的两层激活分别是ReLU和H-Sigmoid
改变2：stride为2时，添加depthwise卷积和pointwise卷积整合通道信息
改变3：stride为1时，添加Ghost模块

改变4：channel-wise search for detection backbone，full model[128,256,512], ratio[[0.5, 0.675, 0.75, 0.875, 1]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/84253.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Django（一）

Django（一）

一、Django介绍 1、python语言编写的开源web框架 2、重量级python web框架，配备了常用的大部分组件 3、组件： ※基本配置文件/路由系统 ※模型层（M）/模板层（T）/视图层（V） ※co…

阅读更多...

Cadence创建插件焊盘（超详细）

Cadence创建插件焊盘（超详细）

背景：Cadence画封装，在我看来，操作是比较不方便的事儿，所以在此在记录一遍。要画一个插件封装，需要调用画好的焊盘（AD里直接设置即可），另外放置好pin的位置和绘制好边框。包括遇到的…

阅读更多...

SpringBoot集成阿里EasyExcel导出excel高级实战

SpringBoot集成阿里EasyExcel导出excel高级实战

目录参考一、引入包二、导出到文件并输出到后台三、过滤字段方式1：类上加注解 ExcelIgnoreUnannotated，过滤属性没有ExcelProperty注解的字段方式2：指定字段加注解方式3：代码指定过滤字段, 同一个excel生成两个sheet分别过滤不同字…

阅读更多...

clickhouse集群搭建

clickhouse集群搭建

一、clickhouse单机部署 clickhouse镜像下载地址 https://mirrors.tuna.tsinghua.edu.cn/clickhouse/ 1、关闭防火墙 #查看防火墙状态systemctl status firewalld#关闭防火墙systemctl stop firewalld#设置防火墙服务开机不自启systemctl disable firewalld#再次查看防火墙检…

阅读更多...

开源软件如何使企业和业务受益

开源软件如何使企业和业务受益

在当今技术驱动、快速发展的商业环境中，越来越多的公司选择投资开源软件。开源为企业提供了许多优势：更快的创新步伐、来自庞大而热情的社区的强大支持以及不受供应商锁定的影响。对于许多人来说，开源不仅仅是编码。它代表了一种生活方式。…

阅读更多...

使用IDEA工具，通过Java API 操作 HDFS （文件/目录的操作，含源码，详细操作步骤）

使用IDEA工具，通过Java API 操作 HDFS （文件/目录的操作，含源码，详细操作步骤）

文章目录一，了解 HDFS Java API（一）HDFS常见类与接口（二）FileSystem的常用方法二，编写Java程序访问HDFS01 创建Maven项目02 添加相关依赖03 创建日志属性文件（1）在resources目录里创…

阅读更多...

2022年还剩半个月，我从外包公司离职了...

2022年还剩半个月，我从外包公司离职了...

今天是12.12，距离元旦也仅剩半个月，大家都在考论假期怎么过，没错，我离职了... 19年大专毕业通过校招进入了一家外包公司，干了接近3年的功能测试，今年年初，感觉自己不能够在这样下去了&#xff…

阅读更多...

MyBatis 注解开发

MyBatis 注解开发

文章目录一、单表查询1. Select 注解2. Insert 注解3. Update 注解4. Delete 注解5. Param 注解二、多表关联查询1. 一对一查询2. 一对多查询3. 多对多查询一、单表查询 1. Select 注解前面的章节介绍了 MyBatis 的基本用法、关联映射、动态 SQL 和缓存机制等知识&#xff0…

阅读更多...

[附源码]计算机毕业设计房屋租赁系统Springboot程序

[附源码]计算机毕业设计房屋租赁系统Springboot程序

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： Springboot mybatis MavenVue等等组成，B/S模式…

阅读更多...

算法竞赛入门【码蹄集进阶塔335题】(MT2201-2225）

算法竞赛入门【码蹄集进阶塔335题】(MT2201-2225）

算法竞赛入门【码蹄集进阶塔335题】(MT2201-2225） 文章目录算法竞赛入门【码蹄集进阶塔335题】(MT2201-2225）前言为什么突然想学算法了？为什么选择码蹄集作为刷题软件？目录1. MT2201 字符串转换2. MT2202 Summer Pockets3. MT2203…

阅读更多...

alsa框架与音频芯片移植基础

alsa框架与音频芯片移植基础

ALSA音频框架 Alsa是Advanced Linux Sound Architecture的缩写，即高级Linux声音架构，在Linux操作系统上提供了对音频和MIDI的支持。在Linux 2.6的内核版本后，Alsa目前已经成为了linux的主流音频体系结构。除了 alsa-driver，ALS…

阅读更多...

CSS -- 使用纯CSS绘制三角形及常见案例汇总

CSS -- 使用纯CSS绘制三角形及常见案例汇总

文章目录1. 绘制原理2. 绘制最简单的三角形3. 绘制对话框4. 绘制两条直角边不等长的三角形1. 绘制原理网页中常见一些三角形，使用 CSS 直接画出来就可以，不必做成图片或者字体图标给每个边框不同的颜色可以看到，每个边框其实都是一个小三…

阅读更多...

测试（缺陷管理）

测试（缺陷管理）

目录 1.缺陷管理理论 1.1.定义 1.2缺陷的名称 1.3.产生缺陷的原因 1.4.缺陷管理流程 1.5.缺陷管理生命周期与状态 2.如何提交缺陷 2.1.提交的Bug的目的 2.2.提交Bug的注意事项 2.3.提交Bug报告应遵循的原则 2.4.Bug报告需包含哪些内容 1.缺陷管理理论 1.1.定义软件…

阅读更多...

rust编程-rust所有权理解（chapter 4.3 Slice切片类型）

rust编程-rust所有权理解（chapter 4.3 Slice切片类型）

目录 3. 切片（Slice）类型 3.1 String slice(字符串切片) 3.2 其它切片 3. 切片（Slice）类型切片可以用来获取一个集合中连续的元素序列，且切片是一种引用类型，因此不具有所有权。如下是一个小的编程示…

阅读更多...

day17_面向对象的三大特征之一（多态）

day17_面向对象的三大特征之一（多态）

概述多态是继封装、继承之后，面向对象的第三大特性。生活中，比如求面积的功能，圆、矩形、三角形实现起来是不一样的。跑的动作，小猫、小狗和大象，跑起来是不一样的。再比如飞的动作，昆虫、鸟类和飞机&a…

阅读更多...

【数字IC设计】Design Compiler入门

【数字IC设计】Design Compiler入门

本博客参考自文章链接本文以全加器为例，演示DC综合的流程。设计文件如下： module full_adder( input clk, input rstn, input [31:0] a_in, input [31:0] b_in, input c_in, output reg [31:0] sum_out, output reg c_out ); wire c_out_w; wire [31:0…

阅读更多...

[vue学习笔记]数组+事件+v-model的使用

[vue学习笔记]数组+事件+v-model的使用

1.关于数组的使用以及常见的函数 （1）在队尾操作函数：push（）：追加，pop（）：删除 arr.push(9,8,7,6); 这种批量追加的方式也是被允许的 （2&#xf…

阅读更多...

Gem5模拟器，关于Adding parameters to SimObjects and more events的一些问题记录（六）

Gem5模拟器，关于Adding parameters to SimObjects and more events的一些问题记录（六）

目录 （1）为什么Gem是Python和C混合使用编程？ （2）关于析构函数创建类的时候一般都需要写上析构函数吗？ （3）关于HelloObject和GoodbyeObject的先后后创建关系 （1&…

阅读更多...

C# 类字段方法

C# 类字段方法

一现实中的实物抽象为类类(class)最基本的要素是 ① 字段(field):变量； ② 方法(method):函数； class Person {public string name;public int age;public void SayHello(){Console.WriteLine("Hello!My name is"name);}public string Ge…

阅读更多...

（Python）第2章-12 输出三角形面积和周长 (15 分)

（Python）第2章-12 输出三角形面积和周长 (15 分)

Python解决输入三条边输出面积与周长1.问题2.解决思路代码在孤单的日子里，你单枪匹马奋斗的样子酷毙了。江客：时荒![在这里插入图片描述](https://img-blog.csdnimg.cn/85fc4495dcfc4578a8612a432d8045cd.png#pic_center)1.问题本题要求编写程序&#…

阅读更多...

推荐文章

最新文章