MobileNetV1作为CenterNet的Backbone尝试

news2024/11/18 17:41:25

1、CenterNet对于Backbone的要求是:

输入为512*512,输出为:heatmap(128*128*C)、wh(128*128*2)、reg(128*128*2)。

2、原生的MobileNet V1输出:

最后一层通过x.view(x.size(0), -1)和nn.Linear后得到[batch_num * class_num]

3、改造输出使得输出符合业务要求

将之前的x.view(x.size(0), -1)修改为:

x.view(x.shape[0], -1, 128, 128),其中第2个维度为16。

然后通过1*1卷积核进行通道数的升、降维。

网络定义阶段:

self.hm = nn.Conv2d(16, class_num, kernel_size=1)
self.wh = nn.Conv2d(16, 2, kernel_size=1)
self.reg = nn.Conv2d(16, 2, kernel_size=1)

forward阶段:
y = x.view(x.shape[0], -1, 128, 128)
z = {}
z['hm'] = self.hm(y)
z['wh'] = self.wh(y)
z['reg'] = self.reg(y)

4、完整MobileNetv1适配centerNet的代码如下:

import torch
import torch.nn as nn


class BasicConv2dBlock(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, downsample=True, **kwargs):
        super(BasicConv2dBlock, self).__init__()
        stride = 2 if downsample else 1
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride=stride, **kwargs)
        self.bn = nn.BatchNorm2d(out_channels)
        self.relu = nn.ReLU(inplace=True)

    def forward(self, x):
        x = self.conv(x)
        x = self.bn(x)
        x = self.relu(x)
        return x

class DepthSeperabelConv2dBlock(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, **kwargs):
        super(DepthSeperabelConv2dBlock, self).__init__()

        # 深度卷积
        self.depth_wise = nn.Sequential(
            nn.Conv2d(in_channels, in_channels, kernel_size, groups=in_channels, **kwargs),
            nn.BatchNorm2d(in_channels),
            nn.ReLU(inplace=True)
        )

        # 逐点卷积
        self.point_wise = nn.Sequential(
            nn.Conv2d(in_channels, out_channels, 1),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(inplace=True)
        )

    def forward(self, x):
        x = self.depth_wise(x)
        x = self.point_wise(x)
        return x

class MobileNet(nn.Module):
    def __init__(self, heads):
        super(MobileNet, self).__init__()
        class_num = heads['hm']

        self.stem = nn.Sequential(
            BasicConv2dBlock(3, 32, kernel_size=3, padding=1, bias=False),
            DepthSeperabelConv2dBlock(32, 64, kernel_size=3, padding=1, bias=False)
        )

        self.conv1 = nn.Sequential(
            DepthSeperabelConv2dBlock(64, 128, kernel_size=3, stride=2, padding=1, bias=False),
            DepthSeperabelConv2dBlock(128, 128, kernel_size=3, padding=1, bias=False)
        )

        self.conv2 = nn.Sequential(
            DepthSeperabelConv2dBlock(128, 256, kernel_size=3, stride=2, padding=1, bias=False),
            DepthSeperabelConv2dBlock(256, 256, kernel_size=3, padding=1, bias=False)
        )

        self.conv3 = nn.Sequential(
            DepthSeperabelConv2dBlock(256, 512, kernel_size=3, stride=2, padding=1, bias=False),
            DepthSeperabelConv2dBlock(512, 512, kernel_size=3, padding=1, bias=False),
            DepthSeperabelConv2dBlock(512, 512, kernel_size=3, padding=1, bias=False),
            DepthSeperabelConv2dBlock(512, 512, kernel_size=3, padding=1, bias=False),
            DepthSeperabelConv2dBlock(512, 512, kernel_size=3, padding=1, bias=False),
            DepthSeperabelConv2dBlock(512, 512, kernel_size=3, padding=1, bias=False)
        )

        self.conv4 = nn.Sequential(
            DepthSeperabelConv2dBlock(512, 1024, kernel_size=3, stride=2, padding=1, bias=False),
            DepthSeperabelConv2dBlock(1024, 1024, kernel_size=3, padding=1, bias=False)
        )


        self.hm = nn.Conv2d(16, class_num, kernel_size=1)
        self.wh = nn.Conv2d(16, 2, kernel_size=1)
        self.reg = nn.Conv2d(16, 2, kernel_size=1)



    def forward(self, x):
        x = self.stem(x)
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.conv3(x)
        x = self.conv4(x)

        y = x.view(x.shape[0], -1, 128, 128)

        z = {}
        z['hm'] = self.hm(y)
        z['wh'] = self.wh(y)
        z['reg'] = self.reg(y)
        return [z]

def main():
    heads = {'hm': 10, 'wh': 2, 'reg': 2}
    model = MobileNet(heads)

    for _,param in enumerate(model.named_parameters()):
        print(param[0], param[1].shape, param[1].shape.numel())
    param_num = sum(x.numel() for x in model.parameters())
    print('model parameters num:', param_num)

    x = torch.rand([1, 3, 512, 512])
    y = model(x)
    print(y[-1]['hm'].shape)
    print(y[-1]['wh'].shape)
    print(y[-1]['reg'].shape)


if __name__ == '__main__':
    main()

5、与DLASeg的对比

(1)效果:

DLASeg的训练集loss可以降到1.0以下,而MobileNet v1的训练姐loss只能降到3.0左右。

在车牌目标检测的试验中,MobileNet v1最好的效果如下,效果不佳。

(2)性能(CPU下)

DLASeg的模型参数有19655846个,大致为2000W个;而MobileNetv1的模型参数有3213030个,大致为320W个。所以参数量上降了一个数量级。

DLASeg的cpu下一次推理平均需要1.2s左右,而mobilenet v1在未剪枝情况下为232ms,这一块到时提升比较明显。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/82432.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JSP:使用 sitemesh/decorator装饰器装饰jsp页面(原理及详细配置)

摘要:首先这个Decorator解释一下这个单词:“装饰器”,我觉得其实可以这样理解,他就像我们用到的Frame,他把每个页面共有的东西提炼了出来,也可能我们也会用各种各样的include标签,将我们的常用页…

关于使用C语言实现负值和非负值进行左右划分,奇数和偶数进行左右划分

目录 1.负值和非负值左右划分 2.偶数和奇数的划分 数据结构之折半查找(递归和非递归),插值查找和斐波那契查找 归并排序求逆序对(C语言) 1.负值和非负值左右划分 要求:使用尽可能少的时间将一组连续的序…

BlockRender for 3DMAX一键区域渲染插件使用教程

BlockRender一键区域渲染插件,自定义区域渲染并在视口中直接查看结果,并可以自动或手动对渲染的图像进行保存。 这个小插件的亮点就在于它能对渲染的图像进行保存,如果没有保存图像的功能,显然这个插件没有任何存在的意义。有了保…

分布式操作系统 - 6.分布式同步控制

文章目录1.物理时钟同步1.1 时钟同步问题1.2 时钟同步算法1.3 网络时间协议(1)Christian算法(2)考虑的问题(3)Berkeley算法-集中式方法(4)平均值算法-非集中式方法(5&…

python教程十 列表

列表 序列是 Python 中最基本的数据结构。 序列中的每个值都有对应的位置值,称之为索引,第一个索引是 0,第二个索引是 1,依此类推。 Python 有 6 个序列的内置类型,但最常见的是列表和元组。 列表都可以进行的操作…

java基础巩固-宇宙第一AiYWM:为了维持生计,四大基础之OS_Part_3_Linux整起(Linux常见命令操作、Shell)

OS的一些基本概念简介,在下面两篇中已经介绍了一些: OS_Part_1整起(进程线程协程并发并行、进程线程切换进程间通信、死锁\进程调度策略、分段分页、交换空间、OS三大调度机制)OS_Part_2整起~IO们那些事【包括五种IO模型&#xf…

爬虫内容学习-工具类---xpath-1

爬虫学习建议: 在编写python爬虫程序时,只需要做以下两件事: 发送GET请求,获取HTML [第一类]解析HTML,获取数据 [第二类] 这两件事,python都有相应的库帮你去做,你只需要知道如何…

ubuntu20.04 搭建kernel调试环境第四篇--图形化调试kernel

一、安装eclipse 1)官网下载对应的版本(eclipse-inst-jre-linux64.tar.gz) Eclipse Packages | The Eclipse Foundation - home to a global community, the Eclipse IDE, Jakarta EE and over 350 open source projects... 2)…

群集【LNMP+SSL+nfs+负载均衡及高可用】

目录 🦐web1部署 🍁创建证书 🍁创建论坛 🦐mysql部署 🦐php部署 🦐nfs部署 🍁创建共享目录 🍁挂载目录 🦐LNMP测试 🦐web2部署 🦐lb1部署 &#x…

资料:成为全栈dApp开发者的学习计划

资料:成为全栈dApp开发者的学习计划 本篇介绍与区块链和去中心化应用程序有关的一切。 前提条件 任何面向对象编程语言的基础知识。Node.js和Npm。前端基础知识。如果你有兴趣做一个全栈的去中心化应用,而不仅仅是智能合约。 流程 去中心化技术和区块…

Mybatis:Mybatis动态SQL(8)

动态SQL1. 动态sql简介2. if3. where4. trim5. choose、when、otherwise6. foreachforeach实现批量添加foreach实现批量删除7. SQL片段8. 总结1. 动态sql简介 Mybatis框架的动态SQL技术是一种根据特定条件动态拼装SQL语句的功能,它存在的意义是为了解决拼接SQL语句…

CAS介绍

CAS介绍一、什么是CAS二、CAS是怎么实现的三、CAS应用场景3.1 实现原子类3.2 实现自旋锁四、CAS的 ABA问题4.1 什么是ABA问题4.2 ABA问题引来的bug4.3 解决方案一、什么是CAS CAS:全称Compare and swap,字面意思:“比较并交换”。一个 CAS 涉…

基于Oracle数据库的学生信息管理系统的设计与开发(JSP)

目 录 1 引言 1 1.1 课题来源及意义 1 1.2 研究内容与目标 1 1.3 本文的内容结构 2 1.4 本章小结 3 2 需求分析 4 2.1 系统功能需求 4 2.2 系统的性能需求 4 2.3 系统数据要求 5 2.4…

Linux恶意攻击自查方案

用户及用户文件检查 (1)passwd文件 文件权限 /etc/passwd默认权限为644,其最小权限为444,首先应对该文件权限进行检查,以确认配置是否正确: ls -l /etc/passwd 用户检查 查看passwd文件内容&#xff…

浅谈电缆行业MES系统解决方案

电缆行业虽然只是一个配套行业,却占据着中国电工行业1/4的产值。它产品种类众多,应用范围十分广泛,涉及到电力、建筑、通信、制造等行业,与国民经济的各个部门都密切相关。电缆还被称为国民经济的“动脉”与“神经”,是…

Guice + Jersey + Jetty 框架 - 学习笔记

因项目使用 Guice Jersey Jetty 框架,所有进行了学习,下面是学习笔记。 目录 一、Guice 1. 依赖注入方式: Inject 2. 依赖绑定(依赖注册): bind() 3. 作用域 4. 基本使用 二、Jersey 使用内置容器为例(使用J…

[附源码]Python计算机毕业设计单位库房管理系统Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

老公下班要跟我学测试,35岁3娃全职宝妈的逆袭之路

马上35了,当了5年全职宝妈,看起来我应该是幸福的,公婆一直在帮忙带娃,老公也舍得给我花钱,愿意把钱全都交给我,在家里不用做饭,家务有人帮把手,主要就是带娃。我应该是幸福的&#x…

说说真实Java项目的开发流程,以及面试前的项目准备说辞

介绍项目是必不可少的Java面试环节,求职者需要借此证明自己真实Java项目的经验,如果再做的好的话,需要借此展开自己的亮点说辞。 不过之前如果只有学习项目经验,比如是自己跑通一个项目,或者是在培训班里通过一个Sprin…

Centos7:Postgresql 14安装

文章目录安装Server配置数据目录创建数据存储目录配置环境变量,数据目录Reload systemd初始化DB启动数据库安装模块包postgresql14-contribpostgresql14-devel安装Server sudo yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64…