3D点云目标检测：VoxelNex解读

3D点云目标检测：VoxelNex解读

news2025/4/28 15:24:11

VoxelNext

通用检测器 vs VoxelNext
一、3D稀疏卷积模块
- 1.1、额外的两次下采样
- - 消融实验结果
  - 代码
- 1.2、稀疏体素删减
- - 消融实验：
  - 代码
二、稀疏体素高度压缩
- 代码
三、稀疏预测head

通用检测器 vs VoxelNext

一、3D稀疏卷积模块

1.1、额外的两次下采样

使用通用的3D sparse conv，包含4个stage，每个stage穿插常规稀疏卷积和子流形稀疏卷积，得到的特征分别为F1、F2、F3、F4。

VoxelNext的backbone在原有的基础上再增加两次下采样，分别得到F5，F6，目的是增大感受野

消融实验结果

从实验结果来看，直接使用原始的4stage结构接检测头后精度下降8.9，多加两次下采样后精度提升9.5。且从可视化效果来看额外的下采样使感受野确实增大了。

代码

1.2、稀疏体素删减

在backbone的第2个stage开头会有一个下采样，Voxelnext在下采样的时候计算体素的重要性，根据比例删掉不重要的体素。

重要性判断公式：直接计算体素所有通道特征的均值，然后经过一个sigmoid，输出的sorce作为重要程度。

消融实验：

前三次下采样使用删减策略，且删减比例为0.5.

代码

DynamicFocalPruningDownsample实现在pruning_block.py中。

二、稀疏体素高度压缩

进入检测head前，直接将F4、F5、F6体素压缩合并。

计算公式：

代码

三、稀疏预测head

与常规的3D目标检测head不同，Voxelnext直接使用稀疏的体素进行预测，训练的时候，靠近GT中心点的体素作为正样本，使用focal loss监督，可视化和统计发现，用来预测box的voxel不一定在box中心点，如下图

统计发现有72.8%的box的query voxel都不在中心点。

推理时使用sparse max pooling 代替NMS，具体过程是先对稀疏的Voxel预测一个score，再使用稀疏卷积的操作做max pooling，只保留max pool kernel里得分最高的voxel。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1274053.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

2023年亚太杯数学建模C题新能源汽车（思路模型代码）

2023年亚太杯数学建模C题新能源汽车（思路模型代码）

一、翻译新能源汽车是指采用先进的技术原理、新技术和新结构，以非常规车用燃料（非常规车用燃料是指汽油和柴油以外的燃料(非常规车用燃料是指汽油和柴油以外的燃料），并集成了汽车动力控制和驱动等先进技术的汽车。新能源汽车包括…

阅读更多...

Gitee 之初体验（上）

Gitee 之初体验（上）

我们在项目开发或者自己学习的时候，总会存在这样的问题： 在一台电脑上编写完代码，想要再另外一台电脑上再去写，再或者和其他人一起协作等等场合，代码传来传去很麻烦。这个时候，我们就可以去使用代码管理工…

阅读更多...

在java java.util.Date 已知逝去时间怎么求年月日数学计算不用其他方法

在java java.util.Date 已知逝去时间怎么求年月日数学计算不用其他方法

在Java中，使用java.util.Date类已知逝去时间求年月日的方法如下： 首先，获取当前时间和逝去时间之间的毫秒数差值，可以使用Date类的getTime()方法获得时间戳。将毫秒数转换为秒数，并计算出总共的天数。根据总共的天…

阅读更多...

计算机网络：应用层（上篇）

计算机网络：应用层（上篇）

文章目录前言一、应用层协议原理1.网络应用的体系结构2.进程通信二、Web与HTTP1.HTTP概况2.HTTP连接3.HTTP请求报文4.用户-服务器状态：cookies5.Web缓存（代理服务器） 三、FTP：文件传输协议1.FTP：控制连接与数据连接分…

阅读更多...

ClassNotFoundException: org.apache.hive.spark.client.Job

ClassNotFoundException: org.apache.hive.spark.client.Job

hive使用的是3.13版本，spark是3.3.3支持hadoop3.x hive将engine从mr改成spark，通过beeline执行insert、delete时一直报错，sparkTask rpc关闭， 查看yarn是出现ClassNotFoundException: org.apache.hive.spark.client.Job。开始…

阅读更多...

怎么一键批量转换PDF/图片为Excel、Word，从而提高工作效率？

怎么一键批量转换PDF/图片为Excel、Word，从而提高工作效率？

在处理大量PDF、图片文件时，我们往往需要将这些文件转换成Word或Excel格式以方便编辑和统计分析。此时，金鸣表格文字识别大师这款工具可以发挥巨大作用。下面，我们就来探讨如何使用它进行批量转换，以实现高效处理。一、准备工作…

阅读更多...

linux服务器环境搭建（使用yum 安装mysql、jdk、redis）

linux服务器环境搭建（使用yum 安装mysql、jdk、redis）

一：yum的安装 1：下载yum安装包并解压 wget http://yum.baseurl.org/download/3.2/yum-3.2.28.tar.gz tar xvf yum-3.2.28.tar.gz 2.进入yum-3.2.28文件夹中进行安装，执行安装指令 cd yum-3.2.28 sudo apt install yum 3.更新版本 yum check-update yum update yum cle…

阅读更多...

（一）C语言概述

（一）C语言概述

文章目录一、C语言1、计算机结构组成二、第一个C语言程序：hello world1、编写C语言代码：hello.c2、通过gcc编译C代码（1）gcc编译器介绍（2）Window平台中gcc环境配置 3、代码分析（1）#…

阅读更多...

基础课14——语音识别

ASR 是自动语音识别（Automatic Speech Recognition）的缩写，是一种将人类语音转换为文本的技术。ASR 系统可以处理实时音频流或已录制的音频文件，并将其转换为文本。它是一种自然语言处理技术，广泛应用于许多领域&#…

阅读更多...

C++ ：运算符重载

C++ ：运算符重载

运算符重载： 运算符重载概念：对已有的运算符重新进行定义，赋予其另一种功能，以适应不同的数据类型运算符的重载实际是一种特殊的函数重载，必须定义一个函数，并告诉C编译器，当遇到该重载的运算符…

阅读更多...

每日一练2023.11.30——验证身份【PTA】

每日一练2023.11.30——验证身份【PTA】

题目链接 ：验证身份题目要求： 一个合法的身份证号码由17位地区、日期编号和顺序编号加1位校验码组成。校验码的计算规则如下： 首先对前17位数字加权求和，权重分配为：{7，9，10，5&a…

阅读更多...

万界星空科技/仓库管理WMS系统/免费仓库管理系统

万界星空科技/仓库管理WMS系统/免费仓库管理系统

仓库管理（仓储管理），指对仓库及仓库内部的物资进行收发、结存等有效控制和管理，确保仓储货物的完好无损，保证生产经营活动的正常进行，在此基础上对货物进行分类记录，通过报表分析展示仓库状态、…

阅读更多...

HarmonyOS4.0 ArkUI组件

HarmonyOS4.0 ArkUI组件

目录简介搭建开发环境 ArkUI基础组件 Image组件 Text组件 TextInput Button Slider 简介 HarmonyOS 4.0的ArkUI组件是一套UI开发框架，提供开发者进行应用UI开发时所必须的能力。在ArkUI中，组件是界面搭建与显示的最小单位，开发者通过…

阅读更多...

传统算法：使用 Pygame 实现线性查找

传统算法：使用 Pygame 实现线性查找

使用 Pygame 模块实现了线性查找的动画演示。首先，它生成一个包含随机整数的数组，并通过 Pygame 在屏幕上绘制这个数组的条形图。接着，通过线性查找算法对数组进行查找，动画效果可视化每一步的变化。在查找的过程中，程序逐个遍历数组元素，如果找到目标值，将相应的元素高…

阅读更多...

java-Swing界面简析

java-Swing界面简析

一、简析： 调用java提供的 java.swing包下的各种类可以实现界面中的各种组件(比如输入框、密码框按钮、单选框、复选框等) 二、java.swing包的关键类： 顶层容器：Jframe(窗口) 中间容器：Jpanel(面板) 基本控件： I…

阅读更多...

java开发之个微群聊自动添加好友

java开发之个微群聊自动添加好友

请求URL： http://域名/addRoomMemberFriend 请求方式： POST 请求头Headers： Content-Type：application/jsonAuthorization：login接口返回参数： 参数名必选类型说明wId是String登录实例标识chatRoom…

阅读更多...

【数据分析 | Numpy】Numpy模块系列指南（一），从设计架构说起

【数据分析 | Numpy】Numpy模块系列指南（一），从设计架构说起

🤵‍♂️ 个人主页: AI_magician 📡主页地址： 作者简介：CSDN内容合伙人，全栈领域优质创作者。 👨‍💻景愿：旨在于能和更多的热爱计算机的伙伴一起成长！！&…

阅读更多...

Springboot快速整合kafka

Springboot快速整合kafka

kafka的基本了解 kafka也是目前常用的消息中间件,支持同步与异步通信,和rabbitmq一样,工作模式大概相同,并且被spingboot整合的后的都是中间件Template的实列化客户端类 ,消费者监听注解为KafkaListener,和RabbitListener和很相似,这些消息中间件使用过后,发现大致都是相同的…

阅读更多...

【Node.js】解决npm报错：RequestError: unable to verify the first certificate

【Node.js】解决npm报错：RequestError: unable to verify the first certificate

1. 问题简述帖主从nodejs官网下载安装nodejs后，发现使用以下命令安装electron会报错： npm install electron 报错信息如下： npm ERR! RequestError: unable to verify the first certificate 2. 解决方案网上列举的方案，无…

阅读更多...

【刷题笔记】串联所有单词的子串||暴力通过||滑动窗口

【刷题笔记】串联所有单词的子串||暴力通过||滑动窗口

串联所有单词的子串 1 题目描述 https://leetcode.cn/problems/substring-with-concatenation-of-all-words/ 给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串长度相同。 s 中的串联子串是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。 …

阅读更多...

推荐文章

最新文章