⌈ 传知代码 ⌋ 使用稀疏查询进行3D目标检测

news2024/9/23 17:48:33

💛前情提要💛

本文是传知代码平台中的相关前沿知识与技术的分享~

接下来我们即将进入一个全新的空间,对技术有一个全新的视角~

本文所涉及所有资源均在传知代码平台可获取

以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦!!!

以下内容干货满满,跟上步伐吧~


📌导航小助手📌

  • 💡本章重点
  • 🍞一. 概述
  • 🍞二. 方法
  • 🍞三.演示效果
  • 🍞四.核心逻辑
  • 🫓总结


💡本章重点

  • 使用稀疏查询进行3D目标检测

🍞一. 概述

在这里插入图片描述
SparseBEV是一个基于查询的单阶段检测器,具有L个解码器层。SparseBEV首先使用图像主干和FPN结构逐帧处理输入的多摄像机视频。之后,在BEV空间中初始化一组稀疏支柱查询,并通过自适应自注意力进行聚合。这些查询通过自适应时空采样和自适应混合与图像特征交互,以进行3D目标检测。


🍞二. 方法

尺度自适应自我注意力机制

基于密集BEV的方法通常使用BEV编码器来对多尺度BEV特征进行编码,然而,由于SparseBEV没有明确的构建BEV特征,如何在BEV空间中聚合多尺度特征仍然是一个挑战。

在这项工作中,SparseBEV认为自注意可以发挥BEV编码器的作用,因为查询是在BEV空间中定义的。因此,SparseBEV提出了尺度自适应自注意(SASA),它在查询的指导下学习适当的感受域。

在这里插入图片描述
 注意力机制不仅考虑查询特征之间的相似性,还考虑它们之间的距离,公式如下:

在这里插入图片描述
自适应时空采样

对于每一帧,SparseBEV使用线性层从查询特征自适应地生成一组采样偏移量,这些偏移被转换为基于查询支柱的3D采样点。

在这里插入图片描述
与BEVFormer的可变形注意力相比,SparseBEV的采样点对查询柱和查询特征都具有自适应性,从而更好地覆盖不同大小的对象。此外,这些点不限于查询,因为SparseBEV不限制采样偏移的范围。

接下来,SparseBEV根据运动扭曲采样点来执行时间对齐。在自动驾驶中,有两种运动,一种是自我运动,一种是对象运动。自车运动描述汽车在环境中行驶时从自身角度的运动,而对象运动是指环境中其他物体在自动驾驶汽车周围移动时的运动。

处理对象运动

在自动驾驶中,瞬时速度可以等于短时间窗口内的平均速度,因此,SparseBEV使用查询中的速度矢量,自适应地将采样点扭曲到以前的时间戳。

在这里插入图片描述
处理自车运动

接下来,我们SparseBEV数据集提供的自我姿态对采样点进行扭曲。首先将点变换到全局坐标系,然后变换到帧t的局部坐标系。

在这里插入图片描述


🍞三.演示效果

在这里插入图片描述
在这里插入图片描述


🍞四.核心逻辑

前向过程

    def forward(self, mlvl_feats,img_metas):
        # 类似于DAB-DETR,其中查询被显式表示为最终的结果,所以可以直接进行细化处理,采用同样的操作,所以属于静态
        query_bbox = self.init_query_bbox.weight.clone()  # [Q, 10] 
        #query_bbox[..., :3] = query_bbox[..., :3].sigmoid()
        
        # query denoising
        B = mlvl_feats[0].shape[0] 
        # BEV中都是在头部就使用了prepare_dn的形式,头部就完成了所有的事情,包括预测的结果,query其中是包含噪声的情况
        query_bbox, query_feat, attn_mask, mask_dict = self.prepare_for_dn_input(B, query_bbox, self.label_enc, img_metas)
        
        cls_scores, bbox_preds = self.transformer(
                query_bbox,
                query_feat,
                mlvl_feats,
                attn_mask=attn_mask,
                img_metas=img_metas,
            )
        # 将边界框重新转换为现实坐标中
        bbox_preds[..., 0] = bbox_preds[..., 0] * (self.pc_range[3] - self.pc_range[0]) + self.pc_range[0]
        bbox_preds[..., 1] = bbox_preds[..., 1] * (self.pc_range[4] - self.pc_range[1]) + self.pc_range[1]
        bbox_preds[..., 2] = bbox_preds[..., 2] * (self.pc_range[5] - self.pc_range[2]) + self.pc_range[2]

        bbox_preds = torch.cat([
            bbox_preds[..., 0:2],
            bbox_preds[..., 3:5],
            bbox_preds[..., 2:3],
            bbox_preds[..., 5:10],
        ], dim=-1)  # [cx, cy, w, l, cz, h, sin, cos, vx, vy]
        # 如果采用了denoise的形式,这是一步重构策略比较重要,
        
        if mask_dict is not None and mask_dict['pad_size'] > 0:  # if using query denoising
            # 此时获得的是denoise后的结果
            output_known_cls_scores = cls_scores[:, :, :mask_dict['pad_size'], :]
            output_known_bbox_preds = bbox_preds[:, :, :mask_dict['pad_size'], :]
            # 此时是需要进行match的情况
            output_cls_scores = cls_scores[:, :, mask_dict['pad_size']:, :]
            output_bbox_preds = bbox_preds[:, :, mask_dict['pad_size']:, :]
            # 此时是输出的结果,但输出的结果不一定需要完全正确,真值是没有output的形式
            mask_dict['output_known_lbs_bboxes'] = (output_known_cls_scores, output_known_bbox_preds)
            # 将其进行修改,其中all_cls_scores只保存match的query的形式
            outs = {
                'all_cls_scores': output_cls_scores,
                'all_bbox_preds': output_bbox_preds,
                'enc_cls_scores': None,
                'enc_bbox_preds': None, 
                'dn_mask_dict': mask_dict,
            }
        else:
            outs = {
                'all_cls_scores': cls_scores,
                'all_bbox_preds': bbox_preds,
                'enc_cls_scores': None,
                'enc_bbox_preds': None, 
            }

        return outs

部署方式

# Install PyTorch 2.0 + CUDA 11.8
conda create -n sparsebev python=3.8
conda activate sparsebev
conda install pytorch==2.0.0 torchvision==0.15.0 pytorch-cuda=11.8 -c pytorch -c nvidia
# PyTorch 1.10.2 + CUDA 10.2 for older GPUs
conda create -n sparsebev python=3.8
conda activate sparsebev
conda install pytorch==1.10.2 torchvision==0.11.3 cudatoolkit=10.2 -c pytorch

# Install other dependencies:
pip install openmim
mim install mmcv-full==1.6.0
mim install mmdet==2.28.2
mim install mmsegmentation==0.30.0
mim install mmdet3d==1.0.0rc6
pip install setuptools==59.5.0
pip install numpy==1.23.5


# Install turbojpeg and pillow-simd to speed up data loading (optional but important):

sudo apt-get update
sudo apt-get install -y libturbojpeg
pip install pyturbojpeg
pip uninstall pillow
pip install pillow-simd==9.0.0.post1
pip install numpy==1.23.5
pip install fvcore
pip install einops


# Compile CUDA extensions:


cd models/csrc
python setup.py build_ext --inplace

🫓总结

综上,我们基本了解了“一项全新的技术啦” 🍭 ~~

恭喜你的内功又双叒叕得到了提高!!!

感谢你们的阅读😆

后续还会继续更新💓,欢迎持续关注📌哟~

💫如果有错误❌,欢迎指正呀💫

✨如果觉得收获满满,可以点点赞👍支持一下哟~✨

【传知科技 – 了解更多新知识】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1964148.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux基础知识之Shell命令行及终端中的快捷键

1.察看历史命令快捷键 按键 操作 ctrl p 返回上一次输入命令字符 ctrl n 返回下一次输入命令字符 ctrl r 输入单词甚至词组搜索匹配历史命令 alt p 输入字符查找与字符相接近的历史命令 alt . 向之前执行的命令的最后一个参数轮循, 并将之添加到当前光标之后…

WPF数据绑定对象Binding中的辅助属性

以下案例使用的统一的数据源: public class Data{public string Value { get; set; } "123";public int IntValue { get; set; } 100;public float FloatValue { get; set; } 0.114f;public DateTime DateTimeValue { get; set; } DateTime.Now;publi…

《品牌与观察》深度剖析:格行如何成为随身WiFi行业标杆?如何成为排名第一名随身WiFi?央视推荐的随身WiFi!官方认证的随身WiFi!

在随身WiFi行业乱象频发的背景下,格行以一股清流之姿,毅然决然地选择了一条“难而正确”的道路——大力发展线下门店,发展续航技术以品质和服务重塑市场格局。格行现已宣布其线下合作门店已突破万家,并且续航技术已经遥遥领先于其…

计算机毕业设计选题推荐-医疗废物管理系统-Java/Python项目实战

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

思科认证有哪些?有什么区别?选哪个比较好?考试多少钱?

思科认证体系庞大且全面,涵盖了从基础到高级的多个方向和等级。那么,思科认证究竟有哪些?有什么区别?选哪个比较好?考试多少钱?下面将为您一一揭晓。 思科认证有哪些? 思科认证体系丰富多样,涵盖了从基础到高级的多个层次和…

AI助力工艺|利用机器学习实现泡沫浮选工艺优化

浮选是一种矿物处理过程,它利用矿物颗粒的自然疏水性或通过添加化学试剂使其变得疏水,从而使它们能够附着在空气泡上,从矿浆中分离出来。在处理铁矿石时,浮选过程特别重要,因为它可以帮助减少二氧化硅(SiO2…

【数据结构】——堆的实现与算法

目录 一、堆的实现 1.1堆数据的插入 1.2堆数据的删除 二、建堆算法 2.1向上调整建堆 2.2向下调整建堆 三、堆的应用 3.1堆排序 3.2Top—K问题 一、堆的实现 1.1堆数据的插入 插入一个数据后不再是小堆需要将新数据调整到合适的位置,所以堆的插入就是在数组…

永结无间Ⅷ--释放机器学习“百万专家组合”的力量

介绍 随着人们对特定领域模型和小型语言模型的兴趣日益浓厚,对于能够利用专门数据有效处理特定领域中大量专门任务请求的模型的需求比以往任何时候都更加迫切。 传统模型往往难以实现可扩展性和适应性,因此研究人员开始探索新的创新方法。DeepMind的“…

【课程系列10】某乎AI大模型全栈工程师-第5期

网盘链接 链接:https://pan.baidu.com/s/1ZC-fOC_QQjNM6wyVjQcYOg --来自百度网盘超级会员v6的分享 课程目标 ✅学大模型来干什么?: 👉想提升薪资,提升效率 👉想私有化部署垂直领域大模型 &#x1f449…

误删文件怎么恢复?电脑误删文件恢复,5个方法深度解析(超实用)

在日常使用电脑的过程中,相信很多小伙伴们都曾经遇到过一个普遍又棘手的问题——误删文件。无论是因为手快便捷还是不慎操作,误删文件似乎总是那么糟心,让人十分困扰。然而,当我们面对这一问题时,我们并不必过分担心。…

mysql+php+html实现学生管理系统

mysqlphphtml实现学生管理系统 前言 本文使用Mysqlphphtml实现一个简单的学生管理系统,实现了登陆,注册,总览学生信息,添加学生,查询特定的学生,删除指定的学生等功能。并且本文仅用来学习就够了&#xf…

大数据——Hive原理

摘要 Apache Hive 是一个基于 Hadoop 分布式文件系统 (HDFS) 的数据仓库软件项目,专为存储和处理大规模数据集而设计。它提供类似 SQL 的查询语言 HiveQL,使用户能够轻松编写复杂的查询和分析任务,而无需深入了解 Hadoop 的底层实现。 Hive…

【pikachu】文件上传漏洞 第三关getimagesize

思路:上传图片马,利用同服务器下的文件包含漏洞解析图片马 对文件后缀名进行白名单检验 对上传包进行修改: 图片后缀图片MIMEGIF89a一句话木马 上传成功 但是图片无法当作php解析 来到文件包含漏洞页面,尝试将刚才上传的图片马…

32--新建工程

一、keil编译完成之后,下载时弹出unknown target connected错误提示 调一下下面: 二、点亮 1:配置RCC,使能,时钟 2:GPIOC高寄存器 3:给端口数据 三、ST-LINK USB communication error 非常有…

uniapp中实现语音识别(app+小程序)

一.app版本需要先去百度智能云申请 注意填写完&#xff0c;需要打包成自定义基座或者安装rpk包&#xff0c;本地是无效的封装recording-popup.vue组件 <template><up-popup round"16" closeable :show"recordShow" :close-on-click-overlay&qu…

计算机网络—电路、分组、报文交换—图文详解

计算机网络—电路、分组、报文交换 计算机网络中的数据传输方式可以根据数据的处理方式和网络资源的使用方式分为电路交换、分组交换和报文交换三种类型。 这些方式在网络设计和数据传输过程中起到了不同的作用和效果。 1. 电路交换&#xff08;Circuit Switching&#xff0…

数字中国:智能交通的未来发展方向

随着数字中国的不断推进&#xff0c;智能交通作为数字化时代的一个重要领域&#xff0c;正面临着前所未有的机遇和挑战。人工智能、大数据应用和物联网等新兴技术的加入&#xff0c;不仅改变了传统交通的运行模式&#xff0c;还赋予了智能交通更多的功能和价值。首先&#xff0…

Convert Ensembl IDs to gene symbols python包

links&#xff1a; https://pypi.org/project/ensembl-converter/ pip install Ensembl_converter批量转&#xff1a; from Ensembl_converter import EnsemblConverter# Create an instance of EnsemblConverter converter EnsemblConverter()# Provide a list of Ensembl …

IEC MMS协议源码运行

环境准备 源码下载链接 https://github.com/mz-automation/libiec61850 我的运行环境是ubuntu虚拟机。 首先进入文件夹根目录进行编译 make clean makeserver代码的编译和运行 进入examples/serve_example_simpler的目录下编译 直接执行会发现报错&#xff0c;异常退出。 …

JLink烧录失败

1. 现象&#xff1a; 这个位置是灰色的&#xff0c;没有SW Device信息。 MDK下面的打印&#xff1a; J-Flash的打印&#xff1a; windows上面的弹框的现象没有截屏。 2. 解决办法&#xff1a; 1.打开J-Link Commander,输入unlock kinetis&#xff0c;看现象不起作用,网…