【MLP-BEV(10)】BEVPooling V1和BEVPooling V2的view_transformer，进行鱼眼图片实践

【MLP-BEV(10)】BEVPooling V1和BEVPooling V2的view_transformer，进行鱼眼图片实践

news2025/3/31 11:15:26

文章目录

先说说 BEVPoolv1
- - 步骤1：3D点生成
  - 步骤2 2D特征采样和BEV特征生成
  - 特点
再谈谈BEVPoolv2
- - 步骤1：3D点生成
  - 步骤2：计算索引关系
  - 步骤3： `voxel_pooling`计算
鱼眼图片进行实践
- 步骤1、3D点生成(基于Kannala-Brandt 进行调整)
- 步骤2、2D特征采样和BEV特征生成
- - - (1) 体素化 (Voxelization)
    - (2) 特征散射 (Scatter Operation)
补充：Kannala-Brandt 模型简短说明
参考

先说说 BEVPoolv1

BEVPoolv2 是 BEVPoolv1 的优化版本，其优化了图像特征到 BEV 特征的转换过程，实现了在计算和存储方面极大的降低。BEVPoolv1 （左）和 BEVPoolv2（右）的示意图如下：

在这里插入图片描述

BEVPoolv1 的主要计算流程如下：

步骤1：3D点生成

利用get_geometry() 计算图像中每个像素对应的3D空间点在自车（Ego）坐标系下的坐标，即建立 2D像素坐标 ↔ 3D自车坐标 的映射关系。
输入（典型参数）：

rots：相机到自车的旋转矩阵 [B, N, 3, 3]
trans：相机到自车的平移向量 [B, N, 3]
intrins：相机内参矩阵 [B, N, 3, 3]
post_rots / post_trans：图像后处理（如裁剪/缩放）的变换矩阵
depth_假设：离散深度值（如 [4.0, 5.0, ..., 45.0]）

输出：

points：3D点坐标 [B, N, D, H, W, 3]
- B：Batch大小
- N：相机数量
- D：深度采样数
- H/W：特征图高度/宽度
- 3：自车坐标系下的 (x, y, z) 坐标

首先执行(1) 生成视锥体（Frustum）

预定义一个 3D视锥体网格（Frustum），表示相机视野范围内的空间采样点：

# 伪代码：生成像素坐标 + 深度假设的网格
# frustum 是视锥空间的点集合，初始形状为 (B, N_cams, D, H, W, 3)。
frustum = create_frustum(depth_bins, H, W)  # [D, H, W, 3]

每个点的初始坐标为 (u, v, d)（像素坐标 + 深度）。

其次执行(2) 逆投影到3D相机坐标系

通过相机内参的逆变换，将像素坐标转换为 归一化相机坐标：
$\begin{bmatrix} x_{cam} \\ y_{cam} \\ 1 \end{bmatrix} = K^{-1} \cdot \begin{bmatrix} u \\ v \\ 1 \end{bmatrix}$
乘以深度值得到 3D相机坐标：
$P_{cam} = \begin{bmatrix} x_{cam} \cdot d \\ y_{cam} \cdot d \\ d \end{bmatrix}$

# 使用深度信息&#

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2323340.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Elasticsearch：使用 Azure AI 文档智能解析 PDF 文本和表格数据

Elasticsearch：使用 Azure AI 文档智能解析 PDF 文本和表格数据

作者：来自 Elastic James Williams 了解如何使用 Azure AI 文档智能解析包含文本和表格数据的 PDF 文档。 Azure AI 文档智能是一个强大的工具，用于从 PDF 中提取结构化数据。它可以有效地提取文本和表格数据。提取的数据可以索引到 Elastic Cloud Serve…

阅读更多...

【＜二＞丹方改良：Spring 时代的 JavaWeb】之 Spring Boot 中的 AOP：实现日志记录与性能监控

<前文回顾> 点击此处查看合集 https://blog.csdn.net/foyodesigner/category_12907601.html?fromshareblogcolumn&sharetypeblogcolumn&sharerId12907601&sharereferPC&sharesourceFoyoDesigner&sharefromfrom_link <今日更新> 一、开篇整…

阅读更多...

多模态大模型训练范式演进与前瞻

多模态大模型训练范式演进与前瞻

本文从多模态大模型相关概念出发，并以Flamingo 模型为例，探讨了基于多模态大模型训练的演进与前瞻。新一代训练范式包括统一架构、数据工程革新和动态适应机制，以提升跨模态推理能力和长视频理解。多模态大模型定义什么是多模态大模型&…

阅读更多...

游戏引擎学习第187天

游戏引擎学习第187天

看起来观众解决了上次的bug 昨天遇到了一个相对困难的bug，可以说它相当棘手。刚开始的时候，没有立刻想到什么合适的解决办法，所以今天得从头开始，逐步验证之前的假设，收集足够的信息，逐一排查可能的原因&a…

阅读更多...

HarmonyOS NEXT 关于鸿蒙的一多开发(一次开发，多端部署) 1+8+N

HarmonyOS NEXT 关于鸿蒙的一多开发(一次开发，多端部署) 1+8+N

官方定义定义：一套代码工程，一次开发上架，多端按需部署。目标：支撑开发者快速高效的开发支持多种终端设备形态的应用，实现对不同设备兼容的同时，提供跨设备的流转、迁移和协同的分布式体验。什么是18…

阅读更多...

当Kafka化身抽水马桶：论组件并发提升与系统可用性的量子纠缠关系

当Kafka化身抽水马桶：论组件并发提升与系统可用性的量子纠缠关系

《当Kafka化身抽水马桶：论组件并发提升与系统可用性的量子纠缠关系》引言：一场OOM引发的血案某个月黑风高的夜晚，监控系统突然发出刺耳的警报——我们的数据发现流水线集体扑街。事后复盘发现：Kafka集群、Gateway、Discovery服…

阅读更多...

Dify+ollama+vanna 实现text2sql 智能数据分析 -01

Dify+ollama+vanna 实现text2sql 智能数据分析 -01

新鲜出炉-今天安装vanna踩过的坑今天的任务是安装vanna这个工具，因为dify中自己写的查询向量数据库和执行sql这两步太慢了大概要20S，所以想用下这个工具，看是否会快一点。后面会把这个vanna封装成一个工具让dify调用。环境说明我是在本…

阅读更多...

uniapp uni-swipe-action滑动内容排版改造

uniapp uni-swipe-action滑动内容排版改造

在uniapp开发中默认的uni-swipe-action滑动组件按钮里的文字都是横排的不能换行的如果是在一些小屏设备比如PDA这种，同时按钮文字又都是4个字多按钮的情况就会发现滑动一下都直接满屏了观看体验都不好但默认的官方组件又没有样式的设置，下面就告…

阅读更多...

电脑卡怎么办？提升电脑流畅的方法

电脑卡怎么办？提升电脑流畅的方法

电脑已经成为我们工作、学习和娱乐不可或缺的伙伴。然而，随着使用时间的增长，许多用户会遇到电脑运行变慢、卡顿的情况，这不仅影响了工作效率，也大大降低了使用体验。本文将为大家分析电脑卡顿的常见原因，并提供一套实…

阅读更多...

SpringBoot报错解决方案

SpringBoot报错解决方案

org.apache.tomcat.util.http.fileupload.impl.SizeLimitExceededException: the request was rejected because its size (31297934) exceeds the configured maximum (10485760) 文件上传大小超过限制

阅读更多...

软件需求未明确非功能性指标（如并发量）的后果

软件需求未明确非功能性指标（如并发量）的后果

软件需求未明确非功能性指标（如并发量）可能带来的严重后果包括：系统性能下降、用户体验恶化、稳定性降低、安全风险增加、后期维护成本高企。其中，系统性能下降尤为显著。当软件系统在设计和开发阶段未明确并发量需求时&#xff0…

阅读更多...

VScode-i18n-ally-Vue

VScode-i18n-ally-Vue

参考这篇文章，做Vue项目的国际化配置，本篇文章主要解释，下载了i18n之后，该如何对Vscode进行配置 https://juejin.cn/post/7271964525998309428 i18n Ally全局配置项 Vscode中安装i18n Ally插件，并设置其配置项&#…

阅读更多...

Spring Boot项目快速创建-开发流程（笔记）

Spring Boot项目快速创建-开发流程（笔记）

主要流程： 前端发送网络请求->controller->调用service->操纵mapper->操作数据库->对entity数据对象赋值->返回前端前期准备： maven、mysql下载好跟学视频，感谢老师： https://www.bilibili.com/video/BV1gm4…

阅读更多...

车架号查询车牌号接口如何用Java对接

车架号查询车牌号接口如何用Java对接

一、什么是车架号查询车牌号接口？ 车架号查询车牌号接口，即传入车架号，返回车牌号、车型编码、初次登记日期信息。车架号又称车辆VIN码，车辆识别码。二、如何用Java对接该接口？ 下面我们以阿里云接口为例&#xff0…

阅读更多...

$npm : 无法加载文件 C:\Program Files\nodejs\npm.ps1，因为在此系统上禁止运行脚本的处理方法$

npm : 无法加载文件 C:\Program Files\nodejs\npm.ps1，因为在此系统上禁止运行脚本的处理方法

1、安装了node.js后，windows powershell中直接输入npm，然后就报错 2、出现原因：权限不够系统禁用了脚本的执行，所以我们在windows powershell输入npm -v的时候，就会报上面的错误。 3、解决 Set-ExecutionPolicy Un…

阅读更多...

数仓开发那些事（11）

数仓开发那些事（11）

某神州优秀员工：一闪，领导说要给我涨米。一闪：。。。。（着急的团团转） 老运维：Oi，两个吊毛，看看你们的hadoop集群，健康度30分，怎么还在抽思谋克&#xff1f…

阅读更多...

从零开始完成冒泡排序（0基础）——C语言版

从零开始完成冒泡排序（0基础）——C语言版

文章目录前言一、冒泡排序的基本思想二、冒泡排序的执行过程（一）第一轮排序（二）第二轮排序（三）第三轮排序（四）第四轮排序三、冒泡排序的代码实现（C语言）&am…

阅读更多...

工业级POE交换机：助力智能化与自动化发展

工业级POE交换机：助力智能化与自动化发展

随着工业互联网、物联网（IoT）和自动化技术的快速发展，网络设备在工业领域的应用日益广泛。然而，在严苛环境下，传统网络设备往往难以应对复杂的温湿度变化、电磁干扰和供电不稳定等挑战。为同时满足数据传输与供电一体化…

阅读更多...

使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第五讲)

使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第五讲)

在上一讲我们讲解了按键回调函数的自定义函数的用法，这一讲继续讲解回调函数的另一种用法。首先我们将上一讲做好的按键名称以及自定义回调事件中的按键名称修改，改为默认模式为“open”当点击按键时进入回调函数将按键名称改为“close”，具…

阅读更多...

Burp Suite Professional 2024版本安装激活指南

Burp Suite Professional 2024版本安装激活指南

文章目录 burpsuite简介Burp Suite的主要组件：Burp Suite的版本使用场景下载地址使用教程 burpsuite简介 Burp Suite 是一个广泛使用的网络安全测试工具，特别是在Web应用程序安全领域。它主要用于发现和修复Web应用中的安全漏洞，特别适用于渗…

阅读更多...

推荐文章

最新文章