CV论文--2024.3.25

news2024/9/23 3:32:49

1、Zero-Shot Multi-Object Shape Completion

中文标题:零样本多对象形状完成

简介:我们提出了一种3D形状补全方法,可以从单个RGB-D图像中恢复复杂场景中多个物体的完整几何形状。尽管单个物体的3D形状补全已经取得了显著进展,但在高度混乱的现实世界多物体场景中实现高质量重建仍然是一个挑战。

为了解决这个问题,我们引入了一种名为OctMAE的架构,它结合了Octree U-Net和潜在的3D MAE。OctMAE通过局部和全局几何推理实现高质量且接近实时的多物体形状补全。考虑到一个朴素的3D MAE在计算上可能难以处理和内存密集,我们采用了一种新颖的遮挡掩蔽策略和3D旋转嵌入,显著提高了运行时间和形状补全质量。

为了推广到不同场景中的各种对象,我们创建了一个大规模的逼真数据集,其中包含来自Objaverse数据集的多样化的12K个3D物体模型。这些模型在基于物理的定位下呈现多物体场景。我们的方法在合成和真实世界数据集上均优于当前最先进的方法,并展示出强大的零样本能力。

2、MVSplat: Efficient 3D Gaussian Splatting from Sparse Multi-View Images

中文标题:MVSplat:稀疏多视图图像的高效 3D 高斯分布

简介:我们提出了一种名为MVSplat的有效前馈3D高斯喷溅模型,该模型是从稀疏的多视图图像中学习得到的。为了准确地定位高斯中心,我们建议通过在3D空间中进行平面扫描来构建成本体积表示。成本体积中存储的跨视图特征相似性可以为深度估计提供有价值的几何线索。

我们联合学习高斯基元的不透明度、协方差和球谐系数,并仅依靠光度监督来学习高斯中心。通过广泛的实验评估,我们展示了成本体积表示在学习前馈高斯喷溅模型中的重要性。

在大规模的RealEstate10K和ACID基准测试中,我们的模型实现了最先进的性能,并具有最快的前馈推理速度(22 fps)。与最新的最先进方法pixelSplat相比,我们的模型使用的参数少了10倍,推理速度提高了2倍以上,同时提供了更高的外观和几何质量,以及更好的跨数据集泛化性能。

3、ODTFormer: Efficient Obstacle Detection and Tracking with Stereo Cameras Based on Transformer

中文标题:ODTFormer:基于 Transformer 的立体相机高效障碍物检测与跟踪

简介:本文介绍了一种名为ODTFormer的基于Transformer的模型,用于解决机器人自主导航中的障碍物检测和跟踪问题。对于检测任务,我们的方法利用可变形注意力构建了一个3D成本体积,该体积以体素占据网格的形式逐步解码。通过匹配连续帧之间的体素,我们进一步实现了对障碍物的跟踪。整个模型可以进行端到端优化。

通过在DrivingStereo和KITTI基准测试上进行大量实验,我们的模型在障碍物检测任务中取得了最先进的性能。同时,我们报告了与最先进的障碍物跟踪模型相当的准确性,而仅需要它们计算成本的一小部分,通常是十倍到二十倍的差距。我们将公开发布代码和模型权重。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1543191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Oracle:ORA-01830错误-更改数据库时间格式

1,先把报错SQL语句拿出来执行,看看是不是报的这个错 ORA-01830: 日期格式图片在转换整个输入字符串之前结束 2,然后查看默认日期格式是不是“YYYY-MM-DD HH24:MI:SS”(正确格式)。; 执行: SELECT * FRO…

用three.js做一个3D汉诺塔游戏(上)

本文由孟智强同学原创,主要介绍了如何利用 three.js 开发 3D 应用,涵盖 3D 场景搭建、透视相机、几何体、材质、光源、3D 坐标计算、补间动画以及物体交互实现等知识点。 入门 three.js 也有一阵子了,我发现用它做 3D 挺有趣的,而…

unity 学习笔记 4.坐标系

下载源码 UnityPackage 目录 1.基础知识 1.1.世界坐标和局部坐标 1.2.屏幕坐标 2.坐标系转换 3.练习:判断鼠标单击的位置 1.基础知识 1.1.世界坐标和局部坐标 1.2.屏幕坐标 2.坐标系转换 3.练习:判断鼠标单击的位置 步骤: 将脚本挂载到小…

MP4短视频怎么提取gif?一招让你视频变gif

日常生活中看到各种各样有趣的gif表情包就会收藏到自己图片库里。但是我们想要自己制作这种有趣的gif动图时要怎么办呢?怎么通过MP4视频来制作gif动画呢?通过使用gif图片制作(https://www.gif.cn/)工具-GIF中文网,能够…

查看Linux系统重启的四种基本命令

目录 前言1. last2. uptime3. journalctl4. dmesg 前言 对于排查其原因推荐阅读:详细分析服务器自动重启原因(涉及Linux、Window) 在Linux中,有多种命令可以查看系统重启的信息 以下是其中一些常用的命令及其解释: …

Windows系统安装PyTorch框架支持AMD Radeon显卡/Intel显卡

前言 PyTorch框架作为一种主流的、对新手友好的深度学习框架,应用的范围越来越广泛,但是作为一种深度学习框架,使用显卡进行加速训练是一种常见的需求,而PyTorch框架官方支持对NVIDIA卡支持更加友好,这一点从官方的安…

【计算机组成】计算机组成与结构(四)

上一篇:【计算机组成】计算机组成与结构(三) (7)存储系统 计算机采用分级存储体系的主要目的是为了解决存储容量、成本和速度之间的矛盾问题。 两级存储:cache-主存、主存-辅存(虚拟存储体系) 局部性原理 ◆ 局部性…

AI程序员的诞生,对传统程序员的影响和堆技术产生的影响

一、全球首位AI程序员诞生,将会对程序员的影响有多大? AI程序员并不会抢走传统程序员的饭碗,而是为他们提供更多的工具和技术支持。实际上,AI技术在软件开发领域的应用可以帮助程序员更高效地进行开发、测试和维护工作&#xff0…

【python】flask执行上下文context,请求上下文和应用上下文原理解析

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

挺后悔,我敷衍地回答了“程序员如何提升抽象思维“

分享是最有效的学习方式。 博客:https://blog.ktdaddy.com/ 大家好,我是老猫。 大概在月初的时候,我发了一篇文章【当程序员之后?(真心话)】,在这篇文章中,提及了抽象思维对一名程序员的重要性。可能说得也比较笼统&a…

ZYNQ学习之PetaLinux开发环境搭建

基本都是摘抄正点原子的文章&#xff1a;<领航者 ZYNQ 之嵌入式Linux 开发指南 V3.2.pdf&#xff0c;因初次学习&#xff0c;仅作学习摘录之用&#xff0c;有不懂之处后续会继续更新~ FTP&#xff1a;File Transfer Protocol 一、Ubuntu 和 Windows 文件互传 1.1、开启 Ubu…

一篇复现Docker镜像操作与容器操作

华子目录 Docker镜像操作创建镜像方式1docker commit示例 方式2docker import示例1&#xff1a;从本地文件系统导入示例2&#xff1a;从远程URL导入注意事项 方式3docker build示例1&#xff1a;构建镜像并指定名称和标签示例2&#xff1a;使用自定义的 Dockerfile 路径构建镜像…

文献学习-22-Surgical-VQLA:具有门控视觉语言嵌入的转换器,用于机器人手术中的视觉问题本地化回答

Authors: Long Bai1† , Mobarakol Islam2† , Lalithkumar Seenivasan3 and Hongliang Ren1,3,4∗ , Senior Member, IEEE Source: 2023 IEEE International Conference on Robotics and Automation (ICRA 2023) May 29 - June 2, 2023. London, UK Abstract: 尽管有计算机辅…

【大模型】VS Code(Visual Studio Code)上安装的扩展插件用不了,设置VS Code工作区信任

文章目录 一、找到【管理工作区信任】二、页面显示处于限制模式&#xff0c;改为【信任】三、测试四、总结 【运行环境】win 11 相关文章&#xff1a; 【大模型】直接在VS Code(Visual Studio Code)上安装CodeGeeX插件的过程 【问题】之前在 VS Code上安装 CodeGeeX 插件后&…

52、Qt/窗口、常用类、ui相关学习20240321

一、使用Qt 自由发挥登录窗口的应用场景&#xff0c;实现一个登录窗口界面。 要求&#xff1a; 1. 需要使用Ui界面文件进行界面设计 2. ui界面上的组件相关设置&#xff0c;通过代码实现 3. 需要添加适当的动图。 代码&#xff1a; #include "widget.h" #incl…

quartz整合前端vue加后端springboot

因工作需求&#xff0c;需要能修改定时的任务&#xff0c;前端vue3&#xff0c;后端是springboot 看看页面效果&#xff1a; 首先maven加上引入 <dependency><groupId>org.quartz-scheduler</groupId><artifactId>quartz</artifactId><versi…

BufferedInputStream解读

咦咦咦&#xff0c;各位小可爱&#xff0c;我是你们的好伙伴——bug菌&#xff0c;今天又来给大家普及Java之IO流啦&#xff0c;别躲起来啊&#xff0c;听我讲干货还不快点赞&#xff0c;赞多了我就有动力讲得更嗨啦&#xff01;所以呀&#xff0c;养成先点赞后阅读的好习惯&am…

hash冲突四种解决办法,hash冲突除了拉链法还有什么?

1. 看hashmap 源码&#xff0c;有个问题&#xff0c;key 存放是 先hash 再与hash值的高16位值 进行异或运算。再与槽位size() 求模取余。如果多个不同的key 得出de数组位置相同。则采用链表依次存储。 2. 那么除了拉链法还有什么其他解决hash冲突的方法呢&#xff1f; a. 建立…

python程序打包

目录 1. 命令2. 安装2.1 PyInstaller2.2 cx_Freeze(笔者未用过) 3. 打包示例3.1 在 pycharm 中执行3.2 若使用打包命令时报错3.3 路径问题 python打包成可执行文件&#xff0c;用于在没有Python环境的地方运行该程序&#xff0c;与qt打包类似。&#xff08;笔者写的qt打包地址&…

Beans模块之工厂模块BeanNameAware

博主介绍&#xff1a;✌全网粉丝5W&#xff0c;全栈开发工程师&#xff0c;从事多年软件开发&#xff0c;在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战&#xff0c;博主也曾写过优秀论文&#xff0c;查重率极低&#xff0c;在这方面有丰富的经验…