CVPR 2024 最佳论文分享┆物体用体积表示:一种不透明固体图形的随机几何表示方法

news2024/11/14 13:37:14

本文详细介绍了一篇获得CVPR 2024最佳论文提名的论文《Objects as volumes: A stochastic geometry view of opaque solids》。该论文的作者为Bailey Miller等人。论文提出了一种新的理论框架,从随机几何学的角度解释和改进当前体积表示方法,即将不透明固体表示为体积,从而解决现有3D重建方法中的不足。本文由李杨撰写,审校为陆新颖和朱旺。

原文链接:

https://arxiv.org/abs/2312.15406

代码链接:

https://github.com/cmu-ci-lab/volumetric_opaque_solids

演示实例链接

https://imaging.cs.cmu.edu/volumetric_opaque_solids/#visualization

CVPR (IEEE Conference on Computer Vision and Pattern Recognition)是计算机视觉领域最有影响力的会议之一,主要方向包括图像和视频处理、目标检测与识别、三维视觉等。近期,CVPR 2024 公布了最佳论文。共有10篇论文获奖,其中2篇最佳论文,2篇最佳学生论文,2篇最佳论文题目和4篇最佳学生论文提名。本公众号推出CVPR 2024最佳论文专栏,分享这10篇最佳论文。

1.研究背景及论文贡献

1.1研究背景

体积表示方法广泛用于模拟半透明物体(如组织、云、蜡)和参与性介质(如烟雾、雾)的光传输。随着NeRF(Neural Radiance Fields)等神经渲染技术的兴起,体积表示方法用于模拟仅有光表面相互作用的不透明物体,而不是传统的包含体积散射和次表面散射的半透明物体。论文旨在通过开发新的理论框架,从随机几何学的角度解释和改进当前体积表示方法,以提升3D重建效果。

图1 确定性微粒几和随机性固体几何的射线投射过程

图1展示了在体积表示中,确定性和随机性的射线投射过程,并区分了微粒几何和固体几何两种场景。

1.2论文贡献

论文提出了一种新的理论框架,将不透明固体表示为体积,从而解决现有方法中的不足。

1)从随机几何学角度重新审视体积表示,证明在特定条件下不透明固体可以用指数体积传输模型进行建模。

2)推导出体积衰减系数的表达式,适用于各向同性和各向异性散射。

3)将不透明固体表示为随机隐函数,确保表示方法满足物理约束如互易性和可逆性。

4)提出新的体积表示方法,通过从基本原理出发,修正和扩展现有方法,显著提升3D重建任务的性能。

2.方法

图2 体积表示理论的总体架构

图2展示了作者提出的体积表示理论的总体架构。该图展示了不同密度(low density 和 high density)的3D形状和各向异性参数(anisotropy)的变化。衰减系数(attenuation coefficient)是密度(density)和投影面积(projected area)的乘积,反映光线在不同方向穿过物体时的衰减。密度通过点的梯度和空隙率(vacancy)计算,表示光线被物体阻挡的概率。投影面积考虑光线方向和物体表面法向量的分布,光线垂直入射时,投影面积最大;掠角入射时,投影面积最小。空隙率表示点的透明度,平均隐式函数(mean implicit function)提供点的期望值。各向异性参数表示不同方向上光线衰减的差异。

3.实验结果

表1 在DTU和NeRF Realistic Synthetic上的重建质量对比

表1展示了在DTU和NeRF Realistic Synthetic上的重建质量对比,使用的指标是Chamfer距离(Chamfer distance)。在这两个数据集上,论文提出的模型平均值和中位数最小,3D重建质量均显著优于现有模型。

表2 在DTU数据集上重建质量的消融研究结果

表2展示了在DTU数据集上不同隐式函数分布(implicit function distribution)和法向量分布(distribution of normals)的设计选择及其重建质量的消融研究结果。使用高斯分布(Gaussian distribution)和空间变化的混合分布(spatially varying mixture distribution)的设计选择取得了最佳表现,平均值和中位数分别为1.75和1.59。该表还显示,当使用违反互易性的ReLU项时,性能显著下降。

图3 BlendedMVS数据集中形状和关键量的可视化

图3展示了关键量在3D场景中的分布和变化,说明了论文提出的模型如何在复杂场景中有效捕捉这些几何和物理特征。图4展示了在BlendedMVS和NeRF Realistic Synthetic数据集上,论文模型与VolSDF和NeuS模型的重建质量对比。通过对比重建结果的视觉效果(图4中的虚线圆圈标注了感兴趣区域),清晰显示了论文模型在细节恢复和整体质量上的优势。

图4 不同模型在BlendedMVS和NeRF Realistic Synthetic数据集上

4.结论

论文提出了一种新的体积表示理论,用于不透明固体的3D重建,解决了现有方法在处理不透明物体时的不足。经典的体积表示方法用于模拟半透明物体和参与性介质,但缺乏对不透明物体的理论支持。论文从随机几何学出发,通过随机指示函数表示不透明固体,推导了指数体积传输模型和体积衰减系数,推广至各向同性和各向异性散射。实验结果表明,体积表示理论为现有方法提供了数学支持,并在实际应用中获得了显著性能提升,为进一步研究提供了基础和指导。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1957242.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OZON大健康热卖产品,OZON大健康产品有哪些

在俄罗斯,随着全球健康意识的提升,特别是在新冠疫情之后,人们对于增强免疫力和保持健康的关注度显著增加。这种趋势在俄罗斯尤为明显,其中天然食品补剂、家居清洁用品以及个人护理产品等大健康领域的产品需求激增。以下是根据当前…

线上红酒品鉴会:与专业人士面对面交流

在繁忙的现代生活中,我们时常渴望寻找一个安静的角落,与志同道合的朋友共同品味生活的美好。当红酒的醇香与线上交流的便捷相结合,一场别开生面的线上红酒品鉴会便应运而生。今天,让我们一同走进这场与专业人士面对面交流的线上红…

WSL for Windows

1、安装 超详细Windows10/Windows11 子系统(WSL2)安装Ubuntu20.04(带桌面环境)_wsl安装ubuntu20.04-CSDN博客https://blog.csdn.net/weixin_44301630/article/details/122390018 注意,安装之后首次启动 Ubuntu 时&…

当我们谈论前端性能时,我们在谈论什么

前端岗位内推来了 本文结合Google官方工具 Lighthouse 分析最新的前端页面性能评分标准,帮助大家更好地理解各种性能指标,以改进和优化相关前端项目。 前端页面性能一直是大家持续关注的话题,因为用户留存率与页面加载性能密切相关。根据Goog…

全球模块化机器人市场展望与未来增长机遇预测:未来六年CAGR为14.9%

在全球自动化和智能化水平提升的背景下,模块化机器人正成为市场的焦点。本文详细分析了全球模块化机器人市场的现状、增长趋势及未来前景,旨在为投资者和业内人士提供深入的市场洞察和指导。 市场概览 据恒州诚思团队研究分析显示,2023年&am…

zeal 开发者离线文档工具

zeal是一款程序开发者不可或缺的离线文档查看器 下载地址 官网地址: windows版csdn下载(开箱即用含):https://download.csdn.net/download/xzzteach/89588765 已离线 Android.docset Apache_HTTP_Server.docset Bash.docset Bootstrap_4.docset Bootst…

QT6安装

我是直接使用 qt-online-installer-windows-x64-4.8.0.exe 安装包一键安装的 需要安装包的可以在此路径下载: qt-online-installer-windows-x64-4.8.0.exe,qt6一键安装包资源-CSDN文库

C#编写软件发布公告2——服务端

简单说明 框架:.NET 6.0 MVC 数据库:sqlLite3(当然这是为考虑本地数据简单,可以考虑使用大型数据库) 一、界面效果展示 1、启动主页面 2、记录摘要界面 3、对应版本详细 二、实现代码逻辑 1、启动主页面 //关联日志文件写 builder.Loggi…

音频处理过程

1、音频 (1)打开设备 (2)从音频设备中读取数据 (3)将音频设备中读取的数据写入文件夹中 (4) 通过界面控制开始录制和结束录制(使用多线程和状态码控制) &…

Spring监听器不同的注册方式下带来的监听范围的变化

事件监听注册的几种方式 ApplicationContext下面简称AC 1.构建SpringApplication时注册(可以监听AC启动阶段事件) // 方式一: //写法1 SpringApplication application new SpringApplicationBuilder().listeners(new ApplicationPidFileWriter()).bu…

网课录制新技能,声画同步,三款录屏软件助力教师高效授课

在数字化教育的浪潮中,教师和培训讲师们越来越依赖于录制网课来提升教学效果。无论是PPT课件的深入讲解,Word文档的详细演示,还是操作手册的直观展示,一款出色的录屏软件都能使这一过程更加生动和高效。今天,我将为大家…

【C++/STL】:哈希 -- 线性探测哈希桶

目录 💡前言一,unordered系列容器二,哈希2.1 哈希的概念2.2 哈希函数2.3 哈希冲突 三,哈希冲突解决(重点)3.1 开放定址法3.2 哈希桶(重点) 四,线性探测的实现4.1 线性探测的基本框架4.2 插入操作4.3 查找操作4.4 删除操…

【C++】类和对象——Lesson1

Hi~!这里是奋斗的小羊,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~ 💥💥个人主页:奋斗的小羊 💥💥所属专栏:C 🚀本系列文章为个人学习笔记…

【Golang 面试 - 基础题】每日 5 题(十)

✍个人博客:Pandaconda-CSDN博客 📣专栏地址:http://t.csdnimg.cn/UWz06 📚专栏简介:在这个专栏中,我将会分享 Golang 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞👍收藏…

关联映射和缓存机制学习笔记

学习视频:4001 关联映射概述_哔哩哔哩_bilibili~4007 案例:商品的类别_哔哩哔哩_bilibili 目录 1.关联映射概述 1.1关联映射关系 一对一关系 一对多关系 多对多关系 Java对象如何描述事物之间的关系 1.2一对一查询 元素 a.嵌套查询方式 b.嵌套结果方…

Spring Cache常用注解

依赖代码如下&#xff1a; <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-cache</artifactId></dependency> 常用注解详解 1. Cacheable 作用&#xff1a;主要用于配置方法&#xff0c;使其…

第九届全球渲染大赛来了!CG爱好者准备好了吗!

在CG界的日历上&#xff0c;二月和八月总是特别繁忙的月份。这两个月&#xff0c;全球CG艺术界最盛大的赛事——全球渲染大赛&#xff0c;都会开放报名&#xff0c;吸引着世界各地的CG艺术家和爱好者参与。备受期待的第九届全球渲染大赛&#xff0c;已经定于2024年8月3日在美国…

微信私域运营工具分享

解决微信多管理难的问题&#xff0c;多微信工作重复做&#xff0c;效率低的问题&#xff0c;防止飞单、删除客户&#xff0c;解决私域运营的难题

在双碳目标下,如何实现工厂的数字化改造升级

在"双碳"目标下&#xff0c;如何实现工厂的数字化改造升级 在“双碳”目标&#xff0c;即2030年前实现碳达峰、2060年前实现碳中和的宏伟蓝图下&#xff0c;企业作为经济社会活动的主体&#xff0c;其改造升级不仅是响应国家战略的必然要求&#xff0c;也是实现可持…

软件压力测试知识大揭秘,专业软件测评公司推荐

在信息技术迅猛发展的今天&#xff0c;软件已经成为各个行业运作的核心。有助于提升工作效率和管理水平的&#xff0c;软件的稳定性和性能也变得尤为重要。而软件压力测试&#xff0c;作为一种重要的测试手段&#xff0c;逐渐受到了更多企业的重视。 软件压力测试&#xff0c;…