CVPR 2024最佳论文分享:Mip-Splatting: 无混叠3D高斯溅射

news2024/11/24 16:53:13

本推文详细介绍了CVPR 2024最佳论文提名《Mip-Splatting: Alias-free 3D Gaussian Splatting》。该论文的第一作者为 Zehao Yu(图宾根大学在读博士,导师:Andreas Geiger )。论文提出了一种名为Mip-Splatting的方法,用于无混叠的三维高斯溅射。这种方法通过结合多级混合技术和高斯溅射,解决了传统三维点绘中常见的混叠问题。Mip-Splatting利用二维和三维滤波器来有效处理不同分辨率的图像,从而在保持高质量渲染的同时,提高了计算效率。本推文由陆新颖撰写,审校为李扬和朱旺。

原文链接:

https://arxiv.org/abs/2311.16493

代码链接:

https://github.com/autonomousvision/mip-splatting

演示实例链接:

https://niujinshuchong.github.io/mip-splatting/

CVPR (IEEE Conference on Computer Vision and Pattern Recognition)是计算机视觉领域最有影响力的会议之一,主要方向包括图像和视频处理、目标检测与识别、三维视觉等。近期,CVPR 2024 公布了最佳论文。共有10篇论文获奖,其中2篇最佳论文,2篇最佳学生论文,2篇最佳论文题目和4篇最佳学生论文提名。本公众号推出CVPR 2024最佳论文专栏,分享这10篇最佳论文。

1.研究背景及解决的问题

1.1研究背景

三维渲染技术在计算机图形学和视觉效果生成中起着关键作用。然而,传统的三维高斯溅射(3D Gaussian Splatting, 3DGS)方法在处理高分辨率图像时,常常出现混叠伪影,这种问题严重影响了图像的视觉质量。混叠现象主要是由于在低分辨率下无法准确表示高频细节而导致的。此外,在多尺度图像处理方面,传统方法在保持高质量渲染和计算效率之间存在困难,如图1所示。图1中的(a),(b)子图是全分辨率,当子图(c)中将图片缩小后,发现渲染的图片将自行车轮胎的钢丝颜色调亮且加粗了,而子图(d)进行放大操作后,图片出现高频伪影并且刹车线变得很细。

1 混叠伪影现象

1.2解决的问题

论文提出的Mip-Splatting方法通过结合多级混合技术和高斯溅射,引入2D和3D Mip滤波器,有效减少了传统3DGS中的混叠伪影。该方法在不同分辨率下实现了高质量的图像渲染,并通过多尺度数据的训练和测试,展示了在处理多分辨率图像时的优越性能和高计算效率。这不仅显著提升了渲染质量,还解决了多尺度图像处理中的性能瓶颈问题。

2.方法

论文提出的方法基于3DGS。该方法通过将3D对象表示为3D高斯点,然后将其投影到图像平面,并在屏幕空间进行二维扩展。这样,3D对象的表示可以简化为二维空间中的点云。为了更好地理解3DGS方法的工作原理,需要掌握多视图频率界限以及采样率相关的知识。多视图图像是连续3D场景的二维投影,图像的分辨率、相机焦距和场景与相机的距离共同决定了采样率。

为了克服上述挑战,提出了Mip Gaussian Splatting方法,对原始的3DGS模型进行了两项重要修改:引入了3D平滑滤波器和二维Mip滤波器。3D平滑滤波器通过限制3D表示的频率来消除高频伪影,而二维Mip滤波器通过模拟物理成像过程中的盒式滤波器来有效地缓解混叠效应和扩展问题。这些改进使得Mip-Splatting方法能够在各种采样频率下实现无伪影的渲染。

2.1 2D平滑滤波器

重建的3D场景的最高频率受到训练图像所施加的采样约束的限制。通过应用高斯低通滤波器Glow来约束每个3D高斯基元的最大频率,从而在将其投影到屏幕空间之前进行处理以有效地正则化3D高斯基元的最大频率,从而消除放大时的高频伪影。

2.2 二维Mip滤波器

模拟2D盒式滤波器,通过近似物理成像过程中的实际2D盒式滤波器,确保在不同尺度下的无混叠重建和渲染。

3.实验

3.1 实验设置

为了对所提出的Mip-Splatting方法进行了广泛的实验评估。实验环境包括多个具有挑战性的基准数据集,如合成数据集和真实数据集。并且与现有的最先进的方法进行了对比,包括直接3D渲染、体绘制技术以及标准的3DGS方法。

(1)评价指标:图像质量评价指标,如峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)、结构相似性指数(Structural Similarity Index,SSIM)和感知图像错误(Learned Perceptual Image Patch Similarity,LPIPS)。

(2)数据集:论文主要展示了在Blender 数据集和Mip-NeRF 360数据集上的成果。

3.2多尺度训练和多尺度测试

论文使用多尺度数据训练模型并在多尺度数据上进行评估。对全分辨率图像的光线采样更频繁,约占 40%,其余图像分辨率各占 20%。定量评估结果如表 1 所示。论文的方法在性能上与最先进的方法如 Mip-NeRF和Tri-MipRF相当或更优。值得注意的是,论文方法由于使用了2D Mip滤波器,性能显著超越了3DGS方法和3DGS + EWA方法。

表1 在Blender数据集上的多尺度训练和多尺度测试

3.2单尺度训练和多尺度测试

论文考虑了一个新的实验设置,即在全分辨率图像上训练,并在不同分辨率(即1×, 1/2, 1/4, 1/8)下渲染,以模拟缩小效果。定量结果如表 所示,论文的方法获得了最优性能。

2 在Blender数据集上的单尺度训练和多尺度测试

定性比较如图2所示,在原始训练尺度上,基于3DGS的方法在捕捉细节方面比Mip-NeRF方法和Tri-MipRF方法更有效。而论文方法在低分辨率下的渲染质量明显优于3DGS方法和3DGS + EWA方法。特别的是,3DGS方法的渲染效果出现扩展伪影。EWA splatting方法使用大低通滤波器限制渲染图像的频率,这样会导致渲染效果过度平滑,尤其在低分辨率下尤为明显。

2 单尺度训练和多尺度测试效果展示

4.结论

论文提出的 Mip-Splatting方法通过引入3D平滑滤波器和2D Mip滤波器,显著改进了现有 3DGS 技术在不同采样率下的渲染质量。实验结果表明,Mip-Splatting方法能够有效消除混叠效应和伪影,显著提升了多视角合成的保真度和视觉质量。此外,Mip-Splatting方法仅需对现有3DGS代码进行少量修改即可实现,应用起来非常方便。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1953207.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

树和二叉树(不用看课程)

1. 树 1.1 树的概念与结构 树是⼀种非线性的数据结构,它是由 n(n>0) 个有限结点组成⼀个具有层次关系的集合。把它叫做树是因为它看起来像⼀棵倒挂的树,也就是说它是根朝上,而叶朝下的。 • 有⼀个特殊的结点&am…

大语言模型赋能设施农业:透过“智慧大脑“看智能环境调控

(文/ 于景鑫 北京市农林科学院)在上一篇专栏文章中,我们从宏观视角探讨了大语言模型为设施农业插上腾飞之翼的广阔前景。而要真正实现这一愿景,还需要在微观层面深入剖析LLM的技术原理和应用路径。本文将聚焦设施农业的核心环节之一——环境调控,看看&qu…

【解决】ubuntu20.04 root用户无法SSH登陆问题

Ubuntu root用户无法登录的问题通常可以通过修改‌SSH配置文件和系统登录配置来解决。 修改SSH配置文件 sudo vim /etc/ssh/sshd_config 找到 PermitRootLogin 设置,并将其值更改为 yes 以允许root用户通过SSH登录 保存并关闭文件之后,需要重启SSH服务…

Xshell、XFTP的安装配置及其使用

Xshell、XFTP的安装配置及其使用 Xshell的优点 安全远程连接: Xshell 使用 SSH 协议等安全协议进行远程连接,确保数据传输的加密和安全性。多会话管理: 用户可以同时管理多个远程连接,方便在不同服务器之间切换和操作。终端仿真…

html+css+js 实现马赛克背景按钮

前言:哈喽,大家好,今天给大家分享htmlcss 绚丽效果!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 文…

python爬虫-事件触发机制

今天想爬取一些政策,从政策服务 (smejs.cn) 这个网址爬取,html源码找不到链接地址,通过浏览器的开发者工具,点击以下红框 分析预览可知想要的链接地址的id有了,进行地址拼接就行 点击标头可以看到请求后端服务器的api地…

女人内裤怎么洗才是最干净?内衣裤洗衣机怎么样?哪个牌子更好?

最近刚好用到一款比较好用的洗内衣裤洗衣机!如果你也和我一样有洗内衣裤烦恼的,或者可以看看! 内衣裤作为贴身穿的衣服,我是不会把它和外衣一起清洗的,而家里面的大洗衣机已经担起了清洗外衣的工作! 朋友们…

React Router-v6.25.1

以下例子是根据vitereactts构建的,使用路由前先安装好这些环境!!!! 1、路由的简单使用 首先要创建一个浏览器路由器并配置我们的第一个路由。这将为我们的 Web 应用启用客户端路由。 该main.jsx文件是入口点。打开它…

【杰理蓝牙开发】AC695x 音频部分

本文主要记录 杰理蓝牙audio接口的使用,包括ADC和DAC原理的介绍和API接口的使用。 【杰理蓝牙开发】AC695x 音频部分 0. 个人简介 && 授权须知1. ADC【音频数据采集】硬件部分1.1 单片机引脚1.2 硬件电路设计1.3 MIC 输入通路解释 2. 【DAC】音频信号编解码…

GLSL教程 第9章:计算着色器

目录 9.1 计算着色器的基本概念 计算着色器的主要特点: 9.2 计算着色器的基础知识 1. 创建计算着色器 计算着色器代码: 2. 编译和链接计算着色器 示例代码: 3. 执行计算着色器 示例代码: 9.3 实现并行计算和数据并行处理…

51单片机-第五节-串口通信

1.什么是串口? 串口是通讯接口,实现两个设备的互相通信。 单片机自带UART,其中引脚有TXD发送端,RXD接收端。且电平标准为TTL(5V为1,0V为0)。 2.常见电平标准: (1)TTL电…

Mysql中如何实现两列的值互换?给你提供些思路。

文章目录 Mysql中如何实现两列的值互换1、第一感觉此sql应该能处理问题了2、需要一个地方存要替换的值,不然两列搞不定。2.1 加第三列?(能解决,但是看起来呆呆)2.2 上临时表(搞点弯路走走) 示例…

C语言画蜡烛图

GPT-4o (OpenAI) 在C语言中,绘制蜡烛图(Candlestick Chart)不是直接的任务,因为C语言本身不包含高级图形绘制库。然而,可以通过某些图形库来完成这项任务,例如使用GTK、SDL、OpenGL等。 以下是通过GTK库绘…

【iOS】—— retain\release实现原理和属性关键字

【iOS】—— retain\release实现原理和属性关键字 1. retain\reelase实现原理1.1 retain实现原理1.2 release实现原理 2. 属性关键字2.1 属性关键字的分类2.2 内存管理关键字2.2.1 weak2.2.2 assgin2.3.3 strong和copy 2.4 线程安全的关键字2.5 修饰变量的关键字2.5.1常量const…

北京率先建设AI原生城市,力争明年推出百个优秀行业大模型产品

7月26日,《北京市推动“人工智能”行动计划(2024-2025年)》(简称《行动计划》)正式向社会发布,新京报记者在北京市发展和改革委员会举行的新闻发布会上获悉,北京将率先建设AI原生城市&#xff0…

基于JSP的班级同学录网站

你好呀,我是计算机学姐码农小野!如果有相关需求,可以私信联系我。 开发语言:Java 数据库:MySQL 技术:JSPB/S架构 工具:Eclipse、Mysql 系统展示 首页 管理员功能界面 用户功能界面 论坛管…

ubuntu上部署vue项目到ngixn中+SpringBoot项目+postgresql数据库

文章目录 前提1.Ubuntu上安装ngix2.部署Vue项目2.1上传vue项目2.2.配置 3.Ubuntu上安装Postgres4.部署springboot项目 前提 记一次在ubuntu部署前端vue和后端springboot项目,以及数据库postgresql的安装以及启动、停止等常用的命令。 1.Ubuntu上安装ngix 1、检查…

探索 Python 的色彩世界:Colorama 库深度解析

文章目录 🌈 探索 Python 的色彩世界:Colorama 库深度解析背景:为何选择 Colorama?Colorama 是什么?如何安装 Colorama?简单库函数使用方法场景应用示例常见问题及解决方案总结 🌈 探索 Python …

Gartner发布2024年零信任网络技术成熟度曲线:20项零信任相关的前沿和趋势性技术

大多数组织都制定了零信任信息安全策略,而网络是零信任实施领域的顶级技术。此技术成熟度曲线可以帮助安全和风险管理领导者确定合适的技术,以将零信任原则嵌入其网络中。 战略规划假设 到 2026 年,15% 的企业将在企业拥有的局域网上用 ZTNA …