从CVPR 2024看 NeRF 最新改进&应用

news2024/11/23 15:53:56

三维重建领域必不可少的NeRF技术最近又有新突破了!

首先是SAX-NeRF框架,专为稀疏视角下X光三维重建设计,无需CT数据进行训练,只使用 X 光片即可,等于给NeRF开透视眼!

还有清华提出的GenN2N,一个统一的生成式 NeRF-to-NeRF 转换框架,适用于各种 NeRF 转换任务,在编辑质量、多样性、效率等方面都超越了SOTA!

这两篇都被收录于CVPR 2024,其中GenN2N更是获得了高分!值得一提的是本届 CVPR 录用论文中关于 NeRF 的论文数目也十分可观。

可见NeRF确实是一项创新且极具潜力的技术,它通过深度学习和体素渲染方法,实现了高度逼真的三维重建与视图合成,目前在自动驾驶、医学图像等领域都有非常广泛的应用。

为帮助大家快速了解并掌握最新的进展,我挑选了 CVPR 2024 有关 NeRF 改进与应用的研究成果 28 篇,希望可以给各位的论文添砖加瓦。

论文原文+开源代码需要的同学看文末

NeRF 改进

Structure-Aware Sparse-View X-ray 3D Reconstruction

方法:在本文中,作者研究了稀疏视图X射线三维重建中的一个核心问题,即如何有效捕捉被X射线穿透的各种复杂结构,为此作者提出了一个新的框架SAX-NeRF。

为了在空间中建模三维结构的依赖关系,作者设计了一个Transformer骨干网络Lineformer,将X射线分割成不同的线段,并在每个线段内计算自注意力。此外,为了提取投影中的2D几何和上下文表示,作者提出了一个包含像素级和补丁级采样的MLG射线采样策略。

创新点:

  • 提出了一种新颖的方法SAX-NeRF,用于没有CT数据进行稀疏视图X光3D重建的训练。

  • 设计了一种新的Transformer模型Lineformer,用于捕捉成像物体在3D空间中的复杂内部结构。

  • 设计了一种MLG采样策略,用于提取2D投影中物体的几何和上下文信息。

  • 建立了一个更大规模的基准数据集X3D,用于X光3D重建。

  • 实验证明该方法在不同X光应用场景的NVS和CT重建任务上,性能超越SOTA。

GenN2N: Generative NeRF2NeRF Translation

方法:本文介绍了GenN2N,这是一个统一的NeRF-to-NeRF转换框架,可以实现一系列的3D NeRF编辑任务,包括文本驱动编辑、上色、超分辨率和修复等。通过GenN2N,可以在推理时呈现编辑后的NeRF场景的至少两个渲染视图,生成具有适当的多视角一致性的高质量编辑结果。

创新点:

  • GenN2N使用2D到2D的图像翻译器进行2D编辑,并将结果整合到3D NeRF空间中,以确保3D一致性。

  • 提出了一个3D VAE-GAN框架,可以学习与一组输入编辑的2D图像相对应的所有可能的3D NeRF编辑的分布。利用对抗学习和对比学习技术,可以将3D编辑和2D相机视角从编辑图像中解耦合。

NeRF 应用

Customize your NeRF: Adaptive Source Driven 3D Scene Editing via Local-Global Iterative Training

方法:本文提出了一个统一的框架CustomNeRF,支持自适应源驱动的三维场景编辑,其中采用了一个主题感知的文本到图像(T2I)模型来将参考图像中的特定视觉主题V *嵌入到混合提示中,满足一般和具体的编辑要求。

创新点:

  • 提出了CustomNeRF模型,用于自适应源驱动的三维场景编辑,可根据文本或参考图像进行统一的编辑提示。通过解决确保仅对前景进行编辑和在使用单视图参考图像时保持多视图一致性这两个关键挑战,实现了精确的编辑。

  • 提出了一种类别引导正则化方法,利用T2I模型中的类别先验信息,以缓解图像驱动编辑中的Janus问题。

SANeRF-HQ: Segment Anything for NeRF in High Quality

方法:本文介绍了高质量3D分割的SANeRF-HQ框架,通过结合SAM和NeRF方法,实现对给定场景中任何目标物体的高质量3D分割,并在多个NeRF数据集上进行了定量和定性评估,展示了SANeRF-HQ在NeRF物体分割方面的优势,并展示了将该方法拓展到4D动态NeRF的潜力。

创新点:

  • 提出了SANeRF-HQ框架,结合了SAM和NeRF的优势,实现了高质量的三维分割。

  • 研究了在NeRF中实现高质量三维对象分割的方法,提出了SANeRF-HQ框架作为该领域的首次尝试。该方法在分割边界的准确性和多视角一致性方面取得了显著的进展。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR神经”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1893664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

7月2日PythonDay1

阶段一阶段导学 测试人员为什么要学习编程? Python是一门快速增长的计算机编程语言 白盒测试、自动化测试、测试开发 为什么学习Python? 相对于其他编程语言更简单 语言开源并且免费 使用人群广泛 应用领域广泛 学习目标 掌握python基础语法&…

你们叫AI,我们叫DI

大家好,才是真的好。 最近Notes/Domino产品在做哪些更新,想必大家都很好奇。 从2022年年末到现在,快两年了,任何一个有追求的大企业或巨头,应该都在追求实现一件事情:AI人工智能。 从小道消息来看&#…

Django创建项目

虚拟环境创建成功 使用命令行创建项目 创建一个文件夹,用pycharm打开,将之前创建好的虚拟环境选中(这一步不在仔细赘述了,比较简单) cd进入虚拟环境所在文件目录,打开虚拟环境pipenv shell 创建django项…

PDF怎么分割成一页一页的?原来可以这么轻松

PDF怎么分割成一页一页的?PDF文档因其跨平台兼容性和可打印性而被广泛使用,但有时为了便于发送电子邮件、管理文档或保护敏感信息,我们需要将一个大型的PDF文件分割成多个小文件。幸运的是,分割PDF文件并不复杂。下文中就介绍了三…

【讲解下AI Native应用中的模型微调】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

django开源电子文档管理系统_Django简介、ORM、核心模块

Django简介 Django是一种开源的大而且全的Web应用框架,是由python语言来编写的。他采用了MVC模式,Django最初是被开发来用于管理劳伦斯出版集团下的一些以新闻为主内容的网站。一款CMS(内容管理系统)软件。并于 2005 年 7 月在 BSD 许可证下发布。这套框…

模型优化Roof-line模型的使用

一、目录 定义求模型的计算强度,绘制屋檐模型,并分析绘制多级缓存的屋檐模型计算模型计算强度、工具A100显卡下模型分析分析如何提高模型的计算强度 二、实现 定义: Roof line Model(屋檐模型):模型在一个计算平台的限制下,到底…

Python番外篇之代码编译与字节码

引言 关于字节码,不太想讲,不影响实际使用,对新手不友好…… 但是,涉及到新手经常碰到的问题的解惑,似乎又不得不讲。 最终,还是打算以番外篇的形式,稍微提一下。 不过,关于字节码的…

恒创科技:HTTP错误码403禁止意味着什么,怎么修复它?

HTTP错误码403禁止意味着客户端无权访问特定网页或服务器。403 错误表示客户端存在问题,无论用户使用的是哪种网络浏览器,都可能发生这种情况。幸运的是,阻止服务器允许访问特定页面的问题通常可以修复。以下是一些常见原因和相应的解决方案。…

Playwright之录制脚本转Page Object类

Playwright之录制脚本转Page Object类 设计思路 : 我们今天UI自动化设计的时候,通常会遵循一些设计模式,例如Page Object模式。但是自己找元素再去填写有一些麻烦,所以我们可以通过拆解录制的脚本,将其中的元素提取出来…

行业洞察 | 2024应用程序安全领域现状报告

在信息爆炸的时代,我们每天都在使用各种应用,从社交娱乐到工作学习,应用已经成为我们生活中不可或缺的一部分。然而,你是否知道,在这些便捷的背后,隐藏着巨大的安全风险? 近年来,应用…

爬虫-网页基础

HTML 基本语法 HTML&#xff1a;Hyper Text Markup Language, 超文本标记语言&#xff0c;是计算机语言的一种&#xff0c;由元素构成。 p元素 <p>Web 真好玩&#xff01;</p> 由三大部分组成 开始标签&#xff1a;一对尖括号中间包裹这元素名称元素内容&#x…

中霖教育怎么样?注册会计师可以跨省考试吗?

中霖教育怎么样?注册会计师可以跨省考试吗? 1. 考试地点安排&#xff1a; 注册会计师考试是在全国范围内统一举行的&#xff0c;通常设在各省、自治区和直辖市指定的考区。考生须依据准考证上提供的信息&#xff0c;核实自己的具体考试地点。该考试实行的网上统一报名制度&…

mpeg格式怎么转换成mp4?这四种转换方法非常好用!

mpeg格式怎么转换成mp4&#xff1f;在数字视频领域中&#xff0c;MPEG格式算是相对冷门的一种选择&#xff0c;然而&#xff0c;选择这种格式却不是没有代价的&#xff0c;首先&#xff0c;MPEG采用了有损压缩技术&#xff0c;这意味着在视频处理过程中&#xff0c;会丢失一些细…

欧洲杯:高精度定位技术,重塑体育赛事新体验

随着科技的飞速发展&#xff0c;体育赛事的观赏体验与竞技水平正被不断推向新的高度。在即将到来的2024年欧洲杯赛场上&#xff0c;一项革命性的技术——高精度定位&#xff0c;正悄然改变着比赛的每一个细节&#xff0c;为球迷们带来前所未有的观赛享受&#xff0c;同时也为运…

Linux Shell 脚本入门教程:开启你的自动化之旅

目录 一、什么是Shell&#xff1f; 二、 编写第一个Shell脚本 ​编辑 2.2 变量 2.3 功能语句 2.4 数组 一、什么是Shell&#xff1f; Shell是一种计算机程序&#xff0c;它充当了用户与操作系统之间的接口。在Linux系统中&#xff0c;Shell允许用户通过命令行界面&#x…

揭开梵蒂冈秘密档案馆的神秘面纱

关注我们 - 数字罗塞塔计划 - PART 01 深邃的历史 梵蒂冈秘密档案馆起源于公元8世纪&#xff0c;负责保存官方文书和教皇书信。9世纪开始在圣彼得大教堂设立档案库&#xff0c;负责保管外交和法律文件&#xff0c;在帕拉蒂诺山塔内保存经济和行政方面的档案。11至13世纪&…

3.2ui功能讲解之graph页面

本节重点介绍 : graph页面target页面flags页面status页面tsdb-status页面 访问地址 $ip:9090 graph页面 autocomplete 可以补全metrics tag信息或者 内置的关键字 &#xff0c;如sum聚合函数table查询 instante查询&#xff0c; 一个点的查询graph查询调整分辨率 resolutio…

在地图上根据经纬度,画一个矩型围栏,设置每个点的经纬度

在做一个需求时有一个小点就是添加一个配送区域(5公里直径内的)矩形围栏 我做的比较简单 大家看看有没有帮助, 也是精简代码。测试效果上相对是精准的 //谷歌&#xff0c;根据经纬度获取以它为中心半径为5公里内的矩形的四个点经纬度getDefalutPoints (lng: number, lat: num…

【SpringCloud】Ribbon源码解析

ribbon是一个负载均衡组件&#xff0c;它可以将请求分散到多个服务提供者实例中&#xff0c;提高系统的性能和可用性。本章分析ribbon是如何实现负载均衡的 1、LoadBalanced 消费者在引入ribbon组件后&#xff0c;给http客户端添加LoadBalanced注解就可以启用负载均衡功能。Lo…