3D 生成重建007-Fantasia3D和Magic3d两阶段玩转文生3D

news2024/10/2 14:32:46

3D生成重建3D 生成重建007-Fantasia3D和magic3d


文章目录

    • 0 论文工作
    • 1 论文方法
      • 1.1 magic3d
      • 1.2 Fantasia3D
    • 2 效果
      • 2.1 magic3d
      • 2.2 fantasia3d

0 论文工作

  两篇论文都是两阶段法进行文生3d,其中fantasia3D主要对形状和外表进行解耦,然后先对geometry进行生成,在结合几何对texture进行生成。在几何阶段是用DMTet形式进行表示,在纹理阶段使用的是PBR对材质进行表达,因为这篇论文使用的是 传统的渲染管线,本来应该比nerf表示的形式要快一些,但是由于使用了两个步骤的扩散,所以一正负,应该也没优势了,他最大的优势就是可以无缝衔接现有的渲染管线,在下游的任务中可以直接使用,这一点是由于nerf表示的形式的。
  其中Magic3D的两阶段,是先生成一个coarse nerf,提取出mesh在第二阶段进行生成优化提升到高分辨率。不过magic3d生成风格上还是略显不足。但是相比于freamfusion的6464的低分辨率,magic3d提升到512512在高频信息和细节这个点上,magic3d还是提供一个优化思路的。速度上由于粗体低分使用更高效的instantNGP和第二阶段使用的传统渲染的优势,在速度上较dreamfusion还是提升了2倍左右。论文还讨论了使用dreambooth 这个Personalized 文生图扩散模型进行更加细致的3d生成,因为文本的描述是不同图像中的细节丰富。dreambooth3d也是使用想的思路进行的。
  他们的共同的另外一个优势是,因为是最终的形态是以mesh形式表示,所以即使生成更高分辨率的时候计算量也不会比nerf形式的表达增加的多。
  他们在两个阶段都是使用sds损失,这一点上并没有变化。有趣的是,fantasia3d使用的dmtet表达形式是magic3d作者他们组的前期工作,这篇论文时间线也是在magic3d之后,应该又受到magic3d的启发。此前学习magic3d作者的一些其他工作比如GET3D等,膜拜,心向往之。
参考
magic3D
fantasia3d

1 论文方法

1.1 magic3d

请添加图片描述
  这个论文应该是围绕003dreamFusion中提到生成的结果分辨率比较低的问题的一种解答方式。前面虽然提到他的风格问题,但是由于分辨率的提升他的细节确实更加丰富。
  如上图所示,第一个阶段等价于dreamfusion不过它采用的是InstantNGP表达形式(一个更快速的nerf方案),他实在一个低分辨率的阶段进行的,一方面可以节省算力,一方面是因为nerf的表达形式先天具有一个一致性优势,所以在coarse阶段用nerf表达还是能带来很多优势。
  经过第一个阶段对mesh进行提取,采用的是DMtet这种mesh表达形式。在第二阶段中会额外增加了一个编码器在隐空间进行,所以在接下来有利于提升到高分辨率。
整体来说,先用nerf在视角一致性的优势,第二阶段使用mesh管线的速度优势,使得该方法在速度和结果上面都取得一定的效果。

1.2 Fantasia3D

请添加图片描述
如上图所示,fantasia3d采用的是一种解耦的思路,将3d物体解耦为geometry和appearance,然后先进行geometry进行生成,在生成外观。在第一阶段,直接用一个dmtet形式表示一个初始化的球,然后进行渲染,得到mask和法线,将二者输入到扩散模型中进行优化,可以对geometry进行优化。第二阶段是用PBR进行材质标识,然后基于几何进行外表的优化。得益于伦恩使用的PBR表示appearance的形式,他的材质标识结果确实更加真实一些。
比较有意思的点就是论文是将法线和mask作为扩散模型的输入,虽然在controlnet中作者证明了可以使用法线和深度作为条件进行扩散,但是直接用发现作为输入也是很震惊。

2 效果

2.1 magic3d

请添加图片描述

2.2 fantasia3d

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1089449.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第五章 图

第五章 图 图的基本概念图的应用背景图的定义和术语 图的存储结构邻接矩阵邻接表 图的遍历连通图的深度优先搜索连通图的广度优先搜索 图的应用最小生成树拓扑排序 小试牛刀 图的基本概念 图结构中,任意两个结点之间都可能相关;而在树中,结点…

接口自动化测试,完整入门篇

1. 什么是接口测试 顾名思义,接口测试是对系统或组件之间的接口进行测试,主要是校验数据的交换,传递和控制管理过程,以及相互逻辑依赖关系。其中接口协议分为HTTP,WebService,Dubbo,Thrift,Socket等类型,测试类型又主…

Web安全基础:常见的Web安全威胁及防御方法 |青训营

Web安全基础:常见的Web安全威胁及防御方法 在现代Web开发中,安全性至关重要。Web应用面临各种潜在的威胁,包括跨站脚本(XSS)、跨站请求伪造(CSRF)等。了解这些威胁以及如何防御它们&#xff0c…

c语言练习87:合并两个有序数组

合并两个有序数组 合并两个有序数组https://leetcode.cn/problems/merge-sorted-array/ 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中&#xff…

Excel 自动提取某一列不重复值

IFERROR(INDEX($A$1:$A$14,MATCH(0,COUNTIF($C$1:C1,$A$1:$A$14),0)),"")注意:C1要空置,从C2输入公式 参考: https://blog.csdn.net/STR_Liang/article/details/105182654 https://zhuanlan.zhihu.com/p/55219017?utm_id0

超越平凡:Topaz Photo AI for Mac带您领略人工智能降噪的魅力

在这个充满噪点和高频信息的时代,照片和视频的降噪成为了一个重要而迫切的需求。Mac用户现在有了一个强大的新工具——Topaz Photo AI for Mac,这是一款利用人工智能技术进行降噪和优化的软件。通过这款软件,您可以轻松地改善图像质量&#x…

呈现高效的软件测试技术 助力软件研发提升10倍质量

像大多数软件工程一样,软件测试是一门艺术。在过去十年中,自动化测试是测试软件的最佳方式。计算机可在瞬间运行数百个测试,而这样的测试集使公司能自信地每天发布数十个版本的软件。有大量资源(书籍、教程和在线课程)可用于解释如何进行自动…

金蝶EAS代码执行漏洞

【漏洞概述】 金蝶 EAS 及 EAS Cloud 是金蝶软件公司推出的一套企业级应用软件套件,旨在帮助企业实现全面的管理和业务流程优化。 【漏洞介绍】 金蝶 EAS 及 EAS Cloud 存在远程代码执行漏洞 【影响版本】 金蝶 EAS 8.0,8.1,8.2&#xf…

【Java学习之道】Java常用集合框架

引言 在Java中,集合框架是一个非常重要的概念。它提供了一种方式,让你可以方便地存储和操作数据。Java中的集合框架包括各种集合类和接口,这些类和接口提供了不同的功能和特性。通过学习和掌握Java的集合框架,你可以更好地管理和…

【python】anaconda中创建虚拟环境

创建虚拟环境 查看当前所有环境 首先打开Anaconda Prompt 初始进入的是base环境,如下。但是我们需要创建一个新的虚拟环境。 查看当前所有虚拟环境 conda env list 创建虚拟环境 conda create -n 虚拟环境名称 python3.10.1 这里使用conda create -n test python…

opencv dnn模块 示例(18) 目标检测 object_detection 之 pp-yolo、pp-yolov2和pp-yolo tiny

文章目录 1、PP-YOLO1.1、网络架构1.1.1、BackBone骨干网络1.1.2、DetectionNeck1.1.3、DetectionHead 1.2、Tricks的选择1.2.1、更大的batchsize1.2.2、滑动平均1.2.3、DropBlock1.2.4、IOU Loss1.2.5、IOU Aware1.2.6、GRID Sensitive1.2.7、Matrix NMS1.2.8、CoordConv1.2.9…

出差学知识No3:ubuntu查询文件大小|文件包大小|磁盘占用情况等

1、查询单个文件占用内存大小2、显示一个目录下所有文件和文件包的大小3、显示ubuntu所有磁盘的占用情况4、查看ubuntu单个包的占用情况 1、查询单个文件占用内存大小 使用指令:ls -lh 文件 2、显示一个目录下所有文件和文件包的大小 指令:du -sh* 3…

FastAdmin表格添加统计信息

如上图&#xff0c;在列表顶部添加订单统计信息&#xff0c;统计符合当前筛选条件的记录。 列表页html中&#xff1a; <div class"panel-body"><div id"myTabContent" class"tab-content"><div class"tab-pane fade active…

vue绑定style和class 对象写法

适用于&#xff1a;要绑定多个样式&#xff0c;个数确定&#xff0c;名字也确定&#xff0c;但不确定用不用。 绑定 class 样式【对象写法】&#xff1a; .box{width: 100px;height: 100px; } .aqua{background-color: aqua; } .border{border: 20px solid red; } .radius{bor…

vue单页面应用使用 history模式路由时刷新页面404的一种可能性

原先使用的是 hash模式路由&#xff0c;因为要结合qiankun进行微前端改造&#xff0c;改成了 history模式&#xff0c;结果页面刷新之后没有正确渲染组件。按照一般思路检查 nginx配置 try_files $uri $uri/ /index.html;也配置上了&#xff0c;还是有问题。 页面异常显示 问题…

通达信突破前高回踩选股公式,假突破的一种应对策略

对于突破型交易策略&#xff0c;经常遇到的问题就是股价突破了某个关键的压力位&#xff0c;但很快又回落到原来的区间&#xff0c;这也就是所谓的“假突破”。 对于假突破&#xff0c;我们可以从以下几个方面进行识别&#xff1a; 1、确认整体趋势&#xff0c;如果行情处于明…

暴力递归转动态规划(九)

题目 题有点难&#xff0c;但还挺有趣 有一个咖啡机数组arr[]&#xff0c;其中arr[i]代表每一个咖啡机冲泡咖啡所需的时间&#xff0c;有整数N&#xff0c;代表着准备冲咖啡的N个人&#xff08;假设这个人拿到咖啡后喝完的时间为0&#xff0c;拿手里咖啡杯即变空&#xff09;&a…

day05_数组

今日内容 另: return补充说明 0 数组复习 1 数组内存 2 数组其他声明方式 3 数组遍历 4 数组在方法中的使用 5 数组排序算法 0.1 复习 1 中文描述方法的定义 方法是一段功能代码,完成某些事情,是独立的有固定的写法 public static根据方法是否返回数据,来确定要不要设置返回值类…

Jmeter场景设置与监听

Jmeter场景设置 场景的概念: 场景是用来尽量真实模拟用户操作的工作单元&#xff0c;场景设计源自于用户真实操作。 场景设计: 场景设计是根据收集分析用户的实际操作而定义的Jmeter脚本的执行策略。 性能测试中涉及的基本场景有两种&#xff0c;即单一业务场景和混合业务场景…

Android Studio SDKGradleJDK等工具的正确使用

AS在安装使用过程中可能会占用C盘大量空间&#xff0c;对于C盘容量本来就小的人来说非常不友好&#xff0c;其实我们可以自定义安装路径 SDK默认安装位置 各种版本和NDK也会安装到这个路径 SDK版本选择性安装 通过选择图示的按钮&#xff0c;可以显示SDK的版本详情&#xff0…