计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D

news2024/11/24 6:00:00

《pi-GAN: Periodic Implicit Generative Adversarial Networks for 3D-Aware Image Synthesis

摘要

我们见证了3D感知图像合成的快速进展,利用了生成视觉模型和神经渲染的最新进展。然而,现有的方法在两方面存在不足:首先,它们可能缺乏底层的3D表示,或者依赖于视图不一致的渲染,从而合成不具有多视图一致性的图像;其次,它们往往依赖于表达能力不足的表示网络架构,因此它们的结果缺乏图像质量。我们提出了一种新的生成模型,称为周期隐式生成对抗性网络(π-GAN或π-GAN),用于高质量的3D感知图像合成。π-GAN利用具有周期激活函数和体积渲染的神经表示来将场景表示为视图一致的辐射场。所提出的方法在具有多个真实和合成数据集的3D感知图像合成中获得了最先进的结果。

实验效果

5ec2e7d0d3877fa5ef3bb385d08e277d.png

框架

pi-GAN的生成框架,

a52fd48e4091b89b71dfa4ed8e2b3a4e.png

地址:https://arxiv.org/pdf/2012.00926v2.pdf

《CIPS-3D: A 3D-Aware Generator of GANs Based on Conditionally-Independent Pixel Synthesis》

摘要

基于风格的GAN(StyleGAN)架构在生成高质量图像方面取得了最先进的成果,但它缺乏对相机姿势的明确和精确控制。最近提出的基于NeRF的GANs在3D感知生成器方面取得了巨大进展,但它们还无法生成高质量的图像。本文介绍了CIPS-3D,这是一种基于风格的3D感知生成器,由浅NeRF网络和深隐式神经表示(INR)网络组成。生成器在没有任何空间卷积或上采样操作的情况下独立地合成每个像素值。此外,我们诊断了镜像对称问题,这意味着次优解,并通过引入辅助鉴别器来解决它。CIPS3D经过对原始单视图图像的训练,在FFHQ上256×256分辨率的图像中,其令人印象深刻的FID为6.97,创下了3D感知图像合成的新纪录。我们还展示了CIPS-3D的几个有趣的方向,如迁移学习和3D人脸风格化。

框架

基于风格的 3D 感知生成器的详细超参数介绍。NeRF 网络很浅,以节省运行时内存。INR网络很深,以增加生成器的容量。我们将3D 形状和外观分开,其中 NeRF 网络负责 3D 形状,INR 网络负责外观。辅助鉴别器有助于克服镜像对称问题。对于 INR 网络,每个 ModFC 后面都跟着一个 LeakyReLU(此处未显示)。

ea666ba8536488ac1c6dc501afa17f6b.png

实验结

2dff907e7495e7d590911e5bc3ad025e.png

结论

本文提出了一种基于风格的 3D 感知生成器,可以独立合成像素值,无需任何空间卷积或上采样操作。我们发现输入坐标的对称性导致了镜像对称问题,并提出利用辅助鉴别器来解决这个问题。我们期待将所提出的生成器应用于更有趣的应用,例如 3D 感知 GAN 反转和图像到图像翻译。

论文地址:https://arxiv.org/pdf/2110.09788v1.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/846842.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ELK 将数据流转换回常规索引

ELK 将数据流转换回常规索引 现象:创建索引模板是打开了数据流,导致不能创建常规索引,并且手动修改、删除索引模板失败 "reason" : "composable template [logs_template] with index patterns [new-pattern*], priority [2…

SAP中采购文档出现定价转换因子字段溢出是何原因?

近期处理了一笔用户反馈的主题问题。这个问题有意思的地方地于,多重错误的叠加,导致了问题在开始就暴露出来,可以将隐患消除在萌芽状态。 在公司的应用中,会由采购创建价格合同,物流参照价格合同创建计划协议。但采购…

聊聊JDK动态代理原理

1. 示例 首先,定义一个接口: public interface Staff {void work(); }然后,新增一个类并实现上面的接口: public class Coder implements Staff {Overridepublic void work() {System.out.println("认真写bug……");…

为什么说用C端产品的思维做B端产品就是死路一条?

经常听行业大佬说起:如果用C端产品的思维做B端产品就是死路一条,那原因究竟是什么呢? 首先,需要明确的是C端产品和B端产品的用户群体和需求存在很大差异。C端产品的用户主要是消费者,更多的是被情感驱动。而B端产品的…

Visual Studio 2022安装教程(英文版)

文章目录 1.下载安装 1.下载 官网地址:https://visualstudio.microsoft.com/zh-hans/vs/ 选择第一个社区版本:Community 2022 安装 1.将下载好的文件保存到桌面,双击点开 2.等待visual studio installer配置好 3.点击安装后会来到配件选…

消息队列(3) -封装数据库的操作

前言 上一篇博客我们写了, 关于交换机, 队列,绑定, 写入数据库的一些建库建表的操作 这一篇博客中,我们将建库建表操作,封装一下实现层一个类来供上层服务的调用 , 并在写完该类之后, 测试代码是否完整 实现封装 在写完上述的接口类 与 xml 后, 我们想要 创建一个类 ,来调用…

使用OpenCV进行目标提取详细教程(附python代码演练)

今天的文章将讨论并指导你识别图像中的对象,使用 OpenCV 对这些对象进行遮罩处理。让我们开始吧! HSV 色标 请花一点时间观察下面的图片。每个图块似乎是不同的颜色,对吧?但是有一个有趣的地方:如果我们仔细思考&#…

B2B2C跨境独立站后台管理--支付系统开源搭建

要搭建一个B2B2C跨境独立站后台管理的支付系统,您可以按照以下步骤进行开发: 1. 确定需求和功能:首先,您需要明确支付系统的功能和需求,包括接入第三方支付平台、实现支付功能、订单管理、退款管理、对账功能等。 2.…

无涯教程-Perl - eval函数

描述 该函数在执行时判断EXPR,就好像EXPR是一个单独的Perl脚本一样。这使您可以在程序中使用单独的,也许是用户提供的Perl脚本。每次调用函数时,都会分别判断eval EXPR语句。 当解析脚本的其余部分时(执行之前),第二种形式判断BLOCK。 语法 以下是此函数的简单语法- eval …

Redis探索之旅

目录 今日良言:有志者自有千计万计,无志者只感千难万难 一、简介 二、Redis的安装 三、Redis的简单使用 四、Redis相关知识点 1.缓存分类 2.五大基本数据类型使用 3.持久化 4.常见面试题 今日良言:有志者自有千计万计,无…

【怎么提高性能和解决高并发】

怎么解决高并发 解决高并发的整体流程大概是: 先进行性能评估、再进行性能测试、然后找到程序可以承受的临界点、最后针对出问题的地方,进行优化。当然硬件设置对高并发的影响也很重要,如果达到硬件天花板,那么再怎么优化程序都…

如何实现网络数据传输

目录 前言 1.理解源IP地址和目的IP地址 2.理解端口号 2.1端口号与进程pid的关系 2.2源端口号和目的端口号 3.协议 3.1TCP协议 3.2认识UDP协议 4.网络字节序 5.socket编程接口 总结 前言 在上一篇文章网络框架中给大家对网络的整体进行了一个宏观的介绍,这…

理解递归方法

递归相关问题 树和二叉树相关的大部分问题二分查找相关问题快速排序、归并排序相关问题所有回溯的问题所有动态规划的问题 本质与特征 本质 本质就是方法的调用,而且是方法自己调用自己。 特征 执行时范围不断缩小,这样才能触底反弹终止(结…

使用MIT Kerberos Ticket Manager在windows下浏览器访问hadoop页面

Author : Spinach | GHB Link : http://blog.csdn.net/bocai8058文章目录 前言准备配置说明安装Firefox浏览器安装MIT Kerberos Ticket Manager客户端配置krb5.ini文件配置MIT Kerberos Ticket Manager客户端配置Firefox浏览器代理参数 访问WebUI 前言 kerberos是一种计算机…

亚马逊关键词下单的作用

在亚马逊上,关键词对于商品的搜索和发现起着非常重要的作用。当卖家在亚马逊上发布商品时,他们可以使用相关的关键词来描述该商品,这些关键词通常是与该商品相关的词汇或短语。 关键词下单的作用如下: 1、商品搜索: 买…

vue3+antd——实现个人中心页面+同步更改头部用户信息——基础积累

之前写过一篇文章关于vue3antd的框架模板,链接如下:http://t.csdn.cn/9dZMS 首先感谢大神提供的后台管理系统的模板,在此基础上改动要简单很多,主要是自己有很多内容不太敢随意改动。。。 直接看【个人中心】页面的效果图&#…

JavaScript事件委托与事件流+牛客例题

事件流: 概念:事件完整执行过程中的流动路径 说明:假设页面里有个div,当触发事件时,会经历两个阶段,分别是捕获阶段、冒泡阶段 简单来说:捕获阶段是 从父到子 冒泡阶段是从子到父 注意&…

TEMU美国儿童文具亚马逊CPC测试标准

美国站儿童文具类上架跨境电商平台美国站或者出口美国需要提交CPC认证,才能进入美国市场,由CPSC 认可的实验室出具的检测报告,确认每件商品均已过检测,符合上述适用要求。但许多亚马逊卖家反映:在亚马逊卖的文具类产品…

哪个思维导图软件好,知道这5个就够了!

思维导图作为一种有效的组织和展示思维的工具,广泛应用于学习、项目管理、创意发展等领域。然而,手工绘制思维导图费时费力,限制了其在快节奏的现代生活中的应用。本文将介绍5款可以一键生成思维导图的软件,它将通过智能化的方式&…

Chrome 谷歌浏览器,自动填充密码,提示需要输入电脑开机密码问题

我们在使用浏览器访问各个网站时,经常会保存密码。在下一次访问时,直接使用保存的密码填充,简单方便。 但是突然有一天(怀疑是谷歌浏览器更新导致的),每次使用密码填充时,都有如下拦截 拦截提…