70、SSDNeRF: Semantic Soft Decomposition of Neural Radiance Fields

news2024/11/23 18:48:02

简介

官网:https://www.siddhantranade.com/research/2022/12/06/SSDNeRF-Semantic-Soft-Decomposition-of-Neural-Radiance-Fields.html
SSDNeRF,将语义信号与场景的辐射信号联合编码,提供了场景的软分解为语义部分,能够正确编码沿同一方向的多个语义类混合——这对现有方法来说是不可能的壮举,这不仅带来了场景的详细3D语义表示,还表明用于编码的MLP的正则化效果有助于改善语义表示
在这里插入图片描述
给定一组RGB图像及其由Mask-RCNN等神经网络计算的分割掩码,SSDNeRF从新的视角自动渲染图像及其深度图,以及其软分割和软语义分解。SSDNeRF分解场景的体表示,从而将语义分割从2D提升到3D

共享点:

  • 一种将神经辐射场分解为一组软语义层的新方法
  • 一组改善重建图层几何质量的损失
  • 一种以时间一致的方式操作自由视点视频的系统,同时尊重细节和保留视点相关的效果

实现流程

论文是基于Instant-ngp的重新实现。通过有 M 个颜色和密度输出来扩展NeRF架构,其中 M 是分割层的数量。此外,用类似于Nerfies的变形场扩展它,它使用刚性转换的螺旋轴表示。与Nerfies类似,在变形场的拉普拉斯上使用正则化子。

下图显示了网络体系结构。当M = 1时(在去除语义损失和提议的正则器后使用单个类),网络架构为Instant-ngp。

Nerfies网络结构
在这里插入图片描述
SSDNeRF网络结构

在具有视图方向 d 和外观代码 l 的标准框架中的每个点 x上,预测每个语义类的颜色 c i c_i ci 和透明度 σ i σ_i σi
在这里插入图片描述

SSDNeRF变形场:在时间 t 的每一点x处,变形场输出螺旋轴参数r, v。在这里插入图片描述

该方法不是为场景生成单个密度场和辐射场,而是为每个语义层生成密度场和辐射场,以表示语义类之间的软转换。使用了一组正则化,利用这种分解来生成高质量的语义层

原始NeRF公式
在这里插入图片描述
在空间的同一点,最终的累积 σ 值应该是所有层的材料密度的总和,最终的颜色应该由各自的层密度加权
论文体渲染公式
在这里插入图片描述
除了渲染所有层外,还可以只使用密度 σ i σ_i σi 和颜色 c i c_i ci 来渲染第 i 个语义层.第 i 个语义 mask 可以使用密度 σ 和颜色 σ j i σ j \frac{\sigma^i_j}{\sigma_j} σjσji 进行渲染
在这里插入图片描述
其中 KaTeX parse error: Expected '}', got 'EOF' at end of input: {\sigma^i_j 是语义层 i 在样本点 j 沿射线 r 的密度

SSDNeRF体渲染公式推导

对连续的体渲染公式转换为离散形式过程如下

在这里插入图片描述
在这里插入图片描述
为了将一个NeRF分解为M个语义层,扩展了这个公式,并生成每个层 F 的颜色和密度值: ( x , d ) → ( c 1 , σ 1 , … c M , σ M ) (x, d)→(c^1, σ^1,…c^M, σ^M) (x,d)(c1σ1cMσM),SSD连续体渲染公式如下
在这里插入图片描述
转化为离散形式
在这里插入图片描述
可以通过保持第 i 层的密度相同,并将其他层的密度设置为0来生成第 i 层,其中 T j i = e x p ( − ∑ k = 1 j − 1 σ j i δ j i ) T^i_j = exp \big( -\sum^{j-1}_{k=1} \sigma^i_j \delta^i_j \big) Tji=exp(k=1j1σjiδji)
在这里插入图片描述
生成第 i 个分割掩码可以通过将第 i 层的颜色设置为1,而其他层的颜色设置为0

在这里插入图片描述

损失函数

层分解允许每个层独立正则化,在训练过程中,最小化一组损失,每一组损失在优化过程中发挥着关键作用
在这里插入图片描述

Color Loss

在这里插入图片描述
R是每个批次中的光线集合

Semantic Loss

引入一个语义项损失最小化的区别和真值语义呈现面具,语义面具从 Mask-RCNN 模型生成用于监督和容易包含异常值,因此使用一个健壮的损失 γ≤1,为了考虑类别不平衡,使用其 instantaneous recall (即在每个训练批次内)导致的每个类别单独权衡
在这里插入图片描述
其中 R i = T P i P i R^i = \frac{TP^i}{P^i} Ri=PiTPi 是类别i的召回率,即true positives TP 与该类别所有 positives P的比率

Sparsity Loss

如果没有进一步的正则化,重建的模型容易在接近训练相机位置和半空中出现半透明材料,这些是过度拟合的伪影,通常来自于错误建模的视角相关效应,为了减少这种部分不透明度的发生,引入了稀疏性损失,有利于不透明度趋近于0或1
在这里插入图片描述

Group Sparsity Loss

尽管二维语义分割掩码是有噪声的,但我们知道,在大多数情况下,空间中的任何点上都应该存在很少的语义类别,用一个额外的正则化术语来表述这个期望的属性,以最大限度地减少语义层之间不透明的共同出现,对每个样本来说,只有一个不透明度值趋向于1,其他趋向于0
在这里插入图片描述

训练细节

使用 NVidia RTX 3080 GPU 迭代 50k次,使用Adam优化器,学习率为 1 0 − 2 10^{-2} 102 β 1 = 0.9 β 2 = 0.99 \beta_1 = 0.9 \beta_2 = 0.99 β1=0.9β2=0.99,没个betch中使用2048条射线,semantic loss中 λ = 1 \lambda = 1 λ=1,sparsity loss 和 group sparsity loss中 λ = 0.8 \lambda = 0.8 λ=0.8,各个损失的权重为, λ c o l o r = 1 \lambda_{color} = 1 λcolor=1 λ s e m = 1 0 − 1 \lambda_{sem} = 10^{-1} λsem=101, λ g r o u p = 1 0 − 3 \lambda_{group} = 10^{-3} λgroup=103

实验

在这里插入图片描述
在这里插入图片描述
上图为SNeRF,下图为SSDNeRF

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/157762.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【HCIA-openEuler】实验手册—09【openEuler综合实践】

文章目录一、实验介绍1、关于本实验2、实验目的二、实验任务配置1、配置思路2、配置步骤步骤1:挂载系统ISO,并配置好本地dnf源步骤2:配置软件安装源步骤3:安装文件共享服务三、设置文件共享用户与权限1、实验介绍(1&am…

【Linux】编辑器 - vim 的使用与配置

目录 1、vim的基本概念 2、vim的基本操作 2.1、vim 编辑器的进入与退出 2.2、插入模式 2.3、命令模式 2.4、底行模式 3、vim的配置 3.1、自定义配置 3.2、自动化配置 vim 的前身是 vi,vi/vim的区别简单点来说,它们都是多模式编辑器,…

Java对时间的处理

Date用的最多这里主要介绍该类。java.util 包提供了 Date 类来封装当前的日期和时间。 Date 类提供两个构造函数来实例化 Date 对象。 package com.company; import java.util.Date;public class Main {public static void main(String[] args) {// write your code hereSyste…

阿里云Docker仓库操作

为什么用阿里云docker有自己的仓库服务器,但是对没掏钱的(白嫖)用户并不是那么友好,有两个很大的限制:免费用户,在6个月之内如果没有任何操作,将会被自动删除,真的很糟糕啊。匿名用户…

港科夜闻|广州市花都区与香港科大(广州)合作建设科研智库,发展AI智慧农业...

关注并星标每周阅读港科夜闻建立新视野 开启新思维1、广州市花都区与香港科大(广州)合作建设科研智库,发展AI智慧农业。1月8日,广州市花都区人民政府和香港科大(广州)在广州举行签约仪式,根据协议,香港科大(广州)和花都区人民政府…

JS案例:接口加解密与防重放

目录 前言 功能设计 客户端的功能点(client) 服务端的功能点(server) 功能实现 工具函数 client.js(客户端) server.js(服务端) 实现效果 写在最后 前言 在网络通信中&am…

远程会计人员如何通过数字工作流程完成工作

远程会计人员如何通过数字工作流程完成工作 当大多数员工居家办公时,会计部门通常会敏锐地感受到挑战。如果您的组织开始数字化转型或只迈出了第一步,您会发文档管理系统现在已成为必备品,而不是可有可无的。现在是时候实施数字工作流程&…

论文投稿指南——中文核心期刊推荐(地理学)

【前言】 🚀 想发论文怎么办?手把手教你论文如何投稿!那么,首先要搞懂投稿目标——论文期刊 🎄 在期刊论文的分布中,存在一种普遍现象:即对于某一特定的学科或专业来说,少数期刊所含…

Mysql操作指令

Mysql操作指令 创建数据库 下面写具体案列一步步学 这里基本上线在sqlyog里面写sql,因为关于java程序和mysql数据库的连接还没有学 图形化操作数据库之前的可视化有 这里只讲指令凑在哦 注意 默认创建库 用uft8字符集,校对规则的uf8_general_ci不区分大…

< Linux >:环境变量

目录 环境变量 常见的环境变量 基本概念 查看环境变量内容的方法 测试环境变量PATH 与环境变量相关的命令 Linux操作系统下C/C程序代码中获取环境变量的方式 环境变量的组织方式 环境变量通常具有全局属性 环境变量 问题: 注意:可执行程序 等价于 命令/指…

Flutter 开发一个自己的 package(纯Dart)并提交到pub.dev上

小提示第一步:创建一个 package第二步:实现我们的package第三步:发布到 pub.dev 上。END发布的准备工作小提示 Flutter 轮子库。本文是为大家讲述怎么自己写个轮子发布到到上面。 https://pub.flutter-io.cn/packages 第一步:创建…

P2P僵尸网络-家族类别

Pink Pink 家族曾在中国境内感染了超过百万级的设备,其非实效性指令通过 P2P 传递,实效性强的指令通过集中控制的方式发布。是一个设计巧妙的 P2P 僵尸网络家族 Pink 僵尸网络概述 Pink 主要针对基于 mips 的光纤路由器,并且具有非常强大的和…

如何使用人力资源软件识别保留优秀员工

在企业信息化的时代,越来越多的年轻员工开始追求他们的激情,辞掉那些乏味的工作,而选择加入重视员工生活质量的企业。他们不再追随那些以牺牲员工福利为代价追求利润的公司。 员工认可度有助于加强组织中的团队合作关系,反过来&a…

VS 17.5 预览版2:/Gw链接开关的标准一致性改进

/Gw 链接开关可以告诉链接器优化代码中的全局数据,从而减小最终生成的二进制文件的大小。在 Visual Studio 17.5 预览版2中,我们新增了一个新的标志:/Zc:checkGwOdr[-] ,目的是在使用 /Gw 开关的时候改进对 C 标准的一致性支持。 …

表情包也能用 AI 生成?如何借助 AIGC 自定义专属表情包 #Memix

随着我们越来越离不开社交媒体,表情包也已经成为我们日常生活中的必备单品。有着个人鲜明风格的「表情包」,不仅是独特的「社交名片」,也能给人留下耳目一新的印象!谁的收藏夹里没有一堆私藏表情包呢!Memix借助 AI 技术…

画中画怎么制作?教你如何录制画中画视频,图文教学

很多小伙伴在录制视频的时候,都需要录制摄像头,以画中画的方式放置在视频当中。在网上眼花缭乱的录屏软件里,有不少的录屏软件是无法做到画中画视频的。画中画怎么制作?今天小编分享2个录制画中画视频的方法,一起来看看…

实心球状CdSe/ZnS/硫量子点QD-AFP-Ab/CPV VLP标记抗体/蛋白的制备方法与电镜表征

实心球状CdSe/ZnS/硫量子点QD-AFP-Ab/CPV VLP标记抗体/蛋白的制备方法与电镜表征 今天小编分享量子点标记蛋白,一起看看吧: 量子点标记蛋白的制备过程: 将纯化后的 CPV-VP2蛋白溶液(测定OD2802.0,蛋白浓度为2mg/ml)和…

CTK Plugin Framework插件框架学习--CTK服务工厂

一、前言 注册服务的时候能够用服务工厂来注册; 访问服务getServeice中的plugin参数是执行ctkPluginContext::getService(const ctkServiceReference&)的插件,从而工厂根据执行的不同插件名称返回不同的服务实现 服务工厂的作用 在服务中可以知道…

华为NAT实验配置

路由器基础配置 AR2 int g0/0/3 ip add 192.168.10.254 24 int g0/0/2 ip add 192.168.20.254 24 int g4/0/0 ip add 192.168.30.254 24 int g0/0/1 ip add 10.0.23.2 24 int g0/0/0 ip add 10.0.12.2 24 ip route-static 192.168.11.0 24 10.0.12.1 ip route-static 192.168.2…

2022年中国数据库排行榜年终盘点-墨天轮

深山虎啸雄风在,绿野兔奔好景来。 崭新的2023年已经到来,在2022年里,国产数据库行业发生了翻天覆地的变化,投融资此起彼伏,国产化替代进程加速,国产数据库行业发展的如火如荼。墨天轮12期中国数据库排行榜解…