论文解读 | 透过窥镜: 透明容器内物体的神经三维重建

news2025/1/10 20:45:47

 原创 | 文 BFT机器人

随着虚拟现实和虚拟世界技术的发展,博物馆藏品的数字化是一个越来越受关注的新兴话题。世界上许多著名的博物馆都在为网上展览建立自己的数字馆藏。

在这些藏品中,有一种特殊而重要的藏品昆虫、人体组织、水生生物和其他易碎的标本需要保存在一些坚硬但透明的材料中(图1)。

为了将这些藏品数字化,抽象出一个独特的研究问题,即透过玻璃般的外部观察并恢复内部物体的几何形状。具体来说,任务是从场景的多个2D视图中重建感兴趣对象的3D几何形状。

图1

该任务的一个主要挑战是在空气和透明块的界面上由光的反复反射和折射引起的严重的图像畸变。由于它使单视点假设失效,大多数现有的多视点三维重建方法往往失败。因此,本文提出了一种新的方法ReNeuS,它使用一种新颖的混合渲染策略,考虑到玻璃/空气界面上多次光线反射和折射,以精确地重建三维模型。

01  该篇论文的创新点

1. 提出了一种新的研究问题,即透明容器内部物体的三维重建问题。

2. 提出了一种新的三维重建方法ReNeuS,该方法可以处理玻璃/空气界面上多次光线反射和折射,并且能够对复杂场景进行分割和重建。

3. 使用了一种基于射线跟踪和体积渲染技术相结合的混合渲染策略来处理两个子空间之间的光线交互,从而提高了重建效果。

图2 ReNeuS框架的概览图。

ReNeuS是一种新颖的神经重建方法,用于透明容器中昆虫的三维重建。该方法的主要步骤包括场景分割、神经渲染、反向传播训练和三维重建。

首先,对于给定的透明容器场景,ReNeuS将其分为内部和外部两个子空间(图2)。

内部子空间包含昆虫标本及其周围环境,而外部子空间则包含容器壁和周围环境。这种场景分割方式可以有效地减少光线追踪过程中的计算量,并提高重建精度。

接下来,ReNeuS使用多层感知器(MLPs)对内部场景进行编码,以表示几何和外观信息。

具体来说,ReNeuS使用隐式神经网络来表示内部场景的表面形状,并使用体积渲染技术来表示其外观特征。这种神经隐式表示方式可以有效地处理复杂的光线折射和反射现象,并提高重建精度。

然后,ReNeuS使用递归光线追踪过程来生成图像。

在每个迭代步骤中,通过神经隐式表示计算每个子光线的辐射度,并将其累加到颜色值中。这种神经渲染方式可以有效地处理复杂的光线传输现象,并提高重建精度。

接着,ReNeuS使用反向传播算法来训练神经网络,以最小化预测图像与真实图像之间的差异。

具体来说,ReNeuS使用渐进式训练策略来逐步优化神经网络的性能,以提高重建精度和泛化能力。在每个训练阶段,ReNeuS使用真实图像和预测图像之间的差异来计算损失函数,并使用反向传播算法来更新神经网络的权重。

最后,ReNeuS使用基于体素的三维重建算法来从渲染图像中恢复昆虫标本的三维形状。

具体来说,ReNeuS将渲染图像转换为体素表示,并使用Poisson重建算法来生成光滑的三维网格模型。这种基于神经网络和体素表示的三维重建方法可以有效地处理复杂的透明场景,并提高重建精度和效率。

02  实验

在实验中,作者使用了一个包含10个真实昆虫标本的透明玻璃容器数据集和一些合成数据集来评估他们的方法。作者还与其他基线方法进行了比较,包括传统的多视角立体重建方法和最新的深度学习方法。

结果表明,ReNeuS在处理透明场景中的三维重建问题方面表现出色,并且可以重建出小昆虫标本的翅膀和触角等细节结构。这些实验结果证明了ReNeuS方法的有效性和优越性。

图3展示了在合成数据集上使用ReNeuS和基线方法进行三维形状重建的结果。

表1展示了在合成数据集上使用ReNeuS和其他基线方法进行定性评估的结果。

图4展示了在真实数据集上使用ReNeuS和其他基线方法进行三维重建的可视化结果。

论文的结论是作者提出的ReNeuS方法可以成功地解决透明容器中物体的三维重建问题,并且在实验中取得了比其他基线方法更好的效果。

这个方法可以应用于数字化脆弱博物馆藏品等领域,为文化遗产保护和数字化提供了新的思路和方法。

网址:

https://xueshu.baidu.com/usercenter/paper/show?paperid=1m4q0tj0gc530ay0rs4p04w0e5712811&site=xueshu_se

标题:

Seeing Through the Glass: Neural 3D Reconstruction of Object Inside a Transparent Container

更多精彩内容请关注公众号:BFT机器人

本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/558773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ZooKeeper(一):基础介绍

文章目录 什么是 ZooKeeper?ZooKeeper 发展历史ZooKeeper 应用场景ZooKeeper 服务的使用ZooKeeper 数据模型data tree 接口znode 分类 总结 什么是 ZooKeeper? ZooKeeper 是一个分布式的,开放源码的分布式应用程序协同服务。ZooKeeper 的设计…

docker-compose安装nacos 2.2.1及配置

目录 官网 创建存储目录 创建数据库 application.properties配置(重要) docker-compose.yml 启动 登录 下面是安装nacos 2.2.1版本的方法,有一些变化 官网 GitHub - alibaba/nacos: an easy-to-use dynamic service discovery, configu…

SCTracker 跟踪论文阅读笔记

SCTracker 跟踪论文阅读笔记 SCTracker: Multi-object tracking with shape and confidence constraints 论文链接 (未开源状态) 论文主要更新点围绕shape constraint and confidence两点来展开: 首先论证在跟踪匹配的过程中D-box(检测框)与T-box(预测框)需要有一定…

今日的CSS小案例

个人名片: 😊作者简介:一名大一在校生,web前端开发专业 🤡 个人主页:几何小超 🐼座右铭:懒惰受到的惩罚不仅仅是自己的失败,还有别人的成功。 🎅**学习目…

第一篇、基于Arduino uno,获取dht11温湿度传感器的温度信息和湿度信息——结果导向

0、结果 说明:先来看看串口调试助手显示的结果,如果是你想要的,可以接着往下看。 1、外观 说明:虽然dht11温湿度模块形态各异,但是代码都是适用的,因为它们的模块都是一样的。 2、连线 说明:…

微博开发--微博官方API使用方法【从注册到实战】

第一步:微博开发者身份认证 访问微博开放平台,登录自己微博账号,登录之后首先需要完善开发者的基本信息。【使用个人】 填写完成之后【审核通过】如下: 第二步:创建自己的应用 【备注:如果只是为了测试…

逻辑回归及逻辑回归的评估指标

一、逻辑回归介绍 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 1.逻辑回归的应用场景 …

【腾讯云FinOps Crane 集训营】快速搭建一个 Kubernetes+Crane 环境,以及如何基于 Crane 优化你的集群和应用初体验

文章目录 一、活动介绍二、环境搭建三、安装本地的 Kind 集群和 Crane 组件四、界面截图五、主要功能六、整体架构七、Crane的优势八、总结参考文献 一、活动介绍 Crane 是由腾讯云主导开源的国内第一个基于云原生技术的成本优化项目,遵循 FinOps 标准,…

用java带你了解网络IO模型

目录 1.BIO1.1 简述1.2 代码示例1.3优点和缺点1.4 思考 2. NoBlockingIO2.1 简述2.2 代码示例2.3 优点和缺点2.4 思考 3. NIO(NewIO)3.1 简述3.2 代码示例3.3 优点和缺点3.3 思考 4. 扩展select/poll、epoll4.1 简述4.2 select/poll4.3 epoll4.4 扩展话题…

Linux之vim编辑器的使用

目录 一、vim是什么? 试验1: 二.命令模式继承用法: vim命令模式的快捷键: 光标移动: vim文本复制相关操作: vim文本编辑操作: 三.末行模式命令用法 部分快捷键: 四.vim编辑器的配置原理 一、vim是什么? vi…

Hive SQL语句的正确执行顺序

关于 sql 语句的执行顺序网上有很多资料,但是大多都没进行验证,并且很多都有点小错误,尤其是对于 select 和 group by 执行的先后顺序,有说 select 先执行,有说 group by 先执行,到底它俩谁先执行呢&#x…

智能结构诊断器:建筑结构健康的守护者

近年来,接二连三的自建房坍塌,超高层建筑震动,让建筑的健康和安全性成为了人们关注的焦点。为了确保建筑物的长期稳定性和安全性,迫切需要高效且准确的方法来监测结构的健康状况。智能结构诊断器的出现,让建筑结构监测…

大数据如何助力营销(5)活动复盘

在市场竞争日益激烈的今天,营销活动已经成为吸引用户、提升品牌影响力、增加销售转化的重要手段。然而,一场营销活动在举办后,往往难以评估活动的效果,而大数据技术将从方方面面、科学有效地复盘活动,并为下一次举办活…

chatgpt赋能Python-python_kbhit

Python kbhit - 帮助您掌握实时按键输入 如果您需要使用实时按键输入来控制您的Python程序,那么你需要知道的是Python kbhit。kbhit是一种允许用户实时按键输入并立即响应的技术。本文将介绍Python kbhit的用途和用法,并探讨实时输入如何帮助您掌控程序…

AI绘图学习心得分享-Midjourney绘画AI,让你少走一些弯路

本教程收集于:AIGC从入门到精通教程 AI绘图学习心得分享-Midjourney绘画AI,让你少走一些弯路 本篇没有什么长篇大论,全部都是实用心得总结。接下来,我们将分享关于Midjourney绘画AI的实用心得总结,包括构图指令结构、常用指令、操作技巧、常用风格词汇和构图词汇。 如果…

手机号码在网时长 API 实现广告投放和精准营销案例分析

引言 手机在网时长是指用户在移动网络上的在线时间,包括用户接入网络的时间和断开网络的时间。手机在网时长 API 是一种提供手机在网时长数据的编程接口,为开发者和服务提供商提供了获取和利用这些数据的能力。 本文旨在深入探讨手机在网时长 API 的技…

计算机视觉——day95 PANet:基于样本原型对齐的Few-Shot图像语义分割

PANet:基于样本原型对齐的Few-Shot图像语义分割 1. Introduction2. Related workFew-shot segmentation 3. Method3.1. Problem setting3.2. Method overview3.3. Prototype learning(原型学习)3.4. 非参数度量学习3.5. 原型对准正则化(PAR) 4. Experime…

MySQL高级 之 explain执行计划详解

使用explain关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的,分析你的查询语句或是表结构的性能瓶颈。 explain执行计划包含的信息 其中最重要的字段为:id、type、key、rows、Extra 各字段详解 id select查询的序…

前端安全和防护:如何保护网站和用户信息的安全

第一章:引言 在当今数字化时代,随着互联网的飞速发展,网站已成为人们获取信息和进行交流的主要渠道。然而,随之而来的是对网站安全的日益关注。作为前端开发者和网站管理员,我们有责任确保用户的信息和网站的安全。本…

可分析表情和情绪的轻量化眼镜:Emteq OCOsense解析

近年来,越来越多VR头显开始尝试结合眼球追踪、手势追踪等生物识别技术,甚至在一些VR社交场景,也在探索将Avatar与面部识别功能结合。可以想象,未来生物识别与AR/VR等穿戴技术的关系将越来越紧密,尽管现阶段相关硬件在体…