论文题目:NeRF-Supervised Deep Stereo
作者:Fabio Tosi ;Alessio Tonioni; Daniele De Gregorio等人
作者机构:University of Bologna(博洛尼亚大学);Google Inc(全球最大的搜索引擎之一);Eyecan.ai(韩国专注于开发眼动追踪技术的公司)
在公众号「3D视觉工坊」后台回复「原论文」,可获取对应论文pdf文件。
项目代码:https://github.com/fabiotosi92/NeRF
项目主页:https://nerfstereo.github.io/
本文提出了一种新的深度立体网络训练框架,可以从使用单个手持相机拍摄的图像序列中生成立体训练数据。这种方法利用了神经渲染解决方案提供的立体图像,跳过了基于ground-truth的训练,使用三元组来补偿遮挡和深度图像作为代理标签进行NeRF监督训练。实验结果表明,训练模型的效果比现有的自我监督方法提高了30-40%,在Middlebury数据集中达到了受监督模型的效果,而且大多数情况下在零拍摄泛化方面表现出色。
1 前言
本文介绍了神经渲染用于构建灵活可扩展训练数据的新范式,该方法可以轻松地训练深度立体网络且无需任何基础知识。该方法使用标准单手持