论文笔记:Reinforcing Local Structure Perception for Monocular Depth Estimation

news2025/1/19 11:25:57

提出问题

  • 混合数据集中深度范围的变化会导致网络的不稳定。虽然已经引入了一些仿射不变的损失函数,但现有的方法可能会导致次优的几何结构,如模糊的边界和细节。

思路

  • 我们提出了一种新的像素级监督损失,称为 the windowed correlation regression loss。它计算加窗的皮尔逊(Pearson)相关系数来约束局部区域内数据分布的相似性。
  • 我们引入了一种新的从粗到细的多尺度法态损失,以进一步提高几何精度。

方法

  • SSI-MAE or ILNR 在同一了尺度和变换之后应用MAE损失。这样会导致模糊的边界和过度平滑的转变。相比之下,几何结构本质上是“区域化的”,这意味着可识别的结构需要由一个由区域内的所有像素组成的集体呈现。

在这里插入图片描述

  • Pearson correlation coefficient (PCC)(皮尔逊相关系数)用于统计学中,以度量数据分布之间的线性相似性,或通过灰度分布来量化图像的相似性。
  • 不同的区域可能仍然表现出相似的灰度分布。因此,我们打算联合一个几何约束损失,以提供更严格的几何监督。一项令人印象深刻的工作是虚拟正常损失 Virtual Normal Loss(VNL)。

两个损失函数的工作流程

  • Windowed correlation regression loss (WCR loss):深度图应根据真实标签 d ∗ d^* d分为边缘和非边缘块。
  • 首先利用Sobel 操作提取 d ∗ d^* d梯度图G。然后通过阈值分割G的的得到边图G。最后,通过扩张(dilation)操作减少伪影。
  • wPCC:在 d ∗ d^* d上随机采样M个 s × s s \times s s×s的块,定义为 d i ∗ d^*_i di.每一个块内又有边区域 d e d g e i ∗ d^*_{edge_i} dedgei以及 d n e d g e i ∗ d^*_{nedge_i} dnedgei
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

  • Coarse-to-fine multi-scale normal loss (CFMN loss)

  • 首先将深度转成3D点云:
    在这里插入图片描述

  • 在m个不同尺度上采样三个点 ( P A , P B , P C ) (P_A,P_B,P_C) (PA,PB,PC), 记为 P t o t a l = U j = 1 m P s j × t j , s j = h / 2 j , t j = w / 2 j P_{total} = U^m_{j=1}P_{s_j \times t_j}, s_j = h/2^j, t_j=w/2^j Ptotal=Uj=1mPsj×tj,sj=h/2j,tj=w/2j.

  • 网络通过优化视觉法向量误差最小化损失函数:
    在这里插入图片描述

在这里插入图片描述

补充内容

  • 皮尔逊相关系数( Pearson correlation coefficient),用于度量两个变量X和Y之间的相关(线性相关),介于[-1,1]之间。
  • 两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商在这里插入图片描述
  • 总体相关系数
    在这里插入图片描述
  • 样本的相关系数
    在这里插入图片描述
  • 总体和样本皮尔逊系数的绝对值小于或等于1。如果样本数据点精确的落在直线上(计算样本皮尔逊系数的情况),或者双变量分布完全在直线上(计算总体皮尔逊系数的情况),则相关系数等于1或-1。皮尔逊系数是对称的。
  • 皮尔逊相关系数一个重要的数学特性是,因两个变量的位置和尺度的变化并不会引起该系数的改变,即它该变化的不变量(由符号确定)。也就是说,我们如果把移动到和把Y移动到 c + d Y c+dY c+dY,其中a、b、c和d是常数,并不会改变两个变量的相关系数(该结论在总体和样本皮尔逊相关系数中都成立)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/982826.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

两个有序链表序列的交集

已知两个非降序链表序列S1与S2,设计函数构造出S1与S2的交集新链表S3。 输入格式: 输入分两行,分别在每行给出由若干个正整数构成的非降序序列,用−1表示序列的结尾(−1不属于这个序列)。数字用空格间隔。 输出格式:…

气传导耳机排名前十名,推荐几款性能表现不错的气传导耳机

​蓝牙耳机大家都很熟悉,如果更了解一些的朋友,一定也知道气传导耳机。气传导耳机最大的好处在于不入耳佩戴更舒适,户外使用时还能听到周围环境音,不会屏蔽汽车鸣笛声,使用更加安全。但也还有很多小伙伴不知道气传导耳…

css flex:1;详解,配合demo效果解答

前言 给设置了display:flex的子组件设置了flex:1;就能让他填满整个容器,如果有多个就平均 flex:1;是另外三个样式属性的简写,等同 flex-grow: 0; flex-shrink: 1; flex-basis: auto;我们就针…

idea插件推荐——Bito提高编码效率

Bito是一款在IntelliJ IDEA编辑器中的插件,Bito插件是由ChatGPT团队开发的,它是ChatGPT团队为了提高开发效率而开发的一款工具。Bito插件的强大之处在于它可以帮助开发人员更快地提交代码,同时还提供了一些有用的功能,如自动补全提…

it设备综合监控系统

IT综合监控系统是一系列IT管理产品的总称,具有功能齐全、应用便捷、解决方案齐全的产品,可一站式服务满足消费者的各种IT管理需求。该产品涵盖网络管理、服务器管理、存储系统、安全管理等方面,可为企业提供对整个IT系统的全方位监控和管理。…

【UIPickerView案例06-省市选择界面数据展示02-省市显示到Label上 Objective-C语言】

一、接下来,我要把城市、省、显示到下面的Label上 1.但是呢,我们现在能拿到它的Label吗, 是不是也是一样的,拖线啊 切换到三视图、选择ViewController.m文件 在类扩展里面, 左边这个呢,按住Control键,拖进来, Name:provinceLbl, 右边这个呢,按住Control键,拖进来…

G1 收集器【JVM调优】

文章目录 1. 分区收集器2. G1 收集器 1. 分区收集器 ① G1:分区算法,物理上不分代,逻辑分代。每次只回收快满了的几个小区域,对于较大的 Eden 区,回收效率还不算很高; ② ZGC:分页算法&#xff…

JS 一维数组 和 二维数组之间的相互转换

JS 一维数组 和 二维数组之间的相互转换 二维数组转一维数组一、需求二、分析1. 方法一(ES5)2. 方法二(ES6)3. 方法三(ES6)3. 方法四(ES5)4. 特殊说明:flat()方法会移除数…

基于Java+SpringBoot+Vue前后端分离电商应用系统设计和实现

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

streamlit执行报错WARNING,重新安装碰到问题如何解决

streamlit执行报错WARNING,重新安装碰到问题如何解决 如何解决1、卸载已经安装的程序2、再次安装程序3、出现如下yinstaller 警告问题:4、又出现“which is not on PATH”警告。5、解决方案 发现在安装的时候有很多WARNING出现,但是没有但回事…

C# OpenVino Yolov8 Detect 目标检测

效果 项目 代码 using OpenCvSharp; using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using static System.Net.Mime.MediaT…

线性代数(六) 线性变换

前言 《线性空间》定义了空间,这章节来研究空间与空间的关联性 函数 函数是一个规则或映射,将一个集合中的每个元素(称为自变量)映射到另一个集合中的唯一元素(称为因变量)。 一般函数从 “A” 的每个元…

数字化时代,企业为什么要做数字化转型?

企业需要在数字时代进行数字化转型的原因是多方面的: 1.竞争优势:数字化转型使企业能够获得竞争优势。通过采用先进技术和数字化运营,他们可以提供创新的产品和服务,比竞争对手更快地满足客户不断变化的需求。 2.提高效率和降低…

删除单链表偶数节点

本题要求实现两个函数,分别将读入的数据存储为单链表、将链表中偶数值的结点删除。链表结点定义如下: struct ListNode { int data; struct ListNode *next; }; 函数接口定义: struct ListNode *createlist(); struct ListNode *deleteeven( …

cookies 设置过期时间

1.如何在浏览器中查看cookie过期时间 F12-Application-Cookies可以查看到网页所有设置cookie值, 如果设置了过期时间的cookie是可以看到过期时间的持久cookie(persistent cookie), 没有设置过期时间的是会话cookie(s…

Java版工程行业管理系统源码-专业的工程管理软件-提供一站式服

鸿鹄工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离构建工程项目管理系统 1. 项目背景 一、随着公司的快速发展,企业人员和经营规模不断壮大。为了提高工程管理效率、减轻劳动强度、提高信息处理速度和准确性,公司对内部工程管…

Linux ubuntu磁盘扩容

1.服务器添加硬盘 2.linux系统重启 reboot 3.查看分区大小 lsblk 4.分配空间 growpart /dev/sda 3 lvextend -l 100%FREE /dev/mapper/ubuntu--vg-ubuntu--lv resize2fs /dev/mapper/ubuntu--vg-ubuntu--lv

SpringBoot+Vue 的留守儿童系统的研究与实现,2.0 版本,附数据库、教程

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝30W,Csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 文章目录 1.研究背景2. 技术栈3.系统分析4系统设计5系统的详细设计与实现5.1系统功能模块5.2管理员功能模块…

想考PMP,符合报名条件么?怎么报考?

报考PMP第一步就是了解报名条件: PMP考试如何报名? 先在PMI官网报英文报名,再在人才交流基金会上报中文报名以及缴费。 1、英文报名 PMP英文报名就是在PMI网站上提交对应的英文材料信息。不限时间,随时可以报名,报…

【2023高教社杯数学建模国赛】ABCD题 问题分析、模型建立、参考文献及实现代码

【2023高教社杯数学建模国赛】ABCD题 问题分析、模型建立、参考文献及实现代码 1 比赛时间 北京时间:2023年9月7日 18:00-2023年9月10日20:00 2 思路内容 可以参考我提供的历史竞赛信息内容,最新更新我会发布在博客和知乎上,请关注我获得最…