【3D目标检测】Orthographic Feature Transform for Monocular 3D Object Detection

news2025/1/31 23:03:42

目录

  • 概述
  • 细节
    • 网络结构
    • 正交特征变换模块
    • 其余部分

概述

本文是基于单目图像的3D目标检测方法。
【2018】【OFT-Net】
研究的问题:

  • 在图像表示中,物体的比例会随着深度的变化而变化;物体的外观随着视点的不同而不同;物体的距离(无论是物体相对于坐标系的绝对距离还是物体之间的相对距离)无法直接表示,且后者是没有意义的,会随着深度的变化而变化的。

提出的方法:

  • 作者认为应该在3D空间中进行检测,因此提出了一种可微的正交特征变换方式,将图像特征变换成正交的鸟瞰图特征,这种表示下物体的比例是均匀的,外观是与视点无关的,距离是有意义的。并且作者的方法没有显式的强调深度信息,作者认为图像特征到鸟瞰图特征的过程中已经隐式的建模了深度的信息。

细节

网络结构

  • 使用图像特征提取器提取图像特征
  • 使用正交特征变换模块将图像特征转换为正交的鸟瞰图特征
  • 一个CNN处理鸟瞰图特征
  • 检测头输出检测结果
    在这里插入图片描述

正交特征变换模块

这个模块的作用就是将图像特征转换为正交的鸟瞰图特征。
第一步就是将图像特征转换成体素特征,具体的做法是将体素投影到图像坐标系下,并且使用获得一个最小的边界框,接着聚合(全局平均池化)这个区域内的特征,将结果作为对应的体素特征。
在这里插入图片描述

第二步就是将体素特征转换成正交鸟瞰图特征,具体的做法是在z轴方向上做加权相加的操作。
在这里插入图片描述
然后作者觉得大批量的全局平均池化计算开销很大,使用了积分图做加速

其余部分

作者最后输出了一个置信度图,然后边界框预测部分的内容和我之前看大过的很多文章都不太一样,所以就没有仔细看了,以最新的文章给出的检测头配置以为边界框预测配置为主吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/104613.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

看漫画也能学Python?小学生都能学会,《看漫画学python 2》PDF中文超清版,可分享

学习Python的小伙伴大部分应该都知道《看漫画学Python:有趣、有料、好玩、好用(全彩版)》这本书! 《看漫画学Python》进阶版,在第1版的基础上讲解Python进阶知识,帮助读者完善Python知识体系,提…

点云Delaunay三角剖分(三维)

文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 四面体网格是一种三维非结构化网格,它划分了一个三维域。这种类型的分区有许多有利的性质。例如,它很适合具有任意复杂几何结构的领域,它可以很容易地在局部细化和粗化(没有悬挂节点),并且它可以完全自动地创建…

GitHub上超强Python零基础入门学习资源,让你的学习事半功倍

根据2020年StackOverflow开发者调查报告,Python是世界上最受欢迎的语言之一,排名仅次于Rust和TypeScript。更令人惊讶的是,Python是开发人员最想尝试的语言。 如果你是一位使用Python的开发人员,而且希望提高自己的技术水平&…

【Numpy基础知识】使用genfromtxt导入数据

使用Numpy进行I/O操作 来源:Numpy官网:https://numpy.org/doc/stable/user/basics.html 文章目录使用Numpy进行I/O操作导包【1】定义输入【2】将行拆分为列【3】跳过行和选择列【4】选择数据类型【5】设置名称【6】调整转换【7】快捷键功能NumPy 提供了几…

JAVA面试(不同类型的公司特点)

工作那么多年面试过很多公司,同时也面试过很多求职者。作为一个JAVA程序员,10年风雨路,10年技术路,一路走来,实属不易,JAVA语言从诞生,到发展起来,到风靡全球,到如今的混…

java回顾:私服搭建

目录 一、搭建私服 1.1、搭建私服原因 1.2、nexus软件的安装 1.3、私服的使用 1.4、仓库介绍 1.5、从私服下载资源 1.6、下载失败 1.7、将资源上传到私服 1.7.1 问题 一、搭建私服 1.1、搭建私服原因 公司开发了jar包,可供其他项目组使用、无网络使用…

次世代培训——我们从游戏美术发展历程讲起

自90后们记忆最初的小霸王游戏算起,中国游戏大致经历了从像素时代-预渲染时代-初世代-中世代-次世代这样几个阶段的变革。有趣的是,当主机、PC游戏早已跨过了像素时代,手游的兴起和发展却依然要遵从这一发展规律从头开始,当人们已…

FineReport智能报表工具- CSS修改控件样式

1. 概述 1.1 使用场景 在实际项目中,为了让 FineReport 报表中的控件和页面风格一致, 可以通过 CSS 修改控件的显示样式。 如下图所示,希望参数面板上文本框控件的边框变为红色,字体颜色变为蓝色。 除更换控件字体、修改边框颜色…

从风控中那些被标准化定义的问题谈起

说到风控业务中被标准化的定义问题,作为风控人最应该来谈谈这个内容,尤其是在数字化的风控内容上。数字化风控的标准化程度较高,在互金经过了一番喷薄的发展后,对于SOP守则,业务问题的定义及留给后续从业者可借鉴的资料…

足球人生:青春不过几届世界杯

🎉花有重开日,人无再少年。将近一个月的卡塔尔世界杯正式落帷幕,见证了最伟大的世界杯决赛,新老两代球王的巅峰对决,节奏拉满。诸神黄昏,球王加冕,最完美的结局。究竟怎样的颠沛流离才配得上这一…

web--拉灯泡切换黑天与白夜的精美动画

功能: 进入界面会出现一个灯泡(下面有可以自由飘动也可以自由拉动的绳子),鼠标左键按住不松开可以拉动绳子,松开变化亮起,同时有拉响的清脆声响,把它放在web作业的设计里面绝对是非常非常不错的…

SQL注入总结复习

SQL注入总结复习 一、前提 1、web三层架构 学习SQL注入,前提必须要了解web程序的三层架构。 数据访问层(DAL):主要负责对数据库进行增删改查,将存储在数据库中的数据提交给业务层,同时将业务层处理的数据…

第七章 集合相关知识

什么是集合 为了存储不同类型的多个对象, Java提供了一系列特殊的类, 这些类可以存储任意类型的对象,并且存储的长度可变,被统称为集合。集合可以简单理解为一个长度可变可以存储不同数据类型的动态数组。集合都位于java.uti包中,使用集合时必须导入java.util包。 …

前端二面必会手写面试题汇总

实现Vue reactive响应式 // Dep module class Dep {static stack []static target nulldeps nullconstructor() {this.deps new Set()}depend() {if (Dep.target) {this.deps.add(Dep.target)}}notify() {this.deps.forEach(w > w.update())}static pushTarget(t) {if …

LeetCode刷题复盘笔记—一文搞懂动态规划之300. 最长递增子序列问题(动态规划系列第二十七篇)

今日主要总结一下动态规划的一道题目,300. 最长递增子序列 题目:300. 最长递增子序列 Leetcode题目地址 题目描述: 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除…

想要月入过万?不防尝试一下Python这个职业!

自从20世纪90年代初发布以来,Python一直相当火爆,在这二十多年里,它的流行程度远远超过了C、C#、Java甚至Javascript。 Python为什么受欢迎? Python迅猛发展背后的一个主要驱动力是它学习起来相当容易,使用起来功能强…

程序员需要了解的硬核知识CPU

大家都是程序员,大家都是和计算机打交道的程序员,大家都是和计算机中软件硬件打交道的程序员,大家都是和CPU打交道的程序员,所以,不管你是玩儿硬件的还是做软件的,你的世界都少不了计算机最核心的 - CPU C…

【C语言进阶】通讯录不好用?进来,零基础带你写出自己的通讯录

目录 🤩前言🤩: 😎正文:编写通讯录😎: 1.文件建立: ①.头文件Contact.h: ②.函数定义文件Contact.c: ③.工程测试文件test.c: 2.通讯录整体执行…

A White Paper on Neural Network Quantization--阅读笔记1

A White Paper on Neural Network Quantization--阅读笔记1一、模型量化的意义二、量化主要做什么三、目前量化主要分类四、量化基本知识介绍0、基本知识1、误差来源2、量化范围的设定五、量化方法介绍1、均匀仿射量化(Uniform affine quantization)2、对称均匀量化(Symmetric …

热门技术中的应用:微服务相关协议-第35讲-二进制类RPC协议:还是叫NBA吧,总说全称多费劲

前面我们讲了两个常用文本类的RPC协议,对于陌生人之间的沟通,用NBA、CBA这样的缩略语,会使得协议约定非常不方便。 在讲CDN和DNS的时候,我们讲过接入层的设计,对于静态资源或者动态资源静态化的部分都可以做缓存。但是对于下单、支付等交易场景,还是需要调用API。 对于…