论文阅读笔记 | 三维目标检测——VeloFCN算法

news2024/11/21 19:58:59

如有错误,恳请指出。


文章目录

paper:《Vehicle Detection from 3D Lidar Using Fully Convolutional Network》

对于64线激光雷达全范围扫描出来的点云进行特征图的构建。对于具体的点(xyz坐标),其在水平方向上可以通过θ=arctan(y/x)来求出,其垂直方向上可以通过 φ = arcsin ⁡ ( z / ( x 2 + y 2 + z 2 ) ) φ=\arcsin(z/(x^2+y^2+z^2)) φ=arcsin(z/(x2+y2+z2))求出。也就是说,全范围上点云可以看成是一个圆柱状坐标分布,通过其水平和垂直上的方向角确定其在一个二维特征平面(point map)上的具体位置。其位置所在值有其深度信息( d = s q r t ( x 2 + y 2 ) d=sqrt(x^2+y^2) d=sqrt(x2+y2))与高度信息z来表示。也就是说,二维特征图point map上的每个位置对于着每个点在柱坐标上的位置,其channels为2,有深度信息d和高度信息z填充。如果点在某个位置重合,则取较近点位置,一般来说填充的两个chnnel值不会为0。

获得点云场景的二维特征后,就可以使用卷积神经网络来提取特征处理,其结构图如下所示。通过卷积核(4x2)下采样提取全局特征再进行上采样(4x2)与相同尺寸的特征图进行拼接,这样可以有效提高小目标检测率(这里VeloFCN没有说明具体的维度信息),最后再进行一个上采样分别为分类和回归构建与原尺寸(point map)一致的特征图,分别进行分类任务和回归任务。由于这里的具体场景应用是基于检测车辆,所以objectness map的通道数为2;而VeloFCN采取的是八个角点回归,所以对于着24个输出vector,既bounding box map的通道数为24;基于这两个feature map与像素点进行逐点的损失计算和预测。
在这里插入图片描述

此外,在具体回归标注框过程中,对每个点云需要预测的ground truth的某个角点是:cp’=R(cp-p),其中p表示当前所在点,cp是标注框角点,cp’表示更改的标注框角点。这样在bounding box map上每个点特征需要预测的vector就是:bp’=(cp’1, cp’2, …, cp’8),利用这样的预测编码方式可以有效的减小3D标注框在预测时的搜索范围(这里感觉paper里面写得不太清晰,理解有误的话请指正一下)。

在训练过程中,VeloFCN还利用到了一些常见的训练策略,比如正负样本不平衡(对样本的代价损失进行重加权,即对正样本的权重大,负样本的权重小)以及扫描点远近不平衡(考虑正样本的平均扫描点数和样本本身扫描点数,当正样本的扫描点数大于平均扫描点数时,说明样本离激光雷达较近,损失函数权重较小;反之,则较大,以增强对远处目标的检测能力)。最后就是回归损失与分类损失的叠加,而这种直接预测角点的损失构造方式,感觉精度不会太高,但可以直接投影回去点云的坐标系中进行推理判断。既在推理阶段,可以直接将预测的编码形式进行反变换获取到实际点云坐标中的边界框中,利用非极大值抑制处理,筛选出置信度最高的目标框作为最后的检测结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/14815.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一个是证书服务和web安全访问配置,一个是PGP的使用

一个是证书服务和web安全访问配置,一个是PGP的使用 IIS介绍 IIS是本机自带的服务,用于上线web网页;虽然是自带但因为非开发人员用不到,所以属于预安装;在本机搜索下载即可, 打开后 证书服务,认…

LeetCode[105]从前序与中序遍历序列构造二叉树

难度:中等 题目: 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的中序遍历,请构造二叉树并返回其根节点。 示例 1: 输入: preorder [3,9,20,15,7], inorder [9,3,1…

Vue基础4

Vue基础4计算属性姓名案例 - 第一种用click.keyup的方法姓名案例 - 第二种用v-model双向绑定的方法姓名案例 - 第三种使用methods方法姓名案例 - 第四种使用计算属性的方法计算属性的简写—只考虑读取,不考虑修改时候使用监视属性第一种普通写法第二种用计算属性的写…

【信号处理】卡尔曼(Kalman)滤波(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

Java内部类分类

文章目录内部类分类局部内部类的使用匿名内部类成员内部类静态内部类一个类的内部又完整的嵌套了另一个类结构。被嵌套的类称为内部类(inner class),嵌套其他类的类称为外部类(outer class)。是我们类的第五大成员 思考:类的五大成员是哪些? - 属性、方法、构造器、代码块、内…

Windows安装Git教程(2022.11.18 Git2.38.1)

(1)首先前往Git官网,下载安装文件: (2)打开安装程序,把Only show new options的勾去掉,点击Next: (3)此处可以选用默认设置,也可以勾…

ProCAST一键导出有限元模型的几何拓扑和属性信息

第一次将ProCast有限元后处理中的数据导出,当时没有经验,方法比较粗暴,详情见文章:ProCast导出节点应力数据并格式化。 最近发现了一种更高效的数据导出“新姿势”,能够快速得到有限元模型的几何拓扑和节点属性数据&a…

电科大离散数学-2-命题逻辑-2

目录 2.7 范式 2.7.1 范式的定义 2.7.2 范式存在定理 2.8 主析取范式和主合取范式 2.8.1 极小项和极大项的定义和编码 2.8.2 极小项和极大项的性质 2.8.3 主析取范式和主合取范式的定义 2.8.4 主范式求解定理 2.8.5 真值表技术 2.8.6 范式的相互转化 2.8.7 主范式的…

[附源码]Python计算机毕业设计jspm计算机学院党员积分管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

Markdown 教程之如何在 Markdown 文档中添加流程图、方程式和交互式图形

您是否遇到过想要在 Markdown 文档中包含一些简单图表或方程式的场景?如果这是一次性的事情,你可以做的是使用 Power Point 或在线生成器,将图表保存为图像并将其放在你的文章中。这种方法的缺点是背景颜色可能与您的文章不匹配,并且进行更改非常耗时。 Markdown 扩展是第…

[附源码]java毕业设计柠檬电动车租赁系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

java selenium (五) 元素定位大全

页面元素定位是自动化中最重要的事情, selenium Webdriver 提供了很多种元素定位的方法。 测试人员应该熟练掌握各种定位方法。 使用最简单,最稳定的定位方法。 自动化测试步骤 在自动化测试过程中, 测试程序通常的操作页面元素步骤 1. 找到…

【快速上手系列】内网穿透(natapp)的快速上手和简单使用教程

【快速上手系列】内网穿透(natapp)的快速上手和简单使用教程 使用 1、natapp配置 网址 https://natapp.cn/ 官方文档 https://natapp.cn/article/natapp_newbie (这个也挺言简意赅的😎) 点击下载或向下划到客户端…

读写算杂志社读写算编辑部读写算杂志2022年第30期目录

课程改革 新课程理念下学生自主学习能力培养策略探究 陈璟; 1-3 新课改下初中语文教学中名著阅读教学策略探究 赵璇; 4-6 教育创新《读写算》投稿:cn7kantougao163.com 多媒体辅助下初中物理教学方法改革策略分析 张鹤贵; 7-9 关于互联网环境下小学美术课堂教学模式…

LVGL | 1.LVGL PC模拟器之CodeBlocks

LVGL的学习与使用 LVGL | 1.LVGL PC模拟器之CodeBlocks 1.资源 1-1.主页:https://lvgl.io/ 1-2.LVGL | LVGL简介之中文文档 1-3.LVGL | LVGL快速概述之中文文档 1-4.问题反馈:https://forum.lvgl.io/ 1-5.LVGL开源GUI零基础入门课程(韦东山监制) 教程基…

【附源码】计算机毕业设计JAVA沙县小吃点餐系统

项目运行 环境配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: Springboot mybatis Maven Vue 等等组成,B/…

通信电源专业技术交流

UPS电源 •UPS为交流不间断供电电源系统的英文缩写。• UPS系统原理:UPS系统由整流模块、逆变器、蓄电池、静态开关等组成。整流模块(AC/DC)和逆变器(DC/AC)都为能量变换装置,蓄电池为储能装置。除此还有间…

docker部署Jenkins与任务创建【七千字超详细指南】

大家好,我是早九晚十二,目前是做运维相关的工作。写博客是为了积累,希望大家一起进步! 我的主页:早九晚十二 文章目录什么是jenkins?jenkins的功能依赖环境使用docker快速搭建查看版本下载jenkins镜像使用d…

搞个网站需要多少钱【网站费用】

想搞一个网站,我们先了解一下搞个网站需要多少钱?网站建设费用主要包括:网站搭建、服务器费用(有些是免费的)、域名费用以及其他杂费。对于刚成立网站我们可以选择用自助建站方案来进行搭建网站,因为我们自…

【freeRTOS】操作系统之五.-内存管理

\FreeRTOS\Source\portable\MemMang下提供了5中内存分配机制的实现 一、配置FreeRTOS内存大小 在FreeRTOSConfig.h头文件中宏configTOTAL_HEAP_SIZE用于配置内核可用的RAM大小。 在heap1.c, heap2.c, heap4.c源文件中,分配的内存实际上是用一个静态数组ucHeap来表…