【3D点云】分割算法总结(二)

news2025/1/16 22:00:27

文章目录

  • 十一、UrbanBIS-城市场景数据集;B-Seg实例分割(SIGGRAPH 2023)
    • 0.摘要
    • 1. 数据集特点
    • 2.B-Seg实例分割算法


提示:本文衔接上一篇文章【3D点云】分割算法总结(一)

十一、UrbanBIS-城市场景数据集;B-Seg实例分割(SIGGRAPH 2023)

作者:VCC杨国庆博士(深圳大学可视计算研究中心黄惠教授课题组与香港中文大学傅志荣教授合作完成)
论文:UrbanBIS: a Large-scale Benchmark for Fine-grained Urban Building Instance Segmentation
期刊:国际计算机图形学顶级会议SIGGRAPH 2023
项目主页: https://vcc.tech/UrbanBIS/

该工作构建了一个大规模城市场景理解基准测试数据集,提供包括图像、点云以及网格模型(三角网格)在内的海量多模态数据和三维语义标注与建筑物实例标注,可广泛应用于语义分割、实例分割、点云重建、布局规划等多项城市理解任务,为智慧城市前沿技术建设提供重要支撑。同时提供一个面向城市场景点云建筑物实例分割的轻量化模型B-Seg,采用端到端的学习结构,提高处理效率的同时提升模型针对不同城市场景的泛化性能。

0.摘要

用于建筑物实例分割的大规模真实城市场景数据集UrbanBIS,UrbanBIS共包含6个真实场景,总面积高达10.78 km2 ,包含3370栋建筑,不仅提供城市场景的常见语义信息以及建筑物单体实例信息,同时提供细粒度的建筑物语义标注信息。是目前唯一一个可用于点云实例分割的大规模的3D真实城市场景数据集。

在这里插入图片描述

1. 数据集特点

1.场景面积大:共提供6个城市场景,总面积达到10.76 km2 ,这也是目前最大的三维真实场景数据;

2.多模态的数据:点云数据,图像以及三角网格数据,类型多样;

3.实例标注数据:语义信息、建筑物实例进行了提取与标注,并且进一步围绕建筑物使用功能提供了细粒度的标签;

4.针对实例分割的基准测试:基于UrbanBIS对一些算法在其上的性能表现进行了测试,为新算法设计提供了新的评估基准,建立了首个城市场景实例分割的测试基准。

下表为多种城市场景数据集,UrbanBIS拥有目前最大的面积以及最为丰富的数据类型,并支持多项任务的训练与验证。

在这里插入图片描述
1. 7种语义类别:UrbanBIS是基于无人机倾斜摄影技术获取图像作为原始数据并基于此采用处理软件进行重建得到的三维模型。重建得到的模型进行了人工标注,确定7种城市场景中常见的语义类别,具体包括地面、水面、船只、植被、桥梁、车辆以及建筑物,如下图所示:
在这里插入图片描述
各类别的统计:
在这里插入图片描述
2.建筑实例划分: 除了语义信息,同样对建筑物实例进行了划分:考虑到建筑物的类内差异过大的实际情况,进一步按照使用功能对建筑物进行划分为商业建筑、居住建筑、办公建筑、文化建筑、交通建筑、市政建筑以及临时建筑,各个建筑物示意如下图所示:
在这里插入图片描述
3. 多种标注类型:UrbanBIS提供了多源数据和丰富的标注信息,可以用于多项视觉与图形学相关任务中,例如:

在这里插入图片描述
在这里插入图片描述

2.B-Seg实例分割算法

在这里插入图片描述
B-Seg的主要流程包含三步:

(1)特征提取:骨干网络提取点云特征,学习到的点云特征将用于后续的三个子任务分支;

(2)生成proposal 候选:建筑物候选生成模块,生成实例候选(包括建筑物候选选择、分组以及合并三个子模块);

(3)实例打分:预测建筑物实例 proposal 的得分,该模块预测的 score 用于评估建筑物实例的预测质量,同时滤除错误的预测。

在这里插入图片描述
下图所示为B-Seg的特征提取网络和三个分支,其中特征提取网络采用3D UNet,而分支采用全连接网络:
在这里插入图片描述

  1. 语义分割分支

为了获取建筑物实例,本文需要对输入的点云进行前后景分离,得到只包含建筑物类别的前景点
Pb。具体地,本文使用了由三层线性层构成的感知机和一个Softmax函数作为输出层构造语义分割分支子网络,用来学习每个点的语义特征信息,并输出语义类别预测的概率分布S∈RN*C ,其中 C 是类别总数。本文选择最大预测概率的类别作为每个点的语义预测结果。这个过程由语义损失函数进行监督学习:

在这里插入图片描述
其中, si s ^ \hat{s} s^i 分别是点 pi 的语义概率预测值以及语义类别标签的真实值。 Lce 是传统的交叉熵损失函数,由于城市场景中的数据广泛存在长尾分布问题,为了这种缓解类别不平衡的情况,本文采用了加权交叉熵损失形式,这使得分割网络模型对于场景中数量较少的类别关注度更高。此外, Ldice 是广泛应用于医学图像分割的dice损失函数,衡量了预测样本和真实样本之间的相似度。本文通过引进该损失函数用于解决城市场景中正负样本强烈不平衡的情况,提高建筑物的语义分割精度。

  1. 中心偏移分支

为了方便后续建筑物合并的操作,在点云特征提取阶段后,设计了一个子网络用于预测每个点到其建筑物中心的偏移向量。本文使用了由两层线性层构成的感知机学习每个点的中心偏移特征,然后使用一层线性层预测每个点在三维空间中的中心偏移向量 O∈RN*3 。 该向量指示了每个点到其对应建筑物实例中心的距离和方向,经过中心偏移后每个点会朝着其建筑物实例中心的位置进行靠近。为了达到这个目的,本文使用以下的中心偏移损失函数进行约束:
在这里插入图片描述
其中, oi o ^ \hat{o} o^i 分别是点 pi 的建筑物中心偏移向量的预测值和真实值, ci 是点 pi 对应的建筑物中心。 Loffset_norm 损失函数限制了预测的中心偏移向量和中心偏移向量真实值之间的距离差异尽可能小。此外本文使用 Loffset_dir 损失函数限制了预测的中心偏移向量与中心偏移向量真实值两者之间的夹角尽可能小。借助这两个损失函数的约束,中心偏移分支可以准确地输出每个点的中心偏移向量。

  1. 实例感知分支

为了获得更准确的建筑物实例分割结果,本文从建筑物实例特征嵌入的角度考虑并构建了一个实例感知子网络。本文假设可以通过神经网络将每个点的特征映射到一个新的嵌入特征空间。在这个空间里,不同的建筑物点之间的特征距离尽可能大而相同建筑物点之间的特征距离尽可能小。为了达到这个目的,本文使用了一个由三层线性层构成的感知机学习每个点的建筑物实例感知特征 E∈RN*D ,其中第三层线性层的输入拼接了来自中心偏移分支的特征,使得学习得到的实例感知特征包含实例中心位置信息。为了更好学习实例感知特征,本文使用了一个判别式损失函数进行监督训练:

在这里插入图片描述
在这里插入图片描述

  1. 候选生成模块

在点云特征学习以及三个子任务分支之后,为了得到建筑物的实例预测,本文提出了一种建筑物实例候选生成模块,该模块包括了建筑物实例候选选取建筑物分组建筑物合并三个部分。

a. 筑物实例中心实例候选选取部分基于语义分割分支的预测结果将输入点云划分前景点(建筑物点)和背景点(非建筑物点)。对于前景点,本文选择简单的点云采样方法算法采样K个点作为建筑物实例候选点。为了使得采样得到的建筑物实例候选点能够均匀地覆盖每个建筑物实例表面上,本文选择FPS进行采样;

b. 由于每个建筑物实例候选点代表的是一个完整的建筑物实例,因此对于剩下的建筑物前景点本文需要对它们进行分组操作,即把每个建筑物前景点划分到对应的建筑物实例候选点,从而产生初始的建筑物实例候选预测。本文根据建筑物实例候选点直接为每个建筑物前景点分配一个唯一的建筑物实例预测标签,基于K 个建筑物实例候选点以及 N’ 个建筑物前景点构造了一个关系矩阵 R∈RK*N‘
。在关系矩阵 R 中,每个元素是由建筑物前景点 pi 与建筑物实例候选点 pj 两者之间的建筑物实例感知特征的特征距离计算得到,代表着这两个点属于同一个建筑物的关系相似性。在特征学习阶段,实例感知分支为每个点学习了其对应建筑物的实例感知特征,该特征具有在同一个建筑物内的特征距离较小,在不同建筑物之间的特征距离较大的特点,因此可选择具有最小特征距离的建筑物候选点 pi 的矩阵列索引 i 作为第个建筑物前景点的建筑物实例预测标签;

c. 尽管在建筑物分组阶段,本文已经得到了每个建筑物前景点的初始建筑物实例预测标签,但这些预测标签会出现冗余的情况。这是因为在建筑物实例候选选择阶段,本文为了避免对建筑物的遗漏设置了大量的建筑实例候选点采样。这种做法虽然能覆盖场景中的建筑物,但是也会大概率使得同一个建筑物上分布着多个建筑物候选点。经过了建筑物分组操作后会出现同一个建筑物会具有多个不同建筑物实例预测标签的情况。为了解决这个问题,本文提出了一个建筑物合并子模块将属于同一个建筑物上的所有建筑物实例预测标签进行合并。先使用了在中心偏移分支网络预测的建筑物实例中心偏移向量 OK 个建筑物实例候选点进行偏移,使得它们朝着对应的建筑物实例中心移动。建筑物实例候选点在经过了中心偏移之后,会分别聚集在对应建筑物的中心附近区域,从而完成后续的合并;

d. 由于语义预测错误、建筑物候选点错误选择、中心偏移预测错误等原因,本文的建筑物实例候选生成模块难以避免地会产生一些错误、无效的建筑物实例预测。为了解决这种问题,引入了实例得分预测网络,用于对生成的建筑物实例预测进行质量评估与错误过滤。得分预测网络结构与本文的骨干网络类似,是具有两层对称结构的三维子流形稀疏卷积U-Net网络,为每一个建筑物实例输出一个建筑物评价得分,该得分衡量了生成的建筑物实例的质量好坏。

根据UrbanBIS上的设置不同,主要可分为几种不同的基准测试方式,包括全部场景的基准测试、交叉场景的基准测试以及单一场景的基准测试,每种不同的测试方法可根据需要具体选择。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
UrbanBIS可提供图像、点云以及三角网格等多种不同格式的数据下载。项目主页下载数据,支持Dropbox与百度云网盘两种下载方式。对于图像和三角网格数据,提供了申请下载的方式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/814424.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python基础入门教程(下)

目录 七、函数进阶 7.1、函数多返回值 7.2、函数多种传参方式 位置参数 关键字参数 缺省参数 不定长参数 位置传递 关键字传递 7.3、匿名函数 函数作为参数传递 lambda匿名函数 八、文件操作 8.1、文件的读取 open()打开函数 mode常用的三种基础访问模式 读操…

【雕爷学编程】MicroPython动手做(23)——掌控板之WiFi与蓝牙

知识点:什么是掌控板? 掌控板是一块普及STEAM创客教育、人工智能教育、机器人编程教育的开源智能硬件。它集成ESP-32高性能双核芯片,支持WiFi和蓝牙双模通信,可作为物联网节点,实现物联网应用。同时掌控板上集成了OLED…

备件管理数字化转型的基础是什么?

备件管理的数字化转型是由多种因素驱动的,以及优化整个流程以提高效率、降低成本和增强客户满意度的愿望。这一转变的一些关键基础包括: 数据驱动的洞察:数字化转型可以收集和分析与备件库存、使用和维护相关的大量数据。这种数据驱动的方法有…

(12)Qt事件系统(one)

目录 Qt Event System 事件处理的方法 系统事件处理函数 基本事件 窗口显示事件 窗口关闭事件 窗口隐藏事件 窗口移动事件 窗口大小改变事件 窗口状态改变事件 鼠标事件 鼠标进入、离开事件 鼠标按下抬起事件 鼠标双击事件 鼠标移动事件 鼠标滚轮事件 示例&#xff1…

【数据结构与算法】斐波那契查找(黄金分割法)

斐波那契查找(黄金分割法) 黄金分割点是指把一条线段分割成两部分,使其中一部分与全长之比等于另一部分与这部分之比。取其前三位数字的近似值是 0.618。由于按此比例设计的造型十分美丽,因此称为黄金分割,也称为中外比…

css 动画之旋转视差

序&#xff1a;网上看到的一个例子&#xff0c;做一下 效果图&#xff1a; 代码&#xff1a; <style>.content{width: 300px;height: 300px;margin: 139px auto;display: grid;grid-template-columns: repeat(3,1fr);grid-template-rows: repeat(3,1fr);grid-template:…

《水经注地图服务》发布的影像数据在MapBox中调用(仅墨卡托)

MapBox源码下载 由于MapBox的源码下载略微有点复杂&#xff0c;我们有必要在这里为大家分享一下它的下载的方法&#xff0c;如果你已经从百度网盘下载了MapBox源码&#xff0c;请略过本节。 首先打开MapBox官网&#xff0c;然后点击“Documentation\Mapbox GL js”&#xff0…

PostgreSql 锁

一、概述 在 PostgreSQL 事务中提到&#xff0c;多个用户访问相同数据时可能出现脏读&#xff0c;不可重复度&#xff0c;幻读&#xff0c;更新丢失的问题&#xff0c;为解决这些问题&#xff0c;定义了不同的隔离级别&#xff0c;而隔离级别的具体实现&#xff0c;依靠的就是数…

计算机图形学笔记2-Viewing 观测

观测主要解决的问题是如何把物体的三维“模型”变成我们在屏幕所看到的二维“图片”&#xff0c;我们在计算机看到实体模型可以分成这样几步&#xff1a; 相机变换(camera transformation)或眼变换(eye transformation)&#xff1a;想象把相机放在任意一个位置来观测物体&#…

实用上位机--QT

实用上位机–QT 通信协议如下 上位机设计界面 #------------------------------------------------- # # Project created by QtCreator 2023-07-29T21:22:32 # #-------------------------------------------------QT += core gui serialportgreaterThan(QT_MAJOR_V…

LLM - model batch generate 生成文本

一.引言 LLM model 类 generate 支持传递 num_return_sequences 进行批量生成&#xff0c;下面简单介绍下原始模型 generate 和 lora 模型 generate 的代码并给出基于 Baichuan-7B 和 ChatGLM 的批量预测效率。 二.generate 参数 介绍 batch generate 之前&#xff0c;先熟悉…

机器学习-Basic Concept

机器学习(Basic Concept) videopptblog Where does the error come from? 在前面我们讨论误差的时候&#xff0c;我们提到了Average Error On Testing Data是最重要的 A more complex model does not lead to better performance on test data Bias And Variance Bias(偏差) …

四通道本地互联网络(LIN)收发器SIT1024Q

特点&#xff1a; ➢ 兼容“LIN 2.x/ISO 17987-4:2016 (12V)/SAE J2602” 标准&#xff1b; ➢ 兼容 K 线&#xff1b; ➢ 内置过温保护功能&#xff08;热关断&#xff09;&#xff1b; ➢ 内置显性超时功能&#xff1b; ➢ 内置 30kΩ 总线上拉从机电阻&#xff1b; ➢…

微软开测“Moment4”启动包:Win11 23H2要来了

近日&#xff0c; 有用户在Win11最新的7月累积更新中发现&#xff0c;更新文件中已经开始出现了对“Moment4”的引用。 具体来说&#xff0c;在7月累积更新中&#xff0c;微软加入了“Microsoft-Windows-UpdateTargeting-ClientOS-SV2Moment4-EKB”“Microsoft-Windows-23H2Ena…

0101日志-运维-mysql

1 错误日志 错误日志&#xff08;Error Log&#xff09;&#xff1a;错误日志记录了MySQL引擎在运行过程中出现的错误和异常情况。这些错误可能包括启动和关闭问题、数据库崩溃、权限问题等。错误日志对于排查和解决MySQL引擎问题非常有帮助。 改日志默认开启&#xff0c;默认存…

python在不同坐标系中绘制曲线

文章目录 平面直角坐标系空间直角坐标系极坐标地理坐标 平面直角坐标系 回顾我们的数据可视化的学习历程&#xff0c;其实始于笛卡尔坐标系的创建&#xff0c;并由此建立了数与形的对应关系。在笛卡尔坐标系中随便点上一点&#xff0c;这个点天生具备坐标&#xff0c;从而与数…

基于LSTM神经网络的电力负荷预测(Python代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f308;3 Python代码及数据 &#x1f389;4 参考文献 &#x1f4a5;1 概述 前馈神经网络的输出只依赖当前输入&#xff0c;但是在文本、视频、语音等时序数据中&#xff0c;时序数据长度并不固定&#xff0c;前馈神经…

我对排序算法的理解

排序算法一直是一个很困惑我的问题&#xff0c;早在刚开始接触 数据结构的时候&#xff0c;这个地方就很让我不解。就是那种&#xff0c;总是感觉少了些什么的感觉。一开始&#xff0c;重新来过&#xff0c;认真来学习这一部分&#xff0c;也总是学着学着就把概念记住了。过了一…

词典项目练习

思维导图 客户端 #include "head.h" //用户提示界面 void help_info1() {printf("\t-----------------------------------------------\n");printf("\t| HENRY 在线辞典 |\n");printf("\t|版本:0.0.1 …

官方实锤!AMD真的已经有了大小核:不搞Intel那一套

Intel 12代酷睿开始引入大小核混合架构&#xff0c;多核跑分提升立竿见影&#xff0c;在游戏、渲染等场景中也有很好的辅助作用&#xff0c;但因为大核心、小核心基于完全不同的架构&#xff0c;需要复杂的系统、软件调度配合&#xff0c;也直接导致失去了AVX-512指令集。 AMD也…