3D点云目标检测数据集标注工具 保姆级教程——CVAT (附json转kitti代码)

news2025/1/12 13:22:19

前言:
笔者尝试过很多3D标注软件都遇到很多问题,例如CloudCompare不适合做3D目标检测的数据集而且分割地面的时很繁琐;labelCloud没有三视图,视角难以调整标得不够精确;SUSTechPOINTS换帧麻烦、输出时存储在docker里面不方便。 CVAT是我这段时间用起来相当丝滑的一个3D目标检测的标注工具了,但是关于CVAT的3D标注教程很少,所以只能自己摸索,最后整理出了这篇教程手册供大家参考。

目录

  • 1. CVAT安装教程
  • 2. 3D点云标注详细流程
    • 2.1 创建3D点云标注任务(Task):
    • 2.2 指定任务的参数:
    • 2.3 数据集上传并进入任务job:
    • 2.4 标注说明:
      • 2.4.1. 可使用鼠标或键盘来改变视图:
      • 2.4.2. 使用长方体进行注释
        • 1)==使用shape方式进行批注(适合帧间目标不连续的情况)==
        • ==2)使用track方式进行批注(适合帧间目标连续的情况)==
    • 2.5 导出标注结果
  • 3. 标注文件格式转换代码——Datumaro 3D(json)转KITTI格式

1. CVAT安装教程

  1. 安装Docker
sudo apt-get update
sudo apt-get --no-install-recommends install -y apt-transport-https ca-certificates \
  curl \
  gnupg-agent \
  software-properties-common
 
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository \
  "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
  $(lsb_release -cs) \
  stable"
 
sudo apt-get update
sudo apt-get --no-install-recommends install -y \
  docker-ce docker-ce-cli containerd.io docker-compose-plugin

添加用户到docker组(以便无需sudo运行docker):

sudo groupadd docker
sudo usermod -aG docker $USER

重启系统以应用docker组的变更。

  1. 克隆CVAT源代码:
git clone https://github.com/opencv/cvat
cd cvat
  1. 安装chrome(若已安装可跳过):

cvat推荐只能用chrome浏览器
①安装包下载:

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb

②使用 gdebi 工具自动安装 deb 包和依赖关系:

sudo apt install gdebi
sudo gdebi google-chrome-stable_current_amd64.deb
  1. 运行docker容器
    注意是在cvat目录下,第一次会下载需要的镜像
    以后每次开机都需要在这个路径下启动cvat的docker镜像
docker compose up -d

(若docker拉取镜像时出现失败超时,可参考解决方案)

  1. 创建一个超级用户
docker exec -it cvat_server bash -ic 'python3 ~/manage.py createsuperuser'

注意在邮箱处可以不填,否则可能报错。

  1. 启动CVAT
    在chrome浏览器中输入localhost:8080

2. 3D点云标注详细流程

2.1 创建3D点云标注任务(Task):

要创建任务,请在 Tasks(任务)页面上单击“+”,选择 Create new task (创建新任务)。
在这里插入图片描述
随后页面显示如下:
在这里插入图片描述

2.2 指定任务的参数:

  1. 在 Name 字段中,输入新任务的名称。
    在这里插入图片描述

  2. (可选)从 Projects 下拉列表中,为新任务选择一个项目。
    如果不想将任务分配给任何项目,请将此字段留空(建议)。
    在这里插入图片描述

注意:如果任务不属于项目,则以下步骤有效。
如果任务已分配给项目,则项目的标签将应用于该任务。

  1. 在 Constructor 选项卡上,单击 Add label (添加标签)。
    标签构造函数菜单将打开:
    在这里插入图片描述

  2. 在 Label name(标签名称)字段中,输入标签的名称。

  3. (可选)要将标签的使用限制为特定形状工具, 从 Label shape 下拉菜单中选择形状(默认Any即可)。

  4. (可选)选择标签的颜色,建议选择一些区分度比较大的颜色。
    在这里插入图片描述

  5. (可选)单击 Add an attribute 并设置其属性。(可以不设置)

  6. 单击 Continue 提交标签,就可以在后台保存下来,直接在label name上开始添加新标签,
    在这里插入图片描述
    在这里插入图片描述

单击 Cancel 终止当前标签并返回到标签列表,就会发现添加的标签已经列出来了。
在这里插入图片描述

2.3 数据集上传并进入任务job:

  1. 单击 Select files (选择文件)的虚线方框区域,或直接将文件拖拽到虚线框,以上传要注释的pcd/bin的压缩文件。(若格式bin,则cvat在标注时会直接转为pcd的格式)
    压缩文件的格式如下:
    在这里插入图片描述
    在这里插入图片描述在这里插入图片描述

注意:文件名尽量做成类似这样以数字序号命名的格式,并且是按照时间排列的顺序,这样便于后续处理。

  1. 单击 Submit and open 以提交配置并打开已创建的任务,或 Submit and continue 以提交配置并启动新任务。文件上传成功会有提示:
    在这里插入图片描述

  2. 重新点击顶栏的Tasks即可看到新建的标注任务。
    在这里插入图片描述

  3. 点击Open进入Jobs页面,再点击job#xx 就可以开始标注了
    在这里插入图片描述

标注工作区界面如下:
在这里插入图片描述

2.4 标注说明:

  1. (注意:一定要经常保存,以免发生意外情况)

2.4.1. 可使用鼠标或键盘来改变视图:

在这里插入图片描述

您还可以使用键盘快捷键操作:

ActionKey
相机旋转Shift + 箭头(向上、向下、向左、向右)
左/右Alt+J/ Alt+L
上/下Alt+U/ Alt+O
放大/缩小Alt+K/ Alt+I

2.4.2. 使用长方体进行注释

有两个选项可用于3D标注:
• 形状:用于对象检测等任务。
• Track:使用插值来预测对象在后续帧中的位置。 将为每个对象分配一个唯一 ID,并在整个图像序列中维护。(更推荐,效率高)

1)使用shape方式进行批注(适合帧间目标不连续的情况)

要添加3D形状,请执行以下操作:

  1. 在对象窗格上,选择 Draw new cuboid>从下拉列表中选择标签>shape.
    在这里插入图片描述

  2. 光标后面将跟着一个cuboid。 双击对应的位置,将长方体放置在3D场景中。

  3. 使用投影调整长方体。 单击并按住鼠标左键可编辑投影上的标签形状。

  4. (可选)移动四个点中的一个以更改长方体的大小。

  5. (可选)要旋转长方体,请单击中间点 ,然后向上/向下或向左/向右拖动长方体。

  6. (可选)若相邻多帧均有相似大小的物体,可以选择传播(propagrate)当前帧的包围框到后续多帧以提高标注效率。
    在这里插入图片描述

(图中笔者是从第9帧开始的,传播了10帧,故到第19帧)

2)使用track方式进行批注(适合帧间目标连续的情况)

数据集中的文件若是按照采样时间顺序来排列,则可以根据物体在帧间移动的轨迹进行插值,从而大大节省人力。

  1. 在对象窗格上,选择 Draw new cuboid>从下拉列表中选择标签>track.
    在这里插入图片描述

  2. 为对象创建track(轨迹)(以所选container为例):
    通过单击创建,然后调整3D包围框
    在这里插入图片描述

  3. 但是此时会发现后面所有帧都被标注了3D框,且越往后偏离越大:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

对于这种问题,CVAT中具有自动插值的功能,通过选取一些关键帧(点击标注界面右侧的label状态栏的符号空心的五角星使其变成实心的五角星,即可将该帧变为关键帧),只需要将关键帧内的包围框手动对齐,然后就会发现关键帧之间的包围框便可以自动移动到了比较合适的位置,进而只需要微调就可以了。
在这里插入图片描述
在这里插入图片描述

  1. 结束当前目标的轨迹
    如图所示点击标注界面右侧的label状态栏的Switch Outside Property的按钮,即可终止后续帧track的操作,(注:操作了这一按钮的那一帧中对应的包围框也会消失失效)
    在这里插入图片描述
    在这里插入图片描述

  2. 如果对象只是在几个帧上不可见,然后再次出现,可以使用Merge功能合并多个单独的track合二为一,从而保证同一物体在不同帧中对应ID的一致性。
    在这里插入图片描述

① 这里以图像标注为例,为骑行者可见的时刻创建轨迹:

② 单击Merge按钮,然后再单击第一个track的任意矩形以及第二个track的任意矩形,依此类推:

③结束时再单击Merge按钮,使更改生效。这样就统一了数据集中同一物体在不同帧中的id了。
在这里插入图片描述

2.5 导出标注结果

  1. Save整个工程后,重新进入Task的界面,点击Export annotations:
    在这里插入图片描述

  2. 输出格式调整为Datumaro 3D 1.0,它自带的kitti输出的格式会有bug(没有帧信息),save images 的开关打开以保存原始点云数据
    在这里插入图片描述

  3. 如图点击顶栏跳到Requests中,然后点击刚刚导出的工程download即可
    在这里插入图片描述

  4. 最终下载的是一个zip的压缩包,内容如下:
    在这里插入图片描述
    在这里插入图片描述在这里插入图片描述
    这种格式可以通过python脚本来转成KITTI数据集的格式,代码我放在最后了。

  5. 最后记得将整个task也做一个备份留存以供后续的二次开发

在这里插入图片描述

3. 标注文件格式转换代码——Datumaro 3D(json)转KITTI格式

import json
import os

def json_to_kitti(json_path, output_dir):

    with open(json_path, 'r') as f:
        data = json.load(f)

    labels = data['categories']['label']['labels']

    os.makedirs(output_dir, exist_ok=True)

    # 遍历每一帧
    for item in data['items']:
        item_id = item['id']  # 使用 JSON 中的 'id' 值
        annotations = item['annotations']

        # 输出 KITTI 格式文件的路径,使用 'id' 命名
        output_path = f"{output_dir}/{item_id}.txt"
        
        with open(output_path, 'w') as f_out:
            # 遍历每个标注
            for annotation in annotations:
                label_id = annotation['label_id']
                label_name = labels[label_id]['name']
                
                # 提取 3D 立方体信息
                position = annotation['position']
                rotation = annotation['rotation']
                scale = annotation['scale']
                
                # KITTI 格式字段
                truncated = 0  # 默认为 0,因为未提供截断信息
                occluded = 1 if annotation['attributes']['occluded'] else 0
                alpha = rotation[2]  # 使用 Z 轴的旋转角作为方向角
                bbox_left = 0.0  # 2D 边界框位置,点云标注中通常为 0
                bbox_top = 0.0
                bbox_right = 0.0
                bbox_bottom = 0.0
                height = scale[2]  # 物体高度
                width = scale[0]   # 物体宽度
                length = scale[1]  # 物体长度
                x = position[0]    # 物体在相机坐标系中的 x 坐标
                y = position[1]    # 物体在相机坐标系中的 y 坐标
                z = position[2]    # 物体在相机坐标系中的 z 坐标
                rotation_y = rotation[2]  # KITTI 中物体绕 Y 轴的旋转角度

                # 将数据写入到 KITTI 格式文件
                f_out.write(f"{label_name} {truncated} {occluded} {alpha} "
                            f"{bbox_left} {bbox_top} {bbox_right} {bbox_bottom} "
                            f"{height} {width} {length} {x} {y} {z} {rotation_y}\n")


json_to_kitti('/home/zpmc/code/demo_study_project/data_convert/default.json', 
              '/home/zpmc/code/demo_study_project/data_convert/kitti_labels')

参考链接: https://blog.csdn.net/wxtcstt/article/details/134601044
https://docs.cvat.ai/docs/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2133626.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日OJ_牛客_数字统计(简单模拟)

目录 牛客_数字统计(简单模拟) 解析代码 牛客_数字统计(简单模拟) [NOIP2010]数字统计_牛客题霸_牛客网 描述 请统计某个给定范围[L, R]的所有整数中,数字2出现的次数。 比如给定范围[2, 22],数字2在数…

sipp模拟uas发送reinvite

概述 freeswitch是一款简单好用的VOIP开源软交换平台。 在更新了sipp模拟update的配置方案之后,我希望对比一下fs对update和reinvite的处理流程。 本文档记录sipp的配置方案,该方案中包含了update和reinvite的信令。 环境 CentOS 7.9 freeswitch 1…

Linux入门攻坚——32、Mini Linux制作

制作一个mini linux,需要对linux的启动流程很熟悉,这里又一次学习Linux的启动过程。 启动流程:CentOS 6 / 5: POST -->BootSequence(BIOS) --> BootLoader --> kernel (ramdisk) --> rootfs --> /sbin/init …

MySQL——数据类型(二)

目录 一、日期与时间类型 1.1 date 1.2 datetime 1.3 timestamp 二、枚举和联合 2.1 enum 2.2 set 2.2.1 set 的插入 2.2.2 set 的查找 思维导图可以参考如下链接: 数据类型.xmind 夜夜亮晶晶/MySQL - Gitee.com 一、日期与时间类型 1.1 date 日期 yyy…

2024 年最佳 Chrome 验证码扩展,解决 reCAPTCHA 问题

验证码,特别是 reCAPTCHA,已成为在线安全的不可或缺的一部分。虽然它们在区分人类和机器人方面起着至关重要的作用,但它们也可能成为合法用户和从事网络自动化的企业的主要障碍。无论您是试图简化在线体验的个人,还是依赖自动化工…

easy-es动态索引支持

背景 很多项目目前都引入了es,由于es弥补了mysql存储及搜索查询的局限性,随着技术的不断迭代,原生的es客户端使用比较繁琐不直观,上手代价有点大,所以easy-es框架就面世了,学习成本很低,有空大…

Ubuntu下安装最新版本Apache2文件服务器

文章目录 1.最新版本Apache2安装2. Apache2配置2.1 端口配置2.2 创建软连接,生成文件服务2.3 隐藏Apache2服务版本号2.4 添加用户,设置Apache2文件服务密码2.5 重启Apache2服务3. 执行后效果 1.最新版本Apache2安装 注意:安装最新版本必须升级Ubuntu为20…

Linux 中System V IPC的共享内存

1. 概念介绍 System V IPC(Inter-Process Communication)是一组在UNIX系统中用于进程间通信的机制,包括共享内存、消息队列和信号量。这些机制由System V内核提供,并且它们的存在不依赖于创建它们的进程,而是由内核管…

JSON数组

数组作为JSON对象 ["Google","Runoob","Taobao"] JSON数组在中括号中书写。 中括号[]保存的数组是值(value)的有序集合。一个数组以左中括号[开始,右中括号]结束,值之间使用逗号,分隔…

【第28章】Spring Cloud之Sentinel注解支持

文章目录 前言一、注解埋点支持二、SentinelResource 注解三、实战1. 准备2. 纯资源定义3. 添加资源配置 四、熔断(fallback)1. 业务代码1.1 Controller1.2 Service1.3 ServiceImpl 2. 熔断配置3. 熔断测试 总结 前言 上一章我们已经完成了对Sentinel的适配工作,这…

物联网架构

1 三层架构 三层架构就像我们拿着一个设备,通过网络直接连接到服务器获取结果,步骤简单。 举个例子:智能家居的温度监控系统 1. 感知层(设备与传感器) 在智能家居系统中,温度传感器被安装在家里的各个房间…

数据结构C //线性表(顺序表)ADT结构及相关函数

数据结构(C语言版)严蔚敏 吴伟民 线性表(顺序表)ADT结构及相关函数 环境:Linux Ubuntu(云服务器) 工具:vim 代码块(头文件,函数文件,主文件&am…

JVM字节码与局部变量表

文章目录 局部变量表javap字节码指令分类 指令指令数据类型前缀加载和存储指令加载常量算术指令其他指令 字节码示例说明 局部变量表 每个线程的帧栈是独立的,每个线程中的方法调用会产生栈帧,栈帧中保存着方法执行的信息,例如局部变量表。 …

Alinx MPSoC驱动开发第11章异步IO实验按下按键报IO Possibile后结束进程

实验现象 使用Alinux官方提供的驱动和应用程序代码,petalinux工程基于自身需要进行了一定的修改(主要是SD卡根文件系统)。在把petalinux工程编译后打包的boot.scr、BOOT.BIN、image.ub放入FAT分区,把驱动程序与应用程序放在NFS共享…

万界星空科技电池MES具体功能及解决方案

电池的生产工艺具有高度的复杂性和精细度。从原材料的准备、电池的组装到最终的测试与包装,每一道工序都需要严格控制,以确保产品的质量和性能。 万界星空科技在电池MES(制造执行系统)领域提供了全面的解决方案,这些解…

JavaWeb项目打包、部署至Tomcat并启动的全程指南(图文详解)

前言 我们想要部署一个javaWeb项目到tomcat上,需要了解一些概念 什么是tomcat? Tomcat 是 Apache 软件基金会(Apache Software Foundation)下的一个开源项目,主要用于实现 Java Servlet、JavaServer Pages(…

在 PyCharm 中配置 Anaconda 环境

1. 安装 Anaconda 如果尚未安装 Anaconda,你可以从 Anaconda 官方网站 下载或者从清华镜像网站下载并安装适合你操作系统的版本。 2. 创建 Anaconda 虚拟环境 打开 Anaconda Prompt(Windows)或终端(macOS/Linux)。 …

EmguCV学习笔记 VB.Net 11.6 图像分割

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。 教程VB.net版本请访问…

如何升级用 Helm 安装的极狐GitLab Runner?

本分分享如何对 Helm 安装的 Runner 进行升级。整个过程分为三步:1、确定 Runner 最新版本或者想要升级的版本是否存在;2、用 Helm upgrade 命令进行升级;3、升级确认。 极狐GitLab 为 GitLab 的中国发行版,中文版本对中国用户更…

【西电电装实习】6. 手装无人机的蓝牙断连debug

文章目录 前言零、闪灯状态零零、翻滚角,俯仰角,偏航角一、问题描述二、现象解释三、解决方案参考文献 前言 在 西电无人机电装实习 时遇到的问题使用蓝牙芯片 CH582F。沁恒的蓝牙芯片CH582F是一款集成了BLE(Bluetooth Low Energy&#xff0…