labelme、labelimg的安装及使用（含格式转换）

news2025/7/7 7:04:35

labelme、labelimg简要介绍

labelme

labelimg

Anaconda虚拟环境

labelme安装

labelme的使用

labelimg安装

labelimg的使用

json格式转换

标注便携操作

labelme、labelimg简要介绍

labelme和labelimg都是图像标注工具，它们在机器学习和计算机视觉领域的数据准备阶段扮演着重要的角色。这些工具的主要目的是帮助用户为图像数据集创建标签，这些标签随后可以用于训练机器学习模型，以识别和理解图像中的对象、场景和活动等。

labelme

labelme是一个开源的图像标注工具，它支持多种类型的标注，包括矩形框、多边形、点、线和圆形等。它提供了一个用户友好的界面，允许用户通过简单的点击和拖动来创建标注。Labelme支持导出多种格式的标注文件，如JSON、XML等，这些文件可以被不同的机器学习框架所使用。

labelimg

labelimg是另一个广泛使用的图像标注工具，它同样提供了矩形框、多边形、点和线的标注功能。labelimg的用户界面相对简洁，易于上手，同时也支持导出多种格式的标注文件，如XML、CSV等。

Anaconda虚拟环境

在进行 labelme 和 labelimg 安装前需要先创建Anaconda虚拟环境。

详情请参考：深度学习环境搭建详解

在电脑搜索栏中搜索Anacodna Prompt打开Anaconda

最开始界面如下，base是基础环境

(base) C:\Users\ZhuanZ>

创建环境：conda create -n labelme python=3.7.16

其中labelme是需要创建的环境名称，pytho=3.7.16是该环境的python版本，可根据自己的需求调整版本号。

激活环境：activate labelme

退出环境：deactivate

labelme的安装

activate labelme 激活 labelme 的虚拟环境

成功显示以下界面，其中（labelme）是激活的对应环境名称

输入以下代码进行下载：

pip install labelme==3.16.7 -i https://pypi.tuna.tsinghua.edu.cn/simple

这里安装 labelme==3.16.7 的版本，其他的版本容易出现报错（后期易出现维度不匹配的问题）

为减少一些不必要的麻烦，建议大家都安装这个版本

labelme的使用

安装好后直接输入 labelme 即可打开该软件

这里 Open 打开的是单个的图片，Open Dir 打开的是一整个图像文件夹

打开后点击 Create Polygons 进行标注，标注特点：首尾相连形成一个封闭区域、尽可能的贴合目标的边界轮廓

补充：导入图像数据后建议打开这两个进行标签保存，其中 Save Automatically 是指标注后的文件自动保存在当前图像的路径下；Change Output Dir 是指标签保存的指定文件夹（可自己选择），请注意，若要使标签和原图像分开保存，选择完标签保存路径后仍需要再次点击Save Automatically ，不然每次保存时还会跳出那些烦人的窗口。

示例：

我这里选择的是单个图像标注，完成后会让你填写对应的 label ，正确填写即可

labelimg的安装

同样按照 labelme 的方式创建 labelimg 环境

activate labelimg 激活labelimg 虚拟环境

输入以下代码进行下载：

pip install PyQt5 -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install pyqt5-tools -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install labelImg -i https://pypi.tuna.tsinghua.edu.cn/simple/

注意：可能遇到的问题

error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools

上面这个报错如果出现的话基本上是在安装PyQt5时缺少C++的插件造成。

解决办法如下（不唯一）：

使用 WIN+R 输入 Powershell 输入以下命令
wget https://aka.ms/vs/17/release/vs_BuildTools.exe -o vs_BuildTools.exe ; cmd /c vs_BuildTools.exe
进入安装界面，注意：对v143生成工具的C++/CLI支持一定要勾选

安装完成后重新下载PyQt5即可

labelimg的使用

安装好后直接输入 labelimg 即可打开该软件

界面及功能与 labelme 基本一致，需要注意 Change Save Dir 是标签保存文件夹路径，标红的地方表示标签的格式，其具有 VOC、YOLO、ML三种格式，标注时请根据需要选择对应的标签格式。

示例：

json格式转换

一般来说我们标注的图像是JMG格式，标注后的图像为JSON格式，而我们传入图像数据进行模型训练的一般是JSON转换后的PNG格式图像。提供的转换脚本如下：

import base64
import json
import os
import os.path as osp
import numpy as np
import PIL.Image
from labelme import utils


if __name__ == '__main__':
    jpgs_path = "datasets/JPEGImages"
    pngs_path = "datasets/SegmentationClass"

    classes = ["_background_", "cat", "dog"]

    count = os.listdir("./datasets/before/")
    for i in range(0, len(count)):
        path = os.path.join("./datasets/before", count[i])

        if os.path.isfile(path) and path.endswith('json'):
            data = json.load(open(path))

            if data['imageData']:
                imageData = data['imageData']
            else:
                imagePath = os.path.join(os.path.dirname(path), data['imagePath'])
                with open(imagePath, 'rb') as f:
                    imageData = f.read()
                    imageData = base64.b64encode(imageData).decode('utf-8')

            img = utils.img_b64_to_arr(imageData)
            label_name_to_value = {'_background_': 0}
            for shape in data['shapes']:
                label_name = shape['label']
                if label_name in label_name_to_value:
                    label_value = label_name_to_value[label_name]
                else:
                    label_value = len(label_name_to_value)
                    label_name_to_value[label_name] = label_value

            # label_values must be dense
            label_values, label_names = [], []
            for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):
                label_values.append(lv)
                label_names.append(ln)
            assert label_values == list(range(len(label_values)))

            lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)

            PIL.Image.fromarray(img).save(osp.join(jpgs_path, count[i].split(".")[0] + '.jpg'))

            new = np.zeros([np.shape(img)[0], np.shape(img)[1]])
            for name in label_names:
                index_json = label_names.index(name)
                index_all = classes.index(name)
                new = new + index_all * (np.array(lbl) == index_json)

            utils.lblsave(osp.join(pngs_path, count[i].split(".")[0] + '.png'), new)
            print('Saved ' + count[i].split(".")[0] + '.jpg and ' + count[i].split(".")[0] + '.png')

其中 class 是需要分开的种类，jpgs_path 是分开后得到的原图像文件夹路径，pngs_path 是分开后得到的 PNG 格式图像文件夹路径，count 和 path 是需要进行转换的图像数据集路径。具体路径请根据自己的需求进行修改。