数据标注工具【LabelImg】安装使用 用VOC制作自己的数据集

news2024/11/26 17:39:51

labelImg的安装

  • ⭐️LabelImg简介
  • ⭐️LabelImg的安装
  • ⭐️labelImg标注数据集
  • ⭐️利用VOC制作自己的数据集

⭐️LabelImg简介

Labelimg是一款开源的数据标注工具,标签可用于分类和目标检测,它是用python写的,并使用Qt作为其图形界面,简单好用,它可以标注三种格式。

   1 VOC标签格式,保存为xml文件。

   2  yolo标签格式,保存为txt文件。

   3 createML标签格式,保存为json格式。

⭐️LabelImg的安装

首先,用conda创建一个新的环境
conda create -n py38 python=3.8
查看已有环境列表:
conda envs list

然后,激活环境py38
conda activate py38

然后在py38这个环境中下载labelImg即可
pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple
然后在py38环境下输入 labelImg即可打开labelImg

打开如图界面:

labelImg的使用

比较常用的快捷键:
画框 W
下一张

⭐️labelImg标注数据集

Open Dir我选择水果数据集进行标注

该数据集一共有五个标签。
为方便标注,选取了一部分各类别的水果至一个文件夹JPEGImages中进行标注。
点击Change save Dir我将标注的数据集存放在路径
标注好的数据集如下,为xml格式:

⭐️利用VOC制作自己的数据集

新建文件夹,并在新建的文件夹下新建AnnotationsImageSetsJPEImages三个文件夹,在ImageSets下新建Main文件夹。

将自己的数据集图片拷贝到JPEGImages目录下。
即:

将数据集label文件拷贝到Annotations目录下。
即:

在主文件夹下新建test.py文件夹,输入以下代码进去运行,将生成四个文件:train.txt,val.txt,test.txt和trainval.txt。

import os
import random

trainval_percent = 0.8  #val即Validation(验证),即训练集和验证机占全体数据的比例
train_percent = 0.9  #训练集占训练集和验证集总体的比例
xmlfilepath = 'D:\\A_data\\fruits\VOC\\Annotations' #这里是我的绝对路径
txtsavepath = 'D:\\A_data\\fruits\\VOC\\ImageSets\Main' #我的绝对路径 如果使用需要修改
total_xml = os.listdir(xmlfilepath)


num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)  # 训练集和验证集总个数
tr = int(tv * train_percent)  # 训练集总个数
trainval = random.sample(list, tv)  
train = random.sample(trainval, tr)


#需要生成以下四个文件,分别是test.txt,train.txt,trainval.txt,val.txt
#分别代表测试集、训练集、训练-验证集、验证集
ftrainval = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\trainval.txt', 'w')
ftest = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\test.txt', 'w')
ftrain = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\train.txt', 'w')
fval = open('D:\\A_data\\fruits\\VOC\\ImageSets\\Main\\val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

运行结束后,我们可以查看txt文件,我们的数据集已经制作完成。
test数据集:

103
105
109
11
111
115
117
119
125
129
131
135
137
139
143
149
15
151
153
157
161
163
165
167
169
23
25
29
3
31
33
35
37
39
43
45
47
49
5
51
53
55
57
61
63
67
7
71
73
75
77
79
81
85
87
89
9
93
95
97
99

train数据集:

101
107
113
121
123
133
141
147
155
159
17
19
21
41
59
65
83
91

训练验证集

1
103
105
109
11
111
115
117
119
125
127
129
13
131
135
137
139
143
145
149
15
151
153
157
161
163
165
167
169
171
23
25
27
29
3
31
33
35
37
39
43
45
47
49
5
51
53
55
57
61
63
67
69
7
71
73
75
77
79
81
85
87
89
9
93
95
97
99

验证集:

1
127
13
145
171
27
69

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1182618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

漏刻有时百度地图API实战开发(2)文本标签显示和隐藏的切换开关

项目说明 在百度地图开发的过程中,如果遇见大数据量POI标注展示或在最佳视野展示时,没有文本标签,会不清楚具体标注的代表的意义;如果同时显示大量的文本标签,又会导致界面杂乱且无法清晰查看,因此&#x…

Leetcode-160 相交链表

双指针:遍历两次 a重bb重a /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode(int x) {* val x;* next null;* }* }*/ public class Solution {public ListNode getInter…

Vue3:一页多题答案提示及循环radio和checkbox混合使用

一页多题,类型包括单选(单选、判断)和多选,radio和checkbox混合使用,答案检验数据匹配,正确答案格式化,答案提交数据格式化,数据提交。 效果: 数据获取: 数据…

伊朗黑客对以色列科技和教育领域发起破坏性网络攻击

导语 近期,以色列的高等教育和科技领域遭受了一系列破坏性的网络攻击。这些攻击始于2023年1月,旨在部署以前未记录的数据清除恶意软件。在最近的攻击中,攻击者试图窃取个人身份信息和知识产权等敏感数据。本文将介绍这些攻击的具体细节&#…

实施电子采购的6个有效步骤

耗时又费力,手动采购之苦相信大家都受够了,现在越来越多的企业正在实施电子采购策略。根据CIPS的《2022年采购与供应数字化报告》,多达95%的企业在采购与供应商管理中采用了技术。 但采用技术并不能保证立竿见影的效果。企业需要制定好电子采…

word统计全部字符数。

问题描述:在投稿SCI论文时,有时会要求提交一个highlight文档,要求不超过85个字符。 具体如下:maximum 85 characters per bullet point including spaces 这里的字符不单单包括字母和汉字,还包括标点和空格键。那么如…

Linux 安装 Nginx 并将其配置为系统服务(详细图文)

目录 前言安装 Nginx安装依赖项下载Nginx解压Nginx编译和安装防火墙设置启动Nginx 配置 Nginx 为系统服务配置 Nginx 服务文件启动 Nginx 服务设置开机自启动检查 Nginx 状态停止 Nginx 服务重启 Nginx 服务 卸载 Nginx结语 前言 Nginx是一款卓越的高性能Web服务器&#xff0c…

【Unity细节】Json序列化时出现:An item with the same key has already been added. Key:

👨‍💻个人主页:元宇宙-秩沅 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 秩沅 原创 😶‍🌫️收录于专栏:unity细节和bug 😶‍🌫️优质专栏 ⭐【…

RFID系统

目录 在物联网应用中有三项关键技术 读写器 电子标签 工作原理 阅读器的组成及作用: 电子标签的组成及作用: RFID系统的组成 接口方式 在物联网应用中有三项关键技术 在物联网应用中有三项关键技术 1、传感器技术:这也是计算机应用中…

操作系统引论(一)

操作系统的地位和目标 计算机系统的组成 系统软件是和硬件相关的,这是它本质的特征。 操作系统在计算机系统中的地位 操作系统的设计目标 可扩充性是面向未来的。 操作系统的作用 1)用户与计算机硬件系统之间的接口 2)计算机系统资源的管…

阿里终面:10亿数据如何快速插入MySQL?

最快的速度把10亿条数据导入到数据库,首先需要和面试官明确一下,10亿条数据什么形式存在哪里,每条数据多大,是否有序导入,是否不能重复,数据库是否是MySQL? 假设和面试官明确后,有如…

第十五届蓝桥杯模拟赛(第一期)

大家好,我是晴天学长,本次分享,制作不易,需要的小伙伴可以点赞关注评论一波哦!后续会继续更新的。💪💪💪 还在持续更新中,目前只更新了部分内容。 一 .找数位 问题描述 …

Educational Codeforces Round 12 C 字符串和dp

Educational Codeforces Round 12 C zscoder喜欢简单字符串!如果每一对相邻字符都是不同的,则称为简单字符串 t 。例如,ab, aba, zscoder 是简单字符串,而 aa, add 则不简单。 zscoder 给出了一个字符串 s 。他想更改最少的字符…

shell脚本的awk续篇(粗糙版)

sleep 30 #这是睡眠时间 awk的精确筛选&#xff1a; $n{><}:对比数值 $n-"字符串"代表第n个字段包含某个字符串 $n!-"字符串"代表第n个字段不包含某个字符串 $n"字符串" 代表第n个字段为某个字符串 $n!"字符串"代表第n个字…

【教3妹学编程-算法题】2924. 找到冠军 II

3妹&#xff1a;2哥快看&#xff0c;我黑龙江的闺蜜给我发了一个她在打雪仗的视频&#xff0c;好大的雪啊&#xff0c;好欢乐。 2哥&#xff1a;什么&#xff0c;东北不是暴雪吗&#xff0c; 还可以打雪仗。 3妹 :是啊&#xff0c;可是雪停了就可以打雪仗了啊。 2哥&#xff1a…

Netty入门指南之NIO Channel详解

作者简介&#xff1a;☕️大家好&#xff0c;我是Aomsir&#xff0c;一个爱折腾的开发者&#xff01; 个人主页&#xff1a;Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客 当前专栏&#xff1a;Netty应用专栏_Aomsir的博客-CSDN博客 文章目录 参考文献前言Channe…

【1107】

interface是面向对象编程语言中接口操作的关键字&#xff0c;功能是把所需成员组合起来&#xff0c;用来封装一定功能的集合。 它好比一个模板&#xff0c;在其中定义了对象必须实现的成员&#xff0c;通过类或结构来实现它。 接口不能直接实例化&#xff0c;即ICount icnew iC…

回归模型原理总结及代码实现

前言 本文将介绍回归模型算法&#xff0c;并总结了一些常用的除线性回归模型之外的模型&#xff0c;其中包括一些单模型及集成学习器。 保序回归、多项式回归、多输出回归、多输出K近邻回归、决策树回归、多输出决策树回归、AdaBoost回归、梯度提升决策树回归、人工神经网络、…

openGauss Meetup(合肥站)精彩回顾 | openGauss合肥用户组正式成立

由openGauss社区、天津南大通用数据技术股份有限公司联合主办的“openGauss Meetup • 合肥站”已于11月4日落下帷幕&#xff0c;此次活动邀请到数据库行业专家与行业同仁共同探讨数据库技术发展创新、数据库产业发展与落地、数据库周边工具构建、生态共建等内容&#xff0c;推…

IDEA项目下不显示target目录或者target目录不完整没有新添加的资源,idea隐藏target目录

文章目录 一、前言二、idea隐藏target目录2.1、idea隐藏target目录2.2、git提交时隐藏target目录 三、idea下显示target目录3.1、解决idea下不显示target目录问题3.2、target显示目录不完整 一、前言 在idea-2020.1.4版本下讲解idea怎么显示或隐藏target目录。 需要知道:如果…