目标检测,将voc格式转化为coco格式详细过程

news2024/11/19 6:41:24

在目标检测方法研究中,数据集的格式至关重要,为了减小模型的训练时长,需要现在小数据集进行模型研究,从而需要将VOC数据集转化为coco格式。下面一步一步来看:

1. 下载VOC数据集

Pascal VOC,即Pattern Analysis, Statical Modeling and Computational Learning Visual Object Classes。详细可参考:http://host.robots.ox.ac.uk/pascal/VOC/

以及论文:http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham10.pdf

数据集下载,在linux系统用以下命令直接下载即可:

# VOC 2007
# 训练验证集
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
# 测试集
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
# 开发工具包代码和文档
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar


# VOC 2012
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

解压方式可参考我之前的文章,进行批量一键解压:https://blog.csdn.net/qq_33854260/article/details/121861169?spm=1001.2014.3001.5502

2. 生成coco格式的标签文件:

这里参考github的代码:https://github.com/KKKSQJ/DeepLearning/blob/master/others/label_convert/voc2coco.py

注意这里需设置voc的根目录,如:

voc_data_dir = './VOC_2007/VOCtrainval_06-Nov-2007/VOCdevkit/VOC2007'
json_save_path = './VOC_2007_COCO/voc2007_train.json'
split = 'train' # train  val  test
parseXmlFilse(data_dir=voc_data_dir, json_save_path=json_save_path, split=split)

运行一次,可在目标文件夹得到对应的标签json文件;修改参数,再次运行,从而分别得到train,val, test的json文件。

3. 配置文件目录:

先来看coco文件目录:

annotations:存放标签文件,即生成的json文件,需要创建相同的文件,并拷贝过来:

 创建数据图片文件夹,并把voc对应的数据拷贝过来。然而,VOC的训练和测试图片都放在一起。提前创建好目标文件夹,之后用我撰写的以下脚本来划分,脚本代码如下:

import os
import shutil

voc_train_val_img = "./voc_coco/voc2007/JPEGImages"
train_txt = "./voc_coco/VOCtrainval_06-Nov-2007/VOCdevkit/VOC2007/ImageSets/Main/train.txt"
val_txt = "./voc_coco/VOCtrainval_06-Nov-2007/VOCdevkit/VOC2007/ImageSets/Main/val.txt"

voc_coco_train_target_dir = "./voc_coco/voc2007/train2007"
voc_coco_val_target_dir = "./voc_coco/voc2007/val2007"

with open(train_txt, "r") as f:
    train = f.read()
    tp = train.split("\n")
    for j in range(len(tp)):
        file_path = os.path.join(voc_train_val_img, tp[j]+".jpg")
        tar_path = os.path.join(voc_coco_train_target_dir, tp[j]+".jpg")
        if os.path.exists(file_path):
            shutil.move(file_path, tar_path)
        else:
            print("Non-exist file", file_path)

print("Train data splited!...")

with open(val_txt, "r") as f:
    train = f.read()
    tp = train.split("\n")
    for j in range(len(tp)):
        file_path = os.path.join(voc_train_val_img, tp[j]+".jpg")
        tar_path = os.path.join(voc_coco_val_target_dir, tp[j]+".jpg")
        if os.path.exists(file_path):
            shutil.move(file_path, tar_path)
        else:
            print("Non-exist file", file_path)

print("Val data splited!...")

转换完成后的结果:

 希望能对大家有帮助~~~~

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/543229.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

windows2003系统SSL证书单站点部署https

本文将讲解,在windows 2003操作系统下,IIS 6 环境的服务器ssl证书安装教程。 安装前,请准备好SSL证书,没有的话,可以点这里申请SSL证书>>> 部署前请退出服务器内安装的杀毒软件(360、金山、安全…

Linux 安装Qt6 教程及错误解决

在Linux环境,通常为Ubuntu,安装Qt开发环境,与Windows安装相比,还是稍显繁琐,需要多做几个步骤。 这里的Ubuntu版本采用的是ubuntu-22.04.2-desktop-amd64,所以,比旧版本会少很多坑,…

链表题目强化练

目录 前言 两数相加 删除链表的倒数第N个结点 环形链表 相交链表 合并 K 个升序链表 复制带随机指针的链表 前言 初学者在做链表的题目时有一个特点,就是每看一个链表的题都觉得很简单,但真正到了扣代码的时候不是这卡一块就是那卡一块。这是因为…

No module named PyQt5

背景:将Python文件转成APP,在编辑器中运行没有问题,一使用pyinstaller转成app就报错了 尝试了各种网上的解法都无效,最后是GPT4解决的 Q: 我遇到一个奇怪的问题,我在python文件中,引用了pyqt5…

Android Termux安装MySQL数据库 | 公网安全远程连接【cpolar内网穿透】

文章目录 前言1.安装MariaDB2.安装cpolar内网穿透工具3. 创建安全隧道映射mysql4. 公网远程连接5. 固定远程连接地址 前言 Android作为移动设备,尽管最初并非设计为服务器,但是随着技术的进步我们可以将Android配置为生产力工具,变成一个随身…

【数据结构与算法】常见排序算法

文章目录 概述1、冒泡排序(Bubble Sort)1.1 步骤1.2 动图演示1.3 java代码实现 2、选择排序(Selection Sort)2.1 步骤2.2 动图演示2.3 java代码实现 3、插入排序(Insertion Sort)3.1 步骤3.2 动图演示3.3 j…

测试-用例篇

软件测试的生命周期 需求分析 - 测试计划 - 测试设计、测试开发 - 测试执行 - 测试评估 测试用例要素 测试环境、操作步骤、测试数据、预期结果 测试用例的要素没有执行结果。 测试用例要素不需要执行结果,因为执行结果需要执行完测试用例才会知道,没…

代码随想录算法训练营day45 | 70. 爬楼梯 (进阶),322. 零钱兑换,279.完全平方数

代码随想录算法训练营day45 | 70. 爬楼梯 (进阶),322. 零钱兑换,279.完全平方数 70. 爬楼梯 (进阶)解法一:动态规划 322. 零钱兑换解法一:动态规划 279.完全平方数解法一&#xff1…

秒懂算法 | 共识算法之Raft算法模拟数

01、Leader选举 存在A、B、C三个成员组成的Raft集群,刚启动时,每个成员都处于Follower状态,其中,成员A心跳超时为110ms,成员B心跳超时为150ms,成员C心跳超时为130ms,其他相关信息如图1所示。 ■…

2024王道数据结构考研丨第三章:栈和队列

2024王道数据结构考研笔记专栏将持续更新,欢迎 点此 收藏,共同交流学习… 文章目录 第三章:栈和队列3.1栈(stack)3.1.1栈的基本概念3.1.2 栈的顺序存储3.1.3栈的链式存储 3.2队列(Queue)3.2.1队…

【点云抽稀】一种基于均匀分布随机数的点云抽稀算法

文章目录 1. 背景2. 原理3. 实现3.1 定义Utils类3.2 加入预定义宏,确定层级3.3 函数实现 1. 背景 在大数据点云的存储中,常常要进行空间分区,一般的策略是构建四叉树或者八叉树。在构建树的过程中,一个不可避免的点就是点云的快速…

Text, Shapes, Colors 的使用

1. Text 的使用 // 多行文本 // Hello, World! This is the Swiftful Thinking Bootcamp. I am really enjoying this course and learning alot.// .lowercased() 文字小写 .uppercased() 文字大写 capitalized: 以单词形式显示 Text("Hello, World!".capitalized)…

test123

import matplotlib.pyplot as plt import pandas as pd # 从Power BI中获取输入数据 data pd.DataFrame({ Country: [USA, Canada, UK, Germany, France], Population: [328, 38, 66, 83, 67] }) # 使用Matplotlib绘制图表 plt.bar(data[Country], data[Population]…

Sentinel的另外三种流控模式(附代码详细介绍)

前言:大家好,我是小威,24届毕业生,在一家满意的公司实习。本篇文章将详细介绍Sentinel的其他三种流控模式,后续文章将详细介绍Sentinel的其他知识。 如果文章有什么需要改进的地方还请大佬不吝赐教👏&#…

轻量应用服务器如何选择之阿里云和腾讯云PK哪个好?

阿里云和腾讯云都有轻量应用服务器,轻量服务器是一种轻量级开箱即用的云服务器,适合小型网站、博客或测试等单机应用,那么问题来了,轻量应用服务器到底是阿里云好还是腾讯云好?阿腾云来详细对比下阿里云轻量应用服务器…

find命令的结果顺序

文章目录 1. 目的2. 准备: 克隆 doxygen 源码3. ubuntu22.04 结果4. ubuntu16.04 结果5. git bash 结果6. 三路比较7. 保持一样的结果: 用自然排序8. References 1. 目的 在研读 doxygen 源码时, 在不同电脑、不同操作系统上使用了 find 命令…

vue2中provide/inject的使用

一般来说,组件之间有以下几种关系: A-B、A-C、B-D、B-E、C-F都是父子关系,B-C、D-E-F是兄弟关系,A-D、A-E、A-F是祖先与孙子关系。 vue2中provide/inject这对选项需要一起使用,以允许一个祖先组件向其所有子孙后代注…

私有化部署即时通讯工具能为企业提升工作沟通效率吗?

在疫情的影响下,越来越多的企业开始采用私有化部署的方式部署即时通讯工具,以提升工作沟通效率。私有化部署的即时通讯工具,能够为企业提供完善的人员管理、安全保障、灵活便捷等优势,帮助企业更好地管理人员、团队协作以及工作沟…

CAMx-Python融合技术与大气污染来源解析方法

详情点击链接:CAMx-Python融合技术应用与大气污染来源解析方法 CAMx模型是一个基于大气化学,针对臭氧、颗粒物和雾霾天气过程的大气污染物计算模型。 1、CAMx模式的区域空气质量模拟配置技术; 2、SMOKE模型的CAMx模式大气排放清单输入准备&…

Kubernetes 二进制部署高可用集群 失败 看报错

概述 openssl证书有问题导致失败,未能解决openssl如何创建私钥,可参考ansible 在私有局域网内完成Kubernetes二进制高可用集群的部署 ETCD Openssl > ca 证书 Haproxy Keepalived Kubernetes 主机规划 序号名字功能VMNET 1备注 1备注 2备注 3 备注…