【目标检测数据集】VOC2007 数据集介绍

【目标检测数据集】VOC2007 数据集介绍

news2026/2/12 19:47:02

一、介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集，官网：http://host.robots.ox.ac.uk/pascal/VOC/

备注：VOC数据集常用的均值为：mean_RGB=(122.67891434, 116.66876762, 104.00698793)

Pytorch 上通用的数据集的归一化指标为：mean=(0.485, 0.456, 0.406) , std=(0.229, 0.224, 0.225)

voc2007 官网：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html

注意：在 VOC 官方给出的数据集中，只有 VOC2007 是给出了带有标记的测试集的。其他年份的数据集是没有给测试集，只给的有带标记的验证集。

二、VOCdevikit

里面是开发工具包代码和文档。解压后如下：

如图所示，里面是一些 MATLAB 代码，就是用这些代码处理的这个数据集，具体可以看看 devkit_doc.pdf，就是一个比较详细的说明书。

三、VOCtrainval_06-Nov-2007

这个里面是具体的图片数据。

Annotations

里面是图片的标注信息，打开之后全是xml文件，文件名就是图像名称。

ImageSets

图像标签集合，里面划分了训练集、验证集、测试集。

这3个文件夹对应的是 VOC challenge 中3类不同的任务。

Main：对应 classification 和 detection 两个任务

在这里面一共有63个文件。

如何得到的：

train.txt、 trainval.txt、 val.txt：划分的训练集、验证集、测试集

剩余60个文件：20 * 3（类别名_train.txt、类别名_trainval.txt、类别名_val.txt ） = 60

VOC 2007 类别（20类）：

person
bird, cat, cow, dog, horse, sheep
aeroplane, bicycle, boat, bus, car, motorbike, train
bottle, chair, dining table, pottedplant, sofa, tv/monitor

然后打开这些子类的文本文档的时候，会稍显不同，以 aeroplane_train.txt （飞机）为例：

该文件一共有2501行，说明此任务训练集图片共有2501个。在

图像ID 后面还有一个数字（-1，1，0）。

意义如下：

-1：表示当前图像中没有该类物体；

1：表示当前图像中有该类物体；

0：表示当前图像中该类物体只露出了一部分。

Layout、Segmentation 为另外两个任务。

所以这3个文件夹中包含的是3类不同的任务需要用到的不同的图片集合。

其中 Layout 和 Segmentation：

train.txt 表示的是训练集，val.txt 表示的是验证集， trainval.txt 是把前两者写到了一起

JPEGImages

里面全都是原始图片数据，一共有5011张个图像。

SegmentationClass

该文件夹是专门用于 Segmentation 任务的一个文件夹，里面存放的是 Segmentation 任务的 label 信息。用于Semantic segmentation [语义分割]。这里的图片共有20+1(背景色)种颜色。

该文件夹中的图片共有422张，在 Imageseets/Segmentation 文件夹中的 trainval.txt 文档，也有422行。

SegmentationObject

用于 Instance Segmentation（实例分割）。在Class里面，一张图片里如果有多架飞机，那么会全部标注为红色。而在Object里面，同一张图片里面的飞机会被不同颜色标注出来。

四、VOCtest_06-Nov-2007

同 VOCtrainval_06-Nov-2007

五、数据下载

【目标检测数据集】VOC2007 数据集介绍

六、链接作者

欢迎关注我的公众号：@AI算法与电子竞赛

硬性的标准其实限制不了无限可能的我们，所以啊！少年们加油吧！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1591830.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

（三）ffmpeg 解码流程以及函数介绍

（三）ffmpeg 解码流程以及函数介绍

一、视频解码流程二、函数介绍 1.avformat_network_init 函数作用： 执行网络库的全局初始化。这是可选的，不再推荐。此函数仅用于解决旧GnuTLS或OpenSSL库的线程安全问题。如果libavformat链接到这些库的较新版本，或者不使用它们&#…

阅读更多...

AI大模型探索之路-应用篇1：Langchain框架概述—快速构建大模型应用

AI大模型探索之路-应用篇1：Langchain框架概述—快速构建大模型应用

目录一、什么是LangChain？ 二、LangChain解决了哪些问题？ 三、LangChain总体架构四、代码实践样例总结一、什么是LangChain？ 为大模型应用提供简便之道。 LangChain，专为构建庞大的语言模型应用程序设计的框架&#xff0…

阅读更多...

神级浏览器，大小不到2MB

神级浏览器，大小不到2MB

今天分享2个神级浏览器，大小不到2MB，第一个是崇尚速度与简约的手机浏览器，支持广告拦截、插件定制、主题自定义等功能 https://github.com/tuyafeng/Via ，安装包大小不过2MB。资源嗅探可以很方便的下载网页视频： 第2个…

阅读更多...

Ubuntu 22.04 安装 zabbix

Ubuntu 22.04 安装 zabbix

Ubuntu 22.04 安装 zabbix 1，Install Zabbix repository2，安装Zabbix server，Web前端，agent3，安装mysql数据库3.1 创建初始数据库3.2 导入初始架构和数据，系统将提示您输入新创建的密码。3.3 在导入数据库架…

阅读更多...

尚硅谷html5+css3（3）布局

尚硅谷html5+css3（3）布局

1.文档流normal flow -网页是一个多层结构 -通过CSS可以分别为每一层设置样式 -用户只能看到最顶层 -最底层：文档流（我们所创建的元素默认都是从文档流中进行排列） <head><style>.box1 {background-color: blue;}/*它的父元…

阅读更多...

今日arXiv最热大模型论文：清华大学发布，ChatGML又添新功能，集成“自我批评”，提升数学能力

今日arXiv最热大模型论文：清华大学发布，ChatGML又添新功能，集成“自我批评”，提升数学能力

引言：数学问题解决在大语言模型中的挑战在当今的人工智能领域，大语言模型（Large Language Models，LLMs）已经在理解和生成人类语言方面取得了显著的进展。这些模型在文本摘要、问答、角色扮演对话等多种语言任务上展现…

阅读更多...

JVM性能调优——OOM分类及解决方案

JVM性能调优——OOM分类及解决方案

文章目录 1、概述2、OOM案例1：堆内存溢出3、OOM案例2：元空间溢出4、OOM案例3:GC overhead limit exceeded5、OOM案例4：线程溢出6、小结在工作中会经常遇到内存溢出(Out Of Memory,OOM)异常的情况，每当遇到OOM，总是让人…

阅读更多...

今天我们来聊一聊Java中的Semaphore

今天我们来聊一聊Java中的Semaphore

写在开头在上几天写《基于AQS手写一个同步器》时，很多同学留言说里面提到的Semaphore，讲得太笼统了，今天趁着周末有空，咱们就一起详细的学习和梳理一把 Semaphore。什么是Semaphore？ 在前面我们讲过的synchronize…

阅读更多...

【计算机毕业设计】人事管理系统——后附源码

【计算机毕业设计】人事管理系统——后附源码

🎉**欢迎来到我的技术世界！**🎉 📘 博主小档案： 一名来自世界500强的资深程序媛，毕业于国内知名985高校。 🔧 技术专长： 在深度学习任务中展现出卓越的能力，包括但不限于…

阅读更多...

【刷题】代码随想录算法训练营第十一天|20、有效的括号，1047、删除字符中的所有相邻重复项，150、逆波兰表达式求值

【刷题】代码随想录算法训练营第十一天|20、有效的括号，1047、删除字符中的所有相邻重复项，150、逆波兰表达式求值

目录 20、有效的括号1047、删除字符中的所有相邻重复项150、逆波兰表达式求值 20、有效的括号讲解：https://programmercarl.com/0020.%E6%9C%89%E6%95%88%E7%9A%84%E6%8B%AC%E5%8F%B7.html 括号匹配是使用栈解决的经典问题。三种不匹配：第一种是缺少匹…

阅读更多...

Axure RP中的相关概念及高保真原型构建方法

Axure RP中的相关概念及高保真原型构建方法

1 Axure RP中概念介绍对于构建高保真原型来说，需要知道事件（Event）、Case、Action等概念。Axure RP中给出这些概念，是为了方便原型的构建，尤其是高保真原型的构建。事件（Event）是附着于控件…

阅读更多...

.vue文件引入路径正确，但报错

.vue文件引入路径正确，但报错

问题描述使用Vue挂载组件时，导入路径正确，但是一直提示 Already included file name ‘绝对路径/index.vue’ differs from file name ‘绝对路径/Index. vue’ only in casing. The file is in the program because: Imported via ‘./components/ind…

阅读更多...

Ubuntu，Kylin环境使用clock()函数设置延迟

Ubuntu，Kylin环境使用clock()函数设置延迟

一、Ubuntu操作系统中，直接在main中测试clock()设置延迟功能代码描述：直接在main中使用clock()函数设置200ms延迟。代码输出： 实现了200ms的延迟。 #include <time.h> #include <sys/time.h> #include <stdio.h> #inc…

阅读更多...

HarmonyOS实战开发-自定义通知角标、如何设定应用的桌面图标角标的功能。

HarmonyOS实战开发-自定义通知角标、如何设定应用的桌面图标角标的功能。

介绍本示例主要展示了设定应用的桌面图标角标的功能，使用ohos.notificationManager 接口，进行桌面角标的设置，通知的发送，获取等。效果预览使用说明在使用本应用时，需安装并启动仿桌面应用；在主界面…

阅读更多...

微信小程序报错——“errno“: 600001, “errMsg“: “request:fail -2:net::ERR_FAILED“

微信小程序报错——“errno“: 600001, “errMsg“: “request:fail -2:net::ERR_FAILED“

bug现象微信小程序体验版和真机调试进入小程序的时候接口就出现了这个报错 "errno": 600001, "errMsg": "request:fail -2:net::ERR_FAILED" 排查检查是证书过期还是证书链不完整证书的信任链完整问题，可以在亚数信息-SSL/TLS安…

阅读更多...

Leetcode:283.移动零

Leetcode:283.移动零

题目要求给定一个数组 nums，编写一个函数将所有 0 移动到数组的末尾，同时保持非零元素的相对顺序。请注意 ，必须在不复制数组的情况下原地对数组进行操作。示例 1: 输入: nums [0,1,0,3,12] 输出: [1,3,12,0,0] 示例 2: 输入: nums [0…

阅读更多...

8、【构造者模式】适合于需要创建复杂对象的场景

8、【构造者模式】适合于需要创建复杂对象的场景

你好，我是程序员。今天我们来学习23种设计模式中的建造者模式。构造者模式是什么？有什么优缺点？使用场景，与工厂模式有什么区别？简单代码实现。一、是什么？ 建造者模式（Builder Pattern&…

阅读更多...

MySQL：MySQL的查询(上)

MySQL：MySQL的查询(上)

文章目录 MySQL的增加单行数据插入多行数据插入插入否则更新替换 MySQL的查询select列where语句本篇开始总结的是MySQL当中的基本查询语句对于数据库的查询，无非大致就是增删查改，因此对于这些内容进行一一解释： MySQL的增加单行数据插…

阅读更多...

鸿铭网创88计第49计：2024挂机托管项目，单号躺赚4000+，无需发作品

鸿铭网创88计第49计：2024挂机托管项目，单号躺赚4000+，无需发作品

项目概述： 这个副业项目极为适合忙碌却希望额外赚钱的伙伴们。核心是与平台合作，提供快手账号用于发布视频，视频中会嵌入推广链接。当有用户通过这些链接下载应用时，我们就能获得拉新佣金。项目地址 ： laoa1.cn/…

阅读更多...

Json和Qt中Json的使用学习笔记

Json和Qt中Json的使用学习笔记

视频链接 https://www.bilibili.com/video/BV1yf4y1A7ek/?p2&spm_id_frompageDriver&vd_sourcefa4ef8f26ae084f9b5f70a5f87e9e41b Json JSON是在网络传输中常用的数据格式，能将不同类型的数据统一起来，我们在发送数据前将不同类型的数据存入到…

阅读更多...

推荐文章

最新文章