数据集——个人收集标注与使用过的数据集

news2026/2/14 16:03:22

前言

这是一个我个人在工作和学习中使用过以数据集的一部分，有语义分割，目标识别，人像抠图等几个大类，这只是我用过数据集中的一部分，这些数据集有小一部分是来源自网络，很大一部分都是我自己收集。

一、语义分割

1.书本

这个数据集标注了书本的中线与边缘的数据集，数据是用labelme标注的，数据集有2500张图像，是用来训练文档扫描的边缘检测与中线识别的。之前用ENet训练过，效果还蛮可以的。数据集标注样例如下：

2.皮肤

2.1 皱纹和眼袋（164张图像）

数据集标注了皱纹和眼袋的位置，数据集有转换好的mask图，可用于医美的皮肤皱纹检测与眼袋检测分割。训练方法和效果可参考我之前的博客：

基于语义分割实现人脸图像的皱纹检测定位与分割_皱纹检测算法_知来者逆的博客-CSDN博客

2.2 痘痘、红斑、雀斑（221张）

数据集包含了痘痘、红斑、雀斑这几种标注，可用来训练实实例分割，每个目标都有唯一的ID。

痘痘

红斑

雀斑

2.3 毛孔

毛孔的数据集里面只有毛孔，只能用于训练语义分割。

3. 拍照文档清晰二值

数据集是用于文档拍照清晰二值化，在某些APP里，这个功能叫省墨模式，样本是用来训练该滤镜的，训练的效果可以参与我之前的博客：

使用深度学习解决拍照文档复杂背景二值化问题_背景较深的图像怎么二值化_知来者逆的博客-CSDN博客

4.拍照文档阴影检测分割

数据集是用labelme标注的，标注了拍照文档的阴影部分，用来做拍照文档扫描的阴影检测去祛除用的，总共有1000张图像。

二、目标识别

1.智慧城市

1.1 手机

标注的是手机，数据格式是xml和转过的yolo的txt格式，有2000张。

1.2 安全帽

数据标注了戴安全的人头和不带安全帽的人头，数据格式是xml和转过的yolo的txt格式，总共有7800张图像。训练效果可参考我之前的博客：

安全帽佩戴检测——从数据处理、训练数据到模型部署落地(带有数据集、训练代码，可使用GPU的C++模型部署代码)_c++ ipc检测安全帽_知来者逆的博客-CSDN博客

1.3 烟火

数据标注了明火和起烟两个标签，数据格式是xml和转过的yolo的txt格式，总共有7600张图像。训练效果可参考我之前的博客：

基于Yolov5的烟火检测——模型训练与C++实现部署_yolov5 c++部署_知来者逆的博客-CSDN博客

1.4 抽烟

数据标注了人头和抽烟两个标签，数据格式是xml和转过的yolo的txt格式，总共有4800张图像。

1.5 文档

文档的目标检测检测了两个目标，双开的书与单张的文档。标注工具是labelImg,数据格式是xml和yolo的txt。

单张的文档

双张的书本

1.6 身份证

数据集包含了身份证正面和身份背面，身份证正面标注了正面和头像，身份证背面标注了背面和国徽，总共四个目标。标注工具是labelImg,数据格式是xml和yolo的txt。训练效果可以参考我之后的博客：

证件拍照扫描——基于C++与深度神经网络实现证件识别扫描并1比1还原证件到A4纸上_知来者逆的博客-CSDN博客

1.7 银行卡

数据集包含了银行正面和银行背面，银联logo，IC芯片，总共四个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.8 护照

护照标注了护照翻开的第一页和人物头像，总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.9 港澳通行证

港澳通行证标注了护正面、头像、背面，总共三个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.10 居住证

居住证标注了护正面、头像，总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.11 驾驶证

驾驶证标注了护正面、头像，总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.12 社保卡

社保卡标注了头像，银联logo,IC卡，社保卡正面，社保卡反面，国徽总共五个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

三、抠图

1.人像抠图

人像抠图有半身抠图，大概5万张左右，格式是mask图，这个是之前用于智能证件照。

待续更新................................

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/759411.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【动手学深度学习】--05.权重衰退

【动手学深度学习】--05.权重衰退

文章目录权重衰退1.原理1.1使用均方范数作为硬性限制1.2使用均方范数作为柔性限制1.3对最优解的影响1.4参数更新法则 2.从零开始实现权重衰退2.1初始化模型参数2.2定义L2范数惩罚2.3训练2.4忽略正则化直接训练2.5使用权重衰退 3.简洁实现权重衰退学习视频：权重衰…

阅读更多...

在网格化数据集上轻松执行 2D 高通、低通、带通或带阻滤波器研究（Matlab代码实现）

在网格化数据集上轻松执行 2D 高通、低通、带通或带阻滤波器研究（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…

阅读更多...

ModaHub魔搭社区：AI原生云向量数据库Zilliz Cloud设置白名单

ModaHub魔搭社区：AI原生云向量数据库Zilliz Cloud设置白名单

目录前提条件操作步骤下一步在 Zilliz Cloud 中，白名单是针对项目的安全设置，适用于项目下的所有集群。设置白名单后，仅白名单中的 IP 地址可以访问您项目下的所有集群。白名单能够有效降低受到恶意攻击的风险本教程将介绍如何设置白名单。前提条件确保满足以…

阅读更多...

EasyX测试布局代码

EasyX测试布局代码

#include <iostream> #include <algorithm> #include <graphics.h> // 引用图形库头文件 #include <conio.h> #include <unordered_map> #include <Windows.h> #include "layout/LayoutSystem.h"#define DEFAULT_PANELS_LAYOUT…

阅读更多...

谈二级索引

谈二级索引

前提： 在数据库中，1、索引分为聚簇索引和非聚簇索引两类。2、所有索引的数据结构都是树，查找树上的节点数据时通过用二分法来锁定数据范围，指定数据排序的规则，比如：有小到大，对比之后最终确定…

阅读更多...

Sequencer使用心得

Sequencer使用心得

在关卡序列中设置了触发蓝图的关键帧，为什么播放的时候没有触发蓝图事件呢？ 在关卡序列中触发蓝图，一般是将蓝图添加到轨道中，设置触发器，在对应的关键帧中，绑定蓝图事件。一般的话，点击播…

阅读更多...

栈、队列、优先级队列详解【c++】

栈、队列、优先级队列详解【c++】

目录 🏀stack的介绍和使用⚽stack的介绍⚽stack的使用 🏀queue的介绍和使用⚽queue的介绍⚽queue的使用 🏀priority_queue的介绍和使用⚽priority_queue的介绍⚽priority_queue的使用 🏀总结 🏀stack的介绍和使用 ⚽s…

阅读更多...

尝试-InsCode Stable Diffusion 美图活动一期

尝试-InsCode Stable Diffusion 美图活动一期

一、 Stable Diffusion 模型在线使用地址： https://inscode.csdn.net/inscode/Stable-Diffusion 二、模型相关版本和参数配置： 活动地址三、图片生成提示词与反向提示词： 提示词：realistic portrait painting of a japanese…

阅读更多...

OPENMV的形状和颜色组合识别

OPENMV的形状和颜色组合识别

使用openmv，通过阈值颜色和形状来去真假宝藏。调试过程发现颜色的阈值比较重要，因为不准的话，它会把一些颜色相近的物体也识别了。识别的精度有待提高，可以使用YOLOV5来精确识别，奈何本人没精力来弄这个。打开机器视觉…

阅读更多...

Proxmox VE 为 Windows 虚拟机添加硬盘遇到的问题

Proxmox VE 为 Windows 虚拟机添加硬盘遇到的问题

环境：PVE 8.x、Windows 11/Windows Server 2019 👉问题一： 为 windows 虚拟机添加磁盘，重启虚拟机后（在 windows 系统中重启）磁盘未能生效，并显示为橘色。 ❗橘色意味需要重启VM才能生效&…

阅读更多...

BIO实战、NIO编程与直接内存、零拷贝深入辨析-02

BIO实战、NIO编程与直接内存、零拷贝深入辨析-02

网络通信编程基本常识什么是 Socket ？ Socket 是应用层与 TCP/IP 协议族通信的中间软件抽象层，它是一组接口，一般由操作系统提供。在设计模式中，Socket 其实就是一个门面模式，它把复杂的 TCP/IP 协议处理和…

阅读更多...

RocketMQ学习笔记（基础篇）

RocketMQ学习笔记（基础篇）

目录 RocketMQ简介单Master模式多Master模式多Master多Slave模式（异步） 多Master多Slave模式（同步） 双主双从集群事务消息事务消息发送及提交事务补偿事务消息状态 RocketMQ高级功能消息存储存储介质消息的…

阅读更多...

vue upload 下载

vue upload 下载

目录上传下载 get post 对象/文件流 download处理返回文件流 axios.post 封装axios 后端直接返回文件流，打开下载文件是 [object Object]，将res改成res.data即可 1.请求设置类型responseType: blob（如果没有设置，打…

阅读更多...

14_Linux设备树下的platform驱动编写

14_Linux设备树下的platform驱动编写

目录设备树下的platform驱动简介运行测试设备树下的platform驱动简介 platform驱动框架分为总线、设备和驱动,其中总线不需要我们这些驱动程序员去管理，这个是Linux内核提供的,我们在编写驱动的时候只要关注于设备和驱动的具体实现即可。在没有设备树的Linux内…

阅读更多...

1770_VirtualBox下安装Debian

1770_VirtualBox下安装Debian

全部学习汇总： GreyZhang/little_bits_of_linux: My notes on the trip of learning linux. (github.com) 作为我自己的日常使用，Debian基本上没有出现过。最多是让它运行在某个设备上作为一个服务的平台，因为很多东西我懒得去配置。 Debia…

阅读更多...

前端 | （二）各种各样的常用标签 | 尚硅谷前端html+css零基础教程2023最新

前端 | （二）各种各样的常用标签 | 尚硅谷前端html+css零基础教程2023最新

学习来源：尚硅谷前端htmlcss零基础教程，2023最新前端开发html5css3视频文章目录 📚HTML排版标签📚HTML语义化标签📚块级元素与行内元素📚文本标签🐇常用的文本标签🐇不常用的文本标…

阅读更多...

模版模式在Spring中的应用

模版模式在Spring中的应用

前言模式模式在Spring中的应用较多，这里结合JdbcTemplate的源码来和大家一起学习下，更加深刻滴认识下模版模式，以便在日常开发中，能灵活运用模版模式，来减少重复代码，增强代码的可拓展性。何为模版模式…

阅读更多...

Python学习（七）

Python学习（七）

#字典 #字典的定义，同样是使用{}，不过存储的元素是一个个的：键值对。如下语法： my_dict{"周杰伦":99,"林俊杰":99} print(f"字典的内容是：{my_dict},类型是：{type(my_dict)}"…

阅读更多...

Vue条件渲染

Vue条件渲染

v-if 和 v-show <body> <div id"root"> <h2 v-if"false">欢迎来到{{name}}</h2&g…

阅读更多...

一文读懂STM32芯片总线

一文读懂STM32芯片总线

目录一、前言二、总线基础知识概述 (1)、总线在芯片中的角色 (2)、总线的类型 (3)、总线的指标 (4)、AHB和APB 三、总线框架结构 (1)、结构类型 (2)、总线模块 (3)、总线交互四、总结一、前言本篇介绍STM32芯片内部的总线系统结构，嵌入式芯片内部的…

阅读更多...

推荐文章

最新文章