数据集——个人收集标注与使用过的数据集

news2024/9/22 9:46:22

前言

这是一个我个人在工作和学习中使用过以数据集的一部分,有语义分割,目标识别,人像抠图等几个大类,这只是我用过数据集中的一部分,这些数据集有小一部分是来源自网络,很大一部分都是我自己收集。

一、语义分割

1.书本

这个数据集标注了书本的中线与边缘的数据集,数据是用labelme标注的,数据集有2500张图像,是用来训练文档扫描的边缘检测与中线识别的。之前用ENet训练过,效果还蛮可以的。数据集标注样例如下:

 

2.皮肤

2.1 皱纹和眼袋(164张图像)

数据集标注了皱纹和眼袋的位置,数据集有转换好的mask图,可用于医美的皮肤皱纹检测与眼袋检测分割。训练方法和效果可参考我之前的博客:

基于语义分割实现人脸图像的皱纹检测定位与分割_皱纹检测算法_知来者逆的博客-CSDN博客

2.2 痘痘、红斑、雀斑(221张)

数据集 包含了痘痘、红斑、雀斑这几种标注,可用来训练实实例分割,每个目标都有唯一的ID。

痘痘

 红斑

 雀斑

2.3 毛孔

 毛孔的数据集里面只有毛孔,只能用于训练语义分割。

3. 拍照文档清晰二值

数据集是用于文档拍照清晰二值化,在某些APP里,这个功能叫省墨模式,样本是用来训练该滤镜的,训练的效果可以参与我之前的博客:

使用深度学习解决拍照文档复杂背景二值化问题_背景较深的图像怎么二值化_知来者逆的博客-CSDN博客

 

4.拍照文档阴影检测分割

数据集是用labelme标注的,标注了拍照文档的阴影部分,用来做拍照文档扫描的阴影检测去祛除用的,总共有1000张图像。

二、目标识别

1.智慧城市

1.1 手机

标注的是手机,数据格式是xml和转过的yolo的txt格式,有2000张。

1.2 安全帽

 数据标注了戴安全的人头和不带安全帽的人头,数据格式是xml和转过的yolo的txt格式,总共有7800张图像。训练效果可参考我之前的博客:

安全帽佩戴检测——从数据处理、训练数据到模型部署落地(带有数据集、训练代码,可使用GPU的C++模型部署代码)_c++ ipc检测安全帽_知来者逆的博客-CSDN博客

1.3 烟火

 数据标注了明火和起烟两个标签,数据格式是xml和转过的yolo的txt格式,总共有7600张图像。训练效果可参考我之前的博客:

基于Yolov5的烟火检测——模型训练与C++实现部署_yolov5 c++部署_知来者逆的博客-CSDN博客

1.4 抽烟

 数据标注了人头和抽烟两个标签,数据格式是xml和转过的yolo的txt格式,总共有4800张图像。

1.5 文档

文档的目标检测检测了两个目标,双开的书与单张的文档。标注工具是labelImg,数据格式是xml和yolo的txt。

 单张的文档

双张的书本 

1.6 身份证

数据集包含了身份证正面和身份背面,身份证正面标注了正面和头像,身份证背面标注了背面和国徽,总共四个目标。标注工具是labelImg,数据格式是xml和yolo的txt。训练效果可以参考我之后的博客:

证件拍照扫描——基于C++与深度神经网络实现证件识别扫描并1比1还原证件到A4纸上_知来者逆的博客-CSDN博客

 

1.7 银行卡

数据集包含了银行正面和银行背面,银联logo,IC芯片,总共四个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.8 护照

护照标注了护照翻开的第一页和人物头像,总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.9 港澳通行证

港澳通行证标注了护正面、头像、背面,总共三个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.10 居住证

居住证标注了护正面、头像,总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.11 驾驶证

驾驶证标注了护正面、头像,总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.12 社保卡

社保卡标注了头像,银联logo,IC卡,社保卡正面,社保卡反面,国徽总共五个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

 

三、抠图

1.人像抠图

人像抠图有半身抠图,大概5万张左右,格式是mask图,这个是之前用于智能证件照。

待续更新................................

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/759411.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【动手学深度学习】--05.权重衰退

文章目录 权重衰退1.原理1.1使用均方范数作为硬性限制1.2使用均方范数作为柔性限制1.3对最优解的影响1.4参数更新法则 2.从零开始实现权重衰退2.1初始化模型参数2.2定义L2范数惩罚2.3训练2.4忽略正则化直接训练2.5使用权重衰退 3.简洁实现 权重衰退 学习视频:权重衰…

在网格化数据集上轻松执行 2D 高通、低通、带通或带阻滤波器研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

ModaHub魔搭社区:AI原生云向量数据库Zilliz Cloud设置白名单

目录 前提条件 操作步骤 下一步 在 Zilliz Cloud 中,白名单是针对项目的安全设置,适用于项目下的所有集群。设置白名单后,仅白名单中的 IP 地址可以访问您项目下的所有集群。白名单能够有效降低受到恶意攻击的风险 本教程将介绍如何设置白名单。 前提条件 确保满足以…

EasyX测试布局代码

#include <iostream> #include <algorithm> #include <graphics.h> // 引用图形库头文件 #include <conio.h> #include <unordered_map> #include <Windows.h> #include "layout/LayoutSystem.h"#define DEFAULT_PANELS_LAYOUT…

谈二级索引

前提&#xff1a; 在数据库中&#xff0c;1、索引分为聚簇索引和非聚簇索引两类。2、所有索引的数据结构都是树&#xff0c;查找树上的节点数据时通过用二分法来锁定数据范围&#xff0c;指定数据排序的规则&#xff0c;比如&#xff1a;有小到大&#xff0c;对比之后最终确定…

Sequencer使用心得

在关卡序列中设置了触发蓝图的关键帧&#xff0c;为什么播放的时候没有触发蓝图事件呢&#xff1f; 在关卡序列中触发蓝图&#xff0c;一般是将蓝图添加到轨道中&#xff0c;设置触发器&#xff0c;在对应的关键帧中&#xff0c;绑定蓝图事件。 一般的话&#xff0c;点击播…

栈、队列、优先级队列详解【c++】

目录 &#x1f3c0;stack的介绍和使用⚽stack的介绍⚽stack的使用 &#x1f3c0;queue的介绍和使用⚽queue的介绍⚽queue的使用 &#x1f3c0;priority_queue的介绍和使用⚽priority_queue的介绍⚽priority_queue的使用 &#x1f3c0;总结 &#x1f3c0;stack的介绍和使用 ⚽s…

尝试-InsCode Stable Diffusion 美图活动一期

一、 Stable Diffusion 模型在线使用地址&#xff1a; https://inscode.csdn.net/inscode/Stable-Diffusion 二、模型相关版本和参数配置&#xff1a; 活动地址 三、图片生成提示词与反向提示词&#xff1a; 提示词&#xff1a;realistic portrait painting of a japanese…

OPENMV的形状和颜色组合识别

使用openmv&#xff0c;通过阈值颜色和形状来去真假宝藏。调试过程发现颜色的阈值比较重要&#xff0c;因为不准的话&#xff0c;它会把一些颜色相近的物体也识别了。识别的精度有待提高&#xff0c;可以使用YOLOV5来精确识别&#xff0c;奈何本人没精力来弄这个。 打开机器视觉…

Proxmox VE 为 Windows 虚拟机添加硬盘遇到的问题

环境&#xff1a;PVE 8.x、Windows 11/Windows Server 2019 &#x1f449;问题一&#xff1a; 为 windows 虚拟机添加磁盘&#xff0c;重启虚拟机后&#xff08;在 windows 系统中重启&#xff09;磁盘未能生效&#xff0c;并显示为橘色。 ❗橘色 意味需要重启VM才能生效&…

BIO实战、NIO编程与直接内存、零拷贝深入辨析-02

网络通信编程基本常识 什么是 Socket &#xff1f; Socket 是应用层与 TCP/IP 协议族通信的中间软件抽象层&#xff0c;它是一组接口&#xff0c;一般由操作 系统提供。在设计模式中&#xff0c;Socket 其实就是一个门面模式&#xff0c;它把复杂的 TCP/IP 协议处理和…

RocketMQ学习笔记(基础篇)

目录 RocketMQ简介 单Master模式 多Master模式 多Master多Slave模式&#xff08;异步&#xff09; 多Master多Slave模式&#xff08;同步&#xff09; 双主双从集群 事务消息 事务消息发送及提交 事务补偿 事务消息状态 RocketMQ高级功能 消息存储 存储介质 消息的…

vue upload 下载

目录 上传 下载 get post 对象/文件流 download处理返回 文件流 axios.post 封装axios 后端直接返回文件流&#xff0c;打开下载文件是 [object Object]&#xff0c;将res改成res.data即可 1.请求设置类型responseType: blob&#xff08;如果没有设置&#xff0c;打…

14_Linux设备树下的platform驱动编写

目录 设备树下的platform驱动简介 运行测试 设备树下的platform驱动简介 platform驱动框架分为总线、设备和驱动,其中总线不需要我们这些驱动程序员去管理&#xff0c;这个是Linux内核提供的,我们在编写驱动的时候只要关注于设备和驱动的具体实现即可。在没有设备树的Linux内…

1770_VirtualBox下安装Debian

全部学习汇总&#xff1a; GreyZhang/little_bits_of_linux: My notes on the trip of learning linux. (github.com) 作为我自己的日常使用&#xff0c;Debian基本上没有出现过。最多是让它运行在某个设备上作为一个服务的平台&#xff0c;因为很多东西我懒得去配置。 Debia…

前端 | (二)各种各样的常用标签 | 尚硅谷前端html+css零基础教程2023最新

学习来源&#xff1a;尚硅谷前端htmlcss零基础教程&#xff0c;2023最新前端开发html5css3视频 文章目录 &#x1f4da;HTML排版标签&#x1f4da;HTML语义化标签&#x1f4da;块级元素与行内元素&#x1f4da;文本标签&#x1f407;常用的文本标签&#x1f407;不常用的文本标…

模版模式在Spring中的应用

前言 模式模式在Spring中的应用较多&#xff0c;这里结合JdbcTemplate的源码来和大家一起学习下&#xff0c;更加深刻滴认识下模版模式&#xff0c;以便在日常开发中&#xff0c;能灵活运用模版模式&#xff0c;来减少重复代码&#xff0c;增强代码的可拓展性。 何为模版模式…

Python学习(七)

#字典 #字典的定义&#xff0c;同样是使用{}&#xff0c;不过存储的元素是一个个的&#xff1a;键值对。如下语法&#xff1a; my_dict{"周杰伦":99,"林俊杰":99} print(f"字典的内容是&#xff1a;{my_dict},类型是&#xff1a;{type(my_dict)}"…

Vue条件渲染

v-if 和 v-show <body> <div id"root"><!--用v-show做条件渲染--> <!-- <h2 v-show"false">欢迎来到{{name}}</h2>--><!--使用v-if做条件渲染--><h2 v-if"false">欢迎来到{{name}}</h2&g…

一文读懂STM32芯片总线

目录 一、前言 二、总线基础知识概述 (1)、总线在芯片中的角色 (2)、总线的类型 (3)、总线的指标 (4)、AHB和APB 三、总线框架结构 (1)、结构类型 (2)、总线模块 (3)、总线交互 四、总结 一、前言 本篇介绍STM32芯片内部的总线系统结构&#xff0c;嵌入式芯片内部的…