基于YOLOv5的智能人脸数据标注工具源码,实现人脸数据标注自动化,可导出PASCAL VOC XML、MS COCO JSON

news2025/1/11 11:06:24

Simple Icons

基于YOLOv5的智能人脸数据标注工具,实现人脸数据标注自动化

可自定义人脸检测模型、可导出多种格式标签,包括PASCAL VOC XML、MS COCO JSON、YOLO TXT

下载地址:基于YOLOv5的智能人脸数据标注工具源码,实现人脸数据标注自动化

📌 项目整体流程与扩展应用

📌 项目功能结构与信息流

💡项目结构

.
├── face-labeling							# 项目名称
│   ├── util								# 工具包
│   │   ├── voc_xml.py						# PASCAL VOC XML
│   │   ├── coco_json.py					# MS COCO JSON
│   │   ├── yolo_txt.py						# YOLO TXT
│   │   ├── model_opt.py					# 模型管理
│   │   ├── obj_opt.py						# 目标管理
│   │   ├── path_opt.py						# 路径管理
│   │   ├── log.py							# 日志管理
│   │   └── time_format.py					# 日期格式化
│   ├── data								# 测试数据
│   │   └── imgs							# 测试图片,来源于WIDER FACE Test
│   ├── models								# 模型Hub
│   │   ├── readme.md						# 模型Hub README
│   │   ├── *.pt							# PyTorch模型
│   │   └── *.onnx							# ONNX模型
│   ├── face_labeling.py					# 主运行文件
│   ├── LICENSE								# 项目许可
│   ├── CodeCheck.md						# 代码检查
│   ├── .gitignore							# git忽略文件
│   ├── yolov5_widerface.md					# 基于YOLOv5的人脸检测模型的构建
│   ├── yolov5_pytorch_gpu.md				# YOLOv5 PyTorch GPU安装教程
│   ├── README.md							# 项目说明
│   └── requirements.txt					# 脚本依赖包

🔥安装教程

✅ 第一步:安装Face Labeling

📌 创建conda环境

conda create -n facelabel python==3.8
conda activate facelabel # 进入环境

📌 克隆

git clone https://gitee.com/CV_Lab/face-labeling.git

✅ 第二步:安装Face Labeling依赖

cd ./face-labeling
conda activate facelabel # 进入环境
pip install -r requirements.txt -U

📌 将人脸模型文件(.pt)放入models 目录中

❗ 注意:yolov5默认采用pip安装PyTorch GPU版,如果采用官网安装PyTorch GPU版,参见YOLOv5 PyTorch GPU安装教程

✅ 基于YOLOv5的人脸检测模型的构建

📌 widerface-m人脸检测模型是在WIDER FACE数据集上,基于YOLOv5 v6.1训练的,具体训练过程参见yolov5_widerface.md

📌 darkface-m人脸检测模型是在DARK FACE数据集上,基于YOLOv5 v6.1训练的,具体训练过程参见yolov5_darkface.md

❤️ 本项目提供了以下人脸检测模型:

模型名称下载地址模型大小适用范围适用设备
widerface-m百度云 , 提取码:5gfs42.1MB实时,图片,视频GPU
darkface-m百度云 , 提取码:mm2k42.2MB实时,图片,视频GPU

⚡使用教程

💡 webcam实时标注

# a键捕获视频帧,q键退出
python face_labeling.py

💡 图片标注(包括批量图片标注)

python face_labeling.py -m img # 默认测试图片目录data/imgs
python face_labeling.py -m img -imd ./img_dir # 指定图片目录

❗ 注:本项目支持的图片输入格式:jpg | jpeg | png | bmp | tif | webp

💡 视频标注(包括批量视频标注)

python face_labeling.py -m video # 默认测试视频目录data/videos
python face_labeling.py -m video -vd ./video_dir # 指定视频目录

❗ 注:本项目支持的视频输入格式:mp4 | avi | wmv | mkv | mov | gif | vob | swf | mpg | flv | 3gp | 3g2

❗ 说明:以上三种检测模式都会在项目根目录中生成FaceFrame目录,该目录会生成frame*的子目录,子目录结构如下:

# webcam和图片标注的目录
.
├── FaceFrame						# 人脸数据保存目录
│   ├── frame						# 子目录
│   │   ├── raw						# 原始图片
│   │   ├── tag						# 标记图片(包括:人脸检测框、人脸ID、置信度、帧ID、FPS、人脸总数,人脸尺寸类型(小、中、大)数量)
│   │   ├── voc_xml					# PASCAL VOC XML 标注文件
│   │   ├── coco_json				# MS COCO JSON 标注文件
│   │   ├── yolo_txt				# YOLO TXT 标注文件
│   ├── frame2						# 子目录
│   │   ├── raw						# 原始图片
│   │   ├── ......
# 视频标注的目录
.
├── FaceFrame						# 人脸数据保存目录
│   ├── frame						# 子目录
│	│   ├── video_name01			# 子视频目录
│   │   │   ├── raw					# 原始图片
│   │   │   ├── tag					# 标记图片(包括:人脸检测框、人脸ID、置信度、帧ID、FPS、人脸总数,人脸尺寸类型(小、中、大)数量)
│   │   │   ├── voc_xml				# PASCAL VOC XML 标注文件
│   │   │   ├── coco_json			# MS COCO JSON 标注文件
│   │   │   ├── yolo_txt			# YOLO TXT 标注文件
│	│   ├── video_name02			# 子视频目录
│   │   │   ├── raw					# 原始图片
│   │   │   ├── ......

❗ 查看检测结果:人脸图片检测结果会保存在FaceFrame/frame*/tag中,以python face_labeling.py -m img为例运行项目自带检测图片,检测结果如下:

widerface-m检测结果

💡 自定义人脸模型

# 默认为widerface-m
python face_labeling.py -mn face_model # 以实时标注为例
python face_labeling.py -mn darkface-m # 以实时标注为例,darkface-m.pt

💡 自定义类别

# 默认为face,以口罩识别为例
python face_labeling.py -cls mask # 口罩类
python face_labeling.py -cls without-mask # 未戴口罩类

💡 自定义模型参数

# 可以根据自定义人脸模型进行相应的调参,以实时标注为例

# 自定义设备,默认为cuda:0
python face_labeling.py
python face_labeling.py -dev 0 # cuda:0版
python face_labeling.py -dev cpu # cpu版

# NMS 置信度阈值,默认为0.5
python face_labeling.py -conf 0.8

# NMS IoU阈值,默认为0.45
python face_labeling.py -iou 0.5

# 单张图片的最大检测目标数,默认为1000
python face_labeling.py -mdn 10

# 以上参数也可以同时使用,例如:
python face_labeling.py -conf 0.8 -iou 0.5
python face_labeling.py -conf 0.8 -iou 0.5 -mdn 10

# 模型推理尺寸
python face_labeling.py -isz 320

# 强制重载YOLOv5
python face_labeling.py -ry

💡 设置标签样式

# 以实时标注为例
python face_labeling.py -ls id # 标签仅显示ID
python face_labeling.py -ls conf # 标签仅显示置信度(%)
widerface-m检测结果(标签ID)
widerface-m检测结果(标签置信度)

💡 设置标签进度条

python face_labeling.py -lpb bar
widerface-m检测结果(标签进度条)

💡 关闭检测标签

python face_labeling.py -lds # 以实时标注为例
widerface-m检测结果

💡 自定义保存目录名称

# 默认为FaceFrame
python face_labeling.py -fsd face_dir # 以实时标注为例

💡 自定义保存子目录名称

# 默认为frame
python face_labeling.py -fdn face_subDir # 以实时标注为例

💡 自定义图片前缀

# 默认为face_test
python face_labeling.py -in face # 以实时标注为例

下载地址:基于YOLOv5的智能人脸数据标注工具源码,实现人脸数据标注自动化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/149767.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智能黑白图像自动上色——C++实现

前言 《Colorful Image Colorization》是加里福利亚大学Richard Zhang发表在ECCV 2016上的文章,论文主要解决的问题是给灰度图的自动着色,算法并不是为恢复灰度图的真实颜色,而是用灰度图中物体的纹理、语义等信息作为线索,来预测…

Gradle学习笔记01

一、Gradle视频介绍新一代构建工具Gradle,提到项目自动化构建工具,首先提到的是Maven。现在谈谈Gradle与Maven之间的差异:同样作为项目自动化构建工具,Maven更侧重于项目jar包的管理,而Gradle侧重于项目的构建&#xf…

卷积层、卷积层里的填充和步幅

多层感知机正式总结卷积层之前,先把上次多层感知机落下的一点内容补一补。几个概念:训练数据集:训练模型参数。验证数据集:选择模型超参数。训练误差:模型在训练数据上的误差。泛化误差:模型在新数据上的误…

Linux常用命令——lftp命令

在线Linux命令查询工具 lftp 优秀的文件客户端程序 补充说明 lftp命令是一款优秀的文件客户端程序,它支持ftp、SETP、HTTP和FTPs等多种文件传输协议。lftp支持tab自动补全,记不得命令双击tab键,就可以看到可能的选项了。 语法 lftp(选项…

基于PCAP搭建软HUB实现物联网在线调试

完整工程可从以下地址签出: https://gitcode.net/coloreaglestdio/pcaphub.git 1.需求场景 在调试嵌入式物联设备时,尤其是在多个以太网物联设备交错通信的情况下,很难通过在捉襟见肘的嵌入式系统上进行数据记录与调试。如果设备连接的是一…

基于Kintex-7 FPGA的核心板电路设计

1. 引言Field Programmable GateArray(简称,FPGA)于1985年由XILINX创始人之一Ross Freeman发明,第一颗FPGA芯片XC2064为XILINX所发明,FPGA一经发明,后续的发展速度之快,超出大多数人的想象&…

系分 - 案例分析 - 需求获取

个人总结,仅供参考,欢迎加好友一起讨论 文章目录系分 - 案例分析 - 需求获取需求获取方法典型例题题目描述参考答案系分 - 案例分析 - 需求获取 需求获取方法 用户访谈 工作内容要点准备访谈步骤:1 确定访谈目的。2 确定访谈哪些用户。3 准…

PHP 文件上传

通过 PHP,可以把文件上传到服务器。 本章节实例在 test 项目下完成,目录结构为: test |-----upload # 文件上传的目录 |-----form.html # 表单文件 |-----upload_file.php # php 上传代码 源码下载 创建一个文件上…

获取Git权限的三种方式

获取Git权限的三种方式写在最前1. HTTPS配合用户名和密码访问Git1.1 获取当前项目的用户和密码1.2 通过临时用户获取Git权限2. HTTPS配合token访问Git2.1 创建token2.2 HTTPS配合token获取Git权限3. SSH访问Git3.1 生成SSH公钥和私钥3.2 使用SSH获取Git权限写在最前 本文以为Az…

力扣(LeetCode)375. 猜数字大小 II(2023.01.08)

我们正在玩一个猜数游戏,游戏规则如下: 我从 1 到 n 之间选择一个数字。 你来猜我选了哪个数字。 如果你猜到正确的数字,就会 赢得游戏 。 如果你猜错了,那么我会告诉你,我选的数字比你的 更大或者更小 ,并…

接口测试——postman和Jemter

接口测试——postman和Jemterpostmanpostman工作原理postman入门postman的基础用法postman的高级用法使用postman管理测试用例批量执行测试用例postman断言环境变量和全局变量postman关联postman请求前置脚本postman参数化及生成测试报告参数化与数据驱动postman生成测试报告je…

(十五)内部类简述

目录 1.概述: 2.内部类之一:静态内部类 3.内部类之二:成员内部类 4.内部类之三:局部内部类 5.内部类之四:匿名内部类 1.概述: 内部类就是定义在一个类里面的类,里面的类可以理解成(寄生)。 2.内部类的使用场景、作用: ①当一个事务的内部,还…

GIT zip下载和clone下载的代码不一致?

问题场景 今天我在下载公司项目的时候遇到了一个问题,我选择了一个分支a,通过下载zip的代码发现是全的,而我通过clone的时候发现显示的是master上的代码 原因 其实是clone下载下来了,但是我idea中分支打开时默认选择的是master分支…

Compose 动画入门 (二) : 为什么animateDpAsState要用val ? MutableState和State有什么区别 ?

1. 前言 我们首先来实现一个Compose的动画(animateDpAsState) var big by remember {mutableStateOf(false) } val size by animateDpAsState(if (big) 100.dp else 50.dp)Box(Modifier.size(size).background(Color.Blue).clickable {big !big}) {}运行程序,来看…

第56篇-利用JSRpc分析某尾波的登录参数【2023-01-09】

声明:该专栏涉及的所有案例均为学习使用,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!如有侵权,请私信联系本人删帖! 文章目录 一、前言二、JsRpc的基本使用1.准备工作2.简单使用三、利用JSRpc分析尾波的登录参数1.网站分析2.构建rpc一、前言 以前使…

LabVIEW控制前面板对象

LabVIEW控制前面板对象控件引用句柄在引用句柄和经典引用句柄选板上,它可将前面板对象的引用传输给其它VI。右键单击前面板对象,从快捷菜单中选择创建引用,可建立一个VI服务器引用。而且,也可在程序框图上的VI服务器常量中找到前面…

2023年01月IDE流行度最新排名

点击查看最新IDE流行度最新排名(每月更新) 2023年01月IDE流行度最新排名 顶级IDE排名是通过分析在谷歌上搜索IDE下载页面的频率而创建的 一个IDE被搜索的次数越多,这个IDE就被认为越受欢迎。原始数据来自谷歌Trends 如果您相信集体智慧&am…

高性能分布式缓存Redis-第一篇章

高性能分布式缓存Redis-第一篇章一、缓存发展史&缓存分类1.1、大型网站中缓存的使用1.2、常见缓存的分类1.3、分布式缓存选型方案对比二、Redis概述&安装配置2.1、概述2.2、安装&配置三、数据类型选择&应用场景3.1、Redis的Key的设计规范3.1.1、key名设计3.1.2…

Linux中常用命令(初学整理附实例和自己的理解)

目录 00.tree命令 01. ls 指令 02. pwd命令 03. cd 指令 04. touch指令 05.mkdir指令 06.rmdir指令 && rm 指令 07.man指令 08.热键tab键 09.nano 10.stat 11.cp指令 12.mv指令 13. cat 14.more指令 15.less指令 16.head指令 17.tail指令 18.wc 19.echo 20.…

运营商云从ATH虎口夺食?

配图来自Canva可画 如今在云计算领域,国内市场与国际市场的分化越来越显著,国内市场也在走出与国际市场不同的路径,而其中最大的变量则是来自三大运营商的进场与冲击。 以天翼云、联通云以及移动云为代表,国内通讯运营商的云品牌…