【数据集NO.3】人脸识别数据集汇总

news2024/11/15 12:41:06

文章目录

  • 前言
  • 一、IMDB-WIKI人脸数据集
  • 二、WiderFace人脸检测数据集
  • 三、GENKI 人脸图像数据集
  • 四、哥伦比亚大学公众人物脸部数据库
  • 五、CelebA人脸数据集
  • 六、美国国防部人脸库
  • 七、MTFL人脸识别数据集
  • 八、BioID人脸数据集
  • 九、PersonID人脸识别数据集
  • 十、CMU PIE人脸库
  • 十一、Youtube视频人脸数据集
  • 十二、CASIA 人脸图像数据集
  • 十三、Caltech人脸数据库


前言

数据集对应应用场景,不同的应用场景有不同的检测难点以及对应改进方法,本系列整理汇总领域内的数据集,方便大家下载数据集。关注免费领取整理好的数据集资料!


一、IMDB-WIKI人脸数据集

IMDB-WIKI 500k+ 是一个包含名人人脸图像、年龄、性别的数据集,图像和年龄、性别信息从 IMDB 和 WiKi 网站抓取,总计 524230 张名人人脸图像及对应的年龄和性别。其中,获取自 IMDB 的 460723 张,获取自 WiKi 的 62328 张。
转换好格式数据集:关注后私信领取
下载链接【点此处即可下载
在这里插入图片描述
样图如下:
在这里插入图片描述

二、WiderFace人脸检测数据集

WIDER FACE数据集是人脸检测的一个benchmark数据集,包含32203图像,以及393,703个标注人脸,其中,158,989个标注人脸位于训练集,39,496个位于验证集。每一个子集都包含3个级别的检测难度:Easy,Medium,Hard。这些人脸在尺度,姿态,光照、表情、遮挡方面都有很大的变化范围。WIDER FACE选择的图像主要来源于公开数据集WIDER。制作者来自于香港中文大学,他们选择了WIDER的61个事件类别,对于每个类别,随机选择40%10%50%作为训练、验证、测试集。检测算法在测试集上的评估方式与PASCAL VOC DATADASET 相同,并且测试集的真值包围框(boundingbox)未发布。
转换好格式数据集:关注后私信领取
下载链接【点此处即可下载】
在这里插入图片描述
在这里插入图片描述

三、GENKI 人脸图像数据集

GENKI数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分。GENKI-R2009a包含11159个图像,GENKI-4K包含4000个图像,分为“笑”和“不笑”两种,每个图片的人脸的尺度大小,姿势,光照变化,头的转动等都不一样,专门用于做笑脸识别。GENKI-SZSL包含3500个图像,这些图像包括广泛的背景,光照条件,地理位置,个人身份和种族等。
下载链接【点此处即可下载】
转换好格式数据集:关注后私信领取
在这里插入图片描述

四、哥伦比亚大学公众人物脸部数据库

PubFig数据库是一个大型的真实世界人脸数据集,由从互联网上收集的58797张200人的图像组成。与大多数其他现有的人脸数据集不同,这些图像是在完全不受控制的情况下与非合作对象拍摄的。因此,在姿势、照明、表情、场景、相机、成像条件和参数等方面存在很大差异。PubFig数据集与麻省大学阿默斯特分校(UMass Amherst)创建的野外标记人脸(LFW)数据集在本质上相似,尽管两者之间存在一些显著差异:
LFW包含12333张5749人的图像,因此比PubFig要宽得多。然而,它也更小、更浅(平均每人的图像更少)。
LFW来源于T.Berg等人的《新闻工作》中的名字和面孔。这些图像最初是通过在线新闻来源收集的。对于许多人来说,在同一个活动中,经常会有几张照片,照片中的人穿着相似的衣服,在相同的环境中。我们在ICCV 2009上的论文表明,算法经常可以利用这一点来提高表演的真实性。
下载链接【点此处即可下载】
在这里插入图片描述
在这里插入图片描述

五、CelebA人脸数据集

CelebFaces Attributes Dataset (CelebA) 是一个大规模的人脸属性数据集,包含超过 20 万张名人图像,每张都有 40 个属性注释。 该数据集中的图像涵盖了较大的姿势变化和杂乱的背景。 CelebA 种类多、数量多、注释丰富,包括10,177 个身份,202,599 张人脸图像,以及5 个地标位置,每张图像 40 个二进制属性注释。
该数据集可用作以下计算机视觉任务的训练和测试集:人脸属性识别、人脸识别、人脸检测、地标(或人脸部分)定位以及人脸编辑与合成。
下载链接【点此处即可下载】
在这里插入图片描述
在这里插入图片描述

六、美国国防部人脸库

为促进人脸识别算法的研究和实用化,美国国防部的Counterdrug Technology Transfer Program(CTTP)发起了一个人脸识别技术(Face Recognition Technology 简称FERET)工程,它包括了一个通用人脸库以及通用测试标准。到1997年,它已经包含了1000多人的10000多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。
下载链接【点此处即可下载】
转换好格式数据集:关注后私信领取
在这里插入图片描述

在这里插入图片描述

七、MTFL人脸识别数据集

该数据集包含 12,995 张人脸图像,这些图像用 (1) 五个面部标志,(2) 性别、微笑、戴眼镜和头部姿势的属性进行了注释。
下载链接【点此处即可下载】
转换好格式数据集:关注后私信领取
在这里插入图片描述
在这里插入图片描述

八、BioID人脸数据集

这个数据集包含了1521幅分辨率为384x286像素的灰度图像。 每一幅图像来自于23个不同的测试人员的正面角度的人脸。为了便于做比较,这个数据集也包含了对人脸图像对应的手工标注的人眼位置文件。 图像以 "BioID_xxxx.pgm"的格式命名,其中xxxx代表当前图像的索引(从0开始)。类似的,形如"BioID_xxxx.eye"的文件包含了对应图像中眼睛的位置。
下载链接【点此处即可下载】
转换好格式数据集:关注后私信领取
在这里插入图片描述

在这里插入图片描述

九、PersonID人脸识别数据集

该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。
下载链接【点此处即可下载】
在这里插入图片描述
在这里插入图片描述

十、CMU PIE人脸库

CMU PIE人脸库建立于2000年11月,它包括来自68个人的40000张照片,其中包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片,现有的多姿态人脸识别的文献基本上都是在CMU PIE人脸库上测试的。
下载链接【点此处即可下载】
在这里插入图片描述

十一、Youtube视频人脸数据集

数据集介绍:
该数据集包含 1,595 个不同人的 3,425 个视频。 所有视频都是从 YouTube 下载的。 每个主题平均有 2.15 个视频可用。 最短剪辑时长为 48 帧,最长剪辑为 6070 帧,视频剪辑的平均长度为 181.3 帧。在这个数据集下,算法需要判断两段视频里面是不是同一个人。有不少在照片上有效的方法,在视频上未必有效/高效。
下载链接【点此处即可下载】
在这里插入图片描述

十二、CASIA 人脸图像数据集

该数据集包含1595个不同的人的3425个视频。所有视频都是从YouTube上下载的。每个主题平均有2.15个视频可用。最短的剪辑持续时间为48帧,最长的剪辑为6070帧,视频剪辑的平均长度为181.3帧。
下载链接【点此处即可下载】
在这里插入图片描述

十三、Caltech人脸数据库

该数据集包含通过在谷歌图像搜索中键入常见的名字从网络上收集的人物图像。每个正面的眼睛、鼻子和嘴巴中心的坐标都在地面真相文件中提供。该信息可用于对齐和裁剪人脸,或作为人脸检测算法的基本事实。该数据集具有10524张不同分辨率和不同设置的人脸,例如肖像图像、人群等。轮廓人脸或非常低分辨率的人脸没有标记。
下载链接【点此处即可下载】
在这里插入图片描述

未完待续。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/59377.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux虚拟内存

问题 什么是虚拟内存地址 ?Linux 内核为啥要引入虚拟内存而不直接使用物理内存 ?虚拟内存空间到底长啥样?内核如何管理虚拟内存?什么又是物理内存地址 ?如何访问物理内存? 什么是虚拟内存地址 举一个生活…

Redis学习笔记(四)

事务 一个命令执行的队列,中间不会被打断或者干扰基本操作、 开启事务:multi 作用:设定事务的开启位置,执行此命令后,后续所有指令均加入事务中 执行事务:exec 作用:设定事务结束的位置&#xf…

【MySQL】表的增删改查(一)

你可以了解世间万物,但追根溯源的唯一途径便是亲身尝试。——《心灵捕手》 前言: 大家好,我是拳击哥,今天给大家讲解的是mysql表GRUD操作中的新增数据、查询数据以及表中数据的排序、去重等。因篇幅过长,分为两期来讲解…

Linux——匿名管道、命名管道及进程池概念和实现原理

目录 一.什么是匿名管道 二.如何使用匿名管道 (一).pipe原理 (二).pipe使用 三.命名管道概念及区别 (一).什么是命名管道 (二).与匿名管道的联系和区别 四.命名管道的使用 &…

Python——分支语句

1.bool 数据类型:真和假,只有两个值,就是True和False。 2.if语句使用的语法: 3.else语句:(同上) 4.比较运算符: a b:a和b是否相等 a ! b: a和b是否不相等 a…

【网络层】子网划分、无分类编址CIDR、构成超网、ARP协议

注:最后有面试挑战,看看自己掌握了吗 文章目录子网划分-----减少浪费IP----两级IP不够灵活-----变三级IP地址-----对外还是表现以前的网络号---------只是拿出部分主机号来做子网号子网划分实例-------对外不展示内部的子网划分----子网掩码---与运算---…

什么是【固件】?

文章目录一、软件 硬件 固件二、BIOS(Basic Input/output System)三、百度百科的解释四、固件的工作原理五、应用六、参考链接一、软件 硬件 固件 通常我们会将硬件和软件分开看待,二者协同工作为我们提供计算机的体验。硬件是摸得着的实体&…

[附源码]计算机毕业设计学生宿舍维修管理系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

假设检验(1)-假设检验的基本概念

数理统计的另一基本任务是对总体参数作某种假设,然后根据所得的样本,运用统计分析的方法来检验这一假设是否成立,从而作出接受或拒绝的决定. 这就是假设检验问题. 3. 1. 1 假设检验的基本思想和推理方法 我们先举一个…

C\C++刷题DAY5

目录 1.第一题 2.第二题 3.第三题 1.第一题 160. 相交链表 - 力扣(LeetCode) 思路分析: 看链表相不相交,是看链表的地址。把两个链表的地址一一比对,如有有相同的地址,那么相交,如果各不相同…

详解自监督发展趋势! 何恺明连获三年CVPR最高引用的秘诀是?

点击文末公众号卡片,不错过计算机会议投稿信息 0 引言 许多加了我好友的读者知道尼谟之前的研究方向是“自监督学习”,而最近我无意中发现,CVPR最近三年引用量最高的论文竟然都是来自监督学习领域的,且三篇论文的作者都包括Face…

(四)进程管理:进程基本概念

文章目录一. 进程的概念二. 进程的结构和特征1. 进程的结构2. 进程的特征三. 进程与【线程】1. 进程与线程的关系与区别2. 线程的实现方式1. 纯用户级方式(淘汰)2. 纯内核级方式3. 组合方式一. 进程的概念 进程(Process)&#xff…

C#,彩色图片转为灰度图的快速算法与源代码

彩色图转为灰度图的场景非常多,比如人工智能的训练与识别时,需要将彩色图片转为灰度图。 以下文字来自于: 彩色图像转灰度图像原理python_蜗牛的笨笨的博客-CSDN博客_python 彩色图转灰度图现在我们所接触到的图像绝大多数都是数字图像&…

[附源码]计算机毕业设计springboot疫情背景下社区互助服务系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

u-boot常用命令

u-boot常用命令查看u-boot所支持的命令查询命令u-boot版本环境变量板子相关信息环境变量操作内存操作网络操作EMMC和 SD卡操作FAT 格式文件系统操作EXT格式文件系统操作ubi格式文件系统操作boot 操作bootzbootmbootUMS 命令常用其他uboot环境变量:bootcmd和bootargs…

python基础语法15-网络编程理论

网络编程是指在程序中实现两台计算机之间的通信。 Python提供了大量的内置模块和第三方模块用于支持各种网络访问,而且Python语言在网络通信方面的优点特别突出,远远领先其他语言。 一、IP: 1.概念: IP:互联网协议地址(Internet Protocol Add…

CCNA-应试教育-思科网院-CCNAv7: Switching, Routing, and Wireless Essentials 交换、路由和无线基础。

CCNA-应试教育-思科网院-CCNAv7: Switching, Routing, and Wireless Essentials 交换、路由和无线基础。 拓扑 – SRWE 最终 PT 技能评估 (PTSA) 拓扑图这样连 题目 SRWE Final PT Skills Assessment (PTSA) A few things to keep in mind while co…

大淘营淘宝复制的“添加、删除、替换属性”功能如何使用?

一、添加属性添加属性填写的格式为“属性名称:属性值”,“”是添加的意思。举个例子,比如我要添加的属性为“AA”,属性值为“aa”,那么,在软件上需要填“AA:aa”。注:“:”是半角字符,中间不要有…

嵌入式 程序调试之gdb和gdbserver的交叉编译及使用

嵌入式 程序调试之gdb和gdbserver的交叉编译及使用 一、简述 记--交叉编译gdb、gdbserver并调试嵌入式程序。 gdb是功能非常强大的常用调试工具,可以直接下断点进行单步调试,是差错排错的利器。 常见三种不同使用场景的gdb: x86 pc端gdb(以下…

MyBatis ---- 自定义映射resultMap

MyBatis ---- 自定义映射resultMap1. resultMap处理字段和属性的映射关系2. 多对一映射处理a>级联方式处理映射关系b>使用association处理映射关系c>分布查询3. 一对多映射处理a>collectionb>分步查询1. resultMap处理字段和属性的映射关系 当实体类中的属性名…