年龄性别预测1:年龄性别数据集说明(含下载地址)

news2024/11/16 15:40:18

年龄性别预测1:年龄性别数据集说明(含下载地址)

目录

年龄性别预测1:年龄性别数据集说明(含下载地址)

1.前言

2.MegaAge_Asian

3.MORPH

4.IMDB-WIKI

5.数据集下载

6.年龄性别预测和识别(Python/C++/Android) 


1.前言

本项目将实现年龄性别预测和识别,整套方案采用二阶段方法实现,即首先使用通用的人脸检测算法(Face Detection)定位人脸区域,裁剪人脸,再构建多任务模型,分别进行年龄预测(Age)和性别识别(Gender)。项目分为数据集说明,Pytorch模型训练和C++/Android部署等多个章节,本篇是项目《年龄性别预测》系列文章之年龄性别数据集说明;为了方便后续模型工程化和Android平台部署,项目骨干网络backbone支持resnet18/resnet50,以及轻量化模型MobilenetV2模型训练和测试,并提供Python/C++/Android多个版本;

本篇,主要分享年龄性别人脸数据集,主要介绍MegaAge_Asian,MORPH以及IMDB-WIKI三大数据集,总数约28W+的人脸图片,并且都标注了年龄和性别的信息,可以用于龄性别预测和识别模型的开发。

 【尊重原创,转载请注明出处】https://blog.csdn.net/guyuealian/article/details/135127124


更多项目《年龄性别预测》和《面部表情识别》系列文章请参考:

  1. 面部表情识别1:表情识别数据集(含下载链接)
  2. 面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码)
  3. 面部表情识别3:Android实现表情识别(含源码,可实时检测)
  4. 面部表情识别4:C++实现表情识别(含源码,可实时检测)
  5. 年龄性别预测1:年龄性别数据集说明(含下载地址)
  6. 年龄性别预测2:Pytorch实现年龄性别预测和识别(含训练代码和数据)
  7. 年龄性别预测3:Android实现年龄性别预测和识别(含源码,可实时预测)
  8. 年龄性别预测4:C/C++实现年龄性别预测和识别(含源码,可实时预测)


2.MegaAge_Asian

数据说明:Quantifying Facial Age by Posterior of Age Comparisons

MegaAge_Asian一个是亚洲人脸数据集,标注了年龄和性别标签,年龄分布为0-70岁,其中训练集37563,测试集3583;项目对该数据集进行数据清洗,标注格式统一转换为

  • 数据格式:image_path age gender xmin ymin xmax ymax,如
test/287.jpg 8 0 41 64 124 180
test/135.jpg 1 1 39 74 125 182
test/1446.jpg 26 1 40 74 131 181
test/599.jpg 11 1 65 81 147 176
  • image_path是图片的相对路径
  • age是年龄,
  • gender是性别,0表示女性,1表示男性
  • xmin ymin xmax ymax对应的人脸框位置

3.MORPH

数据说明:MORPH | UNCW

MORPH一个是欧美人脸数据集,标注了年龄和性别标签,包含 2003 年至 2007 年底超过 13,000 个人的 55,000 张独特图像。年龄范围从 16 岁到 77 岁,中位年龄为 33 岁。每个人的平均图像数量为 4 张,照片之间的平均时间为 164天,最短1天,最长1681天。 图像之间的天数标准差为 180。项目对该数据集进行数据清洗,最后整理保留了训练数据49096张图片,测试数据3000张图片,标注格式统一转换为:

  • 数据格式:image_path age gender xmin ymin xmax ymax

4.IMDB-WIKI

数据说明:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

IMDB-WIKI人脸数据集是基于IMDB 和 Wikipedia 两大数据库整合的人脸数据集,其中 IMDB 数据库包含 460,723 张人脸图片,Wikipedia 数据库包含 62,328 张人脸图片,共计 523,051 张人脸图片,该数据库中每张图片都被标注年龄和性别,但很可惜,标注质量差强人意,年龄信息标注不精准,性别信息也存在标注错误的情况,勉强凑合用吧。官网也强调MDB-WIKI数据并不能保证年龄信息的准确性。

为提高IMDB-WIKI数据的质量,项目对该数据集进行了大规模的清洗,数据清洗完后,Wikipedia 数据训练数据43590张图片,测试数据3000张图片,清洗后的数据称为wiki_crop;IMDB数据清洗完后,训练数据158868张图片,测试数据10000张图片,清洗后的数据称为imdb_crop,标注格式统一转换为:

  • 数据格式:image_path age gender xmin ymin xmax ymax

尽管,项目已经对该数据进行了清洗,但依然无法保证该数据的质量,实际项目开发中,还请谨慎使用。


5.数据集下载

数据集下载地址:可公众号【AI吃大瓜】咨询联系

内容包含:

  1. MegaAge_Asian亚洲人脸数据集,标注了年龄和性别标签,其中训练集37563,测试集3583
  2. MORPH欧美人脸数据集,标注了年龄和性别标签,训练数据49096张图片,测试数据3000张图片
  3. IMDB-WIKI欧美人脸数据集,标注了年龄和性别标签,其中wiki_crop训练数据43590张图片,测试数据3000张图片;imdb_crop训练数据158868张图片,测试数据10000张图片
  4. 标注格式统一转换为:image_path age gender xmin ymin xmax ymax

6.年龄性别预测和识别(Python/C++/Android) 

  1.  年龄性别预测1:年龄性别数据集说明(含下载地址)https://blog.csdn.net/guyuealian/article/details/135127124
  2. 年龄性别预测2:Pytorch实现年龄性别预测和识别(含训练代码和数据)https://blog.csdn.net/guyuealian/article/details/135556789
  3. 年龄性别预测3:Android实现年龄性别预测和识别(含源码,可实时预测)https://blog.csdn.net/guyuealian/article/details/135556824
  4. 年龄性别预测4:C/C++实现年龄性别预测和识别(含源码,可实时预测)https://blog.csdn.net/guyuealian/article/details/135556843

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1397072.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java医药WMS进销存系统

技术架构: jdk8 IntelliJ IDEA maven Mysql5.7 有需要的可以私信我。 系统功能与介绍: 医药进销存系统,主要分两种角色:员工、客户。本系统具有进销存系统的通用性,可以修改为其它进销存系统,如家电进…

仿三方智能对话分析原始会话窗口

设计效果如下&#xff1a; 设计要求如下&#xff1a; 1、顶部播放条播放时&#xff0c;文字内容自动滚动。 监听audio事件timeupdate&#xff0c;只要播放器在播放就会触发该事件。每行文字有开始时间begin。判断当前时间&#xff08;currentTime&#xff09;<开始时间&am…

【分布式技术】Elastic Stack部署,实操logstash的过滤模块常用四大插件

目录 一、Elastic Stack&#xff0c;之前被称为ELK Stack 完成ELK与Filebeat对接 步骤一&#xff1a;安装nginx做测试 步骤二&#xff1a;完成filebeat二进制部署 步骤三&#xff1a;准备logstash的测试文件filebeat.conf 步骤四&#xff1a;完成实验测试 二、logstash拥有…

【REMB 】翻译:草案remb-03

REMB REMB消息 以及 绝对时间戳选项 在带宽估计中的使用 :an absolute-value timestamp option for use in bandwidth estimatoin. 接收方带宽估计的RTCP消息 REMB 这位大神翻译的更好。 RTCP message for Receiver Estimated Maximum Bitrate draft-alvestrand-rmcat-remb-03…

vite多页面打包学习(一)

一、前期准备 首先初始化两套独立的vue实例和相关生态&#xff08;多页面嘛&#xff09;&#xff0c;如下 我在src文件下创建了pages大文件夹&#xff0c;并初始化了两套页面分别为index和page1&#xff0c;每套页面都有自己单独的组件、路由、状态、入口等等&#xff0c;这里…

python数字图像处理基础(十一)——光流估计

目录 概念Lucas-Kanade算法函数表达式 概念 光流是空间运动物体在观测成像平面上的像素运动的“瞬时速度”&#xff0c;根据各个像素点的速度矢量特征&#xff0c;可以对图像进行动态分析&#xff0c;例如目标跟踪。要求如下&#xff1a; 亮度恒定&#xff1a;同一点随着时间…

FPGA之分布RAM(1)

SLICEM 资源可以实现分布式 RAM。可以实现的 RAM 类型&#xff1a; 单口 RAM 双端口 简单的双端口 四端口 下表给出了通过1SLICEM中的4个LUT可以实现的RAM类型 1.32 X2 Quad Port Distributed RAM 我们介绍过把 6 输入 LUT 当作 2 个 5输入 LUT 使用&#xff0c;在这里&a…

easyui渲染隐藏域<input type=“hidden“ />为textbox可作为分割条使用

最近在修改前端代码的时候&#xff0c;偶然发现使用javascript代码渲染的方式将<input type"hidden" />渲染为textbox时&#xff0c;会显示一个神奇的效果&#xff0c;这个textbox输入框并不会隐藏&#xff0c;而是显示未一个细条&#xff0c;博主发现非常适合…

【2015~2024】大牛直播SDK演化史

大牛直播SDK的由来 大牛直播SDK始于2015年&#xff0c;最初我们只是想做个低延迟的RTMP推拉流解决方案&#xff0c;用于移动单兵等毫秒级延迟的场景下&#xff0c;我们先是实现了Android平台RTMP直播推送模块&#xff0c;当我们用市面上可以找到的RTMP播放器测试时延的时候&am…

Debezium发布历史75

原文地址&#xff1a; https://debezium.io/blog/2019/10/22/audit-logs-with-kogito/ 欢迎关注留言&#xff0c;我是收集整理小能手&#xff0c;工具翻译&#xff0c;仅供参考&#xff0c;笔芯笔芯. 使用 Kogito 进行审核日志的管理服务 十月 22, 2019 作者&#xff1a; Mac…

三维重建(3)--单视几何

目录 一、无穷远点、无穷远线、无穷远平面 1、2D平面上的无穷远问题 2、3D平面上的无穷远问题 二、影消点与影消线 1、2D平面上的无穷远点&#xff0c;无穷远线变换 2、影消点 3、影消线 三、单视重构 1、两平行线夹角与影消线关系 2、单视图标定 一、无穷远点、无…

Apifox 国产接口自动化利器 之入门篇

Apifox 产品介绍 Apifox 是集 API 文档、API 调试、API Mock、API 自动化测试多项实用功能为一体的 API 管理平台&#xff0c;定位为 Postman Swagger Mock JMeter。旨在通过一套系统、一份数据&#xff0c;解决多个工具之间的数据同步问题。只需在 Apifox 中定义 API 文档…

Java 全栈知识点问题汇总(上)

Java 全栈知识点问题汇总&#xff08;上&#xff09; 1 Java 基础 1.1 语法基础 面向对象特性&#xff1f;a a b 与 a b 的区别3*0.1 0.3 将会返回什么? true 还是 false?能在 Switch 中使用 String 吗?对equals()和hashCode()的理解?final、finalize 和 finally 的不同…

Win10 打开文件突然鼠标变成一个蓝色大圈卡住点不了也打不开文件,重启电脑也是这样

环境: Win10 专业版 加密客户端环境 问题描述: Win10 打开桌面word文件突然鼠标变成一个蓝色大圈卡住点不了也打不开文件,重启电脑也是这样,只有蓝色圈变大没有鼠标指针出现圈卡着不会动,和那些有鼠标箭头加小蓝色圈不一样 解决方案: 某网上查看的,还是要自己排查…

OceanBase集群扩缩容

​ OceanBase 数据库采用 Shared-Nothing 架构&#xff0c;各个节点之间完全对等&#xff0c;每个节点都有自己的 SQL 引擎、存储引擎、事务引擎&#xff0c;天然支持多租户&#xff0c;租户间资源、数据隔离&#xff0c;集群运行的最小资源单元是Unit&#xff0c;每个租户在每…

LeetCode、2300. 咒语和药水的成功对数【中等,排序+二分】

文章目录 前言LeetCode、2300. 咒语和药水的成功对数【中等&#xff0c;排序二分】题目及类型思路及代码 资料获取 前言 博主介绍&#xff1a;✌目前全网粉丝2W&#xff0c;csdn博客专家、Java领域优质创作者&#xff0c;博客之星、阿里云平台优质作者、专注于Java后端技术领域…

聚铭入选“2023中国数字安全能力图谱(精选版)”安全运营领域

近日&#xff0c;国内权威数字安全领域第三方调研机构数世咨询正式发布《2023年度中国数字安全能力图谱&#xff08;精选版&#xff09;》。聚铭网络作为国内领先的安全运营商&#xff0c;凭借在细分领域突出优势&#xff0c;成功入选该图谱“安全运营”领域代表厂商。 据悉&a…

python tkinter 最简洁的计算器按钮排列

代码如下&#xff0c;只要再加上按键绑定事件函数&#xff0c;计算器既可使用了。 import tkinter as tk from tkinter.ttk import Separator,Buttonif __name__ __main__:Buttons [[%,CE,C,←],[1/x,x,√x,],[7, 8, 9, x],[4, 5, 6, -],[1, 2, 3, ],[, 0, ., ]]root tk.T…

MyBatis 使用报错: Can‘t generate mapping method with primitive return type

文章目录 前言问题原因解决方案个人简介 前言 今天在新项目中使用 MyBatis 报如下错误&#xff1a;Cant generate mapping method with primitive return type 问题原因 发现是 Mapper 注解引入错误&#xff0c;错误引入 org.mapstruct.Mapper, 实际应该引入 org.apache.ibat…

FlinkAPI开发之状态管理

案例用到的测试数据请参考文章&#xff1a; Flink自定义Source模拟数据流 原文链接&#xff1a;https://blog.csdn.net/m0_52606060/article/details/135436048 Flink中的状态 概述 有状态的算子 状态的分类 托管状态&#xff08;Managed State&#xff09;和原始状态&…