深度学习数据集大合集—疾病、植物、汽车等

news2024/11/19 3:43:20

最近又收集了一大批深度学习数据集,今天分享给大家!废话不多说,直接上数据!

1、招聘欺诈数据集

招聘欺诈数据集:共收集了 200,000 条数据,来自三个网站。 该数据集共收集了 200.000 条数据,分别来自前程无忧、智联招聘和猎聘三家中国互联网招 聘网站。该数据集使用一套简单的统计规则为每个数据块分配一个欺诈概率,共有 9 个类别, 范围从 0%到 80%。请注意,数据集严重不平衡,因为它是真实的数据。

数据地址:https://www.dilitanxianjia.com/13415/

2、植物叶、花、果的语义分割数据集

一个全面收集图像精心标记的语义分割任务相关的植物分析。该数据集是计算机视觉、 农业和植物生物学领域的研究人员、开发人员和爱好者的宝贵资源。 数据集概述:总图像数:144 类别:叶,花,水果 Dataset Split: 训练组:85%(123 张) 验证组数:13%(18 张) 测试集:2% (3 张)

数据地址:https://www.dilitanxianjia.com/13412/

3、用于分类的大脑阿尔茨海默氏症数据集

关于数据集,使用此数据集分类是否有痴呆症形成在大脑中或没有。MC指轻度认知障碍(阿尔茨海默病早期),CN指认知障碍非疯呆症。共657张图片。

数据地址:https://www.dilitanxianjia.com/13410/

4、英国常见花卉图像分类数据集

关于数据集是一个包含102个花卉类别的图像分类数据集。这些花是在英国常见的花。每个类别由40至258幅图像组成。这些图像有很大的比例,姿势和光线的变化。此外,还有类别内变化很大的类别,以及几个非常相似的类别。

数据地址:https://www.dilitanxianjia.com/13408/

5、叶片表面缺陷检测图像数据集

关于数据集,检测刀片间良好的缺陷、刻痕和划痕。叶片表面缺陷检测数据集是一个多类图像分类数据集,可用于检测所生产的叶片中的缺陷。共400张图片。

数据地址:https://www.dilitanxianjia.com/13406/

6、眼部弓形虫病眼底图像数据集,视网膜眼底图像

己形虫病性脉络膜视网膜炎通常是由眼科医生通过对患者眼底图像的评估来诊断的。早期发现这些病变可能有助预防失明。数据集的眼底图像标记为三类,健康的眼睛,不活跃的和活动性的绒毛膜视网膜炎。该数据集是由三名眼科专家开发的,他们擅长利用眼底图像检测弓形虫病。该数据集将对致力于利用人工智能技术进行眼科图像分析以自动检测弓形虫病、脉络膜视网膜炎的研究人员有很大的帮助。

一、数据说明

名为“Data_Raw_6class_All”的文件夹中包含了在两个医院中心拍摄的原始眼底图像:

1.Hospital de Clinicas MedicalCenter:采集眼底图像所花费的时间为2018年至2020年。数据集由291张眼底图像组成JPG格式,大小为2124×2056像素。

2.Nios deA cos ta nu总儿科医院:18岁以下儿童获得图像。照片拍摄于2021年。该数据集包含121幅眼底图像,尺寸为1536×1152像素,采用JPG格式。

这些图像与疑似先天性弓形虫感染的患者相对应。眼底图像按健康和疾病分类。依次患病,可分为:i)仅不活动,ij)仅活动和iii)活动/非活动。每个类的数据数如下表所示。

数据地址:https://www.dilitanxianjia.com/13403/

7、新的面部情绪识别图像数据集

关于数据集 该数据集包含 47,000 张人脸灰度图像,每张图像的大小都调整为 48×48 像素。这些图像描 绘了各种面部表情,包括快乐中性、悲伤、愤怒、惊讶、厌恶和恐惧。为了增强平衡,采用 了数据增强技术。该数据集以 CSV 格式提供,可作为情感分类任务的宝贵资源。它包括训 练集中的 37,548 个样本,公共测试集中的 4,732 个样本,私人测试集中的 4.720 个样本。

数据地址:https://www.dilitanxianjia.com/13401/

8、吸烟与饮酒对身体的的影像,以及身体反应的数据集

本数据集收集自韩国国民健康保险局。所有个人信息和敏感数据均被排除在外。

数据地址:https://www.dilitanxianjia.com/13398/

9、甜椒、马铃薯、西红柿植物病害分类数据集

甜椒、马铃薯、西红柿植物病害分类数据集,共61900张图片;

数据地址:https://www.dilitanxianjia.com/13396/

10、特斯拉汽车类型分类检测数据集

包含:特斯拉_ModeL_S,特斯拉-Model_E,Tesla_Model-X,Tesla_Model_Y。

特斯拉模型S:电动豪华重新定义,特斯拉ModelS是电动豪华和高性能创新的象征。一个优质的全电动轿车,模型S拥有令人印象深刻的加速,远程能力.和时尚的设计。它的双电机全轮驱动变种提供了令人难以置信的速度,而宽敞的内部集成了先进的功能和简约的设计美

特斯拉Model3:电动无障碍特斯拉Model3旨在让更广泛的受众能够使用可持续交通工具。这款紧凑型电动轿车结合了经济性、效率和安全性,而不影响特斯拉的标志性性能。凭借其令人印象深刻的续航里程和先进的驾驶员辅助功能,Model3将电动交通工具推向了更广泛的人群。

特斯拉ModelX:未来的电动SUV,特斯拉ModelX以其独特的鹰翼式车门打破了这一模式,将SUV的实用性与电力推进的高效性结合在一起。这款电动SUV提供了宽敞的内部,令人印象深刻的性能,并注重安全,使它成为一个家庭友好的选择,有一点未来主义的天分。

特斯拉Y型:桥接多功能性和效率,特斯拉ModelY是一款紧凑型电动跨界车,在效率和多功能性之间架起了一座桥梁。与Model3共享其平台,ModelY提供了更宽敞的内部空间和更大的货物空间,同时保持了特斯拉车辆的效率和性能预期。它迎合了那些在城市友好的可操作性和冒险能力之间寻求平衡。

数据集共1321张图片。

数据地址:https://www.dilitanxianjia.com/13394/

11、苹果高光谱图像数据集,用于苹果施肥情况的自动检测

苹果高光谱图像数据集用于纯苹果和施肥苹果的高光谱数据集

用于测量所用化学物质水平的纯苹果和施肥苹果的高光谱数据集。数据集由各种苹果的高光谱图像组成。分为三大类:

1.“新鲜”–从市场直接购买的苹果图像,

2.”低浓度”–苹果浸入低浓度杀真菌剂/杀虫剂溶液即1克或1毫升肥料兑1升水)的图像,以及

3.高浓度“_苹果浸入低浓度杀真菌剂/杀虫剂溶液(即3克或3毫升肥料兑1升水)的图

像,以及默认情况下,高光谱图像保存为.bil格式。此数据集以.tif格式给出。

整个数据集被分类为三个

folders.1Apple_Samples,2.Fungicide_Apple3.lnsecticide_AppleApple_Samples文件夹由两个文件夹组成:monostar和nativo。“Monostar”被进一步分为四个文件夹,总共有207张图片。“Nativo”由=个文件夹组成,总共73张图片。

杀菌剂苹果由162张图片组成,分为三类,即新鲜苹果、低浓度溶液浸泡的苹果和高浓度溶液浸泡的苹果。本试验所用的杀菌剂是NATIVO。同样,杀虫剂苹果由175张图片组成,也分为三类,即新鲜苹果,低浓度溶液浸泡的苹果和高浓度溶液浸泡的苹果。所用杀虫剂为MONOSTAR。

数据地址:https://www.dilitanxianjia.com/13392/

12、内镜下膀胱组织分类图像数据集

内镜下膀胱组织分类数据集—多域内窥镜图像的半监督膀胱组织分类 共 1755 张图片,分为 4 大类,并且做好了标注。

数据地址:https://www.dilitanxianjia.com/13390/

13、芒果果实病害检测图像数据集

MangoFruitDDS是一个芒果病害数据集,包含1700张224+224的JPG格式图像。该数据集

包含四种疾病的图像,即链格跑,炭病,黑毒腐病和茎腐病。数据集中的另一个类别是健康

水果。水果图像是在塞内加尔的一个果园里用手机摄像头拍摄的。

数据地址:https://www.dilitanxianjia.com/13388/

14、家禽鸟类便便图像健康状况图像数据集

家禽鸟类便便图像健康状况数据集,用于健康状态预测的禽类粪便图像数据集

关于数据集:从饲养两种鸡的家禽农场收集的健康和非健康的鸡粪的图像数据集,即:尼日利亚的肉鸡和蛋鸡。该数据集共有14.618个带标签的图像,其像素为100×100,ipeg格式,并有一个标签指示图像编号中的图像名称。存储库中,数据被上传到2个单独的文件夹中;健康或非健康的每个文件夹包含从不同时间拍摄的图像到一天,早上,下午,晚上和其他。

数据地址:https://www.dilitanxianjia.com/13386/

15、基于灰度归一化的脑肿瘤图像数据集

数据共3096张图片

数据分类:

1、神经胶质瘤肿瘤

2、脑膜瘤肿瘤

3、正常的

4、垂体瘤

特点:

1、图像标准化:使用灰度直方图对图像进行了归一化处理,提高了图像质量和可比性

2、保留宽高比调整大小所有图像都已调整为一致的256X256像素大小,同时保留原始宽高比,确保图像均匀和详细。

数据地址:https://www.dilitanxianjia.com/13380/

16、肺炎胸部X线数据集的医学图像数据集

数据集被精心组织成三个文件夹:训练,测试和验证。每个文件夹包含每个图像类别的子文件夹,即肺炎和正常。该数据集包括5.863张X射线图像JPEG格式),分为两类(肺炎/正常)。

胸部X线图像(前后位)选自广州市妇女儿童医疗中心1-5岁儿科患者的回顾性队列。所有胸部X线影像检查均作为患者常规临床护理的一部分进行。对于胸部X光检查图像的分析,所有的胸部X光检查最初的质量控制,删除所有低质量或不可读的扫描。然后由两名专家医生对图像的诊断进行分级,然后才批准对AL系统进行培训。为了说明任何评分错误,第三位专家也对评价集进行了检查。共5856张图片。

数据地址:https://www.dilitanxianjia.com/13378/

17、宠物分类图像数据集

动物分类如下:

狗:拉布拉多寻回犬,金毛寻回犬,德国牧羊犬,斗牛犬,小猎犬,贵宾犬约克夏梗,达克犬,石子犬,拳击手,法国斗牛犬,罗威纳犬,小型雪纳瑞犬,可卡犬,大丹犬。

猫:波斯人,暹罗人,缅因州人,拉格布娃娃,孟加拉人,苏格兰褶皱人,Sphynx人,英国海滨人,阿比西尼亚人,俄罗斯蓝人,缅甸人,喜马拉雅山人,德文雷克斯人,美国海滨人,埃及毛人。

鸟:鹦鹉,鹦鹉,非洲灰鹦鹉,金丝雀,芬奇,伯克鹦鹉,贵格鹦鹉、小鹦鹉,小鹦鹉。

哺乳动物:

仓鼠,豚鼠,沙鼠,兔子,大鼠,小鼠,龙猫,刺猬,糖滑翔机,Degus,土拨鼠。

爬行动物:

豹壁虎,须龙,冠壁虎,绿盈蜥,变色龙

两栖动物:

非洲矮蛙,美西鲸,红眼树蛙,白氏树蛙,美洲蟾蛛,带蟒蚪的青蛙。

外来宠物:

龙猫,巨蜥,风信子金刚鹦鹉,有角蟾馀,狐狸沙袋鼠、马、雪貂、蝶鲸

共2262张图片。

数据地址:https://www.dilitanxianjia.com/13376/

18、阿尔茨海默病MRI图像数据,用于老年性痴呆的诊断

关于数据集

该数据集是关于老年痴呆症(AD)的。它包含26例受试者的MRI图像,其中10例为AD患者,10例为轻度认知障碍(MCI)患者,4例为正常对照。这些图像是从伊朗德黑兰的菲鲁兹加医院收集的。共475张图片。

数据地址:https://www.dilitanxianjia.com/13374/

19、2022-2023赛季现役球员的数据和头像

关于数据集

2022-2023赛季所有现役NBA球员的数据包括:名字和姓氏、位置、身高和体重、出生日期、原产国、最后一次上学、草稿信息、头部图片、图像文件名是球员的ID。

数据地址:https://www.dilitanxianjia.com/13372/

20、2005年至2021年道路交通事故乘客、车辆、地点和事故特征数据

关于数据集:本数据集是2005年至2021年法国道路交通事故的完整记录。“它包含了乘客、车辆、事故、地点和特征等信息数据是从法国政府提供的官方数据中抓取、清理和加入的。数据已经为建模进行了预处理,应该可以利用,而不必经过许多额外的清理步骤。非分类数据(例如年龄和nbv列)已经标准化,并且从原始数据中提取了月份、星期和一天的时间的正弦和余弦,以便进行周期性分析和检测周期性模式(即晚上、周末等)。

数据地址:https://www.dilitanxianjia.com/13370/

21、1131个高分辨率脑部MRI(磁共振成像)扫描图像,专门用于脑肿瘤检测和分类

该数据集包含1311个高分辨率脑部MRI(磁共振成像)扫描,专门用于脑肿瘤检测和分类。每张磁共振成像都有四类标记:“脑体”“脑瘤”“胶质瘤”或“无肿瘤”。“该数据集是开发和评估机器学习模型的宝贵资源,特别是卷积神经网络(CNN),用于脑肿瘤的自动检测和分类。

数据集详细信息:图片总数:1311

类别:

1.脑垂体(300张图片)

2脑膜瘤(306张)

3.神经胶质瘤(300张图片)

4.没有肿瘤(405张图片)

主要特点:

1、多种肿瘤类型的高质量MRI图像。

2、均衡的班级分布。

3、预处理可能包括去头盖骨、调整大小和标准化以保证一致性。

4、为每幅图像贴上地面真相标签,以便于有监督的学习。

数据地址:https://www.dilitanxianjia.com/13368/

添加图片注释,不超过 140 字(可选)

22、4类脑肿瘤分类图像数据集

共3264张图片:胶质瘤100张图片、脑膜瘤115张图片、无肿瘤105张图片、垂体瘤74张图片。

数据地址:https://www.dilitanxianjia.com/13366/

添加图片注释,不超过 140 字(可选)

23、3款车型采用不同颜色进行多标签分类图像数据集

数据集包含3种不同颜色的3辆不同的汽车。多标签分类的主要目的是能够根据这些类别来标记照片中的项目。

该数据集包括从Yandex采集的2735幅图像,包括以下类别:

里约红:431

河蓝:262

里约黑:306

瑞虎红:262

瑞虎蓝:273

瑞虎黑:286

浏览次数:346

马蒂兹蓝:334

马蒂兹布莱克:235

数据地址:https://www.dilitanxianjia.com/13364/

后面会不定期再给大家更新最新的各类深度学习数据集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1155354.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

思维训练 第四课 省略句

系列文章目录 文章目录 系列文章目录前言一、省略的十五种情况1.并列复合句中某些相同成分的省略2.在用when, while, if, as if, though, although, as ,until, whether等连词引导的状语从句中,如果谓语有be,而主语又跟主句的主语相同或是(从句主语是&am…

table 表体滚动, 表头、表尾固定

在开发报表中&#xff0c;如果报表数据行过多页面无法全部显示&#xff0c;或者内容溢出div&#xff0c;需要把表头和表尾固定表体滚动这样就可以在页面上全部显示&#xff0c;并且不会溢出div 效果&#xff1a;最终实现效果 代码&#xff1a;<!DOCTYPE html> <html&g…

Spring Security 中自定义权限表达式

Spring Security 中自定义权限表达式 一. SpEL中使用自定义Bean二. 通过类继承自定义权限表达式2.1 自定义 ExpressionRoot 三. 参考文章 前言 这是我在这个网站整理的笔记,有错误的地方请指出&#xff0c;关注我&#xff0c;接下来还会持续更新。 作者&#xff1a;神的孩子都在…

Thread

Thread 线程启动线程第一种创建线程线程的第二种创建方式使用匿名内部类完成线程的两种创建 Thread API线程的优先级线程提供的静态方法守护线程用户线程和守护线程的区别体现在进程结束时 多线并发安全问题同步块 线程 启动线程 启动线程:调用线程的start方法,而不是直接调用…

新版Idea显示Git提交人信息

新版Idea的类和方法上会展示开发者信息 不想展示的话可以做以下配置&#xff1a;

数据查找(search)-----散列表(哈希表)

目录 前言 一.散列表&#xff08;哈希表&#xff09;基本概念 二.哈希函数的构造 构造原则 构造方法 1.直接定址法 2.除留余数法 3.数字分析法 三.地址冲突 四.处理冲突的方法 开放定址法 1.线性探测法 2.二次探测法 3.伪随机探测法 链地址法 五.散列表的查找 前…

路由器如何设置IP地址

IP地址是计算机网络中的关键元素&#xff0c;用于标识和定位设备和主机。在家庭或办公室网络中&#xff0c;路由器起到了连接内部设备和外部互联网的关键作用。为了使网络正常运行&#xff0c;需要正确设置路由器的IP地址。本文将介绍如何设置路由器的IP地址&#xff0c;以确保…

P3983 赛斯石(赛后强化版),背包

题目背景 白露横江&#xff0c;水光接天&#xff0c;纵一苇之所如&#xff0c;凌万顷之茫然。——苏轼真程海洋近来需要进购大批赛斯石&#xff0c;你或许会问&#xff0c;什么是赛斯石&#xff1f; 首先我们来了解一下赛斯&#xff0c;赛斯是一个重量单位&#xff0c;我们用…

谷歌财报解读:基本盘守成有余,云业务进取不足?

科技巨头的AI之战持续上演&#xff0c;而财报季是一窥AI成色的重要窗口。 谷歌和微软这对在多个领域均正面对决的科技巨头&#xff0c;又在同一日发布了财报&#xff0c;而这次相比上季度&#xff0c;战局似乎迎来了反转。 上季度&#xff0c;谷歌不仅成功抵御了Bing联手ChatG…

从歌尔股份三季报中,读懂消费电子的“增程式”复苏

第三季度财报季前夕&#xff0c;消费电子板块可谓利好不断。 9月&#xff0c;苹果、华为纷纷发布新品&#xff0c;大厂高端机型带动购机热潮重现。同时&#xff0c;Meta推出的MR头显Quest3、智能眼镜Ray-Ban等XR新产品也备受消费者期待&#xff0c;大摩预测Quest 3今年出货量将…

面试150题做题记录

面试150题做题记录 题目1: 合并两个有序数组 题目1: 合并两个有序数组 题目&#xff1a;https://leetcode.cn/problems/merge-sorted-array/?envTypestudy-plan-v2&envIdtop-interview-150 最优思路&#xff1a;利用原有数列的单调性质&#xff0c;从右往左遍历&#xff…

驱动day10作业

基于platform驱动模型完成LED驱动的编写 驱动程序 #include <linux/init.h> #include <linux/module.h> #include<linux/platform_device.h> #include<linux/mod_devicetable.h> #include<linux/of.h> #include<linux/of_gpio.h> #inclu…

本地部署 ChatGLM3

本地部署 ChatGLM3 ChatGLM3 介绍ChatGLM3 Github 地址部署 ChatGLM3运行综合 Demo对话模式工具模式代码解释器模式 API 部署 ChatGLM3 介绍 ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型&#xff0c;在…

(四)docker:为mysql和java jar运行环境创建同一网络,容器互联

看了很多资料&#xff0c;说做互联的一个原因是容器内ip不固定&#xff0c;关掉重启后如果有别的容器启动&#xff0c;之前的ip会被占用&#xff0c;所以做互联创建一个网络&#xff0c;让几个容器处于同一个网络&#xff0c;就可以互联还不受关闭再启动ip会改变的影响&#xf…

C++的拷贝构造函数

目录 拷贝构造函数一、为什么用拷贝构造二、拷贝构造函数1、概念2、特征1. 拷贝构造函数是构造函数的一个重载形式。2. 拷贝构造函数的参数3. 若未显式定义&#xff0c;编译器会生成默认的拷贝构造函数。4. 拷贝构造函数典型调用场景 拷贝构造函数 一、为什么用拷贝构造 日期…

FedGNN: Federated Graph Neural Network for Privacy-Preserving Recommendation

FedGNN&#xff1a;用于隐私保护推荐的联邦图神经网络 参考笔记 ICML-21-workshop 本文的主要创新工作 在具有局部差分隐私的模型训练中保护模型梯度&#xff0c;并提出一种伪交互项目采样技术来保护用户与之交互的项目。提出了一种保护隐私的用户-项目图扩展方法&#xff0…

函数总结

一、main函数 //argc 统计命令行传参的个数 //argv 保存命令行传的具体参数,每个参数当做字符串来存储&#xff0c;const是为了不让main函数修改argv数组里的内容 1.1值传递 此为值传递;形参的值改变不影响实参的值 1.2 地址传递 形参拿到的是实参的地址&#xff0c;实际操…

2023云曦秋季期中考

web 1z_php 看到有点晕&#xff0c;根本分不清0和o <?php // Yeedo told you to study hard! echo !(!(!(include "flag.php"|| (!error_reporting(0))|| !isset($_GET[OoO])|| !isset($_GET[0o0])|| ($_GET[OoO] 2023) //检查 "OoO" 参数是否等于…

使用simple_3dviz进行三维模型投影

【版权声明】 本文为博主原创文章&#xff0c;未经博主允许严禁转载&#xff0c;我们会定期进行侵权检索。 更多算法总结请关注我的博客&#xff1a;https://blog.csdn.net/suiyingy&#xff0c;或”乐乐感知学堂“公众号。 本文章来自于专栏《Python三维模型处理基础》的系列文…

Linux———— 运算命令

Shell与其他编程语言一样&#xff0c;支持多种类型的运算符&#xff0c;包括&#xff1a; 算术运算符&#xff1a;用于执行数学运算&#xff0c;例如加法、减法、乘法和除法。 关系运算符&#xff1a;用于比较两个值之间的关系&#xff0c;例如相等、大于、小于等。 布尔运算…