十个最常用的计算机视觉数据集

news2024/9/22 11:40:47

如今,人工智能和机器学习领域中最振奋人心的一个分支是计算机视觉(Computer Vision,简称CV)。CV应用于多种场景,以改善我们的日常生活,并推进科学技术研究。其中包括:

  • 自动驾驶
  • 自动生成图像描述
  • 社交媒体的面部识别和标注
  • 医学影像分析与诊断
  • 家居安防系统
  • 制造过程中的质量控制与缺陷识别
  • 更多

计算机视觉数据集

为准备用于计算机视觉项目的机器学习模型和AI算法,数据不可或缺。从事CV项目的公司面临的一项挑战是,获得足够多的正确且高质量的数据来训练他们的算法。近年来,不同的公司已创建并发布一些预标注数据集。您可以为所能想到的每种类型场景找到开源数据集和可购买的数据集。

常见CV任务包括:

  • 目标检测
  • 目标分割
  • 多目标标注
  • 图像分类
  • 图像描述生成
  • 人体姿态预估
  • 逐帧视频分析

对于您的项目而言,成品数据集是否适合,取决于您所需的数据类型及您希望完成的任务。

成品计算机视觉数据集案例

训练CV算法是一个时间和数据密集型项目,甚至比训练其他类型的机器学习算法需要更多的时间和数据。虽然您可能习惯于处理成百上千的训练数据点,但这不足以为CV任务训练出高质量ML模型。如果没有足够的训练数据,您的CV模型将无法产出有用的结果。

由于难以获得足够的数据来训练CV机器学习模型,在网上查找细致且可靠的CV数据集已变得越来越普遍。

如果在网上找到符合您需求的CV数据集,请务必评估数据是否具有足够高的质量。试着问自己:

  • 此数据的来源是否可信?
  • 能否发现并修复数据中的任何潜在错误?
  • 数据是否完整且具代表性?
  • 数据是否客观?还是存在明显的偏见?

问自己这些问题可以确保您最终获得高质量的数据集,这将帮助您训练出高质量的机器学习算法来完成CV任务。下面,您将看到我们推荐的最佳CV数据集,以及它们优秀的原因。

1. ObjectNet——最适合无偏见数据

预标注CV数据集的主要问题之一是偏见。许多用于训练CV模型的预标注数据集的来源均使用从互联网上抓取的不完整图像,这会在最终数据集中产生偏见。

ObjectNet由MIT-IBM沃森人工智能实验室(MIT-IBM Watson AI Lab)的研究人员开发。研究人员构建的数据集与传统数据集不同。他们不是从现有来源挑选照片,而是将图片众包。该团队在“土耳其机器人”(Mechanical Turk)上雇佣了许多不同的人,并要求提供目标的照片,然后提交审查。

图像审查过程对整个数据集进行评估,以确保背景、光照、旋转和其他图像因素具有足够的多样性,从而限制图像偏见。ObjectNet数据集包含分布在313个对象类中的50,000张图像。

ObjectNet是一种不同类型的数据集。在某些方面,该数据集提供一个CV模型,其中的数据干净得近乎完美。在许多图像中,目标居中,背景整洁。但是,它也具有多样性,呈现出不常见的旋转、透视和视角。虽然这些图像不会让人们在寻找特定目标时感到困惑,但它们对于训练高质量的CV模型非常有用。

2. 澳鹏——国际项目的最佳选择

在澳鹏,我们拥有超过250个可授权的数据集,可用于各种不同类型的CV项目,包括音频、语音、视频、图像和文字。在我们的预标注数据集中,您将发现超过25,000张图像和涵盖80多种语言与方言的870万个单词。

我们的预标注数据集旨在使您的CV模型训练高效和有效。每个数据集都经过精心设计,使您能够大规模训练高度精确的CV模型。在澳鹏,我们与全球超过100万名承包商的工作人员合作,这使我们能够为使用多种语言的国际项目创建最好的预标注数据集之一。

如果您查看我们的预标注数据集,但并未找到适合您需求的数据集,我们也可提供数据采集服务,为您的特定用例创建自定义数据集。

3. VisualData——目标识别的最佳选择

如果您的CV模型旨在识别目标,并且您需要预标注图像数据,那么VisualData是为您的用例寻找正确数据集的最佳选择。VisualData监控大学实验室、社交媒体和许多其他来源,以跟踪新发布的开源数据集。

VisualData提供了可供使用的开源数据集的可搜索存档。您可以按发布日期、主题或通过关键字搜索对数据集进行排序,以找到CV用例的正确图像。

4. Graviti——共享和查找数据的最佳选择

Graviti已建立一个开放的数据集社区,其中,各种企业、机构、研究团队和个人开发人员共享、访问和管理大型数据集。Graviti拥有1000多个高质量的开源数据集,可用于50多种应用场景和10多种数据格式,为数据搜索者提供了不断扩展的数据集选择。

5. ImageNet——大型数据集的最佳选择

ImageNet是市场上最大、最受欢迎的开源数据集之一。ImageNet拥有超过1400万张已手动标注的图像。数据库按WordNet层次结构予以组织,对象级标注通过边界框完成。

6. Roboflow——使用不同文件格式的最佳选择

Roboflow旨在支持开发人员创建自己的计算机视觉机器学习模型,而无论他们的技能或团队规模如何。Roboflow通过帮助您获得正确的数据并准确地标注数据,以简化CV模型的构建过程。

作为简化过程的一部分,Roboflow还具有可用于训练CV模型的开源数据集。这些数据集涵盖各种领域,包括动物、棋类游戏、自动驾驶汽车、医疗、热图像和空中无人机图像。Roboflow还提供一些由合成数据组成的预标注数据集。

Roboflow的优势在于它为用户提供了以多种不同格式下载图像的能力。这些格式包括:

  • VOC XML
  • COCO JSON
  • YOLOv3平面文本文件
  • TFRecords

7. GitHub和Kaggle——最新数据集或模糊数据集的最佳选择

如果您正在处理许多不同的CV项目,并且将需要多个数据集,那么您可以使用的最佳来源之一是社区构建和共享平台,如GitHub和Kaggle。通过加入这些免费的社区,您可以开始构建您的知识库,了解存在哪些数据集,以及哪些数据集对您的独特项目最有帮助。

花点时间输入正确的关键字,您就可以在GitHub和Kaggle等网站上找到一些最新和最模糊的数据集。您还可以与其他数据科学家和机器学习工程师建立网络,他们可能会帮助您找到所需的数据集。

8. Kinetics——人物交互视频的最佳选择

Kinetics提供一个开源数据集,其中共包含650,000个视频剪辑,涵盖700个人类动作类型。该数据集包括人与物互动,人与人互动。数据集可以细分为700个视频剪辑的部分。数据集中的每个视频剪辑均有标注,且持续大约10秒。Kinetics数据集是一个高质量的数据集,可用于许多不同的CV用例。

9. IMDB-WIKI——识别性别和年龄的最佳选择

如果您想训练识别一个人的年龄或性别的CV模型,您就需要使用IMDB-WIKI开源数据集。您可以在许多不同的网站(包括GitHub)上找到此数据集。

IMDB-WIKI数据集共有523,051张图片。这些图像均从维基百科和IMDB中提取。每张图像均有标注,并包括图像中人物的性别、年龄和姓名。这使得该开源数据集成为最大的可公开使用的人脸数据集。

10. Berkeley DeepDrive——自动驾驶车辆CV任务的最佳选择

CV技术最令人兴奋的实际应用之一是自动驾驶。但是,在这些车辆上路之前,它们均需要数小时的训练。为使这些CV模型的训练更易获取且公平,加州大学伯克利分校创建了拥有超过10万个视频序列的Berkeley DeepDrive数据集。该数据集为开源数据集,可供公众使用。

Berkeley DeepDrive数据集包括各种标注,包括目标边界框、驾驶区域、图像级标记、地面标记和全帧实例分割。

成品数据集给企业带来的好处

预标注计算机视觉数据集的兴起使企业能够更容易获取训练CV模型所需的数据。CV模型的应用范围很广,许多组织正在研究如何应用它来解决问题。随着更多的企业意识到CV模型的强大功能,越来越多的企业将寻找数据来训练他们的CV模型。如果没有预标注数据集,许多企业将没有时间或资源创建CV所需的模型。

预标注数据集可使企业将其资源用于构建和训练CV模型,而不是采集数据。而且,可用的开源数据集越多,数据质量就越高。随着这些数据集质量的提高,用于解决整个组织中问题的CV模型也将得到改善。

计算机视觉数据集常见问题解答

随着越来越多的数据集可以免费在线使用,务必谨慎对待项目中使用的数据集,并了解潜在数据集相对于其他数据集的优势。这些常见问题有助于引导您找到CV项目的正确数据集。

我可以从何处获得正确的数据?

谈及“正确的数据”,有许多因素需要考虑。您需要数据有正确的:

  • 数据类型(图像、视频、音频)
  • 文件格式
  • 数据点的数量
  • 数据类型(无偏见、高质量、准确标注)

由于存在这么多不同的因素,审查数据集的来源、数据的标注方式和数据的标注者非常重要。或者,如果数据是原始数据且未经标注,您将如何能够自己进行标注。

获得正确的数据也意味着获得足够的数据。您将需要找到与您的用例相匹配的数据集,并且能够帮助您训练CV模型。一般来说,用来训练模型的数据越多越好。寻找大型开源数据集或结合两个小型数据集,是找到足够数据来训练您的CV模型的好方法。

数据数量越多,数据类型越多样化,您的CV模型就越能识别数据点的细微差异,并能够更准确地读取周围的环境。这有助于避免误判。

我需要多少数据?

虽然您会经常听到这样的指导原则,即数据越多越好,但当数据集中有太多数据时,就会有一个临界值。那么,正确的数据量是多少?

没有一个数字可表示正确的数据量,但范围可以帮助您为项目找到正确的数据量。大多数CV模型需要在数千到数百万个数据点上进行训练。CV模型或模式识别场景越复杂,数据集中所需的数据点就越多。

如何确保计算机视觉数据集的高质量?

在本文中,我们已提到高质量的数据集。但是,是什么使得数据质量高而不是低?

高质量的数据与数据的标注方式和标注准确率有关。虽然一些数据标注已经实现自动化,但是最佳、质量最高的数据标注通过人工标注和自动化相结合来完成。当您使用高质量的数据来训练您的CV模型时,您将拥有一个更好的功能模型,可以更准确地预测和观察。

CV模型数据集质量的另一个考虑因素是集合中包含的数据点的范围。例如,您希望数据集中的图像覆盖CV模型可能遇到的所有实际场景。如果您的训练数据缺乏多样性,或者由于缺乏数据而存在偏见,那么您的CV模型也是如此。准确标注的高质量数据对于创建成功的CV模型颇有帮助。点击观看:从试点到投产,采用值得信赖的AI

如何避免计算机视觉数据集中的偏见?

在寻找正确的数据集时,人们面临的另一个常见问题是如何评估数据集的偏见。训练数据偏见会以多种不同的方式对CV模型的准确性产生负面影响。

虽然偏见通常被认为是种族主义或性别歧视,但当涉及到数据时,这种概念更为广泛。偏见是指数据集中缺少的任何内容。数据集中最常见的一种偏见形式——数据集不能准确地表示CV模型工作的真实环境。重要的是,您的数据集要尽可能地代表您的模型所处的真实世界场景。创建训练数据集时,必须考虑以下因素:

  • 季节性倾向
  • 地理差异
  • 图像视角
  • 背景

许多当前可用的开源数据集包含在理想条件下拍摄的图像,这意味着角度直接,背景整洁。虽然这使得图像易于使用,但无法训练您的CV模型去适应真实世界、不完美的条件和情况。

减少数据偏见的一种最简单方法是在使用数据之前让更多的人来查看数据。审查数据的人越多、越多样化,您在数据中可能存在的漏洞和偏见就越少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1132183.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一、W5100S/W5500+RP2040树莓派Pico<静态配置网络信息>

文章目录 1. 前言2. 相关网络信息2.1 简介2.2 优点2.3 应用 3. WIZnet以太网芯片4. 静态IP网络设置示例讲解以及使用4.1 程序流程图4.2 测试准备4.3 连接方式4.4 相关代码4.5 编译烧录 5. 注意事项6. 相关链接 1. 前言 从本章开始我们将用WIZnet的W5100S/W5500以太网芯片结合RP…

听GPT 讲Rust源代码--library/std(3)

rust标准库std中的src目录主要包含以下内容和模块: alloc:内存分配相关函数,比如alloc::boxed::Box、alloc::string::String等。 ascii:ASCII相关工具函数。 char:字符相关类型和函数,如Char、char等。 cmp:比较相关trait和函数,如Ord、Eq、PartialOrd等。 env:环境变量相关功能…

机架式服务器介绍

大家都知道服务器分为机架式服务器、刀片式服务器、塔式服务器三类,今天小编就分别讲一讲这三种服务器,第一篇先来讲一讲机架式服务器的介绍。 机架式服务器定义:机架式服务器是安装在标准机柜中的服务器,一般采用19英寸的标准尺寸…

5年测开经验,领导却说:写的测试文档还不如应届生

如果有人问“测试人员最重要的能力是什么” ,有人会说“自动化技术”,有人会说“代码能力”,还有人会说“沟通能力”。 以上的各种能力确实挺重要的,但是在我看来,有一种能力长期遭到人们的低估,那就是“文…

TypeScript学习笔记 | 泛型 - 泛型的应用 - 泛型工具类 - extends - infer用法

文章目录 TypeScript学习笔记 | 泛型 - 泛型的应用什么是泛型类型兼容鸭子类型类型运算「&」和「&#xff5c;」 泛型的定义泛型的使用泛型接口与泛型类 extends用法泛型用法条件判断 用于类型的条件判断应用&#xff1a;Exclude<T,U>排除 / Extract 提取 infer关键词…

【23真题】这套适合考211的同学练手!考察复杂梅森!

今天分享的是23年五邑大学801的信号与系统试题及解析。 本套试卷难度分析&#xff1a;本套试题难度中等偏下&#xff0c;考察的题量较少&#xff0c;但是涉及到的知识点是非常全面的&#xff0c;考察的知识大多都是三大性质的定义以及运用&#xff0c;还考察了复杂梅森公式的运…

使用d3-tip报错:targetel.getScreenCTM is not a function

问题背景&#xff1a;使用d3-tip悬浮不显示信息 控制台报错截图&#xff1a; 报错原因&#xff1a; 箭头函数this 指向问题 解决方案&#xff1a;

无缝的链间互操作性:通用消息传递的强大之处

前言 通用消息传递&#xff08;General Message Passing&#xff0c;GMP&#xff09;是一种支持区块链之间通信和数据传输的机制。GMP正在成为增强不同区块链网络之间互操作性的解决方案。GMP允许应用程序构建者通过使用安全消息在区块链之间通信和交换信息来利用任何区块链的…

node-sass安装失败

在重新下载Vue工程依赖的时候&#xff0c;一直提示我报错&#xff0c;报错信息和截图如下&#xff0c;解决办法放在下面&#xff0c;供大家参考。 ValueError: invalid mode: rU while trying to load binding.gyp gyp ERR! configure error gyp ERR! stack Error: gyp faile…

浅谈余压监控系统电气设计

安科瑞 华楠 摘 要&#xff1a;结合实际的工程设计案例&#xff0c;分析余压监控系统的设计&#xff0c;包括余压探测器、余压控制器、余压监控主机的控制原理等。防止人员在实际的火灾疏散过程中会出现楼梯间和前室之间、前室和室内走道之间防火门两侧压差过大&#xff0c;而…

vs2022 使用git同步报错以及解决每次推送要输入密码问题

1.使用 git GUI工具&#xff0c;例如&#xff1a;TortoiseGit &#xff0c;把全局配置文件这样设置一下 设置全局.config ,这样即可。 [credential] helper store 2.如果推送代码或拉取代码一直失败&#xff0c;在当前的仓库下面&#xff0c;使用以下命令来重置一下密码 git …

Java 将list集合的字符串格式转为Map

Java 将list集合的字符串格式转为Map List<Object> list new ArrayList<>(); Map<String,String> map1 new HashMap<>(); map1.put("fileName","测试1"); map1.put("level","1"); list.add(map1);Map<S…

ChineseChess2

中国象棋&#xff1a;黑将&#xff0c;红帅双炮&#xff0c;只要红帅中间露头怎么走怎么赢 卡主黑将的走位&#xff0c;控制住就好了 ChineseChess-CSDN博客

数字驱动,营销赋能丨工商职院电子商务专业学生,前往餐饮美食电商新业态基地试岗交流

纸上得来终觉浅&#xff0c;绝知此事要躬行。为了让学生更好的了解自己与所应聘岗位的匹配度&#xff0c;同时也希望在实际业务场景中&#xff0c;发掘自身优势&#xff0c;10月23日&#xff0c;四川产教融创园信息技术有限公司组织四川工商职业技术学院的电子商务专业学生一行…

医院陪诊系统源码 医院护工陪护系统源码

医院陪诊系统源码 医院护工陪护系统源码 基于ThinkPHP6原生微信小程序框架开发的陪诊小程序源码 支持多运营区&#xff0c;陪护师、推广者等完整闭环功能&#xff0c;快速搭建陪护业务平台。 运行环境&#xff1a;PHPMYSQLNGINX/APACHE微信小程序 功能介绍&#xff1a; 1、…

LLVM学习笔记(49)

4.1.3. 降级 在前面的章节里&#xff0c;我们展示了目标机器特定节点与目标机器无关节点共存的一个图。你可能会问&#xff0c;如果这是指令选择的一个输入&#xff0c;为什么在SelectionDAG类中已经有一些目标机器特定的节点&#xff1f;要理解这&#xff0c;我们首先在下图概…

已经是项目经理了,还有必要考PMP吗?

这个必要性不是一定的&#xff0c;如果你想升职加薪&#xff0c;想突破瓶颈&#xff0c;没有其它办法提升的话&#xff0c;考一个有针对性的项目管理证书也是有一些必要性的&#xff0c;虽然薪资和证书不是画等号的&#xff0c;但是多了一些可能性&#xff0c;既能提升自己&…

小白如何把微博的视频下载到本地,只需2个步骤

微博是中国最受欢迎的社交网络平台之一&#xff0c;用户可以在其上分享文字、图片和视频。但是&#xff0c;有时候我们会想要将喜欢的微博视频保存到本地&#xff0c;以便随时观看。本文将向您介绍如何实现这一目标。 无水印方法&#xff1a; 1. 搜一搜获取视频下载小助手 为…

ffmpeg推流 nginx-http-flv-module作为流媒体服务器转流m3u8 前端vue集成videojs-player播放 实现、调优、问题解决

背景&#xff1a; 最近公司要基于双目视觉做鹤管自动充装项目&#xff0c;需要对相机的流媒体进行推流&#xff0c;推流到流媒体服务器后&#xff0c;再将流转换成页面能播放的flv或m3u8格式的直播流&#xff0c;然后在页面进行视频直播。本项目共有四个鹤位&#xff0c;所以需…