【深度学习:开源数据注释】开源数据注释完整指南

news2024/11/23 22:50:42

在这里插入图片描述

【深度学习:Automated Data Annotation】开源数据注释完整指南

    • 什么是开源数据标注工具?
    • 您会使用开源标签工具做什么?
      • 主要的开源数据标注工具有哪些?
      • CVAT
      • MONAI Label
      • LabelMe
      • RIL-Contour
      • Sefexa
    • 使用开源注释工具的优点和缺点是什么?
      • 开源注释工具的缺点
      • **购买与建造:沉没成本谬论颠倒过来**
      • 难以扩展注释项目
      • 数据安全性薄弱或有限,没有审计跟踪
      • 项目负责人无法监控注释团队
      • 开源注释工具的优点
      • 免费下载和使用!
      • 适应性强且可编辑的软件
      • 社区支持
      • 您什么时候应该考虑使用商业注释工具?
      • Wrapping up

开源注释工具和软件广泛应用于计算机视觉和机器学习领域的数百个项目。

在某些情况下,使用开源工具可能是一个优势,特别是当项目或公司处于启动阶段并且注释工作的预算有限时。学术项目经常发现开源工具以及数百个开源数据集(例如 COCO)很有用。

然而,对于商业项目和用例来说,也有缺点。开源并不总是附带机器学习和数据运营团队有效、高效或大规模管理项目所需的工具和功能。

在本文中,我们将了解开源注释工具的用途,提供有关 5 个最流行的开源工具的更多详细信息,然后权衡使用开源工具的利弊,然后再将其与使用更先进的东西的选择。

什么是开源数据标注工具?

开源数据注释工具是一款专门为图像和视频数据集的图像标记和数据注释而设计的软件。注释是训练计算机视觉模型的重要组成部分,因为需要标签和数据注释来训练模型以产生组织所需的结果/结果。

开源工具可以免费使用。任何人都可以下载和使用它们,因此与软件即服务 (SaaS) 产品不同,无需支付许可费或按月订阅费。开源工具通常由类似于慈善机构的基金会通过社区捐赠或科技公司的赞助来维护。

您会使用开源标签工具做什么?

找到合适的开源工具并不总是那么容易。这取决于您需要它的用途,无论是用于图像标签、视频标签还是两者。

或者您是否需要一个针对某些用例具有特定功能的开源标记工具,例如注释医学成像数据集。正如我们在之前的文章中讨论过该主题一样,在这篇文章中,我们将重点关注更广泛的基于计算机视觉的图像和视频用例,例如智能城市、制造、安全和体育分析。

开源标签工具可用于从图像分割到绘制边界框、折线、对象检测以及图像和视频上的许多其他注释和标签等各种用途。您可以使用开源工具进行人体姿势估计 (HPE) 以及数十个其他计算机视觉 (CV) 项目用例。

在这里插入图片描述

Encord 中的图像注释

现在让我们来看看 5 个最流行的计算机视觉项目开源数据注释工具。

主要的开源数据标注工具有哪些?

CVAT

计算机视觉注释工具 (CVAT) 于 2017 年作为英特尔内部项目启动。现在它是一家独立的公司和基金会,其开源图像和视频注释软件的下载量超过 100 万次,并拥有一个由支持者和贡献者组成的热情社区。

使用 CVAT,您可以通过创建分类、分割、3D 长方体和骨架模板来注释图像和视频。 CVAT 用于医疗保健、零售、制造、体育、汽车和空中观测(无人机)领域。

CVAT 是一个由 Intel 支持的开源项目,属于 OpenCV 的范畴,并且由于 MIT 的宽松许可,可以免费用于商业用途。 CVAT 的核心团队将与 OpenCV 团队合作支持该项目,OpenCV 将支持那些从原来的 CVAT.org 迁移到新家 CVAT.ai 的人员。

MONAI Label

MONAI Label 是一款开源图像标注工具,利用 AI 来自动化标注工作。虽然 MONAI Label 主要用于医疗和保健领域,但它可用于任何类型的图像注释项目。这是一个易于安装的生态系统,可以在具有单个或多个 GPU 的计算机上本地运行。服务器端和客户端都可以在相同或不同的计算机上工作,具体取决于您的需要。

LabelMe

LabelMe 是麻省理工学院计算机科学与人工智能实验室推出的一款开源“为计算机视觉研究构建图像数据库的在线注释工具”。

LabelMe 附带可下载的源代码、工具箱、3D 图像的开源版本、可用于计算机视觉培训项目的图像数据集,以及通过 Amazon Mechanical Turk 外包数据标记的功能。

RIL-Contour

RIL-Contour 是另一个开源注释工具,可使用迭代深度学习 (IDL) 加速注释项目。它主要是为医学成像数据集设计的,但也可用于计算机视觉和机器学习项目的任何类型的基于图像的数据集。

RIL-Contour 是一个开源项目,拥有 1000 多名贡献者,其模式和框架源自 ELIXIR(欧洲生物信息基础设施)。

Sefexa

Sefexa 是一个开源图像分割工具。 Sefexa 由布拉格的软件工程师 Ales Fexa 创建,他对计算机视觉和数学充满热情。借助 Sefexa,您可以使用它在基于图像的数据集中进行半自动图像分割、分析图像并将结果导出到 Excel 中,以及从数据集中的图像创建地面实况数据。

现在让我们看看使用开源注释工具的优点和缺点。

使用开源注释工具的优点和缺点是什么?

不幸的是,开源工具有几个缺点,如下:

开源注释工具的缺点

购买与建造:沉没成本谬论颠倒过来

大多数创始人都知道,购买而不是构建有一个优势,因为它可以确保您的工程团队致力于开发您的产品。否则,当市场上有数百种选择时,您的开发人员可能会花费太多时间构建非核心内部技术解决方案。

在视频和图像注释领域,开源解决方案代表了对数千个图像和视频数据集进行注释和标记的挑战的潜在答案。

然而,这是“沉没成本谬论”被颠覆的一个领域。一些公司“直接使用”这些开源工具,或者作为构建内部版本的基础。不幸的是,正如我们下面概述的那样,与购买现成的和可定制的高级注释解决方案的优点相比,开源工具有太多的缺点,而这些优点并没有权衡开源注释工具的缺点。

难以扩展注释项目

最重要的挑战之一是扩展注释项目。

图像和视频注释项目通常涉及注释数千个图像和视频。每个都需要标签和合适的注释,例如边界框、多边形、折线、对象检测、HPE 以及其他所需的任何内容。注释工具尽可能地自动化此过程。

开源工具通常存在技术限制。它们的运行速度可能会变慢,从而使项目花费更长的时间,而且即使开源工具具有自动化功能,来自商业供应商的这些功能通常也更快、更高效、更有效。

然而,只有人类注释者为注释软件提供了一些可以使用的东西,自动化才有可能实现。借助商业且功能齐全的注释工具,扩展这些项目变得更加容易且耗时更少。每个人都可以看到整个团队的工作,更重要的是,项目负责人可以监控注释者并相应地放大和缩小。

使用开源软件,注释团队只能通过 Dropbox 等云存储解决方案共享图像和视频数据集。这使得扩展注释项目变得更加困难,现在您在管理注释项目时不再需要任何麻烦。

数据安全性薄弱或有限,没有审计跟踪

数据安全和审计跟踪是计算机视觉和机器学习项目不可或缺的一部分。

使用开源工具时,没有审计跟踪,数据安全性很弱或根本不存在。如果无法跟踪和监控图像和视频的基本审计跟踪和时间戳,那么确保您的项目遵守相关数据保护法律(例如欧洲的 GDPR、CE 认证或美国的 CCPA)是很困难的。

项目负责人无法监控注释团队

开源工具无法让注释者像高级软件那样经济高效地监控注释团队的工作。由于开源工具不是基于云的,项目负责人无法实时监控注释者的进度。没有仪表板,因此您无法看到谁做了什么、谁表现良好、谁表现不佳。

基准测试需要花费更多的时间和精力。协作依赖于注释者通过基于云的共享文件夹(例如 Dropbox 和 Box)发送完整批次的图像和视频。

注释项目通常需要更多时间,特别是在需要重新注释和重新标记或准确性较低的情况下。当项目的期限紧迫并且需要快速获得准确的培训数据时,使用开源工具可能会花费您的团队时间,而您不能浪费这些时间。

开源注释工具的优点

免费下载和使用!

使用开源注释工具的最佳也是主要原因之一是价格:它们是免费的!

注释工作非常耗时。获得任何能够加速这项工作的工具都是一种额外的好处,如果你不需要为此付费的话,那就更是如此了。

对于初创公司和学术项目来说,开源工具可能是正确的解决方案,特别是当您必须支付注释者团队的预算以及机器学习、计算机视觉或数据操作工程师的费用时。当注释预算紧张时,每一分钱都有帮助。

适应性强且可编辑的软件

开源工具的另一个优点是它们具有适应性和可编辑性。开源工具通常会发布其源代码和文档,因此,如果该工具与您的需求不完全一致,则可以采取相应的方法进行调整和修改。此外,您还可以使用插件、API 和其他技术调整和解决方法来修改开源软件以满足您的具体要求。

社区支持

与由公司提供支持的专有和高级注释软件不同,开源项目通常被大型且活跃的社区所包围。这些人要么是软件用户,要么对软件的开发做出了贡献。您始终可以依靠这些社区来回答您可能遇到的任何问题,因为其他人可能在注释和标签项目期间遇到类似的挑战。

然而,考虑到商业工具支持的性质,许多人会认为这通常胜过社区可以提供的答案,尤其是当您在截止日期前并且需要快速解决问题时。

您什么时候应该考虑使用商业注释工具?

当我们考虑到有效、高效地使用开源工具的挑战,以及需要协作和大规模的工作流程监督时,许多项目领导者有充分的理由转向并更喜欢商业软件解决方案。

借助 Encord 等解决方案,您可以受益于易于使用的协作界面。您需要能够管理不同国家/地区的注释者并根据需要与其他团队合作。当注释者拥有自己的软件本地版本并使用 Dropbox 等服务共享文件时,您就无法轻松做到这一点。

自动化功能同样重要。自动化功能可以为注释团队节省大量时间。例如,插值可以将一幅图像的像素数据与下一幅图像进行匹配,并确保注释者可以在任何方向绘制插值标签,从而节省大量时间。让我们面对现实吧,任何可以节省注释团队时间的事情都值得去做!

具有内置质量控制流程和功能的项目仪表板同样有用。这对于任何注释项目的顺利运行都是至关重要的。对于项目经理来说,这可能决定注释项目的成功或失败。

审计跟踪和数据合规性同样有价值,特别是在具有严格监管合规性的行业,例如医疗保健和与国防有关的任何行业。

Wrapping up

使用开源工具有很多优点。特别是对于初创公司和学术项目。在商业场景中,开源工具可能是开发您自己的内部专有注释解决方案或在购买现成解决方案时决定您需要什么的良好起点。不过,如果您想节省时间,与建造相比,购买始终是最快的途径!

尽管存在某些缺点,开源注释工具将继续流行并不断发展,以适应需要视频和图像数据集注释软件的市场、企业和组织不断变化的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1452115.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Sora:将文本转化为视频的创新之旅

一.能力 我们正致力于让 AI 掌握理解和模拟物理世界动态的能力,旨在培养能够协助人们解决现实世界互动问题的模型。 介绍 Sora——我们开发的文本到视频转换模型。Sora 能够根据用户的输入提示,生成最长达一分钟的高质量视频内容。 目前,Sora…

Gitee入门之工具的安装

一、gitee是什么? Gitee(码云)是由开源中国社区在2013年推出的一个基于Git的代码托管平台,它提供中国本土化的代码托管服务。它旨在为个人、团队和企业提供稳定、高效、安全的云端软件开发协作平台,具备代码质量分析、…

揭开Markdown的秘籍:引用|代码块|超链接

🌈个人主页:聆风吟 🔥系列专栏:Markdown指南、网络奇遇记 🔖少年有梦不应止于心动,更要付诸行动。 文章目录 📋前言一. ⛳️Markdown 引用1.1 🔔引用1.2 🔔嵌套引用1.3 &…

【Python---六大数据结构】

🚀 作者 :“码上有前” 🚀 文章简介 :Python 🚀 欢迎小伙伴们 点赞👍、收藏⭐、留言💬 Python---六大数据结构 往期内容前言概述一下可变与不可变 Number四种不同的数值类型Number类型的创建i…

【Spring篇】Spring的创建与使用

目录 一 . 创建Spring项目 二 . Bean 对象存放到 Spring 三 . 从Spring中读到Bean 经过前⾯的学习我们已经知道了,Spring 就是⼀个包含了众多⼯具⽅法的 IoC 容器。既然是容器那么 它就具备两个最基本的功能: 将对象存储到容器(Spring&am…

optee CA/TA flow

以 TEEC_InvokeCommand 为例 CA—normal world EL0 //imx-optee-client\libteec\src\tee_client_api.c TEEC_InvokeCommandioctl(session->ctx->fd, TEE_IOC_INVOKE, &buf_data)通过syscall陷入内核态driver linux driver—normal world EL1 tee_ioctl // drive…

一些方便的记录

如何在ubutun上安装qq 在QQ官网选择QQ Linux版本,然后选择X86下的deb类型文件进行下载 sudo dpkg -i linuxqq_3.2.5-21453_amd64.deb64 根据下载的版本不同对其进行更改 运行上述命令后显示应用程序可以看到安装后的QQ面板如何卸载安装在gnuradio的lora组件 - 进入…

php基础学习之可变函数(web渗透测试关键字绕过rce和回调函数)

可变函数 看可变函数的知识点之前,蒟蒻博主建议你先去看看php的可变变量,会更加方便理解,在本篇博客中的第五块知识点->php基础学习之变量-CSDN博客 描述 当一个变量所保存的值刚好是一个函数的名字(由函数命名规则可知该值必…

Eclipse Version: 2023-03 (4.27.0) JDK19 Tomcat10.2

Eclipse Version: 2023-03 (4.27.0) JDK19 Tomcat10.2

电子元器件基础5---二极管

除了电阻、电容和电感等线性元器件之外,还有二极管、三极管这些常用的非线性器件广泛应用于日常生活中。那么今天我们来介绍以下二极管这一常用的电子元器件。 一、二极管概念 二极管是用半导体材料(硅、硒、锗等)制成的一种电子器件 。二极管有两个电极,正极,又叫阳极;负…

07-k8s中secret资源02-玩转secret

一、回顾secret资源的简单实用 第一步:将想要的数据信息【key:value】中的value值,使用base64编码后,写入secret资源清单中; 第二步:创建secret资源; 第三步:pod资源引用secret资源&…

VMware Workstation 17.0 虚拟机安装MS-DOS 7.1完整详细步骤图文教程

VMware Workstation 17.0 虚拟机安装MS-DOS 7.1完整详细步骤图文教程 一、配置MS-DOS虚拟机机器环境二、安装MS-DOS磁盘操作系统 一、配置MS-DOS虚拟机机器环境 1.打开VMware Workstation Pro 2.新建虚拟机 3.建议选择【典型】,之后点击【下一步】 关于【自定义…

嵌入式Qt Qt中的信号处理

一.Qt中的信号处理 Qt消息模型: - Qt封装了具体操作系统的消息机制 - Qt遵循经典的GUI消息驱动事件模型 Qt中定义了与系统消息相关的概念; Qt中的消息处理机制: Qt的核心 QObject::cinnect函数: Qt中的“新”关键字: 实验1 初探…

[职场] 会计学专业学什么 #其他#知识分享#职场发展

会计学专业学什么 会计学专业属于工商管理学科下的一个二级学科,本专业培养具备财务、管理、经济、法律等方面的知识和能力,具有分析和解决财务、金融问题的基本能力,能在企、事业单位及政府部门从事会计实务以及教学、科研方面工作的工商管…

RK3568笔记十七:LVGL v8.2移植

若该文为原创文章,转载请注明原文出处。 本文介绍嵌入式轻量化图形库LVGL 8.2移植到Linux开发板ATK-RK3568上的步骤。 主要是参考大佬博客: LVGL v8.2移植到IMX6ULL开发板_lvgl移植到linux-CSDN博客 一、环境 1、平台:rk3568 2、开发板:…

Java解决下降路径最小和

Java解决下降路径最小和 01 题目 给你一个 n x n 的 方形 整数数组 matrix ,请你找出并返回通过 matrix 的下降路径 的 最小和 。 下降路径 可以从第一行中的任何元素开始,并从每一行中选择一个元素。在下一行选择的元素和当前行所选元素最多相隔一列…

net6 core webapi部署到iis

1.設定發佈的選項 2.安裝Hosting Bundle .NET Core 託管捆綁包是 .NET Core 執行時期和ASP.NET Core 模組的安裝程式。該捆綁包允許 ASP.NET Core 應用程式與 IIS 一起運行。 3.設定網站

自动更改由VSCode调试器创建的默认launch.json文件

File -> Preference -> Settings 修改下面的部分

SpringCloud之Feign发送Http请求

文章目录 http客户端Feign使用步骤自定义Feign的配置Feign的性能优化Feign的性能优化-连接池配置 Feign的最佳实践 http客户端Feign Feign的介绍: Feign是一个声明式的http客户端,官方地址:https:/github.com/OpenFeign/feign 其作用就是帮助…

GPT-4对编程开发的支持

在编程开发领域,GPT-4凭借其强大的自然语言理解和代码生成能力,能够深刻理解开发者的意图,并基于这些需求提供精准的编程指导和解决方案。对于开发者来说,GPT-4能够在代码片段生成、算法思路设计、模块构建和原型实现等方面给予开…