10个最流行的开源机器视觉标注工具

news2024/11/13 9:08:21

在这里插入图片描述

推荐:用 NSDT编辑器 快速搭建可编程3D场景

我们知道寻找良好的图像标记和注释工具对于创建准确且有用的数据集的重要性。 随着图像注释空间的增长,我们看到开源工具的可用性激增,这些工具使任何人都可以免费标记他们的图像并从强大的功能中受益。 继续阅读,了解计算机视觉标注的 10 个最佳开源工具!

1、Label Studio

我们最喜欢的开源标注工具是 Heartex Inc. 的 Label Studio。我们最近在上一篇文章中介绍了该工具的企业版,因为它的多功能性和用于主动学习和协作的高级功能给我们留下了深刻的印象。 该工具的开源版本适用于所有类型的数据,例如音频、文本、图像、视频和时间序列。

在这里插入图片描述

它支持广泛的标注,包括图像分类、对象检测、语义分割。 它适用于几乎所有类型的数据,例如音频、图像、文本和 HTML,并具有称为标签配置的独特配置设置,你可以在其中设计自己的自定义 UI。 它具有各种算法驱动的自动化功能,包括预标记选项,可以根据现有的机器学习模型对数据进行预标记。 最后,我们喜欢它的是它拥有一个充满活力的用户社区和一个非常活跃的 Slack 频道,你可以在其中交换提示或向团队提出请求。

2、Diffgram

此列表中的第二个平台是 Diffgram! Diffgram 之前也曾在我们喜欢的工具系列中出现过,当时它还是一个付费平台。 自 2021 年春季以来,Diffgram 已转变为完全开源平台,提供可选的付费托管服务和企业支持。 我们完全支持这一转变,并且对其扩大的影响范围感到非常兴奋。
在这里插入图片描述

它的突出之处在于,除了作为一个标注平台之外,它还具有各种数据集和工作流管理功能。 它支持图像和视频中几乎所有类型的空间注释,包括但不限于边界框、长方体、分割、长方体和关键点。 它的语义分割功能还提供各种工具,例如自动边框、组合形状、点到全多边形等等! 此外,其视频标注支持插值和序列标记,例如事件跟踪和对象跟踪。

3、LabelIMG

LabelIMG 是另一个非常流行的开源且免费使用的图像标注工具。 事实上,它是我们在 2017 年使用的第一个标注工具,由于其简单直观的界面以及它可以离线使用以提供最大的数据安全性,它极大地方便了我们的工作。

在这里插入图片描述

LabelIMG可以安装在几乎所有操作系统上,例如 Windows、Linux、Ubuntu 和 Mac OS,并且其 Python 库也可以在 Anaconda 或 Docker 中使用。 然而,它只支持边界框作为单独的标记方法,这就是为什么它是一个很好的第一个工具,但对于更复杂的项目来说通常可能不够。 它可以将标注保存为 PASCAL VOC 格式以及 YOLO 和 CreateML 格式的 XML 文件。

4、CVAT

CVAT(计算机视觉标注工具)是由英特尔开发的开源软件。 虽然它没有最直观的 UI,但它具有非常强大且最新的特性和功能,并且在 Chrome 中运行。 它仍然是我们和我们的客户用于标记的主要工具之一,因为它比市场上许多可用的工具要快得多。

在这里插入图片描述

CVAT提供对象检测、图像分类、图像分割以及带有框、多边形、线条和关键点的注释。 CVAT 甚至提供各种自动化功能,例如复制和传播对象、对象跟踪和插值以及自动注释,由 TensorFlow OD API 提供支持。 在 CVAT 中协作很容易,并且可以拆分和委派工作。

5、ImageTagger

ImageTagger 是一个用于协作图像标记的开源在线平台。 该平台由汉堡大学信息学系的 Niklas Fiedler 专为机器人世界杯的需求而开发,其设计使实际的标记过程尽可能直观和快速。
在这里插入图片描述

ImageTagger允许用边界框、多边形、线条和关键点来标记图像集。 它确实提供了一些有助于 QA 的项目管理选项和功能,例如图像预加载、上传现有标签和标签验证。 此外,由于它专注于协作,因此它允许通过将标记者拆分为团队来在图像集标记方面进行大规模协作。

6、LabelMe

LabelMe 是一款被认为是行业经典的开源工具。 LabelMe 由麻省理工学院于 2008 年创建,旨在构建规范的 LabelMe 数据集,可以在线或离线使用。 它可以与 Python 启动器一起在 Windows、Ubuntu 和 Mac 操作系统上运行。 LabelMe 提供带有多边形、方框、圆、直线、关键点以及语义和实例分割的图像和视频标注。
在这里插入图片描述

此外,它还通过图像标注工具提供分类以及清理功能,并具有可定制的用户界面。 它还允许以 VOC 和 COCO 格式导出语义和实例分割。 然而,它几乎没有项目管理功能,因为它不适用于协作标签。 相反,它与 Mechanical Turk 集成,可以轻松外包手动标签流程。

7、VCG Image Annotation

VGG Image Annotation也称为 VIA,由牛津大学视觉几何小组开发。 这是一个相当简单的注释工具,可以手动注释图像、音频和视频——它是我们仍然经常使用的最爱之一。 非常易于使用和安装,它可以在任何支持 HTML 的浏览器中用作离线应用程序。
在这里插入图片描述

VIA 可以用方框、圆形、椭圆形、多边形、关键点和直线等形状进行标记。 VIA 支持 CSV 和 JSON 导出以及有限的项目管理功能,例如允许为注释器设置多个作业,并通过简单易用的 UI 跟踪进度。

8、Make Sense

Make Sense 是一个相对较新的开源注释平台。 Make-sense 由 Piotr Skalski 于 2019 年夏天发布,拥有令人惊叹的 UI,在标注方面没有多余的装饰,还具有额外的对象检测和图像识别功能。 首先,访问他们的网站,拖放图像,就可以立即开始注释。 他们不在线存储图像,因此不存在隐私问题。
在这里插入图片描述

Make Sense 支持边界框、关键点、线条和多边形,甚至使用 AI 模型来自动化一些注释,例如在 COCO 数据集上预训练的 SSD 模型,以及可用于估计人的姿势和动作的 PoseNet 模型。 图像或视频中的关键主体。 目前,Make Sense 没有任何项目管理功能或 API。

9、COCO Annotator

COCO Annotator 使用 Vue.js 创建,Vue.js 是一个开源MVV前端 JavaScript 框架,用于构建用户界面和单页应用程序。 它是一种基于网络的图像分割工具,旨在帮助开发和训练对象检测、定位和关键点检测模型。
在这里插入图片描述

可以使用自由曲线、多边形和关键点以及其他功能来标记数据集,以标记图像片段、跟踪对象实例,甚至允许在单个实例中标记具有断开连接的可见部分的对象,同时高效存储和导出 COCO 格式的标注,因此得名。 COCO Annotator还支持使用半训练模型标注图像,并拥有 DEXTR、MaskRCNN 和 Magic Wand 等高级选择工具。 最后,它还提供了一个用户身份验证系统以确保安全。

10、Dataturks

我们的最后一个条目是一个不再更新的开源平台。 Dataturks 曾经是一项付费服务,于 2018 年被沃尔玛收购,此后Dataturks的开发已停止,现在可在 GitHub 上免费使用。 尽管在使用该软件时多次提及付费额外费用,但它是完全免费的。 它似乎已经有一段时间没有开发了,但仍然是一个可靠的开源数据标注工具。 它允许团队异步处理各种注释类型,包括图像、视频、文本和 NER。

在这里插入图片描述

通过图像标注,它允许绘制自由形式的多边形以生成用于分割的图像掩模,并支持通过多边形标签和边界框标签进行图像分类。 它甚至具有视觉对象跟踪功能,可以在视频中的某些时间围绕对象绘制边界框,并且该工具将自动在这些点之间进行插值。 Dataturks 可以导出 VOC、Tensorflow 和 Keras 格式。


原文链接:TOP10机器视觉标注工具 — BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1123162.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

这5种炫酷的动态图,都是用Python实现的!

数据可以帮助我们描述这个世界、阐释自己的想法和展示自己的成果,但如果只有单调乏味的文本和数字,我们却往往能难抓住观众的眼球。而很多时候,一张漂亮的可视化图表就足以胜过千言万语。本文将介绍 5 种基于 Plotly 的可视化方法&#xff0c…

IP地址SSL证书 IP证书

在许多企业用例中,公司需要SSL证书作为IP地址。公司使用IP地址通过Internet访问各种类型的应用程序。 公网IP地址的SSL证书: 内部IP(也称为私有IP)是IANA设置为保存的IPv4或IPv6地址,例如: RFC 1918范围内…

编译原理如何写出不带回溯的递归子程序?

递归子程序 使用不带回溯的递归子程序解析文法是预测性语法分析的基础,这通常需要该文法是LL(1)文法。每个非终结符对应一个递归子程序,并使用当前的输入符号和FIRST集合来决定调用哪个产生式。 让我们以一个简单的文法为例: 对于此文法&am…

大模型开发06:LangChain 概述

大模型开发06:LangChain 概述 LangChain 是一个基于语言模型开发应用程序的框架。它可以实现以下功能: 上下文感知: 将语言模型与上下文源相连接(提示词、示例、用于支撑响应的内容等)推理能力: 依赖语言模型进行推理(如何根据提供的上下文来回答问题或采取哪些行动等)La…

抖音手把手带,开放到月底!

这个月一直在做的两件事,一个是带内部社员,去把抖音项目跑通。一个是招募合伙人。简单说下这两个事,之前一直没在公众号说。 带学员这件事,默认收徒只到月底。感兴趣的直接报名,价格4980。这块无需多言,做一…

如何解散微信群?这两个方法收藏好!

微信群,简单来说就是多人社交,能够让用户与多个人进行交流与互动。群主可以邀请有共同爱好的朋友在一个群里聊天、分享信息等等,以此来增强社交互动。 如果是一些临时活动群或者群成员已经不活跃的情况下,那么群主可能会选择将群…

mysql图片存取初探

mysql数据库中使用blob存储使用base64加密图片数据 前言 这个方法并不好,因为传输的数据量还是蛮大的,可以存一些诸如头像的小图片,但是如果要存较大的图片会很慢。 不过只是课程作业中简单的功能,这样子简单又快捷,…

各类深度学习框架详解+深度学习训练环境搭建-GPU版本

目录 前言 一、深度学习框架 TensorFlow PyTorch Keras Caffe PaddlePaddle 二、深度学习框架环境搭建 1.CUDA部署 CUDA特性 CUDA下载 2.cuDNN cuDNN 的主要特性 cuDNN 下载 3.安装TensorFlow框架 TensorFlow 2 旧版 TensorFlow 1 4.安装PyTorch框架 5.安装Ca…

MySQL字段加密方案 安当加密

要通过安当KSP密钥管理系统实现MySQL数据库字段的加密,您可以按照以下步骤进行操作: 安装和配置安当KSP密钥管理系统:首先,您需要安装安当KSP密钥管理系统,并按照说明进行配置。确保您已经正确地设置了密钥管理系统的用…

数据结构与算法之图: Leetcode 417. 太平洋大西洋水流问题 (Typescript版)

太平洋大西洋水流问题 https://leetcode.cn/problems/pacific-atlantic-water-flow/description/ 描述 有一个 m n 的矩形岛屿,与 太平洋 和 大西洋 相邻。 “太平洋” 处于大陆的左边界和上边界,而 “大西洋” 处于大陆的右边界和下边界。 这个岛被…

Elsevier上传LaTeX修改稿常见问题解决方法

在撰写科研论文时,一般会使用latex或者word两种工具。在论文的返修阶段,很多期刊要求我们上传可编辑格式的稿件。word在上传到爱思唯尔系统中时候很方便,但latex是较为麻烦的,下面和大家分享一下我在上传latex手稿时遇到的一些问题…

【人工智能】LLM 大型语言模型和 Transformer 架构简介

目录 大型语言模型 (LLM) 一、LLM的起源 二、LLM的发展阶段 三、LLM的应用领域

torch.nn.Parameter()

一文通俗理解torch.nn.Parameter() 一、起源 首先,我写这篇文章的起源是因为,我突然看到了一段有关torch.nn.Parameter()的代码。 因此就去了解了一下这个函数,把自己的一些理解记录下来,希望可以帮到你。 二、官方文档 网址如下…

单目3D目标检测[基于几何约束篇]

基于语义和几何约束的方法 1. Deep3DBox 3D Bounding Box Estimation Using Deep Learning and Geometry [CVPR2017]https://arxiv.org/pdf/1612.00496.pdfhttps://zhuanlan.zhihu.com/p/414275118 核心思想:通过利用2D bounding box与3D bounding box之间的几何约…

直播录屏没有声音?解决方案来了!

在进行游戏直播、教程制作或在线会议录制时,有声音的录屏是至关重要的。然而,有时用户可能会面临直播录屏没有声音的问题。在本文中,我们将介绍两种常用的方法来解决这个问题,通过遵循下面的步骤,您将能够轻松地添加声…

Osgb转3DTiles工具

三维倾斜摄影生产主要格式为Osgb,目前三维模型主要展示场景为web,大部分使用框架都是Cesium库,格式为 3DTiles,目前市面上osgb转3DTiles的软件已经有好几个,付费免费都有。 先说免费软件: 1、CesiumLab …

SaaS是云计算服务,不是互联网平台

习惯性的把SaaS云计算服务,理解成平台,是不对的! SaaS本质就是云计算服务,企业在saas应用系统里操作业务,背后都是各种云计算操作。 但是,中国的互联网环境就都是巨头平台所主导,所以大家基本…

华为OD机试 - 寻找最大价值的矿堆 - 矩阵(Java 2023 B卷 200分)

目录 专栏导读一、题目描述二、输入描述三、输出描述四、Java算法源码五、效果展示1、输入2、输出 华为OD机试 2023B卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(A卷B卷)》。 刷的越多…

工具让公众号推送变得轻而易举

公众号运营的关键在于定期向用户推送内容,但手动推送过程繁琐且浪费时间。现在,有了乔拓云公众号助手工具,你可以轻松实现公众号的自动推送功能。让我们一起来看看如何操作吧! 首先,你需要注册一个乔拓云公众号助手工具…

阿里云新品云服务器实例,经济型e实例,价格便宜,性价比高

前不久,阿里云推出了一款全新云服务器实例,他是阿里云面向个人开发者、学生、小微企业,在中小型网站建设、开发测试、轻量级应用等场景推出的全新入门级云服务器,基于“飞天CIPU”黄金技术架构设计,可轻松满足网站建设…