10个值得收藏的机器视觉标注工具

news2025/2/7 19:39:35

推荐:用 NSDT编辑器快速搭建可编程3D场景

我们知道寻找良好的图像标记和注释工具对于创建准确且有用的数据集的重要性。 随着图像注释空间的增长,我们看到开源工具的可用性激增,这些工具使任何人都可以免费标记他们的图像并从强大的功能中受益。 继续阅读,了解计算机视觉标注的 10 个最佳开源工具!

1、Label Studio

我们最喜欢的开源标注工具是 Heartex Inc. 的 Label Studio。我们最近在上一篇文章中介绍了该工具的企业版,因为它的多功能性和用于主动学习和协作的高级功能给我们留下了深刻的印象。 该工具的开源版本适用于所有类型的数据,例如音频、文本、图像、视频和时间序列。

它支持广泛的标注,包括图像分类、对象检测、语义分割。 它适用于几乎所有类型的数据,例如音频、图像、文本和 HTML,并具有称为标签配置的独特配置设置,你可以在其中设计自己的自定义 UI。 它具有各种算法驱动的自动化功能,包括预标记选项,可以根据现有的机器学习模型对数据进行预标记。 最后,我们喜欢它的是它拥有一个充满活力的用户社区和一个非常活跃的 Slack 频道,你可以在其中交换提示或向团队提出请求。

2、Diffgram

此列表中的第二个平台是 Diffgram! Diffgram 之前也曾在我们喜欢的工具系列中出现过,当时它还是一个付费平台。 自 2021 年春季以来,Diffgram 已转变为完全开源平台,提供可选的付费托管服务和企业支持。 我们完全支持这一转变,并且对其扩大的影响范围感到非常兴奋。

它的突出之处在于,除了作为一个标注平台之外,它还具有各种数据集和工作流管理功能。 它支持图像和视频中几乎所有类型的空间注释,包括但不限于边界框、长方体、分割、长方体和关键点。 它的语义分割功能还提供各种工具,例如自动边框、组合形状、点到全多边形等等! 此外,其视频标注支持插值和序列标记,例如事件跟踪和对象跟踪。

3、LabelIMG

LabelIMG 是另一个非常流行的开源且免费使用的图像标注工具。 事实上,它是我们在 2017 年使用的第一个标注工具,由于其简单直观的界面以及它可以离线使用以提供最大的数据安全性,它极大地方便了我们的工作。

LabelIMG可以安装在几乎所有操作系统上,例如 Windows、Linux、Ubuntu 和 Mac OS,并且其 Python 库也可以在 Anaconda 或 Docker 中使用。 然而,它只支持边界框作为单独的标记方法,这就是为什么它是一个很好的第一个工具,但对于更复杂的项目来说通常可能不够。 它可以将标注保存为 PASCAL VOC 格式以及 YOLO 和 CreateML 格式的 XML 文件。

4、CVAT

CVAT(计算机视觉标注工具)是由英特尔开发的开源软件。 虽然它没有最直观的 UI,但它具有非常强大且最新的特性和功能,并且在 Chrome 中运行。 它仍然是我们和我们的客户用于标记的主要工具之一,因为它比市场上许多可用的工具要快得多。

CVAT提供对象检测、图像分类、图像分割以及带有框、多边形、线条和关键点的注释。 CVAT 甚至提供各种自动化功能,例如复制和传播对象、对象跟踪和插值以及自动注释,由 TensorFlow OD API 提供支持。 在 CVAT 中协作很容易,并且可以拆分和委派工作。

5、Make Sense

Make Sense 是一个相对较新的开源注释平台。 Make-sense 于 2019 年夏天发布,拥有令人惊叹的 UI,在标注方面没有多余的装饰,还具有额外的对象检测和图像识别功能。 首先,访问他们的网站,拖放图像,就可以立即开始注释。 他们不在线存储图像,因此不存在隐私问题。

Make Sense 支持边界框、关键点、线条和多边形,甚至使用 AI 模型来自动化一些注释,例如在 COCO 数据集上预训练的 SSD 模型,以及可用于估计人的姿势和动作的 PoseNet 模型。 图像或视频中的关键主体。 目前,Make Sense 没有任何项目管理功能或 API。

6、LabelMe

LabelMe 是一款被认为是行业经典的开源工具。 LabelMe 由麻省理工学院于 2008 年创建,旨在构建规范的 LabelMe 数据集,可以在线或离线使用。 它可以与 Python 启动器一起在 Windows、Ubuntu 和 Mac 操作系统上运行。 LabelMe 提供带有多边形、方框、圆、直线、关键点以及语义和实例分割的图像和视频标注。

此外,它还通过图像标注工具提供分类以及清理功能,并具有可定制的用户界面。 它还允许以 VOC 和 COCO 格式导出语义和实例分割。 然而,它几乎没有项目管理功能,因为它不适用于协作标签。 相反,它与 Mechanical Turk 集成,可以轻松外包手动标签流程。

7、VCG Image Annotation

VGG Image Annotation也称为 VIA,由牛津大学视觉几何小组开发。 这是一个相当简单的注释工具,可以手动注释图像、音频和视频——它是我们仍然经常使用的最爱之一。 非常易于使用和安装,它可以在任何支持 HTML 的浏览器中用作离线应用程序。

VIA 可以用方框、圆形、椭圆形、多边形、关键点和直线等形状进行标记。 VIA 支持 CSV 和 JSON 导出以及有限的项目管理功能,例如允许为注释器设置多个作业,并通过简单易用的 UI 跟踪进度。

8、ImageTagger

ImageTagger 是一个用于协作图像标记的开源在线平台。 该平台由汉堡大学信息学系的 Niklas Fiedler 专为机器人世界杯的需求而开发,其设计使实际的标记过程尽可能直观和快速。

ImageTagger允许用边界框、多边形、线条和关键点来标记图像集。 它确实提供了一些有助于 QA 的项目管理选项和功能,例如图像预加载、上传现有标签和标签验证。 此外,由于它专注于协作,因此它允许通过将标记者拆分为团队来在图像集标记方面进行大规模协作。

9、COCO Annotator

COCO Annotator 使用 Vue.js 创建,Vue.js 是一个开源MVV前端 JavaScript 框架,用于构建用户界面和单页应用程序。 它是一种基于网络的图像分割工具,旨在帮助开发和训练对象检测、定位和关键点检测模型。

可以使用自由曲线、多边形和关键点以及其他功能来标记数据集,以标记图像片段、跟踪对象实例,甚至允许在单个实例中标记具有断开连接的可见部分的对象,同时高效存储和导出 COCO 格式的标注,因此得名。 COCO Annotator还支持使用半训练模型标注图像,并拥有 DEXTR、MaskRCNN 和 Magic Wand 等高级选择工具。 最后,它还提供了一个用户身份验证系统以确保安全。

10、Dataturks

我们的最后一个条目是一个不再更新的开源平台。 Dataturks 曾经是一项付费服务,于 2018 年被沃尔玛收购,此后Dataturks的开发已停止,现在可在 GitHub 上免费使用。 尽管在使用该软件时多次提及付费额外费用,但它是完全免费的。 它似乎已经有一段时间没有开发了,但仍然是一个可靠的开源数据标注工具。 它允许团队异步处理各种注释类型,包括图像、视频、文本和 NER。

通过图像标注,它允许绘制自由形式的多边形以生成用于分割的图像掩模,并支持通过多边形标签和边界框标签进行图像分类。 它甚至具有视觉对象跟踪功能,可以在视频中的某些时间围绕对象绘制边界框,并且该工具将自动在这些点之间进行插值。 Dataturks 可以导出 VOC、Tensorflow 和 Keras 格式。


原文链接:TOP10机器视觉标注工具 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1336336.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java代理设计模式--静态代理和动态代理

文章目录 代理设计模式概念代理模式的定义与特点代理模式的结构与实现代理模式的应用场景静态代理实例代理模式的扩展动态代理实现方式JDK动态代理与实例Cglib动态代理JDK动态代理与CGLIB对比 代理设计模式 概念 在有些情况下,一个客户不能或者不想直接访问另一个…

【中小型企业网络实战案例 二】配置网络互连互通

​【中小型企业网络实战案例 一】规划、需求和基本配置-CSDN博客 热门IT技术视频教程&#xff1a;https://xmws-it.blog.csdn.net/article/details/134398330?spm1001.2014.3001.5502 配置接入层交换机 1.以接入交换机ACC1为例&#xff0c;创建ACC1的业务VLAN 10和20。 <…

NFC物联网一次性口令认证解决方案

物联网是由无线传感器网络、射频识别(RadioFrequency Identificalion&#xff0c;RFID)网络、互联网等构成的一种复合型网络&#xff0c;具有部分终端设备体积小、存储和计算处理能力弱的特点。顾名思义&#xff0c;物联网就是“物物相连的互联网”&#xff0c;也就是说,物联网…

Visual Studio2022配置ReSharper C++ 常用设置

如需安装免费的可以在下面留言&#xff0c;看到即回复 文章目录 Visual Studio2022配置ReSharper C 常用设置配置Visual Studio2022&#xff0c;使其能够按回车进行补全配置ReSharper C 设置自动弹出配置ReSharper C 的快捷键ReSharper C 去掉注释拼写使用中文注释 如何关闭新版…

OAuth2.0 四种授权方式讲解

一、OAuth2.0 的理解 OAuth2是一个开放的授权标准&#xff0c;允许第三方应用程序以安全可控的方式访问受保护的资源&#xff0c;而无需用户将用户名和密码信息与第三方应用程序共享。OAuth2被广泛应用于现代Web和移动应用程序开发中&#xff0c;可以简化应用程序与资源服务器之…

在国内如何在速卖通上买东西(在速卖通aliexpress上付款)??

一、速卖通aliexpress上购物流程 1. 登录速卖通aliexpress网站&#xff0c;点击“注册”按钮。 2. 输入您的邮箱地址&#xff0c;然后单击“验证/联系”按钮&#xff1b; 3. 使用您的信用卡支付订单金额&#xff0c;点击获取信用卡 4. 在“我的订单管理器”中查看订单信息。 …

学习笔记14——Springboot以及SSMP项目

SpringBoot Springboot项目 IDEA2023只能创建jdk17和21的springboot项目解决 - 嘿嘿- - 博客园 (cnblogs.com)解决IntelliJ IDEA2022.03创建包时&#xff0c;包结构不自动分级显示的问题_idea建包不分级-CSDN博客IDEA调出maven项目窗口_idea maven窗口-CSDN博客 相比于spring的…

【2023下算法课设】Gray码的分治构造算法

Gray码是一个长度为2ⁿ的序列&#xff0c;序列中无相同元素&#xff0c;且每个元素都是长度为n位的二进制位串&#xff0c;相邻元素恰好只有1位不同。例如长度为2的格雷码为&#xff08;000,001,011,010,110,111,101,100&#xff09;&#xff0c;设计分治算法对任意的n值构造相…

如何使用设计模式来解决类与类之间调用过深的问题。

我们将使用责任链模式和装饰者模式的组合。 考虑一个简化的餐厅订单处理系统&#xff0c;其中包括服务员&#xff08;Waiter&#xff09;、厨师&#xff08;Chef&#xff09;和收银员&#xff08;Cashier&#xff09;。订单从服务员开始&#xff0c;然后传递给厨师&#xff0c…

python区块链简单模拟【05】

新增内容&#xff1a;构建去中心化网络 import socket #套接字&#xff0c;利用三元组【ip地址&#xff0c;协议&#xff0c;端口】可以进行网络间通信 import threading #线程 import pickle# 定义一个全局列表保存所有节点 NODE_LIST []class Node(threading.Thread…

目标检测-Two Stage-RCNN

文章目录 前言一、R-CNN的网络结构及步骤二、RCNN的创新点候选区域法特征提取-CNN网络 总结 前言 在前文&#xff1a;目标检测之序章-类别、必读论文和算法对比&#xff08;实时更新&#xff09;已经提到传统的目标检测算法的基本流程&#xff1a; 图像预处理 > 寻找候选区…

手术麻醉临床信息系统源码,客户端可以接入监护仪、麻醉机、呼吸机

一、手术麻醉临床信息管理系统介绍 1、手术麻醉临床信息管理系统是数字化手段应用于手术过程中的重要组成部分&#xff0c;用数字形式获取并存储手术相关信息&#xff0c;既便捷又高效。既然是管理系统&#xff0c;那就是一整套流程&#xff0c;管理患者手术、麻醉的申请、审批…

NVIDIA Jetson Nano 2GB 系列文章(9):调节 CSI 图像质量

NVIDIA英伟达中国 ​在本系列上一篇文章中&#xff0c;我们为大家展示了如何执行常见机器视觉应用。在本篇文章中&#xff0c;我们将带领大家调节 CSI 图像质量。 前面两篇文章在 Jetson Nano 2GB 上使用 CSI 摄像头做了几个实验&#xff0c;效果很不错&#xff0c;并且很容易…

分布式系统架构设计之分布式通信机制

二、分布式通信机制&#xff1a;保障系统正常运行基石 在分布式系统中&#xff0c;各个组件之间的通信是保障系统正常运行的基石&#xff0c;直接影响到系统的性能、可扩展性以及整体的可维护性。接下来我们就一起看看通信在分布式系统中的重要性&#xff0c;以及一些常用的技…

java八股 redis

Redis篇-01-redis开篇_哔哩哔哩_bilibili 1.缓存穿透 2.缓存击穿 逻辑过期里的互斥锁是为了保证只有一个线程去缓存重建 3.缓存雪崩 4.双写一致性 4.1要求一致性&#xff08;延迟双删/互斥锁&#xff09; 延迟双删无法保证强一致性 那么前两步删缓和更新数据库哪个先呢&#xf…

kubernetes(k8s) Yaml 文件详解

YAML格式&#xff1a;用于配置和管理&#xff0c;YAML是一种简洁的非标记性语言&#xff0c;内容格式人性化&#xff0c;较易读。 1、查看API 资源版本标签 kubectl api-versions 2、编写资源配置清单 kubectl create -f nginx-test.yaml --validatefalse 2.3 查看创建的po…

【Python可视化系列】一文教会你绘制美观的热力图(理论+源码)

一、问题 前文相关回顾&#xff1a; 【Python可视化系列】一文彻底教会你绘制美观的折线图&#xff08;理论源码&#xff09; 【Python可视化系列】一文教会你绘制美观的柱状图&#xff08;理论源码&#xff09; 【Python可视化系列】一文教会你绘制美观的直方图&#xff08;理…

docker部署kafka zookeeper模式集群

单机模式链接&#xff1a;https://blog.csdn.net/wsdhla/article/details/133032238 kraft集群模式链接&#xff1a;部署Kafka_kafka 部署-CSDN博客 zookeeper选举机制举例&#xff1a; 目前有5台服务器&#xff0c;每台服务器均没有数据&#xff0c;它们的编号分别是1,2,3,4,5…

鸿蒙开发(二)- 鸿蒙DevEco开发环境搭建

上篇说到&#xff0c;鸿蒙开发目前势头旺盛&#xff0c;头部大厂正在如火如荼地进行着&#xff0c;华为也对外宣称已经跟多个厂商达成合作。目前看来&#xff0c;对于前端或客户端开发人员来说&#xff0c;掌握下鸿蒙开发还是有些必要性的。如果你之前是从事Android开发的&…

【计算机网络】—— 奈氏准则和香农定理

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 &#x1f4ab;个人格言:"没有罗马,那就自己创造罗马~" 目录 失真 - 信号的变化 ​编辑影像失真的因素&#xff1a; ​编辑信道带宽&#xff1a; 码间串扰…