图像标注是什么?及其类型和应用

news2024/11/23 12:44:01

什么是图像标注?

图像标注是与您交互的许多人工智能产品的基础,并且是计算机视觉(CV)领域重要的过程之一。在图像标注过程中,数据标注员使用标签或元数据来标记AI模型学习识别的数据特征。然后,这些图像标注的数据被用于训练机器模型,使计算机在见到无标记的新数据时识别出这些特征。 小时候,你知道那个会“汪汪汪”叫的生物是“狗”。我们慢慢长大,发现那个捉迷藏把屁股对着外面的二愣子叫“二哈”,那个走路屁股一扭一扭叫柯基,那个主人已故却依然坚守在车站的“八公”是秋田犬。我们知道狗和猫不同,长大后也发现有一个长得很像兔子的小可爱叫“天竺鼠”。和人类一样,计算机也需要通过许多数之不尽的“动物知识”来学习如何对动物进行分类。图像标注就是以计算机可以理解的方式来提供这些“知识”。 随着致力于人工智能的公司能够获得的图像数据的不断增多,依赖于图像标注的项目的需求也飞速增长。对于在机器学习领域开展业务的企业来说,创建全面、有效的图像标注过程变得越来越重要。  

图像标注类型

图像标注类型

 图像标注有较为常见的三种类型,企业可以根据项目的复杂程度及适用的应用场景选择一种标注类型。对于任何类型,所使用图像数据的质量越高,达到的AI预测结果就会越准确。

一、图像分类

分类是简单又快捷的图像标注方法,仅将一个标签应用于一张图像。例如,你可能想要浏览并分类一系列杂货店货架的图像,并确定哪些货架上有汽水哪些没有汽水。这种方法非常适合收集抽象信息,例如上面的示例,在一天中的时间内,图像中是否有汽车,或者从一开始就过滤掉不符合条件的图像。在提供单一、高级标签方面,分类是一种快捷的图像标注方法,但也是我们重点介绍的三种类型中较为模糊的一种,因为它并不指示图像中物体所在的位置。

二、目标检测

目标检测是让标注员在图像中标注出指定的特定物体。因此,如果分类法将图像归类为包含汽水,那么这种方法进一步表明汽水在图像中的位置,或者是你正在寻找的芬达汽水的位置。有几种方法可用于目标检测,包括以下的标注技术:

  • 2D边界框(2D Bounding Box):标注员应用矩形和正方形来界定目标对象的位置。这是图像标注领域中常用的技术之一。
  • 三维长方体(Cuboid)或3D边界框(3D Bounding Box):标注员将立方体应用于目标对象,以界定对象的位置和深度。
  • 多边形分割(Polygonal Segmentation):当目标对象不对称且不容易放入盒子中时,标注员会使用复杂的多边形来界定对象的位置。
  • 线和样条线标注(Lines and Splines):标注员标识图像中的关键边界线和曲线以分隔各个区域。例如,标注员可以为自动驾驶汽车图像标注项目中标记高速公路的各个车道。

由于目标检测允许重叠使用框或线,因此该方法仍不是高精确的方法。它提供的是物体的一般位置,同时也是相对较快的标注过程。

三、语义分割(Semantic Segmentation)

语义分割通过确保图像的每个组成部分仅属于一个类别来解决物体检测的重叠问题。通俗的来说就是语义分割是对区域内的像素分类而不是目标分类。因此需要标注员为每个像素分配类别(例如行人、汽车或标志)。这有助于训练AI模型如何识别和分类特定对象,即使这些对象被遮挡。例如,如果有一个购物车遮挡了图像的一部分,则可以使用语义分割来识别直至像素级的芬达汽水是什么样,以便模型能够识别出它虽然被遮挡了但实际上仍是芬达汽水。 值得注意的是,图像标注方法并不仅仅局限于上述三种类型。其他的方法包括专门用于人脸识别的类型,例如特征点标注(标注员使用人体姿势点标注来绘制特征,例如眼、鼻和口)。图像转录是另一种常见的标记方法:当数据中包含多模式信息,即图片中有文字并且需要提取该文字时,就会用到这种方法。  

图像标注的常见应用场景

要罗列一份清单来囊括目前利用图像标注的所有应用程序,篇幅将长达数千页。目前,我们将重点介绍各大行业中比较热门的使用场景。

农业

农民可以借助无人机和卫星图像,利用AI来获得无尽的好处,包括估算作物产量、评估土壤状况等。John Deere公司提供一个令人激动的图像标注实例。该公司对相机图像进行标注,以在像素级别区分杂草和农作物。然后,他们参考这些经标注的图像数据将杀虫剂仅施用在生长杂草的区域而不是整个田地中,从而每年节省大量农药开支。

医疗

医生们正在利用AI解决方案进行辅助诊疗。例如,AI可以检查放射学影像,以确定存在某些癌症的可能性。在一个示例中,团队使用数千个标有癌病灶和非癌病灶的扫描图像数据来训练模型,直至机器学会自动区分。AI并不是真的取代医生,但可以在做肠镜的时候提高病灶诊断的准确性。关于计算机视觉如何应用在医疗领域,澳鹏创建了一个网络研讨会,点击了解《计算机视觉技术如何赋能医疗领域》。

制造业

制造商发现图像标注可以帮助他们采集仓库中的库存信息。他们正在训练计算机评估感官图像数据,以确定产品何时缺货、何时补货。某些制造商还使用图像标注项目监控工厂内的基础设施。他们的团队标注设备的图像数据,然后用这些数据训练计算机识别特定的缺陷或故障,从而推动更快的修复和更好的整体维护。

金融

尽管金融业远未充分利用图像标注项目的能力,但仍有数家公司在此领域掀起热潮。例如,凯克萨银行(Caixabank)使用人脸识别技术验证从ATM取款的客户的身份。这是通过名为“人脸关键点标注”的图像标注过程完成的,该过程可绘制眼和口等面部特征。人脸识别提供了一种更快、更精确的身份确认方法,从而降低了欺诈的可能性。图像标注技术也被广泛应用于标注要报销的单据或通过移动设备存入的支票(OCR技术)。

零售

图像标注对于许多不同的AI使用场景也不可或缺。你是否想要使用AI为特定商品提供正确的搜索结果,例如为客户提供“牛仔裤”的搜索结果?要构建可以浏览产品目录并提供用户所需结果的模型,就需要使用图像标注。有几家零售商还在自己的商店中试用机器人。这些机器人会收集货架图像,以确定产品是否库存量低或缺货,从而决策是否需要再订购。这些机器人还可以使用一种称为图像转录的过程,通过扫描“条形码图像”收集产品信息。  

如何使图像标注更容易

正如建立任何AI模型都需要克服重重挑战一样,图像标注也非常困难。AI需要大量高质量的训练数据才能正常工作(计算机可以学习的用例越多,它的表现就越佳),需要有多样化的团队来标注这些数据,还需要全面的数据流程来执行。对于许多企业而言,要投入的时间、金钱和人力成本通常都高得不切实际。对于那些没有内部资源来完成端到端图像标注项目的客户,向第三方供应商寻求帮助是合理的选择。这些供应商可以提供图像数据、标注员、工具和专家团队来协助进行这种大规模的工作。 特别是,在进行图像标注时,往往会遇到一系列的问题。图像可能光线欠佳,目标对象可能被遮挡,部分图像可能连人眼也无法识别。在开始图像标注项目之前,团队需要谨慎考量在此过程中会碰到的各种问题、必须认真考虑如何命名标签和区分类别,因为这些因素可能会影响标注员的标注判断,并最终使机器混淆。对于过于相似的类别如何制定区分标准是需要团队慎重思考的问题。 如何正确地带领团队完成精确图像标注项目,将决定是否会产出高质量的训练数据,而这也恰恰是制定AI战略投资中不可或缺的环节。  

澳鹏图像标注专家Liz Otto Hamel的见解

澳鹏依靠自身的专家团队帮助完成适用于客户机器学习工具的图像标注项目。Liz Otto Hamel是我们的一名产品经理,她将帮助确保“澳鹏数据标注平台”在提供高质量图像标注功能和工具方面超越行业标准。Liz具有学术研究背景并拥有斯坦福大学博士学位。她对评估和满足图像标注需求的建议包括:

  • 定义范围。首先对项目的业务目标作出明确而严格的定义。所标注数据的需求(包括标注几何形状、元数据、本体和格式)将来自项目的业务目标。利用业务价值指导图像标注项目利于保持明确的工作方向。
  • 制定迭代计划。为需要标注的一组数据制定初始标准,然后开始试运行。自己标注一小部分数据。在迭代过程中,你发现可能需要在项目制定的标准中考虑边缘案例。迭代计划将促使你的团队与数据标注供应商开展合作,第三方标注公司能够提供的多元标注工具和专业知识涵盖了各种标注用例,并可以按照你的团队的需求进行修改。
  • 制定整合计划。为了防止数据偏差(模型在自然环境中看到的数据类型的变化),你需要构建可扩展的自动化训练数据流程,以便用新数据不断训练模型。整合计划将促进你的团队与数据标注供应商开展合作,第三方标注公司可以根据你需要训练数据量的增加进行快速扩展。与模型进行交互的受众越多,为保持模型新鲜度所需的图像标注量也增加得越快。从项目开始就要制定一个整合计划。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/772883.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++模拟实现vector

目录 1.代码实现 2.注意事项 1.成员变量 2. 不能使用memcpy函数拷贝数据 1.用string类型测试时,要考虑到vs可能把数据存储在数组buffer里面 3.insert函数中指针的失效性 1.加引用,那么就不能传常量,比如v.begin() 3 2.加引用&#x…

C#委托相关知识

最开始学习C#的时候,简单的看过委托,最近工作中经常需要使用到委托。这篇笔记是对之前看过的委托的一个补充,也是对最近工作中遇到的委托的一个总结吧。 这里使用的是窗体程序作为例子。实例在文末,可下载。 委托是一个类&#xf…

【动手学深度学习】--15.含并行连结的网络GoogLeNet

文章目录 含并行连结的网络GoogLeNet1.Inception块2.GoogLeNet模型3.训练模型 含并行连结的网络GoogLeNet 学习视频:含并行连结的网络 GoogLeNet / Inception V3【动手学深度学习v2】 官方笔记:含并行连结的网络(GoogLeNet) 1.…

【智能交互】OPPO接入小布语音技能通关教程:个人开发者实现接口调用

目录 前言实际操作注册OPPO平台账号打开创建技能界面创建技能创建意图槽位解析对话管理对话测试接口代码编写接口创建新建意图对话管理测试猜想测试相关文档前言 适用人群:本教程适合大赛接入小布语音技能的同学以及初次使用小布助手的开发者 本篇文章是博主弄了多次测试才勉…

勒索花样繁多,“Sophos Encrypt”披马甲进行勒索攻击

近日,网络安全供应商Sophos发表声明,称Sophos被一款名为“Sophos Encrypt”新型勒索软件冒充,该勒索软件进行攻击时会冒用Sophos品牌名称,并将用户重要文件进行加密以勒索赎金。 现在的勒索软件类型多样,令企业防不胜防…

LeetCode·每日一题·874. 模拟行走机器人·哈希

作者:小迅 链接:https://leetcode.cn/problems/walking-robot-simulation/solutions/2350184/ha-xi-biao-zhu-shi-chao-ji-xiang-xi-by-x-20cg/ 来源:力扣(LeetCode) 著作权归作者所有。商业转载请联系作者获得授权&am…

【iPaaS干货分享】大型企业都在用的新一代SAP集成方式,你了解吗?

目录 目前企业实现SAP集成的主要方式 一、使用SAP PI/PO实现SAP与外部系统的集成 二、使用自开发方式 SAP新一代集成方式——基于iPaaS SAP连接器 一、分钟级实现SAP系统的集成 二、统一集成接口及安全管理 三、可视化编排改造SAP接口 SAP(Systems, Applicatio…

GO语言方法集

实际上,这里 那为什么还要生产包装方法呢?主要是为了支持接口. 接口不能直接使用接收者为值类型的方法.因为我们A(a)接受者是第一个参数,而这个参数是动态派发的,参数放在栈的局部变量,编译器在编译阶段不能确定这个量的大小.而指针平台确定了大小也就确定了.面对这个问题,编译…

如何使用MATLAB软件完成生态碳汇涡度相关监测与通量数据分析

MATLAB MATLAB是美国MathWorks公司出品的商业数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。 [1] MATLAB是matrix&laboratory两个词的组合,意为矩阵工厂&a…

Java List集合 -- 最常用的两种排序方法

现在有一个类 public class Person {private int id;private int age;private String name;public Person(int id, int age, String name) {this.id id;this.age age;this.name name;}public int getId() {return id;}public int getAge() {return age;}public String getN…

149206-86-0,DOTA GGGA,双功能螯合物,修饰在多肽上的螯合剂

资料编辑|陕西新研博美生物科技有限公司小编MISSwu​ 规格单位:g |货期:按照具体的库存进行提供 | 纯度:95%| PART1-------试剂描述: 螯合剂Dota-ggga(CAS号:149206-86-0),螯合…

skbuff.h在哪

今天看来下底层socket的实现,发现很多人都说有个skbuff结构,我就想着去找下这个, cat /include/linux/skbuff.h 结果找不到,查了下,需要下载内核源码 //Ubuntusudo apt install linux-headers-genericdpkg -S skbuff.…

Linux系统配置Node.js环境详细教程(图文讲解)

前言:在使用Jenkins部署Vue项目的时候,如果没有安装Node.js环境的话,Jenkins会无法对Vue项目进行构建,所以本期出了一篇关于在Linux系统如何配置Node.js环境的讲解,以博客的方式记录一下我详细的配置流程和踩过的坑&am…

包的使用及其创建

文章目录 前言类名冲突完整的类路径创建包导入类包总结 前言 java语言中,包在整个管理过程中发挥了重要的作用。使用包,可以有效地管理繁多的类文件,解决了类名重复的问题。在类中应用包和权限修饰符,可以控制他人对类成员的方法的…

旅游卡系统加盟代理软件开发

旅游行业的不断发展,越来越多的旅行社开始推出各种优惠卡来吸引游客。而随着智能手机的普及,开发一款旅行社优惠卡APP软件成为了一种必然的趋势。 该软件的主要功能是提供旅行社的各种优惠卡信息,包括优惠卡的种类、价格、使用范围、有效…

【代码随想录 | Leetcode | 第四天】数组 | 螺旋矩阵 | 螺旋矩阵 II

前言 欢迎来到小K的Leetcode|代码随想录|专题化专栏,今天将为大家带来螺旋矩阵的分享✨ 目录 前言59. 螺旋矩阵 II54. 螺旋矩阵总结 59. 螺旋矩阵 II 给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 n x n…

用微服务架构推进企业数字化转型升级

随着数字化转型进入深水区,企业应用程序建设需求急剧增长且变化多端,软件架构经历了单体结构、垂直架构、SOA架构,发展到了现在的微服务架构。 单体架构目前应用较多,部署容易,但单体式应用内部包含了所有需要的服务&…

四、DML-3.数据操作-删除

delete不能删除某个字段的值 若要删除某个字段的值,用update,将该字段设置为null 原数据表: 一、案例一 删除gender为女的员工 delete from employee where gender 女; 步骤一:输入delete命令并执行: 步骤二&#…

【Python】通过第三方库wxauto自动化操作微信电脑客户端

文章目录 一.简介二.wxauto提供的函数1.WxUtils类功能函数:2.WeChat类主要函数: 三.使用四.遇到的问题 一.简介 wxauto是一个Python第三方库,用于自动化操作微信电脑客户端通过wxauto,我们可以使用Python编写脚本,实现…

如何自学网络安全(黑客)

自学网络安全(黑客)需要掌握一系列的技能和知识,以下是一些学习网络安全的步骤: 基础知识:首先,你需要对计算机网络和操作系统有基本的了解。学习计算机网络的基本原理、网络协议和网络安全的基本概念。同时…