行业报告 | AI+制造业赋能,机器视觉开启掘金新大陆(上)

news2024/10/6 6:41:11

原创 | 文 BFT机器人

01

核心要点

Al+制造业赋能,META 发布 SAM 助力机器视觉迎来 GPT 时刻。


机器视觉技术使得工业设备能够“看到”它正在进行的操作并进行快速决策,完整机器视觉系统由硬件+软件组成,分别进行成像和图像处理工作。

目前,以“AI+人类感知”融合为代表的新兴技术开始逐渐渗透至工业制造各环节,机器视觉作为 AI+制造业的种业落地技术已经介入制造业生产环节的跟踪、产品质量的检测等。人工智能是机器视觉的母身,深度学习为机器视觉的技术堡垒,近期 Meta 发布 SAM 模式有望助力机器视觉迎来 GPT 时刻。

机器视觉下游的高景气反哺明显,AI 与机器视觉成为刚需。

AI+机器视觉技术优势明显,政策加持+社会需求(人口红利退潮)驱动中长期发展,我国机器视觉待渗透空间较大。随着工业 4.0 等概念的持续深化+研发技术的不断突破,AI+机器视觉持续赋能下游工业应用领域,有望受益于下游赛道的高景气,从行业领域来看,高景气赛道的半导体、汽车、新能源有望成为未来行业的最重要驱动力之一,电子领域在中长期仍是应用范围最广的下游。

从应用深度来看,AI 赋予机器视觉的高精度优势,使得机器视觉成为不少行业的刚需标配,机器视觉已逐渐嵌入半导体、汽车、新能源鲤电池与光伏的生产检测环节,提高汽车电子的装配质量、突破光伏缺陷检测瓶颈以提高产品良率等。

机器视觉成本集中在上游,核心环节的国产替代化方兴未艾。


25 年全球有望达到千亿市场规模,中国增速领先全球CAGR 为 15% 。

剖析产业链机器视觉产业链的上游硬件:镜头工业相机、光源以及软件 ,中游为装备制造系统集成厂商,成本集中在技术壁垒高筑的工业相机(价值量占比 23% )以及软件算法(35% ); 

竞争格局方面,全球机器视觉市场以康耐视 (美国 )、基恩士(日本 )、巴斯勒( 德国)为代表的企业占据全球>50%市场份额,以康耐视和基恩士为代表的双巨头以入局早、扎实产品技术、广泛应用场景经验的优势提前据市场优势。

国内机器视觉上游行业仍处于成长阶段,增长速度大致相当,关注国产替代+AI 迭代下工业相机与软件环节发展。

02

机器视觉—智能制造之眼

2.1 机器视觉的本质是机器的眼睛和大脑

机器视觉技术使得工业设备能够“看到”它正在进行的操作并进行快速决策。

根据美国制造工程师协会(SME)机器视觉分会和美国机器人工业协会( RIA )自动化视觉分会对机器视觉的定义:机器视觉是通过光学的装置和非接触的传感器,自动接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置。通俗地说,“眼睛”指的是机器视觉利用环境和物体对光的反射来获取及感知信息;“大脑”指的是机器视觉对信息进行智能处理和分析,根据分析结果来执行相应的活动。

据亿欧智库所称机器视觉是人工智能领域一个正在快速发展的分支,即用机器代替人眼来做测量和判断,是通过光学的装置和非接触的传感器,自动接收和处理真实物体的图像,以获得所需信息或用于控制机器人运动的装置。

中商产业研究院认为,机器视觉可以代替人眼在多种场景下实现多种功能,按功能主要分为四大类:检测、测量、定位、识别。

  1. 检测: 指外观检测,其内涵种类繁多。如产品装配后的完整性检测、外观缺陷检测等。

  2. 测量:把获取的图像像素信息标定成常用的度量衡单位,然后在图像中精确地计算出目标物体的几何尺寸;

  3. 定位:获得目标物体的位置,可以是二维或者是三维的位置信息。定位的精度和速度是定位功能的主要指标。在识别出物体的基础上精确给出物体的坐标和角度信息,自动判断物体位置;

  4. 识别:基于目标物进行甄别,包括外形、颜色、条码等。

图1:机器视觉工作流程

资料来源:奥普特招股书

2.2 AI 技术加持,成为机器视觉走向成熟的筹码

人工智能是机器视觉的母身,深度学习为机器视觉的技术堡垒。

近十年来,得益于深度学习等算法的突破、算力的不断提升以及海量数据的持续积累,人工智能逐渐从实验室走向产业实践,以算法、算力和数据为主旋律追求极致创新方面不断突破,为机器视觉实现更新迭代和提高应用价值的重要技术支撑。

在人工智能领域的新兴技术中,采用 BurstDetection 算法探测出深度学习是当前受到广泛关注的人工智能新兴技术,深度学习是一种以人工神经为架构,对数据进行表征学习的算法,“深”主要体现在更深层次的神经网络和对特征的多次变换上,与相同参数数量的浅层网络相比,深度网络具备更好的特征提取和泛化推广能力,不断为图像识别领域带来进步。

2007 年-2009 年,斯坦福教授李飞飞牵头构建起目前图像分类/检测/定位最常用数据集之一的 mage Net,2010-2017 年,基于Image Net数据集的ILSVRC 等一些大规模视觉识别挑战赛促进神经网络和深度学习技术的发展,如 AlexNet 能够将图片识别的错误率下降 14%,Google Brain 采用多 CPU 组合方式构建起深层次神经网络并应用于图像识别,取得突出成效等。

机器视觉与人工智能逐渐融合,引领向工业 4.0 的过渡。

机器视觉是工业自动化的基础技术之一,通过搭载人工智能发展东风实现机器视觉的再一次迭代升级。

此处东风一方面为深度学习的融合,赋予机器视觉更高的准确性和速度,另一方面则为视觉处理所服务的视觉处理器的能力呈现指数级增加,奠定机器视觉中深度学习推理/训练任务的硬件基础。

复盘机器视觉发展,从能够自动执行简单任务的自动化机器,转型为视觉能力不受人类视觉能力极限约束、自主思考,从而能够长期对各种元素进行优化的自主型机器,AI+机器视觉有望能够渗透入工业制造达到全新的水平。

图2:机器视觉与人工智能逐步融合

资料来源:英特尔官网

未来机器视觉将有望搭载更先进 AI 技术,切入更多差异化工业应用场景。

ChatGPT 所引爆的人工智能话题正持续火热,根据中国信息通信研究院和中国人工智能产业发展联盟当前重点逐渐从单点技术转化为实质应用转化阶段,而视觉人工智能已经泛起干层巨浪。

搭载 A 技术的机器视觉可以进一步优化性能适配更多工业应用场景。

一是深度学习为机器视觉延伸出多元的模型架构以及对应性能提升,如生成对抗网络(GAN)能够通过生成器和鉴别器的对抗训练,在生成图像方面的能力超过其他方法;注意力机制中的ViT 则将 Transformer 架构直接应用到一系列图像块上进行分类任务,减少大量所需的预训练资源,即用于在图像处理方面;在人工智能算法的不断训练和学习下,图像识别误差不新缩小,结合机器视觉设备在工业制造中能够发挥优异作用。

二是 AI 技术可以对不同工程问题和工程参数进行建模,利用所采集的高质量数据进行模型的机器学习,模型与机械设备和生产现状深度绑定,以此为基础开发智能系统,继而产生即时可变的、可保持最优化的生产参数,最后交给基础自动化执行、实现机械化-自动化-数字化-智能化的全面升级。

三是 AI 倒逼芯片算力持续提升,计算光学成为下一代机器视觉的突破口,依托算法的升级突破传统光学成像器件,进一步缩小设备尺寸,挖掘多样复杂的图像信息,推动机器视觉技术在工业场景中的进一步普及。

图3:人工智能与机器视觉的融合发展方向

资料来源:长虹AI实验室,陈佛计等《生成对抗网络及其在图像生成中的应用研究综述》

2.3 Meta发布SAM开启机器视觉GPT时刻

Segment Anything Model (SAM)项目是一个用于图像分割的新任务、模型和数据集。在数据收集循环中使用高效模型构建了迄今为止最大的分割数据集,在 1100 万张授权和尊重隐私的图像上有超过 11 亿个掩码。该模型被设计和训练为可提示的,因此它可以将零样本迁移到新的图像分布和任务。当该模型进行充分的网络语料训练后,发现其零样本性能甚至优于调整模型 ( Fine-tuned models )。

SAM 通过“提示学习”技术对新数据集和任务进行零样本和少样本学习。Meta 研究者提出了 promptable 分割任务,目标是在给定任何分割提示时返回有效的分割掩码。提示符只是指定要在图像中分割的内容,例如,提示符可以包括识别对象的空间或文本信息。有效输出掩码的要求意味着,即使提示是模糊的,并且可能指向多个对象(例如,衬衫上的一个点可能表示衬衫或穿着它的人 ,输出也应该是其中至少一个对象的合理掩码。将提示分割任务作为预训练目标,并通过提示工程解决一般的下游分割任务。

图4:SAM任务详情

资料来源:Alexander Kirillov等著《Segment Anything》

SAM 由一个的图像编码器、一个提示编码器和一个预测分割掩码的掩码解码器组成。

通过将 SAM 分离为图像编码器和提示符快速编码器/掩码解码器,相同的图像嵌入可以在不同的提示符中重用(及其成本分摊)。给定图像嵌入,提示编码器和掩码解码器在 web 浏览器中从提示符预测掩码的时间为 50ms。重点关注点、框和掩码提示,还用自由形式的文本提示呈现初步结果。为使 SAM 具有歧义性,设计了它来为单个提示预测多个面具,使 SAM 能够自然地处理歧义,如衬衫和人的例子。

图5:SAM模型结构

资料来源:Alexander Kirillov等著《Segment Anything》

SAM 有望助力机器视觉发展,带动 AI+制造业垂直领域技术革新。

SAM 已经学会了关于物体的一般概念,并且它可以为任何图像或视频中的任何物体生成掩膜,甚至包括在训练过程中没有遇到过的物体和图像类型,无需额外的训练。Meta 预计,与专门为一组固定任务训练的系统相比,基于 prompt 工程等技术的可组合系统设计将支持更广泛的应用。SAM可以成为 AR、VR、内容创建、科学领域和更通用 AI 系统的强大组件。比如 SAM 可以通过 AR 眼镜识别日常物品,为用户提供提示;SAM 还有可能在农业领域帮助农民或者协助生物学家进行研究。

图6:SAM可通过AR眼睛识别日常物体;图7:SAM在生物学应用

资料来源:数字经济先锋号公众号

 

更多精彩内容请关注公众号:BFT机器人
本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/663549.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

全网超全,接口自动化测试实战总结详全,这几个阶段你知道吗?

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 接口自动化根本目…

【深入浅出 Spring Security(十)】权限管理的概述和使用详情

权限管理 一、授权的核心概念二、权限管理策略权限表达式(SpEL Spring EL)1. 基于 URL 的权限管理(过滤器)基本用法 2. 基于 方法 的权限管理(AOP)EnableGlobalMethodSecurity基本用法 三、权限管理之版本问…

游戏中用脚开飞机实现方案

看看这个图片,有人用脚开飞机,用几个踏板去控制,在游戏中,开飞机的操作比较简单,上升,下降,加减油门,方向左,方向右。 android设备中,使用模拟点击就可以实现…

好用的电容笔有哪些推荐?apple pencil的平替笔测评

随着平板电脑在校园、办公室中的应用越来越广泛,需要一种具有良好性能的电容笔。苹果品牌原装的这支电容笔,虽然功能很强,但因为其的价格实在是太贵了,所以只是用来学习记笔记,实在是太浪费了。所以,哪个电…

python接口自动化(一)--什么是接口、接口优势、类型(详解)

简介 经常听别人说接口测试,接口测试自动化,但是你对接口,有多少了解和认识,知道什么是接口吗?它是用来做什么的,测试时候要注意什么?坦白的说,笔者之前也不是很清楚。接下来先看一下…

计算机网络——自顶向下方法(第一章学习记录)

什么是Internet? 可以从两个不同的方面来理解Internet。(它的构成。它的服务) 1.因特网的主要构成 处在因特网的边缘部分就是在因特网上的所有主机,这些主机又称为端系统(end system),端系统通过因特网服…

openEuler+Linaro合作成果展示|2023开放原子全球开源峰会

2023年6月11~13日,2023年开放原子全球开源峰会(OpenAtom)在北京经济开发区北人亦创国际会展中心召开,本届峰会旨在搭建全球开源生态发展合作交流平台,聚焦开源生态建设发展,并组织了openEuler、…

STL容器——unordered_set的用法

0、概述 unordered_set容器,可直译为无序 set 容器。即 unordered_set容器和 set 容器很像,唯一的区别就在于 set容器会自行对存储的数据进行排序,而 unordered_set 容器不会。下面是set、multiset和unordered_set之间的差别。 注意这三种集…

计算机网络管理 SNMP协议实用工具MIB Browser的安装和使用

⬜⬜⬜ 🐰🟧🟨🟩🟦🟪(*^▽^*)欢迎光临 🟧🟨🟩🟦🟪🐰⬜⬜⬜ ✏️write in front✏️ 📝个人主页:陈丹宇jmu &am…

qt常用基本类

文章目录 点直线时间相关的类 qt里面打印log或者打印东西&#xff0c;自带打印函数qDebug 里面<<插入操作符可以写任意类型 qDebug()<<"im ssss"<<520; //默认给你带换行//也能加endl&#xff0c;那就多换一行并不是说printf或者cout就不能用了…

[进阶]Java:阶段项目02——首页、登录、客户操作页

代码演示&#xff1a; public class MovieSystem {/*** 定义系统的数据容器用户存储数据* 1.存储很多用户&#xff08;客户对象&#xff0c;商家对象&#xff09;*/public static final List<User> ALL_USERS new ArrayList<>();/*** 2.存储系统全部商家和其排片…

Zebec Protocol 与 PGP 深度合作,将流支付更广泛的应用于薪资支付领域

Zebec Protocol 与 PGP 深度合作&#xff0c;将流支付更广泛的应用于薪资支付领域 随着传统机构的入局&#xff0c;以及相关加密合规法规的落地&#xff0c;加密支付正在成为一种备受欢迎的全新支付方式。加密支付基于区块链底层&#xff0c;不受地域、时间等的限制&#xff0c…

网络安全 log4j漏洞复现

前言&#xff1a; log4j被爆出“史诗级”漏洞。其危害非常大&#xff0c;影响非常广。该漏洞非常容易利用&#xff0c;可以执行任意代码。这个漏洞的影响可谓是重量级的。 漏洞描述&#xff1a; 由于Apache Log4j存在递归解析功能&#xff0c;未取得身份认证的用户&#xff…

Gof23设计模式之简单工厂/静态工厂模式

在java中&#xff0c;万物皆对象&#xff0c;这些对象都需要创建&#xff0c;如果创建的时候直接new该对象&#xff0c;就会对该对象耦合严重&#xff0c;假如我们要更换对象&#xff0c;所有new对象的地方都需要修改一遍&#xff0c;这显然违背了软件设计的开闭原则。如果我们…

工地临边防护缺失识别检测算法 opencv

工地临边防护缺失识别检测系统通过opencvpython网络模型技术&#xff0c;工地临边防护缺失识别检测算法检测到没有按照要求放置临边防护设备时&#xff0c;将自动发出警报提示现场管理人员及时采取措施。Python是一门解释性脚本语言&#xff0c;是在运行的时候将程序翻译成机器…

PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR飞桨实验

引言&#xff1a; PaddleOCR 是一个 OCR 框架或工具包&#xff0c;它提供多语言实用的 OCR 工具&#xff0c;帮助用户在几行代码中应用和训练不同的模型。PaddleOCR 提供了一系列高质量的预训练模型。这包含三种类型的模型&#xff0c;使 OCR 高度准确并接近商业产品。它提供文…

SPI(Serial Perripheral Interface)

SPI全称是Serial Perripheral Interface&#xff0c;也就是串行外围设备接口。SPI是Motorola公司推出的一种同步串行接口技术&#xff0c;是一种高速、全双工的同步通信总线&#xff0c;SPI时钟频率相比I2C要高很多&#xff0c;最高可以工作在上百MHz。SPI以主从方式工作&#…

Fiddler抓包工具之Fiddler+willow插件应用

安装 Fiddler的安装包地址&#xff1a;fillderwillow 解压后安装fiddler4和willow1.4.*版本。 安装成功后&#xff0c;启动fiddler后会出现willow插件按钮&#xff1a; 说明安装成功。 重定向 willow重定向 进入willow界面后&#xff0c;通过右键->Add Project ->Add R…

Compose 嵌套滑动冲突的解决办法

前言 在最近我利用业余时间使用 Compose 写的 Gihub APP 中&#xff0c;它的首页结构是这样的&#xff1a; 采用了 Drawer 嵌套 Pager 的结构。 这就会出现一个问题&#xff0c;那就是 Drawer 和 Pager 都需要监听横向滑动手势&#xff0c;从而实现展开 Drawer 和 切换 Pager…

C#TryCatch用法

前几天一个学员在学习C#与TryCatch用法时,也不知道TryCatch用法装可以用来做什么 。下面我们就详细讲讲C# 和封TryCatch用法相关知识。 C# 是一种通用、类型安全且面向对象的编程语言&#xff0c;由微软开发并在 .NET 平台上运行。TryCatch 是 C# 语言中的一个结构&#xff0c…