行业报告|3D感知技术快速发展,打造“机器之眼”,助推各行业加速升级!

news2025/1/13 13:22:22

原创 | 文 BFT机器人 

图片

01

3D视觉感知全栈式平台,硬核实力蓄势待发

1.1 3D视觉感知为“机器之眼”,未来市场空间广阔

3D视觉感知技术充分弥补了2D成像技术的以上不足,可获取空间几何尺寸信息。

过去数十年2D成像技术蓬勃发展,分辨率从几十万像素发展到现在的上亿像素,色彩还原更真实,逆光环境下也能通过HDR技术提升图像质量。

然而,2D图像仅能够提供纹理无法提供实现更精准识别、追踪等功能所需的空间形貌、几何尺寸、位姿等信息。

3D视觉的本质是将光源发射到物体再反射回来,根据图像传感器拍摄的画面计算每个图像的变形量或者根据反射回来的时间计算出距离,形成深度图和点云图,再经算法重现1:1还原的3D模型。有了这些信息作为基础,应用场景会大大增多,性能也会大幅提升。

图片

3D视觉感知技术逐步在消费级、工业级等领域应用,经历了以下几个阶段:

(1)技术启蒙期:3D视觉感知技术最早应用于工业领域,主要用于工业设备与零部件的高精度三维测量以及物体、材料的微小形变测量等,代表产品如德国高慕公司(GOM)的ATOS系列三维扫描仪等,用于工业级的设备通常成本高、体积大、功耗高,该阶段应用普及缓慢。

(2)技术起步期:随着底层元器件、核心算法等的快速发展,3D视觉感知技术不再拘泥于工业领域,逐步向消费领域推广,如微软2010年发布的Kincect、英特尔2013年发布的RealSense、奥比2015年发布的Astra,该阶段国内外共振助力3D视觉感知发展。

(3)技术发展期:前两个阶段发布的产品大多聚焦在三维建模、人机交互等领域,随着3D视觉感知技术的进一步迭代与优化,也逐渐向对成本、功耗、体积等要求更加严格的应用领域拓展,比如智能手机、移动支付、AIoT等。

(4)技术爆发期:随着底层元器件和核心算法的不断更迭,3D视觉感知技术逐步人工智能化,消费级应用产品也不断向高端化发展,如2020年苹果在iphone 12pro上搭建了基于dToF技术的Lidar扫描仪,谷歌于2020年在凤凰城推出无人驾驶租车服务等,3D视觉感知进入快速增长时期。

图片

2025年全球3D成像和传感市场规模达150亿美元,市场空间广阔。随着2D成像逐步向3D视觉感知升级,3D视觉感知市场处于规模快速增长的爆发前期,3D成像和传感市场受到传感器、发射器、光学元件、模块技术发展和研发工作推动,目前3D成像和感知朝着多样化、智能化方向发展,未来将各领域共同放量。

根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告,2019年全球3D视觉感知市场规模为50亿美元,且市场规模将快速发展,预计在2025年达到150亿美元,2019-2025年CAGR约为20%。

3D视觉赛道千亿市场多领域开花,消费电子和汽车领域增速领衔。根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告显示,3D视觉感知市场主要由消费电子、工业、医疗、汽车及消费电子领域组成,到2025年其细分板块占3D感知市场的比分别为54%、11%、2%、8%和25%,消费电子和汽车的增速较高。

未来随着像素内混合堆叠(in-pixel hybrid stacking)、激光雷达光源由近红外光(NIR)慢慢移动到短波红外线(SWIR)等技术的发展与渗透,将会有越来越多新兴产业进入3D视觉感知市场,比如3D打印设备、人形机器人、虚拟现实混合等,值得期待。

图片

1.2 深耕3D视觉感知,以技术为核心打造全栈式平台

3D视觉感知经过近十年的不断探索、研发及应用,已形成完善的产业化链条。其中,上游主要是3D传感器硬件供应商,主要由深度引擎芯片、光学成像模组、激光投影模组以及其他电子器件、结构件等构成,公司自主研发生产专用感光芯片和传感器模组。

中游是3D视觉感知方案供应商,主要是基于深度引擎算法结合应用进行各类3D视觉传感器的方案设计,其中部分3D视觉感知方案商已具备完整的3D视觉感知方案的能力,如苹果、微软、英特尔、华为、奥比中光等。

下游主要是应用算法供应商,如图像分割/增强优化算法、和VSLAM算法等;应用终端则有消费电子、生物识别等领域。

图片

(1)双目:类似于人眼,通过两个摄像头同时拍摄一个物体,然后利用计算机算法计算两个摄像头之间的视差(两个摄像头同时拍摄同一个物体时,物体在两个图像上的位置是有差异的),从而获取物体的深度信息。双目比较依赖于自然光,且无法处理无纹理的物体。

(2)结构光:通过投射仪主动发射一束光源(通常是红外光束),通过光学元件形成一束带有条纹编码的光,打到物体上反射回来的光由于物体的形状不同导致带编码光束产生不同的变形,通过分析这种畸变的大小和形状可以获取物体的深度信息。结构光适用于近距离,随着距离变远精度和分辨率都会变差,且容易收到环境光的干扰。

(3)ToF:相机通过打出一束光(通常是红外线光束)到目标物体上,这束光经物体反射回来,相机的光电二极管阵列接收反射光,并测量光的时间飞行(ToF)从而获取物体的距离信息。测量时间飞行的方式有两种,一种是dToF即直接计算光束飞行的时间(发射与接收到的时间),一种是iToF即间接测量光束飞行的时间,iToF是通过计算前后发出的两束光的相位差来得到光飞行的时间。ToF的分辨率不高,但是对光有抗干扰能力。

(4)Lidar:目前激光雷达的测距方法ToF、相干法和三角法等,其中三角法较为常用,是指一束光发射至物体表面,激光在物体表面发生反射和折射,在另一角度利用透镜对反射激光汇聚成像,光斑成像在CCD位置传感器上。当被测物体沿激光方向发生移动时,位置传感器上的光斑将产生移动,其位移大小对应被测物体的移动距离,以此来计算物体距离。

(5)工业三维测量:通过特定光源将有光学编码的图案投射到被测物体上,通过分析物体表面变形的光学图案,利用相机标定等方法获得特定光源和相机的位姿关系,采用三角测量法获得物体表面的空间三维信息,最终获得待测物体表面的点云数据。

图片

不同应用领域或场景对3D视觉的测量范围、测量精度、尺寸和功耗等性能要求均不同。其中结构光、iToF、双目、dToF、Lidar主要是运用于消费级应用场景的技术,其中结构光和双目的分辨率较高,更多适用于手机前置和机器人等领域。

ToF技术的抗干扰性和视角较宽,但分辨率较低,更多用于手机后置、扫地机器人等对分辨率要求没有那么高的领域。


工业三维测量则是专用于工业领域,适用于高精度工业测量、材料和结构的测量,其分辨率和测量精度都极高。

图片

1.3 芯片到算法全线技术打造消费级应用设备,产品性能一流

3D视觉传感器的深度引擎芯片具备更快更精确的计算能力,公司具备定制化生产能力。3D视觉传感器主要由结构件外壳、激光投影/RGB成像/感光芯片的IR成像等模组、衍射光学元件、感光芯片、深度引擎芯片等组成,深度引擎芯片具备更快的计算效率以及更精确的计算能力,是实现3D视觉传感器由实验室走向量产、产品化的核心。

图片

在消费级具备全线系统设计、芯片设计、光学设计、软件开发和量产的能力。消费级3D视觉感知技术先进性体现在以下几个方面:

(1)系统设计能力:公司依托从底层到上层技术的全栈式布局,在系统设计时可以更好地进行深入优化与融合,使得系统设计更加合理。


(2)芯片设计能力:公司的芯片团队具备数字及模拟芯片的研发实力,目前已成功完成四代深度引擎芯片、两款iToF感光芯片、两款dToF感光芯片的开发。

(3)算法研发上布局了深度引擎和消费场景多种算法。

(4)公司可以依据客户要求提供定制化光学产品。

(5)二次软件开发包SDK使得客户二次开发更为便利。

(6)量产组装能力。

图片

1.4 工业级3D视觉感知技术先进,国产替代进行时

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

三维测量一直是工业领域不可或缺的技术环节,通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量,细致、精确、快速获取,结合全局自动拼接技术,可以实现几十米超大工件的快速高精度测量。

02

原有下游稳固,新兴科技应用场景助推发展

2.1 引领服务机器人3D视觉感知市场,人形机器人再续航

机器人视觉相比工业视觉对深度引擎芯片、3D建模算法、分辨率和集成度的要求更高。

机器人视觉和机器视觉都属于计算机视觉,机器视觉通常用于工业,工业视觉的核心是以光学设备+控制系统+执行机构,代替人眼来完成生产制造中的识别、测量、定位、检测等工作,场景单一,对集成度、算力要求较低。

而机器人视觉则需要将机器人对运动场景、物体位置、物体形状实时计算,场景非常复杂,因此对于应用算法、分辨率和物体建模的要求较高,且机器人的体积较小,视觉传感器需要高度集。

图片

预计2027年我国机器视觉市场(包含2D平面图像和3D视觉)预计达560亿,其中3D视觉市场规模接近160亿元。

依据《2023机器视觉产业发展蓝皮书》显示,预计到2026年服务机器人产量有望达27万台,CGAR超27%。

目前来看,更多服务机器人配备2-4台传感器,其中以3D视觉传感器为主。预计未来几年,单台服务机器人搭载的传感器数量有望提升,传感器需求的复合增速超30%。

到2026年传感器需求量有望接近80万台,其中3D视觉传感器占比接近80%,未来市场空间广阔。

图片

多家厂商推出的人形机器人采用了3D视觉感知方案,人形机器人市场空间巨大。

今年以来,以GPT为代表的大模型快速发展,催生了人工智能产业新浪潮,具身智能机器人将成为人工智能终极形态。视觉能力各类智能终端的“眼睛”,是智能终端人机交互中不可或缺的关键一环,尤其是人形机器人,要更加“像人”和“仿生”,视觉感知不可或缺。

目前已有多家厂商在人形机器人上采用了3D视觉感知方案,如小米的CyberOne全尺寸人形机器人和CyberDog2、宇树科技的H1等。公司3D视觉感知技术是为人工智能提供三维视觉能力的关键共性技术,也是科技创新领域的前沿技术之一。

图片

图片

2.2 3D打印应用场景加速推广,千亿赛道蓄势待发

我国3D打印行业整体处于成长期,与国外仍有一定的差距。

我国3D打印行业整体起步较晚,起源于20世纪90年代,以清华大学等高校的研究力量为主。

1994年国内首台自主知识产权的工业级3D打印设备研制成功,1998年卢秉恒团队研制出国内首台光固化快速成型机,3D打印行业持续产生新的突破。

随后2012年中国工程院开始对3D打印行业进行市场调研,2013年中国3D打印技术产业联盟成立,标志着国家层面开始重视。

2017年至今,国家出台多项政策,支持国内3D产业发展,新企业不断进入,行业发展进入增速较快的阶段。

图片

据预测,2026年我国3D打印行业规模可达1101.9亿元,行业进入高增速时期。

3D打印是实施制造强国战略的主攻方向之一,被视为引领新一轮科技革命和产业变革的核心技术之一,3D打印具有零技能制造、设计空间无限、减少废弃副产品等优点,目前已经在军工、医疗、教育、服饰、模具等领域尝试应用。

据预测,2021年3D打印的市场规模为265亿,预计2026年行业规模可达千亿,复合增长率接近26.79%,当前行业已经进入高速发展期。

图片

2.3 智能座舱渗透率提升,千亿市场前景广阔

汽车从被动驾驶转向主动交互,智能座舱是必经之路。据IDC统计,2023年1季度渗透率已达88.8%。

近年来,汽车已经从简单的交通工具逐渐向智能终端转变,汽车的座舱涉及理解和塑造人与车辆之间的交互,尤其是交互领域中的感觉、感知、信息交换和决策等内容,传统的行车更多的是被动过程,未来随着驾驶技术更加先进,驾驶人员将有更多的时间选择来做驾驶之外的任务,智能座舱则相当于主动式的驾驶过程。智能座舱通常包括操控系统、娱乐系统、通信系统、交互系统和智能感知系统。

图片

中国智能座舱为千亿赛道,硬件端对深度摄像头等3D视觉传感器需求高。

据ICVTank统计,2022年中国智能座舱市场规模739亿元,预计2025年可达1030亿元,多家企业纷纷入场,行业进入高速发展阶段。

智能座舱为交互开辟了新的途径,主动式的引入了智能座舱概念,因此,越来越多的传感器被整合到车辆中,参考理想的L9,智能座舱中包含1个激光雷达、1个高精度毫米波雷达、4个环视摄像头、7个外部感知摄像头、1个内部驾驶员监控摄像头等传感器,其中智能座舱的视觉上采用3D视觉传感将会把人机交互体验推向更完美的状态。

图片

2.4 工业测量领域技术持续完善,下游覆盖行业丰富

预计2026年我国工业视觉市场规模可达543亿元,应用领域广阔。

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量。

可应用于多种行业:汽车工业、航空航天工业、数码家电、文保文创及医学等。据甲子光年智库测算,2021年工业视觉市场规模为178亿,预计2026年可达543亿,市场规模持续放量。

图片

2.5 3D视觉感知助力AIOT和生物识别

(1)智慧生活系列:公司针对智慧零售、智慧农牧、智慧交通提出了3D视觉感知方案。

针对智慧零售,公司3D感知技术助力零售行业打造线上线下一体化的商业模式,实现消费市场提速升级,为传统零售店提供人体3D扫描、商品扫描识别等功能。

针对智慧农牧,公司提出了基于图像视频技术的猪只盘点、背膘测量等产品,解决猪场科学管理难题、提升管理效率、提高经济效益。


针对智慧交通,公司自研3D视觉感知技术赋能交通行业,实现交通客流统计分析智能化处理,形成高效、全面及3D数据为中心的智能交通决策系统,以推动智慧交通发展。

图片

(2)消费电子系列:针对家庭娱乐,公司结合人体骨架识别、AR抠图、人脸识别、物体识别等核心算法,打造“3D+AR”平台,覆盖亲子教育、家庭健身、互动娱乐、家庭看护等应用场景,目前公司家庭娱乐业务已覆盖全国多个省市。

为手机前置提供3D结构光解决方案,已为OPPO旗舰手机FindX定制开发超百万台3D视觉传感器;为手机后置提供iToF解决方案为魅族旗舰手机17Pro、18Pro定制开发ToF解决方案。

(3)生物识别:主要是刷脸支付、3D刷脸门锁、身份核验等解决方案。3D刷脸支付解决方案已在全国数百座城市普及,覆盖超市、药店、便利店等线下场景。

3D刷脸门锁门禁助力实现真3D智能门锁规模化量产,并在办公楼、商场、医院等多个场景广泛使用门禁产品。

提供于人脸识别的金融级KYC验证服务,通过身份信息录入、人脸活体检测、等可快速核验人员信息、分配人员权限等,可广泛应用于政府、医院、人才公寓、校园、产业园区等重要场所。

来源 | 国盛证券

排版 | 居居手

审核 | 柒柒

版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/944921.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【真题解析】系统集成项目管理工程师 2022 年上半年真题卷(案例分析)

本文为系统集成项目管理工程师考试(软考) 2022 年上半年真题(全国卷),包含答案与详细解析。考试共分为两科,成绩均 ≥45 即可通过考试: 综合知识(选择题 75 道,75分)案例分析&#x…

无涯教程-Android Studio函数

第1步-系统要求 您将很高兴知道您可以在以下两种操作系统之一上开始Android应用程序的开发- MicrosoftWindows10/8/7/Vista/2003(32或64位)MacOSX10.8.5或更高版本,最高10.9(小牛) GNOME或KDE桌面 第二点是,开发Android应用程序所需的所有工具都是开源的,可以从Web上下载。以…

TiDB 源码编译之 TiProxy 篇

作者: ShawnYan 原文来源: https://tidb.net/blog/3d57f54d TiProxy 简介 TiProxy 是一个基于 Apache 2.0 协议开源的、轻量级的 TiDB 数据库代理,基于 Go 语言编写,支持 MySQL 协议。 TiProxy 支持负载均衡,接收来…

SpringBoot笔记——(狂神说)——待续

路线 javase: OOPmysql:持久化 htmlcssjsjquery框架:视图,框架不熟练,css不好; javaweb:独立开发MVC三层架构的网站了∶原始 ssm :框架:简化了我们的开发流程,配置也开始较为复杂; war: tomcat运行 spring再简化: SpringBoot - jar:内嵌tomca…

【Grasshopper基础15】“右键菜单似乎不太对劲”

距离上一篇文章已经过去了挺久的,很长时间没有写GH基础部分的内容了,原因其一是本职工作太忙了,进度也有些落后,白天工作累成马,回家只想躺着;其二则是感觉GH基础系列基本上也介绍得差不多了,电…

保护网站安全:学习蓝莲花的安装和使用,复现跨站脚本攻击漏洞及XSS接收平台

这篇文章旨在用于网络安全学习,请勿进行任何非法行为,否则后果自负。 环境准备 一、XSS基础 1、反射型XSS 攻击介绍 原理 攻击者通过向目标网站提交包含恶意脚本的请求,然后将该恶意脚本注入到响应页面中,使其他用户在查看…

如何建设数据资产目录?

数据资产目录其实一个记录和管理组织内各种数据资产的清单或目录。它提供了对数据资产的基本信息和属性的可视化和查询能力,让组织能够更好的了解和利用自己拥有的数据资产。数据资产目录通常包括数据集的名称、描述、来源、格式、存储位置、更新频率等信息&#xf…

fatal: ServicePointManager 不支持具有 socks5 方案的代理。

报错 解决前 git config --global --list 查看git的设置 解决后 // 代理更改为http (7890是我的代理软件clash的port默认的,有些博客使用的是1080,依个人情况而定) git config --global http.proxy http://127.0.0.1:7890 git config --global https…

40、Thymeleaf的自动配置和基本语法、springboot 整合 Thymeleaf

★ Spring Boot支持如下模板技术: FreeMarkerGroovyThymeleafMustache官方推荐使用 ThymeleafJSP不再被推荐。★ Thymeleaf的优势 Thymeleaf标准方言中的大多数处理器都是属性处理器。这种页面模版即使在未被处理之前,浏览器也可正确地显示HTML模板文件…

听力总结易错点+口语准则

目录 听力总结易错点 where are you come from?其实是错的 杯子的大小表达 口语准则 一些常见蔬菜的英文名称: To get a lot out of 英语复述句子题 听力总结易错点 1,在section 1 ,很容易把a读成n 2. silver colored cloth 这个clo…

Spring PropertyEditor 使用案例

1. 继承 PropertyEditorSupport 重写 setAsText 方法 import java.beans.PropertyEditorSupport;public class StringToArrayEditor extends PropertyEditorSupport {Overridepublic void setAsText(String text) throws IllegalArgumentException {//接收Text的值并处理String…

Centos7本地安装Docker-compose

考虑github时常出现问题。以下内容是基于本地安装 安装包地址 文章参考链接 1、下载安装包上传包到/usr/local/bin 2、执行命令 # 修改权限 chmod x /usr/local/bin/docker-compose ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose3、验证是否安装成功 docker-…

内网环境搭建-前篇

通常所说的内网渗透测试,很大程度上就是域渗透测试。搭建域渗透测试环境,在Windows的活动目录环境下进行一系列操作,掌握其操作方法和运行机制,对内网的安全维护有很大的帮助。常见的域环境是使用Windows Server2012 R2、Windows7…

基于SpringBoot+Vue的大学生家教系统设计和实现

前言 💗全网粉丝10W、全栈领域优质创作者、掘金、阿里云等社区博客专家、专注于全栈领域和毕业项目实战💗 文章最下面有微信,获取完整源码和数据库,没有套路,没有套路,没有套路!!&am…

Java JDK各版本特性

一、Java 8 之前版本重要的特性 Java 8 之前版本中有一些重要特性和改进。以下是其中一些主要特性以及它们发布版本: Java SE 7(发布于2011年): Switch 字符串:允许在 switch 语句中使用字符串。泛型的类型推断&…

如何提高视频清晰度?视频调整清晰度操作方法

现在很多小伙伴通过制作短视频发布到一些短视频平台上记录生活,分享趣事。但制作的视频有些比较模糊,做视频的小伙伴应该都知道,视频画质模糊不清,会严重影响观众的观看体验。 通过研究,总结了以下几点严重影响的点 …

Opencv-C++笔记 (18) : 轮廓和凸包

文章目录 一、轮廓findContours发现轮廓drawContours绘制轮廓代码 二.几何及特性概括——凸包(Convex Hull)凸包概念凸包扫描算法介绍——Graham扫描算法 相关API介绍程序示例轮廓集合及特性性概括——轮廓周围绘制矩形框和圆形相关理论介绍轮廓周围绘制矩形 -API绘制步骤程序实…

如何使用ADX指标呢?10秒教会你

这是使用ADX大佬的收益结果,这是没有使用ADX技术指标的新手表情,事实证明只要会使用ADX指标,交易的结果就是令人可喜的,那么如何使用ADX指标呢?anzo capital昂首资本10秒教会你。 从评估价格方向、模式和水平开始技术分析。使用…

BingChat与ChatGPT比较,哪个聊天机器人能让你获益更多?

人工智能领域的最新进展为普通人创造新的收入来源提供了更多机会。今年早些时候,微软对OpenAI进行了大量投资。此后,微软在Microsoft Edge浏览器中推出了自家的聊天机器人Bing Chat。 在论坛和社交媒体上,你可以发现这两个AI工具都吸引了很…

C++之ifstream成员函数get、tellg、eof实例(一百八十五)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…