大模型+人形机器人,用AI唤起钢筋铁骨

news2024/11/24 8:33:32

3e161cedfa3dba0f9553226ce22b9b26.jpeg 《经济参考报》11月8日刊发文章《多方布局人形机器人赛道,智能应用前景广》。文章称,工信部日前印发的《人形机器人创新发展指导意见》,按照谋划三年、展望五年的时间安排,对人形机器人创新发展作了战略部署。

从开发基于人工智能大模型的人形机器人“大脑”,到打造仿人机械臂、灵巧手和腿足,再到发布自主研发的人形机器人产品.以“大模型”为代表的技术爆发加速了人工智能产业的发展。为了抓住这一轮技术变革的浪潮,促进区域以及产业发展,多个一线城市开启了“追逐赛”。以人工智产业发展高地北京为例,《北京市促进通用人工智能创新发展的若干措施(2023-2025年)》的发布是国内首个地方政府紧贴AI大模型产业化发展提出的专项措施。当下正值ChatGPT引发的“千模大战”打响,大模型可能为各行各业带来新的效率革命和体验升级。随着AI第一城北京行动了,上海、深圳、成都等地区都已陆续采取行动,抢占发展的“窗口期”。

人形机器人技术方案包括软件层和硬件层,后者可分为控制模 块、感知模块、运动模块、动力模块、散热总装模块。我们认为软件能力决定机器人产品 力的上限,硬件能力决定机器人的落地程度。目前 ChatGPT 预训练语言模型、PaLM-E 模型等 AI 技术和大模型的发展助力机器人向具身智能逼近,硬件技术方案实际类似搭积木 的过程,核心在于主机厂对成本和性能的权衡。

在今年特斯拉股东大会上,马斯克说到:“人形机器人Optimus对运动和力量的控制以及环境感知方面有显著加强,技术正在快速迭代。预计未来机器人的需求可能会达到100亿,甚至更多。如果以人类和机器人的比例为2:1推算,那么对人形机器人的需求可能会比电动汽车的还大不少。就凭借此寥寥数语,马斯克的信心、热情和投入很快点燃了人形机器人赛道的火焰,并有愈演愈烈的趋势至今。而从实际应用的角度来看,推动整个产业链走向成熟和完善的可能也是特斯拉。

从实际技术的角度来说,特斯拉这种企业做机器人有先天性优势,因为机器人与AI的很多基本原理都是相同的,而且也可以视为电动车的自然延伸,电动车可以视为第一代的四轮机器人。前两年马斯克提出要做机器人时引来不少说他“不务正业”的嘲讽,然而今年年初,理想汽车确定的愿景是成为最优秀的AI和机器人公司,而非全球最大的电动车企业。由此可见梦想也是会传播的。特斯拉的人形机器人Optimus首次亮相是在去年官方的2022 AI Day活动上,并在现场完成了自主行走、转身、停止、挥手问候等动作。Optimus的技术大部分与特斯拉汽车的一致,如机器视觉,以及处理视觉数据、做出行动决策、支持通信交流的“大脑”,还有最重要的与特斯拉汽车一致的芯片,还搭载与特斯拉车辆同源的FSD电脑以及Autopilot相关神经网络技术,预计最终售价不超2万美元,约合14.4万元人民币。

机器人自由度与量产成本为正相关关系,商业化进展较快机器人的共性在于,面向垂直化 场景且匹配了相应的自由度,成本适中能为市场接受。如 EVE 机器人专门用于安防和夜 间巡逻,其腿部为双轮结构,虽无法跨越障碍,但可满足夜间巡逻的基本需求,售价仅 32 万元。而特斯拉 Optimus 则依托汽车产业链优势平衡了机器人自由度与量产成本的矛盾, 能完成行走、上下落体、拿物体等商业化目标明确的动作,而量产后价格仅 2 万美元(目 标),是能完成行走、搬运物体同类机器人产品价格的 1/10。

人形机器人商业化的核心桎梏在于成本,而特斯拉的 FSD 产业 资源优势大概率会为 Optimus 商业化赋能:人形机器人与 FSD 在数据调度、数据处理、 算法模型等关键能力上具有较高共用性,如 Optimus 的硬件生产可共享特斯拉汽车的供应 链;Optimus 软件架构中可应用 FSD 的感知算法、规划控制模型(机器人的规控场景更复 杂),同时机器人涉及室内环境建模,可借鉴 FSD 的 3D 地图构建经验,综上我们认为 FSD 可迁移的成熟的软硬件能力或加速人形机器人商业化落地,具体表现为以下3点:

(1)车端算法迁移:Optimus 搭载特斯拉自研芯片(单芯片算力可达 362TFLOPs),也共享特斯拉汽车自动驾驶软件平台,我们看好特斯拉自身的自动驾驶技术赋能机器人的机器视觉算法、FSD 和 Dojo的数据积累和训练模型加快机器人功能优化,从而实现降本增效。具体而言,算法上,2022 年 AP 团队在原感知算法模型加入了占用网络 Occupancy Network 和矢量地图 Lane Network,进一步提升了感知模型的精度和对 Corner Case 的 覆盖度,Optimus 将会使用和 FSD 同样的 Occupancy Network 来识别可行动区域,或能 生成效果更好的 3D 地图,以弥补特斯拉未使用高精地图和雷达在长尾问题的感知不足。基础设施上,Dojo 超算中心为 FSD 大数据训练的关键,具有高稳定、高并行算力的特征,可提供更高效的数据标注和算法迭代,有望加强机器人的算法优势。

(2)供应链迁移:人形机器人由于硬件超配且关节数目多,量产成本较高,但机器人供 应链与电车供应链有较大重合度,如人形机器人能共用汽车的芯片、电池等,并能够对电 机电器、热管理等做适应性更改再使用。

我们看好 Optimus 与 FSD 供应链接轨、共享特斯拉国产供应链优势,实现规模化降低成本。站在当前时点,我们认为人形机器人已初步突破了软件领域的部分技术桎梏。

22 年 11 月 Open AI 发布 ChatGPT,并计划赋能机器人的零次任务规划、人机交互、视觉辅助、逻辑 判断功能,实现用语言文字控制机器人;23 年 3 月谷歌 PaLM-E 模型推出,融合了 ViT Vision Transformer 的 220 亿参数和 PaLM 的 5400 亿参数能力,集成了可控制机器人视 觉和语言的能力;23 年 5 月英伟达发布多模态具身智能系统 NVIDIA VIMA,标志 AI 能力 的又一显著进步,有望显著提升机器人的智能化水平、人机交互能力、自编译能力。

2023年或为产业化的当打之年:AI、大模型深度赋能机器人感知层和规划层,助力机器人更贴近具身智能。以微软 ChatGPT 预训练语言模型、谷歌 PaLM-E 模型、英伟达多模态具身智能系统 NVIDIA VIMA 为代表的 AI 技术突破,进一步助力机器人突破产品力上限。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1194862.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SQL优化之MySQL执行计划(Explain)及索引失效详解

1、执行计划基础 1.1、执行计划(Explain)定义 在 MySQL 中可以通过 explain 关键字模拟优化器执行 SQL语句,从而解析MySQL 是如何处理 SQL 语句的。 1.2、MySQL查询过程 客户端向 MySQL 服务器发送一条查询请求服务器首先检查查询缓存&am…

为什么我一直是机器视觉调机仔,为什么一定要学一门高级语言编程?

​ 为什么我是机器视觉调机仔,为什么一定要学一门高级语言编程,以后好不好就业,待遇高不高,都是跟这项技术没关系,是跟这个技术背后的行业发展有关系。 你可以选择离机器视觉行业,也可以选择与高级语言相关…

中国电信终端产业联盟5G Inside行业子联盟正式成立!宏电股份作为副理事单位受邀加入

11月9日,中国电信于广州召开“2023中国电信终端生态合作暨中国电信终端产业联盟(以下简称CTTA)第十四次会员大会”,联盟成员齐聚现场。作为CTTA大会的一个重要环节,中国电信终端产业联盟5G Inside行业子联盟正式成立&a…

LeetCode(5)多数元素【数组/字符串】【简单】

目录 1.题目2.答案3.提交结果截图 链接: 169. 多数元素 1.题目 给定一个大小为 n 的数组 nums ,返回其中的多数元素。多数元素是指在数组中出现次数 大于 ⌊ n/2 ⌋ 的元素。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。 示…

jenkins邮件告警

构建失败邮件通知 配置自己的邮箱 配置邮件服务,密码是授权码 添加构建后操作 扩展 配置流水线 添加扩展 钉钉通知 Jenkins安装钉钉插件 钉钉添加机器人 加签 https://oapi.dingtalk.com/robot/send?access_token98437f84ffb6cd64fa2d7698ef44191d49a11…

ios安全加固 ios 加固方案

​ 目录 一、iOS加固保护原理 1.字符串混淆 2.类名、方法名混淆 3.程序结构混淆加密 4.反调试、反注入等一些主动保护策略 二 代码混淆步骤 1. 选择要混淆保护的ipa文件 2. 选择要混淆的类名称 3. 选择要混淆保护的函数,方法 4. 配置签名证书 5. 混淆和测…

原型模式(创建型)

一、前言 原型模式是一种创建型设计模式,它允许在运行时通过克隆现有对象来创建新对象,而不是通过常规的构造函数创建。在原型模式中,一个原型对象可以克隆自身来创建新的对象,这个过程可以通过深度克隆或浅克隆来实现。简单说原型…

【Java SE】类和对象(上)

目录 一. 面向对象的初步认知 1.1 什么是面向对象 1.2 面向对象与面向过程 二. 类定义和使用 2.1 简单认识类 2.2 类的定义格式 三. 类的实例化 3.1 什么是实例化 3.2 实例化对象 四. this引用(重点) 4.1 为什么要有this引用 4.2 this的使用 4.3 this引…

lua环境安装

文章目录 Linux 系统上安装Mac OS X 系统上安装Window 系统上安装 Lua第一个 Lua 程序 Linux 系统上安装 Linux & Mac上安装 Lua 安装非常简单,只需要下载源码包并在终端解压编译即可,本文使用了5.3.0版本进行安装: curl -R -O http://…

openMMLab的mmcv和mmdet、mmdet3d、mmseg版本对应关系

openmmlab提供了MIM来统一安装其多个mm功能框架包https://github.com/open-mmlab/mim,但是需要不借助MIM安装时,这里怎么确定要安装什么版本的mmcv和mmdet、mmdet3d、mmseg,在openmmlab网站主页上没有一个容易能找到的完整表格页面来详细记录…

Dell戴尔灵越Inspiron 7700 AIO一体机电脑原厂预装Windows10系统

链接:https://pan.baidu.com/s/1-slgR9t4Df_eko0Y6xaeyw?pwdmk0p 提取码:mk0p 灵越7700一体机原装出厂系统自带声卡驱动、无线网卡驱动、面部识别等所有驱动、出厂主题壁纸、系统属性专属LOGO标志、Office办公软件、MyDell等预装程序 由于时间关系,…

GF0-57CQD-002 测量参数:加速度、速度、位移–现场可配置

GF0-57CQD-002 测量参数:加速度、速度、位移–现场可配置 GF0-57CQD-002 是一款创新的双通道变送器,专为精确的振动测量而设计。它激励并读取来自加速度计的信号,并将整体振动值作为电流/电压信号传输。它测量加速度、速度和位移等不同参数的振动。配置…

HTTP和HTTPS详解

一)什么是HTTP协议 1)HTTP协议是倾向于相遇业务层次上面的一种协议,传输层协议主要考虑的是端对端之间的一个传输过程,TCP重点进行关注的是可靠传输;咱们的HTTP/1,HTTP/2是基于TCP的,但是咱们的HTTP/3是基于UDP的&…

【优选算法系列】【专题五位运算】第二节.371. 两整数之和and137. 只出现一次的数字 II

文章目录 前言一、两整数之和 1.1 题目描述 1.2 题目解析 1.2.1 算法原理 1.2.2 代码编写二、只出现一次的数字 II 2.1 题目描述 2.2 题目解析 2.2.1 算法原理 2.2.2 代码编写总结 前言 一、两整数之和 …

故障诊断模型 | Maltab实现RF随机森林的故障诊断

效果一览 文章概述 故障诊断模型 | Maltab实现RF随机森林的故障诊断 模型描述 RF善于处理高维数据,特征遗失数据,和不平衡数据 (1)训练可以并行化,速度快 (2)对高维数据集的处理能力强,它可以处理成千上万的输入变量,并确定最重要的变量,因此被认为是一个不错的降…

【overleaf参考文献引用】Citation `r51‘ on page 1 undefined on input line 46

overleaf 编辑插入参考文献出现如下问题: 显示如下:连着三个参考文献有一个显示为问号,latex的错误如上: Citation r51 on page 1 undefined on input line 46 问题原因: 在文档的第一页(Page 1&#xff0…

ElasticSearch7.x - HTTP 操作 - 查询文档操作

查询索引下的所有文档 http://192.168.254.101:9200/shopping/_search 条件查询 请求路径上添加条件:http://192.168.254.101:9200/shopping/_search?q=category:小米 请求体上添加条件:http://192.168.254.101:9200/shopping/_search 请求体内容 {"query" :{&qu…

Linux 部署Sentinel控制台

Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件,主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。 1.版本选择 SpringCloudAlibaba SpringClo…

uniapp+uviewPlus+vue3+ts+pinia+vite+echarts 开发基础模板,开箱即用,非常顺手

github仓库地址:https://github.com/Sjj1024/uniapp-vue3 使用 uniapp vue3 ts pinia vite echarts 开发基础模板,拿来即可使用,不要删除 yarn.lock 文件,否则会启动报错,这个可能和 pinia 的版本有关&#xff0…

k8s存储

nfs 理论上nfs 其实并不是存储设备,它是一种远程共享存储服务。 k8s 存储卷 volume emptyDir:可以实现pod中的容器之间共享数据, 但是存储卷不能持久化数据,且会随着pod的生命周期一起删除。 hostpash:可以实现持久…