通用机器人里程碑?谷歌展示全球首个多任务AI智能体

news2024/11/15 16:03:03

目录

  • 两大硬核科技支撑通用机器人研发
    • (1)自生成训练数据
    • (2)基于多模态模型
  • 科技巨头同台比拼 中国产业链凸显性价比优势
  • 发展初期硬件先行 运动模块价值量最高

已学会套圈、搭积木、抓水果……

人工智能和机器人,总是不可避免地产生交集:前有人形机器人Optimus在特斯拉AI日横空出世,后有OpenAI投资挪威人形机器人公司1X。如今,谷歌旗下的AI团队DeepMind也放出大招,当地时间6月20日,DeepMind展示了用于机器人的AI智能体“RoboCat”。
在这里插入图片描述
谷歌称之为机器人智能体(robotic agent),本质上是由AI赋能的软件程序,相当于机器人的“大脑”,由其加持的机器人与传统机器人不同之处在于,RoboCat机器人更具“通用性”,并可实现自我改进、自我提升

DeepMind称,RoboCat是全球第一个可以解决和适应多种任务的机器人AI智能体,并且它可以在各类真实的机器人产品上完成这些任务,“RoboCat的快速学习能力减少了对人类监督训练的需求,是朝着创建通用机器人迈出的重要一步。”

两大硬核科技支撑通用机器人研发

(1)自生成训练数据

据DeepMind的介绍,只需要通过100次左右的演示,RoboCat就可以学会操控机械臂来完成各式各样的任务,然后通过自生成的数据来进行迭代改进。要知道,构建通用机器人的进展速度较慢,部分原因是收集真实世界的训练数据需要时间。

在DeepMind演示视频中,RoboCat可已经以通过自主学习操控机械臂,完成“套圈”“搭积木”“抓水果”等任务。这些任务看似简单,但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。目前RoboCat完成一项新任务的成功率已经从初期的36%提升至74%。

值得注意的是,不论是它操控的机械臂还是它要完成的任务,RoboCat之前从来没见过。

这种“通用性学习能力”对于加快机器人领域的研究有重要意义。DeepMind认为,RoboCat独立学习技能、快速自我提升的能力,以及对于不同硬件设备的快速适应能力,将对新一代通用机器人AI智能体的发展起到重要推动作用。

(2)基于多模态模型

RoboCat用到的关键技术之一,是一种多模态模型Gato,而Gato在西班牙语里意为“猫”(cat),这也是“RoboCat”这一命名的由来之一。

Gato模型可以在模拟环境和物理环境中处理语言、图像和动作,研究人员将Gato的架构与一个大型训练数据集进行了结合,这个数据集包含100-1000个各种机械臂完成任务的演示。

基于原始数据集和新训练产生的数据,RoboCat的数据集将包含数百万次的训练轨迹数据。它学习的新任务越多,它就能更好地学习和解决额外的新任务。

在这里插入图片描述
在这里插入图片描述
依托于多模态模型,RoboCat完成现实世界训练任务的成功率要远高于传统基于视觉的模型方案

科技巨头同台比拼 中国产业链凸显性价比优势

其实,在生成式AI风靡全球之前,特斯拉、亚马逊、英伟达、腾讯等众多科技巨头已经划拨了专门团队进行机器人研发。该阶段,机器人智能化水平不足,难以商业化。

如今,AI加持的机器人化身具身智能,再次焕发生机。一方面,AI大模型的出现以及多模态技术的迭代,使得机器人具备自然语言交互与自动化决策能力,大大提升其智能化水平、增强用户体验感;另一方面,工程师也可以通过AI对其进行肢体的模拟训练,大大降低了其开发成本。

谷歌RoboCat只是AI赋能机器人的优秀案例之一。仅将视线聚焦在今年:2023年年初,谷歌推出视觉语言模型PaLM-E,并运用到工业机器人上;4月份阿里巴巴将千问大模型接入工业机器人;5月,特斯拉人形机器人Optimus展示了精准的控制、感知能力,同月英伟达发布全新自主移动机器人平台。

再结合OpenAI投资挪威人形机器人公司1X,以及三花智控与绿的谐波在墨西哥合资设立谐波减速器公司,近期多家机构认为AI+机器人已经到达产业爆发前夜

招商证券分析师胡小禹预计Optimus在未来2-3年内会进入量产阶段。如果以100亿台空间以及2万美元单机售价测算,市场空间200万亿美元。另据高盛的研究报告,人形机器人市场规模有望在2035年超过1500亿美元

中银证券分析师陶波称,国产机器人产业链有望在自动化、智能化的浪潮中,凭借产品性价比优势获得广阔的发展空间。

发展初期硬件先行 运动模块价值量最高

中信证券分析师袁健聪表示,OpenAI、腾讯、小米、谷歌、英伟达等科技企业持续加注机器人领域,推动机器人技术创新与降本量产进程加快,机器人目前处发展初期,存在“硬件先行”规律

机器人硬件主要包括控制、感知、运动、动力、散热和总装五大模块,运动模块价值量最高。根据Ofweek机器人网,工业机器人运动模块约占整体成本的47%。

以人形机器人为代表的AI机器人相较工业机器人结构更为复杂,运动模块的成本相应更高。以特斯拉的人形机器人Optimus为例,其运动模块和部分感知模块被整合为一体化关节,这部分成本占比高达整机的50%。基于此,广发证券分析师代川及华泰证券分析师倪正洋均看好一体化关节投资价值。

在这里插入图片描述
据不完全梳理,一体化关节方面的具体A股公司包括:

减速器:谐波减速器(绿的谐波、丰立智能、汉宇集团、双环传动、国茂股份、昊志机电)、RV减速器(中大力德、双环传动、秦川机床、巨轮智能、上海机电)。绿的谐波为国内谐波减速器龙头,市占率达40%,中大力德、国茂股份等企业在各自减速机细分领域也较为领先;

电机:无框力矩电机(步科股份、昊志机电)、空心杯电机(鸣志电器、鼎智科技、江苏雷利、伟创电气)。汇川技术和禾川科技为国内伺服产品主要供应商,也有直驱电机相关产品及布局;

丝杠:鼎智科技、秦川机床、恒立液压。该领域海外高度垄断,国内处于起步阶段,以中国船舶704所、博特精工、思科瑞传动、仲孚机械等为代表的非上市公司率先崭露头角;上市公司中鼎智科技微型行星滚柱丝杆的研发与生产上已有里程碑式达成;

传感器:汉威科技、柯力传感、保隆科技。传感器下游细分领域多,全球竞争集中,以基恩士为代表的龙头企业才易具有规模效应。本土企业逐渐在汽车、仪器仪表、工业互联网等领域打开工业领域国产化的大门。

文章素材来源网络,如有侵权,请联系删除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/712347.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MES生产管理系统与ERP系统的集成以及优势

导言: 在当今数字化转型的浪潮中,企业越来越意识到整合各个部门的数据和流程的重要性。MES生产管理系统和ERP系统是两个关键的管理工具,它们在企业中发挥着不可或缺的作用。本文将探讨企业MES管理系统与ERP系统进行集成,以及这种…

它如何做到让我们持久且不感疲劳

写在前面 随着科技的进步和数字化生活的兴起,人们长时间使用显示器的需求增加,越来越多的人戴眼镜并且面临眼睛问题。显示器屏幕灯在当今社会也逐渐扮演着不可或缺的角色。 首先,显示器屏幕灯能够提供必要的亮度,确保我们在各种…

pyhton-docx表格合并单元格

合并单元格需要指定两个单元格, from docx_utils import set_table_singleBoard from docx import Documentdocument Document() table document.add_table(rows3, cols3) # 创建一个包含 3 行 3 列的表格 table.cell(0, 0).merge(table.cell(0, 1)) # 合并第一…

用正则表达式进行input框的限制输入

vue项目可以用input事件输入 1.限制input输入框只能输入大小写字母、数字、下划线的正则表达式&#xff1a; 用户名< input type"text" placeholder"只包含数字字母下划线" onkeyup"this.valuethis.value.replace(/[^\w_]/g,);"> 2.限…

linux如何修改sudoers文件,将非root用户加入到 sudoers 文件中

需求 由于在非 root 用户下执行 sudo 命令会报错 cc 不在 sudoers 文件中。此事将被报告。所以需要将 cc 这个用户加入到 sudoers 文件中进行授权 解决 要修改 sudoers 文件&#xff0c;您需要以 root 用户身份进行操作。以下是一种常见的方法&#xff1a; 1、使用 root 用…

Linux文件管理(创建 删除 复制 剪切 打包 压缩 解压缩)全总结

目录 一、Linux下文件命名规则 1、可以使用哪些字符&#xff1f; 2、文件名的长度 3、文件名的大小写 4、Linux文件扩展名 二、Linux下的文件管理 1、文件夹创建 ① mkdir创建文件夹 ② mkdir -p递归创建文件夹&#xff08;目录&#xff09; ③ 使用mkdir同时创建多个…

nacos批量信息获取-GitNacosConfig

声明&#xff1a;文中涉及到的技术和工具&#xff0c;仅供学习使用&#xff0c;禁止从事任何非法活动&#xff0c;如因此造成的直接或间接损失&#xff0c;均由使用者自行承担责任。 点点关注不迷路&#xff0c;每周不定时持续分享各种干货。 原文链接&#xff1a;众亦信安&a…

Leetcode-每日一题【234.回文链表】

题目 给你一个单链表的头节点 head &#xff0c;请你判断该链表是否为回文链表。如果是&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 示例 1&#xff1a; 输入&#xff1a;head [1,2,2,1]输出&#xff1a;true 示例 2&#xff1a; 输入&#xff1a;head…

【Golang | runtime】runtime.Caller和runtime.Callers的使用和区别

环境&#xff1a; go version go1.18.2 1、runtime.Caller 函数func runtime.Caller(skip int) (pc uintptr, file string, line int, ok bool) 作用 获取函数Caller的调用信息 参数 skip: 0时&#xff0c;返回调用Caller的函数A的pc(program counter)、所在文件名以及Cal…

SI12T触摸按键芯片兼容TMS12资料

Si12T 是一款具有自动灵敏度校准功能的 12 通道电容传感器&#xff0c;其工作电压 范围为 1.8 ~ 5.0 V 。 Si12T 设置 IDLE 模式来节省功耗&#xff0c;此时&#xff0c;功耗电流为 3.5 A3.3V 。 Si12T 有三种特殊功能&#xff1a;一种是通道 1 上的嵌入式电源键…

体验Kubernetes(k8s),使用minikube搭建单机k8s

文章目录 一、windows&#xff1a;使用Minikube搭建单节点K8s1、安装VirtualBox2、安装kubectl3、安装minikube4、使用minikube搭建k8s 二、centos&#xff1a;使用minikube搭建单节点k8s1、安装docker2、下载kubectl&minikube与安装3、搭建单机k8s4、体验pod 一、windows&…

【计算机网络】MAC地址、IP地址、ARP协议

1.总概念 2.MAC地址 2.1 MAC地址作用 2.2 网络适配器&#xff08;网卡&#xff09; 2.3 概念 2.4 MAC地址格式 2.5 MAC地址发送顺序 单播MAC地址 广播MAC地址 多播MAC地址 随机MAC地址&#xff08;信息安全和隐私保护&#xff09; 2.6小结 3. IP地址 3.1 IP地址作用 3.2 网络…

【C#】实体类和DataTable之间相互转换,实体反射动态遍历列

在实际项目中&#xff0c;经常会用到数据之间的相互转换&#xff0c;序列化和反序列化就是常见场景。这里我们只简单聊聊实体类和DataTable之间的相互转换&#xff0c;可以用于不同业务场景使用。 目录 1、DataTable转Model2、Model转DataTable3、反射概念3.1、Type 类型3.2、A…

力扣 669. 修剪二叉搜索树

题目来源&#xff1a;https://leetcode.cn/problems/trim-a-binary-search-tree/description/ C题解1&#xff1a;递归法。当前节点为空时返回空&#xff0c;不为空时对其值进行分类讨论。以low为例&#xff0c;当前节点值等于low时&#xff0c;意味着其左子树都要丢弃&#xf…

uniapp小程序进入横屏页面后竖屏页面样式错乱放大

问题描述&#xff1a;进入横屏页面后退出再进入一个竖屏页面&#xff0c;样式会错乱放大 解决方法 1.新增一个空白页&#xff0c;blank.vue <template> </template><script>export default {data() {return {}},onLoad(options) {uni.navigateBack({delta…

青岛大学_王卓老师【数据结构与算法】Week03_10_线性表的链式表示和实现10_学习笔记

本文是个人学习笔记&#xff0c;素材来自青岛大学王卓老师的教学视频。 一方面用于学习记录与分享&#xff0c;另一方面是想让更多的人看到这么好的《数据结构与算法》的学习视频。 如有侵权&#xff0c;请留言作删文处理。 课程视频链接&#xff1a; 数据结构与算法基础–…

ASP.NET Core 中文文档 第四章 MVC(4.3)过滤器

ASP.NET MVC 过滤器 可在执行管道的前后特定阶段执行代码。过滤器可以配置为全局有效、仅对控制器有效或是仅对 Action 有效。 查看或下载演示代码. 过滤器如何工作&#xff1f; 不同的过滤器类型会在执行管道的不同阶段运行&#xff0c;因此它们各自有一套适用场景。根据你…

攻防视角下的信息收集组合拳-蓝队视角

攻防视角下的信息收集组合拳-蓝队视角 背景蓝队角度一、攻击前的信息收集1、企业资产梳理2、企业敏感文件清理 二、被攻击后的信息收集1、入侵成功信息收集技巧2、入侵失败信息收集技巧-锁定攻击IP反制技巧 背景 红蓝对抗中&#xff0c;最为重要的就是信息收集&#xff0c;无论…

国外追踪水资源短缺的6幅干旱地图

今天为大家分享国外6个干旱地图&#xff0c;这些地图使我们能够通过最新信息了解干旱的严重程度和范围。 它们通过捕捉水的可用性等关键信息&#xff0c;以便我们能够主动规划和应对干旱的影响。 全球干旱信息系统(GDIS) 地图网址&#xff1a; https://experience.arcgis.co…

HarmonyOS/OpenHarmony应用开发-Stage模型UIAbility组件使用(二)

UIAbility组件启动模式 UIAbility的启动模式是指UIAbility实例在启动时的不同呈现状态。针对不同的业务场景&#xff0c;系统提供了三种启动模式&#xff1a; singleton&#xff08;单实例模式&#xff09; standard&#xff08;标准实例模式&#xff09; specified&#xff0…