一年秀一次!稚晖君的人形机器人上新了,还有开源、免费彩蛋

news2025/1/11 20:48:00

一年一秀,稚晖君的第二代人形机器人来了。

灵巧小手,正在麻将桌上叱咤风云:

图片

不对不对,让我们先看看整体气质:

图片

然后是常规家务,能看出来也是非常熟练:

图片

图片

图片

图片

在大模型风靡的 2024 年,如果说 AI 领域什么最火,「具身智能」这个方向必定位列其中。

视线放到国内,「智元机器人」这家具身智能公司备受瞩目。自 2023 年 2 月成立以来,「智元机器人」已马不停蹄地完成了 6 轮融资,迅速成为机器人创业圈的「顶流项目」。

创业半年,稚晖君和团队就拿出了首款产品「远征 A1」。一出道,「远征 A1」的行走能力和人机互动就是业界领先水平。不过,在「远征 A1」初次亮相之后,我们似乎再也没听说过它的下一步消息,甚至没有放出任何整活视频。

但今天的发布会之后,我们知道了,智元机器人在「闷声干大事」。

图片

在这场发布会中,稚晖君一口气推出了三款远征系列机器人产品:交互服务机器人「远征 A2」、柔性智造机器人「远征 A2-W」、重载特种机器人「远征 A2-Max」。最后的 One more thing 环节,智元 X-Lab 孵化的模块化机器人系列产品「灵犀 X1」和「灵犀 X1-W」也作为「彩蛋」正式亮相。

相比上一代,五款机器人采用了家族化设计语言,对机器人的外形进行了系列化的规整,结合轮式与足式两种形态,覆盖交互服务、柔性智造、特种作业、科研教育和数据采集等应用场景。

关于量产进度,智元机器人也透露了最新消息:2024 年预估发货量将达到 300 台左右,其中双足 200 台左右,轮式 100 台左右。

新一代远征 A2

从「远征 A1」开始,智元在机器人产品上的落地方向就已经很清晰:「进厂打工」。今年的「远征 A2」更是为批量「进厂打工」做了更充分的准备。

我们来看下这个家族的成员:

图片

「远征 A2」是一款交互服务机器人,全身具备超过 40 个主动自由度的关节和仿人的灵巧双手,能够模拟出丰富和复杂的人类工作。它拥有一个可以持续学习的大脑,由大语言模型加持。此外,它还具备多模态的感知,输入系统,可以通过视觉感知交互者的情绪。

「远征 A2-Max」是一款重载特种机器人,既力大无穷又具备灵巧作业的优势,在开场的情景剧中,它轻松地搬动了 40kg 的航空箱,目前「远征 A2-Max」还处于产品研发阶段。

「远征 A2-W」是一款柔性智造机器人,它的两条手臂既可以独立操作,也可以协同工作。它采用了轮式底盘,结合机身搭载的 rgbd 激光雷达、全景相机、为全域安全配置的传感器等等构件,使得它可以在各种环境中快速而平稳的移动。

在发布会前,「远征 A2-W」的表现简直像钢铁侠的「贾维斯」走进了现实。在听懂稚晖君的指令后,它完全自主地打开了可乐瓶子,在榨汁机中放入葡萄,按下榨汁机,一滴没撒地把榨汁机里的饮料倒进了杯子,给稚晖君端上了一杯「萄气可乐」。

除了颜值提升,「远征 A2」系列机器人更是内外兼修。对于机器人的核心零部件,「智元机器人」创新地将机器人系统划分为动力域、感知域、通信域、控制域。显然,「智元机器人」都是冲着全栈生态去的。

图片

在动力域方面,「智元机器人」对 PowerFlow 关节模组实现了量产化迭代升级,从参数上看,PowerFlow 关节模组都有大幅提升。在稳定性和可靠性方面,「智元机器人」也对其峰值性能、老化速度等方面进行了大量测试和优化。

图片

对于「干活」而言对重要的灵巧手,这回「智元机器人」也升级了一番:自由度数跃升至 19 个,主动自由度翻倍至 12 个,在感知能力方面也引入了更多模态,例如基于 MEMS 原理的触觉感知和视触觉感知技术。

图片

此外,「智元机器人」还推出了高精度力控 7 自由度双臂,能够精准执行阻抗控制、导纳控制、力位混控等多种力控任务,也支持双臂拖拽示教模式和可视化调节。

图片

对于感知域方面,新一代的远征机器人系列集成了 RGBD 相机、激光雷达、全景相机等传感器,引入自动驾驶 Occupancy 前沿感知方案,通过 SLAM 算法进一步提升环境理解能力。

图片

在通信域方面,「智元机器人」自研了具身原生、轻量化、高性能的智能机器人通信框架 AimRT。相比 ROS 等第三方中间件,提升了性能、稳定性、系统部署的效率和灵活性,同时又完全兼容 ROS/ROS2 已有生态。AimRT 将于 9 月底开源。

图片

对于控制域方面,「智元机器人」结合了 Model-based 与 Learning-based 两种算法,进一步提升机器人运动控制与适应能力。对于 Model-based,「智元机器人」进一步提升了系统的鲁棒性,因此,在发布会上机器人所做的演示才能如此流畅和丝滑。对于 Learning-based 算法,「智元机器人」在这里划了一个重点,希望能促成机器人训练方法从算法驱动 - 数据驱动的转变。

图片

在运控算法的基础上,「智元机器人」预研了基于自然语言指令集驱动的、可以适配不同机器人本体的 AgentOS,基于强化学习,实现机器人技能的精准编排与高效执行。

图片

首次提出 G1-G5 具身智能技术演进路线

在本次发布会上,智元机器人还首次提出了具身智能领域的技术演进路线,包含从 G1 到 G5 五个阶段:

图片

G1 指的是基础自动化阶段,也就是基于手工设计的特征,配合简单的机器视觉去做一些反馈。这一阶段的部署是为特定的场景量身定制的,虽然可以解决某些场景下的任务执行问题,但无法在不同的场景里面做低成本快速迁移。

G2 是「通用原子技能」阶段,针对大量不同的场景任务和各种作业的任务需求,提炼出一些可以复用的原子能力。简而言之,是以相对通用的方式去实现类似场景任务的快速迁移,然后配合大语言模型框架去做任务编排,使得机器人具备一定的泛化能力。

G3 则意味着具身智能的整体架构开始调整为「端到端」的路线,尽管这个阶段与 G2 阶段的算法架构可能是类似的,但此时的各项「原子能力」的形成方式,已经由手工设计的算法驱动变为了大量数据采集之后的数据驱动。

区别于前三个阶段,G4 阶段将会出现一个通用的端到端操作大模型。到了这一阶段,即可引入大量跨场景的真实数据和仿真数据,同时引入世界模型帮助 AI 理解现实世界背后的物理原理,理解不同任务背后底层逻辑的相通之处。比如对于「拧开瓶子」和「拧开门把手」这两件事,就不再需要采集两份单独的数据以获得两项单独的技能。最终通向无限趋近 AGI 的 G5 阶段。

过去一年,智元机器人已经在 G2 路线取得了阶段性突破,实现了通用的位姿估计模型 UniPose、通用的抓取模型 UniGrasp,通用的力控插拔模型 UniPlug 等一系列 zero-shot 和 few-shot 的通用原子技能。在 G2 阶段的原子能力模型,面向柔性智造和交互服务场景,已经在多个实际场景中得到了商业应用。

在 G3 路线上,智元机器人也形成了一套完整的全流程具身数据方案 AIDEA(Agibot Integrated Data-system for Embodied AI,智元具身智能数据系统)。

图片

但我们都知道,要想形成这样一套方案,首先需要投入大量的数据采集成本,不是每个机器人团队都有条件做到的。

而智元机器人做到了,还预备在今年第四季度开源。

稚晖君表示,数据采集是整个环节的痛点。在过去一年中他们面向数据做了大量的基建工作,而且形成了一套完整、全流程的数据采集、应用的方案 AIDEA。

AIDEA 除了提供硬件本体方案之外,也会提供整个云全链路数据平台,还有 AIDEA ML 机器学习平台进行模型训练与算法评测,以及 AIDEA Sim 仿真平台。

图片

稚晖君表示,他预计接下来智元会有百台以上自由部署机器人专门用来做端到端的数据采集,他们也将于四季度开源基于 AIDEA 的百万条真机、千万条仿真数据集,以积极建设开放生态。

稚晖君的 One more thing

大概因为觉得一年才开一次发布会属实「鸽」太久了,稚晖君也在发布会最后公布了 One more thing:全栈开源机器人灵犀 X1、专业数采机器人灵犀 X1-W 两款新品。

图片

这两款机器人来自于 X-Lab(稚晖君实验室),是 10 个人不到 3 个月的时间做出的产品,里面有非常多的创新细节。例如,自研了 PF86 和 PF52 两款全新的 PowerFlow 关节,融入了模块化设计理念,可以通过简单抱箍形式轻松拆装。

基于 X-Lab 对极致创新的追求,稚晖君表示,会开源灵犀 X1 的本体设计图纸、软件框架、中间件源码、基础运控算法。

此外在执行器方面,X-Lab 自研了带前馈力控、超低成本的自适应通用夹爪,也推出了满足场景需求的百元级成本的六维力传感器。

对了,灵犀的售价是零元,开源大部分设计资料及代码,但卖零件。

稚晖君表示,希望这能够推动「人形机器人人人造」时代的到来。

你喜欢吗?

点击访问我的技术博客https://ai.weoknow.comicon-default.png?t=N7T8https://ai.weoknow.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2053349.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FreeRtos----------- 同步互斥

一、同步的缺陷:全局变量协同两个任务 1.建立两个任务:CalcTask 、LcdPrintTask xTaskCreate(CalcTask, "task1", 128, NULL, osPriorityNormal, NULL);xTaskCreate(LcdPrintTask, "task2", 128, &g_Task2Info, osPriorityNorm…

详解Element-UI el-table表格中勾选checkbox(selection)多选删除

本节讲解的是关于组件库中el-table组件多选删除功能的实现。 1.Vue文件内的引用 2.页面数据 3.存储多选数据 4. 处理多选数据 这里通过循环的方式找到数据并对数据删除,这种方式易于理解,但不一定是最优方案

springboot的自动配置和怎么做自动配置

目录 一、Condition 1、Condition的具体实现 2、Condition小结 (1)自定义条件 (2)SpringBoot 提供的常用条件注解 二、Enable注解 三、EnableAutoConfiguration 注解和自动配置 1、EnableAutoConfiguration的三个注解属性…

LLama 3 跨各种 GPU 类型的基准测试

2024 年 4 月 18 日,AI 社区对 Llama 3 70B 的发布表示欢迎,这是一款最先进的大型语言模型 (LLM)。该型号是 Llama 系列的下一代产品,支持广泛的用例。该模型 istelf 在广泛的行业平台上表现良好,并提供了新…

Eclipse的使用配置教程:必要设置、创建工程及可能遇到的问题(很详细,很全面,能解决90%的问题)

Eclipse的使用配置: Ⅰ、Eclipse 的必要配置:1、Eclipse 的安装:其一、将 Eclipse 解压或安装到没有中文且没有空格的路径下。其二、拿到 eclipse.exe 文件,傻瓜式安装即可; 2、设置工作空间(workspace):其一、首次启动…

源头分析: 网络安全的分布式方法

部署网络可见性和网络检测和响应 (NDR) 解决方案来收集、查看和分析网络活动,以检测网络上的可疑和恶意活动。 这些解决方案中的大多数都是为了将数据从收集点 (或传感器) 移动到中央存储库进行分析而构建的。 这种方法有几个缺点,包括规模、性能、成本…

乌龟对对碰在线版

爆肝两天使用vue开发了一个在线版的乌龟对对碰小游戏之幸运对对碰。没有找到合适的乌龟素材,现在使用小兔子代替。 体验地址:幸运对对碰 | 乌龟对对碰小游戏 之前的python版本的乌龟对对碰:写文章-CSDN博客 乌龟对对碰-幸运对对碰

无需测试环境!如何利用测试脚手架隔离微服务,实现功能自动化

以下为作者观点: 想在不建立完整测试环境的情况下测试微服务? 想在将变更推送到主线分支之前完成测试? 这是我们在进行项目交付时经常遇到的难题。最近,当我们开始一个新的项目,为客户构建一个新的聚合平台时&#…

【springboot】springboot接口参数全局解密,解决request内容修改后如何重新设置回去的问题

文章目录 核心思路spring&servelt基础核心接口类body解密核心原理讲解get解密核心原理讲解 核心思路 拦截每次请求 所以要么在拦截器 要么在过滤器中做 (正常来说 其实只能在过滤器做)修改request中的参数把修改后的参数设置回去(难点) spring&servelt基础…

RegFormer:用于大规模点云配准的高效投影感知Transformer网络

目录 一、导言 二、相关工作 1、点云配准工作 2、大规模点云配准 3、Transformer引入配准工作 三、RegFormer 1、柱面投影 2、特征提取Transformer 3、双射关联Transformer(BAT) 4、刚性变换估计 5、损失函数 四、实验 一、导言 该论文来自于ICCV2023(…

如何搞定聊天记录找回?三款数据恢复工具分享

聊天记录丢了怎么办?别急,我这就带大家看看市面上比较火的三款数据恢复软件在恢复聊天记录方面的表现如何。首先,我们得知道,聊天记录这东西,一旦误删,那可是心急如焚啊。所以,选择一款靠谱的数…

场外个股期权可以分批建仓吗?

场外个股期权的优势是可以进行风险的精细化管理,但由于期权价格变化的非线性特性,盈利与标的行情走势的相关性不断变化,场外个股期权最便宜的可以用2-5万买到100万市值的股票持仓一个月,下面是整理得出的场外个股期权可以分批建仓…

SwiftUI 6.0(iOS 18)监听滚动视图视口中子视图可见性的极简方法

概览 在 SwiftUI 的应用开发中,我们有时需要监听滚动视图中子视图当前的显示状态:它们现在是被滚动到可见视口(Viewport)?或仍然是隐藏在“未知的黑暗”中呢? 在 SwiftUI 早期版本中为了得偿所愿,我们需要借助一些“取巧”的手段。不过,从 SwiftUI 6.0(iOS 18)开始情…

echarts柱状图使用自定义图片填充柱体

这是我的柱状图图片纹理的实现过程的流水账式记录 方法一: 在option.series里面,给每一项配置上图片路径 let Image2 new Image() Image2.src src/assets/image/BarChart-line.pngcolor: {image: Image,repeat: repeat } 出来的效果比较适合整体纹样…

[Linux]如何在Ubuntu中安装Docker,并且学习基本操作?

一、我们为什么需要Docker? 相信大家都遇到过部署一个应用时缺少依赖的情况,往往我们需要手动解决依赖问题,在解决了依赖问题以后,好不容易安装了这个应用,但是我们更换了计算机以后又需要重复上面步骤将这个软件再安装…

Unity(2022.3.38LTS) - Project Settings详细介绍不看你就亏大了(一)

目录 一. 简介 二. 详细介绍 1. Adaptive Performance(自适应性能) 2.音频 3. 编辑器 4. 图形 5. 输入管理器 6.包管理器 7.物理 8.2D物理 9.玩家 10.预设管理器 一. 简介 在 Unity 中,Project Settings(项目设置)页面是一个非常…

企业组网中MPLS和SD-WAN方案各有什么特点?

MPLS(多协议标签交换)和SD-WAN(软件定义广域网)是企业组网的两大关键技术方案,各自具备独特的特点和优势。 MPLS作为一种传统的专线技术,通过给数据包附加标签,实现了网络流量的高效转发。这种方…

教你如何安装并使用小熊猫c++

目录 前言 一、获取安装包 二、安装 1.打开安装包 2.选择语言 3.接受协议 4.安装场景 5.选择组件 6.选择位置 7.完成安装 三、如何使用 1.打开软件并选择主题 2.创建项目 3.新建空项目 4.创建源文件 5.测试C语言代码 6.编译 7.运行 总结 前言 已有的C/…

地震采集的观测系统

这张图表明,为什么在速度分析论文中,与CMP有关的数据都有CDP序号的影子——因为CDP序号是对一条测线上布置的观测系统对地下反射点的信号记录。换句话说,不同的CDP序号(类似测井位置)意味着不同的CMP道集。 几种论文中…

【Python快速入门和实践013】Python常用脚本-目标检测之按照类别数量划分数据集

一、功能介绍 这段代码实现了从给定的图像和标签文件夹中分割数据集为训练集、验证集和测试集的功能。以下是代码功能的总结: 创建目标文件夹结构: 在指定的根目录(dataset_root)下创建images和labels两个文件夹。在这两个文件夹下…