WAIC | 上海人形机器人创新中心 | 最新演讲 | 详细整理

news2024/11/27 20:32:53

前言

笔者看了7月4号的人形机器人与具身智能发展论坛的直播,并在7月5日到了上海WAIC展会现场参观。这次大会的举办很有意义,听并看了各家的最新成果,拍了很多照片视频,部分演讲也录屏了在重复观看学习

稍后会相继整理创立穹彻智能的上交卢策吾老师、创立银河通用的北大王鹤老师、宇树CEO王兴兴、哥伦比亚博士生胡宇航、卡内基梅隆智能控制实验室的博士生孙逸凡在此次论坛上的最新公开演讲。并会分享这次WAIC展会上的一些新鲜见闻。欢迎持续关注我的专栏

如果想直接观看演讲原视频,也可以联系我发送,但是我边看边录的,可能会有点模糊。这篇整理学习笔记图也截于此,若模糊望见谅


演讲纪要

1. 演讲思路清晰、技术路线介绍详细易懂

2. 从本体平台、具身智能、数据集、训练场进行介绍

3. 今年的青龙以旋转执行器作为主驱动单元,明年会发布用直线执行器的"snack"人形机器人。每年发布一款公版机,以生肖为版本号

4. 代号是"青龙"人形机器人平台,"朱雀"具身大脑,"玄武"具身小脑、"白虎"数据集、"麒麟"训练场

5. 值得一提的是,通过在强化学习行走的过程中,引入传统控制的思想,使迁移成功率达到100%

6. 2024年,会在上海打造100个人形训练场。2027年,在各个城市、各个场景打造1000个训练场,构建1PB数据集(每周生产5TB+)

上海人形创新中心

2024年5月,上海的国家级人形机器人创新中心揭牌。

上海打造人形机器人底座,关键词——开源。软硬件全开源。开源网站

之前的关键技术,包括GitHub、ROS、Hugging Face都是国外学者组织的开源社区,而中国想打造人形机器人的开源社区

机器人参数、开发时间:

类似ROS每年发布一版,中国的人形机器人也会每年发布一个公版机,以十二生肖为版本序号,体现中国特色:

演讲顺序:

本体平台

100人+,150天+,生态企业50+

本体包括:行走与驱动系统、操纵与作业系统、感知与控制系统

总体硬件

总体设计:

构型设计:

行走与驱动系统

电池电源方面,人形机器人与常规设备不同,存在循环交变、稳态爆发、反电动势巨大的特点。青龙人形搭载了具有能量回收系统和输出稳压管理的电源系统,以支持整机3-4h强功耗续航:

关节模组:

操纵与作业系统

系统设计:

感知与控制系统

具身智能

感知、规划、决策、控制。包括“朱雀”具身大脑、“玄武”具身小脑

  • 朱雀大脑:以多模态大模型为核心的机器人指挥调度中心。以文字、图像为输入,输出语音交互、任务决策信息
  • 玄武小脑:具体任务执行模型,包括轨迹规划模块和运动控制器。
    • 轨迹规划器:由端到端的模仿学习驱动的,视觉作为输入,以人类作业作为模仿对象,输出期望路径
    • 运动控制器:以环境信息、机器人状态信息输入,输出关节扭矩,完成控制目标。有两条技术路线。其一是基于强化学习的智能运动控制方法,其二是基于全身动力学模型的预测控制方法
  • 遥操作:在朱雀大脑和轨迹规划系统发育尚不完全的情况下,还会利用遥操作系统作为输入,控制机器人完成任务。也可用来收集数据,去发育朱雀大脑和轨迹规划系统

具身大脑

现场演示demo:
——人:你看桌面有什么?
——机器人:桌面有2个面包、3个水果
——人:桌面有点乱,你能帮我清理一下么?
——机器人:好的,正在为您整理桌面。我将把面包和水果分类摆放(它先将面包都放到桌面右边,水果放到桌面左边,再分别抓到篮子中)

具身小脑

三条路径:传统的控制理论(可解释性强)、模仿学习(训练难度低)、强化学习(智能体有较强的鲁棒性)。结合这三条路径有点,打造小脑模型

首先收集大量人体数据,包括人体运动协调数据和人类作业数据,以此为基础,打造行为策略和行为标准。然后,利用控制理论、强化学习两条路径,打造运动控制器。三条路径相互支撑。三个月内完成算法开发、部署、迭代

数据

创新中心采用2类数据采集方式:

  • 全身运动捕捉系统:对高精度手部数据、全身数据进行采集。可以训练机器人完成走跑跳、抓拿放等多种技能
  • 视觉捕捉系统:针对灵巧专用、精细作业,通过视觉捕捉系统完成毫米级的手部动作采集

通过采集丰富数据训练大小脑:

打通人形机器人数据采集、评估清洗、训练一体的全流程体系。提供解决方案、行业可参考的设计理念:

提供标准数据采集工具和基于数字孪生系统完成的评估/二次标注方法:

3年内100台采集设备,完成1PB数据集采集:

提供预训练模型、微调和测评服务,帮助各个企业加速发展:

人形机器人数据是目前整个行业最大的痛点,只由创新中心来做这件事很艰巨,希望通过生态、联盟单位,一起加速开源数据集的建立

训练场

人形机器人一个难点是获得高质量数据难、场景应用难

训练场:搭建场景模拟产线、工艺流水线的规模化数据,检测评估基地。其实也就是数据生产、收集基地

特斯拉训练场。谷歌RT1的开源数据集,在17个月中只收集到13w条高质量数据

训练场难度分级:

是

 训练场架构:

算-学:用模仿学习、强化学习,做单臂、双臂、全身运动的训练;用:工业产线、服务。模拟应用

训练数据产生步骤:

分为3个阶段

  • 第1阶段:基于aloha,打造单臂单技能学习、作业对象与环境的泛化能力
  • 第2阶段:基于前面的6自由度协作臂,将这套技术路线迁移到青龙人形机器人的上肢上,做多技能的学习和训练,实现多技能的模仿学习
  • 第3阶段:未来会做大规模人类视频,产生低成本、规模化数据集的工作

训练场构建方式:

  • 搭建数据管理的平台系统,打造操作端、机器端云网服务器。
  • 建设实时标定系统、控制系统、数据采集系统、数据反馈系统
  • 通过数字孪生,生成合成式数据
  • 通过异构人形机器人,打造真实、生成式数据

2024年,会在上海打造100家人形机器人训练场。2027年,在各个城市、各个场景打造1000个训练场:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1903237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用RAID与LVM磁盘阵列技术

前言:本博客仅作记录学习使用,部分图片出自网络,如有侵犯您的权益,请联系删除 目录 一、RAID磁盘冗余阵列 1、部署磁盘整列 2、损坏磁盘阵列及修复 3、磁盘阵列备份盘 4、删除磁盘阵列 二、LVM逻辑卷管理器 致谢 一、RAID…

linux中可执行文件在运行过程中为什么不能拷贝覆盖

对于一个普通的文件,假如有两个文件,分别是file和file1,我们使用 cp file1 file的方式使用file1的内容来覆盖file的内容,这样是可以的。 但是对于可执行文件来说,当这个文件在执行的时候,是不能通过cp的方…

Python 算法交易实验76 QTV200日常推进

说明 最近实在太忙, 没太有空推进这个项目,我想还是尽量抽一点点时间推进具体的工程,然后更多的还是用碎片化的时间从整体上对qtv200进行设计完善。有些结构的问题其实是需要理清的,例如: 1 要先基于原始数据进行描述…

【ROS2】初级:客户端-编写一个简单的服务和客户端(Python)

目标:使用 Python 创建并运行服务节点和客户端节点。 教程级别:初学者 时间:20 分钟 目录 背景 先决条件 任务 1. 创建一个包2. 编写服务节点3. 编写客户端节点4. 构建并运行 摘要 下一步 相关内容 背景 当节点通过服务进行通信时&#xff0c…

【机器学习】机器学习重塑广告营销:精准触达,高效转化的未来之路

📝个人主页🌹:Eternity._ 🌹🌹期待您的关注 🌹🌹 ❀目录 📒1. 引言📙2. 机器学习基础与广告营销的结合🧩机器学习在广告营销中的核心应用领域🌹用…

将大型语言模型模块化打造协作智能体

B UILDING C OOPERATIVE E MBODIED A GENTS MODULARLY WITH L ARGE L ANGUAGE M ODELS 论文链接: https://arxiv.org/abs/2307.02485https://arxiv.org/abs/2307.02485 1.概述 在去中心化控制及多任务环境中,多智能体合作问题因原始感官观察、高昂…

穿梭印度风情记:维乐 Angel Revo Halo坐垫,让每一寸旅程闪耀光辉!

想象骑乘在印度的万花筒世界中,斑斓色彩与悠久历史交织,每一转轮都是对神秘东方的深刻探索。在这样的骑行之旅中,维乐Angel Revo Halo坐垫不仅是你的坐骑上的宝石,更是舒适与探险的完美媒介。    探索印度的色彩与灵魂&#x…

每日一题~oj(贪心)

对于位置 i来说,如果 不选她,那她的贡献是 vali-1 *2,如果选他 ,那么她的贡献是 ai. 每一个数的贡献 是基于前一个数的贡献 来计算的。只要保证这个数的前一个数的贡献是最优的,那么以此类推下去,整体的val…

【项目设计】负载均衡式——Online Judge

负载均衡式——Online Judge😎 前言🙌Online Judge 项目一、项目介绍二、项目技术栈三、项目使用环境四、项目宏观框架五、项目后端服务实现过程1、comm模块设计1.1 Log.hpp实现1.2 Util.hpp实现 2、compiler_server 模块设计2.1compile.hpp文件代码编写…

【QT】容器类控件

目录 概述 Group Box 核心属性 Tab Widget 核心属性 核心信号 核心方法 使用示例: 布局管理器 垂直布局 核心属性 使用示例: 水平布局 核⼼属性 (和 QVBoxLayout 属性是⼀致的) 网格布局 核心属性 使用示例: 示例&#x…

【C++ OpenCV】机器视觉-二值图像和灰度图像的膨胀、腐蚀、开运算、闭运算

原图 结果图 //包含头文件 #include <opencv2/opencv.hpp>//命名空间 using namespace cv; using namespace std;//全局函数声明部分//我的腐蚀运算 Mat Erode(Mat src, Mat Mask, uint32_t x0, uint32_t y0) {uint32_t x 0, y 0;Mat dst(src.rows, src.cols, CV_8U…

设计模式之状态机模式

一、状态机模式介绍 状态机模式&#xff08;State Machine Pattern&#xff09;是一种用于描述对象行为的软件设计模式&#xff0c;属于行为型设计模式。在状态机模式中&#xff0c;对象的行为取决于其内部状态&#xff0c;并且在不同的状态下&#xff0c;对象可能会有不同的行…

RAG 案框架(Qanything、RAGFlow、FastGPT、智谱RAG)对比

各家的技术方案 有道的QAnything 亮点在&#xff1a;rerank RAGFLow 亮点在&#xff1a;数据处理index 智谱AI 亮点在文档解析、切片、query改写及recall模型的微调 FastGPT 优点&#xff1a;灵活性更高 下面分别按照模块比较各框架的却别 功能模块QAnythingRAGFLowFastG…

【手写数据库内核组件】01 解析树的结构,不同类型的数据结构组多层的链表树,抽象类型统一引用格式

不同类型的链表 ​专栏内容&#xff1a; postgresql使用入门基础手写数据库toadb并发编程 个人主页&#xff1a;我的主页 管理社区&#xff1a;开源数据库 座右铭&#xff1a;天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物. 文章目录 不同类型…

Day05-04-持续集成总结

Day05-04-持续集成总结 1. 持续集成2. 代码上线目标项目 1. 持续集成 git 基本使用, 拉取代码,上传代码,分支操作,tag标签 gitlab 用户 用户组 项目 , 备份,https,优化. jenkins 工具平台,运维核心, 自由风格工程,maven风格项目,流水线项目, 流水线(pipeline) mavenpom.xmlta…

Android 10年,35岁,该往哪个方向发力

网上看到个网友发的帖子&#xff0c;觉的这个可能是很多开发人员都会面临和需要思考的问题。 不管怎样&#xff0c; 要对生活保持乐观&#xff0c;生活还是有很多的选择和出路的。 &#xff08;内容来自网络&#xff0c;不代表个人观点&#xff09; 《Android Camera开发入门》…

关闭vue3中脑瘫的ESLine

在创建vue3的时候脑子一抽选了ESLine,然后这傻卵子ESLine老是给我报错 博主用的idea开发前端 ,纯粹是用不惯vscode 关闭idea中的ESLine,这个只是取消红色波浪线, 界面中的显示 第二步,在vue.config.js中添加 lintOnSave: false 到这里就ok了,其他的我试过了一点用没有

专业140+总分420+天津大学815信号与系统考研经验天大电子信息与通信工程,真题,大纲,参考书。

顺利上岸天津大学&#xff0c;专业课815信号与系统140&#xff0c;总分420&#xff0c;总结一些自己的复习经历&#xff0c;希望对于报考天大的同学有些许帮助&#xff0c;少走弯路&#xff0c;顺利上岸。专业课&#xff1a; 815信号与系统&#xff1a;指定教材吴大正&#xf…

飞书 API 2-4:如何使用 API 将数据写入数据表

一、引入 上一篇创建好数据表之后&#xff0c;接下来就是写入数据和对数据的处理。 本文主要探讨数据的插入、更新和删除操作。所有的操作都是基于上一篇&#xff08;飞书 API 2-4&#xff09;创建的数据表进行操作。上面最终的数据表只有 2 个字段&#xff1a;序号和邮箱。序…

(完整音频)DockerHub、OpenAI、GitCode,脱钩时代,我们该如何自处?

本期主播 朱峰&#xff1a;「津津乐道播客网络」创始人&#xff0c;产品及技术专家。&#xff08;微博&#xff1a;zhufengme&#xff09;高春辉&#xff1a;「科技乱炖」主播。“中国互联网站长第一人”&#xff0c;科技、互联网领域的连续创业者。&#xff08;微博&#xff1…