具身智能(Embodied Intelligence)概述

news2024/9/21 18:58:24

目录

一、引言 

二、具身感知

三、具身交互

四、具身智能体 

 五、虚拟到现实 


一、引言 

最近无论是斯坦福机器人炒虾,还是特斯拉官宣机器人进厂,都赚足了眼球,实力证明了具身智能(Embodied Intelligence)的火爆。

先不说具身智能是实现AGI的关键环节,也是未来研究的重要方向,从发论文的角度来看,今年的各大顶会,比如CVPR,具身智能就排了热门研究领域前三,可见入局具身智能早已成了必然趋势。

具身智能(Embodied Intelligence)是人工智能和认知科学中的一个研究方向,着重于研究智能体如何通过与物理环境的互动来获得和展现智能。与传统的计算机智能不同,具身智能强调智能体的身体和环境在认知过程中的重要性。这种研究关注如何通过身体的感知、运动和与环境的交互来实现学习和智能行为。具身智能的核心理念是,智能不仅仅是计算和信息处理的结果,而是身体与环境相互作用的产物。通过研究和模拟这种互动,科学家们希望能更好地理解和实现类似人类的智能系统。

目前具身智能主要四个研究目标:具身感知、具身互动、具身智能体、虚拟到现实。如果大家想冲顶会,建议从这四个角度入手。

二、具身感知

论文:Embodiedscan: A holistic multi-modal 3d perception suite towards embodied ai

方法:EmbodiedScan是一个新的多模态3D感知数据集,提供了丰富的室内场景注释,支持自我中心视角下的语言基础的全面3D场景理解。基于此数据集,论文提出了Embodied Perceptron框架,用于处理多视图输入,并在3D感知和语言基础任务上表现出色。

创新点:

  • EmbodiedScan:从自我中心视图实现基于语言的整体三维场景理解的多模态感知套件。

  • 基于一个大规模的数据集,提出了一个基准框架,能够处理任意数量的视图输入,使用统一的多模态编码器和任务特定的解码器。

三、具身交互

论文:Dexterous Grasp Transformer

方法:论文提出了一种名为Dexterous Grasp Transformer(DGTR)的新框架,用于生成灵巧抓取姿势。DGTR利用transformer解码器和可学习的抓取查询,仅通过一次前向传播就能从物体的点云中预测出多样化的可行抓取姿势集合。

创新点:

  • 动-静匹配训练策略(DSMT):通过引入动-静匹配训练策略,在显著提高Q1的同时,减少了约50%的穿透损失。

  • 对抗平衡的测试时适应(AB-TTA):通过引入对抗平衡的测试时适应模块(AB-TTA),显著提高了Q1值,并同时增强了ηnp和ηtb的性能。

、具身智能体 

论文:Embodied Multi-Modal Agent trained by an LLM from a Parallel TextWorld

方法:论文提出了一种名为EMMA(Embodied Multi-Modal Agent)的方法,通过跨模态交互模仿学习,将一个在文本世界中表现出色的大型语言模型(LLM)专家的知识迁移到一个在视觉世界中的具身多模态代理上。

创新点:

  • 通过回顾反思,EMMA在时间上得到了改进。通过比较EMMA和去掉回顾机制的EMMA的平均成功率,作者发现EMMA的回顾机制显著优于没有回顾机制的EMMA。

  • 通过在特定噪声率下对EMMA和SOTA LLM代理(Reflexion)进行比较,作者发现随着噪声率的增加,EMMA的性能仍然比Reflexion更具鲁棒性。

 五、虚拟到现实 

论文:GenH2R: Learning Generalizable Human-to-Robot Handover via Scalable Simulation, Demonstration, and Imitation

方法:论文提出了GenH2R,一个用于学习通用的基于视觉的人机交互(Human-to-Robot, H2R)交接技能的框架。该框架通过可扩展的模拟环境GenH2R-Sim、自动化的演示生成方法和一种辅助预测的4D模仿学习方法,实现了对机器人接收人类以各种复杂轨迹递交的不同几何形状物体的能力的培训。

创新点:

  • GenH2R-Sim是一个新的仿真环境,包含了数百万个人与机器人交接的动画,用于支持一般化的H2R交接学习。

  • 文中介绍了一种适用于大规模演示生成的方法,可以自动生成适合学习的高质量演示。

  • 文中还提出了一种基于预测的4D模仿学习方法,用于将演示提炼为视觉-运动交接策略。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2091271.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SEO之网站结构优化(十四-内部链接及权重分配2)

初创企业搭建网站的朋友看1号文章;想学习云计算,怎么入门看2号文章谢谢支持: 1、我给不会敲代码又想搭建网站的人建议 2、“新手上云”能够为你开启探索云世界的第一步 博客:阿幸SEO~探索搜索排名之道 4、翻页过多 稍大型的商务…

无心剑中译莎士比亚《无君相伴浸寒冬》

莎士比亚十四行诗第98首 Sonnet 98 无君相伴浸寒冬 From you have I been absent in the spring, When proud pied April, dressed in all his trim, Hath put a spirit of youth in every thing, That heavy Saturn laughed and leapt with him. Yet nor the lays of birds,…

Python | Leetcode Python题解之第385题迷你语法分析器

题目: 题解: class Solution:def deserialize(self, s: str) -> NestedInteger:index 0def dfs() -> NestedInteger:nonlocal indexif s[index] [:index 1ni NestedInteger()while s[index] ! ]:ni.add(dfs())if s[index] ,:index 1index …

Vue3项目开发——新闻发布管理系统(四)

文章目录 七、登录&注册页面设计开发2、登录&注册页面设计3、表单校验规则设置七、登录&注册页面设计开发 2、登录&注册页面设计 登录页面如下: 点击“注册 →”,切换到注册页面: 点击“← 返回”,又可以切换回登录页面。 页面布局是这么设计的: 1…

保姆级Maven安装、配置、版本查询教程(包含配置本地仓库、阿里云私服、环境变量)

文章目录 一、Maven安装1. 下载zip包2. 解压 zip包 二、配置1. 配置本地仓库2. 配置阿里云私服3. 配置环境变量 三、Maven验证 此教程摘选自我的笔记:黑马JavaWeb开发笔记11——Maven介绍、详细安装、环境配置步骤教程,想要了解Maven组成和作用可以移步此…

中国各地区数字经济发展对环境污染的影响数据(2011-2021年)

关于中国各地区数字经济发展对环境污染的影响数据(2011-2021年),可以从以下几个方面获取相关信息: 数字经济水平:可以通过熵值法衡量的数字经济水平指标来评估各地区的数字经济发展情况。 环境污染物排放量&#xff1…

桥梁在线监测解决方案:科技赋能,守护桥梁安全

在现代社会,桥梁作为连接城市与乡村、跨越河流与峡谷的重要交通设施,其安全性和稳定性直接关系到人民生命财产的安全以及经济社会的正常运转。然而,桥梁在长期使用过程中,会受到自然环境、车辆荷载、材料老化等多种因素的影响&…

中国各地区-城市创新和产业创新指数(2001-2021年)

数据及指标 年份、行业代码、行业名称、大类行业、产业创新指数、城市代码、城市、省份、城市创新指数。 2001-2021年 中国各地区-城市创新和产业创新指数https://download.csdn.net/download/2401_84585615/89504735 中国各地区在城市创新和产业创新指数方面有显著的发展和…

制作效果图常用的软件和渲染器介绍

我们用于效果图制作与渲染的软件主要有3ds Max、Sketchup、Rhino、V-Ray、Corona、Enscape、Lumion和D5 渲染器等。用于制作效果图的软件很多,作为初学者,我们没必要都学习,只需选择一个设计软件和一个渲染器学习就可以了,等都彻底…

设计模式-UML建模语言面向对象的SOLIDLC

一、设计模式概述和UML 1.设计模式概述 1.序言 把软件开发当做修炼武功的话,那么可以分为招式和内功心法。 招式:C,C, java, python等编程语言;jsp等开发技术,qt, spring等开发框架。这些是…

使用.gitignore文件忽略文件

一 .gitignore文件的作用 有些情况,你需要把一些文件放到Git工作目录中,但无需提交,比如本地配置,自动生成的文件等。.gitignore文件可以帮助你实现这样的需要。 二 .gitignore文件的创建和编辑 在git根目录或任意子目录创建名…

springbootmybatis中数组和字符串数据类型的转换

需求 前端(VUE)页面上有一个可多选的select控件,前端以数组形式存储被选中的数据,但是数据库中不想新建表来存储,希望在主表中用以逗号为分隔符的字符串来存。 于是在存储和读取数据的时候就涉及到数据类型转换的问题…

现在别买MPV,比亚迪“夏”来搅局了

文 | AUTO芯球 作者 | 雷慢 买MPV的今年千万别出手, MPV市场可能要变天了。 来,看这个,比亚迪刚刚在成都车展上发布了第一款MPV“夏”, 标准的中大型尺寸, 长5145mm,宽1970mm,高1805mm 主…

学院个人信息|基于SprinBoot+vue的学院个人信息管理系统(源码+数据库+文档)

学院个人信息管理系统基于SprinBootvue的学院个人信息管理系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 后台模块实现 管理员模块实现 学生模块实现 教师模块实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获…

『功能项目』技能爆炸与伤害数值显示【13】

我们打开上一篇12怪物受击后显示受击状态UI的项目, 本章要做的事情是显示魔法球碰撞到怪物时产生的技能爆炸特效 与 显示伤害数值的功能 首先打开资源商店下载一个免费的技能特效 我们双击red技能效果预制体 我们要做的是当怪物受击时,生成这个red预制体…

公务员面试(c语言)

1./ 描述 //公务员面试现场打分。有7位考官,从键盘输入若干组成绩,每组7个分数(百分制),去掉一个最高分和一个最低分,输出每组的平均成绩。 //(注:本题有多组输入) //输入…

Trying to update a textarea with string from an OpenAI request

题意:把从 OpenAI 请求中得到的字符串更新到一个文本区域中。 问题背景: Can anyone assist me with an issue Im facing. Im trying to append a string received back from an OpenAI request to an exisitng textarea element. The requested string…

【ESP-IDF FreeRTOS】信号量

下一个内容,信号量。 先包含头文件。 #include "freertos/semphr.h" 我们通过队列可以进行任务间的数据传递,也可以通过队列来控制任务间的同步。如果我只需要控制任务而不需要传递数据,那么我们完全可以用信号量来代替队列。 …

VS2019开发CAN上位机

1、CAN分析仪,主要功能就是把CAN信号转换成电脑能接收的USB信号。索引号是指电脑连接了几台CAN分析仪设备,一般情况下都是一台,该值为0。不同CAN盒的二次开发文件不同 2、CAN上位机一般只能适应一个CAN盒,如果需要实现多个CAN盒通…

Elasticsearch - SpringBoot 查询 es 相关示例

文章目录 前言Elasticsearch - SpringBoot 查询 es1. ES 整合2. 示例-简单匹配查询3. 示例-简单范围查询4. 示例-布尔查询-分页查询-match 查询5. 示例-布尔查询-分页查询-term查询 前言 如果您觉得有用的话,记得给博主点个赞,评论,收藏一键三…