英伟达Jim Fan预测:未来2~3年机器人将迎来“GPT-3时刻”

news2024/11/15 12:00:37

在这个科技不断进步的时代,我们终将迎来“与机器人共存”的未来。你认为,未来会是人机和平共处,还是《终结者》式未来?

随着科技发展,这个未来似乎近在咫尺。昨日外媒 The Decoder 发文报道,在最近的一次红杉资本的采访中,Nvidia 高级研究员 Jim Fan 预测:在未来两到三年内,机器人基础模型将取得重大进展。

我希望我们能在未来两到三年内,看到机器人基础模型的研究突破,出现机器人技术的"GPT-3 时刻”。

Jim Fan:NVIDIA 具身AI代理研究领导者

Jim Fan ,师从“人工智能教母”李飞飞教授,在斯坦福大学视觉实验室取得博士学位。研究领域包括了多模态基础模型、强化学习、计算机视觉、具身人工智能等多项前沿技术领域。

2016年,Jim Fan 曾作为 OpenAI 的第一个实习生,与 Ilya Sutskever 和 Andrej Karpathy 合作共事;

此外,Jim 还曾在百度 AI Labs、以及 Yoshua Bengio 领导的 MILA 研究院实习。

毕业后,Jim 加入 NVIDIA,继续投身人工智能研究。在2023年,Jim 带头开发了 Voyager ,第一个基于大语言模型的能熟练游玩 Minecraft 的 AI 代理;

以及“2023英伟达十大项目之一”的 Eureka ,利用大语言模型赋能机器手,完成三十余项复杂精巧的任务,例如转笔。

此外,Jim 的成果还有 MineDojo(利用互联网知识构建的开放式代理)、VIMA(最早的机器人操作多模态基础模型之一)等等。其作品还被诸多媒体引用、报道,可谓是硕果累累。

机器人的“GPT-3时刻”:2-3年开启新的篇章

对于具身智能发展现状,Jim认为:现在具身智能发展空前鼎盛,在未来2-3年内,机器人基础模型的研究可能会取得突破性进展,从而实现更通用的机器人能力。

从2023年开始,具身智能热度可谓是水涨船高,无论是高校还是产业,相关的研究可谓是层出不穷。发展至今,人形机器人已经在某些特定领域可以帮助、解放人类的工作,比如手工、做饭、参与工作链等。

NVIDIA 创始人黄仁勋也表示:“开发通用人形机器人基础模型,是当今 AI 领域中最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术,致力于在人工通用机器人领域实现突破。”

进入2024年,在黄仁勋大力支持下,Jim 与他的老同事 Yuke Zhu 教授一起,组建起英伟达最壕AI实验室——GEAR (Generalist Embodied Agent Research),立项 Project GR00T ,为通用具身智能体构建基础模型。

GR00T 驱动的机器人,将能够理解自然语言,并通过观察人类行为来模仿动作,来快速学习人类身体的协调性、灵活性和其它技能,以适应现实世界并与之互动。

Jim 认为:2024年,将是属于机器人、游戏AI和模拟的一年。

至于为什么选择人形机器人,Jim是这样回答的:

在李飞飞教授门下时,我就转向了具身智能研究方向。人类社会是围绕人类的化身、人类的外形因素构建的,我们所有的餐馆、工厂、医院以及所有设备和工具——它们都是为人类形态和人类双手设计的。所以我在人形机器人上看到了巨大的潜力。理论上,人类可以做的任何任务。有能力的人形机器人也能做到。 我预测,人形机器人硬件的生态系统只需要两到三年就可以准备就绪。

另外,Jim 还有一个长期愿景:

在未来2-3年内,机器人基础模型的研究就能开启新的篇章。10年后,编码代理模型会有人类软件工程师的水准。人形机器人也一样,会具备人类水平的敏捷性和可靠性。

然而,真正想让机器人落地投产还会牵扯到诸多问题。如果让机器人在日常生活中的广泛采用,我们还有这些问题需要讨论:

  • 技术突破的进度限制;

  • 机器人合理定价和大规模投产成本问题;

  • 硬件安全问题;

  • 个人隐私和机器人相关法律完善问题。

机器人的落地难度与自动驾驶汽车相似,甚至比自动驾驶汽车的普及更加困难啊。

未来挑战:数据采集与模型架构仍是难题

对于当下机器人发展面临的问题,尽管 Jim Fan 对前景持乐观态度,但他认为挑战仍然存在。目前最大的难题,还是数据采集的问题:

英伟达在开发机器人人工智能时,采用了三种数据类型的结合:互联网动作数据、模拟数据、和真实世界机器人数据。三种方法各有优势与不足,只有将它们结合,才是成功的关键。transformer接收token并输出token,受限于数据的质量,机器人的表现也会不尽人意。

针对具身智能的模型架构,Jim 也提出了自己的见解:

所有移动的东西最终都将是自主的,对于机器人模型,我觉得我们还没有突破架构的极限。还是那个问题,数据是一个难题,我们不能从互联网上下载一些人类动作数据,它们不会附带模型控制数据。一旦我们能利用这些高质量操作扩大数据管道,我们就可以将transformer推到极限;一旦数据管道完全开发完成,就可以看到机器人模型出现一些新兴的特性。我愿称之为具身智能的scaling law。

另外,将快速、无意识的运动控制,与较慢、有意识的规划和推理过程,集成到同一个模型中,并让这个模型可以同时运动和推理,依然是机器人尚待突破的技术壁垒。

笔者认为,从现在机器人技术的发展进度来看,机器人也许真的进入了“GPT-3 时刻”。与 GPT-3 等大语言模型进行比较的话,接下来,机器人可能也会出现类似的演变:

首先是专业的通用模型,然后是针对特定任务进行训练的微调模型,最后出现自主思考的模型。

如果未来真的出现自主思考的机器人模型,它会是《终结者》或“Moss”,还是“解放人类双手”的福音呢?

参考资料

 [1]https://the-decoder.com/nvidia-researcher-jim-fan-expects-gpt-3-moment-for-robotics-in-the-next-few-years/#summary  [2]https://blogs.nvidia.cn/blog/foundation-model-isaac-robotics-platform/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2150312.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins自动化部署后端项目看这篇就够了

本文主要讲解,使用Jenkins自动化部署后端工程。讲解怎么自动化部署前后的分离项目中的后端工程。 前提条件:本地需要Jenkins,如果你不知道怎么安装,可以看我的另外一篇文章。 Jenkins实现自动部署的步骤: 先拉取git…

Jboss 低版本JMX Console未授权

漏洞描述 此漏洞主要是由于JBoss中/jmx-console/HtmlAdaptor路径对外开放,并且没有任何身份验证机制,导致攻击者可以进⼊到 jmx控制台,并在其中执⾏任何功能。 影响范围 Jboss4.x以下 环境搭建 cd vulhub-master/jboss/CVE-2017-7504 d…

力扣题解2414

大家好,欢迎来到无限大的频道。 今日继续给大家带来力扣题解。 题目描述(中等): 最长的字母序连续字符串的长度 ​ ​字母序连续字符串 是由字母表中连续字母组成的字符串。换句话说,字符串 "abcdefghijklm…

linux 最简单配置免密登录

需求:两台服务器互信登录需要拉起对端服务 ip: 192.168.1.133 192.168.1.137 一、配置主机hosts,IP及主机名,两台都需要 二、192.168.1.137服务器,生成密钥 ssh-keygen -t rsa三、追加到文件 ~/.ssh/authorized_key…

分布式中间件-Pika一个高效的分布式缓存组件

文章目录 Pika简介Pika特性Pika解决的问题及应用场景Pika架构之存储引擎部署模式1、主从模式2、分布式集群模式 Pika快速上手1、二进制包方式2、源码编译方式2.1 支持的平台2.2 依赖的库软件2.3 编译过程2.4 启动 Pika2.5 清空已编译的结果2.6 Pika 的开发调试 3、容器化3.1 使…

【2025】儿童疫苗接种预约小程序(源码+文档+解答)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

【C++指南】inline内联函数详解

💓 博客主页:倔强的石头的CSDN主页 📝Gitee主页:倔强的石头的gitee主页 ⏩ 文章专栏:《C指南》 期待您的关注 目录 引言 C为什么引入了inline来替代C语言中的宏 inline的基本用法 定义inline函数 inline的优势与…

DAY20信息打点-红蓝队自动化项目资产侦察武器库部署企查产权网络空间

2.自动化-网络空间-AsamF 1.去GitHub上下载项目之后使用CMD打开 2.输入命令AsamF_windows_amd64.exe -v生成配置文件 3.AsamF会在~/.config/asamf/目录下生成config.json文件 C:\Users\Acer\.config\asamf 5.根据文档输入命令去查询所需信息(已经没有用了&#x…

C/C++通过CLion2024进行Linux远程开发保姆级教学

目前来说,对Linux远程开发支持相对比较好的也就是Clion和VSCode了,这两个其实对于C和C语言开发都很友好,大可不必过于纠结使用那个,至于VS和QtCreator,前者太过重量级了,后者更是不用说,主要用于…

解锁自动化新境界:KeymouseGo,让键盘和鼠标动起来!

文章目录 解锁自动化新境界:KeymouseGo,让键盘和鼠标动起来!背景:为何选择KeymouseGo?KeymouseGo简介安装KeymouseGo简单函数使用应用场景常见问题与解决方案总结 解锁自动化新境界:KeymouseGo,…

ISSTA 2024现场精彩:“杰出论文奖”超半数属于中国学者

ISSTA会议是软件工程领域中最具影响力的国际会议之一,也是中国计算机学会(CCF)推荐的A类会议。 第33届ISSTA会议已于奥地利维也纳圆满结束,这场盛会已经吸引了众多来自学术界和工业界的软件测试专家、研究人员和工程师&#xff0c…

学习C++的第三天!

C对C的函数部分的扩充 封装 #include <iostream> #include <memory.h> #include <stdlib.h> #include <string.h> using namespace std; using datatype int; //封装一个顺序表 class SeqList { private:datatype* ptr; //指向堆区空间的起始…

基于嵌入式的智能物流柜( 触摸屏/0.96寸oled屏)

演示 智能物流柜&#xff08;基础版&#xff09; 智能物流柜&#xff08;升级版&#xff09; 前言 这是本人在大二在学校接的一个简单的实验室项目&#xff0c;之前发布了一个&#xff0c;由于那是在暑假&#xff0c;家里器材有限&#xff0c;代码敲完之后&#xff0c;用面包板…

PyTorch深度学习快速入门教程【土堆】基础知识篇

Juptyer 版本&#xff1a; Python 3.9.19Pytorch 2.4.1 (pytorch0) C:\Users\25694>conda install nb_conda_kernels(pytorch0) C:\Users\25694>jupyter notebook使用conda环境的pytorch&#xff1a; 成功解决python.exe无法找到程序入口 无法定位程序输入点 shifte…

机器学习-深度学习数据集之打架斗殴识别数据集

关于“打架识别数据集”&#xff0c;这是一个专门设计用于训练计算机视觉模型以识别打架、摔倒以及持械行为的数据集。此类数据集对于开发安全监控系统至关重要&#xff0c;可以帮助在公共场所如学校、酒吧或地铁站等地及时发现潜在的暴力事件&#xff0c;从而快速采取行动来防…

anaconda的windows新手安装及配置教程(适用于物联网工程、计算机专业)

第一步:点击免费下载 点击我直达anaconda官网">——>点击我直达anaconda官网 第二步:跳过注册 第三步:下载windows版本 第四步:安装步骤 1.Next (下一步) 2.I Agree (我同意) 3.默认即可,下一步 4.安装地址可以选到D盘,如果没有默认也行,只是一个…

上传富文本插入文件时报错:JSON parse error: Unexpected character解决办法

方式一&#xff08;加密解密&#xff09;&#xff1a; 1.前端 &#xff08;1&#xff09;安装 crypto-js npm install crypto-js&#xff08;2&#xff09;util下创建asc.js asc.js import CryptoJS from crypto-js// 需要和后端一致 const KEY CryptoJS.enc.Utf8.parse(…

《Linux基础》练习操作

一、文件目录类操作 1. 创建新用户user&#xff0c;其中用户名为学生姓名首字小写(如:张三&#xff0c;用户名为zsan) 将/etc/passwd拷贝到/home/user下面。修改/home/user/passwd,在文件的第15行下添加“hello 学号姓名”&#xff0c;光标停留在 hello 学号姓名…

[漏洞复现]泛微e-mobile cdnfile文件读取漏洞分析复现

如果觉得该文章有帮助的&#xff0c;麻烦师傅们可以搜索下微信公众号&#xff1a;良月安全。点个关注&#xff0c;感谢师傅们的支持。 免责声明 本号所发布的所有内容&#xff0c;包括但不限于信息、工具、项目以及文章&#xff0c;均旨在提供学习与研究之用。所有工具安全性…

金属3D打印经济效益高吗?

在我国制造业迈向产业升级的重要阶段&#xff0c;3D打印技术如同一股强劲的新风&#xff0c;特别是在航空航天、汽车、生物医疗等领域&#xff0c;已成为复杂构件制造的“明星”技术。那么&#xff0c;对于众多生产厂家而言&#xff0c;金属3D打印的经济账到底怎么算&#xff1…