每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
Nvidia的高级研究员Jim Fan近日预测,基础模型领域将在不久的将来迎来重大突破。他特别看好类人机器人在日常生活中的应用潜力。
作为Nvidia的高级研究科学家,Jim Fan预计在未来两到三年内,机器人技术将取得重大进展。在接受红杉资本的采访时,Fan表示希望看到机器人领域出现类似GPT-3在语言处理中的“突破时刻”,也就是一种能像GPT-3对语言模型那样,改变机器人基础模型的技术飞跃。
Fan目前领导Nvidia的“具身人工智能”(Embodied AI)研究项目,他的团队正在开发名为Project Groot的项目,旨在为类人机器人创建基础模型。
Fan提到,虽然技术突破可能会在未来几年内实现,但类人机器人要真正进入日常生活仍需时间。他强调:“机器人不仅要在技术上成熟,还必须价格实惠、能够大规模生产,同时硬件的安全性、隐私问题和相关法规也都是不可忽视的因素。”
Fan认为类人机器人有巨大的潜力:“世界的设计围绕着人类的形态展开,比如餐厅、工厂、医院的设备和工具,都是为了人类的身体和双手设计的。”因此,Fan相信一款功能强大的类人机器人理论上可以胜任任何人类可以做的工作。他预计,类人机器人硬件的生态系统将在两到三年内准备就绪。
Nvidia在开发机器人AI时,结合了三种数据类型:互联网数据、模拟数据和现实世界的机器人数据。Fan指出,每种方法各有优劣,但它们的结合才是成功的关键。他还将目前的机器人状态与GPT-3突破前的自然语言处理相比较,认为未来机器人将从专门化模型逐步演变为通用模型,并根据特定任务进行微调。
目前,Fan认为数据获取是最大的挑战。他表示:“我觉得我们还没有充分挖掘Transformer模型的潜力。”一旦数据管道完全建立,模型的规模就可以进一步扩展。
Nvidia也在研究“Eureka”等技术,利用语言模型为机器人训练生成奖励函数,从而自动化以往的手动过程。除此之外,Fan的团队还在研究虚拟环境中的AI代理,例如视频游戏。他认为,虚拟和物理代理的研究存在相似之处,最终目标是打造能够控制两者的单一模型。
Fan引用了Nvidia CEO黄仁勋的一句话:“所有可以移动的东西,最终都会变成自主的。”他补充道:“如果我们相信未来会有像iPhone一样多的智能机器人,那现在就应该开始打造它们。”
尽管Fan对未来持乐观态度,但他也承认挑战依然存在,比如如何将快速的无意识运动控制与较慢的有意识计划和推理过程集成到一个模型中。
在加入Nvidia之前,Fan曾在OpenAI实习,并在斯坦福大学著名AI研究员李飞飞的指导下完成了博士学位。