科技云报道:造完“大模型”,“具身智能”将引领AI下一个浪潮?

news2024/11/18 9:35:17

科技云报道原创。

资深机器人专家Eric Jang不久前曾预言:“ChatGPT 曾在一夜之间出现。我认为,有智慧的机器人技术也将如此。”

3月13日深夜,一段人形机器人的视频开始热传。

在视频中,Figure的人形机器人,可以完全与人类流畅对话,理解人类的意图,同时还能理解人的自然语言指令进行抓取和放置,并解释自己为什么这么做。

而其背后,就是OpenAI为其配置的大型语言模型。由于OpenAI模型还支持多模态输入,因此可为Figure提供高级视觉和语言智能。

而Figure本身,成立于2022年。从OpenAI 宣布介入与之合作,到今天它们共同推出一个能够自主对话和决策的机器人,只有13天。

具身智能的发展,显然正在加速。
在这里插入图片描述
具身智能进化速度超越想象

在去年的ITF World 2023半导体大会上,英伟达创始人兼CEO黄仁勋表示,人工智能下一个浪潮将是“具身智能”(Embodied Intelligence),是能理解、推理、并与物理世界互动的智能系统,AI与机器人的融合,具有很好的想象空间。

他还介绍了英伟达的多模态具身智能系统Nvidia-VIMA,能在视觉文本提示的指导下,执行复杂任务、获取概念、理解边界、甚至模拟物理学,标志着AI能力的显著进步。

此外,在特斯拉召开2023年年度股东大会上,马斯克展示了人形机器人Optimus的全新型号,和具身智能机器人几乎划等。

马斯克表示,人形机器人将是今后特斯拉主要的长期价值来源,他也认为,以具身智能机器人为代表的产品有望成为AI的下一浪潮。

1950年,图灵在他的论文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。

具身智能(Embodied AI)指的是,有身体并支持物理交互的智能体,如智能服务机器人、自动驾驶汽车等,具身智能机器人指的是,像人一样能够与环境交互感知、自助规划、决策、行动、执行任务的机器人。

它包含人工智能领域几乎所有的技术,包括机器视觉、自然语言理解、认知和推理、机器人学、博弈伦理、机器学习等,横跨多个学科方向,是AI的集大成者。

2023年是生成式AI的爆发之年,也被业内人士称为“机器人觉醒之年”。ChatGPT等生成式AI与人形机器人行业结合,开启了具身智能的时代。

今天,在大语言模型的普及和GPT-4等前沿模型的推动下,我们似乎见证了人工智能领域的一个新时代,人机交流也变得前所未有的流畅和无缝。

据2023年5月GGII发布的报告预测,预计到2026年,人形机器人在全球服务机器人市场中的渗透率预计将达到3.5%,市场规模超过20亿美元。

各大科技公司和学术界的顶尖学者也不断涌入这一领域的研究与产品开发当中。

然而,在繁荣热潮的背后,潜在的困境却也如影随形。尽管ChatGPT等模式革命性地变革了AI领域,但它们在理解力、联想力和交互能力等方面,仍然未能完全满足公众的期望。

这促使我们对看似毫无阻碍的进步进行重新评估,同时希望经过不懈努力,人们能攻克实现真正的具身智能所面临的复杂挑战。

当机器人遇上大模型

近年来,国内多家企业发布了自主研发的人形机器人。人形机器人是所有机器人里最复杂的一类,“具身智能”对机器人来说意味着什么?当大模型和机器人相结合,会发生哪些变化?

在“具身智能”的状态下,机器人具备自主学习和计划能力,遇到障碍和困难可以自主反应、快速解决。

目前国内已有200多个大模型,实际上人形机器人是一个载体,当大模型和人形机器人相结合时,机器人可以帮助AI大模型感知物理世界,操作环境上下文;机器人利用多模态感知控制自己的身体,完成复杂的任务。

2023年上半年,以ChatGPT为代表的大语言模型爆炸式“出圈”,大语言模型以及结合视觉等多种传感器的复杂多模态模型的成熟,是实现机器人完成具身智能的关键先决条件。

最为关键的一点是,成熟的“AI大模型”使机器人可以从程序执行导向转向任务目标导向,向通用机器人的发展迈出坚实步伐。

通俗点来说,“大模型”与机器人的融合,让发展已久的机器人能真正地长出“脑子”。

机器人的“云大脑”通过在云、边、端分布式算法、算力和大数据形成机器人智能,通过 5G等无线安全高速网络连接云端大脑和机器人本体:机器人本体在“端”侧完成各种任务。

云端大脑通过人工增强、多模态融合AI和数字生成等先进技术,实现机器人智能地自我学习、不断进化与成长。

AI真正赋能到各行各业、智能机器人走进千家万户的时代正在到来,伴随着技术的突破带来性价比提高,在未来,具身智能渗透率将有望加速提升。

根据高盛预测,在理想状态下,若机器人软硬件在短期内产生重大技术突破,实现具身智能的同时年均降本达到20%,人形机器人全球市场空间 有望在2035年达到1540亿美元,接近2021年智能汽车的市场空间,2025-2035年复合增长率达到94%。

若是在乐观情况下,人形机器人的出货量有望在2035年达到100万台,市场空间2025-2035年复合增长率有望达到59%。

人形机器人的时代正在到来

2023年11月2日,工信部印发《人形机器人创新发展指导意见》(以下简称《意见》)为人形机器人发展指明方向。《意见》中指出,到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产。

2024年1月17日,AI研究实验室Midjourney创始人大卫·霍尔茨(David Holz)在社交媒体的一篇帖子写道:“我们有理由期待,到2040年,地球上将有10亿个人形机器人。到2060年,世界上将会有1000亿人形机器人。”这预示着人形机器人的新时代正在到来。

近年来,具身智能在学术界的关注度持续升温,在CoRL(机器人学习大会)上,具身智能领域的论文数量呈现出快速增长的趋势。

而在2023年初举行的 IROS(智能机器人及系统国际会议)上,具身智能也被作为一个极为重要的议题进行了深入探讨。

在2023年8月18日的世界机器人大会人形机器人技术与产业发展论坛上,2000年图灵奖获得者、中国科学院院士、清华大学交叉信息研究院院长姚期智指出,通用人工智能(AGI)的未来发展需要具备具身实体,与真实物理世界交互以完成各种任务。

只有这样,才能为产业带来更大的价值。

随着中国社会老龄化程度将逐渐加深,劳动力短缺问题日益凸显,同时中国制造业劳动力总量下降,人工成本上升,因此“机器替代人”成为了重要趋势。

目前,全球工业机器人部署量稳定增长,中国已成为世界最大的机器人市场。人形机器人在结构上与人类相似,未来有望覆盖、替换所有原本需要人类劳动力的作业场景。

根据赛迪顾问的报告,尽管目前各家人形机器人仍处于原型机研发的早期阶段,但是其带来的潜在技术变革以及对某些生产生活场景的改变值得高度关注。

人形机器人在制造业、航天探索、生活服务业、高校科研等领域具有较大的发展潜力,预计到2025年,人形机器人将有望实现在制造业场景应用的突破,小批量应用于电子、汽车等生产制造环境。

在中国,智能制造领域将成为人形机器人首个实现大规模应用的领域。人形机器人将围绕工业制造、商用服务和家庭陪伴三大场景,重新定义人工智能时代的工人,把人类从重复性劳动中解放出来。

商用服务场景是人形机器人最快应用的市场,而家庭落地场景则是人形机器人最具潜力的应用市场。

近日,美国科技公司英伟达宣布成立通用具身智能体研究实验室GEAR。

去年以来,包括中国电科21所、智元机器人、科大讯飞、小鹏汽车、傅利叶智能在内的多家国内企业相继发布了自主研发的具身智能机器人,并有多家企业拟在今年实现具身智能的商业化落地。

业界普遍认为,2024年有望成为具身智能商业落地元年。

虚拟世界,与现实世界形成鲜明对比,提供了一个更为精密和可控的环境,使得智能体能够进行更加大胆和创新的行为。

这不仅是对人类智能的延伸,更是一个通用人工智能诞生和发展的舞台,为超越人类智能水平的AI提供了理想的试验场和成长空间。

或许,这也是各大科技公司对具身智能与虚拟世界寄予厚望的深层次原因。

这预示着,一个更加智能、更加互联的未来正向我们走来。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1541622.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录阅读笔记-栈与队列【有效的括号】

题目 给定一个只包括 (,),{,},[,] 的字符串,判断字符串是否有效。 有效字符串需满足: 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。注意空字符串可被认为是有效字符串。 …

python必刷算法

数组 二分法 二分法满足从小到大排序无重复元素 1 两个边界&#xff0c;left,right 2 中间值的选择 3 边界问题考虑有两种 left < right 当left < right的时候&#xff0c;说明mid比较的时候已经比较了left right def search(self, nums: List[int], target: int) ->…

数据分析与挖掘

数据起源&#xff1a; 规模庞大&#xff0c;结构复杂&#xff0c;难以通过现有商业工具和技术在可容忍的时间内获取、管理和处理的数据集。具有5V特性&#xff1a;数量&#xff08;Volume&#xff09;&#xff1a;数据量大、多样性&#xff08;Variety&#xff09;&#xff1a…

基于VS code 实现Java前后端打通—基础—使用Springboot+postgreSql+mybatis+Navicat

前言&#xff1a; 作者学习webjava后的而总结&#xff0c;总的流程概括就是先使用springboot创建项目&#xff0c;在application.properties中完成相应的postgreSql和mybaits的环境配置和.xml文件中dependecy依赖配置&#xff0c;entities实现数据表的类型模板&#xff0c;分别…

隐私计算实训营学习四:SecretFlow的安装和部署

文章目录 一、SecretFlow安装二、SecretFolw部署模式简介三、SecretFlow部署-仿真模式四、SecretFlow部署-生产模式 一、SecretFlow安装 SecretFlow运行要求&#xff1a; Python > 3.8操作系统&#xff1a;CentOS7、Anolis8、Ubuntu 18.04/20.04、macOS 11.1、WSL2资源&am…

前端框架前置课(1)---AJAX阶段

1. AJAX入门 1.1 AJAX概念和axios使用 1.1.1 什么是AJAX? 1.1.2 怎么用AJAX? 引入axios.js 获取省份列表数据 1.2 认识URL 1.3 URL查询参数 1.4 常用请求方和数据提交 1.5 HTTP协议-报文 1.5.1 HTTP响应状态码 1.5.1.1 状态码&#xff1a;1XX&#xff08;信息&#xff09…

论文阅读:UniFormer和UniFormerV2

文章目录 UNIFormer动机方法动态位置嵌入(DPE)多头关系聚合器(MHRA) 模型代码总结 UniFormerV2动机方法整体框架实现细节 总结 UNIFormer 本文主要介绍了UniFormer: Unified Transformer for Efficient Spatial-Temporal Representation Learning 代码&#xff1a;https://git…

购买腾讯云服务器需要多少钱?价格表查询

腾讯云服务器多少钱一年&#xff1f;61元一年起。2024年最新腾讯云服务器优惠价格表&#xff0c;腾讯云轻量2核2G3M服务器61元一年、2核2G4M服务器99元一年可买三年、2核4G5M服务器165元一年、3年756元、轻量4核8M12M服务器646元15个月、4核16G10M配置32元1个月、312元一年、8核…

Python综合实战案例-数据清洗分析

写在前面&#xff1a; 本次是根据前文讲解的爬虫、数据清洗、分析进行的一个纵隔讲解案例&#xff0c;也是对自己这段时间python爬虫、数据分析方向的一个总结。 本例设计一个豆瓣读书数据⽂件&#xff0c;book.xlsx⽂件保存的是爬取豆瓣⽹站得到的图书数据&#xff0c;共 6067…

html网页制作-3D旋转卡片

网页制作-3D旋转卡片 两种旋转卡片的制作 旋转卡片&#xff08;1&#xff09; 代码 html代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-wid…

Transformer的前世今生 day03(Word2Vec、如何使用在下游任务中)

前情回顾 由上一节&#xff0c;我们可以得到&#xff1a; 任何一个独热编码的词都可以通过Q矩阵得到一个词向量&#xff0c;而词向量有两个优点&#xff1a; 可以改变输入的维度&#xff08;原来是很大的独热编码&#xff0c;但是我们经过一个Q矩阵后&#xff0c;维度就可以控…

linux命令(八)

搜索 其实很多人使用linux的是因为服务器是linux系统&#xff0c;既然是服务器&#xff0c;那查找日志肯定是大家用的很多的了&#xff0c;这一节就来介绍一下搜索的命令 grep 先看一下我的文件中的内容是什么 查找不包含该字符串的行 -v v代表的invert-match(不匹配的行) …

基于Java中的SSM框架实现电能计量与客户服务管理系统项目【项目源码+论文说明】计算机毕业设计

基于Java中的SSM框架实现电能计量与客户服务管理系统演示 摘要 当前时代的两个突出特征是世界经济一体化和以计算机为代表的信息技术的迅速发展。为了使组织在激烈的竞争中保持实力和发展&#xff0c;它必须对迅速变化的环境做出有效而有效的响应。 管理信息系统的应用可以提供…

202446读书笔记|《夜风颂》——生命的内核是过往和希望 有情在朝暮 长聚长相思

202446读书笔记|《夜风颂》——生命的内核是过往和希望 有情在朝暮 长聚长相思 序现代诗古体诗 《夜风颂》作者王锴&#xff0c;前段时间加入书架的书&#xff0c;前边有几首现代诗挺惊艳&#xff0c;蛮喜欢的&#xff0c;后边古体诗稍逊色些。值得一读的一本小诗集。 序 海鸥之…

11.创建后台系统项目

后台系统项目 兼容性 vite官网&#xff1a;https://vitejs.dev/ vite中文网&#xff1a;https://cn.vitejs.dev/ vite需要node.js版本 >14.0.0&#xff0c;建议16 node -v 查看版本号 创建项目 进入存放目录 执行命令 npm create vitelatest 选择vue框架 选择typescript…

缓存穿透、缓存击穿、缓存雪崩及其解决方法

缓存穿透、缓存击穿、缓存雪崩是redis的三大问题。 在介绍这三大问题之前&#xff0c;我们需要先了解Redis作为一个缓存中间件&#xff0c;在项目中是如何工作的。首先看一下在没有缓存中间件的时候的系统数据访问的架构图&#xff1a; 客户端发起一个查询请求的时候&#xff…

一个软开关,长按开机,自动关机的实现。

连接说明&#xff1a; 1.ADP_PWR接适配器输入插座 当适配器插入的时候 ADP_PWR接入适配器7.4~8.4V电压 2.ON/OFF_KEY 接开关按键&#xff0c;当开关按下的时候&#xff0c;ON/OFF_KEY 接入电池电压 7.4V 3.ON/OFF_CTRL接单片机IO口 开机实现说明&#xff1a; 1.长按开…

存储随笔原创科普视频首播~

一周之前&#xff0c;存储随笔创建了B站账号。小编利用上个周末休息时间专门研究了B站视频录制的各种方案。发现并没有想象的很容易&#xff0c;先花了很长时间准备了一个PPT&#xff0c;再准备演讲大纲&#xff0c;最终磕磕绊绊完成了首期原创视频录制&#xff01; 可能不尽如…

Mybatis中显示插入数据成功,但在数据库中却没有显示插入的数据

1、在mybatis-config.xml中查看是否添加了JDBC&#xff0c;并引入了映射文件 2、在测试文件中&#xff0c;结尾是否添加提交事务&#xff1a;sqlSession.commit() 添加了这一步就能够将数据提交到数据库中&#xff0c;最后再关闭事务&#xff1a;sqlSession.close() * 如果运…

基于SpringBoot校园外卖服务系统设计与实现

点赞收藏关注 → 私信领取本源代码、数据库 一、项目概述 项目名称&#xff1a;基于SpringBoot校园外卖服务系统设计与实现 项目架构&#xff1a;B/S架构 开发语言&#xff1a;Java语言 主要技术&#xff1a;SpringBootMybatisMySQL 运行环境&#xff1a;Windows7以上、J…