摸着石头过河的具身智能公司,正在寻求“确定性”

news2024/9/25 19:23:57

在种种不确定因素之下,对于具身智能,唯一可以确定的是,其未来巨大的市场空间。从纷纷入局的科技巨头、创业公司的市场现状即可窥见一二。而类比到自动驾驶,其也是抛开层层迷雾后才得以在今天看见曙光。 

相信,于具身智能而言,站在如今大模型和自动驾驶的臂膀上,其成熟期将来得更快。 

作者|思杭 

编辑|皮爷 

出品|产业家 

“具身智能注定会成为最具价值的AI应用,未来还可能会改变我们与科技的交互方式。” 

2024年5月,英国自动驾驶独角兽Wayve完成了10.5亿美元C轮融资,这也是英国史上最大规模的AI融资,本次融资方除了老股东微软,还有新入局的软银集团和英伟达。值得注意的是,上述正是Wayve联合创始人兼CEO在完成融资当天写下的一句话。 

令人好奇的是,为什么一家自动驾驶公司要在融资当天提到具身智能,甚至还极为看好?不仅如此,仔细研究融资方还能发现,在不少具身智能公司里,都有英伟达的身影,比如年初的Figure。 

实际上,从自动驾驶到具身智能,每一个前沿AI领域都少不了英伟达的参与。那么,自动驾驶与具身智能究竟有何关系? 

如果说,“自动驾驶的存在是取代司机,那么具身智能的存在就是替代整个人类。”当然,这只是跟随如今互联网风格的一种狭隘理解。自动驾驶与具身智能的真正相似之处是,从技术到底层逻辑的相似。而一种更好的理解则是,既然2024是自动驾驶的商业化元年,那么同样地,它也见证了具身智能的“元年”。

据南方都市报统计,从2023下半年至今,与具身智能概念相关的公司,已有12家实现融资。而更夸张的是,华为天才少年“稚晖君”辞职后创立的智元机器人,过去一年时间就完成6轮融资,估值一路飙升至70亿元。 

具身智能赛道的疯狂还不止于此,从马斯克到AI知名学者李飞飞,从英伟达、OpenAI甚至到国内几乎所有互联网大厂,全部纷纷涌入具身智能赛道,用脚投票一致看好这个如今AI大模型加持下的机器人产业。 

然而,这个看起来波涛的赛道,如今真的如此光明吗?摆在它前方的,究竟是何种机遇和挑战? 

一、2024,机器人开始有了人的“身体”

回溯过去70多年人工智能的历史长河中,有几个极为关键的标志性事件,其中一件就发生在70年代的日本。1964年,日本早稻田大学教授加藤一郎开始潜心研究人工下肢 ,五年时间,世界上第一个双足机器人WABOT-1诞生。 

这个当时行走一步要45秒,步伐也仅有10厘米左右的机器人马上就引起了全世界的轰动,要知道,彼时的人工智能才刚刚起步,从操控到感知,一切都还处于探索初期。因此,WABOT-1的问世则也标志着整个人工智能发展史上的一个重要里程碑。 

不仅如此,世界上第一个双足机器人在日本诞生后,对于抓住了先机的日本,汽车和电子制造业的崛起也随之而来。而在机器人领域,日本更是占据了整个机器人产业的半壁江山。 

尽管早在70年代人形机器人就有了“雏形”,然而从自然语言到操控、感知、决策等等人工智能领域的关键性技术都未有突破,这也导致在过去很长一段时间,关于人形机器人的发展也不得不按下暂停键。 

而此后的机器人领域则开始围绕着“非人形”机器人展开,比如工业场景里常见的机械臂。可以说,由“ABB、库卡KUKA、发那科FANUC和安川电机YASKAWA”组成的机器人“四大家族”,地位至今都难以撼动。 

如果说当年,世界上第一个人形机器人的诞生对后续的人工智能发展,发挥了至关重要的作用;那么今天,人工智能领域的重大突破,同时也让停滞不前的“人形机器人”产业重新 找回属于自己的光环。 

据不完全统计,在AI大模型风口上的2023年,单单是以“人形机器人”或“具身智能”概念入局的创业公司就有24家;而到了今年,截至2024年8月,这条赛道共聚集了29家创业公司。

在这其中,不仅有一年内连续融资6次,估值达70亿人民币的智元机器人,更有不少被阿里、腾讯、华为、美团等“选中”的初创公司。 

而在过去这一年,资本的疯狂也再一次证明了人形机器人的“觉醒”:据IT桔子统计,2023年中国一级市场机器人行业融资金额达240亿元,单笔十亿元量级以上投资事件约4起。 

在2024年世界人工智 能大会上,一场“人形机器人盛宴”让其火热程度更加具像化。 

而与此同时,在海外,这场盛宴则要更为壮观,从特斯拉的“擎天柱”(Optimus)到今年3月刷屏的Figure AI,再到英伟达的人形机器人通用基础模型GR00T,可以说,对于这些逐梦AI的硅谷科技企业而言,它们对人形机器人的追逐和野心,以及害怕错过(FOMO)的焦虑,无一不暴露在这场盛宴之下。

同样地,作为走在AI前沿的国内科技企业,也并没有人想错过入局人形机器人的最佳时间点。 

对此,一些自身有大模型能力的科技大厂,选择的是投资,并以大模型赋能机器人的方式入局这一新赛道,如华为、百度、腾讯、阿里、字节;甚至一些有硬件研发基础的企业不惜重金自研入局,如科大讯飞、小米。 

而另一些更聚焦实际场景的科技企业则是用投资的方式,更垂直、也更有针对性地为特定场景打造属于他们的人形机器人,如美团、小米。 

2023年,有鹿机器人联合阿里云通义千问共同发布了具身智能大模型LPLM-10B;同年12月29日,人形机器人第一股“优必选”正式登陆港交所,腾讯成为优必选最大机构股东。而就在最近,北京银河通用机器人有限公司也完成了7亿元的天使轮融资,其中投资方就包括了美团。 

上述种种信号都在表明,在科技企业、创业公司、老牌机器人厂商等等参与者的合力之 下,人形机器人正在一步步走向产业,走向有着千家万户的现实世界。 

二、通用机器人之前:

人形机器人的形态之争

从1970年的世界首个人形机器人到以机器人四大家族为首的非人形机器人,再到今天重新觉醒的人形机 器人,为什么一有“机会”就会发展人形机器人?而机器人又为何必须是“人形”?人形机器人的魅力究竟在哪? 

对此,产业各界都给出了不同的解释。更为感性的说法是,机器人的形态越像人,就越符合大众对机器人的幻想,这也是为什么科幻电影中的机器人大多都与真人无异。 

但如果站在更为理性和客观的角度,机器人之所以是人形,实际上是为了更符合人类对一个全能、通用机器人的期待。UniX AI创始人兼CEO杨丰瑜告诉产业家,“我更愿意将人形机器人称之为通用的具身智能机器人。当机器人进入到L5阶段,只需一个通用的机器人即可完成扫地、洗衣服、取快递等全部家务。” 

因此,一个更好的理解便是,无论是目前的人形机器人,还是具身智能,他们都是为了走向未来的通用机器人。而至于机器人的形态,究竟是人形还是非人形,是双足还是轮式,目前业界可以分为三个派别,分别是激进派、温和派和保守派。

首先是身为激进派的马斯克,在6月的特斯拉股东大会上,其宣称将于明年量产1000台双足人形机器人Optimus。 

相比之下,国内一众机器人创业者则较为温和。比如,银河通用所发布的GALBOT就是一个身高173CM的轮式双臂人形机器人,再比如,上半年刚成立的UniX AI,已发布并即将量产的Wanda也同样是轮式双臂机器人;而与此同时,据产业家了解,双方公司都在默默研发双足人形机器人,并正在着手解决相关技术难题。 

而对于机器人的形态问题,也有不少“保守派”不认可或不看好双足。 

在这其中,最为典型的两个代表,一个是猎户星空,其董事长兼CEO傅盛认为,“双足机器人目前很难成功商业化,如果落地到产线上工作,没有三五年根本不可能。”另一个则是知名人形机器人公司Sanctuary AI,其创始人Geordie Rise则是最近在X平台上发文称,“几乎所有工作都更适合在有轮子的环境下完成”,甚至又补充道,“双足人形机器人是愚蠢的”。 

然而,在如今这场机器人的形态之争下,无论是双足还是轮式,大家的终点都只有一个,即通 用机器人。 

三、从技术路线到场景,

具身智能企业“摸着石头过河”

简单来理解通用机器人,就是既会做饭、洗衣服,又会打扫卫生、取快递,而这也就意味着机器人需要能够更 好地掌握真实的物理世界。 

“在此之前,上一代的机器人并没有环境感知能力,其单纯依靠外围设备的节拍信号驱动来执行固定运动,也没有智能可言;而未来的人形机器人则一定是具身大模型+通用的人形机器人,两者缺一不可。”银河通用向产业家表示。 

而这也就诠释了为什么具身智能,或人形机器人的风口出现在如今大模型的浪潮之下。 

从整个人工智能的发展角度来看,AI大模型为机器人领域所带来的是更强大的感知能力。 在银河通用看来,这种强感知能力是建立在“大参数模型和巨量数据展现出来的智能,它能将长任务拆解成短任务,再将短任务拆解成机器人的运动”。 

在机器人领域,一个最大的难点便是缺乏与物理世界的真实数据,而得不到这些数据,就无从对机器人进行训练;即使是互联网上得到的信息,在过去也很难根据这些信息进行扩展,并使机器人更好地理解世界。 

而大模型则很好地解决了这一问题。在杨丰瑜看来,如今的大语言模型已经实现了视觉语言上的智能涌现,这就意味着,通过互联网上的数据,机器人的感知已经出现了相当强的泛化,因此能够更好地理解真实的物理世界。 

实际上,除了具身智能,被大模型随之带火的还有自动驾驶。像开篇提到的英国自动驾驶独角兽Wayve在融资当天,不惜花大量笔墨描绘了一个属于“具身智能”的未来,类似的言论也同样出现在不少机器人公司的内部。 

其中,银河通用在对具身智能的诠释中就提到,“具身智能是一个相对宽泛的概念,像自动驾驶、扫地机器人,严格意义上来说都属于具身智能,当然也包括我们今天在做的拥有具身大模型,能主动干活的人形机器人。” 

此外,关于自动驾驶与具身智能的相似性,UniX AI创始人杨丰瑜则进行了更具象的类比,“如今的具身智能,其实更像2015、2016年的自动驾驶,仍然处于缺少真实数据的阶段。而如果以L0-L5几个阶段来诠释,目前大多数具身智能公司都在L0到L4的过程中,而到真正的L5则还有一段距离。具体而言,L4状态指大多数场景下,机器人可以完成某个指定动作;而L5则指任意场景下,机器人可以完成某一动作。现阶段,大家所缺少的便是真实数据。” 

但自动驾驶和具身智能也都各有各的难点,前者的难点在于安全性,而后者的难点则在于数据获取。 

为解决具身智能目前的种种挑战,目前市面上不同企业内部的技术路线都各不相同。从具身智能公司的创始团队背景就得以窥见,从大厂机器人实验室到智驾公司,甚至连从AI顶尖院校毕业的创业者都来自不同科系,可以说,在这个仍发展初期的具身智能赛道上,各路大神在各显神通。

无法达成共识的还不仅是技术路线,对于机器人的落地场景,尤其是未来走向通用机器人的人形机器人,究竟谁能更快地实现商业化,或哪些更适合当下的具身智能机器人?目前都还并没有定论。 

“目前整个行业,大家都还处于摸索PMF的阶段,很难说B端和C端哪条路更容易或有利于商业化。”杨丰瑜向产业家说到。 

的确如此,如果说在过去非人形机器人阶段,商业化较为成熟的场景是生活服务、智能仓储和智能制造。那么对于如今的具身智能的人形机器人阶段,则既有面向B端的,也有从C端入手的。 

比如,具身智能公司UniX AI即将发布的轮式双臂机器人Wanda面向的就是家庭场景。而之所以先选择C端,有几方面考虑。在杨丰瑜看来,首先,针对具身智能缺乏真实数据的特点,如果能用脱敏处理从用户端获取更广泛的真实数据,从而形成数据飞轮,从这一角度来讲则可以极大地增强机器人的泛化能力。 

然而,对于处于发展初期的当下,究竟何种场景更有利于具身智能发展还是未知数,因此UniX也并没有完全将场景限定在C端。另一方面,相较于B端“强替代”的场景,C端的容错率也更高。 

通常来讲,在B端,企业选择是否要大规模使用某类机器人则要根据人工成本进行对比,因此这也决定了B端更复杂的商业逻辑。 

然而,毋庸置疑的是,从机器人产品本身出发,不同于C端场景,B端场景并不会如此多样化。与此同时,这也意味着,在缺乏数据的当下,B端机器人的技术难度也相对较低。 

对此,目前不少具身智能公司都选择从toB出发。最为代表的则是银河通用,在他们看来,“现阶段先落地在B端场景是更好的选择,当技术积累到一定的程度,再推动其走进家庭。”据银河通用机器人透露,目前GALBOT计划在商超、车厂、工业、物流、科研等领域进行更深入的场景验证和应用落地。 

可以看到,从相差各异的技术路线,到难决高下的落地场景,如今具身智能企业都正在探寻更适合自己的路。 

四、人形机器人的「确定性」在哪?

英国自动驾驶独角兽Wayve之所以成立自动驾驶公司,其更深层次的意义实际上是实现“具身智能”的愿景。 

“从理论上,如果说自动驾驶的感知和决策已经达到成熟,那么具身智能的技术成熟度也没有问题。”具身智能领域的某业内人士告诉产业家。 

但如果说,2024是自动驾驶的商业化元年,那么,具身智能的“确定性”又在哪? 

目前看来,从机器人形态到技术路线,从落地场景再到商业模式,关于具身智能的一切似乎都充满了不确定性。 

甚至更夸张地讲,在过去很长一段时间,究竟什么是人形机器人,什么是通用机器人?又该如何定义具身智能?概念都还并不清晰。而实际上,业界人士对具身智能不同定义的背后,反映的正是各家技术路线的差异。

比如有些企业将具身智能定义为需要与物理世界交互的智能体,而有些则将其定义为一具属于AI的身体。而这两者的区别就在于,前者更注重数据获取,后者则更注重AI或大模型技术的积累。

而如果抛开现实层面的阻碍去谈理想。具身智能的未来是面向通用机器人。但如今,我们距离通用机器人究竟有多远? 

如果用L0-L5做类比,在上文中提到,UniX AI创始人杨丰瑜认为,如今的具身智能机器人正在接近L4阶段的过程中。而真正的通用机器人则是L5阶段。 

根据全球顶级对冲基金Coatue近日发布的一篇关于“具身智能”的报告《The Path to General-Purpose Robots》(通往通用机器人之路),如果将具身智能的阶段与自动驾驶的阶段做类比,“过去无人驾驶汽车从L1到L2花了大约20年,而从L2到现在的L4只用了不到10年;那么人型机器人从L1到L2用了大约50年,从L2到L4预计只 需要不到5年。” 

最后,从商业化周期来看,摆在具身智能企业 面前的,也不只有技术及数据获取障碍,单从研发周期和研发成本以及硬件成本来算,具身智能的商业化之路也同样充满了不确定。 

五源资本董事总经理Peter将目前的通用机器人比作1980年的PC。早在机器人还未出现在大众视野时,Peter就已为这条赛道洒下了希望的种子。但多年来的投资经验依然告诉Peter,“目前的通用机器人很难,商业化也遥遥无期”。 

Peter认为,这条赛道上的商业化标准并不像其他赛道,动辄年销量几个亿,对于机器人赛道而言,100万台就足以称之为商业化标准。然而国内能达到这个标准的并不多。 

然而,在种种不确定因素之下,在具身智能领域,唯一可以确定的是,其未来巨大的市场空间。对此,从纷纷入局的科技巨头、创业公司的市场现状即可窥见一二。

要记得,过去几年的自动驾驶也是抛开层层迷雾,才得以在今天看见曙光。 

而对于如今的具身智能领域而言,从目前“各显神通”的技术路线来看,很难确定具身智能未来的周期会如何发展。但有一点可以确定,站在如今大模型和自动驾驶的臂膀上,具身智能的成熟期将来得更快。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1992861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高效报销管理:领先软件的综合评测

本文主要介绍了以下10款报销管理软件:合思、明道云、汇联易、畅捷通、慧算账、云之家、Ramp、Nexonia by Emburse、Rydoo、Expensify。 在处理财务报销时,你是否经常感到手续繁琐、效率低下?选择合适的软件系统,能够显著优化整个报…

亚信安全以安全守护的“星座”正闪耀太空

近日来,一个Made in China的“星座”闪耀太空,受到世界瞩目。“千帆星座”计划,首批18颗商业组网卫星成功发射升空,目前已顺利进入停泊轨道,见证了我国卫星互联网发展的重要时刻,未来将开启面相全球用户的低…

模块化叙事的演变:DeFi借贷开发的模块化转型

随着区块链技术的不断发展,去中心化金融(DeFi)正经历一场深刻的变革。模块化借贷作为这一变革的重要部分,正逐渐成为加密金融领域的焦点。本文将探讨模块化借贷的起源、演变及其未来发展方向。 一、模块化的起源 模块化区块链的概…

5.2二叉树的概念

5.2.1二叉树的定义 二叉树特点: ①每个节点最多只有两颗子树 ②二叉树的子树有左右之分,不能随意颠倒 ③二叉树为有序树 几种特殊的二叉树 满二叉树 除叶节点之外的每个节点度数均为2 对于编号i的节点,若有双亲,则双亲为i/2-向下取整 若有左孩子,则为2i;若有右孩子则为…

云计算实训24——python基本环境搭建、变量和数据类型、数据集合、py脚本

一、python环境搭建 确保拥有阿里云镜像 查看python环境 [rootpython ~]# yum list installed | grep python 查看epel是否安装 [rootpython ~]# yum list installed | grep epel 安装epel [rootpython ~]# yum -y install epel-release.noarch 查看是否安装python3 [rootpyt…

AI 点燃体育热情!使用 PAI-Artlab 定制专属海报

PAI ArtLab 是人工智能平台 PAI 为设计专业人士打造的 AIGC 智能设计工具,支持云端Stable Diffusion、Kohya 等主流文生图与模型训练应用,提供 AIGC 全场景能力。为了向在赛场上的奥运健儿传递最真挚的鼓舞与喝彩,我们特此发起一场别开生面的…

远程终端 XShell 下载安装配置使用(超详细)

今天给伙伴们分享一下VMware Workstation17 安装 Windows 10 操作系统,希望看了有所收获。 我是公众号「想吃西红柿」「云原生运维实战派」作者,对云原生运维感兴趣,也保持时刻学习,后续会分享工作中用到的运维技术,在…

【数学建模】简单的优化模型-5 不买贵的只买对的

背景 在琳琅满目的市场里选购商品,我们往往遵循 “不买贵的,只买对的” 的准则。然而哪些商品、买多少才是“对的”?这时候,我们需要用到,消费者追求最大效用(经济学的最优化原理),…

java学习笔记 VSCode

2.管理员身份打开cmd,切换存文件的路径 2.输入下面命令创建文件 npm create vitelatest 将项目命名为easyb选择vue--->JavaScript 3,用管理员身份打开VSCode,打开刚刚创建的easyb 4.下载包 npm install npm install vue-router npm install axios npm install element-plus…

数据可视化入门:使用 Matplotlib、Numpy 和 SciPy 绘图

数据可视化是数据分析不可或缺的工具,它通过图形化手段帮助我们更直观地理解数据。Python拥有多种库来实现数据可视化,其中matplotlib、numpy和scipy是最常用的几个。本文将详细介绍如何使用这些库来创建各种图表和曲面。 环境搭建 在开始之前&#xf…

SPSS、Python员工满意度问卷调查激励保健理论研究:决策树、随机森林和AdaBoost|附代码数据

全文链接:https://tecdat.cn/?p37293 原文出处:拓端数据部落公众号 在深入了解公司当前的实际情况和员工内心真实想法的基础上,我们旨在从专业视角出发,为企业在组织管理方面的不足进行诊断,并进行全面审视。 为了…

激发创意:十大设计灵感网站推荐

在设计的世界里,灵感是推动创意发想和项目实现的关键因素。设计师们常常需要寻找新的灵感来源,以保持作品的新鲜感和创新性。幸运的是,互联网上有许多优秀的设计灵感网站,它们提供了丰富的资源和启发,帮助设计师们打破…

leetcode-二叉树oj题1(共三道 965,100,144)--c语言

目录 a. 二叉树的概念以及实现参照博客: 一、三道题的oj链接 二、每题讲解 1.单值二叉树 a. 题目: b. 题目所给代码 c. 思路 d. 代码: 2. 相同的树 a. 题目 b. 题目所给代码 c. 思路 d. 代码 3. 二叉树的前序遍历 a. 题目 b.…

软考:软件设计师 — 11.UML 建模

十一. UML 建模 UML 建模部分是下午场考试中第三个题目,分值 15 分。先介绍一下这类题目的考查形式。 1. 考察形式 (1)类图与对象图 填类名,方法名,属性名填关系填多重度 UML 中四种基本关系: 依赖关…

【IO模型】select、poll、epoll的区别

文章目录 五种IO模型阻塞IO非阻塞IO信号驱动IOIO复用异步IO IO复用的原理selectselect原理及缺点 pollpoll的原理及其缺点 epollepoll_createepoll_ctlepoll_waitepoll的原理水平触发和边缘触发epoll的优点 五种IO模型 I/O模型是操作系统中用于管理输入输出操作的机制。不同的…

多线程 02:线程实现,创建线程的三种方式,通过多线程下载图片案例分析异同(Thread,Runnable,Callable)

一、概述 记录时间 [2024-08-08] 前置知识:Java 基础篇;Java 面向对象 多线程 01:Java 多线程学习导航,线程简介,线程相关概念的整理 Java 多线程学习主要模块包括:线程简介;线程实现&#xff…

MySQL 体系架构

文章目录 一. MySQL 分支与变种1. Drizzle2. MariaDB3. Percona Server 二. MySQL的替代1. Postgre SQL2. SQLite 三. MySQL 体系架构1.连接层2 Server层(SQL处理层)3. 存储引擎层1)MySQL官方存储引擎概要2)第三方引擎3&#xff0…

【java】一维数组

目录 一维数组内存分析Java虚拟机的内存划分一维数组内存解析 一维数组知识点一维数组课后练习 一维数组内存分析 Java虚拟机的内存划分 为了提高运行效率,就对空间进行了不同区域的划分,因为每一片区域都有特定的处理数据方式和内存管理方式。 java中…

cs224w colab0笔记

1.colab0 1.1 数据集 from torch_geometric.datasets import KarateClubdataset KarateClub() print(fDataset:{dataset}:) print() print(fNumber of graphs:{len(dataset)}) print(fNumber of features:{dataset.num_features}) print(fNumber of classes:{dataset.num_cl…

机器学习面试-核心概念-问题理解

1.机器学习的思想 计算机程序随着经验的积累,能够实现性能的提高。对于某一类任务T及其性能度量P,若一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序在从经验E学习。 机器学习是人工智能的一个分支&#xff0c…