马斯克开造人形AI 变形金刚要成真?

news2024/11/17 22:21:39

当5个人形机器人迎面走来,你会下意识地期待它们具备怎样的能力。特斯拉最近公布的视频给出答案,它自研的机器人“擎天柱”(Optimus)能够探索环境,复刻人类动作,自主操纵物品。

特斯拉CEO埃隆·马斯克对这些与《变形金刚》汽车人领袖同名的机器人充满期望,预测比电动汽车更有市场需求,未来会人手一个。

当前,工厂里“机械臂”已经稀松平常,餐厅、酒店的过道里跑着送餐机器人,家里还能安个扫地机器人,但这些结合具体场景的机器人,大多是给程式化运行的智能芯片和传感器装上了胳膊腿,显示屏“脑袋”也实在很不“人”。

特斯拉要造的是一体多能、可自主行动的人形机器人。虽然这个领域的传奇公司波士顿动力已经研发了运动能力强大的双足机器人,但它有两个致命硬伤:智商低、造价高。

能理解自然语言、与人类互动的ChatGPT们一定程度上弥补了机器人的智商缺陷。马斯克要着手解决的是造价问题。

特斯拉释放5个“擎天柱”

“狂人”埃隆·马斯克总是能提出各种令人不可思议的计划,并一步步让梦想照进现实。近期,马斯克又抛下一颗重磅炸弹,他要造出未来“每个人都要配备”的人形机器人。

5月16日的特斯拉2023股东大会上,马斯克公布了该公司人形机器人的最新研发动向。公开视频里,5个人形机器人在特斯拉的工厂中直立行走,它们能够探测周围环境,还能通过传感器实时复刻真人的动作,并且能够执行分拣物品等任务。

这些机器人有一个霸气的代号——“擎天柱”(Optimus),熟悉《变形金刚》的影迷一定对它印象深刻,擎天柱是汽车人领袖,带领着正义军团维护和平。

“擎天柱”这个名字倒是和特斯拉造车企业的属性很搭,而他们打造机器人的方式也与造车异曲同工。根据官方数据,擎天柱躯干处搭载了2.3kWh、52V电池包,高度集成了充电管理、传感器和冷却系统。“从传感到融合、再到充电管理都汇集到这一系统内,这借鉴了我们在汽车设计方面的经验。”特斯拉工程师表示。

这意味着,当特斯拉电动汽车的智能化程度越来越高时,擎天柱也会进化。马斯克也说,特斯拉已经试着打通电动汽车的辅助驾驶软件(FSD)系统和人形机器人的底层模块,形成“汽车人”组合。

对于造出高度智能的机器人,马斯克自豪地表示,大量的特斯拉电动车已经能够观察并理解周围的世界,且能够根据采集到的信息进行决策。而利用特斯拉在计算机视觉方面的技术进步,未来也能够对人形机器人进行进一步的部署。也就是说,擎天柱的“眼睛”也有谱了。

擎天柱并不是近期才开展的项目,早在2021年,马斯克在“特斯拉AI日”上发布了通用机器人计划。当时,他给出了一张概念图,展示了该机器人的基本形态。说来有趣,当时机器人还没有研发出来,但马斯克安排了工作人员穿上了特制的服装,扮成机器人的样子跳了段舞。

 

特斯拉2021年发布的机器人概念图

不得不说,马斯克的执行力惊人。一年后,初代“擎天柱”亮相了,它缓缓走出舞台,还和观众们挥手致意。

可别小看了这个简单的动作,有机器人研发工程师解释,开发性能优异的人形机器人时,一个很大的困难就是双脚直立行走。人类在行走时,为了保持平衡需要运用到视觉、内耳、小脑等多个器官进行感知与调节,让机器人通过技术模拟这个过程,实现起来是个大工程。

从特斯拉最新发布的视频来看,即便是现在,擎天柱们走路还是较为缓慢。视频下的一个高赞评论称,“它们走路的样子,就和我试图不拉裤子时差不多。”

人手一个?马斯克得把价格打下来

尽管“擎天柱”目前看起来还很笨拙,但马斯克对它抱有巨大期望。他表示,未来人形机器人的市场需求将达到100亿台,每个人都会拥有一个,比汽车更有市场。他还半开玩笑地宣布,特斯拉“大部分的长期价值”最终将来自“擎天柱”。

不管马斯克的预言能不能实现,但可以确定,人类对机器人的追求几乎贯穿了整个文明史。在古希腊神话时代,就有很多关于人造人的故事,比如工匠之神赫菲斯托斯曾经打造过黄金少女作为宫殿的侍女;文艺复兴巨匠达芬奇留下的手稿中,也曾找到一张有关仿人机器人的设计图。

在科技时代,人类更是一直在探索机器人的研发,希望有一个忠实的仆人减轻工作量。近年来,各式各样的工业机器人其实已经应用了,但人形的基本没有,它们大多以智能机械臂的样貌呈现,在工厂、物流等领域从事重复的单一动作。而在餐馆和酒店,也有一些送餐机器人,但它们更像是滑行的餐盘,并不具备自主端菜、上菜的能力,只能够在特定环境中移动。

 

海底捞的送餐机器人

相比生成式AI的快速发展,人类在打造软硬件结合、具备自主能力的人形机器人上一直进展缓慢。目前,仍然没有一个机器人能够像人类一样,具备可以完成打扫卫生、洗衣做饭等多项任务的能力。

目前,机器人在传感器的作用下已经可以做到感知环境。AI时代下,特斯拉想要实现的是人形机器人能理解人类后自主行动,包括准确抓取物品。一旦智商在线了,机器人的能力将提升一大截,GPT等大模型很可能成为提升机器人智商感的主要方案。

在人形机器人领域,特斯拉其实也是后来者,这个赛道的传奇是成立于1992年波士顿动力。

最初,波士顿动力为美国军方服务,生产了可在泥地、水中负重行走的四足机器人“大狗”,用以在地形复杂的环境中运送弹药、食物等其它补给品。后来,该公司又研发了双足仿真机器人,它的职能是为美军实验防护服装。

经历了数十年的研发积累,波士顿动力最终在2017年带来了巅峰之作,其研发的人形机器人Atlas在不同高度的箱子之间跳跃、旋转,并完成标准后空翻的视频在全网疯传。正是这个视频,让人们看到了机器人梦想落地的曙光。

近期,一位工程师又将ChatGPT 和波士顿动力公司的机器狗Spot结合起来,使得Spot能够和人类进行语音交流,还能通过点头和摇头来回应问题。

到了这一步,人形机器人的软件、硬件和智商,有史以来第一次接近齐备了。但要达成马斯克所说的“人手一个”,更大的挑战在于价格。

强如波士顿动力,也无法压低机器人的成本。

该公司的四足机器人Spot Mini定价约52万元,上线半年后仅售出了大约400台。人形机器人Atlas并没有被摆上货架,但业内预估其售价高达200万美元左右。由于持续研发投入但鲜有现金回流,波士顿动力命途多舛,在2013年被谷歌收购后,它又于2017年被变卖给软银。仅仅3年后,波士顿动力再次易手至现代汽车麾下,旗下机器人成为了现代汽车工厂的“打工仔”。

高昂的成本摆在眼前,马斯克要实现他的豪言壮语,必须大幅削减造价。他曾公开表示,“擎天柱”的售价要打到2万美元以下,用更低廉的技术解决方案,实现人形机器人产品标准化、低成本和可量产。

马斯克曾乐观预测,“擎天柱”3至5年间即可量产上市,但从它当前迟缓的步伐和动作来看,这些机器人现在还只能低效处理简单的任务。

不过,一旦核心技术被特斯拉突破,上市不过是时间问题。要知道,特斯拉的第一代运动型跑车Roadster的推出只用了5年;Model 3从公开到交付只花了1年。“狂人”马斯克从不让人失望。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/543778.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能Python-python3_4_4怎么打代码

Python3.4.4的入门指南:如何打出高效的Python代码? 作为一名有10年Python编程经验的工程师,我深深地了解到Python3.4.4的强大和灵活性。Python是一种易于学习和使用的编程语言,因此它已成为数据科学家,人工智能和机器…

700页!阿里120W架构师推荐学习的微服务架构解析,到底牛在哪里?

前言 当前,微服务架构在国内正处于蓬勃发展的阶段,无论是大型互联网公司还是传统的IT企业,纷纷采用微服务架构构建系统。 在过去几年里,DevOps、云原生、面向演进式架构等理念已经深入人心,围绕微服务生态也出现了大…

JavaEE(系列9) -- 多线程案列2(堵塞队列)

目录 1. 堵塞队列 2. 生产者消费者模型 2.1 解耦合 2.2 削峰填谷 2.3 代码实现生产者消费者模型 3. 构建堵塞队列 3.1 实现普通队列(循环队列) 3.2 普通队列加上线程安全 3.3 普通队列实现堵塞功能 3.4 堵塞队列最终代码 4. 使用生产者消费者模型测试自己构建的堵塞队列 1. …

IP协议的相关特性、数据链路层相关内容讲解

文章目录 IP协议相关特性地址管理NAT机制IP地址的组成特殊的IP地址 路由选择 数据链路层相关内容以太网MTU IP协议相关特性 首先我们来认识一下IP协议的报头: 4位版本号:指定IP协议的版本,对于IPv4就是4. 4位头部长度:IP头部的长…

每日一题158—— 图片平滑器

图像平滑器 是大小为 3 x 3 的过滤器,用于对图像的每个单元格平滑处理,平滑处理后单元格的值为该单元格的平均灰度。 每个单元格的 平均灰度 定义为:该单元格自身及其周围的 8 个单元格的平均值,结果需向下取整。(即…

常用中外文献检索网站大盘点

一、常用中文文献检索权威网站: 1、知网:是全球最大的中文数据库。提供中国学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源,并提供在线阅读和下载服务。涵盖领域包括:基础科学、文史哲、工程科技、社会科学、…

世界博物馆日:一起来看看这些“不太正经”的文物!

今天是5月18日,世界博物馆日。 这两年喜欢逛博物馆的年轻人越来越多了。和爬山、露营一样,博物馆打卡已经是这一届年轻人最受欢迎的娱乐方式之一了。 今天我们要和大家分享的是:全国各地博物馆里收藏的那些萌的、凶的、神秘的、搞笑的…精品…

从零开始 Spring Boot 31:Spring 表达式语言

从零开始 Spring Boot 31:Spring 表达式语言 图源:简书 (jianshu.com) Spring表达式语言(Spring Expression Language,简称 “SpEL”)是一种强大的表达式语言,支持在运行时查询和操作对象图。该语言的语法…

2024王道数据结构考研丨第一章:绪论

2024王道数据结构考研笔记专栏将持续更新,欢迎 点此 收藏,共同交流学习… 文章目录 第一章:绪论1.1数据结构的基本概念1.2数据结构的三要素1.3算法的基本概念1.4算法的时间复杂度1.5算法的空间复杂度 第一章:绪论 1.1数据结构的基…

Vue - vxe-table 表格合并行应用

Vue - vxe-table 表格合并行应用 一. 将相同的列数据合并为一行实现效果实现方法 二. 拓展合并:根据某个字段合并后的数据 进行合并其他字段列实现效果实现方法 vxe-table 地址:https://vxetable.cn/v2/#/table/start/install 一. 将相同的列数据合并为一…

亚马逊云科技作为中国出海力量之一,为中国企业提供技术桥梁

这是一个真实的故事:一家出海企业的项目交付需要在非洲吉布提部署上云,企业负责人在地图上找了半天才找到吉布提,而亚马逊云科技仅用了3天的时间就为企业在当地的业务开展,交付了IT基础设施。对于出海企业来说,这种效率…

前端学习--Vue(2)常见指令

一、Vue简介 1.1 概念 Vue是一套用于构建用户界面的前端框架 框架:现成解决方案,遵守规范去编写业务功能 指令、组件、路由、Vuex、vue组件库 1.2 特性 数据驱动视图 vue连接页面结构和数据,监听数据变化,自动渲染页面结构…

【遗传算法】【处理图像类问题】

文章目录 一、前言二、问题描述三、算法介绍四、其他知识点Reference 一、前言 近期感兴趣的算法,以前没这么好奇过一个算法。时间没想象的焦虑,认真做一些事情算法入门篇 二、问题描述 从前,一群扇贝在海岸边悠哉游哉地生活着。它们衣食不…

亚马逊云科技宣布推出一个新的开源示例应用程序

5月5日,亚马逊云科技宣布推出一个新的开源示例应用程序,这是一个虚构的二手书电子商务商店,被称之为Bob’s Used Books,可供使用亚马逊云科技的.NET开发人员使用。“亚马逊云科技的.NET宣传和开发团队定期与客户交谈,在…

如何科学地利用高光谱图像合成真彩色RGB图像?

如何科学地利用高光谱图像合成真彩色RGB图像? 1. 前言 参考链接: 色匹配函数是什么? - 知乎 (zhihu.com) 23. 颜色知识1-人类的视觉系统与颜色 - 知乎 (zhihu.com) 色彩空间基础 - 知乎 (zhihu.com) 色彩空间表示与转换 - 知乎 (zhihu.com) CIE XYZ - fresh…

Golang笔记:使用melody包进行WebSocket通讯

文章目录 目的使用示例与说明总结 目的 WebSocket是Web开发应用中非常常用的功能,用于客户端和服务器间长时间的实时双向数据通讯。Golang中官方并没有实现这个功能,需要借助第三方的包来实现。 目前被最广泛使用的包是 gorilla/websocket https://pkg…

Host头攻击

转载与:https://blog.csdn.net/weixin_47723270/article/details/129472716 01 HOST头部攻击漏洞知识 Host首部字段是HTTP/1.1新增的,旨在告诉服务器,客户端请求的主机名和端口号,主要用来实现虚拟主机技术。 运用虚拟主机技术&a…

第八章:C语言的简单指针

谈起指针,简直就是谈虎色变,学习C语言的人都知道,指针的难度,就好像高中的导数一样,难道离谱,但是但是,别慌呀,咱们慢慢来,空杯心态,一步一个脚印&#xff0c…

【STM32】STM32使用继电器

STM32使用继电器 其实继电器简单来说就是一个开关,VCC表示电源正极、GND表示电源负极、IN表示信号输入脚,COM表示公共端,NC(normal close)表示常闭端,NO(normal open)表示常开端。一般情况下是常闭状态。 …

为数字人充值AI情商 小冰“克隆人”要卖给谁?

近日,小冰公司启动“GPT克隆人计划”,据悉最短只要采集三分钟数据,就能帮助用户创造源于本人性格、技能、声音、外貌的AI克隆人,如同拥有“平行世界的第二人生”。 这不免让人想起了《流浪地球2》里华仔为剧中女儿“数字续命”的…