机器人交互新纪元:讯飞星火大模型引领升级浪潮

news2024/11/27 4:22:05

放眼全球,大模型浪潮从前沿话题到规模落地,传统计划和商业模式正在“重构”。依托大模型的持续迭代与快速升级,从文本生成、图像生成乃至视频生成,AI不断改变工作本质,为产业发展注入“超能量”。

当众多行业还在探索大模型接入时,机器人行业已率先迭代,特别是在人形机器人领域。微软、亚马逊、谷歌、智元机器人、优必选、宇树等科技公司纷纷入局,马斯克公布了大模型加持的Optimus(擎天柱)第二代机器人,OpenAI则与人形机器人初创公司Figure合作推出了Figure 01机器人。

图片
(图片由讯飞星火生成)

过去,语音识别、计算机视觉、自然语言理解等智能技术,推动机器人在多领域成为市场“宠儿”。2030年全球机器人市场规模将达到1600亿至2600亿美元。大模型时代,机器人行业迎来全新的发展机遇,新一代人机交互与具身智能正在重新定义!

机器人运动能力大幅提升 交互和脑力升级亟待突破

从1927年美国西屋造出第一台人形机器人Televox,到AlphaGo击败人类棋手成为第一个战胜围棋世界冠军的机器人,再到波士顿动力的机器人能够流畅奔跑、倒立、跳马甚至跳舞,机器人在智慧和运动上的能力持续突破。

然而,与科幻电影中呈现的全能机器人相比,现实中的机器人仍有很大的差距。在我们所处的物理现实世界里,机器人更接近于一种可编程的特定用途设备,在实现“听得清、听得懂、有温度的交流”方面,它们的表现尚未达到理想水准

多模态感知和行为决策构成了机器人的关键技能。然而,在与这些机器进行交互时,用户常常面临这样的挑战:

复杂环境下的机器人交互挑战在医院、商场、地铁这样的繁忙公共场所中,用声音与机器人沟通往往伴随着识别错误。例如,当你在地铁里请求“购买一张到大东门的票”,嘈杂的环境可能会干扰机器的听力,导致它难以立即准确回应,有时你甚至需要多次重复指令。

图片
▲ 复杂环境下,人机交互容易出现语音识别错误

自由解释意图和计划行动的挑战:很多机器人搭载了简单的聊天功能,能应对诸如“北京有哪些旅游景点?”或“讲个笑话”等简单查询。但当问题稍微复杂,比如提出“如何安排五一假期三天游北京?”时,机器人可能就无法正确理解,并有可能给出错误或完全不相关的答复,后续更无法执行正确的行动。

最后是对于更贴近人类情感的需求:传统机器人通常仅能提供基于预设程序的标准响应,其语调听起来生硬且缺乏感情。由于它们难以捕捉人类语音中的情绪变化,有时会造成不合时宜的情况,比如在你悲伤时试图开玩笑,这限制了它们在情感上与人产生共鸣的能力。

如何让机器人能在更复杂场景下执行任务,更好地理解我们,满足我们的需求?大模型在自然语言连续对话、通识理解、少样本/零样本学习等能力的突破,带来了曙光。

大模型加持机器人超脑平台 为机器人注入“灵魂”

2022科大讯飞全球1024开发者节上,讯飞正式发布了讯飞机器人超脑平台。机器人超脑平台是以“讯飞超脑2030”技术为底座,面向物理世界、虚拟世界和元宇宙,以AI能力星云、多模态交互、大模型、模型训练、资产生成和软硬件接入为核心的机器人开发平台,帮助开发者快速搭建多场景适配、具有深厚知识底蕴以及擅长自我进化的实体机器人和虚拟数字人产品。

面对功能更多样、任务更专业、交互更自然、决策更智能的挑战,讯飞机器人超脑平台再次升级,全面接入讯飞星火认知大模型,从终端多模态交互和大模型理解决策两个方面出发,构建面向机器人的新交互,赋能机器人发展进入到一个全新的阶段

图片
▲ 接入星火大模型的讯飞机器人超脑平台

视听融合的感知交互平台融合了语音、视觉、语义等多个维度的信息,定义了包含开启交互、交互保持、切换交互权和结束交互在内的机器人交互新范式。升级麦克风阵列算法,融合人脸和唇形信息,使得机器人能够在嘈杂、高噪场景下精准拾音,利用语音大模型和超拟人合成使机器人聊天更有生命力,能够模拟人对话情况下的思考停顿,声音复刻和高表现力的语音合成能够提升机器人对话的感染力。

图片
▲视听融合的感知交互可以在嘈杂环境下精准拾音

基于大模型的机器人交互大脑以星火大模型为基础,实现控制级指令、官方技能、核心业务功能、快速知识问答、闲聊陪伴的多交互场景的统一。通过设计多风格多情感的AI人设,让每一个机器人都与众不同。整个体验会变得非常自然,像和身边的朋友交流一样,提供给我们更多的情绪价值。

图片
▲人形机器人准确执行具体指令

将认知智能、运动智能和具身智能的多模态感知能力相结合,讯飞机器人超脑平台已为工业、教育、服务、特种等领域398家企业提供了服务。

2023科大讯飞全球1024开发者节上,科大讯飞董事长刘庆峰表示,下一步讯飞将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型,能够更好地赋能人形机器人。

“星河行动”开启 打造机器人交互新纪元

2021年12月,《“十四五”机器人产业发展规划》明确了机器人产业规划的重大意义并提出了机器人产业规划的目标,将中国机器人产业再一次推向新的高度。

机器人产业的发展离不开整个生态。现在,讯飞开放平台联合讯飞创投正式启动“星河行动”,面向机器人领域招募生态合作伙伴,与讯飞共建机器人产业生态。通过前沿大模型计划与机器人产业的融合,共同建立机器人交互领域全新里程碑。

图片

讯飞创投是秉持“产业+技术+资本”的投资理念,专注于人工智能相关领域的创投平台,管理超20亿元创投基金。主要投资对象为中早期技术驱动型的优质创业公司,已先后投资了商汤科技、寒武纪、优必选、主线科技等优秀独角兽公司。

面对机器人产业变革升级的新时代,欢迎与讯飞携手一起探索人机协同的无限可能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1599780.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL、SQL-PaLM)、新一代数据集BIRD-SQL解读

NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集BIRD-SQL解读 NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(Spider vs BIRD)全面对比优劣分析[Text2…

随笔-做好卖麻辣烫的准备

前两天突然接到宝哥的微信, 宝哥:有啥项目没有? 我:?啥项目? 宝哥:那个卖奶茶的。 我:什么情况,你要去卖奶茶啊。 宝哥:有这个打算,年前被裁…

CodeForce[1500-2000]——1946D Birthday Gift

codeforce刷题日记 题目大意:一道位运算有关的题&#xff0c;题目大意是给一个长度为n的整形数组&#xff0c;要求将其分成连续的k段&#xff0c;让每段的元素异或后的结果进行或运算&#xff0c;要让这个值<x&#xff0c;求k的最大值。 问题难点在分成k段的依据是什么&…

LeetCode 每日一题 Day 123-136

1379. 找出克隆二叉树中的相同节点 给你两棵二叉树&#xff0c;原始树 original 和克隆树 cloned&#xff0c;以及一个位于原始树 original 中的目标节点 target。 其中&#xff0c;克隆树 cloned 是原始树 original 的一个 副本 。 请找出在树 cloned 中&#xff0c;与 tar…

【k8s】:深入理解 Kubernetes 中的污点(Taints)与容忍度(Tolerations)

【k8s】&#xff1a;深入理解 Kubernetes 中的污点&#xff08;Taints&#xff09;与容忍度&#xff08;Tolerations&#xff09; 1、污点&#xff08;Taints&#xff09;2、容忍度&#xff08;Tolerations&#xff09;3、示例演示-测试污点的具体应用场景3.1 给节点打污点&…

【C++】类和对象③(类的默认成员函数:拷贝构造函数 | 赋值运算符重载)

&#x1f525;个人主页&#xff1a;Forcible Bug Maker &#x1f525;专栏&#xff1a;C 目录 前言 拷贝构造函数 概念 拷贝构造函数的特性及用法 赋值运算符重载 运算符重载 赋值运算符重载 结语 前言 本篇主要内容&#xff1a;类的6个默认成员函数中的拷贝构造函数…

算法练习第17天|104.二叉树的最大深度 、559.N叉树的最大深度

104.二叉树的最大深度 104. 二叉树的最大深度 - 力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/maximum-depth-of-binary-tree/description/ 什么是二叉树的深度和高度&#xff1f; 二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。最大深度…

03_信号和槽

信号和槽 系统的信号和槽自定义信号和槽Lambda表达式 系统的信号和槽 下面我们完成一个小功能&#xff0c;上面我们已经学习了按钮的创建&#xff0c;但是还没有体现出按钮的功能&#xff0c;按钮最大的功能也就是点击后触发一些事情&#xff0c;比如我们点击按钮&#xff0c;…

链表里面头节点存在的目的

头节点存在的目的&#xff1a; 在单链表的使用中&#xff0c;头结点&#xff08;Header Node&#xff09;是一个常用的概念&#xff0c;特别是在进行链表操作时。头结点不是数据域中实际存储的数据节点&#xff0c;而是作为链表操作的辅助节点&#xff0c;它包含对第一个实际数…

二路归并排序的算法设计和复杂度分析(C语言)

目录 实验内容&#xff1a; 实验过程&#xff1a; 1.算法设计 2.程序清单 3.运行结果 4.算法复杂度分析 实验内容&#xff1a; 二路归并排序的算法设计和复杂度分析。 实验过程&#xff1a; 1.算法设计 二路归并排序算法&#xff0c;分为两个阶段&#xff0c;首先对待排…

HADOOP大数据处理技术7-JavaSe

一粒尘埃 在空气中凝结 最后生成磅礴的风 ​ 生活有时会像一场暴风雨&#xff0c;狂风骤雨让人无法呼吸&#xff0c;但即使如此&#xff0c;也请记住&#xff0c;每一次风雨过后都会是一轮明媚的阳光。在黑暗中寻找光明&#xff0c;在困境中寻找希望&#xff0c;因为最终胜利属…

T细胞耗竭

目录 T Cell Exhaustion T 细胞衰竭路径上的细胞和分子路标 研究起源 介绍 T 细胞耗竭的发生路径 耗尽的T细胞亚群的解剖分离和迁移 持续TCR刺激的收益递减 通过共调节受体进行发育微调 细胞因子介导的耗尽T细胞亚群的特异性 T细胞耗竭和表观遗传 T Cell Exhaustion…

最新:阿里云服务器--学生优惠版购买以及配置方法

阿里云学生服务器免费申请&#xff0c;之前是云翼计划学生服务器9元/月&#xff0c;现在是高校计划&#xff0c;学生服务器可以免费申请&#xff0c;先完成学生认证即可免费领取一台云服务器ECS&#xff0c;配置为2核2G、1M带宽、40G系统盘&#xff0c;在云服务器ECS实例过期之…

Linux Docker容器安装和使用(最简洁快速方式)

Docker 是一个开源的应用容器引擎&#xff0c;让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中&#xff0c;然后发布到任何流行的 Linux或Windows操作系统的机器上&#xff0c;也可以实现虚拟化。容器是完全使用沙箱机制&#xff0c;相互之间不会有任何接口。本篇讲…

论文笔记:(INTHE)WILDCHAT:570K CHATGPT INTERACTION LOGS IN THE WILD

iclr 2024 spotlight reviewer 评分 5668 1 intro 由大型语言模型驱动的对话代理&#xff08;ChatGPT&#xff0c;Claude 2&#xff0c;Bard&#xff0c;Bing Chat&#xff09; 他们的开发流程通常包括三个主要阶段 预训练语言模型在被称为“指令调优”数据集上进行微调&…

25. 【Android教程】列表控件 ListView

在学习了 ScrollView 及 Adapter 两节内容之后&#xff0c;大家应该对 ListView 有了一些基本的了解&#xff0c;它是一个列表样式的 ViewGroup&#xff0c;将若干 item 按行排列。ListView 是一个很基本的控件也是 Android 中最重要的控件之一。它可以帮助我们完成多个 View 的…

阿里云优惠券种类介绍及领取教程详解

随着互联网技术的快速发展&#xff0c;越来越多的企业和个人开始将业务和数据迁移到云端。阿里云作为国内领先的云服务提供商&#xff0c;为广大用户提供了丰富多样的云产品和服务。为了回馈用户&#xff0c;阿里云经常推出各种优惠活动&#xff0c;其中优惠券就是其中一种常见…

如何研究解决问题

如何研究解决问题 目录概述需求&#xff1a; 设计思路实现思路分析1.如何研究解决问题寻找解决方案如何借鉴过往经验 范例1.过程2.寻求的专家意见 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy&#xff0…

ctf.show_web13

上传一句话木马 1.php文件&#xff0c;显示 再改后缀为.jpg&#xff0c;显示错误文件大小 用dirsearch扫一下 备份文件.bak 下载文件源码 <?php header("content-type:text/html;charsetutf-8");$filename $_FILES[file][name];$temp_name $_FILES[file][tm…

新版AndroidStudio使用switch-case语句时出现Constant expression required错误

原因: 在新版的Android Studio中使用JDK17以上版本&#xff0c;会出现switch语句报错"Constant expression required"的问题&#xff0c;这是因为在JDK17中switch语句的条件表达式支持使用枚举类型&#xff0c;而这个特性还没有被支持。 解决方法: ①在gradle.prope…