能做鬼脸、摇滚、自拍,听懂你说的话!GPT-4驱动的实体机器人

news2024/11/25 10:53:19

东京大学的研究人员将GPT-4模型,集成在实体机器人Alter3中,可将文本、语言直接转化成机器人动作,例如,做一个自拍动作;装一个“鬼样”;做一个摇滚音乐动作等,就连微笑、眨眼这样的面部表情动作也没问题

在GPT-4的帮助下,Alter3建立了语言反馈系统,可通过语言指令优化机器人的运动,而无需修改任何代码,在传统机器人领域是很难做不到。

也就是说,Alter3突破了传统的硬件编码限制,可以实现知识存储、动作优化和0样本学习等。在不需要为机器人的每个身体部位进行编程的情况下,可自动生成新的动作序列,完成自我迭代。

简单来说,可以把GPT-4看成是Alter3的“大脑”。大语言模型的海量知识的能力可以使Alter3,完成很多之前需要特定代码才能完成的动作。怎么感觉有点像施瓦辛格的“终结者”呢?

论文地址:https://arxiv.org/abs/2312.06571

图片

Alter3简单介绍

Alter3是Alter系列的第3代实体机器人,整体结构采用前后分离式设计。主控制部分包含43个微调关节和马达,可实现细腻流畅的各部位动作控制。

Alter3采用了空气驱动技术来控制每个关节来执行指定运动,刷新率为100—150毫秒

相比电动马达,空气驱动能保证动作流畅平稳,响应更快速。同时也提高了可靠性和维修保养便利性。例如,当马达出问题时,只需更换单独部件而不影响整体性能。

图片

表情部分对应人脸部位,包括眼睛、眉毛、嘴巴等,也由马达驱动实现丰富的面部表情变化。面部组件可以单独拆装,实现灵活配置。

图片

Alter3视觉系统采用4个高清摄像头,分别安装在头部两侧和眼部内部。头部摄像头主要用于人体姿态跟踪和面部识别分析等任务。

眼部内置摄像头可以模拟眼神等动作,为Alter3提供了与人类视觉系统等效的感知能力。

GPT-4在Alter3的作用

Alter3通过与GPT-4语言模型的结合,能够根据给定的文本描述自主生成动作,同时GPT-4承担了动作描述生成和代码映射转换两大重要功能

在第一阶段, GPT-4能够根据简短的语言提示,产生丰富生动的动作描述:

1)GPT-4会描述出各种面部表情和身体语言;2)各动作应独立成段,流畅连贯;3)根据人体关节可行性给出具体的执行细节。

GPT-4可以生成动作细节和丰富的情感表达,为下一步代码转化提供了重要基础。

图片

在第二阶段,GPT-4会将提示文本语言转换为,控制Alter3机器人实际动作的Python代码

GPT-4采用类似写论文的结构性表达,首先导入Alter3模块,然后针对每个动作描述一步一步写出设置各关节值的Python代码。

例如,轴1值设为255,表示愤怒表情等。Alter3接收到转换后的代码后,可以执行具体的动作。

图片

简单来说,Alter3借助了GPT-4强大的编程、转换、理解、存储等智能化能力,极大节省了开发时间和成本,同时将这些能力注入到Alter3中。

为了测试GPT-4在Alter3上发挥的能力,研究人员对9个不同机器人动作的视频进行了评估,每个视频由100多名参与者按5分制给出评分。

图片

结果显示,GPT-4生成的动作视频评分,显著高于原生动作视频,这说明GPT-4生成的动作能真实还原人体动作细节。

图片

此外,研究人员通过反馈强化对Alter3生成的动作进行微调,达到了更流畅的效果。

同时,研究人员采取了模拟社会大脑理论中的多个代理人模式,让Alter3与6种不同人格进行对话,以增强其与人交流能力。

本文素材来源Alter3论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1393762.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IOS-UIAlertController简单使用-Swift

UIAlertControlle时IOS的对话框控制器(警报控制器),简单使用方法如下: 步骤都一样,先是创建UIAlertController,然后创建UIAlertAction,再将UIAlertAction添加到UIAlertController中,…

SpringBoot项目中添加证书授权认证

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、项目场景二、方案思路三、实施流程1.引入库2.编写代码 四、拓展 一、项目场景 在上线的项目中,需要添加一个定时授权的功能,对系统的进…

Springboot 子工程构建完后无法找到springboot依赖

问题: 构建完子工程后无法找到SpringBootTest 解决方案: 最好用这个构建 https://www.cnblogs.com/he-wen/p/16735239.html 1.先观察项目目录 是否正确 2.观察子工程目录 3.看pom.xml中是否引用springboot依赖 4.检查代码 查看父项目是否包含子模块 查看子模块的父项目是否…

OB SQL引擎和存储引擎

文章目录 一 SQL引擎1.1 双模共存1.2 基本操作1.3 查看SQL的执行计划 二 存储引擎2.1 传统数据库存在的问题2.2 LSM-Tree存储2.3 OceanBase转储和合并2.4 控制内存数据落盘2.5 LSMTree存储压缩 三 备份恢复3.1 物理备份系统架构3.2 物理恢复系统架构 一 SQL引擎 1.1 双模共存 …

网安-入门永恒之蓝/黑

永恒之蓝 实验环境:win7,kali 实验目的:拿到win7管理员权限 扫描该网段 nmap -sP 192.168.164.0/24,查看win7ip,也可在win7上查询 扫描端口,445,永恒之蓝是通过445端口进行攻击的 masscan -…

个人网站制作 Part 8 添加电子邮件通知与社交媒体集成 | Web开发项目

文章目录 👩‍💻 基础Web开发练手项目系列:个人网站制作🚀 添加电子邮件通知🔨使用Nodemailer🔧步骤 1: 安装Nodemailer 🚀 社交媒体集成🔨使用社交媒体API🔧步骤 2: 集成…

多输入多输出 | Matlab实现基于LightGBM多输入多输出预测

多输入多输出 | Matlab实现基于LightGBM多输入多输出预测 目录 多输入多输出 | Matlab实现基于LightGBM多输入多输出预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Matlab实现基于LightGBM多输入多输出预测(完整源码和数据) 1.data为数据集&a…

使用企业订货软件的担忧与考虑|网上APP订货系统

使用企业订货软件的担忧与考虑|网上APP订货系统 网上订货系统担心出现的问题 1,如果在订货系统中定错(多)货物了该怎么办 其实这也是很多人在网购或者是现实中经常会犯的一个错误,但是网上订货平台为大家提供了很多的解决方案,其中对于订单的…

腾讯云 腾讯云服务器 - 腾讯云 产业智变·云启未来

腾讯云服务器CVM提供安全可靠的弹性计算服务,腾讯云明星级云服务器,弹性计算实时扩展或缩减计算资源,支持包年包月、按量计费和竞价实例计费模式,CVM提供多种CPU、内存、硬盘和带宽可以灵活调整的实例规格,提供9个9的数…

jmeter-线程数设置为1,循环10次没问题,循环100次出现异常

一、多次尝试,发现出现异常的接口大致相同。 解决办法:在第一个出现异常的接口下添加超时时间,固定定时器:2000ms,再次运行就没问题了。 二、压力机自身存在的问题 1)在网络编程中,特别是在短…

IOS-数据持久化UserDefaults简单使用-Swift

UserDefaults通过key-value的一种持久化方案,以键值对的形式存储基本类型数据,类似与安卓的SharePreferences。 使用方式,首先就是要获取standerd let userDefaultUserDefaults.standard存取字符串 //存取字符串 var greeting "Hello…

一款 StarRocks 客户端工具,支持可视化建表、数据编辑

什么是 StarRocks? StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。 为了…

循环异步调取接口使用数组promiseList保存,Promise.all(promiseList)获取不到数组内容,then()返回空数组

在使用 vue vant2.13.2 技术栈的项目中,因为上传文件的接口是单文件上传,当使用批量上传时,只能循环调取接口;然后有校验内容:需要所有文件上传成功后才能保存,在文件上传不成功时点击保存按钮&#xff0c…

django电影推荐系统

电影推荐 启动 ./bin/pycharm.shdjango-admin startproject movie_recommendation_projectcd movie_recommendation_project/python manage.py movie_recommendation_apppython manage.py startapp movle_recommendation_applspython manage.py runserver Using the URLconf d…

CSS||引入方式

目录 CSS引入方式 行内样式表(行内式) 内部样式表(嵌入式) 外部样式表(链接式) 引入外部样式表 CSS引入方式 CSS(层叠样式表)是一种用来描述文档样式的样式表语言,它…

【备战蓝桥杯】探索Python内置标准库collections的使用

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​💫个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-q0zvWxZtAIdSGZ8R {font-family:"trebuchet ms",verdana,arial,sans-serif;font-siz…

高密数据中心卓越运维,更灵活助力企业 AI 就绪

AIGC的高速发展将企业对基础架构的需求推上了新的层次,根据中国通服数字基建产业研究院发布的《中国数据中心产业发展白皮书(2023)》报告,互联网行业客户对单机柜功率密度的要求较高,一般在6-8kW,金融行业处…

centos7 arm服务器编译安装gcc 8.2

前言 当前电脑的gcc版本为4.8.5,但是在编译其他依赖包的时候,出现各种奇怪的问题,会莫名其妙的中断编译。本地文章讲解如何自编译安装gcc,替换系统自带的gcc。 环境准备 gcc 需要 8.2:下载地址 开始编译 1、解压gcc…

Azure Machine Learning - 聊天机器人构建

目录 聊天机器人架构概述消耗成本环境准备打开开发环境部署和运行将聊天应用部署到 Azure使用聊天应用从 PDF 文件获取答案使用聊天应用设置更改答复行为 本文介绍如何部署和运行适用于 Python 的企业聊天应用示例。 此示例使用 Python、Azure OpenAI 服务和 Azure AI 搜索中的…

【记录】解决 git 仓库突然出现连接失败

问题描述 今天在 push 代码代码的时候突然发现无法 push(但是我可以正常打开 Gihub),这可不行,我可是 git 的重度使用者😍,我所有的代码都托管在了 Github 上,没有它我的日子怎么活啊!!&#x…