【2023研电赛】安谋科技企业命题二等奖:基于R329的AI交互早教机器人

news2025/1/11 5:47:08

本文为2023年第十八届中国研究生电子设计竞赛安谋科技企业命题二等奖分享,参加极术社区的【有奖活动】分享2023研电赛作品扩大影响力,更有丰富电子礼品等你来领!,分享2023研电赛作品扩大影响力,更有丰富电子礼品等你来领!

基于R329的AI交互早教机器人

参赛单位:南京邮电大学
队伍名称:挖掘机
参赛队员:江蕴宇 王大志 江着帆

作品简介

随着人工智能技术的迅速进步和智能设备的普及,人们对于个性化、互动式学习工具的需求也日益增加。早期教育被认为是儿童发展的关键时期,因此,开发一款结合AI技术的早教机器人成了众多家长和孩子们的需求。市面上的早教机器人很多,但是大多数机器人的功能都不太完善,尤其是语音交互方面。
而近半年来,随着ChatGPT的爆火,聊天AI模型渐渐走进大众的视野。其中,文心一言就是百度全新一代的知识增强大语言模型,它能够与人对话互动,包括回答问题、协助创作,高效性和便捷性是文心一言这类大语言模型最大的亮点。
结合以上两点,我们团队设计并开发了这款AI交互早教机器人。作品的外观如下图所示:
在这里插入图片描述

我们设计的机器人具备以下功能:
(1)人脸识别
采用Retinaface模型并且对其进行了优化。能够做到同时进行人脸框检测和关键点定位,并且能够对提前在板子里录入好的人脸进行有效识别。
(2)语音识别
包括语音唤醒以及长语音连续识别。人脸识别通过后,通过呼叫关键词“小安同学”唤醒我们的机器人,并与其进行交互;机器人可以连续识别一段很长的提问,并且将语音转化成文字实时显示在屏幕上。
(3)AI交互
我们团队总共给我们的机器人设计了4个小功能,分别是AI问答、古诗朗诵、儿歌欣赏、认识动植物。其中,AI问答功能调用文心一言的API实现,并通过tts工具语音输出;古诗朗诵功能是我们将适合早教的古诗存在板子里,并且每首古诗我们都为其添加了朗诵跟读功能,可以识别儿童的发言是否标准;儿歌欣赏功能与之类似;认识动植物模块里面包含了常见的动植物的科普以及它们的英文发音。
(4)断点续存
上述的AI交互的所有功能我们都为它们做了断点续存功能,也就是每次重新开机之后都会继续上次用户保存的进度,不同的用户保存进度也不同。

算法简介

人脸识别算法

人脸识别模块我们采用的是Retinaface模型并对其进行了优化。RetinaFace是一种用于人脸检测和人脸关键点定位的深度学习模型,它旨在精确地检测图像或视频中的人脸,并标识人脸的重要关键点,如眼睛、鼻子和嘴巴等。这个模型的主要特点是其高度准确的检测性能,特别是对小尺寸人脸的检测,以及对多尺寸和多姿势的适应能力。
然而,Retinaface并没有人脸识别的能力,因此,我们团队在Retinaface关键点定位的基础上,根据每个人脸关键点间距比例的不同进行识别,将我们通过摄像头录入的人脸放在PC端进行训练,最后人脸检测的帧率维持在20帧左右,精确度达到95%,速度在稳定在5s以内。
在这里插入图片描述

语音识别算法

语音识别模块我们在矽速科技Maix ASR的基础上进行了优化。Maix ASR具备连续数字识别、关键词识别和大词汇量连续语音识别等功能模块,满足早教机器人系统的需求。其次,Maix ASR采用AM+LM两段式识别,可灵活配置声学模型和语言模型,适应不同的嵌入式场景,也支持加入热词等功能。第三,Maix ASR适用于嵌入式设备,具有较低的计算资源需求和较高的运行效率,能够实时响应用户的语音输入。
我们团队做的工作就是在这个模型的基础上对其在早教领域进行了一定的优化。首先,对于孩子说话口齿、逻辑不清晰的问题,我们采用自然语言处理(NLP)技术,将一些不符合中文语法规则的语音输入进行剔除,防止其直接进入AI问答环节,并请求用户重新提出问题,从而大大减少了无效的人机交互。其次,在关键词识别功能的基础上我们增加了市面上蓝牙音箱常用的语音唤醒功能,用户在人脸识别通过后随时可以呼叫“小安同学”来唤醒我们的机器人。
在这里插入图片描述

断点续存算法

我们早教机器人的AI交互模块功能很多,除了市面上常见的AI对话、儿歌欣赏等,我们还增加了古诗朗诵与跟读和认识动植物(中英文教学)等功能,除了AI对话功能是联网的,其他所有功能都是离线的、内置在我们的机器人中的。因此,对于不同用户(比如家里有多个孩子)的学习进度不尽相同的问题,我们设计了一个断点续存算法。这个算法原理其实非常简单,对于各个不同的用户,我们分别建立了属于他们的文件夹,在这个文件夹里有属于他们每个功能的学习进度文档,用户每次学习与使用都会使这个文档里对应的数字有所改变,那么在下一次用户使用时就能读取这个文件并继续上次保存的进度了。

技术流程

在这里插入图片描述

机器人开机后,会语音提示进行人脸识别,用户通过人脸识别后,就可以通过呼叫“小安同学”随时唤醒机器人,接着就进入了人机交互的具体功能。唤醒机器人后,通过关键词“我想学古诗”进入古诗朗诵与跟读模块,机器人会挑选适合儿童早教的古诗词进行朗诵,并要求用户跟读,并且还会对用户跟读的发音进行校正,培养孩子的文化素养以及中文发音;通过关键词“我想学英语”进入动植物认识与英语学习模块,在这个模块中,机器人会介绍一些简单的动植物以及它们的英文发音,并将其展示在显示屏上;通过关键词“我想听儿歌”进入儿歌欣赏模块,里面内置了上百首适合儿童的经典与现代儿歌。如果语音中不含这些关键词,那么就会跳转到AI对话模块,我们对文心一言的回答做了约束,即回答对象是儿童并将字数限制在50字以内。

作品创新

(1)人脸检测采用RetinaFace模型,可以同时进行人脸框检测和人脸关键点定位,在此基础上通过关键点的比例不同进行人脸识别,并且还可以根据识别到的人脸继续上一次保存的学习进度。
(2)语音识别采用关键词唤醒以及长语音连续识别,并且针对孩子说话逻辑不清晰的问题进行了优化。
(3)结合最近火热的聊天机器人文心一言,并针对早教场景加入新的功能,重视机器人与孩子的交互,提高机器人整体的趣味性,激发孩子的好奇心。

未来展望

一方面,我们的机器人看似功能不少,其实真正能算得上创新的其实很少,希望未来有机会能把我们自己真正的创新运用起来;另一方面,我们的作品名字叫“早教机器人”,但其实目前为止它是不会动的,我们有想过给可达鸭里面加几个舵机控制其四肢,但受限于作品的大小还是放弃了,如果有机会的话可以定制一个外壳,让机器人能有更多的动作与孩子互动。

参赛感悟

通过这次研电赛,我们团队所有人在嵌入式领域又有了一定的进步,队员之间的配合与合作越来越紧密。这次参赛接触到的各种算法、各种新型应用场景,都是未来我们在工作中可能会有所接触的领域。看到了这么多优秀的作品,只能说我们的水平真的极其有限,也给了我们团队继续进步的动力。感谢大赛组委会以及安谋科技的支持,希望还能有机会参加这样的比赛~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/978927.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

intellij idea如何查看项目maven依赖关系图

文章底部有个人公众号:热爱技术的小郑。主要分享开发知识、有兴趣的可以关注一下。为何分享? 踩过的坑没必要让别人在再踩,自己复盘也能加深记忆。利己利人、所谓双赢。 1、打开maven项目依赖 打开后的效果图 2、选择缩放 可以选择1:1 缩放、…

多通道振弦数据记录仪应用桥梁安全监测的解决方案

多通道振弦数据记录仪应用桥梁安全监测的解决方案 城市化进程的加快和交通运输的发展,桥梁作为连接城市的重要交通工具,其安全性也变得越来越重要。为了保证桥梁的安全性,需要进行定期的监测和维护。其中,多通道振弦数据记录仪是…

通信原理板块——窄带随机过程

微信公众号上线,搜索公众号小灰灰的FPGA,关注可获取相关源码,定期更新有关FPGA的项目以及开源项目源码,包括但不限于各类检测芯片驱动、低速接口驱动、高速接口驱动、数据信号处理、图像处理以及AXI总线等 大多数通信系统都是窄带带通型的&a…

【web开发】1、flask入门和html开发

文章目录 一、前端三剑客是什么?二、快速开发网站1.安装flask2.根目录下创建templates目录及web.py文件 三、HTML3.1常用标签3.2列表标签3.3表格标签3.4INPUT系列(7个)3.5下拉框3.6多行文本3.7案例:用户注册页面 一、前端三剑客是…

基于SSM的高校社团管理系统

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 随着高校社团数量的不…

Unity中神秘的Transform和transform(小写)的关系

1.为什么Transform类是保护的不能通过new 来实例化对象,也没有静态函数,而Rotate()这种方法却属于它,该如何访问? Transform 类还是被保护的不允许用户修改! protected Transform(); 是一个受保护的构造函数,不能直接实例化 Transform 类。 2.为甚么transform可以访问Tr…

解决Spring Boot启动错误的技术指南

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

Java“牵手”微店商品详情数据,微店商品详情API接口,微店API接口申请指南

微店平台商品详情接口是开放平台提供的一种API接口,通过调用API接口,开发者可以获取微店商品的标题、价格、库存、月销量、总销量、库存、详情描述、图片等详细信息 。 获取商品详情接口API是一种用于获取电商平台上商品详情数据的接口,通过…

element-ui 修改tooltip样式

1.表格tooltip 统一修改 <el-table:data"tableDatas"tooltip-effect"light" .el-tooltip__popper.is-light {background: #FFF;box-shadow: 0px 0px 8px 1px rgba(0,0,0,0.16);border-radius: 4px;opacity: 1;border: none;&[x-placement^top] .p…

选择企业网盘:MCN机构如何做出明智的选择?

随着在线媒体行业的迅速发展&#xff0c;MCN机构扮演了越来越重要的角色。对于MCN机构来说&#xff0c;高效的文件管理和协作工具是必不可少的。而企业网盘正是满足这些需求的理想解决方案。 "MCN机构用什么企业网盘好&#xff1f;推荐国际云盘Zoho WorkDive和国内云盘百度…

延时消息队列

目录 前言 一、延时队列实用场景 二、DelayQueue DelayQueue的实现 使用延迟队列 DelayQueue实现延时任务的优缺点 三、RocketMQ 原理 四、Kafka 原理 实现 DelayMessage定义 消息发送代码 消费者代码 参考 前言 延时队列的内部是有序的&#xff0c;最重要的…

stm32之31.iic

iic双线制。一根是SCL&#xff0c;作为时钟同步线;一根是SDA&#xff0c;作为数据传输线 SDN #include "iic.h"#define SCL PBout(8)#define SDA_W PBout(9) #define SDA_R PBin(9)void IIC_GPIOInit(void) {GPIO_InitTypeDef GPIO_InitStructure;//使能时钟GR…

开始投简历了

歇了好长时间&#xff0c;也该开始找点事情折腾了。 第一周基本上是没有什么太多的消息&#xff0c;大部分情况就是收到回复的邮件说你很优秀&#xff0c;希望下次合作这种礼节性的拒绝邮件。 给人有点感觉都是在忽悠&#xff0c;有点感觉现在的公司一边到处拒绝&#xff0c;…

短信软件平台搭建最新客户端|移讯云短信系统

根据客户 和市场需要 增加了新的客户端 新的客户端客户登录后发送短信时可自行选择用哪个通道来进行发送短信。每个通道的充值数量不一样。 通过后台给客户分配可使用的通道&#xff0c;只有在后台给客户分配可使用的通道后客户在登录客户端发送短信时才可进行选择。 关于客…

NoSQL之 Redis介绍与配置

目录 一、关系数据库和非关系数据库概述 1、关系型数据库 2、非关系型数据库 二、关系数据库和非关系数据库的区别 1、数据存储格式不同 2、扩展方式不同 3、对事务的支持不同 三、非关系数据库产生背景 1、总结 四、Redis简介 1、 Redis的单线程模式 2、Redis优点…

ChatGPT AIGC 完成多维分析雷达图

我们先让ChatGPT来帮我们总结一下多维分析雷达图的功能与作用。 同样ChatGPT AIGC完成的动态雷达图效果如下; 这样的一个多维分析动态雷达图是用HTML,JS,Echarts 来完成的。 将完整代码复制如下: <!DOCTYPE html> <html style="height: 100%"><h…

服务性能监控:USE 方法(The USE Method)

USE Method: Rosetta Stone of Performance Checklists USE Method: Rosetta Stone of Performance Checklists USE 方法基于 31 模型&#xff08;三种指标类型一种策略&#xff09;&#xff0c;来切入一个复杂的系统。我发现它仅仅发挥了 5% 的力量&#xff0c;就解决了大概…

基于视觉重定位的室内AR导航项目思路(2):改进的建图和定位分离的项目思路

文章目录 一、建图二、定位首先是第一种方法&#xff1a;几何方法其次是第二种方法&#xff1a;图像检索方法最后是第三种方法&#xff1a;深度学习方法 前情提要&#xff1a; 是第一次做项目的小白&#xff0c;文章内的资料介绍如有错误&#xff0c;请多包含&#xff01; 一、…

Unity RawImage

文章目录 1. Image2. RawImage2.1 UV Rect 3. RawImage 应用 1. Image Image 控件在我的这篇博客中有详细解释&#xff1a; https://blog.csdn.net/weixin_45136016/article/details/125655214 2. RawImage RawImage 组件是一个用来显示纹理的组件&#xff0c;常常跟Render …

【OpenCV入门】第九部分——模板匹配

文章结构 模板匹配方法单模板匹配单目标匹配多目标匹配 多模板匹配 模板匹配方法 模板是被查找的图像。模板匹配是指查找模板在原始图像中的哪个位置的过程。 result cv2.matchTemplate(image, templ, method, mask)image&#xff1a; 原始图像templ&#xff1a; 模板图像&a…