ESP32语音转文字齐护百度在线语音识别

news2025/2/24 17:26:27

一、导入(10分钟)
学习目的
二、新授(70分钟)
1.预展示结果(5分钟)
2.本节课所用的软硬件(5分钟)
4.图形化块介绍(10分钟)
5.单个模块的简单使用(10分钟)
6.在线语音转换工具逻辑分析(10分钟)
7.在线语音转换工具分步实现(30分钟)
三、巩固练习(5分钟)
四、课堂小结(5分钟)
五、程序下载

应用说明:

我们在日常生活中经常会用键盘进行打字,而打字的速度会比较慢,今天我们就来制作一个在线语音转换工具,通过说话,直接AI云平台将语音转换成文本,从而大大加快我们打字的速度,增加我们设备的科技含量。这样我们就可以调用这个文本来实现程序的智能控制。

应用范围:各类小的创客比赛,创新项目,语音输入转文字应用设备等。

一、导入(10分钟)

学习目的

1.了解在线语音转换工具仪的工作原理

2.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的接线

3.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的程序编写

二、新授(70分钟)

1.预展示结果(5分钟)

在这里插入图片描述

功能介绍:

当绿色按键按下,开始语音识别,当绿色按键松开,在屏幕上显示语音识别的结果

2.本节课所用的软硬件(5分钟)

3.所用器件 数量

齐护教育版Mixly 1
C02mini主板或AIcam\C02 1
齐护双按键模块 1
齐护TFT显示屏 1
齐护在线语音识别模块(拾音器) 1
C02 4pin线 4
积木组件 若干
齐护C02mini

以上内容可参考:项目一

齐护语音双按键模块

以上内容可参考:项目一

齐护TFT显示屏

以上内容可参考:项目八

齐护在线语音识别模块

在这里插入图片描述

通用万向拾音(麦克风)模块,AI人工智能物联网云服语音识别模块,如要使用本公司软件暂只支持ESP32主控,或购买齐护的C02主控或AIcam主控,结合控制使用,支持ArduinoIDE Mixly软件编程 ,I2S接口

设计:色彩丰富,多种控制方式,积木式通用设计,安装方便,随意搭建;

工艺:沉金无铅PCB,SMT贴片元件,稳定耐用;

4.图形化块介绍(10分钟)

齐护语音双按键模块相关块介绍

以上内容可参考:项目一

齐护TFT显示屏相关块介绍

以上内容可参考:项目八

齐护在线语音识别相关块介绍
在这里插入图片描述

齐护在线语音识别的相关块在齐护机器人C02下的语音合成下,主要有四个块

在这里插入图片描述

第一个块是初始化百度语音,里面的密钥通过关注【齐护教育机器人】的微信公众号回复baidukey获取链接获得

首先关注【齐护教育机器人】,回复baidukey
在这里插入图片描述

然后打开得到的链接

在这里插入图片描述

在里面填入百度的API KEY和Secret KEY,再点提交就可以得到密钥了

接下来我们来讲一下如何获取百度的API KEY和Secret KEY

首先打开mixly,找到百度语音初始化这个块,然后右击,点帮助
在这里插入图片描述
在这里插入图片描述

然后点击右上角的控制台

在这里插入图片描述

登录了之后选语音能力引擎

在这里插入图片描述

然后领取免费资源

在这里插入图片描述

领取所有资源,再点应用列表,然后创建一个应用

在这里插入图片描述

在这里插入图片描述

接着就得到了API KEY和Secret KEY,然后把这二个填入之前的那个网址

在这里插入图片描述

点击提交
在这里插入图片描述

就得到了百度AI密钥
在这里插入图片描述

第二个块是初始化语音识别模块的引脚
在这里插入图片描述

第三个块是获取语音识别结果,其中需要填入齐护密钥

在Mixly软件右上角打开【上传工具】
在这里插入图片描述

点击浏览,找到生成密钥的固件

在这里插入图片描述

再点击上传到ESP

然后在【其它】内输入任意字符,比如输入数字1,点【发送】就得到了齐护密钥。

也可以到其它软件或Mixly软件上打开串口监视器,波特率115200,按一下板子上的复位,也可以返回齐护密钥。

或在工具中清除记录,重新连接,然后点一下“显示记录”,按主板的复位键。

在这里插入图片描述在这里插入图片描述

第四个块的功能是语音识别停止录音

5.单个模块的简单使用(10分钟)

齐护语音双按键模块接线

齐护语音双按键模块程序

以上内容可参考:项目一

齐护TFT显示屏相关块接线

齐护TFT显示屏相关块程序

以上内容可参考:项目八

齐护在线语音识别接线

在这里插入图片描述

齐护在线语音识别模块接C02的P3端口

齐护在线语音识别程序
在这里插入图片描述

效果
在这里插入图片描述

按下按键,开始识别,松开按键,停止识别,并通过串口打印识别的结果

6.在线语音转换工具逻辑分析(10分钟)

在这里插入图片描述

逻辑分析:

首先在屏幕上显示提示信息,然后判断按键是否按下,如果按下,开始录音,如果松开停止录音并且在屏幕上显示识别的结果

7.在线语音转换工具分步实现(30分钟)

整体接线(6分钟)

在这里插入图片描述

齐护TFT显示模块CS接C02 的P5端口,DC接C02的P6端口,齐护在线语音识别模块接C02的P3端口,齐护按键模块接C02的P1端口

分步实现(24分钟)

在这里插入图片描述

1.将识别结果通过串口打印出来(12分钟)

在这里插入图片描述

效果

在这里插入图片描述

按下按键,开始识别,松开按键,停止识别,并通过串口打印识别的结果

2.增加提示信息,并将识别结果通过屏幕显示出来(12分钟)

程序
在这里插入图片描述

效果
在这里插入图片描述

增加提示信息,并将识别结果通过屏幕显示出来

三、巩固练习(5分钟)

1,在本节课的基础上尝试修改提示信息,让本作品更符合实际运用

2,把识别结果放到变量中,对比结果然后执行其它的程序

3,采用齐护AIcam直接应用该项目:
在这里插入图片描述

在这里插入图片描述

四、课堂小结(5分钟)

本节课我们主要学习了以下内容

1.了解在线语音转换工具的工作原理

2.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的接线及程序的编写

五、程序下载

课程程序下载:【在线语音转换工具程序】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1474795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

考研数据结构算法机试训练1

中南大学上机压轴题 测试数据: 3 500 0.6 100 0.8 200 0.7 100 输出 390首先要对输入的折扣进行排序,优先使用比率低的z进行支付。 然后用lowcost记录目前多少钱是打过折的。T-lowcost就是剩余没打折的。 每次循环用上一个人的折扣额度。若所有人折扣额…

VR转接器:破解虚拟与现实边界的革命性设备

VR转接器,这一革命性的设备,为虚拟现实体验带来了前所未有的自由度。它巧妙地连接了虚拟与现实,使得用户在享受VR眼镜带来的奇幻世界的同时,也能自由地在现实世界中活动。这一设计的诞生,不仅解决了VR眼镜续航的瓶颈问…

react-组件基础

1.目标 能够使用函数创建组件 能够使用class创建组件 能够给React元素绑定事件 能够使用state和setState() 能够处理事件中的this指向问题 能够使用受控组件方式处理表单 2.目录 React组件介绍 React组件的两种创建方式 React事件处理 有状态组件和无状态组件 组件中的state…

Flink CDC 提取记录变更时间作为事件时间和 Hudi 表的 precombine.field 以及1970-01-01 取值问题

博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,…

数据结构:树/二叉树

一、树的概念 逻辑结构:层次结构,一对多 节点:树中的一个数据元素根节点:树中的第一个节点,没有父节点孩子节点:该节点的直接下级节点父(亲)节点:该结点的直接上级节点兄弟节点:有…

代码随想录算法训练营第44天|● 完全背包 ● 518. 零钱兑换 II ● 377. 组合总和 Ⅳ

文章目录 ● 完全背包卡码网:52. 携带研究材料-完全背包理论练习代码: ● 518. 零钱兑换 II思路:五部曲 代码:滚动数组代码二:二维数组 ● 377. 组合总和 Ⅳ思路:五部曲 代码: ● 完全背包 卡码…

第十二篇【传奇开心果系列】Python文本和语音相互转换库技术点案例示例:深度解读SpeechRecognition语音转文本

传奇开心果系列 系列博文目录Python的文本和语音相互转换库技术点案例示例系列 博文目录前言一、SpeechRecognition语音转文本一般的操作步骤和示例代码二、SpeechRecognition 语音转文本的优势和特点三、易用性深度解读和示例代码四、多引擎支持深度解读和示例代码五、灵活性示…

windows系统使用Vscode在WSL调试golang本地进程

背景: windows10企业版 vscodegolang1.20 wsl编译运行。 vscode 使用本地wsl进行进程attach操作,发现:Access is denied. 本地进程启动,vscode调试进程。windows-Linux控制台: Starting: C:\Users\book\go\bin\dlv.exe dap --l…

express+mysql+vue,从零搭建一个商城管理系统5--用户注册

提示:学习express,搭建管理系统 文章目录 前言一、新建user表二、安装bcryptjs、MD5、body-parser三、修改config/db.js四、新建config/bcrypt.js五、新建models文件夹和models/user.js五、index.js引入使用body-parser六、修改routes/user.js七、启动项…

vscode不能远程连接ubuntu18.04.6

目录 问题解决Portable Mode 安装vscode 补充说明学习资料 问题 vscode远程ssh连接ubuntu18.04.6时,出现如下提示框,单击Learn More后,定位到问题。Can I run VS Code Server on older Linux distributions? 原始是:需要glibc …

LeetCode 热题 100 | 图论(上)

目录 1 200. 岛屿数量 2 994. 腐烂的橘子 2.1 智障遍历法 2.2 仿层序遍历法 菜鸟做题,语言是 C 1 200. 岛屿数量 解题思路: 遍历二维数组,寻找 “1”(若找到则岛屿数量 1)寻找与当前 “1” 直接或间接连接在…

未来新质生产力Agent的起源与应用

Agent是什么? AI Agent的发展经历了从哲学思想启蒙到计算机科学助力、专家系统兴起、机器学习崛起、深度学习突破等多个阶段。如今,AI Agent已经成为人工智能领域的重要组成部分,为人类带来了巨大的便利和发展机遇。早在古希腊时期&#xff0…

《opencv实用探索·二十二》支持向量机SVM用法

1、概述 在了解支持向量机SVM用法之前先了解一些概念: (1)线性可分和线性不可分 如果在一个二维空间有一堆样本,如下图所示,如果能找到一条线把这两类样本分开至线的两侧,那么这个样本集就是线性可分&#…

关于年化收益率的思考

近期,对于投资的年化收益率有一些思考,想着将这些思考整理一下,顺便也就记录在这里。 1. 计算方式 年化收益率常见的计算有三种:算数平均,几何平均,IRR。 1.1 算术平均 算数平均用于度量产品的回报率&a…

【Java EE初阶二十六】简单的表白墙(二)

2. 后端服务器部分 2.1 服务器分析 2.2 代码编写 2.2.2 前端发起一个ajax请求 2.2.3 服务器读取上述请求,并计算出响应 服务器需要使用 jackson 读取到前端这里的数据,并且进行解析: 代码运行图: 2.2.4 回到前端代码,处理服务器返回的响应…

vue项目从后端下载文件显示进度条或者loading

//API接口 export const exportDownload (params?: Object, peCallback?: Function) > {return new Promise((resolve, reject) > {axios({method: get,url: ,headers: {access_token: ${getToken()},},responseType: blob,params,onDownloadProgress: (pe) > {peC…

Flutter(三):Stack、Positioned、屏幕相关尺寸、Navigator路由跳转

页面尺寸 通知栏高度:MediaQuery.of(context).padding.top顶部导航高度:kToolbarHeight底部导航高度:kBottomNavigationBarHeight屏幕宽:MediaQuery.of(context).size.width屏幕高:MediaQuery.of(context).size.height…

SpringMVC 学习(十)之异常处理

目录 1 异常处理介绍 2 通过 SimpleMappingExceptionResolver 实现 3 通过接口 HandlerExceptionResolver 实现 4 通过 ExceptionHandler 注解实现(推荐) 1 异常处理介绍 在 SpringMVC中,异常处理器(Exceptio…

项目解决方案:海外门店视频汇聚方案(全球性的连锁店、国外连锁店视频接入和汇聚方案)

目 录 一、概述 二、建设目标及需求 2.1 建设目标 2.2 需求描述 2.3 需求分析 三、建设方案设计 3.1 系统方案拓扑图 3.2 方案描述 3.3 服务器配置推荐 四、产品功能 4.1 资源管理平台 (1)用户权限管理 (2&#xff09…

AD9226 65M采样 模数转换

目录 AD9220_ReadTEST AD9220_ReadModule AD9226_TEST_tb 自己再写个 260M的时钟,四分频来提供65M的时钟。 用 vivado 写的 AD9226_ReadTEST module AD9226_ReadTEST( input clk, input rstn,output clk_driver, //模块时钟管脚 input [12:0]IO_data, //模块数…