SU-03T语音控制模块详解

news2025/1/11 11:01:19

当我们谈到智能家居时,经常会通过语音来控制我们的家电,将「懒」发挥到极致。语音模块结合了语音识别和控制技术,使得我们可以通过简单的口令来轻松操控灯光等设备,实现更智能化的生活体验。

在本文中,我们将探讨如何利用语音模块来控制灯光,无需按动开关,只需借助声音的力量。

1. 源码下载及前置阅读

本文首发 良许嵌入式网 :https://www.lxlinux.net/e/ ,欢迎关注!

本文所涉及的源码及安装包如下(由于平台限制,请点击以下链接阅读原文下载):

https://www.lxlinux.net/e/stm32/SU-03T-tutorial.html

往期精彩教程,有兴趣的小伙伴可以看看。

  • 从零开始轻松掌握STM32开发的必备指南

    零基础快速上手STM32开发(手把手保姆级教程):https://www.lxlinux.net/e/stm32/stm32-quick-start-for-beginner.html

  • 深入浅出,帮助您理解和应用MQTT协议

    万字猛文:MQTT原理及案例:https://www.lxlinux.net/e/stm32/mqtt-turorial.html

  • 通俗易懂的 GPIO 介绍与实践:

    如何快速成为点灯大师?:https://www.lxlinux.net/e/stm32/stm32-gpio-hal.html

2. 语音模块介绍

2.1 型号介绍

今天要介绍的语音模块型号是 SU-03T,是一款低成本,低功耗,小体积的高性价比离线语音识别模块。直接语音控制,无需联网,无需手机;AI智能语音芯片,反应灵敏;语音指令简单,老少皆宜。

SU-03T 板载一个高灵敏度咪头,一个 8Ω 0.5W 的喇叭和四个继电器。可以用于产品原型测试验证功能,DIY自己的语音控制设备,改装各种小家电。支持自定义开机播报、唤醒词、命令词等。

产品特性如下:

  • 32bit RISC 内核,运行频率 240M
  • 支持 DSP 指令集以及 FPU 浮点运算单元
  • FFT 加速器:最大支持 1024 点复数 FFT/IFFT 运算,或者是 2048 点的实数 FFT/IFFT 运算
  • 内置高速 SRAM,内置 2MB FLASH
  • 内置 3W、单声道 AB 类功放
  • 支持1路驻极体麦
  • 支持 I2S input/output
  • 支持 5V 电源输入
  • 内置 5V 转 3.3V,3.3V 外部负载不超过 150mA
  • RC 12MHz 时钟源和 PLL 锁相环时钟源
  • 内置 POR(Power on Reset),低电压检测和看门狗
  • 所有 GPIO 均可配置为外部中断输入和唤醒源
  • 1个标准 SPI Master 接口,最高速率 30MHz
  • 1个 SPI Slave 接口最高速率 30MHz
  • 1个全双工 UART 最高速率 3Mbps
  • 1个 I2C 主/从控制器最高速率 400kHz
  • 2个 PWM 输出
  • 1个 12-bit SAR-ADC 最大 450Khz 采样率

2.2 工作参数及引脚介绍

工作温度:-20 ~ 85 ℃

工作电压:3.6V ~ 5.5V,一般 5V 供电

供电电流 :>200mA

SU-03T说明
VCC5V 供电
GND接地
3V3芯片内部 LDO 输出 3.3V,外部负载不能超过 150mA
B8打印信息引脚,不用可悬空
B7ADC13 / UART1_TXD / I2C_SCL
B6ADC12 / UART1_RXD / I2C_SDA
B2UART1_TXD / I2C_SCL / TIM3_PWM
MIC-驻极体麦负极
MIC+驻极体麦正极
B3UART1_RXD / I2C_SDA / TIM4_PWM
A27ADC6 / SPIS_MOSI / SPIM_MOSI / I2S0_DO / DMIC1_CLK / TIM3_PWM
A26ADC5 / SPIS_CLK / SPIM_CLK / I2S0_BCLK / I2S1_BCLK / DMIC0_CLK
A25ADC4 / SPIS_MISO / SPIM_MISO / I2S0_LRCLK / I2S1_LRCLK / DMIC_DAT
B0UART0_TXD / I2C_SCL / TIM3_PWM
B1UART0_RXD / I2C_SDA / TIM4_PWM
GND接地
SPK-喇叭负极
SPK+喇叭正极

4. 通信示意图

我们的实现目标是:有一个三色 LED 灯,说「打开红灯」,红灯亮;说「关闭红灯」,红灯灭;说「打开绿灯」,绿灯亮;说「关闭绿灯」,绿灯灭;说「反转黄灯」,黄灯状态反转。

5. 固件生成

我们需要对语音模块 SU-03T 进行配置,打开【智能公元/AI产品零代码平台 (smartpi.cn)】

有账号的登录,没有账号的小伙伴注册一下。

在以下的教程里,红框跟我做,绿框大家可以自由发挥。

如下点击,我们开始创建产品。

还可以选英文,后面对着 SU-03T 说「turn on the light」是不是可以装一下,哈哈。

由于我们只是模型阶段,距离很近,所以选「近距1m」,其他的默认即可。

接下来设置唤醒词。

所谓的唤醒词,就是你以某个关键词喊一下这个模块,它就会从待机模式苏醒,并等待你的下一条指令。

唤醒词可以有一条或多条,比如你可以设置为「你好小美」,也可以再设置为「二蛋」、「狗剩」等等。

相应地,模块唤醒之后会回复你,也就是所谓的「唤醒回复」。这个回复也可以是一条或多条,经过测试,唤醒词与唤醒回复并不是一一对应,而是随机的。

接下来设置命令词自定义。

我们现在想通过说「打开红灯」、「打开绿灯」、「打开黄灯」等命令来操作相应的 LED 灯,所以可以把那些语句设置为命令词。

同样地,也可以设置命令词所对应的回复词。

在左边的「行为」那一列里,就是模块响应我们的命令之后要做的事情。我们可以先设置一下行为的名称,后续设置行为所对应的动作。

上面已经设置好了命令所对应的「行为」名称,现在就可以设置「行为」具体要做的事情。

比如我们说「打开红灯」,那么模块应该把红灯对应的引脚拉低,绿灯、黄灯对应的引脚接高。

其它几个引脚也是根据相应的需求做配置。

设置好后效果如下。

剩下的东西大家都可以按照需要和兴趣自定义,让设备更智能、更人性化、更适合你。

在接下来我们可以配置「开机播报」及「主动退出」。

「开机播报」就是模块在上电的时候自动说的一句话。比如:「欢迎使用本设备」等等。在本案例我们不配置。

模块唤醒之后,在一定时间内(默认 10 秒,可设置)没有收到命令词,就会退出并进入休眠。默认退出回复为「有需要再叫我」,可自定义。

「主动退出」就是我们通过某个关键词让模块立即进入休眠状态。可以配置「退出命令」及相应的「退出回复」。

一切都配置就绪后,可以点击右上角发布版本。

等待大概半小时后,可以在后台下载固件包并烧录。

6. 编程实战

6.1 硬件接线

本教程使用的硬件如下:

  • 语音模块:SU-03T
  • 小灯:三色 LED 灯模块
  • 供电+烧录:micro 数据线
SU-03TLED
A25R
A26G
A27Y
GNDG

接好如下图:

6.2 程序烧录

SDK 生成好后,点击下载固件和下载 SDK。

将 microUSB 数据线插到 SU-03T,另一端插到电脑 USB,供电的同时可以用于烧录。

再打开固件文件选择如下文件烧录。

如果没有开始下载,可以开关一下 SU-03T 的开关。

6.3 运行效果

说「你好小美」,唤醒模块;

说「打开红灯」,红灯亮;

说「关闭红灯」,红灯灭;

说「打开绿灯」,绿灯亮;

说「关闭绿灯」,绿灯灭;

说「反转黄灯」,黄灯状态反转,由灭转亮。

再说「反转黄灯」,黄灯状态反转,由亮转灭。

7. 总结

祝贺大家成功点灯!

本文只是一个简单的案例,但实际上 SU-03T 还有更多功能等着大家开发,搭配官网,简单方便。

希望这个案例能够给您带来一些启发,感谢各位看官,love and peace!

另外,想进大厂的同学,一定要好好学算法,这是面试必备的。这里准备了一份 BAT 大佬总结的 LeetCode 刷题宝典,很多人靠它们进了大厂。

刷题 | LeetCode算法刷题神器,看完 BAT 随你挑!

有收获?希望老铁们来个三连击,给更多的人看到这篇文章

推荐阅读:

  • 程序员必备编程资料大全
  • 程序员必备软件资源

欢迎关注我的博客:良许嵌入式教程网,满满都是干货!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1414805.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年最新版快手直播推流码获取工具

快手平台的直播推流码在2023年9月份之前可以通过快手云直播平台获取,但是在此之后快手平台关闭了个人用户的直播推流码功能,导致很多主播都不能再使用OBS或者第三方直播编码器与直播软件进行推流直播。 目前,我们经过多年研发,开…

hive面试题

0. 思维导图 1. 简述Hive♥♥ 我理解的,hive就是一款构建数据仓库的工具,它可以就结构化的数据映射为一张表,并且可以通过SQL语句进行查询分析。本质上是将SQL转换为MapReduce或者spark来进行计算,数据是存储在hdfs上,…

【常用工具】7-Zip 解/压缩软件——基本使用方法

在实际日常工作或项目中,经常会遇到需要在window操作系统上压缩文件,在Linux操作系统上解压缩的场景,一款实用的压缩软件迫在眉睫,经过实际使用总结,7-Zip可以很好的解决很多压缩和解压缩问题,其基本使用方…

FreeRtos Queue (二)

本篇主要讲Queue的prvLockQueue和prvUnlockQueue 一、前言 1、prvLockQueue和prvUnlockQueue是FreeRtos内核函数,只能供内核调用,应用层无法call。 2、cTxLock和cRxLock为中断上锁计数器,cTxLock记录了队列上锁期间在中断里入队的数量&#…

CodeGPT--(Visual )

GitCode - 开发者的代码家园 gitcode.com/ inscode.csdn.net/liujiaping/java_1706242128563/edit?openFileMain.java&editTypelite marketplace.visualstudio.com/items?itemNameCSDN.csdn-codegpt&spm1018.2226.3001.9836&extra%5Butm_source%5Dvip_chatgpt_c…

利用aiohttp异步爬虫实现网站数据高效抓取

前言 大数据时代,网站数据的高效抓取对于众多应用程序和服务来说至关重要。传统的同步爬虫技术在面对大规模数据抓取时往往效率低下,而异步爬虫技术的出现为解决这一问题提供了新的思路。本文将介绍如何利用aiohttp异步爬虫技术实现网站数据抓取&#x…

燃烧的指针(三)

🌈个人主页:小田爱学编程 🔥 系列专栏:c语言从基础到进阶 🏆🏆关注博主,随时获取更多关于c语言的优质内容!🏆🏆 😀欢迎来到小田代码世界~ &#x…

DMA 和 零拷贝技术 到 网络大文件传输优化

文章目录 DMA 控制器的发展无 DMA 控制器 IO 过程DMA 控制器 传统文件传输性能有多糟糕?如何优化文件传输性能零拷贝技术mmap writesendfileSG-DMA(The Scatter-Gather Direct Memory Access) 零拷贝技术的应用 大文件传输应该用什么方式Pag…

C# 使用 SapNwRfc 调用SAP RFC

好久没写过相关代码,今天又来贡献一篇 C# 使用 SapNwRfc 调用SAP RFC。用VS2022的WINFORM应用程序,使用NuGet中的SapNwRfc类库,call SAP系统中的RFC,传入7个参数,得到RFC返回的2张表的数据。 一、VS2022中新建WINFORM…

三数之和----双指针

https://leetcode.cn/problems/3sum/description/?envType=study-plan-v2&envId=top-100-liked “三数之和”在某些人的口中被叫做“程序员之梦破碎的地方”。既然如此,这个题肯定是有难度的,尤其是其中的细节,很多,很细。 其中nums代表给定的数组,numsSize代表给定数…

短视频矩阵系统软件(源头独立开发)技术php7.40版本开发

短视频矩阵功能构建: 1. 关键词批量比距生成(区域词行业词产品词) 2. 多平台多账号一站式运营管理 3. 视频内容批量复制生成 4. 视频内容批量多平台投放 5. 视频数据分析及粉丝画像分布统计 6. 智能客服响应 7. 智能私域化线索收集 功…

第七篇【传奇开心果】beeware的toga开发移动应用示例:gui工具包介绍和常用组件使用方法示例

传奇开心果博文系列 系列博文目录beeware的toga开发移动应用示例系列博文目录一、beeware和toga介绍二、Toga常用组件使用方法示例三、归纳总结系列博文目录 beeware的toga开发移动应用示例系列 博文目录 一、beeware和toga介绍 1.BeeWare介绍 BeeWare是一个可以让Python开…

SPA单页面的讲解(超级详细)

目录 一、什么是SPA 二、SPA和MPA的区别 单页应用与多页应用的区别 单页应用优缺点 三、实现一个SPA 原理 实现 hash 模式 history模式 四、题外话:如何给SPA做SEO SSR服务端渲染 静态化 使用Phantomjs针对爬虫处理 一、什么是SPA SPA(sin…

JS进阶-深入对象(二)

拓展:深入对象主要介绍的是Js的构造函数,实例成员,静态成员,其中构造函数和Java种的构造函数用法相似,思想是一样的,但静态成员和实例成员和java种的有比较大的差别,需要认真理解 • 创建对象三…

立创EDA学习:设计收尾工作

布线整理 ShiftM,关闭铺铜显示 调整结束后再使用快捷键”ShiftM“打开铺铜 过孔 在空白区域加上一些GND过孔,连接顶层与底层的铺铜。放置好”过孔“后,隐藏铺铜,观察刚才放置的过孔有没有妨碍到其他器件 调整铺铜 先打开铺铜区&…

C++初阶入门之命名空间和缺省参数的详细解析

个人主页:点我进入主页 专栏分类:C语言初阶 C语言进阶 数据结构初阶 Linux C初阶 欢迎大家点赞,评论,收藏。 一起努力,一起奔赴大厂 目录 一.前言 二.命名空间 2.1命名冲突的例子 2.2解决方案 2.3命…

机器学习---无偏估计

1. 如何理解无偏估计 无偏估计:就是我认为所有样本出现的概率⼀样。 假如有N种样本我们认为所有样本出现概率都是 1/N。然后根据这个来计算数学期望。此时的数学期望就是我们平常讲 的平均值。数学期望本质就 是平均值。 2. 无偏估计为何叫做“无偏”&#xff1…

设计模式-生成器设计模式

什么是生成器设计模式 众所周知我们设计代码的时候要将代码设计出模块化的,一个功能是一个模块,那么生成器设计模式,是将一个类再度进行了一个拆分,让一个类的内部进行了单一职责化,其实我们在平时开发的时候就会不经…

【QT+QGIS跨平台编译】之七:【libjpeg+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、libjpeg介绍二、文件下载三、文件分析四、pro文件五、编译实践一、libjpeg介绍 libjpeg是一个广泛使用的jpeg图像压缩和解压的函数库,采用 C 语言开发。 2013年1月,Independent JPEG Group发布了版本9,对新引入的无损编码模式进行了改进。2022年1月,发布了版…

Python可执行文件的转换

当开发者向普通用户分享程序时,为了方便用户在未安装Python环境的情况 下能够正常运行,需要将开发好的程序进行打包,转换成用户可运行的文件类 型。本节将介绍在Windows和Linux两种系统下,将Python类型的文件转换成可执 行文件的方…