【正点原子i.MX93开发板试用连载体验】中文提示词的训练

news2024/9/28 1:24:03

本文首发于电子发烧友论坛:【正点原子i.MX93开发板试用连载体验】基于深度学习的语音本地控制 - 正点原子学习小组 - 电子技术论坛 - 广受欢迎的专业电子论坛!

好久没有更新了,今天再来更新一下。

我们用前面提到的录音工具录制了自己的中文语音,包括“打开”和“关闭”各100条,同时我们从谷歌的mini_speech_commands样本集里面随机挑选了100条作为"unknown”的样本,三个类别的数据个数要尽量相同,否则训练出来的结果会有倾向性。然后,开始自己的训练过程。

我所使用的是阿里云的PAI-DSW进行在线训练,平台的使用非常方便,避免了在本机上进行繁琐的设置工作。我采用的训练笔记本是TensorFlow的Simple audio recognition: Recognizing keywordssimple_audio_pi/simple_audio_train_numpy.ipynb

 

a68f53c44ea45bef54846ab9e163975b.png

将脚本上传后,直接打开,就可以看到笔记本了。

笔记本的操作和其他平台差不多,就不详细介绍了。

我把准备的语音数据上传到data/speech目录下,共有3个子目录,分别是open、close和unknown。然后修改脚本中关于data_dir的设置。

`data_dir = pathlib.Path('data/speech')` 

然后修改了训练集、验证集和测试集的数量设置。

train_files = filenames[:350] 
val_files = filenames[250: 250 + 100] 
test_files = filenames[-100:] 

然后就按照笔记本里面的步骤执行就可以了。

数据量不大,训练只用了数秒就完成了。

使用一个样本进行测试,可以正确得到打开的结果。

 

1017d4e03815acf74d62057b0fb81498.png

最后可以得到tflite格式的文件,用于在开发板上的测试。

将tflite格式的文件拷贝到开发板上,并修改前面的测试程序中的模型文件路径和commands设置就可以使用中文的“打开”、“关闭”进行控制了。视频稍后将上传到B站,欢迎大家观看。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1980908.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

销量激增难解奇瑞焦虑:新能源短板与加班文化引争议

尽管今年上半年奇瑞汽车以惊人的48.4%同比增长率,力压比亚迪、吉利等竞争对手,成为国内汽车销量增速最快的企业,但这光鲜的增长数字背后,却隐藏着难以忽视的焦虑与困境。 奇瑞汽车的销量飞跃,主要得益于燃油车市场的强…

短信平台营销:解锁市场潜力的金钥匙

在瞬息万变的营销领域,短信平台以其直接、高效、覆盖面广的特性,成为众多企业争相探索的蓝海。面对中国近9亿的手机用户群体,这一庞大的市场潜力无疑为企业开启了无限商机的大门。 一、塑造品牌,提升知名度 短信平台营销是…

ProvenCore经过形式化验证的TEE OS,最高级别的安全认证CC EAL 7

这是一个闭源的TEE OS,但其ATF组件已提交到upstream。 实现安全功能需要硬件的高级抽象,通常由操作系统 (OS) 提供。由于安全功能的正确性取决于这些高级抽象的正确性,因此实现这些功能的操作系统应该没有可利用的漏洞。 ProvenRun 开发了 …

JavaEE---Spring MVC(3)

11.获取session 法1> 传统方式 初始状态下session为空,那么我们就需要手动设置session 2>不传统方式 但是!!!我们发现报错了! 解决方式: 设置session之后可以发现代码的session就被查到了 12.获取header 1>传统方式 这里我们规定只返回浏览器的信息 2>不…

【CodinGame】趣味算法(教学用) CLASH OF CODE -20240804

文章目录 正文写在最后END 正文 import math import sys# Auto-generated code below aims at helping you parse # the standard input according to the problem statement.n int(input()) j 1 h 0for i in range(1, n 1):j * ih iprint(j) print(h)import sys import m…

推荐一款界面优雅、功能强大的 .NET + Vue 权限管理系统

目录 前言 项目简介 项目特点 项目预览 项目演示 1、系统登录 2、系统首页 3、系统页面 4、插件示例 5、移动端 项目地址 总结 前言 今天推荐一款用 .NET 和 Vue3 实现的开源权限管理系统。它的界面清爽干净,功能强大,还具备灵活的角色权限分配…

人工智能在病理组学领域的最新研究进展|顶刊速递·24-08-05

小罗碎碎念 本期推文主题:人工智能在病理组学领域的最新进展 今天的推文主要涉及三个癌种——结直肠癌、肾乳头状细胞癌、上皮性卵巢癌。既有淋巴结转移的风险预测模型,也有结合了测序数据的多模态病理AI模型。 重点关注一下第六篇文献,由西…

本地化AI语音聊天voicechat2;改进版的Whisper模型,速度快50%;多代理创建儿童图画书

✨ 1: voicechat2 voicechat2是一款使用WebSockets进行快速、本地化AI语音聊天的软件。 Voicechat2 是一个快速、完全本地化的AI语音聊天系统,采用WebSockets技术。它运行在高性能硬件上,例如7900级的AMD RDNA3显卡或4090显卡,可以实现低至…

最全面的Python重点知识汇总,建议收藏!

Py2 VS Py3 print成为了函数,python2是关键字 不再有unicode对象,默认str就是unicode python3除号返回浮点数 没有了long类型 xrange不存在,range替代了xrange 可以使用中文定义函数名变量名 高级解包 和*解包 限定关键字参数 *后的变…

【区块链+医疗健康】国家儿童医学中心互联网 + 肾脏专科联盟服务平台 | FISCO BCOS应用案例

医疗资源结构的失衡在儿科领域尤为突出,供需矛盾突出。由于肾脏病等疑难病的特殊性,加之儿童疾病诊断的 复杂性,其诊治过程可谓“难上加难”。一些基层儿童医院由于缺乏专业的医疗团队、特殊的辅助检查手段以及 基因测序等前沿技术的支撑&…

代码随想录算法训练营第二十四天| 455.分发饼干, 376. 摆动序列 , 53. 最大子序和

今天是贪心算法学习的第一天,主要的学习内容有:贪心算法的理论基础,以及如何通过局部最优解推导全局最优解。 对于贪心的理论基础,贪心算法并没有固定的模板和套路,对于贪心算法的题目其实就是一种模拟题,…

从常春藤精英到阶下囚:加密货币行业丑闻频发,责任在「名校情节」?

撰文:Muyao Shen,彭博社 编译:Yangz,Techub News 似乎每当加密货币行业出现丑闻时,涉案者大都有着常春藤联盟大学或其他名校学位。本文简单整理了加密货币行业的「脏衣篓」,翻出了好多名校 T 恤。 就在本周…

UE5 UC++流式请求 || Varest流式调用Coze(但一次性回复,不太推荐)

文章仅供参考。C调用的是公司后台的接口,博主未尝试用C调用Coze的接口,需要补充更多的代码。 ———— C #include "HttpModule.h" #include "HttpManager.h" #include "Http.h"DECLARE_DYNAMIC_MULTICAST_DELEGATE_O…

星座运势网源码/星座屋接口/星座配对网站PHP程序带采集

星座运势网源码/星座屋接口/星座配对网站PHP程序带采集 演示站: https://xz.wengu8.com/ 程序说明: 1、前端模板PC手机端自适应。 2、每日运势/当月/当年星座运势调用星座屋API接口,每天只采集一次接口,后保存到本地调用本地…

ThreeJs控制模型骨骼实现数字人

之前章节有讲过ThreeJs加载pmd模型和vmd动作文件,实现动画人物根据vmd中的动作跳舞,不过缺点是只能按照文件中指定动作跳舞,如果要让一个模型做出多种动作的话,就需要做很多个动作文件,如果动作文件很多,加…

算力共享:forward_to_next_shard,process_prompt推断之间的链接map_partitions_to_shards

目录 forward_to_next_shard 参数 函数逻辑 _process_prompt StandardNode get_current_shard map_partitions_to_shards forward_to_next_shard 这段代码定义了一个名为 forward_to_next_shard 的异步函数,它是设计用于在分布式模型或数据处理系统中的节点(或称为“分…

SpringBoot基本原理,轻松应对面试官 - 第522篇

《国内最全的Spring Boot系列之一》 《国内最全的Spring Boot系列之二》 《国内最全的Spring Boot系列之三》 《国内最全的Spring Boot系列之四》 《国内最全的Spring Boot系列之五》 《国内最全的Spring Boot系列之六》 《国内最全的Spring Boot系列之七》 Noisee AI中…

C语言自定义类型联合体与枚举超详解

文章目录 1. 联合体1. 1 联合体类型的声明1. 2 联合体的特点1. 3 相同成员的结构体和联合体对比1. 4 联合体大小的计算1. 5 联合体的练习 2. 枚举2. 1 枚举类型的声明2. 2 枚举类型的优点2. 3 枚举类型的使用2. 4 枚举类型的实际使用 1. 联合体 1. 1 联合体类型的声明 像结构…

无线定位测距传输无延迟,飞睿智能超宽带uwb sip芯片,商显TV遥控器丝滑操控

在这个日新月异的智能时代,每一项技术的创新都如同星辰般璀璨,创新着我们的生活向更加便捷、高效的方向迈进。今天,让我们聚焦于一项正悄然改变商业显示(商显)领域游戏规则的黑科技——飞睿智能超宽带(Ultr…

阿里云SMS服务C++ SDK编译及调试关键点记录

一. 阿里云SMS服务开通及准备工作 在阿里云官网上完成这部分的工作 1. 申请资质 个人or企业 我这里是用的企业资质 2. 申请签名 企业资质认证成功后,会自动赠送一个用于测试的短信签名 也可以自己再进行申请,需要等待审核。 3. 申请短信模板 企…