37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的,这里准备逐一动手尝试系列实验,不管成功(程序走通)与否,都会记录下来—小小的进步或是搞不掂的问题,希望能够抛砖引玉。
【Arduino】168种传感器模块系列实验(资料代码+仿真编程+图形编程)
实验一百二十九:中文TTS文字转语音合成模块 替代SYN6288和XFS5152
知识点:TTS(Text-To-Speech,文本到语音)
我们比较熟悉的ASR(Automatic Speech Recognition),是将声音转化为文字,可类比于人类的耳朵。而TTS是将文字转化为声音(朗读出来),类比于人类的嘴巴,是人机对话的一部分,让机器能够说话。
TTS是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。TTS语音合成技术 [1] 即将覆盖国标一、二级汉字,具有英文接口,自动识别中、英文,支持中英文混读。所有声音采用真人普通话为标准发音,实现了120-150个汉字/分钟的快速语音合成,朗读速度达3-4个汉字/秒,使用户可以听到清晰悦耳的音质和连贯流畅的语调。有少部分MP3随身听具有了TTS功能。
【Arduino】168种传感器模块系列实验(资料代码+仿真编程+图形编程)
实验一百二十九:中文TTS文字转语音合成模块 替代SYN6288和XFS5152
Arduino实验开源代码
/*
【Arduino】168种传感器模块系列实验(资料代码+仿真编程+图形编程)
实验一百二十九:中文TTS文字转语音合成模块 替代SYN6288和XFS5152
实验接线:
TX -> Arduino 0
RX -> Arduino 1
5V -> Arduino 5V
GND -> Arduino GND
*/
void setup(){
Serial.begin(9600);
}
void loop(){
Serial.println("1234567890") ;
delay(5000);
Serial.println("abcdefghijk") ;
delay(5000);
}
Arduino实验场景图
实验串口返回情况
完成初步的实验,通过串口,模块可以准确合成阿拉伯数字和英文字母的发音,并在喇叭上播放。
视频播放 https://v.youku.com/v_show/id_XNDUzNDgxMDE2NA==.html
TTS文本转发语音模块实验
实验之二:尝试中文TTS文本转语音合成播放
Arduino实验开源代码
/*
【Arduino】168种传感器模块系列实验(资料代码+仿真编程+图形编程)
实验一百二十九:中文TTS文字转语音合成模块 替代SYN6288和XFS5152
实验之二:尝试中文TTS文本转语音合成播放
模块实验接线:
TX -> Arduino 0
RX -> Arduino 1
5V -> Arduino 5V
GND -> Arduino GND
*/
void setup(){
Serial.begin(9600);
}
void loop(){
Serial.println("期待好的解决方案 对编码转换这块一直有疑问") ;
delay(5000);
}
实验串口返回情况
由于编码不同,发出的是乱码播放,下面开始尝试学习编码转换相关…
播放链接 https://v.youku.com/v_show/id_XNDUzNDkyMjY4OA==.html
经查询资料,中文TTS文本转语音合成模块支持任意中文、 英文字母、阿拉伯数字的文本合成,并且支持中文、英文字母、数字的混读。模块支持中文 GBK 编码集;支持大、小写英文字母。
GBK编码(即汉字国标扩展码)
GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。Windows 95系统就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。
编码范围
8140-FEFE (33088-65278)
全部编码分为三大部分:1.汉字区;2.图形符号区;3.用户自定义区(详情见特性码位分配及顺序)
适用范围以及存在问题
几乎完美支持汉字,但是不支持部分国家的语言(如一些东亚国家,日本等)
所以经常会有GBK到UNICODE的转换
特性
1、字汇——GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充。具体包括:
GB 2312 中的全部汉字、非汉字符号。
GB 13000.1 中的其他 CJK 汉字。以上合计 20902 个 GB 化汉字。
《简化字总表》中未收入 GB 13000.1 的 52 个汉字。
《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件。
13 个汉字结构符。
BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号。
GB 12345 增补的 6 个拼音符号。
汉字“○”。
GB 12345 增补的 19 个竖排标点符号(GB12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收)。
从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字。
GB 13000.1 收入的 31 个 IBM OS/2 专用符号。
未录入《新华字典》上的一些字,如“韡”的简体。
2、码位分配及顺序
GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。
3、误处理
低字节是0x40-0x7E的GBK字符有一定特殊性,因为这些字符占用了ASCII码的位置,这样会给一些系统带来麻烦。有些系统中用0x40-0x7E中的字符(如“|”)做特殊符号,在定位这些符号时又没有判断这些符号是不是属于某个 GBK字符的低字节,这样就会造成错误判断。在支持GB2312的环境下就不存在这个问题。需要注意的是支持GBK的环境中小于0x80的某个字节未必就 是ASCII符号;另外就是最好选用小于0×40的ASCII符号做一些特殊符号,这样就可以快速定位,且不用担心是某个汉字的另一半。Big5编码中也存在相应问题。
4、双字节编码
遵循GB2312规定。
网上搜寻,请教知乎《Arduino 魔法书》专栏的兔子老师,才明白这个TTS模块只能识别16进制的GBK编码。
百度——汉字转GBK,有很多在线工具,这里使用千千秀字(https://www.qqxiuzi.cn/bianma/zifuji.php),输入“谢谢兔子老师”,自动转换结果见下图
例如汉字”兔子”的GBK编码是“CDC3 D7D3”,再转为C语言格式“0xCD,0xC3,0xD7,0xD3”。
实验开源代码如下:
/*
【Arduino】168种传感器模块系列实验(资料代码+仿真编程+图形编程)
实验一百二十九:中文TTS文字转语音合成模块 替代SYN6288和XFS5152
实验之三:中文TTS文本转语音合成播放:兔子你好
模块实验接线:
TX -> Arduino 0
RX -> Arduino 1
5V -> Arduino 5V
GND -> Arduino GND
*/
char a[4]={0xC4,0xE3,0xBA,0xC3};//你好
char b[]={0xCD,0xC3,0xD7,0xD3};//兔子
String zi= "";
void setup() {
Serial.begin(9600);
for(int i=0;i<4;i++) zi+=a;
}
void loop() {
Serial.println(zi);
Serial.println(b);
delay(1000);
}
发送到串口的16进制GBK编码
Arduino实验开源代码之三
/*
【Arduino】168种传感器模块系列实验(资料代码+仿真编程+图形编程)
实验一百二十九:中文TTS文字转语音合成模块 替代SYN6288和XFS5152
实验之四:中文TTS文本转语音合成播放:春节快乐
(GBK码 B4BA,BDDA,BFEC,C0D6)
模块实验接线:
TX -> Arduino 0
RX -> Arduino 1
5V -> Arduino 5V
GND -> Arduino GND
*/
char a[8] = {0xB4,0xBA,0xBD,0xDA,0xBF,0xEC,0xC0,0xD6}; //春节快乐
void setup() {
Serial.begin(9600);
}
void loop() {
Serial.println(a);
delay(3000);
}
实验串口返回情况
中文TTS文本转语音模块合成播放“春节快乐”的10秒视频
https://v.youku.com/v_show/id_XNDUzNTY3MjMyNA==.htm
完成本实验,特别感谢兔子老师的微信指导与帮助,主要学习与参考的资料有
Arduino 语音交互 TTS语音合成
https://zhuanlan.zhihu.com/p/66314323
DIY朗读机器人!不想给孩子读故事?TTS语音合成模块了解一下,B719模块效果测试
https://www.bilibili.com/read/cv3630794/
TTS 真人发音 SYN6288 模块
https://www.arduino.cn/thread-75043-1-1.html
Arduino语音模块-Speech Synthesizer Bee语音合成模块
https://www.ncnynl.com/archives/201606/192.html
关于 Arduino 发送中文字符问题 GB2312转16进制
https://www.cnblogs.com/xiaohe520/articles/7918641.html