文本转语音(Text-to-Speech,TTS)技术是一种将文本信息转换为口语输出的技术。它涉及多个学科,包括声学、语言学、数学信号处理技术和多媒体技术等。TTS技术能够将计算机中的文本信息转换为自然流畅的语音输出,广泛应用于语音合成、语音识别、语音交互系统等领域。
本示例使用pyttsx3实现tts文字转语音。虽然pyttsx3实现语音效果比较书面语,不够自然,但是方便本地部署,转换速度快,读音清晰,对于自然情感要求不高的场景比较适合。
安装pyttsx3库:
pip install pyttsx3
具体实现代码如下,示例为通过电脑麦克风播放朗诵的古诗:
#-*-coding:utf-8-*-
# date:2024
# Author: DataBall
# function: 文字转语音 Text To Speech
import pyttsx3
if __name__ == "__main__":
engine = pyttsx3.init() # 初始化语音引擎
rate = engine.getProperty('rate') # 获取当前语速
engine.setProperty('rate', 95) # 增加语速
list_ = [
"乌衣巷",
"刘禹锡〔唐代〕",
"朱雀桥边野草花",
"乌衣巷口夕阳斜",
"旧时王谢堂前燕",
"飞入寻常百姓家。"
]
for s_ in list_:# 遍历 文本 list ,一句句朗诵
engine.say(s_)
engine.runAndWait()
助力快速掌握数据集的信息和使用方式。