第十九章:Python-pyttsx3 库实现文本转语音功能

前言

在开发语音交互应用或需要文本转语音功能的项目时，pyttsx3 是一个非常实用的 Python 库。它支持离线语音合成，无需联网即可将文本转换为语音。本文将详细介绍 pyttsx3 的功能、用法以及常见问题的解决方法，并通过示例代码帮助你快速上手。资源绑定附上完整资料供读者参考学习（含效果视频）！

一、`pyttsx3` 是什么？

pyttsx3 是一个轻量级的 Python 库，用于将文本转换为语音。它支持多种语音引擎，包括 Windows 的 SAPI5 和 NSSpeechSynthesizer（Mac），并且可以离线运行，无需依赖外部服务。

特点：

离线运行：无需联网即可使用。
多平台支持：支持 Windows、Mac 和 Linux。
简单易用：API 简洁，易于集成到项目中。
可扩展性：支持自定义语音引擎和属性。

二、安装 `pyttsx3`

在开始之前，确保你已经安装了 pyttsx3。可以通过以下命令安装：

pip install pyttsx3

Windows用户可能需要额外安装：

pip install pywin32

记得把这两个库都加到Python解释器里

安装完成后，就可以开始使用了。

三、`pyttsx3` 基本用法

1. 初始化引擎

pyttsx3 的核心是 init() 方法，用于初始化语音引擎。默认情况下，它会自动选择系统支持的引擎。

Python

import pyttsx3

# 初始化引擎
engine = pyttsx3.init()

2. 语音播放

使用 say() 方法将文本传递给引擎，然后调用 runAndWait() 方法开始播放。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.say("Hello, welcome to the pyttsx3 tutorial!")
engine.runAndWait()

效果展示:

3. 保存语音到文件

可以将生成的语音保存为 WAV 文件，方便后续使用。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.save_to_file("Hello, welcome to the pyttsx3 tutorial!", "保存语音文件.wav")
engine.runAndWait()

效果展示

4.什么是 `.wav` 格式？

.wav（Waveform Audio File Format）是一种常见的音频文件格式，主要用于存储音频数据。以下是它的主要特点：

无损音频格式：
.wav 是一种无损音频格式，能够完整地保存音频的原始数据，不会因压缩而损失音质。因此，它常用于高质量音频的存储和编辑。
文件较大：
由于 .wav 是无损格式，文件通常较大。例如，一分钟的音频可能占用几 MB 的存储空间。
兼容性好：
.wav 格式被广泛支持，几乎所有的音频播放器和编辑工具都可以读取和处理 .wav 文件。
应用场景：
- 语音合成和音频编辑（如 pyttsx3 的输出）。
- 音频录制和后期处理。
- 音频分析和研究。

四、语音属性设置

pyttsx3 提供了多种属性设置，可以自定义语音的速度、音量和声音。

1. 设置语音速度

速度的范围通常在 0 到 200 之间，默认值为 200。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.setProperty('rate', 150)  # 设置速度为 150
engine.say("永远相信美好的事情即将发生 这个语音速度快吗")
engine.runAndWait()

效果展示

2. 设置音量

音量的范围是 0.0 到 1.0，默认值为 1.0。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.setProperty('volume', 0.5)  # 设置音量为 50%
engine.say("Are you ok! 这个声音大吗 大的话给我点个赞好吗？")
engine.runAndWait()

效果展示

3. 设置声音

可以切换不同的语音声音，例如男性或女性声音。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

# 切换到第一个可用的女性声音
for voice in voices:
    if "female" in voice.name.lower():
        engine.setProperty('voice', voice.id)
        break

engine.say("这是一个女生的声音")
engine.runAndWait()

效果展示

五、`pyttsx3` 函数和参数总结

以下是 pyttsx3 的主要函数及其参数的详细说明：

函数/属性	参数	参数类型	说明
`init()`	`driverName`	`str`	指定语音引擎驱动名称，默认为系统默认引擎
`say(text)`	`text`	`str`	将文本添加到语音队列
`runAndWait()`	无	无	开始播放语音并等待完成
`save_to_file()`	`text`, `filename`	`str`, `str`	将语音保存到文件，支持 WAV 格式
`setProperty()`	`name`, `value`	`str`, `any`	设置引擎属性，如速度、音量、声音等
`getProperty()`	`name`	`str`	获取引擎属性值
`setProperty('rate', value)`	`value`	`int`	设置语音速度，范围通常为 0-200
`setProperty('volume', value)`	`value`	`float`	设置音量，范围为 0.0-1.0
`setProperty('voice', value)`	`value`	`str`	设置语音声音，值为可用声音的 ID
`stop()`	无	无	停止当前语音播放
`endLoop()`	无	无	结束语音播放循环

六、进阶用法

1. 获取可用声音列表

可以列出系统中所有可用的声音，并选择特定的声音。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

print("Available voices:")
for i, voice in enumerate(voices):
    # 手动设置语言信息
    if "Huihui" in voice.name:
        voice.languages = ["zh-CN"]  # 中文（简体）
    elif "Zira" in voice.name:
        voice.languages = ["en-US"]  # 英语（美国）

    print(f"{i+1}. {voice.name} - {voice.languages[0]}")

效果展示

2. 动态调整语音属性

可以在播放过程中动态调整语音属性，例如速度和音量。

Python示例代码

import pyttsx3

engine = pyttsx3.init()

# 慢速播放
engine.setProperty('rate', 100)
engine.say("这是慢速语音")

# 快速播放
engine.setProperty('rate', 250)
engine.say("这是快速语音")

engine.runAndWait()

效果展示

3. 多语言支持

如果系统支持多语言语音，可以指定语言进行语音合成。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

# 切换到中文语音
for voice in voices:
    if "Chinese" in voice.name:
        engine.setProperty('voice', voice.id)
        break

engine.say("啊阿狸不会拉杆-pyttsx3！")
engine.runAndWait()

效果展示

4.综合应用-语音助手

import pyttsx3
import datetime
import time
import random
import webbrowser

class SmartVoiceAssistant:
    def __init__(self,name="啊阿狸不会拉杆"):
        self.name=name
        self.engine=pyttsx3.init()
        # 设置默认语音参数
        self.engine.setProperty('rate',160)
        self.engine.setProperty('volume',0.9)
        # 尝试设置女声（如果有的话）
        voices=self.engine.getProperty('voices')
        for voice in voices:
            if voice.gender=='female'or('female'in voice.name.lower()):
                self.engine.setProperty('voice',voice.id)
                break
    def speak(self,text):
        """说话功能"""
        print(f"{self.name}:{text}")
        self.engine.say(text)
        self.engine.runAndWait()
    def greet(self):
        """根据时间问候"""
        hour=datetime.datetime.now().hour
        if 5<=hour<12:
            greeting="早上好！阳光明媚，祝你有个美好的一天。"
        elif 12<=hour<18:
            greeting="下午好！希望你今天过得愉快。"
        else:
            greeting="晚上好！今天过得怎么样？"
            self.speak(greeting)
    def tell_time(self):
        """报时功能"""
        now=datetime.datetime.now()
        time_str=now.strftime("%H点%M分")
        self.speak(f"现在是{time_str}")
    def tell_date(self):
        """报日期功能"""
        now=datetime.datetime.now()
        date_str=now.strftime("%Y年%m月%d日")
        weekday_names=["星期一","星期二","星期三","星期四","星期五","星期六","星期日"]
        weekday=weekday_names[now.weekday()]
        self.speak(f"今天是{date_str}，{weekday}")
    def tell_weather(self,condition="晴天",temperature="26"):
        """天气播报（模拟数据）"""
        weather_templates=[
            f"今天天气{condition}，气温{temperature}度，是个{self._get_day_comment(condition)}。",
            f"气象部门报告，今天{condition}，温度{temperature}度。",
            f"今日天气：{condition}，{temperature}度。{self._get_weather_advice(condition)}"
]
        self.speak(random.choice(weather_templates))
    def _get_day_comment(self,condition):
        """根据天气给出评价"""
        good_conditions=["晴天","多云","晴间多云"]
        if condition in good_conditions:
            return "适合户外活动的好日子"
        elif "雨" in condition:
            return "适合在家看书的日子"
        else:
            return "普通的日子"

    def _get_weather_advice(self,condition):
        """根据天气给出建议"""
        if "雨" in condition:
            return "记得带伞哦！"
        elif "晴" in condition:
            return "记得防晒！"
        elif "雪" in condition:
            return "注意保暖！"
        else:
            return "祝你有愉快的一天！"

    def read_news(self,news_list):
        """阅读新闻"""
        self.speak("以下是今日热点新闻：")
        for i,news in enumerate(news_list,1):
            self.speak(f"新闻{i}：{news}")
            time.sleep(0.5)

    def set_reminder(self,minutes,message):
        """设置提醒"""
        self.speak(f"好的，我会在{minutes}分钟后提醒你{message}")

        def reminder_task():
            time.sleep(minutes*60)
            self.speak(f"提醒时间到！{message}")

# 在实际应用中，这里应该使用线程而不是阻塞
#import threading
# reminder_thread = threading.Thread(target=reminder_task)
# reminder_thread.daemon = True
# reminder_thread.start()

# 为了演示，我们使用以下注释掉的代码
# reminder_task()

    def tell_joke(self):
        """讲笑话"""
        jokes=[
            "为什么程序员总是分不清万圣节和圣诞节？因为Oct 31 和 Dec 25 是一样的。",
            "一个程序员去买菜，妻子叮嘱他：'买10个苹果，如果看到有香蕉，就买20个。'结果他回来了，带了20个苹果。妻子问他怎么回事，他说：'他们有香蕉。'",
            "如何判断一个人是否是程序员？问他下楼梯要多久，如果他回答'O(n)'，那他就是程序员。",
            "有一天，程序员的妻子让他去买东西：'去买一瓶牛奶，如果有鸡蛋，买六个。'程序员回来后，带了六瓶牛奶。妻子问他：'为什么买六瓶？'他回答：'因为有鸡蛋。'"
]
        self.speak(random.choice(jokes))

    def search_web(self,query):
        """模拟网络搜索"""
        self.speak(f"正在搜索：{query}")
        # 实际应用中可以打开浏览器
        webbrowser.open(f"https://www.google.com/search?q={query}")

    def interactive_mode(self):
        """交互模式"""
        self.greet()
        self.speak(f"我是{self.name}，你的智能语音助手。有什么我能帮你的吗？")
        self.speak("我可以告诉你时间、日期、天气，读新闻，讲笑话，或者设置提醒。")

# 在实际应用中，这里应该有语音识别和自然语言处理
# 但为了演示，我们使用简单的输入
        print("\n可用命令：时间、日期、天气、新闻、笑话、提醒、退出")

        while True:
            command=input("\n请输入命令: ").strip().lower()

            if "退出" in command:
                self.speak("再见，期待与你的下次相遇！")
                break
            elif "时间" in command:
                self.tell_time()
            elif "日期" in command:
                self.tell_date()
            elif "天气" in command:
                self.tell_weather()
            elif "新闻" in command:
                sample_news=[
                    "科学家发现新的治疗方法，有望攻克多种疑难杂症",
                    "全国多地加大环保力度，空气质量显著改善",
                    "最新研究表明，每天喝八杯水可能并非必要"
]
                self.read_news(sample_news)
            elif "笑话" in command:
                self.tell_joke()
            elif "提醒" in command:
                self.speak("你想要我提醒你什么？")
                message=input("提醒内容: ")
                self.speak("几分钟后提醒？")
                try:
                    minutes=int(input("分钟数: "))
                    self.set_reminder(minutes,message)
                except ValueError:
                    self.speak("抱歉，我没有理解这个时间")
            else:
                self.speak("抱歉，我没有理解你的命令。可以请你重新说一次吗？")

# 使用示例
if  __name__=="__main__":
    assistant=SmartVoiceAssistant()
# 单独功能演示
# assistant.greet()
# assistant.tell_time()
# assistant.tell_date()
# assistant.tell_weather("小雨", "22")
# assistant.tell_joke()

# 交互模式
# assistant.interactive_mode()

# 简单演示
assistant.speak("演示开始")
assistant.greet()
assistant.tell_time()
assistant.tell_weather()
assistant.tell_joke()
assistant.speak("演示结束，感谢使用！")

效果展示

七、常见问题与解决方法

1. 语音引擎初始化失败

如果初始化失败，可能是因为系统缺少语音引擎。可以尝试以下方法：

确保系统已安装语音引擎（如 Windows 的 SAPI5）。

指定驱动名称初始化：

Python

engine = pyttsx3.init(driverName='sapi5')

2. 语音播放无声音

可能的原因包括：

音量设置为 0。
选择了无效的声音。
系统音量静音或过低。

3. 保存的语音文件无法播放

确保保存的文件路径正确，并且文件格式支持播放（如 WAV）。

八、总结

pyttsx3 是一个功能强大且易于使用的文本转语音库，适合需要离线语音合成的场景。通过本文的介绍，你应该已经掌握了 pyttsx3 的基本用法和一些进阶技巧。希望这些内容能帮助你在项目中更好地应用 pyttsx3！资源绑定附上完整资料供读者参考学习（含效果视频）！

如果你有任何问题或建议，欢迎在评论区留言！