第十九章:Python-pyttsx3 库实现文本转语音功能

news2025/4/2 19:39:32

前言

    在开发语音交互应用或需要文本转语音功能的项目时,pyttsx3 是一个非常实用的 Python 库。它支持离线语音合成无需联网即可将文本转换为语音。本文将详细介绍 pyttsx3 的功能、用法以及常见问题的解决方法,并通过示例代码帮助你快速上手。资源绑定附上完整资料供读者参考学习(含效果视频)!

一、pyttsx3 是什么?

   pyttsx3 是一个轻量级的 Python 库,用于将文本转换为语音。它支持多种语音引擎,包括 Windows 的 SAPI5 和 NSSpeechSynthesizer(Mac),并且可以离线运行,无需依赖外部服务

特点:

  1. 离线运行:无需联网即可使用。

  2. 多平台支持:支持 Windows、Mac 和 Linux。

  3. 简单易用:API 简洁,易于集成到项目中。

  4. 可扩展性:支持自定义语音引擎和属性。

二、安装 pyttsx3

在开始之前,确保你已经安装了 pyttsx3。可以通过以下命令安装:

pip install pyttsx3

Windows用户可能需要额外安装:

pip install pywin32

记得把这两个库都加到Python解释器里

安装完成后,就可以开始使用了。

三、pyttsx3 基本用法

1. 初始化引擎

pyttsx3 的核心是 init() 方法,用于初始化语音引擎。默认情况下,它会自动选择系统支持的引擎。

Python

import pyttsx3

# 初始化引擎
engine = pyttsx3.init()

2. 语音播放

使用 say() 方法将文本传递给引擎,然后调用 runAndWait() 方法开始播放

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.say("Hello, welcome to the pyttsx3 tutorial!")
engine.runAndWait()

效果展示:

3. 保存语音到文件

可以将生成的语音保存为 WAV 文件,方便后续使用。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.save_to_file("Hello, welcome to the pyttsx3 tutorial!", "保存语音文件.wav")
engine.runAndWait()

效果展示

4.什么是 .wav 格式?

.wav(Waveform Audio File Format)是一种常见的音频文件格式,主要用于存储音频数据。以下是它的主要特点:

  1. 无损音频格式
    .wav 是一种无损音频格式,能够完整地保存音频的原始数据不会因压缩而损失音质。因此,它常用于高质量音频的存储和编辑。

  2. 文件较大
    由于 .wav 是无损格式,文件通常较大。例如,一分钟的音频可能占用几 MB 的存储空间。

  3. 兼容性好
    .wav 格式被广泛支持,几乎所有的音频播放器和编辑工具都可以读取和处理 .wav 文件。

  4. 应用场景

    • 语音合成和音频编辑(如 pyttsx3 的输出)。

    • 音频录制和后期处理。

    • 音频分析和研究。

四、语音属性设置

pyttsx3 提供了多种属性设置,可以自定义语音的速度、音量和声音

1. 设置语音速度

速度的范围通常在 0 到 200 之间,默认值为 200

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.setProperty('rate', 150)  # 设置速度为 150
engine.say("永远相信美好的事情即将发生 这个语音速度快吗")
engine.runAndWait()

效果展示

2. 设置音量

音量的范围是 0.0 到 1.0,默认值为 1.0

Python示例代码

import pyttsx3

engine = pyttsx3.init()
engine.setProperty('volume', 0.5)  # 设置音量为 50%
engine.say("Are you ok! 这个声音大吗 大的话给我点个赞好吗?")
engine.runAndWait()

效果展示

3. 设置声音

可以切换不同的语音声音,例如男性或女性声音。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

# 切换到第一个可用的女性声音
for voice in voices:
    if "female" in voice.name.lower():
        engine.setProperty('voice', voice.id)
        break

engine.say("这是一个女生的声音")
engine.runAndWait()

效果展示

五、pyttsx3 函数和参数总结

以下是 pyttsx3 的主要函数及其参数的详细说明:

函数/属性参数参数类型说明
init()driverNamestr指定语音引擎驱动名称,默认为系统默认引擎
say(text)textstr将文本添加到语音队列
runAndWait()开始播放语音并等待完成
save_to_file()textfilenamestrstr将语音保存到文件,支持 WAV 格式
setProperty()namevaluestrany设置引擎属性,如速度、音量、声音等
getProperty()namestr获取引擎属性值
setProperty('rate', value)valueint设置语音速度,范围通常为 0-200
setProperty('volume', value)valuefloat设置音量,范围为 0.0-1.0
setProperty('voice', value)valuestr设置语音声音,值为可用声音的 ID
stop()停止当前语音播放
endLoop()结束语音播放循环

六、进阶用法

1. 获取可用声音列表

可以列出系统中所有可用的声音,并选择特定的声音。

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

print("Available voices:")
for i, voice in enumerate(voices):
    # 手动设置语言信息
    if "Huihui" in voice.name:
        voice.languages = ["zh-CN"]  # 中文(简体)
    elif "Zira" in voice.name:
        voice.languages = ["en-US"]  # 英语(美国)

    print(f"{i+1}. {voice.name} - {voice.languages[0]}")

效果展示

2. 动态调整语音属性

可以在播放过程中动态调整语音属性,例如速度和音量。

Python示例代码

import pyttsx3

engine = pyttsx3.init()

# 慢速播放
engine.setProperty('rate', 100)
engine.say("这是慢速语音")

# 快速播放
engine.setProperty('rate', 250)
engine.say("这是快速语音")

engine.runAndWait()

效果展示

3. 多语言支持

如果系统支持多语言语音,可以指定语言进行语音合成

Python示例代码

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')

# 切换到中文语音
for voice in voices:
    if "Chinese" in voice.name:
        engine.setProperty('voice', voice.id)
        break

engine.say("啊阿狸不会拉杆-pyttsx3!")
engine.runAndWait()

效果展示

4.综合应用-语音助手

import pyttsx3
import datetime
import time
import random
import webbrowser

class SmartVoiceAssistant:
    def __init__(self,name="啊阿狸不会拉杆"):
        self.name=name
        self.engine=pyttsx3.init()
        # 设置默认语音参数
        self.engine.setProperty('rate',160)
        self.engine.setProperty('volume',0.9)
        # 尝试设置女声(如果有的话)
        voices=self.engine.getProperty('voices')
        for voice in voices:
            if voice.gender=='female'or('female'in voice.name.lower()):
                self.engine.setProperty('voice',voice.id)
                break
    def speak(self,text):
        """说话功能"""
        print(f"{self.name}:{text}")
        self.engine.say(text)
        self.engine.runAndWait()
    def greet(self):
        """根据时间问候"""
        hour=datetime.datetime.now().hour
        if 5<=hour<12:
            greeting="早上好!阳光明媚,祝你有个美好的一天。"
        elif 12<=hour<18:
            greeting="下午好!希望你今天过得愉快。"
        else:
            greeting="晚上好!今天过得怎么样?"
            self.speak(greeting)
    def tell_time(self):
        """报时功能"""
        now=datetime.datetime.now()
        time_str=now.strftime("%H点%M分")
        self.speak(f"现在是{time_str}")
    def tell_date(self):
        """报日期功能"""
        now=datetime.datetime.now()
        date_str=now.strftime("%Y年%m月%d日")
        weekday_names=["星期一","星期二","星期三","星期四","星期五","星期六","星期日"]
        weekday=weekday_names[now.weekday()]
        self.speak(f"今天是{date_str},{weekday}")
    def tell_weather(self,condition="晴天",temperature="26"):
        """天气播报(模拟数据)"""
        weather_templates=[
            f"今天天气{condition},气温{temperature}度,是个{self._get_day_comment(condition)}。",
            f"气象部门报告,今天{condition},温度{temperature}度。",
            f"今日天气:{condition},{temperature}度。{self._get_weather_advice(condition)}"
]
        self.speak(random.choice(weather_templates))
    def _get_day_comment(self,condition):
        """根据天气给出评价"""
        good_conditions=["晴天","多云","晴间多云"]
        if condition in good_conditions:
            return "适合户外活动的好日子"
        elif "雨" in condition:
            return "适合在家看书的日子"
        else:
            return "普通的日子"

    def _get_weather_advice(self,condition):
        """根据天气给出建议"""
        if "雨" in condition:
            return "记得带伞哦!"
        elif "晴" in condition:
            return "记得防晒!"
        elif "雪" in condition:
            return "注意保暖!"
        else:
            return "祝你有愉快的一天!"

    def read_news(self,news_list):
        """阅读新闻"""
        self.speak("以下是今日热点新闻:")
        for i,news in enumerate(news_list,1):
            self.speak(f"新闻{i}:{news}")
            time.sleep(0.5)

    def set_reminder(self,minutes,message):
        """设置提醒"""
        self.speak(f"好的,我会在{minutes}分钟后提醒你{message}")

        def reminder_task():
            time.sleep(minutes*60)
            self.speak(f"提醒时间到!{message}")

# 在实际应用中,这里应该使用线程而不是阻塞
#import threading
# reminder_thread = threading.Thread(target=reminder_task)
# reminder_thread.daemon = True
# reminder_thread.start()

# 为了演示,我们使用以下注释掉的代码
# reminder_task()

    def tell_joke(self):
        """讲笑话"""
        jokes=[
            "为什么程序员总是分不清万圣节和圣诞节?因为Oct 31 和 Dec 25 是一样的。",
            "一个程序员去买菜,妻子叮嘱他:'买10个苹果,如果看到有香蕉,就买20个。'结果他回来了,带了20个苹果。妻子问他怎么回事,他说:'他们有香蕉。'",
            "如何判断一个人是否是程序员?问他下楼梯要多久,如果他回答'O(n)',那他就是程序员。",
            "有一天,程序员的妻子让他去买东西:'去买一瓶牛奶,如果有鸡蛋,买六个。'程序员回来后,带了六瓶牛奶。妻子问他:'为什么买六瓶?'他回答:'因为有鸡蛋。'"
]
        self.speak(random.choice(jokes))

    def search_web(self,query):
        """模拟网络搜索"""
        self.speak(f"正在搜索:{query}")
        # 实际应用中可以打开浏览器
        webbrowser.open(f"https://www.google.com/search?q={query}")

    def interactive_mode(self):
        """交互模式"""
        self.greet()
        self.speak(f"我是{self.name},你的智能语音助手。有什么我能帮你的吗?")
        self.speak("我可以告诉你时间、日期、天气,读新闻,讲笑话,或者设置提醒。")

# 在实际应用中,这里应该有语音识别和自然语言处理
# 但为了演示,我们使用简单的输入
        print("\n可用命令:时间、日期、天气、新闻、笑话、提醒、退出")

        while True:
            command=input("\n请输入命令: ").strip().lower()

            if "退出" in command:
                self.speak("再见,期待与你的下次相遇!")
                break
            elif "时间" in command:
                self.tell_time()
            elif "日期" in command:
                self.tell_date()
            elif "天气" in command:
                self.tell_weather()
            elif "新闻" in command:
                sample_news=[
                    "科学家发现新的治疗方法,有望攻克多种疑难杂症",
                    "全国多地加大环保力度,空气质量显著改善",
                    "最新研究表明,每天喝八杯水可能并非必要"
]
                self.read_news(sample_news)
            elif "笑话" in command:
                self.tell_joke()
            elif "提醒" in command:
                self.speak("你想要我提醒你什么?")
                message=input("提醒内容: ")
                self.speak("几分钟后提醒?")
                try:
                    minutes=int(input("分钟数: "))
                    self.set_reminder(minutes,message)
                except ValueError:
                    self.speak("抱歉,我没有理解这个时间")
            else:
                self.speak("抱歉,我没有理解你的命令。可以请你重新说一次吗?")

# 使用示例
if  __name__=="__main__":
    assistant=SmartVoiceAssistant()
# 单独功能演示
# assistant.greet()
# assistant.tell_time()
# assistant.tell_date()
# assistant.tell_weather("小雨", "22")
# assistant.tell_joke()

# 交互模式
# assistant.interactive_mode()

# 简单演示
assistant.speak("演示开始")
assistant.greet()
assistant.tell_time()
assistant.tell_weather()
assistant.tell_joke()
assistant.speak("演示结束,感谢使用!")

效果展示

七、常见问题与解决方法

1. 语音引擎初始化失败

如果初始化失败,可能是因为系统缺少语音引擎。可以尝试以下方法:

  • 确保系统已安装语音引擎(如 Windows 的 SAPI5)。

  • 指定驱动名称初始化:

    Python

    engine = pyttsx3.init(driverName='sapi5')

2. 语音播放无声音

可能的原因包括:

  • 音量设置为 0

  • 选择了无效的声音。

  • 系统音量静音或过低

3. 保存的语音文件无法播放

确保保存的文件路径正确,并且文件格式支持播放(如 WAV)。

八、总结

  pyttsx3 是一个功能强大且易于使用的文本转语音库,适合需要离线语音合成的场景。通过本文的介绍,你应该已经掌握了 pyttsx3 的基本用法和一些进阶技巧。希望这些内容能帮助你在项目中更好地应用 pyttsx3资源绑定附上完整资料供读者参考学习(含效果视频)!

如果你有任何问题或建议,欢迎在评论区留言!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2325913.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SvelteKit 最新中文文档教程(16)—— Service workers

前言 Svelte&#xff0c;一个语法简洁、入门容易&#xff0c;面向未来的前端框架。 从 Svelte 诞生之初&#xff0c;就备受开发者的喜爱&#xff0c;根据统计&#xff0c;从 2019 年到 2024 年&#xff0c;连续 6 年一直是开发者最感兴趣的前端框架 No.1&#xff1a; Svelte …

Flutter项目之构建打包分析

目录&#xff1a; 1、准备部分2、构建Android包2.1、配置修改部分2.2、编译打包 3、构建ios包3.1、配置修改部分3.2、编译打包 1、准备部分 2、构建Android包 2.1、配置修改部分 2.2、编译打包 执行flutter build apk命令进行打包。 3、构建ios包 3.1、配置修改部分 3.2、编译…

24、网络编程基础概念

网络编程基础概念 网络结构模式MAC地址IP地址子网掩码端口网络模型协议网络通信的过程&#xff08;封装与解封装&#xff09; 网络结构模式 C/S结构&#xff0c;由客户机和服务器两部分组成&#xff0c;如QQ、英雄联盟 B/S结构&#xff0c;通过浏览器与服务器进程交互&#xf…

Mentalab Explore Pro携手 Wearanize + 数据集,推动睡眠科学研究

在神经科学和睡眠研究的领域&#xff0c;精确监测大脑活动是获取深入见解的关键。传统多导睡眠监测&#xff08;PSG&#xff09;设备虽然提供了详尽的数据&#xff0c;但其操作的复杂性和成本限制了其在更广泛场景中的应用。可穿戴技术的兴起提供了一种新的数据收集方式&#x…

基于 RK3588 的 YOLO 多线程推理多级硬件加速引擎框架设计(代码框架和实现细节)

一、前言 接续上一篇文章&#xff0c;这个部分主要分析代码框架的实现细节和设计理念。 基于RK3588的YOLO多线程推理多级硬件加速引擎框架设计&#xff08;项目总览和加速效果&#xff09;-CSDN博客https://blog.csdn.net/plmm__/article/details/146542002?spm1001.2014.300…

【Yolov8部署】 VS2019+opencv+onnxruntime 环境下部署目标检测模型

文章目录 前言一、导出yolov8模型为onnx文件二、VS2019中环境配置三、源码与实际运行 前言 本文主要研究场景为工业场景下&#xff0c;在工控机与工业相机环境中运行的视觉缺陷检测系统&#xff0c;因此本文主要目的为实现c环境下&#xff0c;将yolov8已训练好的检测模型使用o…

论文阅读:Dual Anchor Graph Fuzzy Clustering for Multiview Data

论文地址:Dual Anchor Graph Fuzzy Clustering for Multiview Data | IEEE Journals & Magazine | IEEE Xplore 代码地址&#xff1a;https://github.com/BBKing49/DAG_FC 摘要 多视角锚图聚类近年来成为一个重要的研究领域&#xff0c;催生了多个高效的方法。然而&#…

乐橙R10 AI智能锁:以「技术减法」终结智能家居「参数内卷」

1 行业迷思&#xff1a;当「技术内卷」背离用户真实需求 “三摄猫眼”、“0.3秒人脸解锁”、“DeepSeek大模型”……智能锁行业的营销话术日益浮夸&#xff0c;但用户体验却陷入“功能冗余”与“操作复杂”的泥潭。 一位用户在社交平台直言&#xff1a;“我的智能锁有六个摄像…

如何使用 FastAPI 构建 MCP 服务器

哎呀&#xff0c;各位算法界的小伙伴们&#xff01;今天咱们要聊聊一个超酷的话题——MCP 协议&#xff01;你可能已经听说了&#xff0c;Anthropic 推出了这个新玩意儿&#xff0c;目的是让 AI 代理和你的应用程序之间的对话变得更顺畅、更清晰。不过别担心&#xff0c;为你的…

当 EcuBus-Pro + UTA0401 遇上 NSUC1500

文章目录 1.前言2.EcuBus-Pro简介2.1 官方地址2.2 概览 3.纳芯微NSUC1500简介3.1 NSUC1500概述3.2 产品特性 4.测试环境5.基础功能5.1 数据发送5.2 数据监控 6.自动化功能6.1 脚本创建6.2 脚本编辑6.3 脚本编辑与测试 7.音乐律动7.1 导入例程7.2 效果展示 ECB工程 1.前言 最近…

【FreeRTOS】裸机开发与操作系统区别

&#x1f50e;【博主简介】&#x1f50e; &#x1f3c5;CSDN博客专家 &#x1f3c5;2021年博客之星物联网与嵌入式开发TOP5 &#x1f3c5;2022年博客之星物联网与嵌入式开发TOP4 &#x1f3c5;2021年2022年C站百大博主 &#x1f3c5;华为云开发…

Deepseek API+Python 测试用例一键生成与导出 V1.0.4 (接口文档生成接口测试用例保姆级教程)

接口文档生成接口测试用例保姆级教程 随着测试需求的复杂性增加,测试用例的设计和生成变得愈发重要。Deepseek API+Python 测试用例生成工具在 V1.0.4 中进行了全方位的优化和功能扩展,特别是对接口测试用例设计的支持和接口文档的智能解析处理。本文将详细介绍 V1.0.4 版本…

CET-4增量表

CET-4词表-增量表 注&#xff1a; 【1】所谓增量&#xff0c;是相对于高中高考之增量 即&#xff0c;如果你是在读大学生&#xff0c;高中英语单词过关了&#xff0c;准备考CET-4&#xff0c;那么侧重下面的增量词表的学习&#xff0c;也算是一条捷径吧 ^_^ 【2】本结果数据 官…

DeepSeek详解:探索下一代语言模型

文章目录 前言一、什么是DeepSeek二、DeepSeek核心技术2.1 Transformer架构2.1.1 自注意力机制 (Self-Attention Mechanism)(a) 核心思想(b) 计算过程(c) 代码实现 2.1.2 多头注意力 (Multi-Head Attention)(a) 核心思想(b) 工作原理(c) 数学描述(d) 代码实现 2.1.3 位置编码 (…

FOC 控制笔记【三】磁链观测器

一、磁链观测器基础 1.1 什么是磁链 磁链&#xff08;magnetic linkage&#xff09;是电磁学中的一个重要概念&#xff0c;指导电线圈或电流回路所链环的磁通量。单位为韦伯&#xff08;Wb&#xff09;&#xff0c;又称磁通匝。 公式为&#xff1a; 线圈匝数 穿过单匝数的…

SpringBoot项目读取自定义的配置文件

先说使用场景: 开发时在resource目录下新建一个 config 文件夹, 在里面存放 myconf.properties 文件, 打包后这个文件会放到与jar包同级的目录下, 如下图 关键点&#xff1a;自定义的文件名(当然后缀是.properties)&#xff0c;自定义的存放路径。 主要的要求是在打包后运行过…

在PyCharm 中免费集成Amazon CodeWhisperer

CodeWhisperer 是Amazon发布的一款免费的AI 编程辅助小工具&#xff0c;可在你的集成开发环境&#xff08;IDE&#xff09;中生成实时单行或全函数代码建议&#xff0c;帮助你快速构建软件。简单来说&#xff0c;Amazon CodeWhisperer就是你写一段注释&#xff08;支持中文&…

[7-02-02].第15节:生产经验 - 消费者相关操作

Kafka笔记大纲 五、生产经验——分区的分配以及再平衡: 4.1.生产经验——分区的分配以及再平衡 4.2.参数&#xff1a; 5.4.1 Range 以及再平衡

Matlab_Simulink中导入CSV数据与仿真实现方法

前言 在Simulink仿真中&#xff0c;常需将外部数据&#xff08;如CSV文件或MATLAB工作空间变量&#xff09;作为输入信号驱动模型。本文介绍如何高效导入CSV数据至MATLAB工作空间&#xff0c;并通过From Workspace模块实现数据到Simulink的精确传输&#xff0c;适用于运动控制…

文件操作与IO—File类

目录 1 属性 2 构造方法 3 常用方法 4 示例代码 1 属性 修饰符与类型 属性 含义 static String pathSeparator 依赖于系统的路径分隔符&#xff0c;String类型的表示 static char pathSeparator 依赖于系统的路径分隔符&#xff0c;char类型的表示 2 构造方法 构造…