【人工智能】Python实现文本转换为语音：使用gTTS库实现

news2026/2/14 12:24:32

在这里插入图片描述

🔥 个人主页：空白诗

在这里插入图片描述

文章目录

- 一、引言
- 二、准备工作
- 三、使用gTTS实现文本转换为语音
- - 详细步骤
- 四、人工智能与TTS技术
- 五、总结

在这里插入图片描述

一、引言

文本转换为语音（Text-to-Speech，简称TTS）技术是人工智能的重要组成部分，广泛应用于智能助手、导航系统、读屏软件和智能家居等领域。

TTS技术使得机器能够将书面文字转换为自然流畅的语音，这不仅提升了用户体验，还在无障碍设计中发挥了重要作用。

本文将介绍如何使用Python的gTTS（Google Text-to-Speech）库实现简单的TTS功能。

二、准备工作

在开始之前，需要确保已安装Python和pip。然后通过pip安装gTTS库：

pip install gtts

或者是

pip3 install gtts

三、使用gTTS实现文本转换为语音

以下是一个使用gTTS库将文本转换为语音并保存为MP3文件的完整示例代码。

from gtts import gTTS
import os

# 需要转换为语音的文本
text = "Hello, this is a sample text to speech conversion using gTTS library in Python."

# 选择语言（这里选择英语）
language = 'en'

# 使用gTTS将文本转换为语音
speech = gTTS(text=text, lang=language, slow=False)

# 保存为音频文件
speech.save("output.mp3")

# 播放音频文件（可选）
os.system("start output.mp3")  # 对于Windows
# os.system("mpg321 output.mp3")  # 对于Linux
# os.system("afplay output.mp3")  # 对于macOS

详细步骤

导入库：
首先需要导入gTTS和os库。gTTS库用于文本转换为语音，os库用于执行系统命令以播放音频文件。
```
from gtts import gTTS
import os
```
准备文本和语言：
定义需要转换为语音的文本和选择的语言。这里我们使用英语（语言代码为'en'）。
```
text = "Hello, this is a sample text to speech conversion using gTTS library in Python."
language = 'en'
```
转换文本为语音：
使用gTTS库将文本转换为语音。slow=False表示使用正常语速，如果需要慢速语音，可以设置为True。
```
speech = gTTS(text=text, lang=language, slow=False)
```
保存为音频文件：
将转换后的语音保存为MP3文件。
```
speech.save("output.mp3")
```
播放音频文件（可选）：
使用系统命令播放生成的音频文件。不同操作系统的播放命令不同，以下分别为Windows、Linux和macOS的播放命令：
- 对于Windows：
```
os.system("start output.mp3")
```
- 对于Linux：
```
os.system("mpg321 output.mp3")
```
- 对于macOS：
```
os.system("afplay output.mp3")
```