目录
🍸前言
🍻一、环境准备
🍺二、依赖引入
💞️三、简单启动
🍹四、接口改造
4.1 封装为一个工具类
4.2 暴露一个接口
4.3 测试
🌱五、扩展
🍸前言
小伙伴们大家好,上次分享了一位读者使用国际化上下文 i18n 技术时遇到的兼容问题,也是成功帮他解决了问题,自己同时也学到这种使用方式;这次先放一放常用技术的学习,来看一个小工具,文本转语音,用 java 实现
🍻一、环境准备
一台语音功能没问题的设备(因为要借用机器的语音设备)
本地创建一个可以运行的 SpringBoot 项目,另外准备一个接口模拟工具即可
🍺二、依赖引入
jacob
是一个 Java COM (Component Object Model) 接口库,利用了 COM 接口来调用 Windows 的语音合成(TTS)服务,可以访问 Windows 的 Speech API 或者类似的语音合成工具,用于将文本转换为语音。
在项目的 pom.xml 文件中添加以下依赖,刷新 maven 触发自动下载
<dependency>
<groupId>com.hynnet</groupId>
<artifactId>jacob</artifactId>
<version>1.18</version>
</dependency>
注:首次启动的时候可能会遇到如下报错
Exception in thread "main" java.lang.UnsatisfiedLinkError: no jacob-1.18-x64 in java.library.path
只需要手动下载解压后将文件放入到 JDK 的 bin 目录下即可
Release Release 1.18 · freemansoft/jacob-project · GitHub
查看自己 JDK 安装位置的命令如下:
💞️三、简单启动
使用语音功能的主要代码如下:
有四个参数,第一个参数是控制生成的 .mps 多媒体文件的输出位置;
第二个是所需语音阅读的文本内容
第三个第四个是控制语音元素的
/**
* 文本转音频
*
* @param path 音频生成路径(全路径,带文件名)(例:D:\\aa\\a.mp3)
* @param text 文本内容
* @param volume 音量大小 0 - 100
* @param speed 语音朗读速度 -10 到 +10
* @return 是否成功
*/
public static boolean text(String path, String text, int volume, int speed) {
try {
// 调用dll朗读方法
ActiveXComponent ax = new ActiveXComponent("Sapi.SpVoice");
// 音量 0 - 100
ax.setProperty("Volume", new Variant(volume));
// 语音朗读速度 -10 到 +10
ax.setProperty("Rate", new Variant(speed));
// 输入的语言内容
Dispatch dispatch = ax.getObject();
// 本地执行朗读
Dispatch.call(dispatch, "Speak", new Variant(text));
//开始生成语音文件,构建文件流
ax = new ActiveXComponent("Sapi.SpFileStream");
Dispatch sfFileStream = ax.getObject();
//设置文件生成格式
ax = new ActiveXComponent("Sapi.SpAudioFormat");
Dispatch fileFormat = ax.getObject();
// 设置音频流格式
Dispatch.put(fileFormat, "Type", new Variant(22));
// 设置文件输出流格式
Dispatch.putRef(sfFileStream, "Format", fileFormat);
// 调用输出文件流打开方法,创建一个音频文件
Dispatch.call(sfFileStream, "Open", new Variant(path), new Variant(3), new Variant(true));
// 设置声音对应输出流为输出文件对象
Dispatch.putRef(dispatch, "AudioOutputStream", sfFileStream);
// 设置音量
Dispatch.put(dispatch, "Volume", new Variant(volume));
// 设置速度
Dispatch.put(dispatch, "Rate", new Variant(speed));
// 执行朗读
Dispatch.call(dispatch, "Speak", new Variant(text));
// 关闭输出文件
Dispatch.call(sfFileStream, "Close");
Dispatch.putRef(dispatch, "AudioOutputStream", null);
// 关闭资源
sfFileStream.safeRelease();
fileFormat.safeRelease();
// 关闭朗读的操作
dispatch.safeRelease();
ax.safeRelease();
return true;
} catch (Exception e) {
e.printStackTrace();
}
return false;
}
测试下,因为只有本地能听到语音,所以这里就用打印验证方法执行没有出错,结果如下:
🍹四、接口改造
本地测试,该依赖对接设备语音没有问题,在此基础上可以改造为一个接口,该接口的功能就是朗读接口传入的参数,改造后如下:
4.1 封装为一个工具类
这里把保存到本地的代码去掉了,因为只需要阅读即可,不用保留多媒体文件
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
/**
* @author HuangBen
*/
public class SpeakUtil {
/**
* 文本转音频
*
* @param text 文本内容
* @return 是否成功
*/
public static boolean text(String text) {
try {
// 调用dll朗读方法
ActiveXComponent ax = new ActiveXComponent("Sapi.SpVoice");
// 音量 0 - 100
ax.setProperty("Volume", new Variant(50));
// 语音朗读速度 -10 到 +10
ax.setProperty("Rate", new Variant(0));
// 输入的语言内容
Dispatch dispatch = ax.getObject();
// 本地执行朗读
Dispatch.call(dispatch, "Speak", new Variant(text));
// 关闭朗读的操作
dispatch.safeRelease();
ax.safeRelease();
return true;
} catch (Exception e) {
e.printStackTrace();
}
return false;
}
}
4.2 暴露一个接口
使用一个 get 请求简单模拟下即可,请求到达之后首先创建一个线程进行语音朗读,主线程进行打印,这是为了防止请求参数过长时,迟迟收不到响应
@GetMapping("/testVoice")
public void testVoice(String word) {
new Thread(() -> {
SpeakUtil.text(word);
}).start();
System.out.println(word);
}
4.3 测试
🌱五、扩展
这只是在本地测试使用的方式,实际上隐藏的问题还有很多,比如语音只能在本地机器触发,另外就是如果请求接口参数过长,多个请求同时来的话,可能处理不及时导致部分请求报错或者说无法语音,当然也有一些别的更成熟的依赖可以使用,比如谷歌(需要账号认证),本地只是小耍一下
文章到这里就结束了~