调用华为API实现语音合成

news2025/1/23 10:23:32

目录

  • 1.作者介绍
  • 2.华为云语音合成
    • 2.1 语音合成介绍
    • 2.2 华为语音合成服务
    • 2.3 应用场景
  • 3. 实验过程以及结果
    • 3.1 获取API密钥
    • 3.2 调用语音合成算法API
    • 3.3 实验代码
    • 3.4 运行结果

1.作者介绍

袁斌,男,西安工程大学电子信息学院,2023级研究生
研究方向:医学影像大数据分析
电子邮件:1424233159@qq.com

吴思雨,女,西安工程大学电子信息学院,2023级研究生
研究方向:机器视觉与异常检测
电子邮件:2879944563@qq.com

2.华为云语音合成

2.1 语音合成介绍

语音合成技术,通常被称为文本到语音(Text-to-Speech,TTS),是一种将书面文本转换为自然语音的技术。其主要应用包括为视障人士提供信息获取渠道、智能语音助手、自动化呼叫中心,以及内容创作中的配音等。语音合成技术的发展历程可以大致分为几个阶段:基于规则的合成、统计参数合成(如隐马尔可夫模型,HMM),以及近年来的深度学习方法(如基于神经网络的WaveNet、Tacotron等)。

2.2 华为语音合成服务

华为语音合成服务,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。

2.3 应用场景

1.语音导航
使用语音合成服务将车载导航数据转换成语音素材,为用户提供精确的语音导航服务。利用个性化定制能力,提供丰富的导航语音服务。
在这里插入图片描述2.有声读物
将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。
在这里插入图片描述
3.电话回访
在客服系统场景中,通过语音合成服务将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。
在这里插入图片描述
4.智能教育
将书本上的文本内容合成为语音,接近真人的发音可模拟真人教学场景,实现课文的朗读和带读,帮助学生更好地理解和掌握教学内容。
在这里插入图片描述

3. 实验过程以及结果

3.1 获取API密钥

1、注册华为云账号,进行实名认证,开通服务。
2、AK/SK认证,下载文件credentials.csv。
3、登录控制台。
4、单击页面右上角的用户名,并选择“我的凭证”。进入“我的凭证”页面:
在这里插入图片描述
单击“访问秘钥”页签下的“新增访问密钥”。弹出“新增访问密钥”对话框:
在这里插入图片描述
输入“登录密码”,如果绑定了手机或者邮箱,还需要获取验证码并进行验证。验证成功后,弹出访问密钥下载对话框。单击“确定”,并根据提示下载保存访问密钥。如果已生成过AK/SK,找到原来已下载的AK/SK文件,文件名一般为:credentials.csv。

3.2 调用语音合成算法API

1、点击开发者页面下的开发工具
在这里插入图片描述
2、单击API Explorer进入华为云OpenAPI页面,搜索语音交互。
在这里插入图片描述
3、设置参数
输入需要语音合成的文本,设置语音格式,采样率,语种等参数,示例:
在这里插入图片描述
待合成的文本:明月几时有,把酒问青天?
语音格式头: mp3
采样率 : 8000
语种: chinese_xiaoqi_common 小琪,标准女声发音人
4、API 3.0 Explorer 在线接口调试图
在这里插入图片描述
调试成功之后,将自动生成的python代码复制即可,但是一定要记得填入自己的"AK/SK"!!

3.3 实验代码

将ak,sk等参数修改为获取的密钥,运行成功后获得temp.mp3文件,正是所输入文本的语音。

# coding: utf-8
from huaweicloudsdkcore.auth.credentials import BasicCredentials
from huaweicloudsdksis.v1.region.sis_region import SisRegion
from huaweicloudsdkcore.exceptions import exceptions
from huaweicloudsdksis.v1 import *
import base64
def base64_to_file(base64_string, file_path):
    # 将base64字符串解码为字节流
    decoded_bytes = base64.b64decode(base64_string)
    # 将字节流写入文件
    with open(file_path, 'wb') as file:
        file.write(decoded_bytes)
if __name__ == "__main__":
    ak = __import__('os').getenv("CLOUD_SDK_AK")
    sk = __import__('os').getenv("CLOUD_SDK_SK")
    projectId = "6093a8e9e016484f9f9ccb3e85d1af45"
    credentials = BasicCredentials(ak, sk, projectId)
    client = SisClient.new_builder() \
        .with_credentials(credentials) \
        .with_region(SisRegion.value_of("cn-east-3")) \
        .build()
    try:
        request = RunTtsRequest()
        configbody = TtsConfig(
            audio_format="mp3",
            sample_rate="8000",
            _property="chinese_xiaoqi_common",
            speed=10,
            pitch=10,
            volume=50
        )
        request.body = PostCustomTTSReq(
            config=configbody,
            text="明月几时有,把酒问青天"
        )
        response = client.run_tts(request)
        print(response)
        base64_to_file(response.result.data, "temp.mp3")
    except exceptions.ClientRequestException as e:
        print(e.status_code)
        print(e.request_id)
        print(e.error_code)
        print(e.error_msg)

3.4 运行结果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1812211.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

哥斯拉v4.01webshell实验

1、工具使用 生成有效载荷 选择载荷和加密器 放到对应web目录下,然后就可以添加管理 2 、JAVA_AES_RAW-JSPX/JSP 流量 第一组:请求34880,响应0 第二组:请求48,响应32 第三组:请求64,响应2576…

Navicat访问宝塔中的MySQL

开放数据库权限: 开放3306端口: 连接数据库: 对应好用户名与名称,要不会报错1024:

【每日一题】错误的集合

错误的集合 ✨审题:在一个1-n的数组中,会有一个元素重复,一个元素丢失;👉目标;找到重复的元素和丢失的元素并放入一个数组中返还回去 ✨有没有想到单身狗问题的进阶版那个思路,找2个单身狗,一个…

升级和维护老旧LabVIEW程序

在升级老旧LabVIEW程序至64位环境时,需要解决兼容性、性能和稳定性等问题。本文从软件升级、硬件兼容性、程序优化、故障修复等多个角度详细分析。具体包括64位迁移注意事项、修复页面跳转崩溃、解决关闭程序后残留进程的问题,确保程序在新环境中的平稳运…

C++学习日记 | Lecture 7 函数进阶

资料来源:南科大 余仕琪 C/C Program Design LINK: CPP/week07 at main ShiqiYu/CPP GitHub7.1-default-arguments_哔哩哔哩_bilibili7.2-function-overloading_哔哩哔哩_bilibili7.3-function-templates_哔哩哔哩_bilibili7.4-function-pointers-an…

【课程总结】Day7:深度学习概述

前言 本篇文章,我们将通过示例来逐步学习理解导数、求函数最小值、深度学习的本质、以及使用numpy和pytorch实操深度学习训练过程。 线性回归 线性回归内容回顾 在《【课程总结】Day5(下):PCA降维、SVD分解、聚类算法和集成学习》中,我们…

Diffusers代码学习-ControlNet(Inpaint)

对于Inpaint,需要一个初始图像、一个蒙版图像和一个描述用什么替换蒙版的提示词。ControlNet模型允许添加另一个控制图片来调节模型。让我们用Inpaint蒙版来调整模型。这样,ControlNet可以使用修复掩模作为控件来引导模型在蒙版区域内生成图像。 # 以下代…

【Unity | Editor强化工具】资产快速访问工具

经常在Project窗口中翻找资产相对麻烦,Unity自带的Favorite功能又和Project窗口强绑定,且只能在双列视图下使用,故制作了一个可以在独立窗口中列举常用资产的小工具: Unity Asset Quick Access 。 CSDN弄了个Github加速计划&…

基于深度图像的无监督目标跟踪

概要 大致的步骤 深度图像获取:通过深度传感器(例如ToF相机、双目相机等)获取场景的深度图像。深度图转scanscan转pointcloud点云聚类卡尔曼滤波预测匈牙利算法匹配目标ID更新深度图转scan 参考这篇博客 scan转pointcloud

小迪安全代码语言回溯

java安全 第一个就是文件上传,可以通过../上传到上一级目录,以及别的目录,避免本目录不可以执行 jw令牌窃取 令牌由三部分组成,以.号分割,在java的程序看到cookie是三个奇怪的字符串以.号分开,可以确定是…

snmp-check一键获取SNMP信息(KALI工具系列二十一)

目录 1、KALI LINUX 简介 2、snmp-check工具简介 3、在KALI中使用onesixtyone 3.1 目标主机IP(win) 3.2 KALI的IP 4、操作示例 4.1 SNMP 检查 4.2 指定 SNMP 端口 4.3 指定社区字符串 4.4 详细输出 4.5 指定多项 5、总结 1、KALI LINUX 简介…

6.11 作业

以下是一个简单的比喻,将多态概念与生活中的实际情况相联系: 比喻:动物园的讲解员和动物表演 想象一下你去了一家动物园,看到了许多不同种类的动物,如狮子、大象、猴子等。现在,动物园里有一位讲解员&…

EGST:Explicit Geometric Structure Transformer论文解读

目录 一、导言 二、相关工作 1、3D局部描述子 2、点云配准方法 三、EGST模型 1、结构化特征 2、特征提取 3、点云匹配 4、变换估计 5、损失函数 四、实验 1、数据集 2、评估指标 3、细节 4、对比实验 一、导言 该论文提出一种基于增强几何结构特征的点云配准方…

【华为 ICT HCIA eNSP 习题汇总】——题目集21

1、OSPF协议中的hello报文不包括以下哪个字段? A、Priority(优先级) B、Neighbor(邻居表) C、Interval(时间间隔) D、Checksum(校验和) 考点:路由技术原理 解…

三十而已,逐梦AI新赛道,解锁职业第二春

前言 哎,你说这年头,一晃眼就三十了,是不是觉得找工作就像在走钢丝,小心翼翼还生怕踩空?特别是想换个跑道,跑到AI那边去,心里头那个忐忑啊,感觉比相亲还紧张。总担心老板们会不会嫌…

Linux-笔记 设备树插件

前言: 设备树插件(Device Tree Blob Overlay,简称 DTBO)是Linux内核和嵌入式系统中用于动态修改或扩展系统运行时的设备树配置的一种机制。它是对传统设备(Device Tree Source,简称 DTS)的补充&…

shiro反序列化分析

shiro反序列化分析 基础知识简单介绍关键组件SecurityManagerSubjectRealm总结 shiro安全框架在web中使用配置文件配置具体实现ShiroFilter过滤器分析 shiro的漏洞shiro550链子分析序列化加密cookie反序列化解密cookie验证总结 poc编写存在的问题和解决CC6TemplatesImlCC6insta…

AI写作助手:五款超实用工具让创作更轻松

写作这件事一直让我们从小学生头痛到打工人,初高中时期800字的作文让我们焦头烂额,一篇作文里用尽了口水话,拼拼凑凑才勉强完成。 大学时期以为可以轻松顺利毕业,结果毕业前的最后一道坎拦住我们的是毕业论文,苦战几个…

Day48 代码随想录打卡|二叉树篇---合并二叉树

题目(leecode T617): 给你两棵二叉树: root1 和 root2 。 想象一下,当你将其中一棵覆盖到另一棵之上时,两棵树上的一些节点将会重叠(而另一些不会)。你需要将这两棵树合并成一棵新…

C++ 不定参数模版

使用不定参数模版遇到一个小问题&#xff0c;做个记录 测试代码如下&#xff1a; template<typename T, typename ...Args> void pushToVectorIfParamIsStr(std::vector<std::string>& vec, T &&value,Args&&... args) {const bool is std:…