阿里云 CosyVoice 语音合成大模型 API 实践

news2025/2/22 4:34:32

前言

最近大模型这么火,就想着玩一下,作为非 AI 从业者,最好的方式就是调用云服务的 API 来构建自己的 AI 应用。
首选当然是国外的 ChatGPT API,但是说实话那个玩意有点贵,而且最近国内也被封禁不让调用了,最近使用了下阿里的通义千问,说良心话,如果我们的 AI 应用是基于中文的,个人觉得国内的通义千问和文心一言还是挺不错的。
说干就干,开通了阿里云的 dashscope.api_key, 这个开通很简单这里就不说了,而且这个 Key 每个月送的都有免费试用的 token 数,不商用,玩玩完全是足够了的。而且现在阿里的 API key 收费贼便宜,冲就是了。
image.png
接下来我会演示调用 **文字合成语音大模型,**来生成两段语音,我把生成的语音上传到资源里了,大家可以下载听一下:

  • 女朋友想要买一个东西,然后给男朋友撒娇的语音
    女朋友撒娇
  • 小女孩嘴馋想要买糖葫芦,给姐姐撒娇的语音
    小女孩撒娇

参考文档:
官方实例代码 git 地址
官方CosyVoice 大模型文字生语音文档
不同 voice 音色官方文档
这里有很多不同种的音色,和真人语音差不多,而且有的还挺有意思的,比如有个龙老铁的,东北口音,大家可以试下。

代码

# coding=utf-8

import dashscope
from dashscope.audio.tts_v2 import *

dashscope.api_key = '使用你在阿里云开通的 key'

# 女朋友撒娇
npy_sajiao = """
哎呀~亲爱的,你知不知道我今天在商场里看到了一个超级超级可爱的小熊玩偶啊?
它的眼睛圆溜溜的,好像会说话一样,我一看到它,心都快要融化了呢~但是人家最近钱包君有点瘦,所以只好忍痛离开了。
可是脑子里一直都是它的影子,转来转去都是它萌萌的样子,我是不是很没出息呀?
要是你能帮宝贝把它带回家,我保证会给你做好多好多好吃的,还会给你一个大大的熊抱加香香的亲亲哦~好不好嘛,就当是给我的小奖励嘛~
"""
# 适合女朋友撒娇的温柔音色
wenrou_voice = 'longmiao'


# 小女孩撒娇
xiaonvhai_sajiao = """
玲玲姐姐~你最好了嘛!我刚才路过街角那家老糖葫芦摊,那个糖葫芦红彤彤、亮晶晶的,上面的山楂一颗颗圆滚滚,好像在跟我眨眼睛呢!我站在那儿好久好久,闻着那甜甜的香味儿,脚都挪不动步了。
可是我回头想想,自己这个月的零花钱已经全都换成故事书了。我心里痒痒的,就差那么一点点就能尝到那酸甜的滋味儿了。
玲玲姐姐,你能不能当我的救星,让我实现这个小小的愿望呢?下次你有喜欢的东西,我也存钱给你买,好不好嘛~你就答应我这一次,让我感受一下那传统美味在舌尖跳舞的感觉吧!
"""
# 适合小女孩撒娇的音色
zhiqi_voice = 'longtong'

###################################################
speech_synthesizer = SpeechSynthesizer(
    model='cosyvoice-v1',
    voice=zhiqi_voice,
    format=AudioFormat.MP3_48000HZ_MONO_256KBPS,
    callback=None,
    speech_rate=0.5)
# 生成稚气可爱小女孩撒娇语音
result = speech_synthesizer.call(xiaonvhai_sajiao)
with open('zhiqi.mp3', 'wb') as f:
    f.write(result)

#################################################
speech_synthesizer = SpeechSynthesizer(
    model='cosyvoice-v1',
    voice=wenrou_voice,
    format=AudioFormat.MP3_48000HZ_MONO_256KBPS,
    callback=None,
    speech_rate=0.5)
# 生成温柔可爱女朋友撒娇语音
result = speech_synthesizer.call(npy_sajiao)
with open('wenrou.mp3', 'wb') as f:
    f.write(result)

print('ok')

这里我试用了很多音色,推荐两种个人觉得挺不错很适合我设定角色的音色:

  • longmiao:适合女朋友撒娇
  • longtong:适合小女孩撒娇

上边的文案也是用通义千问生成的,感觉不错。

总结

阿里提供了各种各样的的大模型 API ,包括文字处理,语音,图片,视频等,云服务大模型 AI API 的提供,可以说把普通人进入 AI 行业的门槛降到了最低,以后人人都是 AI 工程师,最珍贵的不再是 AI 算法,而是一个好的 idea,将生活中的大大小小事情结合这些 AI 能力,产生创造力,提升我们的工作生活效率。
只想说未来以来,特别是作为程序员的我们,思想一定不能再停留在以前的思考方式。
这是我使用 AI API 的第一次尝试,后边我会尝试更多的API, 而且会试着去结合他们,看会产生什么不一样的效果,比如说:将文字实时转为语音,然后再让 AI 生成配上对应的图片。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1883045.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

诊所运营效率提升方法有哪些?

随着医疗行业的快速发展和市场竞争的加剧,诊所运营效率的提升成为了众多医疗机构关注的焦点。高效的诊所运营不仅能够提升患者的就医体验,还能帮助诊所实现可持续发展。那么,诊所运营效率提升的方法有哪些呢? 1、优化管理流程 诊…

项目经验-不同行业、不同风格的网站设计

网站UI设计的首要考虑点是布局与导航。合理的布局能够确保信息清晰呈现,使用户能够快速定位所需内容。同时,简洁明了的导航设计能够引导用户流畅浏览,减少迷失感。通过精心设计的布局和导航,可以提升用户体验,增强用户…

一、安全完善度等级SIL(Safety Integrity Level)介绍

目录 一、背景 二、定义 2.1 相关概念介绍如下: 2.2 扩展 2.3 注意事项 一、背景 在轨道交通行业中,安全完善度等级(SIL,Safety Integrity Level)是一个至关重要的概念,它用于评估安全相关系统&#x…

vue3.0 + vant实现下拉刷新上拉加载

在vue中使用vant组件库有个van-pull-refresh下拉组件,配合van-list列表组件实现页面的下拉刷新和上拉加载,原理简单,适用场景在列表页面内容展示。 下拉刷新 PullRefresh 实现下拉刷新的效果。 PullRefresh组件中的searchRefreshing属性&…

Open3D Ransac点云配准算法(粗配准)

目录 一、概述 1.1简介 1.2RANSAC在点云粗配准中的应用步骤 二、代码实现 2.1关键函数 2.2完整代码 2.3代码解析 2.3.1计算FPFH 1. 法线估计 2. 计算FPFH特征 2.3.2 全局配准 1.函数:execute_global_registration 2.距离阈值 3.registration_ransac_b…

为什么企业应用开发,c++干不过java?

在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「c的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!! C/C这种东西,根本…

面向阿克曼移动机器人(自行车模型)的LQR(最优二次型调节器)的路径跟踪方法

线性二次调节器(Linear Quadratic Regulator,LQR)是针对线性系统的最优控制方法。LQR 方法标准的求解体系是在考虑到损耗尽可能小的情况下, 以尽量小的代价平衡其他状态分量。一般情况下,线性系统在LQR 控制方法中用状态空间方程描…

Docker 一篇到位

目录 01. Docker使用导航 02. Build Share Run 样例 03. 理解容器 04. 安装 Docker 05. Docker 样例(常见命令使用) 下载镜像 启动容器 修改页面 保存镜像 docker commit docker save docker load 分享社区 docker login docker tag do…

浅聊JavaScript中的栈(stack)

前言 这篇文章结合leetcode题目讲解一下栈这种结构 第20题:20. 有效的括号 - 力扣(LeetCode) 第LCR-147题LCR 147. 最小栈 - 力扣(LeetCode) 栈(stack) 在讲解题目之前,我们先来…

天池大赛Higress插件官方demo详细部署+调试

天池大赛Higress插件官方demo详细部署调试 契机 ⚙ 使用Higress AI网关优化AI调用成本。就是基于向量召回相似问题的缓存,降低LLM API调用成本。就是开发一个网关插件做QA缓存嘛。前文已经成功复现了hello-world插件,这次结合官方提供的AI-Cache插件自…

二叉树遍历练习题

2.已知某二叉树的前序遍历序列为5 7 4 9 6 2 1,中序遍历序列为4 7 5 6 9 1 2,则其后序遍历序列为( ) A.4 2 5 7 6 9 1 B.4 2 7 5 6 9 1 C.4 7 6 1 2 9 5 D.4 7 2 9 5 6 1 答案:C 解析: 通过前序遍历找…

失眠焦虑植物神经紊乱应该怎么改善饮食?

在快节奏的现代社会中,越来越多的人受到植物神经紊乱的困扰,尤其是失眠、焦虑、胸闷气短等症状频发。这些症状不仅影响日常生活和工作效率,还可能引发一系列健康问题。今天,我们就来谈谈如何通过调整饮食来改善这些症状。 饮食调整…

Java [ 基础 ] 方法引用 ✨

✨探索Java基础✨ Java基础:方法引用 方法引用是Java 8中引入的一种新特性,它使得代码更加简洁和易读。方法引用提供了一种可以直接引用已有方法作为Lambda表达式的替代方案。本文将深入介绍方法引用的基本概念、使用方法、具体实例及其在实际开发中的…

HCIA4.26-5.10

OSPF ——开放式最短路径优先协议 无类别链路状态IGP动态路由协议 距离矢量协议 运行距离矢量协议的路由器会周期性的泛洪自己的路由表,通过路由之间的交互,每台路由器都从相邻的路由器学习到路由条目,随后加载进自己的路由表中。对于网络…

简单分享下python封装

目录: 一、简介,什么是封装 二、封装的优点与好处 三、封装的示例 四、可封装的场景 一、简介,什么是封装 通俗理解:封装,简而言之,就是把数据(变量)和操作这些数据的方法&#xff0…

全球AI新闻速递7.1

全球AI新闻速递 1.科大讯飞发布讯飞星火 V4.0。 2.成都人形机器人创新中心:基于视觉扩散架构的人形机器人任务生成式模型 R-DDPRM。 3.安徽省人形机器人产业创新中心获批,将打造国内首创、世界领先研究基地。 4.亳州牵手华为打造华佗中医药大模型。 …

系统安全及应用(命令)

目录 一、账号安全控制 1.1 系统账号清理 1.2 密码安全控制 1.3 历史记录控制 1.4 终端自动注销 二、系统引导和登陆控制 2.1 限制su命令用户 2.2 PAM安全认证 示例一:通过pam 模块来防止暴力破解ssh 2.3 sudo机制提升权限 2.3.1 sudo命令(ro…

SRS流媒体服务器安装与推拉流测试

一、首先打开SRS Github https://github.com/ossrs/srs二、在Linux系统下安装SRS 1. git clone https://github.com/ossrs/srs2、克隆完后进入trunk文件夹 cd srs/trunk3.进行环境配置 ./configure 检测当前环境是否满足 4.进行编译 make 5.编译完成后运行 ./objs/srs …

统计学期末名词解释说明

基本名词解释P值、显著性、显著水平、样本量、三大分布等 20基本名词详细解释: √P值: 相关名词:显著性、显著性差异、0.01水平显著、0.05水平显著。 P值,也称显著性值或者Sig.值,用于描述某件事情发生的概率情况&a…

器件频频更换为哪桩

曾想象,在一家大型研发型企业里有如下案例: 硬件工程师设计电路选择了器件库中的某器件,在批量试产产品时,却发现没有库存,即时申请采购,却发现货期相当长,一时难以采购,甚至根本不…