开源TTS+gtx1080+cuda11.7+conda+python3.9吊打百度TTS

news2024/11/24 17:54:15

简介 

开源项目,文本提示的生成音频模型

https://github.com/suno-ai/bark

 Bark是由Suno创建的基于变换器的文本到音频模型。Bark可以生成极为逼真的多语种演讲以及其他音频 - 包括音乐、背景噪音和简单的声音效果。该模型还可以产生非言语沟通,如笑声、叹息和哭声。为了支持研究社区,我们提供了预训练的模型检查点,可用于推断,并可供商业使用。

演示链接:

https://pan.baidu.com/s/1O9_la6TBar75NfI1yut4Lg?pwd=utqg 提取码: utqg 

支持的语言

LanguageStatus
English (en)
German (de)
Spanish (es)
French (fr)
Hindi (hi)
Italian (it)
Japanese (ja)
Korean (ko)
Polish (pl)
Portuguese (pt)
Russian (ru)
Turkish (tr)
Chinese, simplified (zh)

显卡信息

安装步骤

1.安装conda

2.安装python3.9

conda create --name brakAI python=3.9

3.激活brakAI环境

conda activate barkAI

4.安装 pytorc

conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.7 -c pytorch -c nvidia

5.查看了版本

import torch
print(torch.cuda.is_available())
print(torch.__version__)

 

6.克隆bark 

git clone https://github.com/suno-ai/bark
cd bark && pip install . 

 

 

7.测试

from bark import SAMPLE_RATE, generate_audio, preload_models
from scipy.io.wavfile import write as write_wav
from IPython.display import Audio

# download and load all models
preload_models()

# generate audio from text
text_prompt = """
    CSDN是全球知名中文IT技术交流平台,创建于1999年,包含原创博客、精品问答、职业培训、技术论坛、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区.。
"""
audio_array = generate_audio(text_prompt)

# save audio to disk
write_wav("bark_generation22.wav", SAMPLE_RATE, audio_array)
  
# play text in notebook
Audio(audio_array, rate=SAMPLE_RATE)

会自动下载模型文件text_2.pt,也可以自己下载suno/bark at main 

模型路径 bark/generation.py

 

 将临时目录改到bark 根目录,模型文件下载到这个目录下

 

其他模型下载,文字转语言

Models - Hugging Face

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/913148.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构】 单链表面试题讲解->叁

文章目录 🍀[相交链表](https://leetcode.cn/problems/intersection-of-two-linked-lists/description/)🎄题目描述🎍示例🚩示例一🚩示例二🚩示例三 🎋解法思路🚩相关变量的建立&…

Elasticsearch(十三)搜索---搜索匹配功能④--Constant Score查询、Function Score查询

一、前言 之前我们学习了布尔查询,知道了filter查询只在乎查询条件和文档的匹配程度,但不会根据匹配程度对文档进行打分,而对于must、should这两个布尔查询会对文档进行打分,那如果我想在查询的时候同时不去在乎文档的打分&#…

多传感器分布式融合算法——加权最小二乘WLS融合/简单凸组合SCC融合

加权最小二乘WLS融合/简单凸组合SCC融合——多传感器分布式融合算法 原创不易,路过的各位大佬请点个赞 主要讲解算法: 加权最小二乘融合WLS 简单凸组合融合SCC 应用于: 多传感器网络协同目标跟踪/定位/导航 联系WX: ZB823618313 目…

【Python】理解作用域:内置、全局、局部

原文作者:我辈李想 版权声明:文章原创,转载时请务必加上原文超链接、作者信息和本声明。 文章目录 一、基础数据类型1.整型1.函数中加global(2)函数中不加global(3)报错 二、组合数据类型1.列表…

AI让儿童绘画动起来-程序员带娃必备

项目效果演示 项目描述 很多小朋友在学习绘画的过程中,创作出来很多比较有创意的作品,那么怎么让这些作品,动起来,甚至是和拍摄的视频进行互动呢,今天分享的这个项目,能够完美解决这个问题。 项目地址http:…

ASEMI整流桥KBP210和2W10能代换吗

编辑-Z 在电子世界中,整流桥是最常见和最重要的组件之一。它是将交流电转换为直流电的重要设备。在这篇文章中,我们将深入了解两款常见的整流桥:KBP210和2W10,以及它们是否可以互换使用。 首先,我们需要关注的是这两种…

网上可做的兼职副业,分享3个靠谱办法,快来收藏

不知道从何时起,越来越多的人开始在网上做兼职,兼职逐渐的成为上班族和大学生的第二件事。相比线上,他们不愿意做传统的发传单、或者体力活兼职。线上兼职也是在互联网和智能手机的影响下被广泛使用了吧。但是网上的兼职这么多,那…

[Mac软件]Pixelmator Pro 3.3.12 专业图像编辑中文版

Pixelmator Pro是专为Mac设计的功能强大,美观且易于使用的图像编辑器。借助广泛的专业级无损图像编辑工具,Pixelmator Pro可使您发挥出最佳的照片效果,创建华丽的构图和设计,绘制,绘画,应用令人惊叹的效果&…

融云:AI 机器人在社交软件中的花样存在

最近 AIGC 行业的新话题来自 HeyGen 的一段自动生成视频。关注【融云全球互联网通信云】了解更多 一眼看上去“真”到吓人,手势、嘴型等细节逼近真人效果。 除了,眨眼的频率有点高。 图源:HeyGen 这是 AI 数字人公司 HeyGen 即将推出的超逼…

基于Vue的3D饼图

先看效果: 再看代码: <template><div class="container"><div style="height: 100%;width: 100%;" id="bingtu3D"></div></div></template> <script> import "echarts-liquidfill"; imp…

python命令行or控制台or日志带有颜色的输出

python命令行or控制台or日志带有颜色的输出 python控制台带颜色输出 在几年前&#xff0c;我写过一个项目&#xff0c;喜欢花里胡哨的我看到别人输出到控制台带有颜色&#xff0c;于是我也想要。 于是乎不知道从哪里搜到的资料&#xff0c;是拼凑起来的颜色代码块。 当时用着…

服务注册中心 Eureka

服务注册中心 Eureka Spring Cloud Eureka 是 Netflix 公司开发的注册发现组件&#xff0c;本身是一个基于 REST 的服务。提供注册与发现&#xff0c;同时还提供了负载均衡、故障转移等能力。 Eureka 有 3 个角色 服务中心&#xff08;Eureka Server&#xff09;&#xff1a;…

【Apollo学习笔记】——规划模块TASK之PATH_REUSE_DECIDER

文章目录 前言PATH_REUSE_DECIDER功能简介PATH_REUSE_DECIDER相关配置PATH_REUSE_DECIDER总体流程PATH_REUSE_DECIDER相关子函数IsCollisionFreeTrimHistoryPathIsIgnoredBlockingObstacle和GetBlockingObstacleS Else参考 前言 在Apollo星火计划学习笔记——Apollo路径规划算…

1克硬件变化+99%软件能力,点燃XR行业第二时代之战

夕小瑶科技说 原创 作者 | 卖萌酱 你的下一代手表&#xff0c;可以是没有手表&#xff01;即将在8月26日发布空间计算新品的Rokid&#xff0c;近日发表路透视频&#xff1a;AR眼镜使用场景下&#xff0c;抬起手腕就能出现虚拟手表表盘&#xff0c;握一下拳即切换到天气模式。…

0006Java程序设计-jsp婚恋交友网设计与实现

摘 要 在线交友是互联网发展的必然产物&#xff0c;它改变了人们的网络交往形态&#xff0c;使得人们的即时通信变得更加的直观和亲切&#xff0c;并且具有良好的发展趋势。 婚恋交友网站我们使用 Microsoft公司的JSP开发工具&#xff0c;利用其提供的各种面向对象的开发工具…

武汉凯迪正大—变比组别测试仪

一、概述 在电力变压器的半成品、成品生产过程中&#xff0c;新安装的变压器投入运行之前以及根据国家电力部的预防性试验规程中&#xff0c;要求变压器进行匝数比或电压比测试。传统的变比电桥操作繁琐&#xff0c;读数不直观&#xff0c;且要进行必要的换算&#xff0c;测试时…

关于 大屏项目的参考

1、自适应组件 &#xff1a; v-scale-screen https://huaweicloud.csdn.net/638eec6cdacf622b8df8dc59.html 2、参考项目&#xff1a; https://zhuanlan.zhihu.com/p/634382389

leetcode 714. 买卖股票的最佳时机含手续费

2023.8.22 本题和买卖股票的最佳时机II 几乎一样&#xff0c;就是增加了一个手续费&#xff0c;需要在卖出股票的时候减去手续费fee即可。 代码如下&#xff1a; class Solution { public:int maxProfit(vector<int>& prices, int fee) {vector<vector<int&g…

第十六课、利用 EnigmaVB 打包 Qt 应用程序

功能描述&#xff1a;详细介绍如何利用 EnigmaVB 打包 Qt 应用程序&#xff0c;从 EnigmaVB 软件下载、安装&#xff0c;到如何使用&#xff0c;一步步教你走进 EnigmaVB 软件&#xff0c;最后还介绍了一款针对 Enigma Virtual Box 制作的单文件程序进行解包的工具 EnigmaVBUnp…

利用全志H616 MangoPi MQ Quad部署一个网络摄像头

本文男二号海康威视720p USB摄像头出场&#xff0c;尊容如下&#xff1a; SBC需连接网络&#xff1a; rootorangepizero2:~# ifconfig wlan0: flags4163< UP,BROADCAST,RUNNING,MULTICAST > mtu 1500inet 192.168.99.217 netmask 255.255.255.0 broadcast 192.168.99…