声音生成评价项目AudioLDM_eval项目配置过程

news2026/3/13 1:23:56

文章目录

- 引言
- 正文
- - 问题一：模型下载不了
  - 问题二 TypeError: pad_center() takes 1 positional argument but 2 were given
  - 问题三 AttributeError: module 'numpy' has no attribute 'complex'.
- 结果

引言

对于生成的声音，如何进行评价，一般是通过计算FAD、FID、KL等不同系数，但是并没有相关的库文件.这里找到了一个在很多项目中都使用的库。

正文

下述为这个测试包需要安装的环境，如果直接安装，会默认安装最新的，然后会出很多问题。

"torch>=1.11.0",
"torchaudio",
"scikit-image",
"torchlibrosa",
"absl-py",
"scipy",
"tqdm",
"ssr_eval",
"librosa",

这里一个一个做了测试，并列举出每一个包拥有的版本号

torchlibrosa== (from versions: 0.0.1, 0.0.2, 0.0.3, 0.0.4, 0.0.5, 0.0.6, 0.0.7, 0.0.8, 0.0.9, 0.0.10, 0.1.0)

注意，这里要选择0.8.0，新版的很多函数发生了改变，不然会出现函数调用的问题。
最重要的是使用linux的系统，安装的pytorch最好是1.12.0或者1.13.0

问题一：模型下载不了

在这里插入图片描述

下载VGGish，打不开对应的网页。直接跳转到对应的网页，下载，然后放到对应的位置。

问题二 TypeError: pad_center() takes 1 positional argument but 2 were given

在这里插入图片描述

安装librosa的版本为0.8.0，然后在继续使用。

问题三 AttributeError: module ‘numpy’ has no attribute ‘complex’.

异常如下

在这里插入图片描述

修改方式

结果

弄了好几天，终于跑通了，完美。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1078293.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

声音生成评价项目AudioLDM_eval项目配置过程

文章目录

引言

正文

问题一：模型下载不了

问题二 TypeError: pad_center() takes 1 positional argument but 2 were given

问题三 AttributeError: module ‘numpy’ has no attribute ‘complex’.

结果

相关文章

Matlab之查询子字符串在字符串中的起始位置函数strfind

网络与信息安全基础知识 (软件设计师笔记)

大数据要怎么样学才可以到企业级实战

Edge 无法登录/同步问题【一招搞定】

第四章树和二叉树

【低代码开发】：低代码开发助力应用创新

Java基础（变量篇）

英国/法国/意大利/德国/西班牙，电动交通设备配件等相关政策更新

Cesium小技巧：快速打开API文档

Linux系统编程：Linux基础

蓝桥杯基础---切面条

MySQL数据库安装和介绍

优雅而高效的JavaScript——函数柯里化

数据结构：链表（1）

Python并发编程简介

C++程序员必修第一课【C++基础课程】00：课程介绍

公众号留言板小程序哪个好用？一一列举

【java学习】对象的产生（18）

C# 搭建一个简单的WebApi项目23.10.10

类加载器、双亲委派机制