使用AudioCraft（MusicGen）生成音乐

news2026/2/8 19:32:31

AudioCraft 是一个 PyTorch 库，用于音频生成的深度学习研究。AudioCraft 包含两个先进的AI生成模型：AudioGen和MusicGen，它们共同致力于生成高质量的音频内容。

MusicGen是一个简单且可控的音乐生成模型。它利用Meta提供的20K小时授权音乐进行训练，能够根据文本描述或已有的旋律生成高质量的32kHz音乐作品。

源码：

https://github.com/facebookresearch/audiocraft

Demo示例：

https://huggingface.co/spaces/facebook/MusicGen

安装

安装环境

conda create -n musicgen python=3.10
conda activate musicgen
pip install setuptools wheel
pip install torch==2.1.0+cu118 torchvision==0.16.0+cu118 torchaudio==2.1.0 xformers==0.0.22.post7 --extra-index-url https://download.pytorch.org/whl/cu118
conda install "ffmpeg<5" -c conda-forge

pip install dora-search

拉取源码

git clone https://github.com/facebookresearch/audiocraft
pip install -e .

启动项目

python -m demos.musicgen_app --share

模型介绍

模型将根据提供的描述生成一段简短的音乐，一次可生成长达30秒的音频。

模型是根据库存音乐目录中的描述进行训练的，最有效的描述应该包括现有乐器的一些细节，以及一些预期的用例（例如，添加“perfect for a commercial”可能会有所帮助）。

10种模型变体：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1664064.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！