音乐产业即将发生革命。
今天Stability AI,开源人工智能工具和模型之王,例如Stable DIffusion和StableLM,推出Stable Audio,其首款用于音乐和声音生成的人工智能产品。
音乐行业是出了名的难以进入。即使您有才华和动力,您仍然需要技能和资源来创作和制作音乐。
但如果您不需要这些怎么办?如果你可以只用创造性思维和良好的人工智能提示来创作音乐会怎样?
StableAudio是一款可以从头开始生成音乐的人工智能工具。您所需要做的就是提供一些简单的指令,人工智能将完成剩下的工作。
什么是稳定音频?
StableAudio 是一款首创的 AI 工具,它使用生成式 AI 技术来创建高品质的音乐和音效。
要使用 StableAudio,您只需提供描述性文本提示和所需的音频长度。例如,您可以输入“Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM”
生成后摇滚风格的 95 秒曲目。
StableAudio 是寻求创建在音乐中使用的样本的音乐家的理想选择。您可以使用它来创建音效、背景音乐,甚至您自己的原创作品。
自己尝试一下
前往StableAudio仪表板并注册。
稳定音频
然后,转到“生成音乐”仪表板开始生成您自己的音乐。
稳定音频
输入提示并设置持续时间。请记住,免费订阅的音频最大长度为 20 秒。
提示:在水疗大厅播放平静的冥想音乐
单击向右的小箭头按钮开始生成音频。
目前,该网站的流量很大,因此无法正常运行。一旦网站恢复并运行,我将更新这篇文章。
稳定音频
同时,您可以探索StableAudio用户指南部分中提供的示例。
稳定音频
怎么运行的
以下是 StableAudio 工作原理的一些关键技术细节:
StableAudio技术背景
- VAE 将立体声音频压缩为数据压缩、抗噪声和可逆有损潜在编码,与使用原始音频样本本身相比,可以更快地生成和训练。
- 文本编码器用于从文本提示中提取特征。然后使用这些特征来调节扩散模型。
- 扩散模型是基于 U-Net 的模型,它使用残差层、自注意力层和交叉注意力层的组合来对输入进行去噪并重建所需的音频。
此外,另一个重要信息是,StableAudio 模型使用了超过 800,000 个音频文件的数据集,包括音乐、音效和单乐器主干。这相当于超过 19,500 小时的音频。
价格
如果您想生成自己的音乐供个人使用,它是完全免费的。但是,如果您想将内容用于商业目的,则需要升级到 Pro 级别。以下是定价等级:
- 免费:20 首每月曲目,每首曲目时长不超过 45 秒。
- 专业版(每月 11.99 美元):500 个每月曲目,每个曲目最多 90 秒。
- 企业(自定义金额)
稳定音频定价
最后的想法
总的来说,这个新的人工智能工具给我留下了深刻的印象。音频的质量与人类专业人士创建的音频质量相当。
StableAudio 是一个游戏规则改变者,它可能会颠覆整个音乐和音效行业。当然,一些专业音乐家可能会对它的到来感到愤怒,但我怀疑我们能否阻止它。他们会将其视为对其生计的威胁。