StableAudio-大模型创作音乐的工具

news2024/11/24 19:52:53

音乐产业即将发生革命。

今天Stability  AI,开源人工智能工具和模型之王,例如Stable DIffusion和StableLM,推出Stable Audio,其首款用于音乐和声音生成的人工智能产品。

音乐行业是出了名的难以进入。即使您有才华和动力,您仍然需要技能和资源来创作和制作音乐。

但如果您不需要这些怎么办?如果你可以只用创造性思维和良好的人工智能提示来创作音乐会怎样?

StableAudio是一款可以从头开始生成音乐的人工智能工具。您所需要做的就是提供一些简单的指令,人工智能将完成剩下的工作。

什么是稳定音频?

StableAudio 是一款首创的 AI 工具,它使用生成式 AI 技术来创建高品质的音乐和音效。

要使用 StableAudio,您只需提供描述性文本提示和所需的音频长度。例如,您可以输入“Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM”生成后摇滚风格的 95 秒曲目。

StableAudio 是寻求创建在音乐中使用的样本的音乐家的理想选择。您可以使用它来创建音效、背景音乐,甚至您自己的原创作品。

自己尝试一下

前往StableAudio仪表板并注册。

稳定音频仪表板

稳定音频

然后,转到“生成音乐”仪表板开始生成您自己的音乐。

StableAudio 生成仪表板

稳定音频

输入提示并设置持续时间。请记住,免费订阅的音频最大长度为 20 秒。

提示:在水疗大厅播放平静的冥想音乐

单击向右的小箭头按钮开始生成音频。

目前,该网站的流量很大,因此无法正常运行。一旦网站恢复并运行,我将更新这篇文章。

稳定的音频 我们看到大量流量

稳定音频

同时,您可以探索StableAudio用户指南部分中提供的示例。

StableAudio 用户指南示例

稳定音频

怎么运行的

以下是 StableAudio 工作原理的一些关键技术细节:

StableAudio技术背景

  • VAE 将立体声音频压缩为数据压缩、抗噪声和可逆有损潜在编码,与使用原始音频样本本身相比,可以更快地生成和训练。
  • 文本编码器用于从文本提示中提取特征。然后使用这些特征来调节扩散模型。
  • 扩散模型是基于 U-Net 的模型,它使用残差层、自注意力层和交叉注意力层的组合来对输入进行去噪并重建所需的音频。

 

此外,另一个重要信息是,StableAudio 模型使用了超过 800,000 个音频文件的数据集,包括音乐、音效和单乐器主干。这相当于超过 19,500 小时的音频。

价格

如果您想生成自己的音乐供个人使用,它是完全免费的。但是,如果您想将内容用于商业目的,则需要升级到 Pro 级别。以下是定价等级:

  • 免费:20 首每月曲目,每首曲目时长不超过 45 秒。
  • 专业版(每月 11.99 美元):500 个每月曲目,每个曲目最多 90 秒。
  • 企业(自定义金额)

稳定音频定价

稳定音频定价

最后的想法

总的来说,这个新的人工智能工具给我留下了深刻的印象。音频的质量与人类专业人士创建的音频质量相当。

StableAudio 是一个游戏规则改变者,它可能会颠覆整个音乐和音效行业。当然,一些专业音乐家可能会对它的到来感到愤怒,但我怀疑我们能否阻止它。他们会将其视为对其生计的威胁。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1040772.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RFID技术在质量控制和生产追溯中的关键应用

在现代制造业中,质量控制和生产追溯是确保产品质量和合规性的关键环节。RFID技术已经成为实现这一目标的强大工具。本文将探讨RFID技术在质量控制和生产追溯中的关键应用,以及如何利用它来提高生产效率、确保产品质量和满足合规性要求。 生产过程追溯 …

Android11 适配

一、修改targetSdkVersion为30 将build.gradle的目标版本targetSdkVersion修改为30(Android 11) targetSdkVersion 30Android11的改变改变主要影响以Adnroid11 为目标版本的应用(targetSdkVersion>30才有影响),和所…

OpenCV实现模板匹配和霍夫线检测,霍夫圆检测

一,模板匹配 1.1代码实现 import cv2 as cv import numpy as np import matplotlib.pyplot as plt from pylab import mplmpl.rcParams[font.sans-serif] [SimHei]#图像和模板的读取 img cv.imread("cat.png") template cv.imread(r"E:\All_in\o…

18672-2014 枸杞 学习记录

声明 本文是学习GB-T 18672-2014 枸杞. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围 本标准规定了枸杞的质量要求、试验方法、检验规则、标志、包装、运输和贮存。 本标准适用于经干燥加工制成的各品种的枸杞成熟果实。 2 规范性引用文件…

无代码解决信息孤岛,云表实现软件开发"书同文,车同轨"

什么是信息孤岛?信息孤岛就是一个组织或系统内部的信息资源无法与其他部分或外部系统共享、互操作,从而使得这些信息无法在整个组织或系统中发挥最大作用的现象。这种现象通常发生在不同部门、不同业务领域或不同系统之间,导致信息重复、浪费…

精彩回顾 | 迪捷软件亮相2023世界智能网联汽车大会

2023年9月24日,2023世界智能网联汽车大会(以下简称大会)在北京市圆满落幕。迪捷软件北京参展之行圆满收官。 本次大会由工业和信息化部、公安部、交通运输部、中国科学技术协会、北京市人民政府联合主办,是我国首个经国务院批准的…

【编码魔法师系列_构建型1.2 】工厂方法模式(Factory Method)

学会设计模式,你就可以像拥有魔法一样,在开发过程中解决一些复杂的问题。设计模式是由经验丰富的开发者们(GoF)凝聚出来的最佳实践,可以提高代码的可读性、可维护性和可重用性,从而让我们的开发效率更高。通…

基于微信小程序的竞赛管理平台设计与实现(开题报告+任务书+源码+lw+ppt +部署文档+讲解)

文章目录 前言运行环境说明学生微信端的主要功能有:竞赛负责人的主要功能:管理员的主要功能有:具体实现截图详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考论文参考源码获取 前…

33 排序链表

排序链表 题解1 STL - multiset题解2 归并【自顶向下】题解3 归并【自底向上】自底向上:子串长度 l 从1开始,合并后的串长度*2,11 -> 22 -> 44 ->... 给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 …

如何选择一款高性价比的便携式明渠流量计

如何选择一款精度高、测量准确、易操作的便携式明渠流量计 如何选择一款精度高、测量准确、易操作的便携式明渠流量计 便携式明渠流量计:是一款对现有在线水监测系统中流量监测的对比装置。该便携式明渠流量计实现了比对在线系统的液位误差及流量误差。引导式的操作…

基于微信小程序的背单词学习激励系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言用户微信端的主要功能有:管理员的主要功能有:具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉…

2023年思维100秋季赛报名中,比赛安排、阶段、形式和5年真题资源

家有小学生的魔都的爸爸妈妈们,上海市含金量比较高的奥数比赛——思维100秋季比赛正在报名中。如果你想让你的孩子多个证书、多个经历、以赛促学,来了解一下吧。 一、思维100比赛是什么? 思维100是原来的“中环杯”,全称"中…

ChatGPT实战-Embeddings打造定制化AI智能客服

本文介绍Embeddings的基本概念,并使用最少但完整的代码讲解Embeddings是如何使用的,帮你打造专属AI聊天机器人(智能客服),你可以拿到该代码进行修改以满足实际需求。 ChatGPT的Embeddings解决了什么问题? …

蓝桥杯 题库 简单 每日十题 day10

01 最少砝码 最少砝码 问题描述 你有一架天平。现在你要设计一套砝码,使得利用这些砝码 可以出任意小于等于N的正整数重量。那么这套砝码最少需要包含多少个砝码? 注意砝码可以放在天平两边。 输入格式 输入包含一个正整数N。 输出格式 输出一个整数代表…

面部情绪识别Facial Emotion Recognition:从表情到情绪的全面解析与代码实现

面部情绪识别(FER)是指根据面部表情对人类情绪进行识别和分类的过程。通过分析面部特征和模式,机器可以有依据地推测一个人的情绪状态。这一面部识别子领域是一个高度跨学科的领域,它借鉴了计算机视觉、机器学习和心理学的见解。 …

蓝桥杯每日一题2023.9.25

4406. 积木画 - AcWing题库 题目描述 分析 在完成此问题前可以先引入一个新的问题 291. 蒙德里安的梦想 - AcWing题库 我们发现16的二进制是 10000 15的二进制是1111 故刚好我们可以从0枚举到1 << n(相当于二的n次方的二进制表示&#xff09; 注&#xff1a;奇数个0…

学生用什么光的灯最好?2023最适合学生用的台灯推荐

学生当然用全光谱的台灯最好。全光谱台灯主要还是以护眼台灯为主&#xff0c;因为不仅色谱丰富&#xff0c;贴近自然色的全光谱色彩&#xff0c;通常显色指数都能达到Ra95以上&#xff0c;显色能力特别强&#xff0c;而且还具有其他防辐射危害、提高光线舒适度的特性&#xff0…

Unity之Hololens如何实现传送功能

一.前言 什么是Hololens? Hololens是由微软开发的一款混合现实头戴式设备,它将虚拟内容与现实世界相结合,为用户提供了沉浸式的AR体验。Hololens通过内置的传感器和摄像头,能够感知用户的环境,并在用户的视野中显示虚拟对象。这使得用户可以与虚拟内容进行互动,将数字信…

实施主品牌进化战略(四):升级顾客认知驱动力

很多企业常常会陷入困境&#xff0c;有足够优秀的产品&#xff0c;但没有有效地提升顾客认知驱动力。产品优秀&#xff0c;但如果顾客对品牌的认知度不高、信任度不足&#xff0c;主品牌定位与目标顾客的认知产生距离&#xff0c;那么增长将无处可寻。所以&#xff0c;提升顾客…

基于通用LLM的一次测试用例自动生成的实验

基于通用LLM的一次测试用例自动生成的实验 选择很多,最后选择了讯飞的星火做本次实验,原因还是因为讯飞的LLM的API是有免费额度的,案例代码相对比较成熟易学易用 1 LLM和基于LLM的应用 最近这段实际LLM已经变成了一个炙手可热的词汇,现在任何技术不了到LLM都感觉好像没有彻…