更多AI前沿科技资讯,请关注我们:https://aigc.douyoubuy.cn/
【closerAI ComfyUI】商业合规!版权安全!Stable Audio 3:开源音频生成的新王者,终于来了!从此,你的生成就是你的音乐!

大家好,我是Jimmy。这期是关于AI音乐的内容,一个AI绘画的鼻祖团队Stability AI,沉寂了这几年,最近开源新模型:Stable Audio 3。这次不是小打小闹,而是直接把开放权重、长音频生成、商业安全性和本地运行体验拉到了新高度。正是由于它解决了版权问题且免费开源开放使用,让音乐生成更安全无纠纷!

为什么说 Stable Audio 3 特别有价值?
- 彻底解决版权焦虑全部使用授权许可数据 + Creative Commons 训练,不再有那种“不知道会不会被追责”的隐忧。输出归你自己,随便商用、发布、卖歌、做游戏音效都行,Stability AI 不抽成、不拿版权。
- 真正能生成“完整作品”的长度
- Small 系列:最高约 2 分钟(音乐 / SFX 分别优化)
- Medium:最长 6 分 20 秒,已经能做一整首结构完整的歌 这在开源音频模型里目前算是顶尖水平,远超以前动不动就断、结构乱的体验。
- 速度快到离谱,本地友好Medium 模型在 H200 上几秒就能出一首长音频,Small 系列甚至能在消费级硬件(RTX 40 系列、MacBook Pro M4)上高效跑。真正实现了“本地即用”,不用每次都去云端排队。
- 开放权重 + 可玩性拉满Small Music、Small SFX、Medium 三个模型开放权重,直接上 Hugging Face 下载。官方还放出了推理代码和 LoRA 微调支持,意味着你可以:
- 自己继续训特定风格(日系电子、lo-fi、游戏音效等)
- 做 inpainting(局部重绘、续写、修改某一段)
- 嵌入自己的工作流(比如 ComfyUI)
- 技术底子硬用了新的 SAME(Semantic-Acoustic)Autoencoder,在保持高保真度的同时,让潜变量空间既有语义结构又有声学细节。所以生成的音乐连贯性、乐器分离度和整体音乐感都明显提升。
适合哪些人?
- 独立音乐人 / 电子音乐制作人:快速打 demo、生成伴奏、实验新风格
- 游戏 / 视频创作者:批量生成音效和背景音乐
- 开发者 / 技术爱好者:本地部署、二次开发、做工具链
- 想玩 AI 音乐但怕版权雷的普通用户
相比之前的 Stable Audio 系列,这次 3.0 真正把“能用”和“好用”结合起来了。尤其是开放权重的 Medium 模型,把以前只有闭源大厂才能玩的长音乐生成,平民化了。
说了这么多,如何在comfyUI使用呢?
一、更新comfyUI
目前comfyUI官方已支持,直接更新版本;
二、打开comfyUI ,在左侧导航栏找开模板-音乐,选择下图所示示例工作流:

官方示例工作流打开后直接下载模型啦,已有提示,直接点击下载放置对应位置:

同时,它的工作流提供了提示词优化的功能,使用的是比较先进一点的qwen3.5 2B 的模型

但有个问题,提示词要自己写啊,这难道了不是音乐人的小白了。

为了解决这个问题。根据Stable Audio 3.0模型的特点,我开发了一个🎵 音乐提示词节点:closerAI-music-prompt

9大选项,
- 预设(53选1)
- 风格(97选1)
- 情绪(75选1)
- 速度节奏(54选1)
- 自定义BPM(整数输入)
- 乐器配置(60选1)
- 曲式结构(62选1)
- 时代风格(61选1)
- 额外修饰词(自由文本)
每个选项至少50+参数,选择就是

调整了下工作流,如下图示:


这样就能愉快地当个音乐制作人了
它的生成速度非常快!且质量非常好!
以下是效果展示了:
示例一:

生成的提示词如下:
Golden age hip-hop production with crisp 90 BPM drum machine beats, sharp snare hits, and deep sub-bass grooves creating confident, laid-back street energy. Hip-hop beat with smooth electric piano chops, vintage brass stabs, walking double bass, and subtle ethnic percussion for nostalgic soulful groove. Cinematic synth pads and atmospheric field recordings adding rich harmonic depth and spacious reverb tails.
生成的音乐如下:
示例二:

生成的提示词如下:
Surf rock instrumental with electric guitar lead, acoustic bass, rhythmic drums, and full band arrangement creating energetic warm sunshine vibes. BPM: 130. Length: 120 seconds
生成音乐如下:
示例三:lofi音乐
这玩意生成Lofi音乐无敌了

生成的提示词如下:
Lo-fi hip-hop chill track with mellow electric piano, soft vinyl crackle, subtle synth pads, low-pass filtered drums, and 8-bar loop percussion creating relaxed, dreamy, and soothing energy. BPM: 85. Length: 120 seconds
生成效果如下:
我在RH上也发布应用,大家可以去体验下
总结:
虽然无人声,但纯音乐、音效的生成完成没有版权顾虑。且可玩性很高,我使用的是它中等开放的模型,最长能生成6分钟的音乐。像自媒体、游戏、音乐、视频音效等都可以用它生成!这是真正意义上的自由生成。
本地算力不够怎么办?
如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

stable Audio3音乐设计应用体验地址:
注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151
通过这个链接第一次注册送1000点,每日登录送100点
runningHug上的无限画布,也可以使用GPT image进行生成:

它集成了多个优秀的闭源模型:

在图像与视频生成中,一个节点就能直接调用使用并生成。十分方便,且价格优惠。它通过集成闭源模型简化了工作流程直接输入即所得,速度很快。是一个不错的选择。通过注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151 注册后打开无限画面

最后几句:
如果对你有帮助,请一键三连支持下我,感谢
CloserAI AI短剧工作台(本地化解决方案):
https://aigc.douyoubuy.cn/ai-agent/
closerAI FlowStudio本地AIGC无限画布创作工具:
https://aigc.douyoubuy.cn/closerai-flowstudio/
closerAI AI绘画大师万象视界:
https://aigc.douyoubuy.cn/closerai-vision/
CLOSERAI POD电商印花批量生产工作站:
https://aigc.douyoubuy.cn/?page_id=420541
印花提取:
https://aigc.douyoubuy.cn/yinhua/
以上是就是本期的分享,当然,更多工作流、资讯、插件、工具也可以在我们closerAI会员站上获取(查看原文)。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:JimmyMo
更多AI前沿科技资讯,请关注我们:

工作流如下:
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)