阶跃星辰再推开源模型,与ACE Studio联合发布ACE-Step音跃大模型
创始人
2025-05-08 00:20:55
0

5月7日,人工智能基础大模型公司阶跃星辰与数字音乐平台 ACE Studio ,联合发布开源音乐大模型“ACE-Step”(音跃),据悉模型参数量为3.5B,具备快速高质量生成、强可控性、易于拓展等特点,同时支持多种语言的歌曲生成,涵盖中文、英文、日文、韩文、西班牙文、俄语等 19 种语言。

阶跃星辰方面介绍,作为一个通用性强的音乐基础模型,ACE-Step 支持包括 LoRA (定制音乐风格)和 ControlNet(人声驱动伴奏生成) 在内的多种微调方式,可灵活适配音频编辑、人声合成、伴奏生成、声线克隆、风格迁移等多种下游任务,相比此前的开源音乐模型,具有真·全曲生成、精准时长控制、灵活输入格式、多语言与多风格生成四大优势。

另外,当前技术普遍面临生成速度、音乐连贯性和可控性之间的固有权衡。例如基于LLM的模型(如Yue、SongGen)擅长歌词对齐,但存在推理速度慢和音质问题;而扩散模型(如DiffRhythm)能实现更快合成,却往往缺乏全局结构连贯性。而ACE-Step通过融合扩散生成、Sana深度压缩自编码器(DCAE)和轻量级线性Transformer架构,成功弥合了这一鸿沟。

ACE-Step 模型架构图

该模型在训练阶段创新性地采用MERT和m-hubert实现语义表征对齐(REPA)技术,从而加速收敛。实验表明,在A100 GPU上仅需20秒即可生成长达4分钟的音乐,比基于LLM的基线快15倍,同时在旋律、和声与节奏维度均展现出更优的音乐连贯性和歌词对齐能力。ACE-Step也能保留精细的声学细节,支持语音克隆、歌词编辑、混音改编及分轨生成(如歌词转人声、演唱转伴奏)等高级控制功能。

ACE-Step 目前提供两种生成模式:快速和慢速模式。最快 15 秒即可生成一整首歌,慢速模式也仅需 32 秒。

同时,ACE-Step 不仅仅是一个“生成器”,还是一个全能的“编辑器”,它为创作者提供了两个关键功能:EditRetake/Repaint。

其中,Edit 功能可以使创作者在不改变旋律的情况下,精确修改已生成歌曲的歌词内容、语气或情感表达,确保每行歌词与整体音乐风格完美契合。

而如果生成的作品不完全符合创作需求,创作者可以使用 Retake 功能重新生成一首风格相似、结构类似的歌曲,或者通过 Repaint 对特定部分(如旋律或歌词)进行局部调整,进一步优化作品。

据悉,作为全球开源可商用的SOTA级音乐大模型,ACE-Step已开放GitHub代码库及API接口。开发者可基于其构建AI作曲、智能配乐、虚拟歌手等应用,而音乐人则能实现从灵感生成到混音母带的全程AI辅助。

相关内容

热门资讯

玩家必看科普(约局互娱)原来真... 1、玩家必看科普(约局互娱)原来真的有辅助挂(透视)山东369麻将有挂的(详细教程)-哔哩哔哩2、进...
揭秘攻略!aapoker到底有... 揭秘攻略!aapoker到底有挂的(透视)原来真的有挂(2022已更新)(哔哩哔哩);超受欢迎的aa...
一分钟了解!微信边锋斗地主(透... 一分钟了解!微信边锋斗地主(透视)外挂透明挂辅助软件(2024已更新)(哔哩哔哩)是一款可以让一直输...
实测揭晓(aapoker牌局)... 实测揭晓(aapoker牌局)外挂透视辅助外挂(透视)详细教程(2023已更新)(哔哩哔哩);亲真的...
十分钟了解(aapoker)系... 十分钟了解(aapoker)系统发牌规律(透视)果真真的有外挂(2023已更新)(哔哩哔哩);1.a...
5分钟了解(Wepoke是真的... 1、5分钟了解(Wepoke是真的)外挂透视辅助辅牌器(透视)详细教程(2024已更新)(哔哩哔哩)...
普及知识(aapoKer)外挂... 普及知识(aapoKer)外挂透视辅助代打(透视)详细教程(2022已更新)(哔哩哔哩);一、aap...
终于懂了(Wepoke透明)外... 终于懂了(Wepoke透明)外挂透视辅助ai(透视)详细教程(2023已更新)(哔哩哔哩)是一款可以...
推荐一款(聚星扑克)其实真的有... 推荐一款(聚星扑克)其实真的有挂(透视)牵手跑得快辅助器软件(详细教程)-哔哩哔哩;玩家必备必赢加哟...
实测揭晓(WepOke)系统规... 《实测揭晓(WepOke)系统规律(透视)果真真的有外挂(2021已更新)(哔哩哔哩)》 WepOk...