ACE-Step 1.5 项目标志(来源:GitHub)
今年四月,一个叫 ACE-Step 的开源项目在 GitHub 上爆了——11k stars,号称「最强本地音乐生成模型」,质量在 Suno v4.5 到 v5 之间。最吸引我的一点:它支持 Apple Silicon。
如果你也有一台 Mac(尤其是 M 系列芯片),这篇文章会告诉你 ACE-Step 1.5 能不能跑、能玩到什么程度、以及和 Suno 这类在线服务到底有什么区别。
不是又一个 Suno 替代品
先说定位。ACE-Step 不是那种一键生成、无脑使用的产品——它是个本地部署的模型套件,需要你动手配置、调参数、选模型。但换来的东西很实在:
- 完全本地运行——你的提示词和生成的音乐不会上传到任何服务器
- 无限使用——没有月配额、没有充值墙
- 可微调——用你自己的 8 首歌就能做 LoRA 训练
- 功能远超生成——翻唱、分轨、重绘、音频分析全都有
简单说:Suno 是 iPhone(即开即用),ACE-Step 是 Linux 工作站(上限高,但需要折腾)。
Mac mini M4 能跑吗?
这是大家最关心的问题。ACE-Step 1.5 的模型分三档:
| 显卡 / 内存 | 推荐模型 | 功能 |
|---|---|---|
| ≤6GB | 2B turbo(INT8+CPU offload) | 仅 DiT,无 LM 辅助 |
| 8-16GB ⬅ Mac mini M4 16GB | 2B turbo/sft + 0.6B/1.7B LM | 完整功能 |
| 16-20GB | XL turbo | 高质量+快出 |
| ≥24GB | XL sft + 4B LM | 最强效果 |
根据你的 VRAM 选择最合适的模型配置(来源:官方 README 整理)
Mac mini M4 16GB 落在 8-16GB 这一档,完全能跑 2B 模型,加上 0.6B 或 1.7B 的 LM(语言模型)辅助写歌词和编排。如果想上 XL(4B 参数),需要开启 offload,效果会更好但速度会慢一些。
macOS 有专门的 MLX 后端支持,启动脚本是现成的 start_gradio_ui_macos.sh,也有预装好的 .zip 便携包可以直接下载解压运行。
能干什么?
ACE-Step 1.5 的功能列表比我想象的长很多:
生成类
- Text2Music:给文字描述直接生成音乐
- Cover:翻唱,换风格不换旋律
- Repaint:局部重绘,只改某段落的风格
- 支持 10 秒到 10 分钟的长度,一次最多生成 8 首
编辑类
- 分轨提取(人声、BGM 分离)
- 多轨合成
- Vocal2BGM:人声转背景音乐
- LRC 歌词文件生成
理解类
- 自动分析 BPM、调性、音阶
- 质量自动评分
高级功能
- LoRA 微调:标注 + 训练一体化,8 首歌大约 1 小时(RTX 3090)
- 50+ 语言歌词支持,包括中文
它的 XL turbo 模型只需要 8 步采样就能出高质量结果,速度非常快。项目作者声称 A100 上生成一首歌不到 2 秒,3090 上不到 10 秒。
ACE-Step 1.5 vs Suno:功能完整度对比(来源:官方 README + Suno 功能页)
安装有多麻烦?
比我想象的简单:
# 1. 安装 uv(Python 包管理器)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. 克隆项目
git clone https://github.com/ace-step/ACE-Step-1.5
cd ACE-Step-1.5
# 3. 安装依赖
uv sync
# 4. 启动(模型自动下载)
uv run python gradio_app.py
打开 http://localhost:7860 就能用 Gradio 界面操作。也有 REST API 模式,方便集成到其他工具里。
macOS 用户也可以直接下载便携版 .zip,解压即用,省去装 uv 和 uv sync 的步骤。
一些实话
优点:
- 本地运行,隐私和配额都不是问题
- 功能集远超同类开源项目
- 社区活跃(Discord、HuggingFace 都有)
- 技术报告公开(arxiv),不是闭源黑盒
需要注意的地方:
- 16GB 内存跑 XL 需要 offload,实时交互会有延迟
- Turbo 模型质量高但多样性偏弱,容易风格趋同
- 需要一定命令行基础,不是纯小白产品
- LM 模型较大(尤其 4B 版),下载需要时间
值不值得折腾?
如果你已经有一台 Mac(M 系列芯片),而且对 AI 音乐生成有兴趣但不想被 Suno 的月费绑死——ACE-Step 1.5 值得花一个下午折腾一下。特别是它的分轨和翻唱功能,在当前开源方案里几乎没有竞品。
如果只是想随便玩玩、生成几首歌发朋友圈,Suno 还是更省心的选择。
但如果你想真把 AI 音乐纳入自己的工作流,想要本地控制、无限调用、甚至自己微调风格——ACE-Step 是目前最值得关注的开源方案。