ACE-Step 1.5:本地运行「最强音乐生成模型」,Mac mini 也能玩

ACE-Step 1.5 Logo
ACE-Step 1.5 项目标志(来源:GitHub)

今年四月,一个叫 ACE-Step 的开源项目在 GitHub 上爆了——11k stars,号称「最强本地音乐生成模型」,质量在 Suno v4.5 到 v5 之间。最吸引我的一点:它支持 Apple Silicon。

如果你也有一台 Mac(尤其是 M 系列芯片),这篇文章会告诉你 ACE-Step 1.5 能不能跑、能玩到什么程度、以及和 Suno 这类在线服务到底有什么区别。

不是又一个 Suno 替代品

先说定位。ACE-Step 不是那种一键生成、无脑使用的产品——它是个本地部署的模型套件,需要你动手配置、调参数、选模型。但换来的东西很实在:

  • 完全本地运行——你的提示词和生成的音乐不会上传到任何服务器
  • 无限使用——没有月配额、没有充值墙
  • 可微调——用你自己的 8 首歌就能做 LoRA 训练
  • 功能远超生成——翻唱、分轨、重绘、音频分析全都有

简单说:Suno 是 iPhone(即开即用),ACE-Step 是 Linux 工作站(上限高,但需要折腾)。

Mac mini M4 能跑吗?

这是大家最关心的问题。ACE-Step 1.5 的模型分三档:

显卡 / 内存 推荐模型 功能
≤6GB 2B turbo(INT8+CPU offload) 仅 DiT,无 LM 辅助
8-16GB ⬅ Mac mini M4 16GB 2B turbo/sft + 0.6B/1.7B LM 完整功能
16-20GB XL turbo 高质量+快出
≥24GB XL sft + 4B LM 最强效果

ACE-Step 1.5 模型选择指南
根据你的 VRAM 选择最合适的模型配置(来源:官方 README 整理)

Mac mini M4 16GB 落在 8-16GB 这一档,完全能跑 2B 模型,加上 0.6B 或 1.7B 的 LM(语言模型)辅助写歌词和编排。如果想上 XL(4B 参数),需要开启 offload,效果会更好但速度会慢一些。

macOS 有专门的 MLX 后端支持,启动脚本是现成的 start_gradio_ui_macos.sh,也有预装好的 .zip 便携包可以直接下载解压运行。

能干什么?

ACE-Step 1.5 的功能列表比我想象的长很多:

生成类

  • Text2Music:给文字描述直接生成音乐
  • Cover:翻唱,换风格不换旋律
  • Repaint:局部重绘,只改某段落的风格
  • 支持 10 秒到 10 分钟的长度,一次最多生成 8 首

编辑类

  • 分轨提取(人声、BGM 分离)
  • 多轨合成
  • Vocal2BGM:人声转背景音乐
  • LRC 歌词文件生成

理解类

  • 自动分析 BPM、调性、音阶
  • 质量自动评分

高级功能

  • LoRA 微调:标注 + 训练一体化,8 首歌大约 1 小时(RTX 3090)
  • 50+ 语言歌词支持,包括中文

它的 XL turbo 模型只需要 8 步采样就能出高质量结果,速度非常快。项目作者声称 A100 上生成一首歌不到 2 秒,3090 上不到 10 秒。

ACE-Step vs Suno 功能对比
ACE-Step 1.5 vs Suno:功能完整度对比(来源:官方 README + Suno 功能页)

安装有多麻烦?

比我想象的简单:

# 1. 安装 uv(Python 包管理器)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 克隆项目
git clone https://github.com/ace-step/ACE-Step-1.5
cd ACE-Step-1.5

# 3. 安装依赖
uv sync

# 4. 启动(模型自动下载)
uv run python gradio_app.py

打开 http://localhost:7860 就能用 Gradio 界面操作。也有 REST API 模式,方便集成到其他工具里。

macOS 用户也可以直接下载便携版 .zip,解压即用,省去装 uv 和 uv sync 的步骤。

一些实话

优点:

  • 本地运行,隐私和配额都不是问题
  • 功能集远超同类开源项目
  • 社区活跃(Discord、HuggingFace 都有)
  • 技术报告公开(arxiv),不是闭源黑盒

需要注意的地方:

  • 16GB 内存跑 XL 需要 offload,实时交互会有延迟
  • Turbo 模型质量高但多样性偏弱,容易风格趋同
  • 需要一定命令行基础,不是纯小白产品
  • LM 模型较大(尤其 4B 版),下载需要时间

值不值得折腾?

如果你已经有一台 Mac(M 系列芯片),而且对 AI 音乐生成有兴趣但不想被 Suno 的月费绑死——ACE-Step 1.5 值得花一个下午折腾一下。特别是它的分轨和翻唱功能,在当前开源方案里几乎没有竞品。

如果只是想随便玩玩、生成几首歌发朋友圈,Suno 还是更省心的选择。

但如果你想真把 AI 音乐纳入自己的工作流,想要本地控制、无限调用、甚至自己微调风格——ACE-Step 是目前最值得关注的开源方案。

发表评论