3s克隆音频工具 - VoxCPM2 v1.0 下载-黑苹果动力

3s克隆音频工具 - VoxCPM2 v1.0 下载

AI软件 2026-05-03 0 155

来自bilibili 万能君的软件库制作的3s克隆音频工具V1.0，音频克隆、风格描述自由引导，不限制字数，不用搭建环境，解压即用！

网盘

预览

清华OpenBMB刚放出来一个东西叫VoxCPM2，我看完直接沉默了。

先说参数：20亿，训练数据200万小时多语言音频，输出48kHz录音棚级音质。这几个数字摆出来，传统TTS基本可以退场了。

但最让我觉得可怕的不是这个。

它不用Tokenizer。

传统方案是把音频切成离散token再生成，这个过程信息损失很严重，声音听起来总差点意思。VoxCPM2直接在连续潜空间做扩散自回归，音色、情绪、呼吸节奏，全给你保留下来。

指标我给你列一下：

① 支持30种语言加9种中文方言，普通话粤语闽南语随便切

② RTX 4090跑下来实时率0.13，流式输出几乎感觉不到延迟

③ 不需要参考音频，用自然语言描述就能直接生成声音

④ 声音克隆可以调情绪、语速、口癖，想让它说话磕巴都行

⑤ 终极克隆模式：给一段参考音频加文本，连呼吸节奏都能复刻出来

协议是Apache 2.0，商用友好，GitHub已经破万星，连续霸榜Trending。

播客、有声书、游戏配音、短视频旁白，开源方案现在完全够用，甚至比很多付费方案更强。

一个简易的黑苹果安装教程：https://www.mfpud.com/topics/10263/
一个联系QQ：577535622