VibeVoice – 微软开源的语音合成工具,支持合成最长 90 分钟、4 位说话人的自然对话音频。

VibeVoice

👉点击这里获取网址

VibeVoice 是微软开源的长对话多说话人语音合成框架,可在单条 64 K 上下文中合成最长 90 分钟、4 位说话人的自然对话音频。支持中英混读、情感、即兴 BGM,MIT 协议可商用。

VibeVoice - 微软开源的语音合成工具,支持合成最长 90 分钟、4 位说话人的自然对话音频。
© 版权声明

相关文章