VibeVoice 是微软开源的长对话多说话人语音合成框架,可在单条 64 K 上下文中合成最长 90 分钟、4 位说话人的自然对话音频。支持中英混读、情感、即兴 BGM,MIT 协议可商用。
免费可商用中文字体,金山云UED设计团队推出。