Higgs Audio v3 TTS 登陆 SGLang-Omni:实时可控语音代理新突破
Boson AI 与 SGLang-Omni 团队近日宣布,Higgs Audio v3 TTS 模型已在 SGLang-Omni 框架上实现端到端部署。该模型专为对话式语音代理设计,支持 100 种语言且 WER/CER 保持个位数,同时
Boson AI 与 SGLang-Omni 团队近日宣布,Higgs Audio v3 TTS 模型已在 SGLang-Omni 框架上实现端到端部署。该模型专为对话式语音代理设计,支持 100 种语言且 WER/CER 保持个位数,同时
本文介绍 MOSS-TTS-Local-Transformer-v1.5 在 SGLang-Omni 上的端到端部署方案。该模型支持 48kHz 立体声音频、零样本语音克隆、长时合成、多语言生成及原生流式输出。SGLang-Omni 将请求