← 返回资讯
芯片 @lmsysorg 2026-06-18

SGLang-Omni上线MOSS-TTS v1.5:开源48kHz立体声TTS模型,支持31语言…

基于Qwen3-4B构建,支持原生流式输出与长文本(10分钟),31语言训练于约400万小时语音数据。非流式吞吐量5.976 req/s,RTF 0.644,SeedTTS英语测试WER仅1.75%。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。