← 返回资讯
产品发布 @vllm_project 2026-03-26

Mistral 发布 Voxtral 4B TTS:9 种语言、20 种预设音色、企业级语音合成

Mistral 发布 Voxtral 4B TTS 模型(CC BY-NC 权重,非商用),支持 9 种语言的自然韵律和情感表达,多款预设音色,超低延迟流式输出(24kHz)。企业可通过 API 商用。vLLM 首日支持。

查看原文
TL;DR · 产品解读

Mistral 发布 4B 参数 TTS 模型 Voxtral,支持 9 种语言情感语音合成并首日集成 vLLM推理引擎,在非商用 CC 协议下免费可用,企业 API 收费。轻量化与多语言是其核心差异点,适合出海/多语客服/语音交互场景,而非追求极致音质的专业配音。

深度解读

产品是什么

Voxtral 4B 是 Mistral 推出的参数量为 4B(约 40 亿参数)的文本转语音(TTS)模型。相比 Mistral 在 LLM 领域的声量,此次切入 TTS 赛道意味着其产品线从纯语言模型向多模态语音合成的扩张。

核心能力:

解决什么问题

当前 TTS 市场存在两极分化:高质量方案(如 ElevenLabs)价格偏高,开源方案(如 Coqui XTTS、MetaVoice)多语言支持弱或情感表达单薄。Voxtral 4B 的定位是以轻量化 4B 参数实现多语言情感 TTS,填补中端市场空白——既比小模型有更好的韵律自然度,又比超大模型更易部

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. Mistral 发布 Voxtral 4B TTS:9 种语言、20 种预设音色、企业级语音合成 · 2026-03-26
  2. ElevenLabs Pricing · 2026-01-01
  3. Coqui XTTS v2 Overview · 2025-10-01
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。