Google DeepMind:Gemini 3.1 Flash TTS 发布,用 Audio Tags 控风格
Gemini 3.1 Flash TTS 是目前最可控的文生语音模型,通过新的 Audio Tags,用户可直接用文本指令调节语音风格、情绪与节奏。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Gemini 3.1 Flash TTS 是目前最可控的文生语音模型,通过新的 Audio Tags,用户可直接用文本指令调节语音风格、情绪与节奏。
查看原文