OpenAI:ChatGPT 语音更新还在锅里,请稍等
在 GPT-Realtime-2 进入 API 后,OpenAI 安抚等待 ChatGPT 端语音升级的用户:相关更新正在路上,但暂未公布时间。
查看原文OpenAI 确认 ChatGPT 语音功能更新仍在开发中,用户需要继续等待。此次更新将在 GPT-Realtime-2 API 上线后推进,官方未给出具体时间表。
产品具体是什么?
OpenAI 在 X 平台上正式回应用户询问,确认 ChatGPT 语音模式的重大升级正在开发中但尚未完成。这意味着用户期待的更实时、更自然的语音对话体验仍需等待,官方此次只是"安抚"而非正式发布。
解决什么问题?
当前 ChatGPT 语音模式仍存在延迟、语气不够自然、多轮对话连贯性不足等问题。用户期待的是接近真人的实时对话体验,包括更低的延迟(<300ms)、情绪化的语音表达、以及复杂多轮对话中的上下文保持能力。
相比之前的变化
核心变化在于底层模型的升级。GPT-Realtime-2 已在 API 侧上线,意味着实时语音处理能力已具备,但端到端的用户体验(ChatGPT App/Web)还需要额外的产品化工作。根据 OpenAI 的表态,预计新语音模式将基于 Realtime-2 的 API 能力,提供更低的延迟和更自然的声音表现。
目标用户是谁?
主要面向两类用户:1) 普通用户——期待更自然流畅的语音对话体验;2) 开发者——通过 API 集成语音能力的第三方应用开发者,后者已可以通过 GPT-Realtime-2 API 实现。
对比同类竞品
- Google Gemini Live
● 未登录访客SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- OpenAI 确认 ChatGPT 语音更新仍在开发中 · 2026-05-07
- OpenAI GPT-Realtime-2 API 发布公告 · 2026-04-15
- Google Gemini Live 功能更新 · 2026-03-20