Google DeepMind:发布 Gemini Robotics-ER 1.6,提升机器人空间理解
Gemini Robotics-ER 1.6 大幅提升视觉和空间理解能力,使机器人能更好地规划和完成实际物理世界任务。
查看原文Google DeepMind 发布 Gemini Robotics-ER 1.6,重点强化视觉-空间理解能力,使机器人在复杂物理环境中的任务规划与执行更可靠。这是具身智能从「能看」到「能动手」的关键一步,将加速工业和服务机器人的落地进程。
Gemini Robotics-ER 1.6 的核心升级
Google DeepMind 于 4 月 14 日发布 Gemini Robotics-ER 1.6 版本。根据官方描述,这次更新的重点在于大幅提升机器人的视觉和空间理解能力——也就是说,机器人不仅能「看到」环境,还能更准确地理解物体在三维空间中的位置、姿态和相互关系,从而规划出更合理的动作序列。这对于执行「拿起桌上的杯子放到柜子里」这类看似简单但实际需要空间推理的任务尤为关键。
从技术路径看,Gemini Robotics-ER 系列采用了 DeepMind 在 Gemini 大模型中积累的多模态理解能力,并针对Embodied Reasoning(具身推理)场景做了专项优化。1.6 版本可能借鉴了 Gemini 2.0 在长上下文和工具调用方面的改进,使机器人能处理更复杂的任务分解和长时序规划。
为什么是现在
过去半年,具身智能进入密集落地期:Figure 02、1X Technologies、Physical Intelligence 等公司相继推出通用机器人基础模型,NVIDIA 在 GTC 2026 也发布了 Jetson Thor 和 GR00T 2.0 机器人平台。Google 此
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- Google DeepMind 官方推文 · 2026-04-14
- Google DeepMind 发布 Gemini Robotics-ER(早期版本) · 2026-02-20