Allen Institute 推出 MolmoMotion:视频驱动的 3D 运动预测模型
MolmoMotion 根据单帧或多帧视频、物体三维点及自然语言指令,预测这些点在共享三维坐标系中接下来数秒的移动轨迹,可用于机器人操作与交互。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
MolmoMotion 根据单帧或多帧视频、物体三维点及自然语言指令,预测这些点在共享三维坐标系中接下来数秒的移动轨迹,可用于机器人操作与交互。
查看原文