产品观察

xAI Grok Imagine Video 1.5 深扒:图生视频、原生音频,与绕不开的 deepfake 阴影

720p / 24fps / 6–15 秒、声画同生、登顶图生视频竞技场——但这款长在 X 社交流量里的视频模型,最大的变量不是画质,而是它一路走来的内容审核与 deepfake 争议

Pro 限定研报

2026-06-17 14 篇信源 读完约 14 分钟

一句话先说清:Grok Imagine Video 1.5 是什么

Grok Imagine Video 1.5 是 xAI图生视频(image-to-video)模型:你给一张静态图 + 一句自然语言指令,它生成一段最高 720p / 24fps、6–15 秒的视频,并且声效、环境音、对白在同一遍里一起生成、与画面动作对齐[1][2][8]。它内置在 Grok app / X / grok.com 里,是马斯克「X 万能 App」中负责"生成"的那一块。