一句话先说清:Grok Imagine Video 1.5 是什么
Grok Imagine Video 1.5 是 xAI 的图生视频(image-to-video)模型:你给一张静态图 + 一句自然语言指令,它生成一段最高 720p / 24fps、6–15 秒的视频,并且声效、环境音、对白在同一遍里一起生成、与画面动作对齐[1][2][8]。它内置在 Grok app / X / grok.com 里,是马斯克「X 万能 App」中负责"生成"的那一块。
产品观察
720p / 24fps / 6–15 秒、声画同生、登顶图生视频竞技场——但这款长在 X 社交流量里的视频模型,最大的变量不是画质,而是它一路走来的内容审核与 deepfake 争议
Pro 限定研报
Grok Imagine Video 1.5 是 xAI 的图生视频(image-to-video)模型:你给一张静态图 + 一句自然语言指令,它生成一段最高 720p / 24fps、6–15 秒的视频,并且声效、环境音、对白在同一遍里一起生成、与画面动作对齐[1][2][8]。它内置在 Grok app / X / grok.com 里,是马斯克「X 万能 App」中负责"生成"的那一块。