2026年1月初,马斯克旗下的 AI 巨头 xAI 再次投下深水炸弹。随着 Grok 1.3.28 版本的发布,全新的 Grok Imagine 模型及其 API 正式上线。这款号称 xAI 史上最强的音视频生成模型,正以其强大的性能和极具竞争力的价格,重塑 AI 视频领域的格局。


一、 全能选手:从文生视频到电影级精修

Grok Imagine 不仅仅是一个简单的生成工具,它是一个涵盖了创作全链路的音视频引擎。其核心能力包括:

  • 多模态生成: 支持文生视频(Text-to-Video)和图生视频(Image-to-Video),能够让静态图片产生自然的动态效果。
  • 自带音效: 生成视频的同时支持匹配高质量音频,解决了 AI 视频“默片”的痛点。
  • 电影级掌控: 能够处理复杂的镜头语言,为专业创作者提供精细化打磨的空间。

二、 性能登顶:制霸行业主流榜单

在衡量 AI 模型实力的权威排行榜上,Grok Imagine 展现出了极强的统治力:

  1. 双料冠军: 在 Artificial Analysis 的文生视频和图生视频排行榜中,Grok Imagine 目前均高居第一
  2. 梯队领先: 在 Arena 图生视频榜单中位列第三,文生图榜单排名第四。紧随 Google 的 Veo 3.1 和 OpenAI 的 Sora 2 之后,稳居全球第一梯队。

三、 极致的工程优化:打破价格战僵局

xAI 此次更新最令业界震撼的并非仅仅是效果,而是其背后的工程优化带来的超低成本

模型生成 1 秒视频的价格
Grok Imagine$0.05
Google Veo 3.1$0.40

点评: Grok Imagine 的成本仅为竞争对手的八分之一。这种极低的推理延迟和价格,为开发者的大规模调用和商业化实际应用清扫了障碍。


四、 深度编辑功能:AI 视频的“手术刀”

相比于传统的生成模型,Grok Imagine 在视频后期处理上表现尤为出色,甚至优于可灵(Kuaishou)的 o1 和 Runway 的 Aleph:

  • 对象编辑: 支持在视频中精准添加、移除或替换对象(如在场景中凭空增加两只奔跑的狼)。
  • 角色驱动: 用户可以用自己的表演动作驱动任意角色,实现低成本的动作捕捉与动画赋予。
  • 全局氛围转换: 支持一键切换视频季节、气候或光影氛围(如从金色阳光切换至迷雾冬景)。
  • 属性与风格: 精确到人物衣服的调整,以及各种艺术风格的无损转换。

五、 生态接入:创作者的福音

为了快速打入专业市场,xAI 已同步推出了 Grok Imagine API。目前,主流的 AI 绘画与视频流工具 ComfyUI 已经正式接入了 Grok Imagine 的 API 节点。这意味着全球的创作者现在就可以在自己的工作流中,利用这款高性能模型进行创作。

总结

Grok Imagine 的出现,标志着 AI 视频生成从“炫技阶段”正式跨入“实用阶段”。凭借着第一梯队的画质表现和颠覆性的低价策略,马斯克的 xAI 正在通过 Grok 强力撕开视频生成市场的缺口。

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。