更多AI前沿科技资讯,请关注我们:
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
【closerAI ComfyUI】Ltx2.3 Vs grok 开闭源视频生成模型对比分析,LTX2.3是真的强!LTX2.3用最小成本打出顶级效果!

大家好,我是Jimmy。
LXT2.3视频生成模型已推出几天,社区一直旺盛。它能文生视频、图生视频、视频编辑、音频生视频等。出来效果也非常地棒。
我更是详细地介绍了如何在8G上进行运行:
【closerAI ComfyUI】“开源天花板”LTX2.3重磅发布:音视频同步、原生 4K!全网最全的comfyUI GGUF低显存方案! 8G 显存也能飞!
也开发了一个LTX2.3提示词优化器节点来优化提示词提升输出的结果:
【closerAI ComfyUI】从平庸到炸裂!结构化提示词大法,让 LTX2.3 生成效果更炸裂!这一招直接让画质翻倍,视频质感拉满!
LTX2.3甚至能与闭源产品硬刚。这里我拿同样是音画同步生成且质量与速度并存的grok视频生成来对比。
首先,如果不优化提示词,直接是简单提示词来进行生成的话,LTX2.3是具备稳定性且脑补的效果还算中规中矩。
例子:
输入参考图:

提示词:她哭着说道“再见了!是时候该放手了,去吧,找你心爱的她”

然后经过提示词优化后,质量再上一个等级:


输出优化后的提示词:
一名 28 岁的女性,深色长发束于脑后,面部有泪痕,身穿一件厚重的棕色羊毛大衣,镜头以 85mm f/1.4 肖像镜头从正面特写推入,背景为模糊的户外小径,光线来自斜上方,营造出温暖而略带阴郁的氛围。她缓缓抬起右手,轻轻擦去眼角泪水,嘴唇微张,低声说:“再见了!是时候该放手了,去吧,找你心爱的她。”
然后,我同步在grok上进行生成:

九宫图分镜视频生成法Ltx2.3行不行呢?
首先,我用json结构化提示词节点转换成9个分镜提示词:如下

再利用这个json提示词,接入closerAI flow使用NanoBanana2进行分镜图生成。


9宫格生成视频有些勉强,多画面的话能力有些不足,人物会崩。
grok是没问题的,主要看后期它迭代与使用策略!
总结
通过以上对比。
真的,LTX2.3的能力已经是超出意外了,同样这个例子,音乐、声音、情感,画面、运镜,其实它都做得很不错。它完全能在消费级显卡作为生产力工具来使用,而无须付费排队生成(没错,就是一到节假日付费去旅游景点排队的那种享受)
当然,你非要拿索拉2、seedance2.0去对比,那确实存在一定差距,毕竟这是一个开源模型,人力、物力、资金等投入都不同,但别人团队就是用最小成本打造出这样一个模型出来。不得不说,对于它后面的迭代还是很期待。如果真到了消费级显卡就能跑出高质量的视频内容,那这就是AI视频领域真正遍地开发的时刻。从玩具到生产的高光时刻。
昨天还看到黑森林的一篇报道:
https://bfl.ai/research/self-flow


我猜这团队又在搞大事情了。
后面视频生成领域会有哪些更多惊喜呢?期待。
本地算力不够怎么办?
如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

LTX2.3图生视频应用体验地址:
https://www.runninghub.cn/ai-detail/2029776111051214850
注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151
通过这个链接第一次注册送1000点,每日登录送100点
最后几句:
如果对你有帮助,请一键三连支持下我,感谢
以上是closerAI团队制作的stable diffusion comfyUI closerAI LTX-2.3 GGUF+提示词优化视频生成工作流(8G可运行版本)0307的介绍,当然,也可以在我们closerAI会员站上获取(查看原文)。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:JimmyMo
更多AI前沿科技资讯,请关注我们:
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)