添加图片注释,不超过 140 字(可选)
更多AI前沿科技资讯,请关注我们:
【closerAI ComfyUI】24G降到8G,AI视频的王者地位!混元视频最强开源模型+高效提示词反推,本地玩转AI视频!
大家好,我是Jimmy。这期我们主要讨论如何使用stable diffusion comfyUI 制作AI视频。
腾讯的混元HunyuanVideo视频模型开源也有一段时间了,一直没有尝试,主要是因为需要24G以上显存,没有钞能力所以没怎么玩。这不,前几天comfyUI团队优化混元HunyuanVideo视频模型,使得8G显存就能畅玩,同时comfyUI官方也提供了GGUF量化版本,直接将生成速度提高几个等级。
我的设备4060Ti 8G,也能小玩一会。今天不讨论这个怎么安装,因为网上其它号也已经详细有说明。直接上连接大家自己根据官网的说明来安装吧。
腾讯混元文生视频项目仓库地址:https://github.com/Tencent/HunyuanVideo
腾讯混元文生视频在线体验地址:腾讯混元文生视频
腾讯混元文生视频模型地址:https://huggingface.co/tencent/HunyuanVideo
ComfyUI-HunyuanVideoWrapper节点仓库地址:https://github.com/kijai/ComfyUI-HunyuanVideoWrapper 更新 ComfyUI 到最新版本。下载以下模型文件并放置到对应目录中:hunyuan_video_t2v_720p_bf16.safetensors → ComfyUI/models/diffusion_models
Clip_l.safetensors 和 llava_llama3_fp8_scaled.safetensors → ComfyUI/models/text_encoders
hunyuan_video_vae_bf16.safetensors → ComfyUI/models/vae
加载节点中的示例工作流到 ComfyUI 中,或直接拖放到界面中运行即可。
我们主要讨论如何使用它来进行图生视频。我们知道,现在混元HunyuanVideo视频模型只支持文生图,那如何图生视频呢?我们可以进行提示词反推,从而实现接近参考图元素的视频控制生成。
这里我们使用前期我们介绍的cliption节点形成提示词。没看的可以关注看看:
【closerAI ComfyUI】快速洗图!高效快速的提示词反推节点——cliption,让洗图出图快人一步不爆显存!
形成提示词组合后,接入混元文生视频模块。
以下是工作流的全貌:

加载图片如下:



反推加载图像形成提示词。然后描述视频动作渐由哭到笑”并形成组合提示词,如下图示。

最终提示词为:
这张照片是一位年轻女子坐在地板上,手里拿着一只泰迪熊和一个戴着皇冠的蛋糕。她穿着一件白色毛衣,有着长长的波浪状棕色头发。背景是一面朴素的浅色墙壁。图像右侧有一个小窗户,图像的整体色调温暖而诱人。逐渐从哭到笑。
以下生成效果。
我们再试一张。

也是抽卡几次啦,提示词也调整过才出的结果。抽卡少不了啦。
根据我设备的情况,4~5分钟出一个结果吧。
以上就是本地运行混元视频模型的图生视频工作流介绍。效果其实也是跟算力有关啦。我这里果都384*480的结果,分辨率低。
下面我们也通过看可灵AI视频的结果来看看吧。我发现效果非常不错。就是免费的生成时间有点久。一起来欣赏下吧。
以上是closerAI团队制作的stable diffusion comfyUI closerAI开发的closerAI 混元视频图生视频8G可用工作流介绍,以及可灵AI视频的生成效果欣赏,工作流大家可以根据上述思路进行尝试搭建。
当然,也可以在我们closerAI会员站上获取对应的工作流。
更多AI前沿科技资讯,请关注我们:closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台aigc.douyoubuy.cn/
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
评论(0)