
更多AI前沿科技资讯,请关注我们:
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
【closerAI ComfyUI】炸裂!视频创作神器HunyuanCustom,多模态视频生成模型,可玩性很强!视频未来可期!
大家好,我是Jimmy。Hunyuan最近开源动作比较频繁!在5月9日推出了HunyuanCustom一种多模态驱动的定制视频生成架构。一起来看看究竟是何方神圣!
HunyuanCustom:多模态融合的视频创作神器
HunyuanCustom是基于混元视频生成大模型(HunyuanVideo)精心打造的智能视频创作工具。它最大的亮点在于融合了文本、图像、音频、视频等多模态输入生成视频的能力,在主体一致性效果上超越了现有的开源方案,为用户提供了高度控制力和卓越生成质量的视频生成体验。
(一)丰富多样的视频生成功能
- 单主体视频生成:用户只需上传一张包含目标人物或物体的图片,并提供一句简单的文本描述,例如“他正在遛狗”,HunyuanCustom就能凭借强大的识别能力,精准提取图片中的身份信息,然后在截然不同的动作、服饰与场景中生成连贯自然的视频内容。这一功能打破了传统视频生成的限制,为用户提供了无限的创意空间。

- 多主体视频生成:除了单主体,HunyuanCustom还能实现多主体视频的生成。用户只需提供一张人物和一张物体的照片(比如一包薯片和一名男子的照片),并输入相应的文字描述(如“一名男子正在游泳池旁边,手里拿着薯片进行展示”),模型就能让这两个主体按照要求出现在视频里,为创作复杂的场景提供了便利。


- 单主体视频配音:在音频驱动(单主体)模式下,用户上传人物图像并配上音频语音,模型便可生成人物在任意场景中说话、唱歌或进行其他音视频同步表演的效果。这一功能广泛应用于数字人直播、虚拟客服、教育演示等场景,大大提升了视频的互动性和趣味性。


- 视频局部编辑:在视频驱动模式下,HunyuanCustom支持将图片中的人物或物体自然地替换或插入到任意视频片段中,进行创意植入或场景扩展,轻松实现视频重构与内容增强。这一功能为视频创作者提供了更多的创作可能性,让视频内容更加丰富多样。


(二)应用场景广泛,满足多元需求
HunyuanCustom凭借其强大的功能和卓越的性能,能够满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户和场景的需求。
1、广告场景
在广告创作中,HunyuanCustom可以快捷变换商品背景、让模特快速换衣服,为广告创意提供更多可能性,提升广告的吸引力和表现力。例如,在为一款化妆品制作广告时,创作者可以通过HunyuanCustom轻松改变模特的发型、服装和妆容,展示产品在不同风格下的效果,吸引更多消费者的关注。
2、电商和客服场景
在电商和客服领域,HunyuanCustom可以快速低成本制作出生动的数字人商品介绍视频,或者制作特定穿着的数字人客服视频。数字人商品介绍视频能够更加生动形象地展示商品的特点和优势,提高用户的购买意愿;数字人客服视频则可以为用户提供更加便捷、高效的服务,提升用户体验。
3、影视场景
在影视制作中,HunyuanCustom可以快速制作短剧和小故事短视频,降低影视制作成本,提高创作效率。创作者可以通过上传图片和文本描述,快速生成所需的视频片段,为影视创作提供了更多的灵感和便利。
在comfyUI中的实现
kijai大佬已实现,但还未正式发布,大家可在dev分支中下载KJ节点进行更新。
kijai的hunyuanvideowarpper项目dev分支页面:https://github.com/kijai/ComfyUI-HunyuanVideoWrapper/tree/develop

模型下载页:https://hf-mirror.com/Kijai/HunyuanVideo_comfy/tree/main


下载模型后放置comfyUI/models/diffusion models中
重启comfyUI
加载工作流如下:

主要是KJ版huanyuan视频生成工作流,增加了以下两个节点:

基于工作流,尝试加载以下两个主体进行视频生成:

建议16G显存以上的小伙伴玩玩。算力不够,就线上运行玩玩。
本地算力不够怎么办?
如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

runninghub.cn framepack F1视频生成工作流体验地址:
https://www.runninghub.cn/ai-detail/1919988115879170049
注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151
通过这个链接第一次注册送1000点,每日登录送100点
最后几句:
一个多模态定制的视频生成框架,强调主题的一致性,同时支持图像,音频,视频和文本,5月中下旬会陆续推出其它功能。期待!

以上是HunyuanCustom的介绍comfyUI中的实现及工作流的体验,以及closerAI团队制作的stable diffusion comfyUI closerAI开发的huanyuancustom视频生成工作流介绍,大家可以根据工作流思路进行尝试搭建。
当然,也可以在我们closerAI会员站上获取对应的工作流(查看原文)。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:JimmyMo
更多AI前沿科技资讯,请关注我们:
closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
评论(0)