【closerAI ComfyUI】继续卷！挑战闭源！字节发布跨模态对齐统一视频生成框架Phantom，多图融合生成一致性视频！-closerAI(未授权)

更多AI前沿科技资讯，请关注我们：

closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

【closerAI ComfyUI】视频生成继续卷！字节发布跨模态对齐统一视频生成框架Phantom，多图融合生成一致性视频！炸！

大家好，我是Jimmy。ByteDance的研究团队最近发布了一个名为Phantom的统一视频生成框架，旨在通过跨模态对齐实现单人和多人主体的视频生成。

Phantom：通过跨模态对齐实现主体一致的视频生成

https://hf-mirror.com/bytedance-research/Phantom

Phantom是一个基于现有文本到视频和图像到视频架构(wan2.1)的统一视频生成框架。它通过重新设计联合文本-图像注入模型来实现跨模态对齐，从而在人类生成的视频中强调主体一致性，并增强身份保留的视频生成能力。

主要特点

跨模态对齐：Phantom通过使用文本-图像-视频三元组数据来实现跨模态对齐，这使得模型能够更好地理解输入文本和图像的语义信息，并将其转化为高质量的视频内容。
主体一致性：在生成视频时，Phantom特别注重保持主体的连贯性和一致性，这对于生成涉及多个主体的视频尤为重要。
身份保留：Phantom在生成视频时能够保留输入图像中的身份特征，使得生成的视频在视觉上与输入图像保持一致。

目前大佬kijai已在wanvideo节点中作更新，但目前还处于开发阶段。

大家可以在https://github.com/kijai/ComfyUI-WanVideoWrapper

在分支中选择dev，下载dev下的所有文件。如下图示：

下载后，覆盖原来节点的文件。

模型要使用kijai版本的，在以下链接下载即可：

https://hf-mirror.com/Kijai/WanVideo_comfy/tree/main

下载后，将模型放置：comfyUI/models/diffusion_models下。

Phantom的comfyUI中实现与体验

前面的模型和节点下载后，加载工作流打开。如下图示：

工作流加载节点中的示例工作流。

我添加了两张图进行融合测试，这里我使用的是KJ的FP16模型来生成视频，大家可以根据自己设备情况来选择合适的模型。

提示词我们是需要描述下的，这样更容易引导模型合成我们需要的内容。像物体、人物这些要简单描述。

一张人物，一张场景，如下：

然后直接执行：以下是效果。我8G显存，跑了16分钟。大家作参考吧。

我们很直观地看出，人物的特征以及场景的一致性保持得很好，人脸虽然有点崩，但这仅是它开源的1.3B的模型，接下来还会开源一个14B模型。非常强!

本地算力不够怎么办？

如果本地设备算力不好的小伙伴，推荐使用线上comfyUI来运行体验：runninghub.cn

runninghub.cn framepack首尾帧工作流体验地址：

https://www.runninghub.cn/ai-detail/1914594578874466305

注册地址：https://www.runninghub.cn/?utm_source=kol01-RH151

通过这个链接第一次注册送1000点，每日登录送100点

最后几句：

Phantom的多图参考视频生成是基于万相视频生成训练的，得到这样的一个这么强的一致性融图，期待它的14B模型开源。它的价值在于，简化了我们为了保持人物一致性，花大量时间在生产图片中，在图片中先保持人物一致再进行图生视频的工作流，现在，它可以直接多图参考一起图生视频！

以上是closerAI团队制作的stable diffusion comfyUI closerAI

phantom多图融合视频生成工作流介绍，大家可以根据工作流思路进行尝试搭建。

当然，也可以在我们closerAI会员站上获取对应的工作流(查看原文)。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～谢谢你看我的文章，我们，下次再见。

>/ 作者：JimmyMo

更多AI前沿科技资讯，请关注我们：

closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

隐藏内容

本内容需权限查看

普通用户: 99.9金币
VIP会员: 免费
永久会员: 免费

主题授权提示：请在后台主题设置-主题授权-激活主题的正版授权，授权购买：RiTheme官网

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

【closerAI ComfyUI】继续卷！挑战闭源！字节发布跨模态对齐统一视频生成框架Phantom，多图融合生成一致性视频！

主要特点

评论(0)

提示：请文明发言取消回复

作者信息

文章展示

【closerAI ComfyUI】视频高清化！生成速度快！FlashVSR：基于实时扩散的流式视频超分辨率技术！ AI短剧制作开源生态逐渐完善！为开花作准备！

【closerAI ComfyUI】强！视频分割新模型：SeC模型，让wan2.2 animate视频生成实现更精准的自动分割！

【closerAI ComfyUI】AI视频制作思路再迭代：nano+S2+closerAI分词器节点助力分镜画面生成！这次你也能当主角！高效分镜画面生成方案！冲！

【closerAI ComfyUI】AI视频制作最强组合：nanoBanana分镜画面+S2，轻松实现广告、小短剧、小故事的AI视频生产，学会了你就是AIGC创作者！

WAN2.2-14B-Rapid-AlO MegaV6版 NSFW使用

目前最棒的视频融合模型：WAN2.2-14B-Rapid-AlO MegaV6版！文生、图生、首尾帧视频生成一个模型搞掂！搞起！

排行榜展示

comfyUI节点：flux kontext提示词生成器

comfyUI节点：closerAI标注助手

closerAI模型库

【closerAI ComfyUI】AI微短剧分镜头场景生成工作流，两种方法实现分镜场景生成，高效出图，一套工作流搞掂！

【closerAI ComfyUI】3D玩偶玩疯了？手把手教你用comfyUI做一个真人转3D玩偶工作流，在朋友圈当最靓的仔！

closerAI AI数字人解决方案

【closerAI ComfyUI】继续卷！挑战闭源！字节发布跨模态对齐统一视频生成框架Phantom，多图融合生成一致性视频！

主要特点

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

文章展示

排行榜展示

提示：请文明发言取消回复