ComfyUI

ComfyUI Wan2.1 Fun Camera 官方原生示例

关于 Wan2.1 Fun Camera

Wan2.1 Fun Camera 是阿里团队推出的视频生成项目,专注于通过摄像机运动来控制视频生成效果。
模型权重下载地址

代码仓库VideoX-Fun
目前 ComfyUI 已原生支持了 Wan2.1 Fun Camera 模型

请确保你的 ComfyUI 已经更新。

本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:

  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

相关模型安装

这些模型你仅需要安装一次,另外在对应的工作流图片中也包含了模型下载信息,你可以选择你喜欢的方式下载模型。
下面的所有模型你可以在 Wan_2.1_ComfyUI_repackaged 找到
Diffusion Models 选择 1.3B 或 14B:

下面的模型,如果你使用过 Wan2.1 的相关模型,那么你应该已经有了下面的模型,如果没有,请下载下面的模型:
Text Encoders 选择其中一个:

VAE

CLIP Vision

文件保存位置:

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │   ├── wan2.1_fun_camera_v1.1_1.3B_bf16.safetensors # 1.3B 版本
│ │   └── wan2.1_fun_camera_v1.1_14B_bf16.safetensors # 14B 版本
│ ├── 📂 text_encoders/
│ │   └── umt5_xxl_fp8_e4m3fn_scaled.safetensors
│ ├── 📂 vae/
│ │   └── wan_2.1_vae.safetensors
│ └── 📂 clip_vision/
│     └── clip_vision_h.safetensors

ComfyUI Wan2.1 Fun Camera 1.3B 原生工作流示例

1. 工作流相关文件下载

1.1 工作流文件

下载下面的视频,并拖入 ComfyUI 中以加载对应的工作流:

下载 Json 格式工作流文件

如果你想使用 14B 版本,只需要将模型文件替换为 14B 版本即可,但请注意显存要求。

1.2 输入图片下载

请下载下面的图片,我们将作为起始帧:
输入参考图片

2. 按步骤完成工作流

Wan2.1 Fun Camera 工作流步骤

  1. 确保加载了正确版本的模型文件:
    • 1.3B 版本:wan2.1_fun_camera_v1.1_1.3B_bf16.safetensors
    • 14B 版本:wan2.1_fun_camera_v1.1_14B_bf16.safetensors
  2. 确保 Load CLIP 节点加载了 umt5_xxl_fp8_e4m3fn_scaled.safetensors
  3. 确保 Load VAE 节点加载了 wan_2.1_vae.safetensors
  4. 确保 Load CLIP Vision 节点加载了 clip_vision_h.safetensors
  5. Load Image 节点上传起始帧
  6. 修改 Prompt,如果你使用了你自己的图像输入
  7. WanCameraEmbedding 节点设置相机动作
  8. 点击 Run 按钮,或使用快捷键 Ctrl(cmd) + Enter(回车) 执行生成

ComfyUI Wan2.1 Fun Camera 14B 工作流及输入图片


下载 Json 格式工作流文件


输入图片
输入图片

性能参考

1.3B 版本

  • 512×512 RTX 4090 生成 81 帧约需 72 秒

14B 版本

  • RTX4090 24GB 显存在生成 512×512 分辨率时可能会出现显存不足, 在 A100 上运行尺寸过大时也出现过显存不足的情况

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网