closerAI ComfyUI LTX-2 完整安装指南

ComfyUI LTX-2安装完整指南

简介与概述

LTX-2 是由 Lightricks 开发的开源音视频生成模型,采用扩散变换器(DiT)架构,拥有 190 亿参数,能够同步生成高质量视频和音频,创造出连贯的多媒体体验。

重要提示

LTX-2 针对 NVIDIA GPU 进行了优化,是领先的开放权重音频视频模型,能够生成高达 4K 分辨率、50 FPS 且长达 20 秒的视频片段。

主要特性

  • 同步生成视频和音频内容
  • 支持 4K 分辨率输出
  • 高达 50 FPS 的流畅帧率
  • 最长 20 秒的视频生成
  • 多种模型变体(基础版、蒸馏版、量化版)
  • 完整的 ComfyUI 节点集成

系统要求

硬件要求

组件 最低要求 推荐配置 备注
GPU NVIDIA GPU,32GB 显存 RTX 4090 或 RTX 6000 Ada RTX 4090(24GB)可通过优化运行
内存 32GB 系统内存 64GB DDR4/DDR5 用于复杂工作流
存储 100GB 可用空间 200GB+ NVMe SSD 模型文件约 50GB,缓存需要额外空间
CPU 4 核处理器 8 核以上处理器 Intel i7/Ryzen 7 或更高

软件要求

注意

macOS 仅提供有限支持(仅 CPU 模式),性能会大幅降低。建议在 NVIDIA GPU 上运行以获得最佳体验。

  • 操作系统:Windows 10/11(64位)、Linux(Ubuntu 20.04+)
  • Python:3.12 或更高版本(推荐使用虚拟环境)
  • CUDA:12.7 或更高版本
  • PyTorch:2.7 或兼容版本
  • Git:用于克隆仓库

步骤一:安装 ComfyUI

1

克隆仓库

打开终端或命令提示符,克隆 ComfyUI 官方仓库到本地。

Bash
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
2

创建虚拟环境

创建 Python 虚拟环境以避免依赖冲突。

Bash
# Windows
python -m venv venv
venv\Scripts\activate

# Linux/macOS
python3 -m venv venv
source venv/bin/activate
3

安装依赖

安装所需的 Python 依赖包和 PyTorch。

Bash
pip install -r requirements.txt
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121
验证安装

启动 ComfyUI 后,打开浏览器并访问 http://localhost:8188。如果页面成功加载,说明 ComfyUI 安装成功。

步骤二:安装 LTX-2 节点

方法 A:通过 ComfyUI Manager(推荐)

  1. 启动 ComfyUI(使用 python main.py
  2. Ctrl+M(Windows/Linux)打开 ComfyUI Manager
  3. 点击 "Install Custom Nodes"
  4. 在搜索框中输入 "LTXVideo"
  5. 找到 Lightricks 的 "ComfyUI-LTXVideo" 并点击 "Install"
  6. 等待安装完成(可能需要 2-5 分钟)
  7. 完成后重启 ComfyUI

方法 B:手动安装

Bash
# 导航到自定义节点目录
cd ComfyUI/custom_nodes

# 克隆 LTXVideo 仓库
git clone https://github.com/Lightricks/ComfyUI-LTXVideo.git
cd ComfyUI-LTXVideo

# 安装依赖
pip install -r requirements.txt

# 返回根目录并重启
cd ../..
python main.py
验证节点安装

重启 ComfyUI 后,在工作流画布中右键点击,导航到 "Add Node" → "LTXVideo"。您应该看到 LTXVConditioning、LTX、LTXV Add Guide、LTXVLoader 等节点。如果看到这些节点,说明安装成功。

步骤三:下载模型文件

主模型 (LTX-2)

约 20GB

选择以下变体之一,放置在 ComfyUI/models/checkpoints/

  • ltx-2-19b-dev-fp8(推荐)
  • ltx-2-19b-distilled(快速版)
  • ltx-2-19b-dev-fp4(低显存)

文本编码器

约 7GB

Gemma 3 12B IT(Q4_0 量化),放置在 ComfyUI/models/text_encoders/

Bash
# 创建目录
mkdir -p ComfyUI/models/text_encoders
cd ComfyUI/models/text_encoders

# 克隆文本编码器
git clone https://huggingface.co/Lightricks/LTX-2-text-encoder

使用 Git LFS 下载(推荐)

Bash
# 如果尚未安装 Git LFS,先安装
git lfs install

# 克隆模型仓库
cd ComfyUI/models/checkpoints
git clone https://huggingface.co/Lightricks/LTX-2

手动下载链接

步骤四:配置工作流

推荐参数设置

参数 16GB 显存 24GB+ 显存 说明
分辨率 576×1024 (540p) 720×1280 (720p) 根据显存选择合适分辨率
帧率 24 FPS 30-50 FPS 动态内容用高帧率
视频时长 3-4 秒 5-10 秒 时长越长显存占用越高
采样步数 20-30 步 30-50 步 步数越多质量越好
模型版本 ltx-2-19b-distilled ltx-2-19b-dev-fp8 根据需求选择模型

提示词工程建议

提示词格式

使用以下格式构建提示词:[主体] [动作] [场景] [氛围/风格] [镜头运动] [音频描述]

示例提示词
一只金毛寻回犬小狗在阳光明媚的花园里玩耍,兴奋地摇着尾巴。
轻柔的环境音,鸟儿鸣叫和树叶沙沙作响。缓慢的镜头平移。

一位穿着粉色制服的1950年代餐厅女服务员在柜台为顾客端咖啡。
复古美学,温暖的灯光。镜头从左向右推移。
背景喧闹声、餐具碰撞声和欢快的爵士乐。

常见问题与故障排除

ComfyUI 无法启动

可能原因:Python 版本不兼容、CUDA 安装问题、端口被占用

解决方案:检查 Python 版本(应为 3.12+)、CUDA 安装、更改端口(--port 参数)

模型加载失败

可能原因:模型文件缺失、文件名不匹配、目录错误

解决方案:确保模型文件在正确目录,文件名完全匹配,使用正确的大小写

显存不足

可能原因:模型过大、分辨率过高、视频时长过长

解决方案:使用低显存配置、减少分辨率/时长/步数,或使用量化模型

低显存配置命令

Bash
# 预留 5GB 显存给其他进程
python main.py --reserve-vram 5

# 使用低精度模式
python main.py --lowvram

# 使用 CPU 卸载部分计算
python main.py --cpu

资源与链接

官方文档

官方 GitHub 仓库和文档链接

模型下载

模型文件和预训练权重下载

进阶技巧

建议参考官方文档定期更新最佳实践指南,获取最新的模型优化和使用技巧。

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。