closerAI ComfyUI LTX-2 完整安装指南
ComfyUI LTX-2 完整安装指南
Lightricks LTX-2 音视频生成模型在 ComfyUI 中的详细安装与配置教程
简介与概述
LTX-2 是由 Lightricks 开发的开源音视频生成模型,采用扩散变换器(DiT)架构,拥有 190 亿参数,能够同步生成高质量视频和音频,创造出连贯的多媒体体验。
LTX-2 针对 NVIDIA GPU 进行了优化,是领先的开放权重音频视频模型,能够生成高达 4K 分辨率、50 FPS 且长达 20 秒的视频片段。
主要特性
- 同步生成视频和音频内容
- 支持 4K 分辨率输出
- 高达 50 FPS 的流畅帧率
- 最长 20 秒的视频生成
- 多种模型变体(基础版、蒸馏版、量化版)
- 完整的 ComfyUI 节点集成
系统要求
硬件要求
| 组件 | 最低要求 | 推荐配置 | 备注 |
|---|---|---|---|
| GPU | NVIDIA GPU,32GB 显存 | RTX 4090 或 RTX 6000 Ada | RTX 4090(24GB)可通过优化运行 |
| 内存 | 32GB 系统内存 | 64GB DDR4/DDR5 | 用于复杂工作流 |
| 存储 | 100GB 可用空间 | 200GB+ NVMe SSD | 模型文件约 50GB,缓存需要额外空间 |
| CPU | 4 核处理器 | 8 核以上处理器 | Intel i7/Ryzen 7 或更高 |
软件要求
macOS 仅提供有限支持(仅 CPU 模式),性能会大幅降低。建议在 NVIDIA GPU 上运行以获得最佳体验。
- 操作系统:Windows 10/11(64位)、Linux(Ubuntu 20.04+)
- Python:3.12 或更高版本(推荐使用虚拟环境)
- CUDA:12.7 或更高版本
- PyTorch:2.7 或兼容版本
- Git:用于克隆仓库
步骤一:安装 ComfyUI
克隆仓库
打开终端或命令提示符,克隆 ComfyUI 官方仓库到本地。
git clone https://github.com/comfyanonymous/ComfyUI.git cd ComfyUI
创建虚拟环境
创建 Python 虚拟环境以避免依赖冲突。
# Windows python -m venv venv venv\Scripts\activate # Linux/macOS python3 -m venv venv source venv/bin/activate
安装依赖
安装所需的 Python 依赖包和 PyTorch。
pip install -r requirements.txt pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121
启动 ComfyUI 后,打开浏览器并访问 http://localhost:8188。如果页面成功加载,说明 ComfyUI 安装成功。
步骤二:安装 LTX-2 节点
方法 A:通过 ComfyUI Manager(推荐)
- 启动 ComfyUI(使用
python main.py) - 按
Ctrl+M(Windows/Linux)打开 ComfyUI Manager - 点击 "Install Custom Nodes"
- 在搜索框中输入 "LTXVideo"
- 找到 Lightricks 的 "ComfyUI-LTXVideo" 并点击 "Install"
- 等待安装完成(可能需要 2-5 分钟)
- 完成后重启 ComfyUI
方法 B:手动安装
# 导航到自定义节点目录 cd ComfyUI/custom_nodes # 克隆 LTXVideo 仓库 git clone https://github.com/Lightricks/ComfyUI-LTXVideo.git cd ComfyUI-LTXVideo # 安装依赖 pip install -r requirements.txt # 返回根目录并重启 cd ../.. python main.py
重启 ComfyUI 后,在工作流画布中右键点击,导航到 "Add Node" → "LTXVideo"。您应该看到 LTXVConditioning、LTX、LTXV Add Guide、LTXVLoader 等节点。如果看到这些节点,说明安装成功。
步骤三:下载模型文件
主模型 (LTX-2)
约 20GB选择以下变体之一,放置在 ComfyUI/models/checkpoints/
- ltx-2-19b-dev-fp8(推荐)
- ltx-2-19b-distilled(快速版)
- ltx-2-19b-dev-fp4(低显存)
文本编码器
约 7GBGemma 3 12B IT(Q4_0 量化),放置在 ComfyUI/models/text_encoders/
# 创建目录 mkdir -p ComfyUI/models/text_encoders cd ComfyUI/models/text_encoders # 克隆文本编码器 git clone https://huggingface.co/Lightricks/LTX-2-text-encoder
使用 Git LFS 下载(推荐)
# 如果尚未安装 Git LFS,先安装 git lfs install # 克隆模型仓库 cd ComfyUI/models/checkpoints git clone https://huggingface.co/Lightricks/LTX-2
手动下载链接
步骤四:配置工作流
推荐参数设置
| 参数 | 16GB 显存 | 24GB+ 显存 | 说明 |
|---|---|---|---|
| 分辨率 | 576×1024 (540p) | 720×1280 (720p) | 根据显存选择合适分辨率 |
| 帧率 | 24 FPS | 30-50 FPS | 动态内容用高帧率 |
| 视频时长 | 3-4 秒 | 5-10 秒 | 时长越长显存占用越高 |
| 采样步数 | 20-30 步 | 30-50 步 | 步数越多质量越好 |
| 模型版本 | ltx-2-19b-distilled | ltx-2-19b-dev-fp8 | 根据需求选择模型 |
提示词工程建议
使用以下格式构建提示词:[主体] [动作] [场景] [氛围/风格] [镜头运动] [音频描述]
一只金毛寻回犬小狗在阳光明媚的花园里玩耍,兴奋地摇着尾巴。 轻柔的环境音,鸟儿鸣叫和树叶沙沙作响。缓慢的镜头平移。 一位穿着粉色制服的1950年代餐厅女服务员在柜台为顾客端咖啡。 复古美学,温暖的灯光。镜头从左向右推移。 背景喧闹声、餐具碰撞声和欢快的爵士乐。
常见问题与故障排除
ComfyUI 无法启动
可能原因:Python 版本不兼容、CUDA 安装问题、端口被占用
解决方案:检查 Python 版本(应为 3.12+)、CUDA 安装、更改端口(--port 参数)
模型加载失败
可能原因:模型文件缺失、文件名不匹配、目录错误
解决方案:确保模型文件在正确目录,文件名完全匹配,使用正确的大小写
显存不足
可能原因:模型过大、分辨率过高、视频时长过长
解决方案:使用低显存配置、减少分辨率/时长/步数,或使用量化模型
低显存配置命令
# 预留 5GB 显存给其他进程 python main.py --reserve-vram 5 # 使用低精度模式 python main.py --lowvram # 使用 CPU 卸载部分计算 python main.py --cpu
资源与链接
模型下载
模型文件和预训练权重下载
建议参考官方文档定期更新最佳实践指南,获取最新的模型优化和使用技巧。
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)