Ovis-Image ComfyUI 工作流示例
Ovis-Image 是一个基于 Ovis-U1 构建的 7B 文生图模型,专门针对高质量文本渲染进行优化。它能够提供与更大的 20B 级别系统相当的文本渲染质量,同时保持足够紧凑,可在常见硬件上运行。
模型亮点:
模型亮点:
- 7B 规模下的强大文本渲染:提供与 Qwen-Image 等更大的 20B 级别系统相当的文本渲染质量,在文本场景中与 GPT4o 等领先的闭源模型具有竞争力
- 文本密集型提示词的高保真度:擅长处理需要语言内容与渲染排版紧密对齐的提示词(如海报、横幅、标志、UI 模型、信息图表)
- 精准的双语文本渲染:在各种字体、大小和宽高比下,生成清晰、拼写正确且语义一致的中英文文本
- 高效且易于部署:可在单个高端 GPU 上运行,内存需求适中,支持低延迟交互使用
相关链接:
Ovis-Image 文生图工作流
下载 JSON 工作流文件
在 ComfyUI Cloud 上运行
模型链接
text_encoders(文本编码器)
diffusion_models(扩散模型)
vae
模型存储位置
