ERNIE-Red-Mix(红潮 ERNIE 版) 是基于百度 ERNIE-Image(80 亿参数的 DiT 架构)进行深度微调后的版本。相比于原生模型,它的核心亮点主要体现在生成效率指令遵循以及商业设计三个维度。

以下是该模型的具体亮点汇总:

1. 极致的生成效率与低门槛

  • 10步极速成像:经过微调优化,该模型在 CFG = 1 的设置下,仅需 10 步即可输出高质量图像。这显著降低了等待时间,非常适合快速迭代原型。
  • 显存友好:模型支持混合精度,对于 8GB - 12GB 显存的消费级显卡(如 RTX 4060 Ti 等系列)非常友好,能够流畅运行。
  • 推荐参数:采样器推荐使用 Euler / DEIS,调度器选择 Simple

2. 强大的结构化创作与文本能力

  • 保留文本渲染:该版本在微调过程中特意保留了 ERNIE 原本强大的文本渲染能力。在生成海报、信息图、UI 界面等含有文字的场景时,表现优于许多同类模型。
  • 结构化输出:在处理海报设计、漫画分镜、故事板等具有明确排版逻辑的任务时,稳定性和准确度更高。
  • 复杂指令遵循:能够可靠地处理包含多个对象和复杂逻辑的提示词,不易出现漏掉关键描述的情况。

3. RedCraft 专有数据集微调

  • 风格扩展与去限制:采用了 RedCraft 混合精度 SFT(监督微调) 算法,不仅提升了美学表现(尤其是摄影类质感),还在一定程度上解除了原生模型的指令生成限制,创作自由度更高。
  • 多语言支持:原生支持中文、日文、繁体中文等多种语言的指令输入,对中文语境的理解更加自然。

4. 关键技术规格

特性详情
基础架构8B DiT (Diffusion Transformer) + 轻量级提示增强器
下载大小FP8 版本约 9.9 GB
适用环境完美适配 ComfyUI(网页中提供了专门的简单工作流 .json 文件)
主要用途摄影写实、艺术设计、商业海报、二次元插画

[!CAUTION] 使用注意事项

  • 肢体缺陷:这是 ERNIE 架构的一个已知短板,复杂肢体容易出现伪影,建议通过多次采样(Generate More)或局部重绘解决。
  • 混合精度的权衡:虽然混合精度能节省显存,但对微小文字的渲染会有一定负面影响。如果任务对文字精度要求极高,建议使用 BF16 Base 版本。

从社区反馈来看,这个模型被认为非常适合作为“接力采样”的一环:利用 ERNIE 优秀的皮肤质感和设计感进行初步生成,再结合其他模型进行细节修复。

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。