ERNIE-Red-Mix(红潮 ERNIE 版) 是基于百度 ERNIE-Image(80 亿参数的 DiT 架构)进行深度微调后的版本。相比于原生模型,它的核心亮点主要体现在生成效率、指令遵循以及商业设计三个维度。
以下是该模型的具体亮点汇总:
1. 极致的生成效率与低门槛
- 10步极速成像:经过微调优化,该模型在 CFG = 1 的设置下,仅需 10 步即可输出高质量图像。这显著降低了等待时间,非常适合快速迭代原型。
- 显存友好:模型支持混合精度,对于 8GB - 12GB 显存的消费级显卡(如 RTX 4060 Ti 等系列)非常友好,能够流畅运行。
- 推荐参数:采样器推荐使用 Euler / DEIS,调度器选择 Simple。
2. 强大的结构化创作与文本能力
- 保留文本渲染:该版本在微调过程中特意保留了 ERNIE 原本强大的文本渲染能力。在生成海报、信息图、UI 界面等含有文字的场景时,表现优于许多同类模型。
- 结构化输出:在处理海报设计、漫画分镜、故事板等具有明确排版逻辑的任务时,稳定性和准确度更高。
- 复杂指令遵循:能够可靠地处理包含多个对象和复杂逻辑的提示词,不易出现漏掉关键描述的情况。
3. RedCraft 专有数据集微调
- 风格扩展与去限制:采用了 RedCraft 混合精度 SFT(监督微调) 算法,不仅提升了美学表现(尤其是摄影类质感),还在一定程度上解除了原生模型的指令生成限制,创作自由度更高。
- 多语言支持:原生支持中文、日文、繁体中文等多种语言的指令输入,对中文语境的理解更加自然。
4. 关键技术规格
| 特性 | 详情 |
|---|---|
| 基础架构 | 8B DiT (Diffusion Transformer) + 轻量级提示增强器 |
| 下载大小 | FP8 版本约 9.9 GB |
| 适用环境 | 完美适配 ComfyUI(网页中提供了专门的简单工作流 .json 文件) |
| 主要用途 | 摄影写实、艺术设计、商业海报、二次元插画 |
[!CAUTION] 使用注意事项
- 肢体缺陷:这是 ERNIE 架构的一个已知短板,复杂肢体容易出现伪影,建议通过多次采样(Generate More)或局部重绘解决。
- 混合精度的权衡:虽然混合精度能节省显存,但对微小文字的渲染会有一定负面影响。如果任务对文字精度要求极高,建议使用 BF16 Base 版本。
从社区反馈来看,这个模型被认为非常适合作为“接力采样”的一环:利用 ERNIE 优秀的皮肤质感和设计感进行初步生成,再结合其他模型进行细节修复。
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)