更多AI前沿科技资讯,请关注我们:
【closerAI ComfyUI】指令式图像编辑的新尝试:解析小红书开源模型 FireRed-Image-Edit

大家好,我是Jimmy。
在 AIGC 领域,“文生图”已经非常成熟,但如何对已有图像进行“精细化、指令化”的修改,依然是开源界的一个难题。
2月14日,小红书超智能团队(Super Intelligence Team)开源了其图像编辑模型 FireRed-Image-Edit。官方文档显示,该模型在保持图像一致性和文本渲染方面做了针对性优化,并在多个公开 Benchmark 中取得了不错的评测成绩。
项目地址:https://github.com/FireRedTeam/FireRed-Image-Edit
模型下载:https://huggingface.co/FireRedTeam/FireRed-Image-Edit-1.0

01. FireRed-Image-Edit技术背景:从全局生成到局部推理
传统的图像编辑模型在执行“局部修改”时,往往容易造成非目标区域的语义漂移(例如修了衣服,背景却变了)。
FireRed-Image-Edit 引入了名为 FireEdit 的架构,其核心是区域感知(Region-aware)机制。通过视觉语言模型(VLM)与扩散模型的结合,系统尝试在理解用户指令的同时,更精准地锁定需要编辑的空间坐标。这种设计旨在解决复杂指令下,局部修改与全局画面和谐度之间的平衡问题。

02. 官方披露的三大核心特性
根据 GitHub 仓库的介绍,该模型主要在以下几个维度发力:
- 文本样式保持: 针对 AI 绘图中常见的“文字崩坏”问题,模型采用了布局感知 OCR 奖励机制。据官方数据,它在处理海报、书封等包含特定文字样式的编辑任务时,能较好地保持原有的字体风格与排版逻辑。
- 多图融合与应用场景: 除了基础的属性修改,模型还展示了在“虚拟试穿”和“多图引用融合”方面的潜力,试图通过自然语言指令实现复杂的视觉变换。
- 图像修复能力: 整合了针对旧照片修复与高清增强的逻辑,利用扩散模型的先验知识补全画面细节。

03. 评测表现:官方榜单数据参考
虽然实际落地效果仍需社区进一步验证,但根据官方公布的 Benchmark 数据,FireRed-Image-Edit 展现了较强的竞争:
- ImgEdit & GEdit: 在官方提供的对比数据中,该模型在指令遵循(Action)和文本处理(Text)等维度上,成绩优于不少现有的开源方案。
- REDEdit-Bench: 这是研发团队随模型一同提出的评测基准,包含 1,673 对中英双语指令,涵盖了从低级属性到高级语义的 15 个细分任务。

04. 部署与开源生态
对于开发者而言,FireRed-Image-Edit 的落地门槛相对务实:
- 开源协议: 遵循 Apache 2.0 协议,代码与模型权重(1.0版本)均已开放下载。
- 硬件兼容: 支持 torch.bfloat16 推理。根据社区测算,通过 4-bit 量化,该模型有望在 16GB 甚至更低显存的消费级显卡上运行。
- 生态联动: 它是小红书“FireRed”全媒体套件(涵盖 ASR、TTS、视频创作)的一员,显示了该团队构建全链路 AI 内容生产工具的意图。
官方的展示:
- 创意场景

- 文本场景:

换装

结语
FireRed-Image-Edit 的开源,为指令式图像编辑提供了一个新的观察样本。它在文本对齐和局部控制上的技术路径是否能经受住复杂实战场景的考验,还有待更多开发者的真实测试反馈。
目前,该项目的模型权重已在 Hugging Face 上线,感兴趣的同学可以前往官方仓库了解更多技术细节。
分镜我在RH上也有应用可以去尝试生成然后在即梦中生成视频。同时,RunningHub 刚开启了 2026「骏马新程」创作者大赛,奖池有 2.5W。更多大赛详情可以看这里:https://tcn73taga4ku.feishu.cn/wiki/XckBwAIJyiHwo3kypwxcZr8anhb
本地算力不够怎么办?
如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

NanoBanana Pro分镜图应用体验地址:
https://www.runninghub.cn/ai-detail/1998278644248272898
注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151
通过这个链接第一次注册送1000点,每日登录送100点
最后几句:
如果对你有帮助,请一键三连支持下我,感谢
CloserAI 3D Pose Editor:http://aigc.douyoubuy.cn/2025/12/03/3448/ closerAI-nanoPrompts: http://closerai.douyoubuy.cn/2025/11/24/3396/ closerAI 分镜设计 软件(exe)本地运行版closerAI 分镜设计 软件(exe)本地运行版 操作说明文档以下是closerAIwater节点:closerAIsorawater Sora 水印移除 ComfyUI 节点分镜分词器节点:closerAI分词器节点说明json结构化提示词 http://aigc.douyoubuy.cn/2025/11/05/3242/
更多资讯也可以在我们closerAI会员站上获取(查看原文)。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:JimmyMo
更多AI前沿科技资讯,请关注我们:

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)