更多AI前沿科技资讯,请关注我们:closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台
【closerAI ComfyUI】超强!神秘开源模型boogu:图像生成与图像编辑的黑马!性能直逼闭源产品!不玩虚的,一次性开源base、turbo、edit!

大家好,我是Jimmy。端午节祝各位端午安康。
这期分享一个这几天重磅发布的一个神秘模型,以黑马形态出现在开源界中,没有铺天盖地的营销,没有大厂背书,但在 Hugging Face 上短短几天就引起了轰动。它的模型家族——Boogu-Image-0.1,以 Apache-2.0 开源协议全量开放,号称"在训练数据量比现有开源模型少一个数量级的情况下,依然打到了第一梯队"。
今天,咱们就来好好聊聊这个来头不小的新项目。
一、Boogu 到底是什么?
一句话概括:Boogu-Image-0.1 是一个统一的图像生成与编辑模型家族。
它不是某一个单一模型,而是一个"全家桶"——包含 Base、Turbo、Edit 三个核心变体,全部基于 100 亿参数 的统
一架构,采用联合训练(Joint Training)方式打造。

- Base — 高画质、高多样性,适合微调与下游开发
- Turbo — 仅 3~4 步推理,极速照片级生成
- Edit — 自然语言指令驱动图像编辑
- FP8 量化版 — 降低显存需求,适配消费级显卡
Boogu 团队的核心思路很朴素:闭源系统(比如 GPT-Image-2、Nano Banana Pro)之所以强,不是因为某一个模型有多神奇,而是整个系统高度统一。他们在训练算力极其有限的情况下,用更小的数据量、更好的数据质量、更系统的训练方法,做出了一个有竞争力的开源方案。
二、全家桶拆解:Base / Turbo / Edit
🔵 Base —— 全能基石
Base 是 Boogu 的"根模型",也是 Turbo 的基础。它特别擅长超密集文字渲染——海报、文档、UI 界面里塞上上百个中文字符,它也能稳稳 hold 住。

🟢 Turbo —— 4 步速成
Turbo 是 Boogu 最引人注目的变体。它通过 Decoupled DMD 蒸馏技术,将原本需要 25~50 步的 Base 压缩到了 4 步。参数量不变,速度翻了十倍以上。
💡 在高配硬件上,单次推理可以控制在 1 秒以内。对于追求效率的用户来说,这几乎就是"即说即出"的体验。
🟡 Edit —— 图像编辑
Edit 支持自然语言指令驱动的图像编辑,从局部调整到创意改写都能胜任。它目前聚焦于摄影类编辑场景,在多参考图、大幅度视角变化等复杂场景下还在打磨中。
三、核心亮点:它到底强在哪?
📝 中英文双语文字渲染
这是 Boogu 最突出的差异化能力之一。实测中,早餐摊招牌、公告栏大字、段落手写体这些场景,Boogu 的文字准确率明显优于同类模型。
文字渲染 ██████████████████░░ 88%%
照片写实 ████████████████░░░░ 82%%
风格多样 ████████████████░░░░ 78%%

🏆 性能排名:开源里的佼佼者
在 Qwen-Image-Bench 评测中:
| 模型 | 参数 | 总分 | 评级 |
|---|---|---|---|
| GPT Image 2 | 闭源 | 64.69 | 👑 |
| Nano Banana 2.0 | 闭源 | 59.82 | ⭐ |
| Boogu-Image-0.1 | 10B | 53.58 | 🥇 |
| Qwen Image 2512 | 20B | 52.06 | 🥈 |
| Hunyuan-Image-3.0 | 80B | 50.81 | 🥉 |
Boogu-Image-0.1 以 10B 参数 击败了 20B 和 80B 的模型,在参数量上不到对手的零头,成绩却排在了开源模型的第一名。
四、为什么值得关注?
- 开源生态的一剂强心针 — Apache-2.0 协议,免费商用,可自由微调
- "小数据高质量"范式 — 数据量少一个数量级,照样能打
- 统一架构示范 — 生成+编辑一套底座,未来趋势
- 中文创作者友好 — 双语文字渲染,海报设计刚需
五、诚实地说:它还不够完美
⚠️ 该模型以研究目的发布,未经额外安全措施不建议直接用于生产环境。
| 局限项 | 说明 |
|---|---|
| 🌍 世界知识 | 名人、地标、复杂常识理解仍落后于顶级闭源模型 |
| 🖼️ 编辑一致性 | 多图参考、身份保持、精细编辑还不够稳定 |
| 📐 细节伪影 | 受限于 FLUX.1 VAE,小人脸、小肢体可能出现伪影 |
| 🔤 语言限制 | 文字渲染主要针对中英文,其他语言效果退化 |
| 💾 硬件门槛 | 10B 参数,12GB 起步,推荐 24GB+ |
comfyUI中的实现
目前comfyUI官方快速支持,我们需要更新comfyUI版本,
comfyUI官方仓库:https://huggingface.co/Comfy-Org/Boogu-Image,下载后这样放置:

同时社区已有GGUF量化模型,以下实现是基于GGUF的工作流实现。
GGUF模型直接通过以下链接下载:

这里测试我使用Q4版的turbo模型,4步加速的模型,
搭建文生图工作流如下:

这是文生图模型,不要接入comfyUI官方提供加速LORA,如果要使用这个LORA,则需要与base模型一起使用。
以下是Boogu turbo 4步加速工作流效果:
提示词:时尚杂志编辑风格的时髦中国女模特肖像,皮肤光洁,颧骨分明,身穿黑色结构化西装外套内搭白衬衫,自信地摆姿势,背景为极简主义的灰色混凝土墙。工作室灯光,强烈的阴影,大胆的眼神接触,现代都市气息,《Jimmy》杂志风格,锐利细节,单色美学带有微妙的色彩点缀。

提示词:可爱中国女孩的随性生活照,带着明亮自然的微笑,身穿休闲棉质连衣裙,坐在晴朗天空下的草坡上。黄金时刻光线,暖色调,胶片颗粒质感,富士胶片色彩科学,轻松快乐的氛围,树木的柔焦背景,真实的美,无浓妆,35mm摄影风格。

提示词:赛博朋克风格的中国美女肖像,五官立体,穿着未来感的透明科技外套和发光的霓虹配饰,站在夜晚新上海潮湿的街道上。鲜艳的粉色和青色霓虹灯光在湿润的地面上反射,雨滴,强烈的凝视,带有银色高光的前卫妆容,超精细,Octane渲染,体积光,戏剧性氛围。

搭建图像编辑工作流如下:大家按以下自己搭建就是。

提示词:将衣服修改成红色,戴上白色帽子


七、总结
Boogu-Image-0.1 的出现,给开源图像生成领域注入了新的活力。
它不是完美的——10B 参数的模型不可能打败 80B 的闭源巨无霸。但它证明了:在合理的数据策略和训练方法下,小参数模型同样可以打出竞争力。对于中文创作者来说,Boogu 的双语文本渲染能力尤其实用。对于 ComfyUI 玩家来说,官方的节点支持来得又快又稳,上手几乎没有门槛。
地址:https://aigc.douyoubuy.cn/2026/06/19/421276/
会员小伙伴可在小站上下载本期工作流、优化节点、模型。
我在RH上发布了应用,大家可以上去体验下
本地算力不够怎么办?
如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

Ideogram4_图生图应用体验地址:
注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151
通过这个链接第一次注册送1000点,每日登录送100点
最后几句:
如果对你有帮助,请一键三连支持下我,感谢!以下是小站主流的一些AI工具应用:
- CloserAI AI短剧工作台(本地化解决方案) https://aigc.douyoubuy.cn/ai-agent/
- closerAI FlowStudio本地AIGC无限画布创作工具 https://aigc.douyoubuy.cn/closerai-flowstudio/
- closerAI AI绘画大师万象视界: https://aigc.douyoubuy.cn/closerai-vision/
- CLOSERAI POD电商印花批量生产工作站: https://aigc.douyoubuy.cn/?page_id=420541
- 印花提取: https://aigc.douyoubuy.cn/yinhua/
以上是就是本期的分享,当然,更多工作流、资讯、插件、工具也可以在我们closerAI会员站上获取(查看原文)。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:JimmyMo
更多AI前沿科技资讯,请关注我们:https://aigc.douyoubuy.cn/

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)