添加图片注释,不超过 140 字(可选)

更多AI前沿科技资讯,请关注我们:

closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

【closerAI ComfyUI】太棒了!超高速修图解决方案!IC-Edit+nunchaku应该是目前图像编辑领域最优解!冲!

大家好,我是Jimmy。随着生成式AI的快速发展,基于自然语言指令的图像编辑技术成为数字创作领域的核心需求。然而,现有方法在精度与效率之间始终存在难以调和的矛盾:

  • 传统微调方法依赖海量数据和算力,训练成本高昂;
  • 零样本编辑技术(如Prompt-to-Prompt)则受限于指令理解能力和编辑质量。

浙江大学与哈佛大学联合团队针对这一痛点,提出ICEdit(In-Context Edit)框架,通过融合大规模扩散变换器(Diffusion Transformer, DiT)的生成潜力与上下文感知机制,实现了轻量化、高精度、强泛化的图像编辑解决方案。

ICEdit:基于大规模扩散变换器的上下文图像编辑框架

——开启高效精准的AI图像编辑新时代

添加图片注释,不超过 140 字(可选)

论文地址:https://river-zhang.github.io/ICEdit-gh-pages/

项目仓库:https://github.com/River-Zhang/ICEdit?tab=readme-ov-file

模型下载地址:https://huggingface.co/sanaka87/ICEdit-MoE-LoRA

ICEdit的核心创新

1. 上下文驱动的零样本编辑范式

ICEdit摒弃传统模型微调模式,直接利用扩散变换器(DiT)的上下文感知能力完成编辑任务:

  • 输入形式:用户仅需提供原始图像与自然语言指令(如“将背景改为夜晚”),模型通过双联图像对(源图+目标图)的上下文提示生成编辑结果。
  • 技术优势:无需修改网络结构,避免重复训练,显著降低计算开销。

2. LoRA-MoE混合调优策略

为实现高效参数适配,ICEdit采用低秩适配器(LoRA)与混合专家网络(MoE)的协同机制:

  • LoRA适配:仅用1%可训练参数(约2亿参数量)实现局部更新,相比全量微调节省99%算力;
  • 动态路由机制:通过MoE网络动态激活任务特定专家模块,提升复杂编辑任务的鲁棒性。
  • 数据效率:仅需5万张公开数据集(0.1%常规训练量)即可达到SOTA性能。

3. 推理时缩放策略(Early Filter Scaling)

在生成过程中,ICEdit引入视觉-语言模型(VLM)对初始噪声进行筛选:

  • 早期优化:通过VLM评估初始噪声的语义一致性,选择高质量噪声作为生成起点;
  • 效果提升:显著减少迭代次数,加速收敛,单图处理时间压缩至约9秒(同类方法需数十秒至数分钟)。
添加图片注释,不超过 140 字(可选)

应用场景与价值

ICEdit凭借其高效性与灵活性,可广泛应用于以下领域:

  • 创意设计:快速生成插画、海报、动漫角色;
  • 影视制作:智能修复画面瑕疵、调整场景光照与构图;
  • 社交媒体:用户一键美化照片、创作个性化头像;
  • 工业设计:辅助产品设计迭代与可视化原型生成。

项目意义与未来方向

ICEdit通过轻量化设计与上下文感知技术,重新定义了图像编辑的效率边界:

  • 学术贡献:首次验证大规模扩散模型在零样本编辑中的潜力,为AIGC研究开辟新路径;
  • 产业价值:为边缘设备部署(如手机端实时修图)提供技术可行性;
  • 未来规划:扩展多模态支持(如视频编辑)、优化长文本指令处理能力。
添加图片注释,不超过 140 字(可选)

ICEdit在comfyUI中的实现

下载官方LORA:439MB

添加图片注释,不超过 140 字(可选)

这个官方的LORA,大概率是运行不起来的,因为它是

但社区中有大神已做了调整,提供了两个版本的优化后的LORA:

https://huggingface.co/aha2023/average_MOE_ICEdit-MoE-LoRA/tree/main

添加图片注释,不超过 140 字(可选)

如上图示,上面一个是适用于与nunchaku一起加载使用的。下面是优化后的。如果搭配错误会报错。

我们基于这些内容,closerAI团队搭建了closerAI nunchaku+ICEdit图像编辑工作流,这是nunchaku加持下的高速编辑工作流。如果不想使用nunchaku,直接使用unet加载器,加载fill模型。

以下是closerAI nunchaku+ICEdit图像编辑工作流全貌:

添加图片注释,不超过 140 字(可选)

工作流思路:

1)先进行图像处理:组合图像与遮罩图,用于fill重绘

添加图片注释,不超过 140 字(可选)

2)nunchaku的设置如图示:

添加图片注释,不超过 140 字(可选)

加载LORA:使用其它会报错。用截图这个。

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

主要是以上的板块。

然后我们加入了三种放大方式:模型放大、upscaler放大和kl_optimal修复放大。人物有时候会变化,用kl_optimal放大后换脸

以下是测试ICEdit的图像编辑能力结果:

1、戴上墨镜:

添加图片注释,不超过 140 字(可选)

2、衣服换成绿色:

添加图片注释,不超过 140 字(可选)

3、换成吉卜力风格:

添加图片注释,不超过 140 字(可选)

4、改物体:手里拿着榴莲

添加图片注释,不超过 140 字(可选)

5、换衣服:换成牛仔外套

添加图片注释,不超过 140 字(可选)

还能编辑以下内容,这里不展开了:

编辑任务提示词,例如转换风格、修改服装颜色、增加装饰等。

示例:

风格转换:convert the image into anime illustration

更一致的风格转换,增加对原图的描述:convert the image into anime illustration and maintain shirt be pink,hair be brown,

修改服装颜色:change the pink shirt to blue shirt

修改服装类型:change the pink shirt to blue suite

小幅度修改姿态:make the girl eyes closed

修改物品:change the glasses to sunglasses

增加物品:This girl wears a white watch

移除物品:remove picture on the wall

去除文字:remove the text "from aha"

去除水印:remove the white watermark

增加水印:add a blue watermark "from aha" on the wall

修改背景:girl is on the beach,colorful cloud in the sky

本地算力不够怎么办?

如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

添加图片注释,不超过 140 字(可选)

runninghub.cn IC-Edit图像编辑(稳定\高效)体验地址:

https://www.runninghub.cn/ai-detail/1919022587660140546

注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151

通过这个链接第一次注册送1000点,每日登录送100点


最后几句:

IC-Edit图像编辑提供了一个高效、轻量的解决方案,结合Nunchaku,实现超高速的P图,同时达到很好的效果,相信这是目前图像编辑的最优解,当然也有提升空间。

以上是Ic-Edit图像编辑的介绍、安装与体验,以及closerAI团队制作的stable diffusion comfyUI closerAI nunchaku+ICEdit图像编辑工作流介绍,大家可以根据工作流思路进行尝试搭建。

当然,也可以在我们closerAI会员站上获取对应的工作流(查看原文)

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:JimmyMo

更多AI前沿科技资讯,请关注我们:

closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

添加图片注释,不超过 140 字(可选)
隐藏内容
本内容需权限查看
  • 普通用户: 99.9金币
  • VIP会员: 免费
  • 永久会员: 免费

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。