
更多AI前沿科技资讯,请关注我们:
【closerAI ComfyUI】模糊图像救星!CoZ技术实现64倍无损放大!Chain-of-Zoom:基于尺度自回归与偏好对齐的极端超分辨率技术!超赞技术!
大家好,我是Jimmy。超分辨率(Single Image Super-Resolution, SISR)是计算机视觉领域的重要研究方向,旨在从单张低分辨率图像中重建出高分辨率图像,提升图像的细节和清晰度,具有极大的价值和意义。特别是在医学影像(提升 CT/MRI 分辨率)、遥感图像(卫星图像细节增强)、监控视频(人脸识别细节优化)、手机摄影(数字变焦后的画质修复)、老照片 / 视频修复(复古内容高清化)……
Chain-of-Zoom项目的提出就是解决目前SISR存在缺陷,实现16~64倍的放大!目前已在github上开源,本地部署24G显存可玩。但暂无comfyUI实现,可在体验网站体验,附在文末位置。下面我们先看下它的效果,再介绍下它。
Chain-of-Zoom——基于尺度自回归与偏好对齐的极端超分辨率技术
Chain-of-Zoom (CoZ) 是由 Bryan Sangwoo Kim、Jeongsol Kim 和 Jong Chul Ye 团队提出的创新框架,旨在解决单图像超分辨率(SISR)任务中的两大核心问题:
- 跨尺度泛化性不足:传统模型在超出训练范围的放大倍数下易产生模糊和伪影;
- 计算成本高:为更高分辨率重新训练模型效率低下。
CoZ 通过模型无关的自回归链式推理,将超分辨率分解为多步中间尺度状态,结合多尺度感知的文本提示,实现无需重新训练的极端分辨率提升(如16倍以上)。其核心思想是通过重复调用基础SR模型,逐步细化图像,并利用视觉语言模型(VLM)生成的文本提示引导生成质量。实验表明,标准的4倍扩散SR模型包裹在CoZ达到超过256倍的放大,具有高的感知质量和保真度。

技术亮点
- 尺度自回归链(Autoregressive Chain) 将高倍超分辨率分解为多个低倍子任务,递归应用基础模型(如Stable Diffusion 3),避免直接训练高倍模型。支持两种推理模式:recursive_multiscale(多尺度递归)和recursive_fixed(固定尺度递归)。
- 多尺度感知提示(VLM Prompting): 使用微调的视觉语言模型(如Qwen2.5-VL-3B)分析图像内容,生成描述性文本提示,弥补高倍放大时的视觉信息丢失。通过GRPO(Group Relative Preference Optimization)与批评家VLM对齐人类偏好,优化提示质量。
- 高效内存管理: 支持单GPU(24GB VRAM)运行,但推荐双GPU以提升速度(通过--efficient_memory参数启用内存优化)。



部分实验结果展示如下:

体验
目前可以在抱脸上体验,体验地址:https://huggingface.co/spaces/alexnasa/Chain-of-Zoom

我加载了一张图。

通过两倍放大。

能够修复放大到裤子的细节。
目前,它是没有comfyUI中的实现节点。希望后续社区有大神能支持。但关于放大。同样的我们可以使用SUPIR来放大。它是KJ大神实现的comfyUI节点:
https://github.com/kijai/ComfyUI-SUPIR
仓库中有模型下载的链接。安装过程不再展开讲。
下面的基于SUPIR的放大工作流。我建议大家是在线上去体验了。对设备要求高,24G是最好。16G是勉强玩这个。
下面是closerAI SUPIR放大工作流:


节点很简单,加载图像,选择放大模型和SDXL模型。

点击执行:

本地算力不够怎么办?
如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

runninghub.cn suspir 超级高清4K放大流体验地址:
https://www.runninghub.cn/ai-detail/1929389231452405761
注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151
通过这个链接第一次注册送1000点,每日登录送100点
最后几句:
目前项目刚开源但作为高清放大的一个新技术,是通过VLM视觉模型来作指引的,看是否能引起社区大神们的关注在comfyUI中实现,目前是24G显存可玩,以下相关链接:
论文:https://bryanswkim.github.io/chain-of-zoom/
体验地址:https://huggingface.co/spaces/alexnasa/Chain-of-Zoom
Github:https://github.com/bryanswkim/Chain-of-Zoom
以上Chain-of-Zoom基于尺度自回归与偏好对齐的极端超分辨率技术的介绍与分享,以及体验。以及closerAI团队制作的stable diffusion comfyUI closerAI搭建的closerAI supirl图像放大工作流的介绍,大家可以根据工作流思路进行尝试搭建。
当然,也可以在我们closerAI会员站上获取对应的工作流(查看原文)。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:JimmyMo
更多AI前沿科技资讯,请关注我们:

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
评论(0)