添加图片注释,不超过 140 字(可选)

更多AI前沿科技资讯,请关注我们:

【closerAI ComfyUI】太强了!Gemini Flash 2.0 Exp插件,在comfyUI也能使用多模态的功能!

大家好,我是Jimmy。昨天刚介绍完ComfyUI-Gemini-API:【closerAI ComfyUI】最强王炸!谷歌AI绘画三件套,Gemini+whisk+imageFX的最强组合,收藏学习!实现图像编辑功能。

但开源就是有一个好处,百花齐放,国外另一个大佬将Gemini Flash 2.0网页版的所有功能迁移至comfyUI中,开发了:Gemini Flash 2.0 Exp插件,集成了Google的Gemini Flash 2.0实验模型,可以直接在ComfyUI工作流中对文本、图像、视频帧和音频进行多模式分析。

事先说明:本教程重在分享前沿知识,请大家根据自身情况来搞不要做不合规的事情。

一、Gemini Flash 2.0 Exp节点

Comfyui节点:https://github.com/ShmuelRonen/ComfyUI-Gemini_Flash_2.0_Exp

添加图片注释,不超过 140 字(可选)

功能如下:

1)多模式输入支持:

  • 文本分析
  • 图像分析
  • 视频帧分析
  • 音频分析

2)可使用gemini-2.0-flash-exp-imag-generation模型生成图像

3)具有对话历史记录的聊天模式

4)使用智能音频记录器节点进行语音聊天

5)结构化输出选项

6)温度和令牌限制控制

7)代理支持

安装与API获取

安装也很简单,下载解压,放置comfyUI节点文件夹中。

添加图片注释,不超过 140 字(可选)

重启。

其次,要申请好密钥:需要魔法的。

API获取:https://aistudio.google.com/apikey?hl=zh-cn

然后重启后在comfyUI中拖入工作流。

在节点中填写API。

测试体验

1、分析图像

添加图片注释,不超过 140 字(可选)

输入一张图,

添加图片注释,不超过 140 字(可选)

输入类型选择图像,模型版本选flash模型,操作模式选择分析

添加图片注释,不超过 140 字(可选)

提示词写:请详细描述提供的图像

以下返回结果:

这是图像的详细描述:
**总体印象:**
该图像是一个以动漫风格的年轻女子的数字插图,非常重视绿色调色板。背景充满了各种以绿色为主题的物体,创造了一种有趣而有凝聚力的美学。
**主要主题:**
***外观:**这个女人的皮肤白皙,大,富有表情的绿眼睛,短而深绿色的头发,饰有辫子。她的表达严重或中立。
***衣服:**她穿着黑色衬衫在图案上,绿叶和水果。她还有一条螺丝式项链。
***配饰:**她戴着圆形,绿色眼镜和以水果为主题的耳环。她有一个红色的头发夹。
***姿势:**她的左手拿着绿色iPhone,部分遮盖了她的身体。
**背景元素:**
背景充满了卡通绿色物体,包括:
*各种水果(苹果,酸橙)
*   树叶
*几何形状
*其他抽象的绿色设计
**调色板:**
主要颜色为绿色,整个图像中都使用各种阴影和色调。红色重音很少用于增加对比度。
**风格:**
插图风格让人想起动漫或漫画,具有干净的线条,鲜艳的色彩和夸张的功能。

反推得非常详细,我们也为了验证它的反推效果,我们将它放进imageFX 工作流中测试生图:

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

非常棒,基本八九不离十的重绘了。非常棒!而且因为调用免费API,速度快!

添加图片注释,不超过 140 字(可选)

2、图像编辑

支持多图输入,文本描述进行图像编辑。

添加图片注释,不超过 140 字(可选)

输入两张图:一张人物图,一张服饰图。我们让人物穿上对应服饰。

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

以下是结果:

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

效果也不错,人物和服饰都有 一点的控制。虽然控制能力还行。但已经是很高效地完成绝大部分任务了。

添加图片注释,不超过 140 字(可选)

它还能理解视频与音频,这里就不展开了,因为AI绘画中,我们主要是要它图像反推的能力即可。大家感兴趣的也可以玩玩。


本地算力不够怎么办?

如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn,

添加图片注释,不超过 140 字(可选)

runninghub.cn工作流地址:https://www.runninghub.cn/post/1899683017957265409

体验地址:https://www.runninghub.cn/ai-detail/1899689506537164801

通过上面链接第一次注册送1000点,每日登录送100点


结论

不用多说,这已经是目前最强的组合的生产力工具了。

以上是closerAI团队制作的stable diffusion comfyUI closerAI开发的closerAI定制创意写真+卡通贴纸风格照片工作流介绍,大家可以根据工作流思路进行尝试搭建。

当然,也可以在我们closerAI会员站上获取对应的工作流(查看原文)。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:JimmyMo

更多AI前沿科技资讯,请关注我们:

添加图片注释,不超过 140 字(可选)
隐藏内容
本内容需权限查看
  • 普通用户: 99.9金币
  • VIP会员: 免费
  • 永久会员: 免费

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。