添加图片注释,不超过 140 字(可选)

更多AI前沿科技资讯,请关注我们:

closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

【closerAI ComfyUI】最强开源3D生成模型!腾讯混元3D模型迎来重大更新!V2版本更精细,3D效果再次提升?!

大家好,我是Jimmy。前几期我们也有介绍过一个3d生成模型。Triple 3d,那这个项目当时我们是介绍使用它的一个API来实现3d生成的

【closerAI ComfyUI】这个工作流太惊艳了,真人转3D形象,几分钟就能生成3D模型,可玩性高,建议收藏学习

因为最近腾讯混元3d模型又迎来了第2个版本更新,这次我们的3D工作流使用它来看一下效果。这不详细介绍混元3D了。以下是官方项目链接,以及KJ版本的comfyUI中的实现节点。

腾讯混元3D模型V2版本

代码仓库:https://github.com/tencent/Hunyuan3D-2

模型权重:https://huggingface.co/tencent/Hunyuan3D-2demo

页面:https://huggingface.co/spaces/tencent/Hunyuan3D-2

网站:https://3d.hunyuan.tencent.com/

comfyUI的KJ版实现:

https://github.com/kijai/ComfyUI-Hunyuan3DWrapper

主模型页:https://huggingface.co/Kijai/Hunyuan3D-2_safetensors(放置位置:ComfyUI\models\diffusion_models)

delight模型和paint模型下载页:https://huggingface.co/tencent/Hunyuan3D-2/tree/main(放置位置:ComfyUI\models\diffusers)

为什么使用KJ版的呢?因为它整合了生成白模、打光、多视图、材质于一体的实现。官方最近几天也在更新它,也支持了混元3D。但是官方啊,只能实现单张图片生成3D白模没有材质,以及三视图生成3D白模,同样也没有材质生成。但是它的速度是真的快。但距离我们真正使用还差一点,还得再等等。

以下是基于KJ版的混元3D开发的工作流。这里实现了照片转3D,3D图生成3D建模模型。

以下是closerAI搭建的基于混元3D的图片转3D模型工作流全貌

添加图片注释,不超过 140 字(可选)

工作流的思路:首先,加载一张照片,将真人照片转化成高保真的3D风格,并保持人物脸部特征一致性,同时接入混元3D生成带材质的3D模型。

工作流主要功能:3D化,生成立体3D模型

工作流主要分两个部分来实现,以下是第一部分:

添加图片注释,不超过 140 字(可选)

我们先们3D形象化的工作流程。首先加载一张真人照片,先要过白底的预处理。当然如果背景不复杂也可以保留不作白底处理。因为在后面生成3D模型的流程中,还会对背景进行一个去除。

添加图片注释,不超过 140 字(可选)

得出白底图后,进行提示词反推和提示词组合:如下图示

添加图片注释,不超过 140 字(可选)

为了保持人物相似性,加入pulid flux模块

添加图片注释,不超过 140 字(可选)

然后是FLUX生图啦。这个过程中加入了sageattention+Teacache进行加速。步数设置成了28步.

以下是加载的图像。

添加图片注释,不超过 140 字(可选)

经过处理后,生成3D形象。

添加图片注释,不超过 140 字(可选)

这里第一部分已完成。

第二部分工作流是就是将上面生成的3D形象,进行混元3D的生成。

添加图片注释,不超过 140 字(可选)

首先,第一步还是去背景。这里提供了两种去背景并生成蒙版的节点。建议是第一种,第二种看情况使用吧。有时候有些图就是会把人脸也去掉。看情况选择吧。

添加图片注释,不超过 140 字(可选)

然后通过混元3D V2模型生成白模:

添加图片注释,不超过 140 字(可选)

然后执行重打光:

添加图片注释,不超过 140 字(可选)

多视角的法线图的生成:

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

然后生成材质并贴上白模

添加图片注释,不超过 140 字(可选)

生成最后结果:

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

只能说结果是生成了个大概。人物脸部细节不够。

我猜有可能是人物在图像中占比太小的原因,导致人物脸部最后得到的细节不够。我要再搞一次。

先转成3D模型:这里转为更为3D化的形象。

添加图片注释,不超过 140 字(可选)

截图一下:

添加图片注释,不超过 140 字(可选)

再来:

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

这么搞,效果好多了。

我们直接再去它官网上试试,在线生成:

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

好吧,得出的结果比comfyUI中的实现的还要精细。我们能清楚地看到纹理结构

哈哈。的确,开源出来不一定是最优版本。


最后几句:

图像要提供人物占比大的。在后面处理得到的建模才会有更多细节。但整体,混元3D是在一定程度上有细节的提升。在快速建模的效率上,得确能赋能3D建模工作,得到的结果还需要后期再处理下。但这个版本是应该还不是最高版本的模型。在混元官方生成的3D模型的质量明显比较好。

以上是closerAI团队制作的stable diffusion comfyUI closerAI开发的closerAI混元3D的图片转3D模型工作流介绍,大家可以根据工作流思路进行尝试搭建。

当然,也可以在我们closerAI会员站上获取对应的工作流(查看原文)。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:JimmyMo

更多AI前沿科技资讯,请关注我们:closerAI-一个深入探索前沿人工智能与AIGC领域的资讯平台

添加图片注释,不超过 140 字(可选)
隐藏内容
本内容需权限查看
  • 普通用户: 199金币
  • VIP会员: 免费
  • 永久会员: 免费

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。