更多AI前沿科技资讯,请关注我们:

http://aigc.douyoubuy.cn/

【closerAI】从一首歌到AI MV到gemini 3生产力程序化应用无脑输出的过程分享及一些思考碎碎念

大家好,我是Jimmy。“2025年最后一天,感谢大家还看我文章以及的一路支持,最后一天没有总结,牛马终身不得闲,只有继续向前,干就完了。提前祝大家2026年马上成功。”

最近被一首歌映入眼帘,那是什么颁奖典礼的金曲奖《用背脊唱情歌》,嗯,找了下听了下,哎哟不错哦,原来是黄伟文作的词,难怪难怪。

于是我在想,歌曲中歌词是最直接触及我们普通人的,一首歌就是一个故事。这不,AI视频在2025年可是爆发式发展,从开源到闭源可是你追我赶,每周一更新,每月一技术爆炸。能不能开发一个小应用,让用户简单输入歌名,就能根据歌词,细分出歌词意境的分镜画面,然后利用文生图模型进行图像生成,甚至还能使用图生视频完成视频生成。最后自动拼接输出?

这个全自动AI MV应用,说干就干。

打开Gemini 3,https://aistudio.google.com/,在应用构建中,输入基础想法:

开发一个应用,用户输入歌名,全网搜索出歌词,然后根据歌词理解后制作成连贯的分镜画面的提示词,输入提示词,图像。然后呈呈现给用户。

得出基础架构后,基于想要的功能逐步完善。(最后提供分享链接,大家可以上面使用)

操作简单,用户仅仅只需要输入一个歌名,我让LLM全网搜索这首歌歌词并理解后自动根据歌词意境形成分镜及分镜的文生图提示词。

这里输入歌名,选择模式,这里的模式决定了分镜数量,意思就是歌词的划分细致程度。下面是绘画风格。点击生成。

然后,会形成每个分镜的列表,包括歌词、分镜提示词、视频提示词

然后点击生成:它就会利用图像生成模形成生成图像,这里我让它使用的是NanoBananaPro来生图并保持上下连贯性及一致性。

然后图有了,我就想让它结合音频自动生成简单的图片MV视频。

所以让它提供了一个音频上传的功能进行合成。这样少操作就能快速输出。

最后合成后:

这是第一版合成效果。虽然在音频与图像呈现上有点小出入,当然,它还能加入图生视频的功能后再进行合视频视频,这样视频就有动画。

想借这个小应用的实现过程分享聊一下以下的一些思考:

这个过程,前后花了不到一个小时时间,在短短的几十分钟内,开发了一个从想法到应用落地的工具来辅助我们进行AIGC的生产。这是今年2025年,AI技术发展的最强模型与应用工具给出的答案。当然,其它大厂的也很强,但在我看来,技术强、触及用户,真正让技术平权到每个普通人上去使用,去进行生产的,目前来讲,还得是谷歌。从技术落后到技术追赶到2025年AI全面超越(这是个人使用AI的主观感受并不客观,不喜勿喷),我觉得国内大厂要静心学习下它的战略和打法。毕竟再牛的技术使用门槛太高(太贵)还是没法真正全面普及和让更多应用场景落地。看年底前gemini的几波更新,到现在,基本各个领域(文本、图像、视频、音频等)都能免费使用所有大模型!像上面的应用构建,全是免费。正是在强技术产品的背景下实施免费与低价战略赢得市场份额。

前面我也有文章聊到,其实发展到现在,我们的生产方式要改变,不再是跨平台,多应用间的来回操作去生产。像这个应用,如果按一些相对先进的方式去生产,你要去使用AI助手,然后找图像生成平台生图,再图像生视频,再使用视频剪辑工具如剪映来进行视频合成……最后才完成,当然,也可以搭建工作流来完成,但是现在,直接构建应用,完成所有流程,工作流都省了,直接输入即输出。更为高效!

以前我也分享过一个观点,一个工作流就是一个应用,那现在,随着技术迭代,一个应用可能就是一个垂直领域的操作系统!到时候,设计好这个操作系统, 你直接输入需求,最后就自动完成所有内容生产!

随着这个生产方式的改变,未来,企业人员配置上也会有所改变,因为每个人都必须学习AI构建应用,调教应用来生产。所以工作流搭建的思维是要有的,comfyUI也是一定要学习的。

2026年,AI的迭代与技术的展示会更快,在这个过程中,如何及时了解新事物新技术并快速应用到我们实际工作、生产、商业行为中是当下我们都要去学习的一种能力,只有不断地去锻炼这种能力,才能不被企业、行业、时代所淘汰!不是吗?

最后,上面应用的链接:https://ai.studio/apps/drive/1WT9-FL0Tr8EFpELFoZqgQfG5XuoswINC?fullscreenApplet=true

本地算力不够怎么办?

如果本地设备算力不好的小伙伴,推荐使用线上comfyUI来运行体验:runninghub.cn

nano banana多图编辑应用体验地址:

https://www.runninghub.cn/ai-detail/1963192318062989314

注册地址:https://www.runninghub.cn/?utm_source=kol01-RH151

通过这个链接第一次注册送1000点,每日登录送100点


最后几句:

如果对你有帮助,请一键三连支持下我,感谢


closerAI-nanoPrompts:

http://closerai.douyoubuy.cn/2025/11/24/3396/

closerAI 分镜设计 软件(exe)本地运行版

http://aigc.douyoubuy.cn/2025/11/22/3350/

以下是closerAIwater节点:

http://aigc.douyoubuy.cn/2025/10/22/3121/

分镜分词器节点:

http://aigc.douyoubuy.cn/2025/10/11/3080/

json结构化提示词

http://aigc.douyoubuy.cn/2025/11/05/3242/


以上是closerAI 关于gemini 3AIGC应用构建的分享

更多资源可在我们closerAI会员站上获取(查看原文)

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:JimmyMo

更多AI前沿科技资讯,请关注我们:

http://aigc.douyoubuy.cn/

上面应用的链接:https://ai.studio/apps/drive/1WT9-FL0Tr8EFpELFoZqgQfG5XuoswINC?fullscreenApplet=true

隐藏内容
本内容需权限查看
  • 普通用户: 199金币
  • VIP会员: 免费
  • 永久会员: 免费

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。