
还在对着 Qwen3-TTS 的 Prompt 框发呆? 还在为“如何写出那种带哭腔、带方言、有画面感”的提示词而头秃?
🚀 closerAI Qwen3TTS-designAssistant V10 正式上线! 它不仅仅是一个参数选择器,它内置了一个**“声音剧本作家”**!
✨ 核心亮点:
- 🧠 内置 LLM 大脑:不是简单的关键词拼接!内置 OpenAI/Mistral 等模型接口(免费/免Key),自动将你的“中年、醉汉、陕西话”脑补成一段包含呼吸感、语调起伏的专业提示词。
- 🗣️ 10国语言 & 9种方言:从地道的北京儿化音到火辣的四川话,再到优雅的法语,一键直达。
- 🎭 丰富人设库:想听“傲娇的萝莉”?“阴险的反派”?还是“疲惫的社畜”?预设 20+ 种高频人设,一键入戏。
- 🎬 场景化沉浸:浴室混响、电话电流音、战场嘶吼……不仅仅是读稿,而是“声音演出”。
- 🔌 开放生态:独创“输出指令”模式,可直接连接 ChatGPT/Ollama 节点,让更强的模型为你打工!
- 🎤 交互式录音机 (WAV Fix)
- 无需准备音频文件,直接在节点上点击 🔴 录音。
- 内置专业 WAV 编码器,完美解决 Web 录音格式不兼容问题,无缝对接 Qwen3 声音克隆。
👉 拒绝机械音,让你的 AI 声音拥有灵魂!

closerAI Qwen3TTS-designAssistant 安装与使用指南
1. 简介
这是一个专为 Qwen3-TTS 模型设计的 ComfyUI 辅助节点。它利用内置的大语言模型(LLM)将简单的选项(如性别、情绪、方言)转化为 Qwen3-TTS 官方推荐的高质量、长文本提示词(Prompt),极大地提升了声音生成的自然度和表现力。
2. 安装方法
方法 A:手动安装(推荐)
- 下载解压放置到你的 ComfyUI 插件目录:
\ComfyUI\custom_nodes\ - 重启 ComfyUI。
3. 界面功能详解
重启 ComfyUI 后,在右键菜单找到:
closerAI -> Qwen3TTS -> closerAI Qwen3TTS-designAssistant
🎛️ 核心参数面板
| 参数名称 | 说明 | 推荐玩法 |
| 性别/年龄 | 声音的基础物理属性。 | 想要反差萌?试选“幼童”+“大叔人设”。 |
| 语言 | 支持中、英、日、法等10国语言。 | 选“法语”+“御姐”,体验优雅质感。 |
| 方言 | 特色功能! 支持北京、四川、粤语、陕西等9种方言。 | 选“陕西话”+“醉汉”,效果炸裂! |
| 人设 | 决定说话的语气和韵律(如主播、太监、反派)。 | 选“说书人”+“惊堂木(补充描述中写)”。 |
| 场景 | 决定声场环境(如电话、浴室、战场)。 | 选“无”可获得最干净的干声。 |
| 情绪 | 极其细腻的情绪库(如傲娇、绝望、讽刺)。 | 选“傲娇”+“语速快”,二次元感拉满。 |
| 生成模式 | 核心大脑! 决定 Prompt 的生成方式(见下文)。 | 默认推荐“内置LLM: 详细属性表”。 |
| Seed | 控制 LLM 的发挥。 | 固定种子可复现结果;点击 🎲 可获得新灵感。 |
4. 进阶玩法:三种生成模式
🟢 模式 1:内置LLM - 详细属性表 (官方推荐)
- 原理:利用内置联网 AI,生成 Qwen3-TTS 最喜欢的“结构化标签+自然描述”格式。
- 适用:90% 的场景,效果最稳,细节最丰富。
- 示例输出:gender: Female. dialect: Sichuan dialect. A spicy and energetic voice... (包含音色、情绪的详细英文描述)
🔵 模式 2:内置LLM - 人物小传 (深度人设)
- 原理:AI 会根据你的选项自动脑补一个具体的角色背景(姓名、经历、信条)。
- 适用:需要极强情感爆发、广播剧、有声书角色定制。
- 示例输出:角色姓名:李秀莲。身份:成都火锅店老板娘。性格:泼辣豪爽...
🟠 模式 3:输出指令 (连接第三方 LLM)
- 原理:节点不生成最终 Prompt,而是输出一段“催眠指令”。
- 用法:
- 将本节点的输出连接到
ChatGPT/Ollama/DeepSeek等更强 LLM 节点的输入端。 - 让外部 LLM 生成最终提示词。
- 优点:如果你有 GPT-4 API,用这个模式可以获得天花板级别的理解力。
- 将本节点的输出连接到
🟤 模式 4:本地规则 (断网兜底)
- 原理:简单的关键词拼接,不联网。
- 适用:断网环境,或者 API 抽风时使用。
节点功能详解
🅰️ 节点一:设计助手 (CloserAI Qwen3TTS-designAssistant)
功能:生成高质量的 Qwen3-TTS 提示词。
- 参数说明:
- 性别/年龄/语言:基础物理属性。语言支持 10 国标准发音。
- 方言:特色功能,支持北京、四川、粤语等 9 种方言。
- 人设 (Persona):决定说话的语气、韵律和性格(如:太监、醉汉、主播)。
- 场景 (Scenario):决定声场环境(如:雨中、电话、浴室)。
- 生成模式 (关键):
内置LLM: 详细属性表:最推荐。调用 AI 生成包含音色、流利度、细节的结构化 Prompt。内置LLM: 人物小传:AI 会自动脑补角色的背景故事和人生信条,适合广播剧。输出指令:不生成 Prompt,而是输出一段指令,供你连接外部更强的 LLM 节点。本地规则:断网兜底模式。
- Seed:控制 LLM 的发挥。固定种子可复现结果。
- 使用技巧:
- 想要“克苏鲁”风格?选
人设:疯子+场景:山洞+质感:气声。 - 想要“带货主播”?选
人设:主播+语速:极快+情绪:激动。
- 想要“克苏鲁”风格?选
🅱️ 节点二:交互式录音机 (CloserAI Interactive Recorder)
功能:在浏览器直接录音,用于声音克隆。
- 操作流程:
- 添加节点。
- 点击节点上的 🔴 点击录音 按钮。
- 浏览器弹窗请求麦克风权限 -> 点击“允许”。
- 对着麦克风说话。
- 再次点击按钮(此时变为 ⏹️ 停止)。
- 等待状态变为
✅ 已保存。 - 连接:将节点的
audio输出端连接到 Qwen3-TTS 的Reference Audio输入端。
- 注意事项:
- 必须使用 HTTPS 或 Localhost (127.0.0.1) 访问 ComfyUI,否则浏览器会因安全策略禁用麦克风。
- 录音文件会自动保存为标准的 16-bit WAV 格式,兼容性极佳。
5. 常见问题 (Q&A)
Q: 节点显示红色报错“LLM调用失败”?
A: 这是因为网络无法连接到内置的 API 服务。
- 检查是否开启了魔法上网。
- 将
内置LLM源切换为mistral或chickytutor试试。 - 如果都不行,请暂时切换生成模式为“本地规则”。
Q: 方言效果不明显?
A: Qwen3-TTS 模型本身对方言的支持主要体现在音调和特定词汇上。建议在“补充描述”里输入一点该方言的特色词(例如选北京话时,输入“儿化音重一点”),LLM 会帮你加强描述。
Q: 如何让声音更像真人?
A: 善用 [音色质感] 和 [场景]。
- 真人往往不是完美的播音腔。试着选择 “沙哑” 或 “气声”。
- 增加一点 “犹豫” 或 “思考” 的情绪(在补充描述里写)。
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)