VoxFlow CLI

终端里的 AI 语音工作流。一条命令完成文字转语音、播客生成、视频配音、语音识别等任务。
npm 包：voxflow

安装 & 登录

npm install -g voxflow      # 需要 Node 20.19+ 或 22.12+
voxflow login               # 浏览器弹出登录（Google / 邮箱 OTP）
voxflow status              # 查看登录状态和配额

# 一键把 5 个 skill 装到所有已检测的 AI agent
# （Claude Code / Cursor / Codex / Gemini / Cline / Amp / OpenClaw 等 50+ 种）
voxflow skills install -y

底层等价于 npx -y skills add VoxFlowStudio/skills --all --yes --global，技能文件落到 ~/.agents/skills/voxflow/ 并 symlink 到每个 agent 的标准目录。详见 Agent Skills。
OpenClaw 用户请走 OpenClaw 官方注册表：海外用 clawhub install voxflow，中国 / 腾讯内部 OpenClaw（如 chico-claw-win）用 skillhub install voxflow。两边 slug 都是 voxflow，bot 里直接说「帮我装 voxflow skill」也行，详见 /docs/openclaw——OpenClaw 出于供应链安全会拒绝 voxflow skills install 这条路径。

AI 一键安装（推荐）

不想自己跑命令？把下面这段 prompt 整段复制给 Claude Code / Codex / Cursor / Gemini CLI / WorkBuddy / OpenClaw 任意一个 agent，全程不用开终端、不用粘贴 token——它自己跑命令、自己处理登录、自己装好 skill：

✨ 复制给 AI

请帮我把 VoxFlow 装好并跑通验证。VoxFlow 是一个语音工作流 CLI（npm 包名 voxflow），
首页 https://voxflow.studio。装好后你能用自然语言帮我合成语音 / 做播客 / 翻译视频。

⚠️ 重要：登录步骤不要让我去开新终端！按下面的"AI agent 非交互登录"模式做。
每一步先告诉我你在做什么；遇到失败先 dump 错误再排查，不要静默重试；全程中文回复。

═══ 步骤 1：装 CLI ═══
node --version    # 要求 >=20.19 或 >=22.12
npm install -g voxflow@latest

═══ 步骤 2：登录（device-flow，零粘贴）═══

(2a) 你跑：voxflow login
(2b) CLI 会打印两行关键信息：
       Pairing code: VF-XXXX
       Verify at:    https://voxflow.studio/device?code=VF-XXXX
     把这两行原样发给我，告诉我："请打开上面的链接，确认网页上的配对码
     与终端的 VF-XXXX 完全一致后，点「授权此设备」。"
(2c) CLI 在后台每 5 秒轮询。我授权完成后你会看到 "✓ Authorized (邮箱)" —
     全程零 JSON 粘贴。
(2d) 如果 CLI 一直显示 "Unexpected poll response" 或超过 5 分钟没动静，
     先 dump 完整输出，再让我重新跑。不要静默重试。

═══ 步骤 3：TTS 链路验证 ═══
voxflow say "你好 VoxFlow" -o hello.mp3
告诉我 hello.mp3 的绝对路径和文件大小。

═══ 步骤 4：装 5 个 skill 到所有 AI agent ═══
voxflow skills install -y
（底层跑：npx -y skills add VoxFlowStudio/skills --all --yes --global，
  装到 ~/.agents/skills/ 并 symlink 到 Claude Code / Cursor / Codex /
  Gemini / OpenClaw 等 agent 的标准 skills 目录。）

═══ 步骤 5：报告 ═══
全部跑完，告诉我：
  a) 装了哪些组件、版本号
  b) hello.mp3 路径和大小
  c) ~/.agents/skills/ 下有哪几个目录
  d) 我现在可以用哪些自然语言指令调用 VoxFlow（举 3 个例子）

═══ 约束 ═══
- 沙箱不能 npm install -g 的话告诉我具体限制，改用 https://voxflow.studio 网页版
- 步骤 2 严禁让我开新终端 — 把 verifyUrl + 配对码直接发我，让我在浏览器完成

命令速查

命令	功能	示例
`say`	文字转语音	`voxflow say "你好世界" -o hello.mp3`
`narrate`	文件/文本 → 多段 TTS	`voxflow narrate script.txt -o output.wav`
`podcast`	AI 播客生成	`voxflow podcast "AI的未来" --bgm jazz`
`voices`	搜索音色库	`voxflow voices --lang zh --gender female`
`asr`	语音识别 → 文字	`voxflow asr meeting.mp3`
`story`	AI 故事 → 有声书	`voxflow story "太空冒险" -o story.wav`
`skills install`	把 5 个 skill 装到所有 AI agent	`voxflow skills install -y`

所有命令支持 --help 查看详细参数。

常用场景

快速文字转语音

# 一句话合成
voxflow say "你好世界" -o hello.mp3 && open hello.mp3

# 指定音色和语速
voxflow say "慢速朗读" --voice v-female-R2s4N9qJ --speed 0.8 -o slow.mp3

文档/文件朗读

# 朗读整个文件
voxflow narrate README.md -o readme.mp3

# 从管道输入
cat article.txt | voxflow narrate --voice v-female-R2s4N9qJ -o narration.wav

AI 播客制作

# 输入话题，自动生成多角色播客
voxflow podcast "程序员如何用AI提升效率" --duration 5 --bgm lofi

AI 故事生成

# AI 写故事 + TTS 配音
voxflow story "小狐狸的星星种子" -o bedtime.mp3 && open bedtime.mp3

音色搜索

# 找中文女声
voxflow voices --lang zh --gender female

# 搜索关键词
voxflow voices --search "narrator"

CLI vs MCP vs Skills — 什么时候用什么？

工具	适合场景	特点
CLI	终端手动执行、Shell 脚本、CI/CD 流水线、批量处理	全功能（视频、FFmpeg）、可管道组合、适合自动化
MCP	在 Claude Code / Cursor 对话中让 AI 自动调用	对话式交互、AI 自动编排、OAuth 免配置
Skills	教 AI agent 如何正确使用 CLI 命令	项目内嵌指引、agent 看到 Skill 自动调用 CLI

简单记忆：你自己在终端操作用 CLI，让 AI 帮你操作用 MCP，教 AI 怎么操作用 Skills。

MCP 文档 → · Agent Skills → · 所有文档 →