VoxFlow CLI
终端里的 AI 语音工作流。一条命令完成文字转语音、播客生成、视频配音、语音识别等任务。
npm 包:voxflow
安装 & 登录
npm install -g voxflow # 需要 Node 20.19+ 或 22.12+
voxflow login # 浏览器弹出登录(Google / 邮箱 OTP)
voxflow status # 查看登录状态和配额
# 一键把 5 个 skill 装到所有已检测的 AI agent
# (Claude Code / Cursor / Codex / Gemini / Cline / Amp / OpenClaw 等 50+ 种)
voxflow skills install -y
底层等价于 npx -y skills add VoxFlowStudio/skills --all --yes --global,技能文件落到 ~/.agents/skills/voxflow/ 并 symlink 到每个 agent 的标准目录。详见 Agent Skills。
OpenClaw 用户请走 OpenClaw 官方注册表:海外用 clawhub install voxflow,中国 / 腾讯内部 OpenClaw(如 chico-claw-win)用 skillhub install voxflow。两边 slug 都是 voxflow,bot 里直接说「帮我装 voxflow skill」也行,详见 /docs/openclaw——OpenClaw 出于供应链安全会拒绝 voxflow skills install 这条路径。
AI 一键安装(推荐)
不想自己跑命令?把下面这段 prompt 整段复制给 Claude Code / Codex / Cursor / Gemini CLI / WorkBuddy / OpenClaw 任意一个 agent,全程不用开终端、不用粘贴 token——它自己跑命令、自己处理登录、自己装好 skill:
✨
复制给 AI
请帮我把 VoxFlow 装好并跑通验证。VoxFlow 是一个语音工作流 CLI(npm 包名 voxflow),
首页 https://voxflow.studio。装好后你能用自然语言帮我合成语音 / 做播客 / 翻译视频。
⚠️ 重要:登录步骤不要让我去开新终端!按下面的"AI agent 非交互登录"模式做。
每一步先告诉我你在做什么;遇到失败先 dump 错误再排查,不要静默重试;全程中文回复。
═══ 步骤 1:装 CLI ═══
node --version # 要求 >=20.19 或 >=22.12
npm install -g voxflow@latest
═══ 步骤 2:登录(device-flow,零粘贴)═══
(2a) 你跑:voxflow login
(2b) CLI 会打印两行关键信息:
Pairing code: VF-XXXX
Verify at: https://voxflow.studio/device?code=VF-XXXX
把这两行原样发给我,告诉我:"请打开上面的链接,确认网页上的配对码
与终端的 VF-XXXX 完全一致后,点「授权此设备」。"
(2c) CLI 在后台每 5 秒轮询。我授权完成后你会看到 "✓ Authorized (邮箱)" —
全程零 JSON 粘贴。
(2d) 如果 CLI 一直显示 "Unexpected poll response" 或超过 5 分钟没动静,
先 dump 完整输出,再让我重新跑。不要静默重试。
═══ 步骤 3:TTS 链路验证 ═══
voxflow say "你好 VoxFlow" -o hello.mp3
告诉我 hello.mp3 的绝对路径和文件大小。
═══ 步骤 4:装 5 个 skill 到所有 AI agent ═══
voxflow skills install -y
(底层跑:npx -y skills add VoxFlowStudio/skills --all --yes --global,
装到 ~/.agents/skills/ 并 symlink 到 Claude Code / Cursor / Codex /
Gemini / OpenClaw 等 agent 的标准 skills 目录。)
═══ 步骤 5:报告 ═══
全部跑完,告诉我:
a) 装了哪些组件、版本号
b) hello.mp3 路径和大小
c) ~/.agents/skills/ 下有哪几个目录
d) 我现在可以用哪些自然语言指令调用 VoxFlow(举 3 个例子)
═══ 约束 ═══
- 沙箱不能 npm install -g 的话告诉我具体限制,改用 https://voxflow.studio 网页版
- 步骤 2 严禁让我开新终端 — 把 verifyUrl + 配对码直接发我,让我在浏览器完成
命令速查
| 命令 | 功能 | 示例 |
|---|---|---|
say |
文字转语音 | voxflow say "你好世界" -o hello.mp3 |
narrate |
文件/文本 → 多段 TTS | voxflow narrate script.txt -o output.wav |
podcast |
AI 播客生成 | voxflow podcast "AI的未来" --bgm jazz |
voices |
搜索音色库 | voxflow voices --lang zh --gender female |
asr |
语音识别 → 文字 | voxflow asr meeting.mp3 |
story |
AI 故事 → 有声书 | voxflow story "太空冒险" -o story.wav |
skills install |
把 5 个 skill 装到所有 AI agent | voxflow skills install -y |
所有命令支持 --help 查看详细参数。
常用场景
快速文字转语音
# 一句话合成
voxflow say "你好世界" -o hello.mp3 && open hello.mp3
# 指定音色和语速
voxflow say "慢速朗读" --voice v-female-R2s4N9qJ --speed 0.8 -o slow.mp3
文档/文件朗读
# 朗读整个文件
voxflow narrate README.md -o readme.mp3
# 从管道输入
cat article.txt | voxflow narrate --voice v-female-R2s4N9qJ -o narration.wav
AI 播客制作
# 输入话题,自动生成多角色播客
voxflow podcast "程序员如何用AI提升效率" --duration 5 --bgm lofi
AI 故事生成
# AI 写故事 + TTS 配音
voxflow story "小狐狸的星星种子" -o bedtime.mp3 && open bedtime.mp3
音色搜索
# 找中文女声
voxflow voices --lang zh --gender female
# 搜索关键词
voxflow voices --search "narrator"
CLI vs MCP vs Skills — 什么时候用什么?
| 工具 | 适合场景 | 特点 |
|---|---|---|
| CLI | 终端手动执行、Shell 脚本、CI/CD 流水线、批量处理 | 全功能(视频、FFmpeg)、可管道组合、适合自动化 |
| MCP | 在 Claude Code / Cursor 对话中让 AI 自动调用 | 对话式交互、AI 自动编排、OAuth 免配置 |
| Skills | 教 AI agent 如何正确使用 CLI 命令 | 项目内嵌指引、agent 看到 Skill 自动调用 CLI |
简单记忆:你自己在终端操作用 CLI,让 AI 帮你操作用 MCP,教 AI 怎么操作用 Skills。