VoxFlowStudio
← Documentation home

Agent Skills

技能包是一份给 AI 编程助手的「说明书」。安装后,Claude Code 等 AI agent 在遇到音频相关任务时,会自动知道该调用哪些 VoxFlow CLI 命令。

什么是 Agent Skills?

Agent Skills 是安装在你项目里的 SKILL.md 文件。它告诉 AI agent:

Skills vs MCP: Skills 教 AI 用 CLI(本地执行,支持 FFmpeg/视频),MCP 让 AI 直接调 API(云端执行,对话式交互)。两者互补。

安装

# 安装 VoxFlow 技能包到当前项目
npx skills add VoxFlowStudio/skills --skill voxflow

# 查看所有可用技能
npx skills add VoxFlowStudio/skills --list

安装后,技能文件会出现在 .claude/skills/voxflow/SKILL.md(Claude Code)或对应 agent 的 skills 目录。

前提条件

# 先安装 CLI
npm install -g voxflow

# 登录(只需一次)
voxflow login
voxflow status

安装后的效果

AI agent 遇到音频任务时,会自动使用 VoxFlow CLI:

“帮我把这段文字合成语音”

AI 自动执行 voxflow say "..." -o output.mp3

“把这个视频翻译成日语”

AI 自动执行 voxflow video-translate video.mp4 --to ja

“生成一个关于 AI 的播客”

AI 自动执行 voxflow podcast "AI的未来" --duration 3

Skills 包含的内容

.claude/skills/voxflow/
  SKILL.md               # AI 读取的技能说明(299 行)
    ├── 7 个核心命令       # say / narrate / podcast / story / voices / asr / status
    ├── 5 个基础场景       # 念文字、读文件、生成播客、讲故事、转录
    ├── 8 个创意工作流     # 有声绘本、演示文稿、文章摘要、多语言、Git 日报...
    ├── 音色选择指南       # 热门音色 ID + 搜索方法
    └── 配额 & 规则     # 成本表、AI 行为规则

创意工作流

安装 Skill 后,AI 会自动组合 CLI 命令完成复杂创作。这些都写在 SKILL.md 里,AI 照着做。

有声绘本

AI 写故事 + 生成 SVG 插画 + voxflow say 逐页配音 → 单个离线 HTML 文件

有声演示文稿

AI 做 slide + 写旁白 + voxflow say 逐页配音 → HTML 演示文稿

文档朗读 / 文章有声摘要

voxflow narrate README.md 或 AI 总结网页 + voxflow say → mp3

多语言合成 / Git 日报 / PR 讲解 / 模拟面试

AI 翻译/总结/出题 + voxflow say 多段合成 → 自动播放

在 OpenClaw 中使用

OpenClaw 是一个 AI 聊天机器人框架,支持 WeChat、Telegram、Discord 等渠道。安装 VoxFlow Skills 后,OpenClaw bot 可以自动使用语音回复用户。

# 在 OpenClaw 项目中安装 VoxFlow 技能
npx skills add VoxFlowStudio/skills --skill voxflow

# 确保 CLI 已登录
npm install -g voxflow
voxflow login

安装后,OpenClaw bot 遇到 “用语音回复” “念出来” 等指令时,会自动调用 voxflow say 合成语音。

WeChat — 用户发消息,bot 用 VoxFlow 语音回复

Telegram — 语言学习 bot,发单词自动播放标准发音

Discord — 故事电台 bot,自动生成有声故事发送到频道

Skills vs MCP vs CLI — 什么时候用什么?

Skills MCP CLI
执行方式 AI 调 CLI(本地) AI 调 API(云端) 你手动执行
适合 需要 FFmpeg/视频/本地文件的任务 纯语音任务、对话式交互 脚本、CI/CD、批量处理
依赖 Node.js + CLI + ffmpeg 无(纯网络) Node.js + CLI
视频处理
安装 npx skills add claude mcp add npm i -g voxflow
推荐组合:同时安装 Skills + MCP。AI 会根据任务自动选择:需要视频处理用 CLI(通过 Skills),纯语音用 MCP API。

更新

# 删除旧版本并重新安装(推荐)
rm -rf .agents/skills/voxflow .claude/skills/voxflow
npx skills add VoxFlowStudio/skills --skill voxflow

CLI 文档 →  ·  MCP 文档 →  ·  所有文档 →