MCP 服务器

一条命令，让 Claude Code、Cursor、Windsurf 等 AI 代理直接调用 VoxFlow 的语音合成、语音识别、播客脚本生成等工具。
支持 OAuth 自动登录，无需手动复制 API Key。

快速开始

https://api.voxflow.studio/api/mcp

协议：Streamable HTTP · 认证：OAuth 自动登录（首次使用弹出浏览器）

Claude Code

一条命令添加，重启 Claude Code 即可：

claude mcp add --transport http voxflow https://api.voxflow.studio/api/mcp

首次调用工具时自动弹出浏览器登录（Google 或邮箱验证码），授权后无缝使用。

验证是否添加成功：

claude mcp list

Cursor

打开 Cursor → Settings → MCP，添加：

{
  "mcpServers": {
    "voxflow": {
      "url": "https://api.voxflow.studio/api/mcp"
    }
  }
}

重启 Cursor，首次使用时自动弹出 OAuth 登录。

Windsurf / OpenAI Codex

在 MCP 配置文件中添加（~/.codeium/windsurf/mcp_config.json 或对应路径）：

{
  "mcpServers": {
    "voxflow": {
      "serverUrl": "https://api.voxflow.studio/api/mcp"
    }
  }
}

n8n / 自动化平台

在 AI Agent 节点中添加 MCP Client Tool：

Transport:  Streamable HTTP
URL:        https://api.voxflow.studio/api/mcp

n8n 等不支持 OAuth 的平台需要手动填写 Bearer Token（在 VoxFlow 应用 Settings → API 中获取）。

可用工具

工具	功能	配额
`voice_list`	搜索音色 — 按语言、性别、风格筛选	免费
`tts_synthesize`	文字转语音 — 返回 mp3/wav 音频文件	100
`asr_transcribe`	语音识别 — 音频/视频 URL 转文字	100
`podcast_script`	AI 播客脚本 — 多角色对话生成	5000
`quota_check`	查询配额余额	免费

免费用户每月 10,000 配额。1 次 TTS 合成 = 100 配额。

试试这些对话

添加 MCP 后，直接在 Claude Code / Cursor 对话中输入以下内容。AI 会自动调用 VoxFlow 工具。

› “你会说话吗？”

AI 会调用 TTS 合成一段语音回应你，保存为 mp3 文件

› “给我讲个小故事，用语音”

AI 编故事 → 选音色 → 合成语音 → 保存 mp3

› “帮我查一下 VoxFlow 配额还剩多少”

调用 quota_check，告诉你剩余额度和消费情况

› “有哪些日语女声可以用？”

调用 voice_list 搜索日语女声音色列表

› “用英文念一下这段代码的注释”

AI 提取注释 → 选英文音色 → TTS 合成

创意工作流

AI 会自动编排多个工具，实现复杂创作流程。

AI 有声绘本

"帮我做一个6页的儿童有声绘本，主题是'小狐狸的星星种子'，每页有 SVG 插画和语音旁白，输出为单个 HTML 文件"

AI 写故事 → 生成 SVG 插画 → voice_list → tts_synthesize × 6 → 全部内嵌到一个离线可用的 HTML 绘本

这是 VoxFlow MCP 的标杆用法 — 一次对话生成完整的创意作品，SVG 插画 + TTS 配音，1MB 单文件，完全离线可用。

网页 → 有声摘要

"读一下这个链接 https://example.com/article ，用 3 句话总结，然后用中文女声合成音频"

AI 抓取网页 → 总结内容 → voice_list → tts_synthesize → 保存 mp3

会议录音 → 纪要

"转录这个录音 https://example.com/meeting.mp3 ，提取关键要点，生成一份会议纪要"

asr_transcribe → AI 分析提取 → 结构化输出

播客脚本 → 多角色合成

"帮我生成一个关于'AI 时代程序员如何转型'的播客脚本，然后把前 3 句用不同声音合成出来"

podcast_script → voice_list(多个角色) → tts_synthesize × N

多语言配音

"把'欢迎使用 VoxFlow'翻译成英语和日语，分别用对应语言的女声合成"

AI 翻译 → voice_list(en) + voice_list(ja) → tts_synthesize × 2

Git 日报 → 音频版

"看看今天的 git log，总结成一段日报，用男声合成音频"

AI 读取 git log → 总结 → tts_synthesize

PR 变更 → 语音讲解

"看看这个 PR 改了什么，用通俗的语言讲解，然后合成语音"

AI 读 diff → 生成讲解 → tts_synthesize

外语音频 → 中文重配音

"转录这段英语音频，翻译成中文，用中文男声重新合成"

asr_transcribe → AI 翻译 → voice_list(zh, male) → tts_synthesize

睡前故事生成器

"编一个 3 分钟的儿童睡前故事，关于一只会飞的小猫，用温柔的女声合成"

AI 创作故事 → voice_list(温柔女声) → tts_synthesize → mp3

邮件 → 有声版

"读一下我刚收到的这封邮件（粘贴内容），用英文男声念出来"

AI 整理邮件内容 → voice_list(en, male) → tts_synthesize

文档朗读

"把 README.md 读出来，用中文女声，语速 0.9"

AI 读取文件 → 提取文本 → tts_synthesize(speed: 0.9) → 自动播放 mp3

Debug 辅助 — 错误信息播报

"把刚才的报错信息用语音念一下，我在看别的屏幕"

AI 提取错误信息 → tts_synthesize → 自动播放（解放双眼）

模拟面试

"用男声扮演面试官，问 3 个 React 相关的技术问题，每个问题合成语音"

AI 生成面试题 → tts_synthesize × 3 → 依次播放

有声演示文稿 / 产品介绍

"帮我做一个 5 页的产品介绍演示文稿，关于 VoxFlow AI 语音平台，每页有要点和配音旁白，输出为单个 HTML 文件"

AI 写 slide 内容 → 生成 HTML/CSS → tts_synthesize × N → 每页内嵌音频的交互式演示文稿

技术教程 / 课件

"把这个 README.md 做成一个有声教学课件，每个章节一页 slide，配上语音讲解"

AI 拆分章节 → 生成 slide HTML → tts_synthesize × N → 有声教学课件

视频脚本 → 分镜旁白

"帮我写一个 60 秒的产品介绍视频脚本，分成 5 个镜头，每个镜头配上旁白音频"

AI 写分镜脚本 → voice_list → tts_synthesize × 5 → 每个镜头独立 mp3

基本工作流

1. quota_check          → 确认配额够用
2. voice_list           → 找到合适的音色 ID
3. tts_synthesize       → 合成语音（自动保存为本地 mp3 文件）
   — 或 —
3. podcast_script       → 生成播客对话脚本
4. tts_synthesize ×N    → 逐句合成每个角色的台词

发现端点（无需认证）

curl https://api.voxflow.studio/api/mcp

返回工具清单 — 名称、描述、认证方式。

手动认证（不支持 OAuth 的客户端）

对于 n8n 等不支持 OAuth 的客户端，需要手动传入 Bearer Token：

# Claude Code 手动 Token 方式
claude mcp add --transport http voxflow https://api.voxflow.studio/api/mcp \
  --header "Authorization: Bearer YOUR_VOXFLOW_TOKEN"

# Token 获取方式：登录 voxflow.studio → Settings → API → 复制 JWT

CLI 文档 → · Agent Skills → · 所有文档 →