VoxFlowStudio
← Documentation home

MCP 服务器

一条命令,让 Claude Code、Cursor、Windsurf 等 AI 代理直接调用 VoxFlow 的语音合成、语音识别、播客脚本生成等工具。
支持 OAuth 自动登录,无需手动复制 API Key。

快速开始

https://api.voxflow.studio/api/mcp

协议:Streamable HTTP  ·  认证:OAuth 自动登录(首次使用弹出浏览器)

Claude Code

一条命令添加,重启 Claude Code 即可:

claude mcp add --transport http voxflow https://api.voxflow.studio/api/mcp

首次调用工具时自动弹出浏览器登录(Google 或邮箱验证码),授权后无缝使用。

验证是否添加成功:

claude mcp list

Cursor

打开 Cursor → Settings → MCP,添加:

{
  "mcpServers": {
    "voxflow": {
      "url": "https://api.voxflow.studio/api/mcp"
    }
  }
}

重启 Cursor,首次使用时自动弹出 OAuth 登录。

Windsurf / OpenAI Codex

在 MCP 配置文件中添加(~/.codeium/windsurf/mcp_config.json 或对应路径):

{
  "mcpServers": {
    "voxflow": {
      "serverUrl": "https://api.voxflow.studio/api/mcp"
    }
  }
}

n8n / 自动化平台

在 AI Agent 节点中添加 MCP Client Tool

Transport:  Streamable HTTP
URL:        https://api.voxflow.studio/api/mcp

n8n 等不支持 OAuth 的平台需要手动填写 Bearer Token(在 VoxFlow 应用 Settings → API 中获取)。

可用工具

工具 功能 配额
voice_list 搜索音色 — 按语言、性别、风格筛选 免费
tts_synthesize 文字转语音 — 返回 mp3/wav 音频文件 100
asr_transcribe 语音识别 — 音频/视频 URL 转文字 100
podcast_script AI 播客脚本 — 多角色对话生成 5000
quota_check 查询配额余额 免费

免费用户每月 10,000 配额。1 次 TTS 合成 = 100 配额。

试试这些对话

添加 MCP 后,直接在 Claude Code / Cursor 对话中输入以下内容。AI 会自动调用 VoxFlow 工具。

“你会说话吗?”

AI 会调用 TTS 合成一段语音回应你,保存为 mp3 文件

“给我讲个小故事,用语音”

AI 编故事 → 选音色 → 合成语音 → 保存 mp3

“帮我查一下 VoxFlow 配额还剩多少”

调用 quota_check,告诉你剩余额度和消费情况

“有哪些日语女声可以用?”

调用 voice_list 搜索日语女声音色列表

“用英文念一下这段代码的注释”

AI 提取注释 → 选英文音色 → TTS 合成

创意工作流

AI 会自动编排多个工具,实现复杂创作流程。

AI 有声绘本

"帮我做一个6页的儿童有声绘本,主题是'小狐狸的星星种子',每页有 SVG 插画和语音旁白,输出为单个 HTML 文件"

AI 写故事 → 生成 SVG 插画 → voice_list → tts_synthesize × 6 → 全部内嵌到一个离线可用的 HTML 绘本

这是 VoxFlow MCP 的标杆用法 — 一次对话生成完整的创意作品,SVG 插画 + TTS 配音,1MB 单文件,完全离线可用。

网页 → 有声摘要

"读一下这个链接 https://example.com/article ,用 3 句话总结,然后用中文女声合成音频"

AI 抓取网页 → 总结内容 → voice_list → tts_synthesize → 保存 mp3

会议录音 → 纪要

"转录这个录音 https://example.com/meeting.mp3 ,提取关键要点,生成一份会议纪要"

asr_transcribe → AI 分析提取 → 结构化输出

播客脚本 → 多角色合成

"帮我生成一个关于'AI 时代程序员如何转型'的播客脚本,然后把前 3 句用不同声音合成出来"

podcast_script → voice_list(多个角色) → tts_synthesize × N

多语言配音

"把'欢迎使用 VoxFlow'翻译成英语和日语,分别用对应语言的女声合成"

AI 翻译 → voice_list(en) + voice_list(ja) → tts_synthesize × 2

Git 日报 → 音频版

"看看今天的 git log,总结成一段日报,用男声合成音频"

AI 读取 git log → 总结 → tts_synthesize

PR 变更 → 语音讲解

"看看这个 PR 改了什么,用通俗的语言讲解,然后合成语音"

AI 读 diff → 生成讲解 → tts_synthesize

外语音频 → 中文重配音

"转录这段英语音频,翻译成中文,用中文男声重新合成"

asr_transcribe → AI 翻译 → voice_list(zh, male) → tts_synthesize

睡前故事生成器

"编一个 3 分钟的儿童睡前故事,关于一只会飞的小猫,用温柔的女声合成"

AI 创作故事 → voice_list(温柔女声) → tts_synthesize → mp3

邮件 → 有声版

"读一下我刚收到的这封邮件(粘贴内容),用英文男声念出来"

AI 整理邮件内容 → voice_list(en, male) → tts_synthesize

文档朗读

"把 README.md 读出来,用中文女声,语速 0.9"

AI 读取文件 → 提取文本 → tts_synthesize(speed: 0.9) → 自动播放 mp3

Debug 辅助 — 错误信息播报

"把刚才的报错信息用语音念一下,我在看别的屏幕"

AI 提取错误信息 → tts_synthesize → 自动播放(解放双眼)

模拟面试

"用男声扮演面试官,问 3 个 React 相关的技术问题,每个问题合成语音"

AI 生成面试题 → tts_synthesize × 3 → 依次播放

有声演示文稿 / 产品介绍

"帮我做一个 5 页的产品介绍演示文稿,关于 VoxFlow AI 语音平台,每页有要点和配音旁白,输出为单个 HTML 文件"

AI 写 slide 内容 → 生成 HTML/CSS → tts_synthesize × N → 每页内嵌音频的交互式演示文稿

技术教程 / 课件

"把这个 README.md 做成一个有声教学课件,每个章节一页 slide,配上语音讲解"

AI 拆分章节 → 生成 slide HTML → tts_synthesize × N → 有声教学课件

视频脚本 → 分镜旁白

"帮我写一个 60 秒的产品介绍视频脚本,分成 5 个镜头,每个镜头配上旁白音频"

AI 写分镜脚本 → voice_list → tts_synthesize × 5 → 每个镜头独立 mp3

基本工作流

1. quota_check          → 确认配额够用
2. voice_list           → 找到合适的音色 ID
3. tts_synthesize       → 合成语音(自动保存为本地 mp3 文件)
   — 或 —
3. podcast_script       → 生成播客对话脚本
4. tts_synthesize ×N    → 逐句合成每个角色的台词

发现端点(无需认证)

curl https://api.voxflow.studio/api/mcp

返回工具清单 — 名称、描述、认证方式。

手动认证(不支持 OAuth 的客户端)

对于 n8n 等不支持 OAuth 的客户端,需要手动传入 Bearer Token:

# Claude Code 手动 Token 方式
claude mcp add --transport http voxflow https://api.voxflow.studio/api/mcp \
  --header "Authorization: Bearer YOUR_VOXFLOW_TOKEN"

# Token 获取方式:登录 voxflow.studio → Settings → API → 复制 JWT

CLI 文档 →  ·  Agent Skills →  ·  所有文档 →