MCP 服务器
一条命令,让 Claude Code、Cursor、Windsurf 等 AI 代理直接调用 VoxFlow 的语音合成、语音识别、播客脚本生成等工具。
支持 OAuth 自动登录,无需手动复制 API Key。
快速开始
https://api.voxflow.studio/api/mcp
协议:Streamable HTTP · 认证:OAuth 自动登录(首次使用弹出浏览器)
Claude Code
一条命令添加,重启 Claude Code 即可:
claude mcp add --transport http voxflow https://api.voxflow.studio/api/mcp
首次调用工具时自动弹出浏览器登录(Google 或邮箱验证码),授权后无缝使用。
验证是否添加成功:
claude mcp list
Cursor
打开 Cursor → Settings → MCP,添加:
{
"mcpServers": {
"voxflow": {
"url": "https://api.voxflow.studio/api/mcp"
}
}
}
重启 Cursor,首次使用时自动弹出 OAuth 登录。
Windsurf / OpenAI Codex
在 MCP 配置文件中添加(~/.codeium/windsurf/mcp_config.json 或对应路径):
{
"mcpServers": {
"voxflow": {
"serverUrl": "https://api.voxflow.studio/api/mcp"
}
}
}
n8n / 自动化平台
在 AI Agent 节点中添加 MCP Client Tool:
Transport: Streamable HTTP
URL: https://api.voxflow.studio/api/mcp
n8n 等不支持 OAuth 的平台需要手动填写 Bearer Token(在 VoxFlow 应用 Settings → API 中获取)。
可用工具
| 工具 | 功能 | 配额 |
|---|---|---|
voice_list |
搜索音色 — 按语言、性别、风格筛选 | 免费 |
tts_synthesize |
文字转语音 — 返回 mp3/wav 音频文件 | 100 |
asr_transcribe |
语音识别 — 音频/视频 URL 转文字 | 100 |
podcast_script |
AI 播客脚本 — 多角色对话生成 | 5000 |
quota_check |
查询配额余额 | 免费 |
免费用户每月 10,000 配额。1 次 TTS 合成 = 100 配额。
试试这些对话
添加 MCP 后,直接在 Claude Code / Cursor 对话中输入以下内容。AI 会自动调用 VoxFlow 工具。
› “你会说话吗?”
AI 会调用 TTS 合成一段语音回应你,保存为 mp3 文件
› “给我讲个小故事,用语音”
AI 编故事 → 选音色 → 合成语音 → 保存 mp3
› “帮我查一下 VoxFlow 配额还剩多少”
调用 quota_check,告诉你剩余额度和消费情况
› “有哪些日语女声可以用?”
调用 voice_list 搜索日语女声音色列表
› “用英文念一下这段代码的注释”
AI 提取注释 → 选英文音色 → TTS 合成
创意工作流
AI 会自动编排多个工具,实现复杂创作流程。
AI 有声绘本
"帮我做一个6页的儿童有声绘本,主题是'小狐狸的星星种子',每页有 SVG 插画和语音旁白,输出为单个 HTML 文件"
AI 写故事 → 生成 SVG 插画 → voice_list → tts_synthesize × 6 → 全部内嵌到一个离线可用的 HTML 绘本
这是 VoxFlow MCP 的标杆用法 — 一次对话生成完整的创意作品,SVG 插画 + TTS 配音,1MB 单文件,完全离线可用。
网页 → 有声摘要
"读一下这个链接 https://example.com/article ,用 3 句话总结,然后用中文女声合成音频"
AI 抓取网页 → 总结内容 → voice_list → tts_synthesize → 保存 mp3
会议录音 → 纪要
"转录这个录音 https://example.com/meeting.mp3 ,提取关键要点,生成一份会议纪要"
asr_transcribe → AI 分析提取 → 结构化输出
播客脚本 → 多角色合成
"帮我生成一个关于'AI 时代程序员如何转型'的播客脚本,然后把前 3 句用不同声音合成出来"
podcast_script → voice_list(多个角色) → tts_synthesize × N
多语言配音
"把'欢迎使用 VoxFlow'翻译成英语和日语,分别用对应语言的女声合成"
AI 翻译 → voice_list(en) + voice_list(ja) → tts_synthesize × 2
Git 日报 → 音频版
"看看今天的 git log,总结成一段日报,用男声合成音频"
AI 读取 git log → 总结 → tts_synthesize
PR 变更 → 语音讲解
"看看这个 PR 改了什么,用通俗的语言讲解,然后合成语音"
AI 读 diff → 生成讲解 → tts_synthesize
外语音频 → 中文重配音
"转录这段英语音频,翻译成中文,用中文男声重新合成"
asr_transcribe → AI 翻译 → voice_list(zh, male) → tts_synthesize
睡前故事生成器
"编一个 3 分钟的儿童睡前故事,关于一只会飞的小猫,用温柔的女声合成"
AI 创作故事 → voice_list(温柔女声) → tts_synthesize → mp3
邮件 → 有声版
"读一下我刚收到的这封邮件(粘贴内容),用英文男声念出来"
AI 整理邮件内容 → voice_list(en, male) → tts_synthesize
文档朗读
"把 README.md 读出来,用中文女声,语速 0.9"
AI 读取文件 → 提取文本 → tts_synthesize(speed: 0.9) → 自动播放 mp3
Debug 辅助 — 错误信息播报
"把刚才的报错信息用语音念一下,我在看别的屏幕"
AI 提取错误信息 → tts_synthesize → 自动播放(解放双眼)
模拟面试
"用男声扮演面试官,问 3 个 React 相关的技术问题,每个问题合成语音"
AI 生成面试题 → tts_synthesize × 3 → 依次播放
有声演示文稿 / 产品介绍
"帮我做一个 5 页的产品介绍演示文稿,关于 VoxFlow AI 语音平台,每页有要点和配音旁白,输出为单个 HTML 文件"
AI 写 slide 内容 → 生成 HTML/CSS → tts_synthesize × N → 每页内嵌音频的交互式演示文稿
技术教程 / 课件
"把这个 README.md 做成一个有声教学课件,每个章节一页 slide,配上语音讲解"
AI 拆分章节 → 生成 slide HTML → tts_synthesize × N → 有声教学课件
视频脚本 → 分镜旁白
"帮我写一个 60 秒的产品介绍视频脚本,分成 5 个镜头,每个镜头配上旁白音频"
AI 写分镜脚本 → voice_list → tts_synthesize × 5 → 每个镜头独立 mp3
基本工作流
1. quota_check → 确认配额够用
2. voice_list → 找到合适的音色 ID
3. tts_synthesize → 合成语音(自动保存为本地 mp3 文件)
— 或 —
3. podcast_script → 生成播客对话脚本
4. tts_synthesize ×N → 逐句合成每个角色的台词
发现端点(无需认证)
curl https://api.voxflow.studio/api/mcp
返回工具清单 — 名称、描述、认证方式。
手动认证(不支持 OAuth 的客户端)
对于 n8n 等不支持 OAuth 的客户端,需要手动传入 Bearer Token:
# Claude Code 手动 Token 方式
claude mcp add --transport http voxflow https://api.voxflow.studio/api/mcp \
--header "Authorization: Bearer YOUR_VOXFLOW_TOKEN"
# Token 获取方式:登录 voxflow.studio → Settings → API → 复制 JWT