Kokoro TTS MCP 服务器

AI TTS MCP Server Text-to-Speech

联系我们在FlowHunt托管您的MCP服务器

“Kokoro TTS” MCP 服务器的功能是什么?

Kokoro 文字转语音(TTS)MCP 服务器是一款模型上下文协议(MCP)服务器,能让 AI 助手和客户端将文本输入生成高质量语音音频。通过将 AI 工作流连接至该服务器,用户可将文本转为 .mp3 文件,并可选择上传至 Amazon S3 或兼容存储。Kokoro TTS 利用先进模型(通过 HuggingFace spaces 和 ONNX 权重)提供自定义语音、语速和语言,便于在开发环境、聊天机器人或自动化管道中无缝集成文字转语音能力。对于需要合成语音以满足无障碍、通知或内容创作的场景,这款 MCP 服务器尤其有价值。

提示模版列表

仓库中未记录明确的提示模版。

FlowHunt 标志

准备好发展您的业务了吗?

今天开始免费试用,几天内即可看到结果。

资源列表

仓库文件或 README 未记录明确资源。

工具列表

  • 文字转语音生成
    使用 Kokoro TTS 模型将输入文本转换为 .mp3 音频文件。可配置语音、语速和语言。
  • S3 上传
    若配置中启用,可将生成的 .mp3 文件上传至指定的 Amazon S3 桶/文件夹。
  • 本地 MP3 管理
    将生成的 .mp3 文件存储在指定本地文件夹,可在上传或达到保留期后自动删除。

典型应用场景

  • 无障碍解决方案:
    集成 Kokoro TTS 到应用,为视障用户提供语音反馈或朗读内容。
  • 语音通知:
    在监控或物联网系统中自动将事件消息转为语音音频,实现语音提醒。
  • 内容创作:
    直接从文本脚本为视频、播客或互动媒体生成配音。
  • 对话式 AI/聊天机器人:
    让聊天机器人以语音方式回应,提升客户支持或虚拟助手场景的用户体验。
  • 音频归档与合规:
    为文本通信创建音频记录,满足合规或归档需求。

如何搭建

Windsurf

  1. 确保已下载 uv 和所有 Kokoro 模型文件。
  2. 将 Kokoro TTS MCP 仓库克隆到本地机器。
  3. 编辑 Windsurf 的配置文件,添加 Kokoro TTS MCP 服务器。
  4. mcpServers 对象中添加如下 JSON 片段:
    {
      "kokoro-tts-mcp": {
        "command": "uv",
        "args": [
          "--directory",
          "/path/toyourlocal/kokoro-tts-mcp",
          "run",
          "mcp-tts.py"
        ],
        "env": {
          "TTS_VOICE": "af_heart",
          "TTS_SPEED": "1.0",
          "TTS_LANGUAGE": "en-us",
          "AWS_ACCESS_KEY_ID": "",
          "AWS_SECRET_ACCESS_KEY": "",
          "AWS_REGION": "us-east-1",
          "AWS_S3_FOLDER": "mp3",
          "S3_ENABLED": "true",
          "MP3_FOLDER": "/path/to/mp3"
        }
      }
    }
    
  5. 保存配置并重启 Windsurf。

Claude

  1. 安装前置条件(Node.js、uv、Kokoro 模型)。
  2. 在 Claude 的 mcpServers 区域添加 Kokoro TTS MCP 服务器。
  3. 按上述方式插入 JSON 配置。
  4. 保存并重启 Claude 环境。

Cursor

  1. 下载仓库及所需模型文件。
  2. 更新 cursor.json 或等效配置文件,包含 Kokoro TTS MCP 服务器。
  3. 复制提供的 JSON 配置片段,按需修改路径。
  4. 保存更改并重启 Cursor。

Cline

  1. 克隆仓库并配置环境变量。
  2. 编辑 Cline 配置,按示例添加 Kokoro TTS MCP 服务器。
  3. 保存并重启 Cline 客户端。

API 密钥安全管理

请始终使用环境变量存储敏感信息(如 AWS 凭证)。示例:

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

请在系统或 CI 环境中设置这些变量,切勿将密钥硬编码进配置文件。

如何在流程中调用 MCP

在 FlowHunt 中使用 MCP

要将 MCP 服务器集成到您的 FlowHunt 工作流,请先将 MCP 组件添加至流程,并与您的 AI 代理连接:

FlowHunt MCP flow

点击 MCP 组件打开配置面板。在系统 MCP 配置区,使用如下 JSON 格式填写您的 MCP 服务器信息:

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI 代理即可作为工具调用该 MCP 的所有功能。请记得将 “kokoro-tts-mcp” 替换为您实际的 MCP 服务器名称,并将 URL 替换为您自己的服务器地址。


概览

部分可用性详情/备注
概览AI 工作流中的文字转语音服务器
提示模版列表未找到提示模版
资源列表未记录明确的 MCP 资源
工具列表TTS、S3 上传、本地文件管理
API 密钥安全管理明确文档说明使用环境变量管理 AWS 与配置
采样支持(评测中次要)未提及 LLM 采样功能

我们的看法

Kokoro TTS MCP 服务器专注实用,是一款针对文字转语音任务并支持云集成的专业工具。它不包含提示和资源原语,但开源、配置规范,并支持安全密钥管理。未涉及采样和 Roots 支持,限制了高级代理能力。对于 TTS 场景,其表现稳健且实用,虽不如通用型 MCP 服务器功能丰富,但作为专用 TTS 服务非常有价值。

MCP 评分

是否有 LICENSE✅ (Apache-2.0)
至少有一个工具
Fork 数7
Star 数39

常见问题

将 Kokoro TTS 集成到您的 AI 工作流

为您的聊天机器人和自动化流程添加自然、高质量的语音合成功能,使用 Kokoro TTS MCP 服务器。可在 FlowHunt 内试用,或与您自己的基础设施对接。

了解更多

Cartesia MCP服务器集成
Cartesia MCP服务器集成

Cartesia MCP服务器集成

Cartesia MCP服务器为AI助手和客户端(如Cursor和Claude)与Cartesia先进的语音与音频API之间架起桥梁,实现文本转音频、语音本地化、音频补全以及变声等功能,可在FlowHunt及其他平台内使用。...

1 分钟阅读
Voice Synthesis Audio Tools +5
DeepL MCP 服务器
DeepL MCP 服务器

DeepL MCP 服务器

DeepL MCP 服务器通过 DeepL API 在 AI 工作流中集成了先进的翻译、改写和语言检测功能。它为 FlowHunt 及其他 AI 助手赋予实时多语言能力、自动语言识别和语气定制,实现无缝的全球交流。...

2 分钟阅读
AI Translation +5
用户反馈 MCP 服务器
用户反馈 MCP 服务器

用户反馈 MCP 服务器

用户反馈 MCP 服务器通过允许在自动化或 AI 辅助任务期间直接进行用户反馈、审批和审核,实现了 Cline 和 Cursor 等开发工具中的无缝人机协作工作流。非常适用于桌面应用测试、工作流审核和协作代码评审。...

2 分钟阅读
MCP Server Human-in-the-Loop +5