什么是 Kokoro TTS MCP 服务器？

Kokoro TTS MCP 服务器是一款模型上下文协议（MCP）服务器，使 AI 代理和客户端能够将文本输入转换为高质量语音音频，支持语音、语速、语言及云存储等选项。非常适合为聊天机器人、无障碍工具和自动化工作流添加文字转语音功能。

Kokoro TTS MCP 的主要特性有哪些？

支持通过 HuggingFace 模型和 ONNX 权重自定义语音、语速和语言。音频可本地存储，也可上传到 Amazon S3。易于集成到开发环境、聊天机器人和自动化管道中。

如何保障我的 AWS S3 上传凭证安全？

切勿将凭证硬编码在配置文件中。请使用环境变量安全传递敏感信息，如 AWS_ACCESS_KEY_ID 和 AWS_SECRET_ACCESS_KEY 给 Kokoro TTS MCP 服务器。

典型的应用场景有哪些？

应用场景包括无障碍解决方案（为视障用户朗读）、语音通知、内容创作（为媒体配音）、对话式 AI 以及合规性音频归档等。

Kokoro TTS 能否与 FlowHunt 配合使用？

可以，您可以将 Kokoro TTS 作为 MCP 组件添加到 FlowHunt 工作流，使代理能够生成音频回复并使用所有支持的工具和配置。

Kokoro TTS 是否支持高级 LLM 采样或提示模版？

不支持。Kokoro TTS 专注于高质量文字转语音，不提供提示原语或 LLM 采样功能。

Kokoro TTS MCP 服务器

Kokoro TTS MCP 服务器为您的 AI 应用带来自然、可定制的文字转语音功能，支持本地及云端音频存储，非常适合无障碍、自动化和内容创作场景。

AI TTS MCP Server Text-to-Speech

在 FlowHunt 中试用预约演示

联系我们在FlowHunt托管您的MCP服务器

support@flowhunt.io

“Kokoro TTS” MCP 服务器的功能是什么？

Kokoro 文字转语音（TTS）MCP 服务器是一款模型上下文协议（MCP）服务器，能让 AI 助手和客户端将文本输入生成高质量语音音频。通过将 AI 工作流连接至该服务器，用户可将文本转为 .mp3 文件，并可选择上传至 Amazon S3 或兼容存储。Kokoro TTS 利用先进模型（通过 HuggingFace spaces 和 ONNX 权重）提供自定义语音、语速和语言，便于在开发环境、聊天机器人或自动化管道中无缝集成文字转语音能力。对于需要合成语音以满足无障碍、通知或内容创作的场景，这款 MCP 服务器尤其有价值。

提示模版列表

仓库中未记录明确的提示模版。

资源列表

仓库文件或 README 未记录明确资源。

工具列表

文字转语音生成
使用 Kokoro TTS 模型将输入文本转换为 .mp3 音频文件。可配置语音、语速和语言。
S3 上传
若配置中启用，可将生成的 .mp3 文件上传至指定的 Amazon S3 桶/文件夹。
本地 MP3 管理
将生成的 .mp3 文件存储在指定本地文件夹，可在上传或达到保留期后自动删除。

典型应用场景

无障碍解决方案：
集成 Kokoro TTS 到应用，为视障用户提供语音反馈或朗读内容。
语音通知：
在监控或物联网系统中自动将事件消息转为语音音频，实现语音提醒。
内容创作：
直接从文本脚本为视频、播客或互动媒体生成配音。
对话式 AI/聊天机器人：
让聊天机器人以语音方式回应，提升客户支持或虚拟助手场景的用户体验。
音频归档与合规：
为文本通信创建音频记录，满足合规或归档需求。

如何搭建

Windsurf

确保已下载 uv 和所有 Kokoro 模型文件。
将 Kokoro TTS MCP 仓库克隆到本地机器。
编辑 Windsurf 的配置文件，添加 Kokoro TTS MCP 服务器。

在 mcpServers 对象中添加如下 JSON 片段：

{
  "kokoro-tts-mcp": {
    "command": "uv",
    "args": [
      "--directory",
      "/path/toyourlocal/kokoro-tts-mcp",
      "run",
      "mcp-tts.py"
    ],
    "env": {
      "TTS_VOICE": "af_heart",
      "TTS_SPEED": "1.0",
      "TTS_LANGUAGE": "en-us",
      "AWS_ACCESS_KEY_ID": "",
      "AWS_SECRET_ACCESS_KEY": "",
      "AWS_REGION": "us-east-1",
      "AWS_S3_FOLDER": "mp3",
      "S3_ENABLED": "true",
      "MP3_FOLDER": "/path/to/mp3"
    }
  }
}

保存配置并重启 Windsurf。

Claude

安装前置条件（Node.js、uv、Kokoro 模型）。
在 Claude 的 mcpServers 区域添加 Kokoro TTS MCP 服务器。
按上述方式插入 JSON 配置。
保存并重启 Claude 环境。

Cursor

下载仓库及所需模型文件。
更新 cursor.json 或等效配置文件，包含 Kokoro TTS MCP 服务器。
复制提供的 JSON 配置片段，按需修改路径。
保存更改并重启 Cursor。

Cline

克隆仓库并配置环境变量。
编辑 Cline 配置，按示例添加 Kokoro TTS MCP 服务器。
保存并重启 Cline 客户端。

API 密钥安全管理

请始终使用环境变量存储敏感信息（如 AWS 凭证）。示例：

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

请在系统或 CI 环境中设置这些变量，切勿将密钥硬编码进配置文件。

如何在流程中调用 MCP

在 FlowHunt 中使用 MCP

要将 MCP 服务器集成到您的 FlowHunt 工作流，请先将 MCP 组件添加至流程，并与您的 AI 代理连接：

点击 MCP 组件打开配置面板。在系统 MCP 配置区，使用如下 JSON 格式填写您的 MCP 服务器信息：

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后，AI 代理即可作为工具调用该 MCP 的所有功能。请记得将 “kokoro-tts-mcp” 替换为您实际的 MCP 服务器名称，并将 URL 替换为您自己的服务器地址。

概览

部分	可用性	详情/备注
概览	✅	AI 工作流中的文字转语音服务器
提示模版列表	⛔	未找到提示模版
资源列表	⛔	未记录明确的 MCP 资源
工具列表	✅	TTS、S3 上传、本地文件管理
API 密钥安全管理	✅	明确文档说明使用环境变量管理 AWS 与配置
采样支持（评测中次要）	⛔	未提及 LLM 采样功能

我们的看法

Kokoro TTS MCP 服务器专注实用，是一款针对文字转语音任务并支持云集成的专业工具。它不包含提示和资源原语，但开源、配置规范，并支持安全密钥管理。未涉及采样和 Roots 支持，限制了高级代理能力。对于 TTS 场景，其表现稳健且实用，虽不如通用型 MCP 服务器功能丰富，但作为专用 TTS 服务非常有价值。

MCP 评分

是否有 LICENSE	✅ (Apache-2.0)
至少有一个工具	✅
Fork 数	7
Star 数	39

常见问题

: Kokoro TTS MCP 服务器是一款模型上下文协议（MCP）服务器，使 AI 代理和客户端能够将文本输入转换为高质量语音音频，支持语音、语速、语言及云存储等选项。非常适合为聊天机器人、无障碍工具和自动化工作流添加文字转语音功能。
: 支持通过 HuggingFace 模型和 ONNX 权重自定义语音、语速和语言。音频可本地存储，也可上传到 Amazon S3。易于集成到开发环境、聊天机器人和自动化管道中。
: 切勿将凭证硬编码在配置文件中。请使用环境变量安全传递敏感信息，如 AWS_ACCESS_KEY_ID 和 AWS_SECRET_ACCESS_KEY 给 Kokoro TTS MCP 服务器。
: 应用场景包括无障碍解决方案（为视障用户朗读）、语音通知、内容创作（为媒体配音）、对话式 AI 以及合规性音频归档等。
: 可以，您可以将 Kokoro TTS 作为 MCP 组件添加到 FlowHunt 工作流，使代理能够生成音频回复并使用所有支持的工具和配置。
: 不支持。Kokoro TTS 专注于高质量文字转语音，不提供提示原语或 LLM 采样功能。