Servidor MCP Kokoro TTS
Kokoro TTS MCP Server aporta texto a voz natural y personalizable a tus aplicaciones de IA, con soporte para almacenamiento de audio local y en la nube, ideal para accesibilidad, automatización y creación de contenido.

¿Qué hace el Servidor MCP “Kokoro TTS”?
El Servidor MCP Kokoro Text to Speech (TTS) es un servidor Model Context Protocol (MCP) que permite a asistentes y clientes de IA generar audio de voz de alta calidad a partir de texto. Al conectar flujos de trabajo de IA con este servidor, los usuarios pueden convertir texto en archivos .mp3 y, opcionalmente, subirlos a Amazon S3 o almacenamiento compatible. Kokoro TTS aprovecha modelos avanzados (a través de HuggingFace spaces y pesos ONNX) para ofrecer voces, velocidades e idiomas personalizables, facilitando la integración fluida de capacidades texto-a-voz en entornos de desarrollo, chatbots o pipelines de automatización. Este servidor MCP es especialmente valioso en escenarios donde se requiere voz sintetizada para accesibilidad, notificaciones o creación de contenido.
Lista de Prompts
No hay plantillas de prompts explícitas documentadas en el repositorio.
Lista de Recursos
No hay recursos explícitos documentados en los archivos del repositorio o README.
Lista de Herramientas
- Generación de Texto a Voz
Convierte texto de entrada en un archivo de audio .mp3 usando modelos Kokoro TTS. Ofrece configuración de voz, velocidad e idioma. - Subida a S3
Opcionalmente sube los archivos .mp3 generados a un bucket/carpeta de Amazon S3 especificado si está habilitado en la configuración. - Gestión Local de MP3
Almacena los archivos .mp3 generados en una carpeta local designada y puede eliminarlos automáticamente tras la subida o pasado un periodo de retención.
Casos de Uso de este Servidor MCP
- Soluciones de Accesibilidad:
Integra Kokoro TTS en aplicaciones para proporcionar retroalimentación de voz a usuarios con discapacidad visual o para leer contenido en voz alta. - Notificaciones por Voz:
Automatiza alertas de voz en sistemas de monitorización o IoT convirtiendo mensajes de eventos en audio. - Creación de Contenido:
Genera locuciones para videos, podcasts o medios interactivos directamente desde guiones escritos. - IA Conversacional/Chatbots:
Permite que los chatbots respondan con salida hablada, mejorando la experiencia del usuario en soporte o asistentes virtuales. - Archivado de Audio & Cumplimiento:
Crea registros de audio de comunicaciones basadas en texto para cumplimiento o propósitos de archivo.
Cómo configurarlo
Windsurf
- Asegúrate de tener
uv
y todos los archivos de modelos Kokoro descargados. - Clona el repositorio Kokoro TTS MCP en tu máquina local.
- Edita tu archivo de configuración de Windsurf para agregar el servidor Kokoro TTS MCP.
- Añade el siguiente fragmento JSON a tu objeto
mcpServers
:{ "kokoro-tts-mcp": { "command": "uv", "args": [ "--directory", "/path/toyourlocal/kokoro-tts-mcp", "run", "mcp-tts.py" ], "env": { "TTS_VOICE": "af_heart", "TTS_SPEED": "1.0", "TTS_LANGUAGE": "en-us", "AWS_ACCESS_KEY_ID": "", "AWS_SECRET_ACCESS_KEY": "", "AWS_REGION": "us-east-1", "AWS_S3_FOLDER": "mp3", "S3_ENABLED": "true", "MP3_FOLDER": "/path/to/mp3" } } }
- Guarda tu configuración y reinicia Windsurf.
Claude
- Instala los prerrequisitos (Node.js, uv, modelos Kokoro).
- Agrega el servidor Kokoro TTS MCP en la sección
mcpServers
de Claude. - Inserta la configuración JSON como arriba.
- Guarda y reinicia el entorno de Claude.
Cursor
- Descarga el repositorio y los archivos de modelos requeridos.
- Actualiza el
cursor.json
o la configuración equivalente para incluir el servidor Kokoro TTS MCP. - Copia el fragmento JSON proporcionado, actualizando las rutas según sea necesario.
- Guarda los cambios y reinicia Cursor.
Cline
- Clona el repositorio y configura las variables de entorno.
- Edita la configuración de Cline, agregando el servidor Kokoro TTS MCP como se muestra.
- Guarda y reinicia el cliente Cline.
Protección de Claves API
Usa siempre variables de entorno para almacenar información sensible como credenciales de AWS. Ejemplo:
"env": {
"AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
"AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
...
}
Define estas variables en tu sistema o entorno CI, nunca codifiques secretos directamente en tus archivos de configuración.
Cómo usar este MCP dentro de flows
Uso de MCP en FlowHunt
Para integrar servidores MCP en tu flujo de trabajo FlowHunt, comienza agregando el componente MCP a tu flujo y conectándolo a tu agente de IA:

Haz clic en el componente MCP para abrir el panel de configuración. En la sección de configuración del sistema MCP, inserta los detalles de tu servidor MCP usando este formato JSON:
{
"kokoro-tts-mcp": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Una vez configurado, el agente de IA puede utilizar este MCP como herramienta con acceso a todas sus funciones y capacidades. Recuerda cambiar “kokoro-tts-mcp” por el nombre real de tu servidor MCP y reemplazar la URL por la de tu MCP.
Resumen
Sección | Disponibilidad | Detalles/Notas |
---|---|---|
Resumen | ✅ | Servidor texto-a-voz para flujos de trabajo IA |
Lista de Prompts | ⛔ | No se encontraron plantillas de prompts |
Lista de Recursos | ⛔ | No hay recursos MCP explícitos documentados |
Lista de Herramientas | ✅ | TTS, subida a S3, gestión de archivos locales |
Protección de Claves API | ✅ | Uso documentado de variables de entorno para AWS y configuración |
Soporte Sampling (menos relevante en la evaluación) | ⛔ | Sin mención de función de sampling para LLM |
Nuestra opinión
Kokoro TTS MCP Server es una herramienta enfocada y práctica, que ofrece una solución especializada para tareas de texto a voz con integración en la nube. Carece de primitivas de prompts y recursos, pero es de código abierto, bien configurada y soporta gestión segura de claves. No se mencionan sampling ni soporte para Roots, lo que limita capacidades agenticas avanzadas. Para casos TTS es robusto y útil, aunque no tan completo como servidores MCP más generalistas.
MCP Score
Tiene LICENSE | ✅ (Apache-2.0) |
---|---|
Tiene al menos una herramienta | ✅ |
Número de Forks | 7 |
Número de Stars | 39 |
Preguntas frecuentes
- ¿Qué es el Servidor MCP Kokoro TTS?
El Servidor MCP Kokoro TTS es un servidor Model Context Protocol que permite a agentes y clientes de IA convertir texto en audio de voz de alta calidad, con opciones para voz, velocidad, idioma y almacenamiento en la nube. Es ideal para añadir texto a voz a chatbots, herramientas de accesibilidad y flujos de automatización.
- ¿Cuáles son las principales características de Kokoro TTS MCP?
Soporta voces, velocidades e idiomas personalizables usando modelos de HuggingFace y pesos ONNX. El audio puede almacenarse localmente o subirse a Amazon S3. Es fácil de integrar en entornos de desarrollo, chatbots y pipelines de automatización.
- ¿Cómo aseguro mis credenciales AWS para la subida a S3?
Nunca codifiques credenciales directamente en archivos de configuración. Usa variables de entorno para pasar de manera segura información sensible como AWS_ACCESS_KEY_ID y AWS_SECRET_ACCESS_KEY al Servidor MCP Kokoro TTS.
- ¿Cuáles son los casos de uso típicos?
Los casos de uso incluyen soluciones de accesibilidad (voz para usuarios con discapacidad visual), notificaciones por voz, creación de contenido (locuciones para medios), IA conversacional y archivado de audio para cumplimiento.
- ¿Puedo usar Kokoro TTS con FlowHunt?
Sí, puedes agregar Kokoro TTS como un componente MCP en tu flujo de trabajo FlowHunt, permitiendo que tus agentes generen respuestas de audio y utilicen todas las herramientas y configuraciones soportadas.
- ¿Kokoro TTS soporta sampling avanzado de LLM o plantillas de prompts?
No, Kokoro TTS está enfocado en texto a voz de alta calidad y no proporciona primitivas de prompt ni funciones de sampling para LLM.
Integra Kokoro TTS en tu flujo de trabajo de IA
Añade síntesis de voz natural y de alta calidad a tus chatbots y automatizaciones con Kokoro TTS MCP Server. Pruébalo en FlowHunt o conéctalo con tu propia infraestructura.