Kokoro TTS MCP Server

Kokoro TTS MCP Server

Kokoro TTS MCP Server aduce text-to-speech natural și personalizabil în aplicațiile tale AI, cu suport pentru stocare audio locală și în cloud, ideal pentru accesibilitate, automatizare și creare de conținut.

Ce face serverul “Kokoro TTS” MCP?

Serverul Kokoro Text to Speech (TTS) MCP este un server Model Context Protocol (MCP) care permite asistenților AI și clienților să genereze audio de vorbire de înaltă calitate din text. Prin conectarea fluxurilor AI la acest server, utilizatorii pot converti textul în fișiere .mp3 și, opțional, le pot încărca pe Amazon S3 sau stocare compatibilă. Kokoro TTS folosește modele avansate (prin HuggingFace spaces și greutăți ONNX) pentru a oferi voci, viteze și limbi personalizabile, facilitând integrarea fără întreruperi a capabilităților text-to-speech în medii de dezvoltare, chatboți sau fluxuri de automatizare. Acest server MCP este deosebit de valoros în scenarii unde este necesară vorbirea sintetizată pentru accesibilitate, notificări sau creare de conținut.

Listă de prompturi

Nu sunt documentate șabloane explicite de prompt în depozit.

Listă de resurse

Nu sunt documentate resurse explicite în fișierele depozitului sau în README.

Listă de instrumente

  • Generare Text-to-Speech
    Convertește textul introdus într-un fișier audio .mp3 folosind modelele Kokoro TTS. Oferă configurare pentru voce, viteză și limbă.
  • Încărcare S3
    Opțional, încarcă fișierele .mp3 generate într-un bucket/folder Amazon S3 specificat dacă este activat în configurație.
  • Management local MP3
    Stochează fișierele .mp3 generate într-un folder local desemnat și le poate șterge automat după încărcare sau după o perioadă de retenție.

Cazuri de utilizare pentru acest server MCP

  • Soluții de accesibilitate:
    Integrează Kokoro TTS în aplicații pentru a oferi feedback vocal utilizatorilor cu deficiențe de vedere sau pentru a citi conținut cu voce tare.
  • Notificări vocale:
    Automatizează alertele vocale în sisteme de monitorizare sau IoT, convertind mesajele de eveniment în audio.
  • Creare de conținut:
    Generează voiceover pentru videoclipuri, podcasturi sau media interactivă direct din scenarii scrise.
  • AI conversațional/Chatboți:
    Permite chatboților să răspundă vocal, crescând implicarea utilizatorului în asistență pentru clienți sau scenarii de asistent virtual.
  • Arhivare audio & conformitate:
    Creează înregistrări audio ale comunicărilor bazate pe text pentru conformitate sau arhivare.

Cum se setează

Windsurf

  1. Asigură-te că ai instalat uv și ai descărcat toate fișierele de modele Kokoro.
  2. Clonează depozitul Kokoro TTS MCP pe mașina ta locală.
  3. Editează fișierul de configurare Windsurf pentru a adăuga serverul Kokoro TTS MCP.
  4. Adaugă următorul fragment JSON în obiectul mcpServers:
    {
      "kokoro-tts-mcp": {
        "command": "uv",
        "args": [
          "--directory",
          "/path/toyourlocal/kokoro-tts-mcp",
          "run",
          "mcp-tts.py"
        ],
        "env": {
          "TTS_VOICE": "af_heart",
          "TTS_SPEED": "1.0",
          "TTS_LANGUAGE": "en-us",
          "AWS_ACCESS_KEY_ID": "",
          "AWS_SECRET_ACCESS_KEY": "",
          "AWS_REGION": "us-east-1",
          "AWS_S3_FOLDER": "mp3",
          "S3_ENABLED": "true",
          "MP3_FOLDER": "/path/to/mp3"
        }
      }
    }
    
  5. Salvează configurația și repornește Windsurf.

Claude

  1. Instalează precondițiile (Node.js, uv, modelele Kokoro).
  2. Adaugă serverul Kokoro TTS MCP în secțiunea mcpServers a lui Claude.
  3. Inserează configurația JSON ca mai sus.
  4. Salvează și repornește mediul Claude.

Cursor

  1. Descarcă depozitul și fișierele de model necesare.
  2. Actualizează cursor.json sau configurația echivalentă pentru a include serverul Kokoro TTS MCP.
  3. Copiază fragmentul JSON furnizat, actualizând căile după necesitate.
  4. Salvează modificările și repornește Cursor.

Cline

  1. Clonează depozitul și configurează variabilele de mediu.
  2. Editează configurația Cline, adăugând serverul Kokoro TTS MCP ca în exemplu.
  3. Salvează și repornește clientul Cline.

Securizarea cheilor API

Folosește întotdeauna variabile de mediu pentru a stoca informații sensibile precum credențialele AWS. Exemplu:

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

Setează aceste variabile în sistemul tău sau mediul CI, nu introduce niciodată secrete direct în fișierele de configurare.

Cum folosești acest MCP în fluxuri

Folosirea MCP în FlowHunt

Pentru a integra servere MCP în fluxul tău FlowHunt, adaugă componenta MCP în flow și conecteaz-o la agentul tău AI:

FlowHunt MCP flow

Apasă pe componenta MCP pentru a deschide panoul de configurare. În secțiunea de configurare MCP de sistem, inserează detaliile serverului MCP folosind acest format JSON:

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Odată configurat, agentul AI poate folosi acest MCP ca instrument cu acces la toate funcțiile și capabilitățile sale. Nu uita să schimbi “kokoro-tts-mcp” cu numele real al serverului tău MCP și să înlocuiești URL-ul cu adresa serverului tău MCP.


Prezentare generală

SecțiuneDisponibilitateDetalii/Note
Prezentare generalăServer text-to-speech pentru fluxuri AI
Listă de prompturiNu au fost găsite șabloane de prompt
Listă de resurseNu sunt documentate resurse MCP explicite
Listă de instrumenteTTS, încărcare S3, management fișiere locale
Securizarea cheilor APIFolosirea variabilelor de mediu pentru AWS și config este documentată
Suport sampling (mai puțin important în evaluare)Nu este menționat suport pentru sampling LLM

Opinia noastră

Kokoro TTS MCP Server este concentrat și practic, oferind un instrument specializat pentru sarcini text-to-speech cu integrare în cloud. Îi lipsesc primitivele de prompt și resurse, dar este open source, bine configurat și suportă managementul securizat al cheilor. Nu este menționat support pentru sampling sau Roots, ceea ce limitează capabilitățile agentice avansate. Pentru cazuri de utilizare TTS, este robust și util, chiar dacă nu este la fel de bogat în funcții ca serverele MCP mai generaliste.

Scor MCP

Are LICENSE✅ (Apache-2.0)
Are cel puțin un instrument
Numărul de Fork-uri7
Numărul de stele39

Întrebări frecvente

Ce este serverul Kokoro TTS MCP?

Kokoro TTS MCP Server este un server Model Context Protocol care permite agenților AI și clienților să convertească textul introdus în audio de vorbire de înaltă calitate, cu opțiuni pentru voce, viteză, limbă și stocare în cloud. Este ideal pentru integrarea funcției text-to-speech în chatboți, instrumente de accesibilitate și fluxuri de automatizare.

Care sunt principalele caracteristici ale Kokoro TTS MCP?

Suportă voci, viteze și limbi personalizabile folosind modele HuggingFace și greutăți ONNX. Audio-ul poate fi stocat local sau încărcat pe Amazon S3. Se integrează ușor în medii de dezvoltare, chatboți și fluxuri de automatizare.

Cum îmi securizez acreditările AWS pentru încărcare pe S3?

Nu salva niciodată acreditările direct în fișierele de configurare. Folosește variabile de mediu pentru a transmite în siguranță informații sensibile precum AWS_ACCESS_KEY_ID și AWS_SECRET_ACCESS_KEY către Kokoro TTS MCP Server.

Care sunt cazurile tipice de utilizare?

Cazurile de utilizare includ soluții de accesibilitate (vorbire pentru utilizatori cu deficiențe de vedere), notificări vocale, creare de conținut (voiceover pentru media), AI conversațional și arhivare audio pentru conformitate.

Pot folosi Kokoro TTS cu FlowHunt?

Da, poți adăuga Kokoro TTS ca un component MCP în fluxul tău FlowHunt, permițând agenților să genereze răspunsuri audio și să utilizeze toate instrumentele și configurațiile suportate.

Kokoro TTS suportă sampling LLM avansat sau șabloane de prompt?

Nu, Kokoro TTS este axat pe text-to-speech de calitate înaltă și nu oferă primitive de prompt sau funcții de sampling LLM.

Integrează Kokoro TTS în fluxul tău de lucru AI

Adaugă sinteză vocală naturală și de înaltă calitate chatbot-urilor și automatizărilor tale cu Kokoro TTS MCP Server. Încearcă-l în FlowHunt sau conectează-l cu propria infrastructură.

Află mai multe

Typesense MCP Server
Typesense MCP Server

Typesense MCP Server

Typesense MCP Server conectează agenții AI la Typesense, un motor de căutare open-source, permițând LLM-urilor să caute, să recupereze și să analizeze colecții ...

5 min citire
AI Search +6
Markdownify MCP Server
Markdownify MCP Server

Markdownify MCP Server

Markdownify MCP Server convertește diverse tipuri de fișiere și conținut web—precum PDF-uri, DOCX, imagini, audio și pagini web—în format Markdown standardizat,...

5 min citire
AI Document Conversion +4
mcp-rquest MCP Server
mcp-rquest MCP Server

mcp-rquest MCP Server

Serverul mcp-rquest MCP oferă asistenților AI capabilități avansate de solicitări HTTP similare browserelor, mecanisme robuste de evitare a sistemelor anti-bot ...

4 min citire
MCP Server HTTP +5