Kokoro TTS MCP-server

Kokoro TTS MCP-server

Kokoro TTS MCP-server levererar naturligt, anpassningsbart text-till-tal till dina AI-applikationer, med stöd för lokal och molnbaserad ljudlagring – perfekt för tillgänglighet, automatisering och innehållsskapande.

Vad gör “Kokoro TTS” MCP-servern?

Kokoro Text to Speech (TTS) MCP-servern är en Model Context Protocol (MCP)-server som gör det möjligt för AI-assistenter och klienter att generera högkvalitativt tal-ljud från textinmatning. Genom att koppla AI-arbetsflöden till denna server kan användare konvertera text till .mp3-filer och vid behov ladda upp dem till Amazon S3 eller kompatibla lagringstjänster. Kokoro TTS använder avancerade modeller (via HuggingFace spaces och ONNX-vikter) för att erbjuda anpassningsbara röster, hastigheter och språk, vilket förenklar integrering av text-till-tal-funktioner i utvecklingsmiljöer, chatbots eller automatiseringsflöden. Denna MCP-server är särskilt värdefull där syntetiskt tal behövs för tillgänglighet, notifieringar eller innehållsskapande.

Lista över promts

Inga explicita promptmallar finns dokumenterade i repot.

Resurslista

Inga explicita resurser finns dokumenterade i repo-filerna eller README.

Verktygslista

  • Text-till-tal-generering
    Konverterar inskriven text till en .mp3-ljudfil med Kokoro TTS-modeller. Erbjuder konfiguration för röst, hastighet och språk.
  • S3-uppladdning
    Laddar vid behov upp genererade .mp3-filer till en angiven Amazon S3-bucket/mapp om det är aktiverat i konfigurationen.
  • Lokal MP3-hantering
    Sparar genererade .mp3-filer i en angiven lokal mapp och kan automatiskt ta bort dem efter uppladdning eller efter en viss behållningstid.

Användningsområden för denna MCP-server

  • Tillgänglighetslösningar:
    Integrera Kokoro TTS i applikationer för att ge talåterkoppling till synskadade användare eller för att läsa upp innehåll.
  • Röstnotifieringar:
    Automatisera röstlarm i övervaknings- eller IoT-system genom att konvertera händelsemeddelanden till tal-ljud.
  • Innehållsskapande:
    Skapa voiceovers för videor, podcasts eller interaktiva medier direkt från manus.
  • Konversations-AI/Chatbots:
    Låt chatbots svara med talat utdata för ökad användarengagemang i kundsupport eller virtuella assistentmiljöer.
  • Ljudarkivering & efterlevnad:
    Skapa ljudarkiv av textbaserad kommunikation för efterlevnad eller arkivering.

Så här sätter du upp det

Windsurf

  1. Säkerställ att du har uv och alla Kokoro-modellfiler nedladdade.
  2. Klona Kokoro TTS MCP-repot till din lokala maskin.
  3. Redigera din Windsurf-konfigurationsfil för att lägga till Kokoro TTS MCP-servern.
  4. Lägg till följande JSON-snutt i ditt objekt mcpServers:
    {
      "kokoro-tts-mcp": {
        "command": "uv",
        "args": [
          "--directory",
          "/path/toyourlocal/kokoro-tts-mcp",
          "run",
          "mcp-tts.py"
        ],
        "env": {
          "TTS_VOICE": "af_heart",
          "TTS_SPEED": "1.0",
          "TTS_LANGUAGE": "en-us",
          "AWS_ACCESS_KEY_ID": "",
          "AWS_SECRET_ACCESS_KEY": "",
          "AWS_REGION": "us-east-1",
          "AWS_S3_FOLDER": "mp3",
          "S3_ENABLED": "true",
          "MP3_FOLDER": "/path/to/mp3"
        }
      }
    }
    
  5. Spara din konfiguration och starta om Windsurf.

Claude

  1. Installera förkrav (Node.js, uv, Kokoro-modeller).
  2. Lägg till Kokoro TTS MCP-servern i Claudes mcpServers-sektion.
  3. Sätt in JSON-konfigurationen som ovan.
  4. Spara och starta om Claude-miljön.

Cursor

  1. Ladda ner repot och nödvändiga modellfiler.
  2. Uppdatera cursor.json eller motsvarande config för att inkludera Kokoro TTS MCP-servern.
  3. Kopiera den medföljande JSON-snippet, uppdatera sökvägar vid behov.
  4. Spara ändringar och starta om Cursor.

Cline

  1. Klona repot och konfigurera miljövariabler.
  2. Redigera Cline-konfigurationen och lägg till Kokoro TTS MCP-servern som visas.
  3. Spara och starta om Cline-klienten.

Skydda API-nycklar

Använd alltid miljövariabler för att lagra känslig information som AWS-uppgifter. Exempel:

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

Sätt dessa variabler i ditt system eller CI-miljö, och hårdkoda aldrig hemligheter i dina konfigurationsfiler.

Hur du använder denna MCP i flöden

Använda MCP i FlowHunt

För att integrera MCP-servrar i ditt FlowHunt-arbetsflöde börjar du med att lägga till MCP-komponenten i ditt flöde och koppla den till din AI-agent:

FlowHunt MCP-flöde

Klicka på MCP-komponenten för att öppna konfigurationspanelen. I systemets MCP-konfigurationssektion, ange din MCP-server-information med detta JSON-format:

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

När det är konfigurerat kan AI-agenten nu använda denna MCP som ett verktyg med tillgång till alla dess funktioner och möjligheter. Kom ihåg att ändra “kokoro-tts-mcp” till det faktiska namnet på din MCP-server och byt ut URL:en mot din egen MCP-server-URL.


Översikt

SektionTillgängligDetaljer/Noteringar
ÖversiktText-till-tal-server för AI-arbetsflöden
Lista över promtsInga promptmallar funna
ResurslistaInga explicita MCP-resurser dokumenterade
VerktygslistaTTS, S3-uppladdning, lokal filhantering
Skydda API-nycklarDokumenterat bruk av miljövariabler för AWS och config
Stöd för sampling (mindre viktigt i utvärdering)Ingen nämnd funktion för LLM-sampling

Vår åsikt

Kokoro TTS MCP-servern är fokuserad och praktisk, och erbjuder ett specialiserat verktyg för text-till-tal-uppgifter med molnintegration. Den saknar prompt- och resursprimitiver men är öppen källkod, välkonfigurerad och stöder säker nyckelhantering. Sampling och Roots-stöd nämns inte, vilket begränsar avancerade agentfunktioner. För TTS-användningsfall är den robust och användbar, om än inte lika funktionsrik som mer allmänna MCP-servrar.

MCP-betyg

Har en LICENS✅ (Apache-2.0)
Har minst ett verktyg
Antal förgreningar7
Antal stjärnor39

Vanliga frågor

Vad är Kokoro TTS MCP-server?

Kokoro TTS MCP-server är en Model Context Protocol-server som gör det möjligt för AI-agenter och klienter att konvertera text till högkvalitativt tal-ljud med val för röst, hastighet, språk och molnlagring. Den är idealisk för att lägga till text-till-tal i chatbots, tillgänglighetsverktyg och automatiseringsflöden.

Vilka är de viktigaste funktionerna i Kokoro TTS MCP?

Den stöder anpassningsbara röster, hastigheter och språk via HuggingFace-modeller och ONNX-vikter. Ljud kan lagras lokalt eller laddas upp till Amazon S3. Den är enkel att integrera i utvecklingsmiljöer, chatbots och automatiseringspipelines.

Hur skyddar jag mina AWS-uppgifter för S3-uppladdning?

Hårdkoda aldrig uppgifter i konfigurationsfiler. Använd miljövariabler för att säkert överföra känslig information som AWS_ACCESS_KEY_ID och AWS_SECRET_ACCESS_KEY till Kokoro TTS MCP-servern.

Vilka är de typiska användningsområdena?

Användningsområden inkluderar tillgänglighetslösningar (tal för synskadade användare), röstnotifieringar, innehållsskapande (voiceovers till media), konversations-AI och ljudarkivering för efterlevnad.

Kan jag använda Kokoro TTS med FlowHunt?

Ja, du kan lägga till Kokoro TTS som en MCP-komponent i ditt FlowHunt-arbetsflöde och göra det möjligt för dina agenter att generera ljudsvar samt använda alla stödda verktyg och konfigurationer.

Stöder Kokoro TTS avancerad LLM-sampling eller promptmallar?

Nej, Kokoro TTS är fokuserad på högkvalitativ text-till-tal och tillhandahåller inte promptprimitiver eller LLM-sampling-funktioner.

Integrera Kokoro TTS i ditt AI-arbetsflöde

Lägg till naturlig, högkvalitativ talsyntes till dina chatbots och automatiseringar med Kokoro TTS MCP-server. Prova i FlowHunt eller anslut till din egen infrastruktur.

Lär dig mer

Typesense MCP Server
Typesense MCP Server

Typesense MCP Server

Typesense MCP Server kopplar AI-agenter till Typesense, en öppen källkodssökmotor, vilket möjliggör för LLM:er att söka, hämta och analysera strukturerade datak...

4 min läsning
AI Search +6
Markdownify MCP Server
Markdownify MCP Server

Markdownify MCP Server

Markdownify MCP Server konverterar olika filtyper och webbinnehåll—såsom PDF, DOCX, bilder, ljud och webbsidor—till standardiserat Markdown-format, vilket ger A...

4 min läsning
AI Document Conversion +4
SlideSpeak MCP-server
SlideSpeak MCP-server

SlideSpeak MCP-server

SlideSpeak MCP-servern kopplar AI-assistenter till SlideSpeak API och möjliggör automatiserad, programmatisk skapande av PowerPoint-presentationer för företag, ...

3 min läsning
MCP Server Automation +4