Kokoro TTS MCP-server

Kokoro TTS MCP-server

Kokoro TTS MCP-server gir naturtro, tilpassbar tekst-til-tale til dine AI-applikasjoner, med støtte for lokal og skybasert lydlagring – ideelt for tilgjengelighet, automatisering og innholdsproduksjon.

Hva gjør “Kokoro TTS” MCP-serveren?

Kokoro Text to Speech (TTS) MCP-serveren er en Model Context Protocol (MCP)-server som lar AI-assistenter og klienter generere høykvalitets tale fra tekstinnhold. Ved å koble AI-arbeidsflyter til denne serveren, kan brukere konvertere tekst til .mp3-filer og eventuelt laste dem opp til Amazon S3 eller kompatibel lagring. Kokoro TTS benytter avanserte modeller (via HuggingFace-spaces og ONNX-vekter) for å tilby tilpassbare stemmer, hastigheter og språk, noe som gjør det enkelt å integrere tekst-til-tale i utviklingsmiljøer, chatboter eller automasjonsløsninger. Denne MCP-serveren er spesielt nyttig i scenarier hvor syntetisk tale trengs, for eksempel for tilgjengelighet, varslinger eller innholdsproduksjon.

Liste over prompt-maler

Ingen eksplisitte prompt-maler er dokumentert i repositoriet.

Liste over ressurser

Ingen eksplisitte ressurser er dokumentert i repositoriets filer eller README.

Liste over verktøy

  • Tekst-til-tale-generering
    Konverterer innsendt tekst til en .mp3-lydfil ved bruk av Kokoro TTS-modeller. Tilbyr konfigurasjon av stemme, hastighet og språk.
  • S3-opplasting
    Kan om ønskelig laste opp genererte .mp3-filer til en spesifisert Amazon S3-bøtte/mappe hvis aktivert i konfigurasjonen.
  • Lokal MP3-håndtering
    Lagrer genererte .mp3-filer i en angitt lokal mappe og kan automatisk slette dem etter opplasting eller etter en oppbevaringsperiode.

Bruksområder for denne MCP-serveren

  • Tilgjengelighetsløsninger:
    Integrer Kokoro TTS i applikasjoner for å gi tale til synshemmede brukere eller lese innhold høyt.
  • Stemmevarsler:
    Automatiser stemmevarslinger i overvåknings- eller IoT-systemer ved å konvertere hendelsesmeldinger til tale.
  • Innholdsproduksjon:
    Lag stemmespor for videoer, podkaster eller interaktive medier direkte fra manus.
  • Konversasjonell AI/Chatboter:
    La chatboter svare med tale, og gi bedre brukeropplevelse i kundestøtte eller virtuelle assistenter.
  • Lydarkivering og samsvar:
    Lag lydopptak av tekstbasert kommunikasjon for samsvar eller arkivering.

Slik setter du det opp

Windsurf

  1. Sørg for at du har uv og alle Kokoro-modellfilene lastet ned.
  2. Klon Kokoro TTS MCP-repositoriet til din lokale maskin.
  3. Rediger Windsurf-konfigurasjonsfilen for å legge til Kokoro TTS MCP-serveren.
  4. Legg til følgende JSON-snutt i mcpServers-objektet ditt:
    {
      "kokoro-tts-mcp": {
        "command": "uv",
        "args": [
          "--directory",
          "/path/toyourlocal/kokoro-tts-mcp",
          "run",
          "mcp-tts.py"
        ],
        "env": {
          "TTS_VOICE": "af_heart",
          "TTS_SPEED": "1.0",
          "TTS_LANGUAGE": "en-us",
          "AWS_ACCESS_KEY_ID": "",
          "AWS_SECRET_ACCESS_KEY": "",
          "AWS_REGION": "us-east-1",
          "AWS_S3_FOLDER": "mp3",
          "S3_ENABLED": "true",
          "MP3_FOLDER": "/path/to/mp3"
        }
      }
    }
    
  5. Lagre konfigurasjonen og start Windsurf på nytt.

Claude

  1. Installer forutsetninger (Node.js, uv, Kokoro-modeller).
  2. Legg til Kokoro TTS MCP-serveren i Claudes mcpServers-seksjon.
  3. Sett inn JSON-konfigurasjonen som over.
  4. Lagre og start Claude-miljøet på nytt.

Cursor

  1. Last ned repositoriet og nødvendige modellfiler.
  2. Oppdater cursor.json eller tilsvarende konfigurasjon for å inkludere Kokoro TTS MCP-serveren.
  3. Kopier den oppgitte JSON-snippet, og tilpass stier etter behov.
  4. Lagre endringer og start Cursor på nytt.

Cline

  1. Klon repositoriet og konfigurer miljøvariabler.
  2. Rediger Cline-konfigurasjonen og legg til Kokoro TTS MCP-serveren som vist.
  3. Lagre og start Cline-klienten på nytt.

Sikre API-nøkler

Bruk alltid miljøvariabler til å lagre sensitiv informasjon som AWS-legitimasjon. Eksempel:

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

Sett disse variablene i systemet ditt eller CI-miljøet, og aldri hardkod hemmeligheter i konfigurasjonsfilene dine.

Slik bruker du denne MCP-en i flyter

Bruke MCP i FlowHunt

For å integrere MCP-servere i din FlowHunt-arbeidsflyt, start med å legge til MCP-komponenten i flyten og koble den til AI-agenten din:

FlowHunt MCP flow

Klikk på MCP-komponenten for å åpne konfigurasjonspanelet. I systemets MCP-konfigurasjonsseksjon, sett inn MCP-serverdetaljene dine i dette JSON-formatet:

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Når dette er satt opp, kan AI-agenten bruke denne MCP-en som et verktøy med tilgang til alle dens funksjoner og egenskaper. Husk å endre “kokoro-tts-mcp” til navnet på din MCP-server og bytt ut URL-en med din egen MCP-server-URL.


Oversikt

SeksjonTilgjengeligDetaljer/Notater
OversiktTekst-til-tale-server for AI-arbeidsflyter
Liste over prompt-malerIngen prompt-maler funnet
Liste over ressurserIngen eksplisitte MCP-ressurser dokumentert
Liste over verktøyTTS, S3-opplasting, lokal filhåndtering
Sikre API-nøklerBeskrevet bruk av miljøvariabler for AWS og konfigurasjon
Sampling-støtte (mindre viktig i evaluering)Ingen omtale av LLM sampling-funksjon

Vår vurdering

Kokoro TTS MCP-server er fokusert og praktisk, og tilbyr et spesialisert verktøy for tekst-til-tale-oppgaver med skyintegrasjon. Den mangler prompt- og ressurs-primitiver, men er åpen kildekode, godt konfigurert og støtter sikker nøkkelhåndtering. Sampling og Roots-støtte er ikke nevnt, noe som begrenser avanserte agent-funksjoner. For TTS-bruk er den robust og nyttig, selv om den ikke er like funksjonsrik som mer generelle MCP-servere.

MCP-score

Har en LISENS✅ (Apache-2.0)
Har minst ett verktøy
Antall forks7
Antall stjerner39

Vanlige spørsmål

Hva er Kokoro TTS MCP-server?

Kokoro TTS MCP-server er en Model Context Protocol-server som lar AI-agenter og klienter konvertere tekst til høykvalitets tale, med muligheter for stemme, hastighet, språk og skylagring. Den er ideell for å legge til tekst-til-tale i chatboter, tilgjengelighetsverktøy og automatiseringsflyter.

Hva er hovedfunksjonene til Kokoro TTS MCP?

Den støtter tilpassbare stemmer, hastigheter og språk ved bruk av HuggingFace-modeller og ONNX-vekter. Lyd kan lagres lokalt eller lastes opp til Amazon S3. Den er enkel å integrere i utviklingsmiljøer, chatboter og automatiseringspipeliner.

Hvordan sikrer jeg AWS-legitimasjonene for S3-opplasting?

Aldri hardkod legitimasjon i konfigurasjonsfiler. Bruk miljøvariabler for å sikkert sende sensitiv informasjon som AWS_ACCESS_KEY_ID og AWS_SECRET_ACCESS_KEY til Kokoro TTS MCP-serveren.

Hva er de typiske bruksområdene?

Bruksområder inkluderer tilgjengelighetsløsninger (tale for synshemmede brukere), stemmenotifikasjoner, innholdsproduksjon (stemmespor til media), konversasjonell AI og lydarkivering for samsvar.

Kan jeg bruke Kokoro TTS med FlowHunt?

Ja, du kan legge til Kokoro TTS som en MCP-komponent i din FlowHunt-arbeidsflyt, slik at agentene dine kan generere lydsvar og bruke alle støttede verktøy og konfigurasjoner.

Støtter Kokoro TTS avansert LLM-sampling eller prompt-maler?

Nei, Kokoro TTS er fokusert på høykvalitets tekst-til-tale og tilbyr ikke prompt-primitiver eller LLM-sampling-funksjoner.

Integrer Kokoro TTS i din AI-arbeidsflyt

Legg til naturtro, høykvalitets talesyntese i chatboter og automatisering med Kokoro TTS MCP-server. Prøv det i FlowHunt eller koble til din egen infrastruktur.

Lær mer

Typesense MCP-server
Typesense MCP-server

Typesense MCP-server

Typesense MCP-server kobler AI-agenter til Typesense, en åpen kildekode søkemotor, og gjør det mulig for LLM-er å søke, hente og analysere strukturerte datakoll...

4 min lesing
AI Search +6
Markdownify MCP Server
Markdownify MCP Server

Markdownify MCP Server

Markdownify MCP Server konverterer ulike filtyper og nettinnhold—som PDF, DOCX, bilder, lyd og nettsider—til standardisert Markdown-format, og gir AI-assistente...

4 min lesing
AI Document Conversion +4
Todoist MCP Server-integrasjon
Todoist MCP Server-integrasjon

Todoist MCP Server-integrasjon

Todoist MCP Server kobler AI-assistenter med Todoist, og muliggjør oppgavehåndtering med naturlig språk—opprett, oppdater, fullfør og søk etter oppgaver direkte...

4 min lesing
AI Automation +4