Kokoro TTS MCP Server
Kokoro TTS MCP Server dostarcza naturalnie brzmiącą, konfigurowalną syntezę mowy do Twoich aplikacji AI, z obsługą lokalnego i chmurowego przechowywania dźwięku – idealny dla dostępności, automatyzacji oraz tworzenia treści.

Co robi serwer “Kokoro TTS” MCP?
Kokoro Text to Speech (TTS) MCP Server to serwer Model Context Protocol (MCP), który umożliwia asystentom AI i klientom generowanie wysokiej jakości dźwięku mowy na podstawie wprowadzonego tekstu. Dzięki połączeniu workflow AI z tym serwerem użytkownicy mogą konwertować tekst na pliki .mp3 i opcjonalnie przesyłać je do Amazon S3 lub kompatybilnych magazynów. Kokoro TTS wykorzystuje zaawansowane modele (poprzez HuggingFace spaces i wagi ONNX), oferując konfigurowalne głosy, prędkości oraz języki, co ułatwia integrację funkcji text-to-speech w środowiskach deweloperskich, chatbotach lub pipeline’ach automatyzacji. Ten serwer MCP jest szczególnie przydatny w sytuacjach, gdzie potrzebna jest syntezowana mowa – na potrzeby dostępności, powiadomień lub tworzenia treści.
Lista promptów
W repozytorium nie udokumentowano jawnych szablonów promptów.
Lista zasobów
W plikach repozytorium lub README nie udokumentowano jawnych zasobów.
Lista narzędzi
- Generowanie Text-to-Speech
Konwertuje wprowadzony tekst na plik audio .mp3 przy użyciu modeli Kokoro TTS. Oferuje konfigurację głosu, prędkości i języka. - Wysyłanie do S3
Opcjonalnie przesyła wygenerowane pliki .mp3 do wskazanego zasobnika/folderu Amazon S3, jeśli taka opcja jest włączona w konfiguracji. - Lokalne zarządzanie MP3
Przechowuje wygenerowane pliki .mp3 w wyznaczonym folderze lokalnym i może je automatycznie usuwać po przesłaniu lub po okresie retencji.
Przykładowe zastosowania tego serwera MCP
- Rozwiązania dostępnościowe:
Zintegruj Kokoro TTS z aplikacjami, aby zapewnić informację głosową dla użytkowników niedowidzących lub odczytywać treści na głos. - Powiadomienia głosowe:
Automatyzuj alerty głosowe w systemach monitoringu lub IoT, konwertując komunikaty zdarzeń na mowę. - Tworzenie treści:
Generuj lektora do wideo, podcastów lub interaktywnych mediów bezpośrednio ze scenariuszy tekstowych. - Konwersacyjna AI/Chatboty:
Pozwól chatbotom odpowiadać głosowo, zwiększając zaangażowanie użytkowników w obsłudze klienta lub wirtualnych asystentach. - Archiwizacja dźwięku i zgodność:
Twórz nagrania audio komunikacji tekstowej na potrzeby zgodności lub archiwizacji.
Jak to skonfigurować
Windsurf
- Upewnij się, że masz zainstalowane
uv
oraz pobrane wszystkie pliki modeli Kokoro. - Sklonuj repozytorium Kokoro TTS MCP na swój lokalny komputer.
- Edytuj plik konfiguracyjny Windsurf, dodając serwer Kokoro TTS MCP.
- Dodaj poniższy fragment JSON do obiektu
mcpServers
:{ "kokoro-tts-mcp": { "command": "uv", "args": [ "--directory", "/path/toyourlocal/kokoro-tts-mcp", "run", "mcp-tts.py" ], "env": { "TTS_VOICE": "af_heart", "TTS_SPEED": "1.0", "TTS_LANGUAGE": "en-us", "AWS_ACCESS_KEY_ID": "", "AWS_SECRET_ACCESS_KEY": "", "AWS_REGION": "us-east-1", "AWS_S3_FOLDER": "mp3", "S3_ENABLED": "true", "MP3_FOLDER": "/path/to/mp3" } } }
- Zapisz konfigurację i zrestartuj Windsurf.
Claude
- Zainstaluj wymagane zależności (Node.js, uv, modele Kokoro).
- Dodaj serwer Kokoro TTS MCP w sekcji
mcpServers
Claude’a. - Wstaw konfigurację JSON jak wyżej.
- Zapisz i zrestartuj środowisko Claude.
Cursor
- Pobierz repozytorium oraz wymagane pliki modeli.
- Zaktualizuj plik
cursor.json
lub równoważny, aby dodać serwer Kokoro TTS MCP. - Skopiuj podany fragment JSON, aktualizując ścieżki według potrzeb.
- Zapisz zmiany i zrestartuj Cursor.
Cline
- Sklonuj repozytorium i skonfiguruj zmienne środowiskowe.
- Edytuj konfigurację Cline, dodając serwer Kokoro TTS MCP zgodnie z instrukcją.
- Zapisz i zrestartuj klienta Cline.
Zabezpieczanie kluczy API
Zawsze używaj zmiennych środowiskowych do przechowywania wrażliwych informacji, takich jak dane uwierzytelniające AWS. Przykład:
"env": {
"AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
"AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
...
}
Ustaw te zmienne w swoim systemie lub środowisku CI – nigdy nie zapisuj sekretów na stałe w plikach konfiguracyjnych.
Jak korzystać z tego MCP we flow
Użycie MCP w FlowHunt
Aby zintegrować serwery MCP z workflow FlowHunt, zacznij od dodania komponentu MCP do swojego flow i podłączenia go do agenta AI:

Kliknij na komponent MCP, aby otworzyć panel konfiguracji. W sekcji konfiguracji MCP systemu wstaw dane swojego serwera MCP w formacie JSON:
{
"kokoro-tts-mcp": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Po zapisaniu konfiguracji agent AI może korzystać z tego MCP jako narzędzia z dostępem do wszystkich jego funkcji. Pamiętaj, aby zmienić “kokoro-tts-mcp” na faktyczną nazwę swojego serwera MCP i podać własny URL serwera.
Podsumowanie
Sekcja | Dostępność | Szczegóły/Uwagi |
---|---|---|
Przegląd | ✅ | Serwer text-to-speech dla workflow AI |
Lista promptów | ⛔ | Brak szablonów promptów |
Lista zasobów | ⛔ | Brak jawnych zasobów MCP w dokumentacji |
Lista narzędzi | ✅ | TTS, wysyłka do S3, zarządzanie plikami lokalnymi |
Zabezpieczanie kluczy API | ✅ | Udokumentowane użycie zmiennych środowiskowych dla AWS i konfiguracji |
Wsparcie próbkowania (mniej istotne w ocenie) | ⛔ | Brak wzmianki o funkcji próbkowania LLM |
Nasza opinia
Kokoro TTS MCP Server to narzędzie ukierunkowane i praktyczne, oferujące wyspecjalizowane rozwiązanie do zadań text-to-speech z integracją chmurową. Brakuje w nim prymitywów promptów i zasobów, ale jest open source, dobrze skonfigurowany i obsługuje bezpieczne zarządzanie kluczami. Nie wspomina się o wsparciu próbkowania czy Roots, co ogranicza zaawansowane możliwości agentowe. Do zastosowań TTS jest solidny i użyteczny, choć mniej rozbudowany niż bardziej ogólne serwery MCP.
Ocena MCP
Posiada LICENCJĘ | ✅ (Apache-2.0) |
---|---|
Ma przynajmniej jedno narzędzie | ✅ |
Liczba forków | 7 |
Liczba gwiazdek | 39 |
Najczęściej zadawane pytania
- Czym jest Kokoro TTS MCP Server?
Kokoro TTS MCP Server to serwer Model Context Protocol, który umożliwia agentom i klientom AI konwersję tekstu na wysokiej jakości dźwięk mowy, z opcjami wyboru głosu, prędkości, języka oraz przechowywania w chmurze. Idealny do dodania funkcji text-to-speech do chatbotów, narzędzi dostępności czy automatyzacji.
- Jakie są główne funkcje Kokoro TTS MCP?
Obsługuje konfigurowalne głosy, prędkości i języki wykorzystując modele HuggingFace i wagi ONNX. Dźwięk może być przechowywany lokalnie lub przesyłany do Amazon S3. Integracja z środowiskami deweloperskimi, chatbotami i pipeline’ami automatyzacji jest prosta.
- Jak zabezpieczyć dane AWS do przesyłania na S3?
Nigdy nie umieszczaj danych uwierzytelniających w plikach konfiguracyjnych. Używaj zmiennych środowiskowych, aby bezpiecznie przekazywać wrażliwe informacje, takie jak AWS_ACCESS_KEY_ID i AWS_SECRET_ACCESS_KEY, do serwera Kokoro TTS MCP.
- Jakie są typowe zastosowania?
Przykłady zastosowań to rozwiązania dla dostępności (mowa dla osób niedowidzących), powiadomienia głosowe, tworzenie treści (lektor do materiałów), konwersacyjna AI oraz archiwizacja dźwięku dla zgodności.
- Czy mogę używać Kokoro TTS z FlowHunt?
Tak, możesz dodać Kokoro TTS jako komponent MCP w swoim workflow FlowHunt, umożliwiając agentom generowanie odpowiedzi głosowych i korzystanie ze wszystkich obsługiwanych narzędzi oraz konfiguracji.
- Czy Kokoro TTS obsługuje zaawansowane próbkowanie LLM lub szablony promptów?
Nie, Kokoro TTS skupia się na wysokiej jakości syntezie mowy i nie udostępnia prymitywów promptów ani funkcji próbkowania LLM.
Zintegruj Kokoro TTS z Twoim workflow AI
Dodaj naturalną, wysokiej jakości syntezę mowy do swoich chatbotów i automatyzacji za pomocą Kokoro TTS MCP Server. Wypróbuj w FlowHunt lub połącz z własną infrastrukturą.