Kokoro TTS MCPサーバー

Kokoro TTS MCPサーバー

Kokoro TTS MCPサーバーは、自然でカスタマイズ可能なテキスト読み上げをAIアプリケーションにもたらします。ローカルやクラウドでの音声保存にも対応し、アクセシビリティ、自動化、コンテンツ制作に最適です。

「Kokoro TTS」MCPサーバーは何をするのか?

Kokoro Text to Speech (TTS) MCPサーバーは、Model Context Protocol (MCP) サーバーであり、AIアシスタントやクライアントがテキスト入力から高品質な音声オーディオを生成できるようにします。AIワークフローをこのサーバーと接続することで、テキストを.mp3ファイルに変換し、必要に応じてAmazon S3や互換ストレージにアップロードすることが可能です。Kokoro TTSは先進的なモデル(HuggingFace spacesやONNXウェイトを利用)を活用し、音声・スピード・言語のカスタマイズを実現。開発環境やチャットボット、自動化パイプラインへのテキスト読み上げ機能のシームレスな統合を支援します。合成音声がアクセシビリティ、通知、コンテンツ制作などで必要な場面に特に有用です。

プロンプト一覧

リポジトリには明示的なプロンプトテンプレートの記載はありません。

リソース一覧

リポジトリファイルやREADMEに明示的なリソースの記載はありません。

ツール一覧

  • テキスト読み上げ生成
    入力テキストをKokoro TTSモデルで.mp3音声ファイルに変換します。音声・スピード・言語の設定が可能です。
  • S3アップロード
    設定で有効化すれば、生成した.mp3ファイルを指定のAmazon S3バケット/フォルダにアップロードできます。
  • ローカルMP3管理
    生成した.mp3ファイルを指定したローカルフォルダに保存し、アップロード後や保存期間後に自動削除も可能です。

このMCPサーバーのユースケース

  • アクセシビリティソリューション:
    Kokoro TTSをアプリケーションに統合し、視覚障害者向けの音声フィードバックやコンテンツ読み上げを提供します。
  • 音声通知:
    監視やIoTシステムのイベントメッセージを音声に変換し、自動で音声アラートを送信します。
  • コンテンツ制作:
    ビデオ・ポッドキャスト・インタラクティブメディア用のナレーションを、スクリプトから直接生成します。
  • 会話AI/チャットボット:
    チャットボットが音声で応答できるようにし、カスタマーサポートやバーチャルアシスタントのユーザー体験を向上します。
  • 音声アーカイブ&コンプライアンス:
    テキストベースのコミュニケーション記録を音声化し、法令遵守やアーカイブ目的で保存します。

セットアップ方法

Windsurf

  1. uvとすべてのKokoroモデルファイルをダウンロードしてください。
  2. Kokoro TTS MCPリポジトリをローカルマシンにクローンします。
  3. Windsurfの設定ファイルを編集し、Kokoro TTS MCPサーバーを追加します。
  4. 以下のJSONスニペットをmcpServersオブジェクトに追加します:
    {
      "kokoro-tts-mcp": {
        "command": "uv",
        "args": [
          "--directory",
          "/path/toyourlocal/kokoro-tts-mcp",
          "run",
          "mcp-tts.py"
        ],
        "env": {
          "TTS_VOICE": "af_heart",
          "TTS_SPEED": "1.0",
          "TTS_LANGUAGE": "en-us",
          "AWS_ACCESS_KEY_ID": "",
          "AWS_SECRET_ACCESS_KEY": "",
          "AWS_REGION": "us-east-1",
          "AWS_S3_FOLDER": "mp3",
          "S3_ENABLED": "true",
          "MP3_FOLDER": "/path/to/mp3"
        }
      }
    }
    
  5. 設定を保存し、Windsurfを再起動します。

Claude

  1. 必要なものをインストールします(Node.js、uv、Kokoroモデル)。
  2. ClaudeのmcpServersセクションにKokoro TTS MCPサーバーを追加します。
  3. 上記と同じJSON設定を挿入します。
  4. 設定を保存し、Claude環境を再起動します。

Cursor

  1. リポジトリと必要なモデルファイルをダウンロードします。
  2. cursor.jsonや同等の設定ファイルを更新し、Kokoro TTS MCPサーバーを追加します。
  3. 提供されたJSONスニペットをコピーし、必要に応じてパスを修正します。
  4. 変更を保存し、Cursorを再起動します。

Cline

  1. リポジトリをクローンし、環境変数を設定します。
  2. Clineの設定を編集し、Kokoro TTS MCPサーバーを追加します。
  3. 設定を保存し、Clineクライアントを再起動します。

APIキーの安全な管理

AWS認証情報など機密情報は、必ず環境変数で管理してください。例:

"env": {
  "AWS_ACCESS_KEY_ID": "${AWS_ACCESS_KEY_ID}",
  "AWS_SECRET_ACCESS_KEY": "${AWS_SECRET_ACCESS_KEY}",
  ...
}

これらの変数はシステムやCI環境に設定し、設定ファイルに直接記載しないようにしてください。

FlowHunt内フローでのMCPサーバー利用方法

FlowHuntでMCPサーバーを統合するには、まずフローにMCPコンポーネントを追加し、AIエージェントと接続します。

FlowHunt MCPフロー

MCPコンポーネントをクリックすると設定パネルが開きます。システムMCP設定セクションで、下記JSON形式でMCPサーバー情報を入力します。

{
  "kokoro-tts-mcp": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

設定後、AIエージェントはこのMCPをツールとして利用でき、すべての機能にアクセス可能となります。“kokoro-tts-mcp"は実際のMCPサーバー名に、URLはご自身のMCPサーバーURLに置き換えてご利用ください。


概要

セクション対応状況詳細・備考
概要AIワークフロー向けテキスト読み上げサーバー
プロンプト一覧プロンプトテンプレートなし
リソース一覧明示的なMCPリソース記載なし
ツール一覧TTS、S3アップロード、ローカルファイル管理
APIキーの安全な管理AWSや設定用のenv変数利用を記載
サンプリング対応(評価上は重要度低)LLMサンプリング機能について記載なし

コメント

Kokoro TTS MCPサーバーは特化型で実用的なTTSツールであり、クラウド連携も対応。プロンプトやリソースのプリミティブはありませんが、オープンソースで設定もわかりやすく、キー管理も安全です。サンプリングやRootsサポートは記載がなく、高度なエージェント機能は制限されますが、TTS用途には堅牢かつ有用です。より汎用的なMCPサーバーほど多機能ではありません。

MCPスコア

LICENSEあり✅ (Apache-2.0)
ツールが1つ以上ある
フォーク数7
スター数39

よくある質問

Kokoro TTS MCPサーバーとは何ですか?

Kokoro TTS MCPサーバーは、AIエージェントやクライアントがテキスト入力を高品質な音声オーディオに変換できるModel Context Protocolサーバーです。音声やスピード、言語、クラウドストレージのオプションも備えています。チャットボット、アクセシビリティツール、自動化ワークフローへのテキスト読み上げ追加に最適です。

Kokoro TTS MCPの主な特徴は何ですか?

HuggingFaceモデルやONNXウェイトを用いた音声・スピード・言語のカスタマイズが可能です。オーディオはローカル保存またはAmazon S3へのアップロードも対応。開発環境やチャットボット、自動化パイプラインへの統合も簡単です。

S3アップロード用のAWS認証情報はどのように安全に管理しますか?

認証情報を設定ファイルにハードコーディングしないでください。AWS_ACCESS_KEY_IDやAWS_SECRET_ACCESS_KEYなどの機密情報は環境変数で安全にKokoro TTS MCPサーバーへ渡すようにしてください。

主なユースケースは何ですか?

視覚障害者向けの音声フィードバックなどのアクセシビリティソリューション、音声通知、コンテンツ制作(メディア用の音声ナレーション)、会話AI、法令遵守のための音声アーカイブなどがユースケースです。

FlowHuntでKokoro TTSは利用できますか?

はい、FlowHuntワークフローのMCPコンポーネントとしてKokoro TTSを追加できます。エージェントが音声応答を生成し、すべてのツールや設定を利用可能です。

Kokoro TTSは高度なLLMサンプリングやプロンプトテンプレートに対応していますか?

いいえ、Kokoro TTSは高品質なテキスト読み上げに特化しており、プロンプトプリミティブやLLMサンプリング機能は提供していません。

Kokoro TTSをAIワークフローに組み込む

Kokoro TTS MCPサーバーで、チャットボットや自動化に自然で高品質な音声合成を追加しましょう。FlowHuntで試すか、ご自身のインフラと接続できます。

詳細はこちら

SlideSpeak MCPサーバー
SlideSpeak MCPサーバー

SlideSpeak MCPサーバー

SlideSpeak MCPサーバーはAIアシスタントとSlideSpeak APIを接続し、ビジネス、教育、分析などの用途でPowerPointプレゼンテーションの自動かつプログラムによる作成を可能にします。...

1 分で読める
MCP Server Automation +4
ElevenLabs MCP サーバー
ElevenLabs MCP サーバー

ElevenLabs MCP サーバー

ElevenLabs MCP サーバーは、ElevenLabs のテキスト読み上げ API を AI ワークフローに統合し、自動化された高品質な音声合成、音声管理、音声履歴追跡を標準化された Model Context Protocol インターフェース経由で実現します。...

2 分で読める
Text-to-Speech AI Integration +3
DeepL MCPサーバー
DeepL MCPサーバー

DeepL MCPサーバー

DeepL MCPサーバーは、DeepL APIを通じて高度な翻訳、言い換え、言語検出をAIワークフローに統合します。FlowHuntや他のAIアシスタントにリアルタイム多言語機能、自動言語識別、トーンのカスタマイズを提供し、シームレスなグローバルコミュニケーションを実現します。...

1 分で読める
AI Translation +5