mcp-vision MCP サーバー

mcp-vision MCP サーバー

mcp-vision で AI ワークフローにコンピュータビジョンを追加:HuggingFace 搭載の物体検出および画像解析を FlowHunt やマルチモーダルアシスタント用 MCP サーバーとして提供。

「mcp-vision」MCP サーバーは何をしますか?

「mcp-vision」MCP サーバーは、Model Context Protocol(MCP)サーバーであり、HuggingFace のコンピュータビジョンモデル(ゼロショット物体検出など)を、LLM やビジョンランゲージモデルの視覚機能を強化するツールとして公開します。AI アシスタントと強力なコンピュータビジョンモデルを接続することで、mcp-vision は物体検出や画像解析などを開発ワークフローの中で直接実行可能にします。これにより、LLM や他の AI クライアントが画像をプログラム的に問い合わせ、処理し、解析できるようになり、アプリケーションにおける視覚的なやり取りの自動化・標準化・拡張が容易になります。本サーバーは GPU・CPU 環境の両方に対応し、主要な AI プラットフォームとの統合も簡単に設計されています。

プロンプト一覧

ドキュメントやリポジトリには特定のプロンプトテンプレートは記載されていません。

リソース一覧

リポジトリには明示的な MCP リソースは記載またはリストされていません。

ツール一覧

  • locate_objects
    HuggingFace が提供するゼロショット物体検出パイプラインを利用し、画像内の物体を検出・特定します。入力には画像パス、候補ラベルリスト、オプションでモデル名を指定可能。標準フォーマットで検出物体リストを返します。

  • zoom_to_object
    画像内の特定の物体について、検出スコアが最も高い物体のバウンディングボックスに画像をクロップしズームします。入力は画像パス、検索するラベル、オプションでモデル名。クロップ済み画像または None を返します。

この MCP サーバーの活用例

  • 画像内の自動物体検出
    開発者は mcp-vision を用いて、画像内の物体をプログラム的に検出・特定でき、画像タグ付け、コンテンツモデレーション、ビジュアル検索などの作業を効率化できます。
  • ビジョンベースのワークフロー自動化
    物体検出を大規模なワークフローに統合し、コンテンツによる画像分類、検出物に基づくレポート自動生成、アクセシビリティツールの強化などに活用できます。
  • 対話的な画像探索
    AI アシスタントが画像内の特定物体へズームなどを支援し、品質検査、医用画像解析、製品識別などの作業を支援します。
  • AI エージェントの視覚機能強化
    LLM が視覚データに基づいて推論・行動できるようになり、チャットボットやデジタルアシスタント、研究ツール等でよりリッチなマルチモーダル対話・コンテキスト対応応答が可能となります。

セットアップ方法

Windsurf

リポジトリに Windsurf 用セットアップ手順はありません。

Claude

  1. 前提条件:
    Docker がインストールされていること、GPU 利用の場合は NVIDIA 対応環境であることを確認してください。
  2. Docker イメージのビルドまたは利用:
    • ローカルでビルド:
      git clone git@github.com:groundlight/mcp-vision.git
      cd mcp-vision
      make build-docker
      
    • 公開イメージを利用(オプション):ビルド不要です。
  3. 設定ファイルの編集:
    claude_desktop_config.json を開き、以下を mcpServers に追加します。
    • GPU 使用時:
      "mcpServers": {
        "mcp-vision": {
          "command": "docker",
          "args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
          "env": {}
        }
      }
      
    • CPU 使用時:
      "mcpServers": {
        "mcp-vision": {
          "command": "docker",
          "args": ["run", "-i", "--rm", "mcp-vision"],
          "env": {}
        }
      }
      
    • 公開イメージ利用(ベータ):
      "mcpServers": {
        "mcp-vision": {
          "command": "docker",
          "args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
          "env": {}
        }
      }
      
  4. 保存と再起動:
    設定を保存し、Claude Desktop を再起動します。
  5. セットアップの確認:
    Claude Desktop の UI で mcp-vision が MCP サーバーとして利用可能であることを確認してください。

API キーのセキュリティ

  • ドキュメントには API キー要件や例はありません。

Cursor

リポジトリに Cursor 用セットアップ手順はありません。

Cline

リポジトリに Cline 用セットアップ手順はありません。

この MCP をフロー内で使う方法

FlowHunt で MCP を利用する

FlowHunt のワークフローに MCP サーバーを組み込むには、まず MCP コンポーネントをフローに追加し、AI エージェントと接続します。

FlowHunt MCP flow

MCP コンポーネントをクリックして構成パネルを開き、システム MCP 設定欄で以下のような JSON 形式で MCP サーバー情報を入力してください:

{
  "mcp-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

設定後、AI エージェントはこの MCP のすべての機能・能力をツールとして利用できます。なお、“mcp-vision” はご自身の MCP サーバー名に、URL もご自身の MCP サーバーのものに置き換えてください。


概要

セクション対応状況詳細・備考
概要HuggingFace のコンピュータビジョンモデルを MCP 経由で LLM ツール化
プロンプト一覧プロンプトテンプレートは未記載
リソース一覧明示的なリソースは未記載
ツール一覧locate_objects, zoom_to_object
API キーセキュリティAPI キー手順なし
サンプリングサポート(評価には重要ではない)記載なし

Roots サポート:記載なし


全体として、mcp-vision は HuggingFace ビジョンモデルとの直接連携を提供しますが、リソースやプロンプトテンプレート、roots やサンプリング等の高度な MCP 機能に関するドキュメントは不足しています。Claude Desktop でのセットアップは詳細ですが、他プラットフォーム向け情報はありません。

当社の見解

mcp-vision は、特に Docker 対応環境で AI ワークフローに視覚知能を追加するための実用的で特化した MCP サーバーです。明確なツール提供と Claude Desktop 向けのシンプルなセットアップが強みですが、リソース・プロンプトテンプレート・他プラットフォーム対応・高度な MCP 機能に関するさらなるドキュメントが望まれます。

MCP スコア

ライセンスあり✅ MIT
ツールが少なくとも 1 つ
フォーク数0
スター数23

よくある質問

mcp-vision MCP サーバーとは何ですか?

mcp-vision はオープンソースの Model Context Protocol サーバーで、HuggingFace のコンピュータビジョンモデルを AI アシスタントや LLM のツールとして提供し、AI ワークフローで物体検出や画像クロッピングなどを可能にします。

mcp-vision にはどのようなツールがありますか?

mcp-vision には locate_objects(画像内のゼロショット物体検出)や zoom_to_object(検出された物体への画像クロッピング)などのツールがあり、MCP インターフェース経由で利用できます。

mcp-vision の主なユースケースは何ですか?

mcp-vision は自動物体検出、ビジョンベースのワークフロー自動化、対話的な画像探索、AI エージェントの視覚推論・解析能力の強化などに利用できます。

mcp-vision を FlowHunt でセットアップする方法は?

FlowHunt のフローに MCP コンポーネントを追加し、構成パネルで提供された JSON フォーマットを使って mcp-vision サーバー情報を入力します。MCP サーバーが稼働中で FlowHunt からアクセス可能であることを確認してください。

mcp-vision に API キーは必要ですか?

現在のドキュメントによれば、mcp-vision の実行に API キーや特別な認証情報は必要ありません。Docker 環境の設定とサーバーへのアクセスができれば十分です。

mcp-vision を FlowHunt と統合

mcp-vision を使った物体検出と画像解析で、AI エージェントの能力を強化。FlowHunt のフローに組み込んでシームレスなマルチモーダル推論を実現。

詳細はこちら

OpenCV MCPサーバー
OpenCV MCPサーバー

OpenCV MCPサーバー

OpenCV MCPサーバーは、OpenCVの強力な画像・動画処理ツールをAIアシスタントや開発者プラットフォームとModel Context Protocol(MCP)経由で連携します。画像操作、物体検出、動画解析などの高度なコンピュータビジョンワークフローを、お気に入りの開発環境内で直接実現できます。...

1 分で読める
OpenCV MCP Server +4
BlenderMCP MCPサーバー
BlenderMCP MCPサーバー

BlenderMCP MCPサーバー

BlenderMCPはBlenderとClaudeなどのAIアシスタントを橋渡しし、Model Context Protocol(MCP)を通して自動化されたAI駆動の3Dモデリング、シーン作成、アセット管理を実現します。リアルタイムかつプロンプトベースの自動化と双方向AI通信で、Blenderのワークフローを強化しま...

1 分で読める
AI 3D Modeling +4
画像生成 MCP サーバー
画像生成 MCP サーバー

画像生成 MCP サーバー

画像生成 MCP サーバーは、Replicate Flux モデルを利用して、AI アシスタントやアプリケーションがオンデマンドでカスタム画像を生成できるようにし、自動化された創造的かつスケーラブルなビジュアルコンテンツ生成ワークフローを実現します。...

1 分で読める
AI Image Generation +4