
OpenCV MCP-Server
Der OpenCV MCP-Server verbindet die leistungsstarken Bild- und Videobearbeitungstools von OpenCV mit KI-Assistenten und Entwicklerplattformen über das Model Con...
Erweitern Sie Ihre KI-Workflows mit mcp-vision um Computer Vision: HuggingFace-basierte Objekterkennung und Bildanalyse als MCP-Server für FlowHunt und multimodale Assistenten.
Der “mcp-vision” MCP-Server ist ein Model Context Protocol (MCP) Server, der HuggingFace-Modelle für Computer Vision – wie Zero-Shot-Objekterkennung – als Werkzeuge bereitstellt und damit die visuellen Fähigkeiten von großen Sprachmodellen oder Vision-Language-Modellen erweitert. Durch die Anbindung von KI-Assistenten an leistungsstarke Computer-Vision-Modelle ermöglicht mcp-vision Aufgaben wie Objekterkennung und Bildanalyse direkt in Entwicklungs-Workflows. Damit können LLMs und andere KI-Clients Bilder programmatisch abfragen, verarbeiten und analysieren – dies vereinfacht die Automatisierung, Standardisierung und Erweiterung von visuell basierten Interaktionen in Anwendungen. Der Server ist sowohl für GPU- als auch CPU-Umgebungen geeignet und für die einfache Integration in gängige KI-Plattformen konzipiert.
In der Dokumentation oder den Repository-Dateien sind keine spezifischen Prompt-Vorlagen erwähnt.
Im Repository sind keine expliziten MCP-Ressourcen dokumentiert oder gelistet.
locate_objects
Erkennen und Lokalisieren von Objekten in einem Bild mit einer der Zero-Shot-Objekterkennungspipelines von HuggingFace. Zu den Eingaben gehören der Bildpfad, eine Liste von Kandidatenlabels und optional ein Modellname. Gibt eine Liste erkannter Objekte im Standardformat zurück.
zoom_to_object
Auf ein bestimmtes Objekt in einem Bild zoomen, indem das Bild auf die Begrenzungsbox des Objekts mit dem besten Erkennungsergebnis zugeschnitten wird. Eingaben sind Bildpfad, ein zu findendes Label und optional ein Modellname. Gibt ein zugeschnittenes Bild oder None zurück.
Im Repository sind keine Einrichtungshinweise für Windsurf vorhanden.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
und fügen Sie unter mcpServers
Folgendes hinzu:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
Im Repository sind keine Einrichtungshinweise für Cursor vorhanden.
Im Repository sind keine Einrichtungshinweise für Cline vorhanden.
MCP in FlowHunt nutzen
Um MCP-Server in Ihren FlowHunt-Workflow zu integrieren, fügen Sie zunächst die MCP-Komponente Ihrem Flow hinzu und verbinden Sie diese mit Ihrem KI-Agenten:
Klicken Sie auf die MCP-Komponente, um das Konfigurationspanel zu öffnen. Im Bereich System-MCP-Konfiguration geben Sie Ihre MCP-Server-Details in folgendem JSON-Format ein:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Nach der Konfiguration kann der KI-Agent diesen MCP als Tool mit Zugriff auf alle Funktionen und Fähigkeiten nutzen. Denken Sie daran, “mcp-vision” durch den tatsächlichen Namen Ihres Servers zu ersetzen und die URL entsprechend anzupassen.
Abschnitt | Verfügbar | Details/Hinweise |
---|---|---|
Übersicht | ✅ | HuggingFace-Modelle für Computer Vision als Tools für LLMs via MCP |
Liste der Prompts | ⛔ | Keine Prompt-Vorlagen dokumentiert |
Liste der Ressourcen | ⛔ | Keine expliziten Ressourcen gelistet |
Liste der Tools | ✅ | locate_objects, zoom_to_object |
Absicherung von API-Keys | ⛔ | Keine API-Key-Anleitung |
Sampling Support (weniger wichtig für Bewertung) | ⛔ | Nicht erwähnt |
Insgesamt bietet mcp-vision eine nützliche, direkte Integration mit HuggingFace-Vision-Modellen, jedoch fehlt Dokumentation zu Ressourcen, Prompt-Vorlagen oder erweiterten MCP-Features wie Roots oder Sampling. Die Einrichtung ist für Claude Desktop gut dokumentiert, für andere Plattformen fehlen jedoch Hinweise.
mcp-vision ist ein fokussierter und praxisorientierter MCP-Server, um KI-Workflows um visuelle Intelligenz zu erweitern – besonders in Umgebungen mit Docker-Support. Seine Stärken liegen in den klaren Tool-Angeboten und der unkomplizierten Einrichtung für Claude Desktop. Zusätzliche Dokumentation zu Ressourcen, Prompt-Vorlagen und Unterstützung für weitere Plattformen oder fortgeschrittene MCP-Features wären jedoch wünschenswert.
Hat eine LICENSE | ✅ MIT |
---|---|
Mindestens ein Tool | ✅ |
Anzahl der Forks | 0 |
Anzahl der Stars | 23 |
mcp-vision ist ein Open-Source Model Context Protocol Server, der HuggingFace-Modelle für Computer Vision als Werkzeuge für KI-Assistenten und LLMs bereitstellt. So werden Objekterkennung, Bildausschnitt und mehr in Ihre KI-Workflows integriert.
mcp-vision bietet Tools wie locate_objects (für Zero-Shot-Objekterkennung in Bildern) und zoom_to_object (um Bilder auf erkannte Objekte zuzuschneiden), die über die MCP-Schnittstelle zugänglich sind.
Nutzen Sie mcp-vision für automatisierte Objekterkennung, automatisierte Workflows auf Basis von Bildinhalten, interaktive Bildexploration und die Erweiterung von KI-Agenten um visuelle Analysefähigkeiten.
Fügen Sie die MCP-Komponente Ihrem FlowHunt-Flow hinzu und tragen Sie die mcp-vision-Serverdetails im Konfigurationspanel im angegebenen JSON-Format ein. Stellen Sie sicher, dass Ihr MCP-Server läuft und von FlowHunt erreichbar ist.
Laut aktueller Dokumentation wird kein API-Key oder besondere Anmeldedaten benötigt. Stellen Sie einfach sicher, dass Ihre Docker-Umgebung konfiguriert ist und der Server erreichbar ist.
Statten Sie Ihre KI-Agenten mit Objekterkennung und Bildanalyse per mcp-vision aus. Binden Sie ihn in Ihre FlowHunt-Flows ein für nahtloses multimodales Reasoning.
Der OpenCV MCP-Server verbindet die leistungsstarken Bild- und Videobearbeitungstools von OpenCV mit KI-Assistenten und Entwicklerplattformen über das Model Con...
Der Model Context Protocol (MCP) Server verbindet KI-Assistenten mit externen Datenquellen, APIs und Diensten und ermöglicht so eine optimierte Integration komp...
BlenderMCP verbindet Blender mit KI-Assistenten wie Claude und ermöglicht automatisiertes, KI-gesteuertes 3D-Modellieren, Szenenerstellung und Asset-Management ...