
OpenCV MCP-Server
Der OpenCV MCP-Server verbindet die leistungsstarken Bild- und Videobearbeitungstools von OpenCV mit KI-Assistenten und Entwicklerplattformen über das Model Con...

Erweitern Sie Ihre KI-Workflows mit mcp-vision um Computer Vision: HuggingFace-basierte Objekterkennung und Bildanalyse als MCP-Server für FlowHunt und multimodale Assistenten.
FlowHunt bietet eine zusätzliche Sicherheitsschicht zwischen Ihren internen Systemen und KI-Tools und gibt Ihnen granulare Kontrolle darüber, welche Tools von Ihren MCP-Servern aus zugänglich sind. In unserer Infrastruktur gehostete MCP-Server können nahtlos mit FlowHunts Chatbot sowie beliebten KI-Plattformen wie ChatGPT, Claude und verschiedenen KI-Editoren integriert werden.
Der “mcp-vision” MCP-Server ist ein Model Context Protocol (MCP) Server, der HuggingFace-Modelle für Computer Vision – wie Zero-Shot-Objekterkennung – als Werkzeuge bereitstellt und damit die visuellen Fähigkeiten von großen Sprachmodellen oder Vision-Language-Modellen erweitert. Durch die Anbindung von KI-Assistenten an leistungsstarke Computer-Vision-Modelle ermöglicht mcp-vision Aufgaben wie Objekterkennung und Bildanalyse direkt in Entwicklungs-Workflows. Damit können LLMs und andere KI-Clients Bilder programmatisch abfragen, verarbeiten und analysieren – dies vereinfacht die Automatisierung, Standardisierung und Erweiterung von visuell basierten Interaktionen in Anwendungen. Der Server ist sowohl für GPU- als auch CPU-Umgebungen geeignet und für die einfache Integration in gängige KI-Plattformen konzipiert.
In der Dokumentation oder den Repository-Dateien sind keine spezifischen Prompt-Vorlagen erwähnt.
Im Repository sind keine expliziten MCP-Ressourcen dokumentiert oder gelistet.
locate_objects
Erkennen und Lokalisieren von Objekten in einem Bild mit einer der Zero-Shot-Objekterkennungspipelines von HuggingFace. Zu den Eingaben gehören der Bildpfad, eine Liste von Kandidatenlabels und optional ein Modellname. Gibt eine Liste erkannter Objekte im Standardformat zurück.
zoom_to_object
Auf ein bestimmtes Objekt in einem Bild zoomen, indem das Bild auf die Begrenzungsbox des Objekts mit dem besten Erkennungsergebnis zugeschnitten wird. Eingaben sind Bildpfad, ein zu findendes Label und optional ein Modellname. Gibt ein zugeschnittenes Bild oder None zurück.
Im Repository sind keine Einrichtungshinweise für Windsurf vorhanden.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json und fügen Sie unter mcpServers Folgendes hinzu:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
Im Repository sind keine Einrichtungshinweise für Cursor vorhanden.
Im Repository sind keine Einrichtungshinweise für Cline vorhanden.
MCP in FlowHunt nutzen
Um MCP-Server in Ihren FlowHunt-Workflow zu integrieren, fügen Sie zunächst die MCP-Komponente Ihrem Flow hinzu und verbinden Sie diese mit Ihrem KI-Agenten:

Klicken Sie auf die MCP-Komponente, um das Konfigurationspanel zu öffnen. Im Bereich System-MCP-Konfiguration geben Sie Ihre MCP-Server-Details in folgendem JSON-Format ein:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Nach der Konfiguration kann der KI-Agent diesen MCP als Tool mit Zugriff auf alle Funktionen und Fähigkeiten nutzen. Denken Sie daran, “mcp-vision” durch den tatsächlichen Namen Ihres Servers zu ersetzen und die URL entsprechend anzupassen.
| Abschnitt | Verfügbar | Details/Hinweise |
|---|---|---|
| Übersicht | ✅ | HuggingFace-Modelle für Computer Vision als Tools für LLMs via MCP |
| Liste der Prompts | ⛔ | Keine Prompt-Vorlagen dokumentiert |
| Liste der Ressourcen | ⛔ | Keine expliziten Ressourcen gelistet |
| Liste der Tools | ✅ | locate_objects, zoom_to_object |
| Absicherung von API-Keys | ⛔ | Keine API-Key-Anleitung |
| Sampling Support (weniger wichtig für Bewertung) | ⛔ | Nicht erwähnt |
Insgesamt bietet mcp-vision eine nützliche, direkte Integration mit HuggingFace-Vision-Modellen, jedoch fehlt Dokumentation zu Ressourcen, Prompt-Vorlagen oder erweiterten MCP-Features wie Roots oder Sampling. Die Einrichtung ist für Claude Desktop gut dokumentiert, für andere Plattformen fehlen jedoch Hinweise.
mcp-vision ist ein fokussierter und praxisorientierter MCP-Server, um KI-Workflows um visuelle Intelligenz zu erweitern – besonders in Umgebungen mit Docker-Support. Seine Stärken liegen in den klaren Tool-Angeboten und der unkomplizierten Einrichtung für Claude Desktop. Zusätzliche Dokumentation zu Ressourcen, Prompt-Vorlagen und Unterstützung für weitere Plattformen oder fortgeschrittene MCP-Features wären jedoch wünschenswert.
| Hat eine LICENSE | ✅ MIT |
|---|---|
| Mindestens ein Tool | ✅ |
| Anzahl der Forks | 0 |
| Anzahl der Stars | 23 |
Statten Sie Ihre KI-Agenten mit Objekterkennung und Bildanalyse per mcp-vision aus. Binden Sie ihn in Ihre FlowHunt-Flows ein für nahtloses multimodales Reasoning.

Der OpenCV MCP-Server verbindet die leistungsstarken Bild- und Videobearbeitungstools von OpenCV mit KI-Assistenten und Entwicklerplattformen über das Model Con...

Der mcp-hfspace MCP Server verbindet KI-Assistenten mit HuggingFace Spaces und ermöglicht nahtlose Integration, Automatisierung und Verwaltung externer KI-Model...

BlenderMCP verbindet Blender mit KI-Assistenten wie Claude und ermöglicht automatisiertes, KI-gesteuertes 3D-Modellieren, Szenenerstellung und Asset-Management ...
Cookie-Zustimmung
Wir verwenden Cookies, um Ihr Surferlebnis zu verbessern und unseren Datenverkehr zu analysieren. See our privacy policy.