
OpenCV MCP Server
OpenCV MCP Server kopplar samman OpenCV:s kraftfulla bild- och videobehandling med AI-assistenter och utvecklarplattformar via Model Context Protocol (MCP). Akt...
Lägg till datorseende i dina AI-arbetsflöden med mcp-vision: objektigenkänning och bildanalys med HuggingFace som MCP-server för FlowHunt och multimodala assistenter.
“mcp-vision” MCP-servern är en Model Context Protocol (MCP) server som exponerar HuggingFace datorseendemodeller – såsom zero-shot objektigenkänning – som verktyg för att förstärka visionsfunktionaliteten hos stora språkmodeller eller vision-language-modeller. Genom att koppla AI-assistenter till kraftfulla datorseendemodeller möjliggör mcp-vision uppgifter som objektigenkänning och bildanalys direkt i utvecklingsarbetsflöden. Detta gör att LLM:er och andra AI-klienter kan fråga, bearbeta och analysera bilder programmatiskt, vilket förenklar automatisering, standardisering och utökning av visuella interaktioner i applikationer. Servern fungerar både i GPU- och CPU-miljöer och är utformad för enkel integrering med populära AI-plattformar.
Inga specifika prompt-mallar nämns i dokumentationen eller repository-filerna.
Inga explicita MCP-resurser dokumenterade eller listade i repositoryt.
locate_objects
Identifiera och lokalisera objekt i en bild med någon av HuggingFaces zero-shot objektigenkänningspipelines. Inparametrar är bildsökväg, en lista med kandidatetiketter och eventuellt modellnamn. Returnerar en lista med detekterade objekt i standardformat.
zoom_to_object
Zooma in på ett specifikt objekt i en bild genom att beskära bilden till objektets bounding box med högst detektionspoäng. Inparametrar är bildsökväg, etikett att hitta och eventuellt modellnamn. Returnerar en beskuren bild eller None.
Inga installationsinstruktioner för Windsurf finns i repositoryt.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
och lägg till följande under mcpServers
:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
Inga installationsinstruktioner för Cursor finns i repositoryt.
Inga installationsinstruktioner för Cline finns i repositoryt.
Att använda MCP i FlowHunt
För att integrera MCP-servrar i ditt FlowHunt-arbetsflöde, börja med att lägga till MCP-komponenten i ditt flöde och koppla den till din AI-agent:
Klicka på MCP-komponenten för att öppna konfigurationspanelen. I systemets MCP-konfigurationssektion anger du dina MCP-serverdetaljer enligt detta JSON-format:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
När det är konfigurerat kan AI-agenten nu använda detta MCP som ett verktyg med tillgång till alla dess funktioner och möjligheter. Kom ihåg att byta ut “mcp-vision” till det faktiska namnet på din MCP-server och byta ut URL:en mot din egen serveradress.
Sektion | Tillgänglighet | Detaljer/Noteringar |
---|---|---|
Översikt | ✅ | HuggingFace datorseendemodeller som verktyg för LLM:er via MCP |
Lista över prompts | ⛔ | Inga prompt-mallar dokumenterade |
Lista över resurser | ⛔ | Inga explicita resurser listade |
Lista över verktyg | ✅ | locate_objects, zoom_to_object |
API-nyckelsäkerhet | ⛔ | Inga instruktioner om API-nycklar |
Samplingsstöd (mindre viktigt vid utvärdering) | ⛔ | Inte nämnt |
Sammanfattningsvis erbjuder mcp-vision användbar och direkt integration med HuggingFace vision-modeller, men saknar dokumentation om resurser, prompt-mallar och avancerade MCP-funktioner såsom roots eller sampling. Installation är väl dokumenterad för Claude Desktop men inte för andra plattformar.
mcp-vision är en fokuserad och praktisk MCP-server för att lägga till visuell intelligens i AI-arbetsflöden, särskilt i miljöer som stödjer Docker. Dess största styrkor är tydliga verktyg och enkel installation för Claude Desktop, men den skulle vinna på fylligare dokumentation – särskilt kring resurser, prompt-mallar samt stöd för fler plattformar och avancerade MCP-funktioner.
Har en LICENSE | ✅ MIT |
---|---|
Har minst ett verktyg | ✅ |
Antal forks | 0 |
Antal stjärnor | 23 |
mcp-vision är en öppen Model Context Protocol-server som exponerar HuggingFace datorseendemodeller som verktyg för AI-assistenter och LLM:er, och möjliggör objektigenkänning, bildbeskärning med mera i dina AI-arbetsflöden.
mcp-vision erbjuder verktyg som locate_objects (för zero-shot objektigenkänning i bilder) och zoom_to_object (för beskärning av bilder till detekterade objekt), tillgängliga via MCP-gränssnittet.
Använd mcp-vision för automatiserad objektigenkänning, workflow-automation baserat på datorseende, interaktiv bildutforskning, och för att förstärka AI-agenter med visuella resonemangs- och analysmöjligheter.
Lägg till MCP-komponenten i ditt FlowHunt-flöde och ange mcp-vision-serverns detaljer i konfigurationspanelen enligt det angivna JSON-formatet. Kontrollera att din MCP-server är igång och tillgänglig från FlowHunt.
Ingen API-nyckel eller särskilda inloggningsuppgifter behövs för att köra mcp-vision enligt gällande dokumentation. Säkerställ bara att din Docker-miljö är korrekt konfigurerad och att servern är åtkomlig.
Ge dina AI-agenter superkrafter med objektigenkänning och bildanalys genom mcp-vision. Koppla in det i dina FlowHunt-flöden för sömlös multimodal resonemang.
OpenCV MCP Server kopplar samman OpenCV:s kraftfulla bild- och videobehandling med AI-assistenter och utvecklarplattformar via Model Context Protocol (MCP). Akt...
ModelContextProtocol (MCP) Server fungerar som en brygga mellan AI-agenter och externa datakällor, API:er och tjänster, vilket gör det möjligt för FlowHunt-anvä...
Kubernetes MCP-server fungerar som en brygga mellan AI-assistenter och Kubernetes/OpenShift-kluster, vilket möjliggör programmatisk resursxadhantering, poddxado...