
Serverul OpenCV MCP
Serverul OpenCV MCP face legătura între instrumentele puternice de procesare a imaginilor și videoclipurilor oferite de OpenCV și asistenții AI sau platformele ...
Adaugă viziune computerizată în fluxurile tale AI cu mcp-vision: detectare de obiecte și analiză de imagini bazate pe HuggingFace, ca server MCP pentru FlowHunt și asistenți multimodali.
Serverul MCP “mcp-vision” este un server Model Context Protocol (MCP) care expune modelele de viziune computerizată HuggingFace—precum detectarea de obiecte zero-shot—ca instrumente pentru îmbunătățirea capabilităților vizuale ale modelelor mari de limbaj sau viziune-limbaj. Prin conectarea asistenților AI cu modele performante de viziune computerizată, mcp-vision permite sarcini precum detectarea obiectelor și analiza imaginilor direct în fluxurile de dezvoltare. Aceasta permite LLM-urilor și altor clienți AI să interogheze, proceseze și analizeze imagini programatic, facilitând automatizarea, standardizarea și extinderea interacțiunilor bazate pe viziune în aplicații. Serverul este potrivit atât pentru medii cu GPU, cât și pentru CPU și este conceput pentru integrare ușoară cu platforme AI populare.
Nu sunt menționate șabloane de prompt specifice în documentație sau în fișierele repository-ului.
Nu sunt documentate sau listate explicit resurse MCP în repository.
locate_objects
Detectează și localizează obiecte într-o imagine utilizând unul dintre pipeline-urile de detectare de obiecte zero-shot disponibile prin HuggingFace. Inputurile includ calea imaginii, o listă de etichete candidate și, opțional, numele unui model. Returnează o listă de obiecte detectate în format standard.
zoom_to_object
Mărește un anumit obiect dintr-o imagine decupând imaginea la bounding box-ul obiectului cu cel mai bun scor de detectare. Inputurile includ calea imaginii, o etichetă de căutat și, opțional, numele unui model. Returnează o imagine decupată sau None.
Nu există instrucțiuni de configurare pentru Windsurf în repository.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
și adaugă următoarele sub mcpServers
:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
Nu există instrucțiuni de configurare pentru Cursor în repository.
Nu există instrucțiuni de configurare pentru Cline în repository.
Utilizarea MCP în FlowHunt
Pentru a integra servere MCP în fluxul tău FlowHunt, începe prin a adăuga componenta MCP în flux și conectează-l la agentul tău AI:
Fă clic pe componenta MCP pentru a deschide panoul de configurare. În secțiunea de configurare MCP a sistemului, inserează detaliile serverului MCP folosind acest format JSON:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Odată configurat, agentul AI poate folosi acest MCP ca instrument cu acces la toate funcțiile și capabilitățile sale. Nu uita să înlocuiești “mcp-vision” cu numele real al serverului tău MCP și să pui propria adresă URL.
Secțiune | Disponibilitate | Detalii/Note |
---|---|---|
Prezentare generală | ✅ | Modele de viziune HuggingFace ca instrumente pentru LLM-uri prin MCP |
Lista de Prompts | ⛔ | Nicio șablon de prompt documentat |
Lista de Resurse | ⛔ | Nicio resursă explicit listată |
Lista de Instrumente | ✅ | locate_objects, zoom_to_object |
Securizarea cheilor API | ⛔ | Nicio instrucțiune pentru chei API |
Suport pentru sampling (mai puțin important) | ⛔ | Nu este menționat |
Per ansamblu, mcp-vision oferă o integrare utilă și directă cu modelele de viziune HuggingFace, dar lipsește documentația despre resurse, șabloane de prompt sau funcții MCP avansate precum roots sau sampling. Configurarea sa este bine documentată pentru Claude Desktop, dar nu și pentru alte platforme.
mcp-vision este un server MCP concentrat și practic pentru adăugarea inteligenței vizuale în fluxurile AI, mai ales în medii care suportă Docker. Punctele sale forte principale sunt instrumentele clar definite și configurarea simplă pentru Claude Desktop, dar ar beneficia de o documentație mai bogată, în special privind resursele, șabloanele de prompt și suportul pentru alte platforme și funcții MCP avansate.
Are o LICENȚĂ | ✅ MIT |
---|---|
Are cel puțin un instrument | ✅ |
Număr de Fork-uri | 0 |
Număr de Stele | 23 |
mcp-vision este un server open-source Model Context Protocol care expune modelele de viziune computerizată HuggingFace ca instrumente pentru asistenți AI și LLM-uri, permițând detectarea obiectelor, decuparea imaginilor și multe altele în fluxurile tale AI.
mcp-vision oferă instrumente precum locate_objects (pentru detectarea obiectelor zero-shot în imagini) și zoom_to_object (pentru decuparea imaginilor la obiectele detectate), accesibile prin interfața MCP.
Folosește mcp-vision pentru detectare automată de obiecte, automatizarea fluxurilor bazate pe viziune, explorare interactivă a imaginilor și pentru a dota agenții AI cu abilități de raționament vizual și analiză.
Adaugă componenta MCP în fluxul tău FlowHunt și inserează detaliile serverului mcp-vision în panoul de configurare, folosind formatul JSON furnizat. Asigură-te că serverul tău MCP rulează și este accesibil din FlowHunt.
Nu este necesară nicio cheie API sau credențiale speciale pentru a rula mcp-vision conform documentației curente. Doar asigură-te că mediul tău Docker este configurat și serverul este accesibil.
Îmbunătățește-ți agenții AI cu detectare de obiecte și analiză de imagini folosind mcp-vision. Integrează-l în fluxurile tale FlowHunt pentru raționament multimodal fără întreruperi.
Serverul OpenCV MCP face legătura între instrumentele puternice de procesare a imaginilor și videoclipurilor oferite de OpenCV și asistenții AI sau platformele ...
Serverul ModelContextProtocol (MCP) acționează ca o punte între agenții AI și sursele externe de date, API-uri și servicii, permițând utilizatorilor FlowHunt să...
Visio MCP Server permite crearea și editarea programatică a diagramelor Microsoft Visio printr-un API standardizat. Integrați automatizări Visio în fluxurile dv...