
Servidor OpenCV MCP
El Servidor OpenCV MCP conecta las potentes herramientas de procesamiento de imagen y video de OpenCV con asistentes de IA y plataformas de desarrollo a través ...
Agrega visión por computadora a tus flujos de trabajo de IA con mcp-vision: detección de objetos y análisis de imágenes impulsados por HuggingFace como un servidor MCP para FlowHunt y asistentes multimodales.
El servidor MCP “mcp-vision” es un servidor Model Context Protocol (MCP) que expone modelos de visión por computadora de HuggingFace—como la detección de objetos zero-shot—como herramientas para mejorar las capacidades de visión de modelos de lenguaje grande o modelos visión-lenguaje. Al conectar asistentes de IA con potentes modelos de visión por computadora, mcp-vision permite tareas como detección de objetos y análisis de imágenes directamente dentro de los flujos de desarrollo. Esto permite que LLMs y otros clientes de IA consulten, procesen y analicen imágenes programáticamente, facilitando automatizar, estandarizar y ampliar interacciones basadas en visión en aplicaciones. El servidor es apto tanto para entornos con GPU como con CPU y está diseñado para integrarse fácilmente con plataformas de IA populares.
No se mencionan plantillas de prompt específicas en la documentación ni en los archivos del repositorio.
No se documentan ni se listan recursos MCP explícitos en el repositorio.
locate_objects
Detecta y localiza objetos en una imagen usando uno de los pipelines de detección de objetos zero-shot disponibles en HuggingFace. Los parámetros incluyen la ruta de la imagen, una lista de etiquetas candidatas y un nombre de modelo opcional. Devuelve una lista de objetos detectados en formato estándar.
zoom_to_object
Amplía un objeto específico en una imagen recortando la imagen al cuadro delimitador del objeto con la mejor puntuación de detección. Los parámetros incluyen la ruta de la imagen, una etiqueta a buscar y un nombre de modelo opcional. Devuelve una imagen recortada o None.
No se proporcionan instrucciones de configuración para Windsurf en el repositorio.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
y agrega lo siguiente bajo mcpServers
:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
No se proporcionan instrucciones de configuración para Cursor en el repositorio.
No se proporcionan instrucciones de configuración para Cline en el repositorio.
Uso de MCP en FlowHunt
Para integrar servidores MCP en tu flujo de trabajo de FlowHunt, comienza agregando el componente MCP a tu flujo y conectándolo a tu agente de IA:
Haz clic en el componente MCP para abrir el panel de configuración. En la sección de configuración MCP del sistema, ingresa los detalles de tu servidor MCP usando este formato JSON:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Una vez configurado, el agente de IA podrá usar este MCP como herramienta con acceso a todas sus funciones y capacidades. Recuerda cambiar “mcp-vision” por el nombre real de tu servidor MCP y reemplazar la URL por la de tu propio servidor MCP.
Sección | Disponibilidad | Detalles/Notas |
---|---|---|
Resumen | ✅ | Modelos de visión por computadora de HuggingFace como herramientas para LLMs vía MCP |
Lista de prompts | ⛔ | No se documentan plantillas de prompt |
Lista de recursos | ⛔ | No se listan recursos explícitos |
Lista de herramientas | ✅ | locate_objects, zoom_to_object |
Protección de claves API | ⛔ | No se incluyen instrucciones sobre claves API |
Soporte de muestreo (menos relevante) | ⛔ | No mencionado |
En general, mcp-vision brinda integración útil y directa con modelos de visión de HuggingFace pero carece de documentación sobre recursos, plantillas de prompt o características avanzadas de MCP como roots o sampling. Su configuración está bien documentada para Claude Desktop pero no para otras plataformas.
mcp-vision es un servidor MCP enfocado y práctico para añadir inteligencia visual a flujos de trabajo de IA, especialmente en entornos que soportan Docker. Sus principales fortalezas son la claridad de sus herramientas y la configuración sencilla para Claude Desktop, pero se beneficiaría de una documentación más rica, especialmente sobre recursos, plantillas de prompt y soporte para otras plataformas y características avanzadas de MCP.
Tiene LICENSE | ✅ MIT |
---|---|
Tiene al menos una herramienta | ✅ |
Número de Forks | 0 |
Número de Stars | 23 |
mcp-vision es un servidor de código abierto del Model Context Protocol que expone modelos de visión por computadora de HuggingFace como herramientas para asistentes de IA y LLMs, permitiendo la detección de objetos, recorte de imágenes y más en tus flujos de trabajo de IA.
mcp-vision ofrece herramientas como locate_objects (para detección de objetos zero-shot en imágenes) y zoom_to_object (para recortar imágenes a objetos detectados), accesibles a través de la interfaz MCP.
Utiliza mcp-vision para la detección automática de objetos, automatización de flujos basada en visión, exploración interactiva de imágenes y para aumentar agentes de IA con capacidades de razonamiento y análisis visual.
Agrega el componente MCP a tu flujo de FlowHunt e ingresa los detalles del servidor mcp-vision en el panel de configuración usando el formato JSON proporcionado. Asegúrate de que tu servidor MCP esté en funcionamiento y accesible desde FlowHunt.
No se requiere clave API ni credenciales especiales para ejecutar mcp-vision según la documentación actual. Solo asegúrate de que tu entorno Docker esté configurado y el servidor sea accesible.
Potencia tus agentes de IA con detección de objetos y análisis de imágenes usando mcp-vision. Conéctalo a tus flujos de FlowHunt para razonamiento multimodal sin interrupciones.
El Servidor OpenCV MCP conecta las potentes herramientas de procesamiento de imagen y video de OpenCV con asistentes de IA y plataformas de desarrollo a través ...
Video Still Capture MCP es un servidor basado en Python que proporciona a los asistentes de IA acceso en tiempo real a cámaras web y fuentes de video mediante O...
BlenderMCP conecta Blender con asistentes de IA como Claude, permitiendo la creación automatizada y dirigida por IA de modelados 3D, escenas y gestión de assets...