
Servidor OpenCV MCP
O Servidor OpenCV MCP conecta as poderosas ferramentas de processamento de imagem e vídeo do OpenCV com assistentes de IA e plataformas de desenvolvedores via o...
Adicione visão computacional aos seus fluxos de IA com o mcp-vision: detecção de objetos e análise de imagens com tecnologia HuggingFace como servidor MCP para FlowHunt e assistentes multimodais.
O “mcp-vision” MCP Server é um servidor Model Context Protocol (MCP) que expõe modelos de visão computacional do HuggingFace — como detecção de objetos zero-shot — como ferramentas para aprimorar as capacidades de visão de grandes modelos de linguagem ou modelos visão-linguagem. Ao conectar assistentes de IA com poderosos modelos de visão computacional, o mcp-vision permite tarefas como detecção de objetos e análise de imagens diretamente em fluxos de desenvolvimento. Isso possibilita que LLMs e outros clientes de IA consultem, processem e analisem imagens programaticamente, facilitando a automação, padronização e extensão de interações baseadas em visão em aplicações. O servidor é adequado para ambientes com GPU e CPU e foi projetado para fácil integração com plataformas de IA populares.
Nenhum template de prompt específico é mencionado na documentação ou arquivos do repositório.
Nenhum recurso MCP explícito é documentado ou listado no repositório.
locate_objects
Detecte e localize objetos em uma imagem usando um dos pipelines de detecção de objetos zero-shot disponíveis pelo HuggingFace. As entradas incluem o caminho da imagem, uma lista de rótulos candidatos e um nome de modelo opcional. Retorna uma lista de objetos detectados em formato padrão.
zoom_to_object
Dê zoom em um objeto específico em uma imagem recortando a imagem para a caixa delimitadora do objeto com a melhor pontuação de detecção. As entradas incluem o caminho da imagem, um rótulo a ser encontrado e um nome de modelo opcional. Retorna uma imagem recortada ou None.
Nenhuma instrução de configuração para Windsurf é fornecida no repositório.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
e adicione o seguinte em mcpServers
:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
Nenhuma instrução de configuração para Cursor é fornecida no repositório.
Nenhuma instrução de configuração para Cline é fornecida no repositório.
Usando MCP no FlowHunt
Para integrar servidores MCP ao seu fluxo no FlowHunt, comece adicionando o componente MCP ao seu fluxo e conectando-o ao seu agente de IA:
Clique no componente MCP para abrir o painel de configuração. Na seção de configuração do MCP do sistema, insira os detalhes do seu servidor MCP usando este formato JSON:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://seumcpserver.exemplo/caminhoparamcp/url"
}
}
Depois de configurado, o agente de IA pode usar este MCP como uma ferramenta com acesso a todas as suas funções e capacidades. Lembre-se de trocar “mcp-vision” pelo nome real do seu servidor MCP e substituir a URL pela URL do seu próprio servidor MCP.
Seção | Disponibilidade | Detalhes/Notas |
---|---|---|
Visão Geral | ✅ | Modelos de visão computacional HuggingFace como ferramentas para LLMs via MCP |
Lista de Prompts | ⛔ | Nenhum template de prompt documentado |
Lista de Recursos | ⛔ | Nenhum recurso explícito listado |
Lista de Ferramentas | ✅ | locate_objects, zoom_to_object |
Segurança de Chaves de API | ⛔ | Nenhuma instrução de chave de API |
Suporte a Sampling (menos importante na avaliação) | ⛔ | Não mencionado |
No geral, o mcp-vision oferece integração útil e direta com modelos de visão do HuggingFace, mas carece de documentação sobre recursos, templates de prompts ou recursos avançados de MCP como roots ou sampling. Sua configuração é bem documentada para o Claude Desktop, mas não para outras plataformas.
O mcp-vision é um servidor MCP focado e prático para adicionar inteligência visual a fluxos de IA, especialmente em ambientes que suportam Docker. Seus principais pontos fortes são a oferta clara de ferramentas e a configuração direta para Claude Desktop, mas se beneficiaria de uma documentação mais rica, especialmente sobre recursos, templates de prompts e suporte a plataformas adicionais e funções MCP avançadas.
Possui LICENSE | ✅ MIT |
---|---|
Possui ao menos uma ferramenta | ✅ |
Número de Forks | 0 |
Número de Estrelas | 23 |
O mcp-vision é um servidor Model Context Protocol de código aberto que expõe modelos de visão computacional do HuggingFace como ferramentas para assistentes de IA e LLMs, permitindo detecção de objetos, recorte de imagens e mais em seus fluxos de IA.
O mcp-vision oferece ferramentas como locate_objects (para detecção de objetos zero-shot em imagens) e zoom_to_object (para recortar imagens nos objetos detectados), acessíveis via a interface MCP.
Use o mcp-vision para detecção automática de objetos, automação de fluxos baseada em visão, exploração interativa de imagens e para aumentar agentes de IA com capacidades de raciocínio e análise visual.
Adicione o componente MCP ao seu fluxo no FlowHunt e insira os detalhes do servidor mcp-vision no painel de configuração utilizando o formato JSON fornecido. Certifique-se de que seu servidor MCP esteja em execução e acessível pelo FlowHunt.
Nenhuma chave de API ou credencial especial é necessária para rodar o mcp-vision segundo a documentação atual. Apenas assegure que seu ambiente Docker esteja configurado e o servidor acessível.
Potencialize seus agentes de IA com detecção de objetos e análise de imagens usando o mcp-vision. Conecte-o aos seus fluxos do FlowHunt para raciocínio multimodal sem esforços.
O Servidor OpenCV MCP conecta as poderosas ferramentas de processamento de imagem e vídeo do OpenCV com assistentes de IA e plataformas de desenvolvedores via o...
O servidor MCP interactive-mcp possibilita fluxos de trabalho de IA integrados ao ser humano, conectando agentes de IA com usuários e sistemas externos. Suporta...
O Video Still Capture MCP é um servidor em Python que fornece assistentes de IA com acesso em tempo real a webcams e fontes de vídeo através do OpenCV, permitin...