
OpenCV MCP 服务器
OpenCV MCP 服务器通过模型上下文协议(MCP)将 OpenCV 强大的图像和视频处理工具与 AI 助手及开发者平台连接起来。可在您喜爱的开发环境中,直接实现高级计算机视觉工作流,包括图像处理、目标检测和视频分析等。...
使用 mcp-vision 为您的 AI 工作流添加计算机视觉功能:基于 HuggingFace 的目标检测和图像分析,作为 FlowHunt 和多模态助手的 MCP 服务器。
“mcp-vision” MCP 服务器是一个 Model Context Protocol (MCP) 服务器,将 HuggingFace 计算机视觉模型(如零样本目标检测)作为工具,提升大语言模型或视觉-语言模型的视觉能力。通过将 AI 助手与强大的计算机视觉模型连接,mcp-vision 可在开发流程中直接实现目标检测与图像分析。这使得 LLM 及其他 AI 客户端能够以编程方式查询、处理并分析图像,更容易实现视觉交互的自动化、标准化与扩展。该服务器支持 GPU 和 CPU 环境,便于集成至主流 AI 平台。
文档与仓库文件中未提及具体提示词模板。
仓库中未明确记录或列出 MCP 资源。
locate_objects
通过 HuggingFace 提供的零样本目标检测管道,在图像中检测并定位对象。输入包括图像路径、候选标签列表,以及可选的模型名。返回标准格式的检测对象列表。
zoom_to_object
通过将图像裁剪到检测分数最高对象的边界框,放大图像中的特定对象。输入包括图像路径、要查找的标签,以及可选的模型名。返回裁剪后的图像或 None。
仓库中未提供 Windsurf 的配置说明。
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
,在 mcpServers
下添加如下内容:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
仓库中未提供 Cursor 的配置说明。
仓库中未提供 Cline 的配置说明。
在 FlowHunt 中使用 MCP
要将 MCP 服务器集成到 FlowHunt 工作流中,首先添加 MCP 组件并与您的 AI 智能体连接:
点击 MCP 组件,打开配置面板。在系统 MCP 配置部分,按以下 JSON 格式填写您的 MCP 服务器信息:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
配置完成后,AI 智能体即可作为工具调用该 MCP 的全部功能。请记得将 “mcp-vision” 替换为您实际的 MCP 服务器名称,并将 URL 改为您的 MCP 服务器地址。
部分 | 是否可用 | 详细说明 |
---|---|---|
概览 | ✅ | HuggingFace 计算机视觉模型通过 MCP 作为 LLM 工具 |
提示词列表 | ⛔ | 未记录提示词模板 |
资源列表 | ⛔ | 未列出明确资源 |
工具列表 | ✅ | locate_objects, zoom_to_object |
安全 API 密钥 | ⛔ | 未说明 API 密钥相关内容 |
采样支持(评估时不重要) | ⛔ | 未提及 |
总体来看,mcp-vision 可直接与 HuggingFace 视觉模型集成,资源、提示词模板及 roots 或采样等高级 MCP 功能的文档略有不足。其在 Claude Desktop 上的部署说明清晰,但对其他平台支持有限。
mcp-vision 是专注且实用的 MCP 服务器,为 AI 工作流添加视觉智能,尤其适合支持 Docker 的环境。其主要优点在于工具明确、Claude Desktop 部署简单,但在资源、提示词模板以及对更多平台和高级 MCP 功能的文档方面仍有提升空间。
是否有 LICENSE | ✅ MIT |
---|---|
是否有至少一个工具 | ✅ |
Fork 数量 | 0 |
Star 数量 | 23 |
mcp-vision 是一个开源的 Model Context Protocol 服务器,将 HuggingFace 计算机视觉模型作为工具提供给 AI 助手和大语言模型(LLM),实现目标检测、图像裁剪等功能,丰富您的 AI 工作流。
mcp-vision 提供如 locate_objects(用于图像的零样本目标检测)和 zoom_to_object(将图像裁剪到检测到的目标),可通过 MCP 接口访问。
可用于自动目标检测、基于视觉的流程自动化、交互式图像探索,以及增强 AI 智能体的视觉推理和分析能力。
在 FlowHunt 流程中添加 MCP 组件,并在配置面板中以提供的 JSON 格式填写 mcp-vision 服务器信息。确保您的 MCP 服务器已启动并可从 FlowHunt 访问。
根据当前文档,运行 mcp-vision 无需 API 密钥或特殊凭证。只需确保已配置好 Docker 环境且服务器可访问。
OpenCV MCP 服务器通过模型上下文协议(MCP)将 OpenCV 强大的图像和视频处理工具与 AI 助手及开发者平台连接起来。可在您喜爱的开发环境中,直接实现高级计算机视觉工作流,包括图像处理、目标检测和视频分析等。...
BlenderMCP 将 Blender 与 Claude 等 AI 助手连接,通过模型上下文协议(MCP)实现自动化、AI 驱动的 3D 建模、场景创建和资产管理。通过实时、基于提示的自动化与双向 AI 通信,让你的 Blender 工作流程如虎添翼。...
Puppeteer Vision MCP 服务器让 AI 助手能够抓取网页并转换为 Markdown,通过先进的 AI 驱动交互自动绕过 CAPTCHA、付费墙等交互障碍,轻松集成至 AI 工作流(基于 MCP 协议),简化网页数据提取与导入。...