
mcp-vision
Tăng tốc quy trình AI của bạn với tích hợp mcp-vision từ FlowHunt. Khai thác phát hiện vật thể zero-shot dựa trên HuggingFace, công cụ phóng to và cắt ảnh nâng ...

Thêm thị giác máy tính vào quy trình AI của bạn với mcp-vision: phát hiện vật thể và phân tích hình ảnh dựa trên HuggingFace dưới dạng máy chủ MCP cho FlowHunt và trợ lý đa phương thức.
Máy chủ MCP “mcp-vision” là một máy chủ Model Context Protocol (MCP) giúp xuất các mô hình thị giác máy tính của HuggingFace—như phát hiện vật thể zero-shot—thành các công cụ tăng cường năng lực thị giác cho các mô hình ngôn ngữ lớn hoặc mô hình ngôn ngữ-thị giác. Bằng cách kết nối trợ lý AI với các mô hình thị giác máy tính mạnh mẽ, mcp-vision cho phép thực hiện các tác vụ như phát hiện vật thể và phân tích hình ảnh trực tiếp trong quy trình phát triển. Điều này giúp các LLM và các khách hàng AI khác có thể truy vấn, xử lý, phân tích hình ảnh một cách lập trình, dễ dàng tự động hóa, tiêu chuẩn hóa và mở rộng các tương tác dựa trên thị giác trong ứng dụng. Máy chủ này phù hợp với cả môi trường GPU và CPU, được thiết kế để tích hợp dễ dàng với các nền tảng AI phổ biến.
Không có mẫu prompt cụ thể nào được đề cập trong tài liệu hoặc file repository.
Không có tài nguyên MCP nào được ghi chú hoặc liệt kê trong repository.
locate_objects
Phát hiện và định vị các vật thể trong một hình ảnh bằng một trong các pipeline phát hiện vật thể zero-shot của HuggingFace. Đầu vào gồm đường dẫn ảnh, danh sách nhãn ứng viên và tên mô hình tùy chọn. Trả về danh sách các vật thể đã phát hiện theo định dạng tiêu chuẩn.
zoom_to_object
Phóng to vào một vật thể cụ thể trong ảnh bằng cách cắt ảnh vào hộp giới hạn của vật thể có điểm phát hiện tốt nhất. Đầu vào gồm đường dẫn ảnh, nhãn cần tìm và tên mô hình tùy chọn. Trả về ảnh đã cắt hoặc None.
Không có hướng dẫn thiết lập cho Windsurf trong repository.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json và thêm mục sau vào trường mcpServers:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
Không có hướng dẫn thiết lập cho Cursor trong repository.
Không có hướng dẫn thiết lập cho Cline trong repository.
Sử dụng MCP trong FlowHunt
Để tích hợp các máy chủ MCP vào workflow FlowHunt của bạn, hãy bắt đầu bằng cách thêm thành phần MCP vào flow và kết nối nó với tác nhân AI của bạn:

Nhấp vào thành phần MCP để mở bảng cấu hình. Trong phần cấu hình hệ thống MCP, hãy chèn thông tin máy chủ MCP của bạn theo định dạng JSON sau:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Sau khi cấu hình, tác nhân AI sẽ có thể sử dụng MCP này như một công cụ với đầy đủ chức năng và khả năng của nó. Hãy nhớ thay “mcp-vision” bằng tên thực tế của máy chủ MCP của bạn và thay URL bằng URL máy chủ MCP của bạn.
| Phần | Tình trạng | Chi tiết/Ghi chú |
|---|---|---|
| Tổng quan | ✅ | Các mô hình thị giác HuggingFace dưới dạng công cụ cho LLM qua MCP |
| Danh sách Prompt | ⛔ | Không có mẫu prompt nào được ghi chú |
| Danh sách Tài nguyên | ⛔ | Không có tài nguyên nào được liệt kê |
| Danh sách Công cụ | ✅ | locate_objects, zoom_to_object |
| Bảo mật API Key | ⛔ | Không có hướng dẫn về API key |
| Hỗ trợ sampling (ít quan trọng khi đánh giá) | ⛔ | Không đề cập |
Nhìn chung, mcp-vision cung cấp tích hợp hữu ích, trực tiếp với các mô hình thị giác HuggingFace nhưng thiếu tài liệu về tài nguyên, mẫu prompt hoặc các tính năng MCP nâng cao như roots hoặc sampling. Việc thiết lập được hướng dẫn rõ ràng cho Claude Desktop nhưng chưa có cho các nền tảng khác.
mcp-vision là một máy chủ MCP tập trung và thực tiễn để bổ sung trí tuệ thị giác cho quy trình AI, đặc biệt ở những môi trường hỗ trợ Docker. Điểm mạnh lớn nhất là các công cụ rõ ràng và thiết lập đơn giản cho Claude Desktop, nhưng sẽ hoàn thiện hơn nếu có tài liệu phong phú về tài nguyên, mẫu prompt và hỗ trợ thêm các nền tảng hoặc tính năng MCP nâng cao.
| Có LICENSE | ✅ MIT |
|---|---|
| Có ít nhất một công cụ | ✅ |
| Số lượng Forks | 0 |
| Số lượng Stars | 23 |
Tăng cường sức mạnh cho tác nhân AI của bạn với phát hiện vật thể và phân tích hình ảnh bằng mcp-vision. Kết nối vào các flow FlowHunt của bạn để suy luận đa phương thức mượt mà.

Tăng tốc quy trình AI của bạn với tích hợp mcp-vision từ FlowHunt. Khai thác phát hiện vật thể zero-shot dựa trên HuggingFace, công cụ phóng to và cắt ảnh nâng ...

Tích hợp FlowHunt với Máy chủ OpenCV MCP để mang các khả năng thị giác máy tính tiên tiến, phân tích hình ảnh và video theo thời gian thực, nhận diện đối tượng ...

Máy chủ Giao thức Ngữ cảnh Mô hình (MCP) kết nối các trợ lý AI với nguồn dữ liệu ngoài, API và dịch vụ, giúp tích hợp quy trình phức tạp và quản lý bảo mật các ...
Đồng Ý Cookie
Chúng tôi sử dụng cookie để cải thiện trải nghiệm duyệt web của bạn và phân tích lưu lượng truy cập của mình. See our privacy policy.