
OpenCV MCP 서버
OpenCV MCP 서버는 OpenCV의 강력한 이미지 및 비디오 처리 도구를 AI 어시스턴트와 개발자 플랫폼에 Model Context Protocol(MCP)을 통해 연결합니다. 이미지 조작, 객체 감지, 비디오 분석 등 고급 컴퓨터 비전 워크플로우를 선호하는 개발 환경 내에서 직접...
mcp-vision을 이용해 컴퓨터 비전을 AI 워크플로우에 추가하세요: HuggingFace 기반의 객체 감지 및 이미지 분석을 FlowHunt와 멀티모달 어시스턴트를 위한 MCP 서버로 제공합니다.
“mcp-vision” MCP 서버는 모델 컨텍스트 프로토콜(Model Context Protocol, MCP) 서버로, HuggingFace의 컴퓨터 비전 모델(예: zero-shot 객체 감지)을 대형 언어 모델(LLM) 혹은 비전-언어 모델의 시각적 역량을 강화하는 도구로 제공합니다. 이 서버를 통해 AI 어시스턴트와 강력한 컴퓨터 비전 모델을 연결함으로써, 객체 감지 및 이미지 분석과 같은 작업을 개발 워크플로우 내에서 직접 수행할 수 있습니다. LLM 및 기타 AI 클라이언트가 이미지를 프로그래밍적으로 질의, 처리, 분석할 수 있어, 비전 기반 상호작용을 자동화·표준화·확장하는 데 유용합니다. 서버는 GPU와 CPU 환경 모두에 적합하며, 인기 있는 AI 플랫폼과의 손쉬운 통합을 위해 설계되었습니다.
문서나 레포지토리 파일에 특정 프롬프트 템플릿이 언급되어 있지 않습니다.
레포지토리에 명시적으로 문서화된 MCP 리소스가 없습니다.
locate_objects
HuggingFace에서 제공하는 zero-shot 객체 감지 파이프라인 중 하나를 사용하여 이미지 내 객체를 감지하고 위치를 찾습니다. 입력값은 이미지 경로, 후보 레이블 목록, 선택적 모델명입니다. 표준 형식의 감지된 객체 목록을 반환합니다.
zoom_to_object
이미지에서 특정 객체로 확대(크롭)합니다. 최적의 감지 점수를 받은 객체의 경계 상자를 기준으로 이미지를 자릅니다. 입력값은 이미지 경로, 찾을 레이블, 선택적 모델명입니다. 크롭된 이미지나 None을 반환합니다.
레포지토리에 Windsurf용 설치 안내가 제공되지 않습니다.
git clone git@github.com:groundlight/mcp-vision.git
cd mcp-vision
make build-docker
claude_desktop_config.json
파일을 열고 mcpServers
아래 다음을 추가하세요:"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp-vision"],
"env": {}
}
}
"mcpServers": {
"mcp-vision": {
"command": "docker",
"args": ["run", "-i", "--rm", "--runtime=nvidia", "--gpus", "all", "groundlight/mcp-vision:latest"],
"env": {}
}
}
레포지토리에 Cursor용 설치 안내가 제공되지 않습니다.
레포지토리에 Cline용 설치 안내가 제공되지 않습니다.
FlowHunt에서 MCP 사용하기
FlowHunt 워크플로우에 MCP 서버를 통합하려면, MCP 컴포넌트를 플로우에 추가하고 AI 에이전트와 연결하세요:
MCP 컴포넌트를 클릭해 설정 패널을 엽니다. 시스템 MCP 설정 섹션에 다음과 같이 MCP 서버 정보를 JSON 형식으로 입력하세요:
{
"mcp-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
설정이 완료되면, AI 에이전트가 이 MCP의 모든 기능과 역량을 도구로 사용할 수 있습니다. “mcp-vision” 이름은 실제 사용 중인 MCP 서버 명으로, URL은 본인의 MCP 서버 주소로 변경해야 합니다.
섹션 | 지원 여부 | 세부 내용/비고 |
---|---|---|
개요 | ✅ | HuggingFace 컴퓨터 비전 모델을 MCP를 통해 LLM 도구로 제공 |
프롬프트 목록 | ⛔ | 프롬프트 템플릿 문서화되지 않음 |
리소스 목록 | ⛔ | 명시적 리소스 없음 |
도구 목록 | ✅ | locate_objects, zoom_to_object |
API 키 보안 | ⛔ | API 키 안내 없음 |
샘플링 지원(평가에 덜 중요) | ⛔ | 언급되지 않음 |
전반적으로, mcp-vision은 HuggingFace 비전 모델과의 직접적이고 유용한 통합을 제공하지만, 리소스, 프롬프트 템플릿, roots 또는 샘플링 등 고급 MCP 기능에 대한 문서화가 부족합니다. Claude Desktop 환경에서의 설치는 잘 문서화되어 있으나, 다른 플랫폼에 대한 안내는 제공되지 않습니다.
mcp-vision은 특히 Docker를 지원하는 환경에서 AI 워크플로우에 시각적 인텔리전스를 추가하기에 집중적이고 실용적인 MCP 서버입니다. 명확한 도구 제공과 Claude Desktop을 위한 간단한 설치가 강점이지만, 리소스, 프롬프트 템플릿, 추가 플랫폼 및 고급 MCP 기능에 대한 더 풍부한 문서화가 필요해 보입니다.
라이선스 보유 | ✅ MIT |
---|---|
도구 최소 1개 이상 | ✅ |
포크 수 | 0 |
별 수 | 23 |
mcp-vision은 오픈 소스 모델 컨텍스트 프로토콜 서버로, HuggingFace 컴퓨터 비전 모델을 AI 어시스턴트 및 LLM을 위한 도구로 제공하여, 객체 감지, 이미지 크롭 등 다양한 비전 작업을 AI 워크플로우에서 가능하게 합니다.
mcp-vision은 locate_objects(이미지 내 zero-shot 객체 감지), zoom_to_object(감지된 객체로 이미지 크롭)와 같은 도구를 MCP 인터페이스로 제공합니다.
mcp-vision은 자동 객체 감지, 비전 기반 워크플로우 자동화, 인터랙티브 이미지 탐색, AI 에이전트의 시각적 추론 및 분석 역량 강화 등에 활용할 수 있습니다.
FlowHunt 플로우에 MCP 컴포넌트를 추가하고, 설정 패널의 JSON 형식에 따라 mcp-vision 서버 정보를 입력하세요. MCP 서버가 실행 중이며 FlowHunt에서 접근 가능한지 확인해야 합니다.
현재 문서 기준으로 mcp-vision을 실행하는 데 API 키나 특별한 인증이 필요하지 않습니다. Docker 환경만 잘 설정하고 서버가 접근 가능하면 됩니다.
OpenCV MCP 서버는 OpenCV의 강력한 이미지 및 비디오 처리 도구를 AI 어시스턴트와 개발자 플랫폼에 Model Context Protocol(MCP)을 통해 연결합니다. 이미지 조작, 객체 감지, 비디오 분석 등 고급 컴퓨터 비전 워크플로우를 선호하는 개발 환경 내에서 직접...
멀티 모델 어드바이저 MCP 서버는 FlowHunt가 AI 어시스턴트와 여러 개의 로컬 Ollama 모델을 연결하도록 하여, 다양한 AI 관점을 동시에 질의하고 종합할 수 있게 해줍니다. 이를 통해 보다 풍부하고 미묘한 답변을 생성할 수 있습니다....
BlenderMCP는 Blender와 Claude와 같은 AI 어시스턴트를 연결하여 Model Context Protocol(MCP)을 통한 자동화된 AI 기반 3D 모델링, 씬 생성, 에셋 관리를 가능하게 합니다. 실시간 프롬프트 기반 자동화와 양방향 AI 통신으로 Blender 워크...