
mcp-vision Máy chủ MCP
Máy chủ mcp-vision MCP kết nối các mô hình thị giác máy tính của HuggingFace—như phát hiện vật thể zero-shot—với FlowHunt và các nền tảng AI khác, giúp các LLM ...
Tự động hóa thu thập dữ liệu web mạnh mẽ bằng AI và chuyển đổi sang Markdown—even trên các trang web tương tác hoặc được bảo vệ—bằng Máy chủ Puppeteer Vision MCP.
Máy chủ Puppeteer Vision MCP cho phép trợ lý AI thu thập và chuyển đổi trang web sang định dạng Markdown bằng Puppeteer, Readability và Turndown. Nó cung cấp tương tác AI tiên tiến để tự động xử lý các yếu tố web như banner cookie, CAPTCHA, paywall, v.v., đảm bảo trích xuất nội dung mạnh mẽ ngay cả trên các trang web tương tác hoặc được bảo vệ. Máy chủ này cung cấp khả năng đó thông qua Giao thức Bối cảnh Mô hình (MCP), giúp dễ dàng tích hợp vào quy trình phát triển AI. Điều này cho phép các tác vụ như thu thập dữ liệu web tự động, tóm tắt nội dung và nhập dữ liệu được thực hiện liền mạch bởi LLM. Máy chủ dễ dàng triển khai qua npx
, yêu cầu cấu hình tối thiểu và hỗ trợ cả giao tiếp stdio lẫn SSE để tích hợp linh hoạt.
Không có mẫu prompt nào được đề cập trong kho lưu trữ hoặc tài liệu.
Không có tài nguyên MCP cụ thể nào được liệt kê hoặc mô tả trong kho lưu trữ hoặc tài liệu.
url
(string, bắt buộc): Trang web cần thu thập.autoInteract
(boolean, tùy chọn, mặc định: true): Có tự động xử lý các yếu tố tương tác không.maxInteractionAttempts
(số, tùy chọn, mặc định: 3): Số lần tương tác AI tối đa.waitForNetworkIdle
(boolean, tùy chọn, mặc định: true): Chờ mạng không còn hoạt động trước khi thu thập.Yêu cầu: Cài đặt Node.js và npm.
Thiết lập môi trường: Tạo tệp .env
hoặc export các biến môi trường cần thiết, bao gồm OPENAI_API_KEY
.
Sửa cấu hình: Tìm tệp cấu hình của Windsurf.
Thêm Puppeteer Vision MCP: Thêm đoạn JSON sau:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Lưu/Khởi động lại: Lưu tệp và khởi động lại Windsurf.
Kiểm tra: Xem log hoặc giao diện để xác nhận máy chủ MCP đã chạy.
Bảo mật API Keys:
Lưu trữ bí mật trong biến môi trường (ví dụ, .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Yêu cầu: Đảm bảo Node.js và npm đã được cài đặt.
Thiết lập môi trường: Chuẩn bị .env
hoặc export OPENAI_API_KEY
cùng các biến khác.
Sửa cấu hình: Mở cấu hình MCP của Claude.
Thêm MCP Server:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Khởi động lại Claude: Áp dụng thay đổi và khởi động lại nền tảng.
Kiểm tra: Xác nhận khởi động thành công.
Yêu cầu: Cài đặt Node.js và npm.
Môi trường: Thiết lập .env
với khóa API OpenAI.
Sửa cấu hình Cursor: Thêm MCP server như sau:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Lưu & Khởi động lại: Lưu thay đổi và khởi động lại Cursor.
Kiểm tra log: Đảm bảo máy chủ đã chạy.
Yêu cầu: Cài đặt Node.js và npm.
Môi trường: Thiết lập hoặc export OPENAI_API_KEY
.
Cấu hình: Thêm vào cấu hình MCP của Cline:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Khởi động lại Cline: Áp dụng và khởi động lại.
Xác nhận: Kiểm tra máy chủ đã truy cập được.
Lưu ý: Bảo mật API key bằng biến môi trường và không ghi cứng bí mật vào tệp cấu hình.
Sử dụng MCP trong FlowHunt
Để tích hợp máy chủ MCP vào quy trình FlowHunt của bạn, hãy thêm thành phần MCP vào flow và kết nối với tác nhân AI:
Nhấn vào thành phần MCP để mở bảng cấu hình. Trong phần cấu hình hệ thống MCP, chèn thông tin máy chủ MCP bằng định dạng JSON sau:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Sau khi cấu hình, tác nhân AI có thể sử dụng MCP này như một công cụ với đầy đủ chức năng và khả năng. Lưu ý thay “puppeteer-vision” thành tên thực tế của máy chủ MCP và thay URL bằng URL máy chủ của bạn.
Phần | Tình trạng | Chi tiết/Ghi chú |
---|---|---|
Tổng quan | ✅ | Đã trình bày trong README. |
Danh sách Prompt | ⛔ | Không tìm thấy mẫu prompt nào. |
Danh sách Tài nguyên | ⛔ | Không mô tả tài nguyên MCP cụ thể. |
Danh sách Công cụ | ✅ | Công cụ scrape-webpage , chi tiết trong README. |
Hướng dẫn bảo mật API Key | ✅ | Có hướng dẫn cho .env và biến môi trường. |
Hỗ trợ Sampling (không quan trọng khi đánh giá) | ⛔ | Không đề cập đến hỗ trợ sampling. |
| Hỗ trợ Roots | ⛔ | Không đề cập đến Roots. |
Dựa trên các mục trên, Máy chủ Puppeteer Vision MCP cung cấp một công cụ thu thập dữ liệu web mạnh mẽ, tài liệu tốt và hướng dẫn bảo mật, nhưng thiếu đa công cụ, mẫu prompt, tài nguyên và các tính năng MCP nâng cao như roots hoặc sampling. Thiết kế một công cụ, một mục đích giúp tính ổn định cao cho trường hợp sử dụng, nhưng giới hạn khả năng mở rộng.
Điểm MCP: 5/10
Máy chủ MCP này có tài liệu tốt, hữu ích cho mục đích cụ thể và dễ thiết lập, nhưng thiếu mẫu prompt, tài nguyên rõ ràng và các tính năng MCP nâng cao (roots, sampling) nên bị hạn chế về tính linh hoạt và tích hợp hệ sinh thái.
Có LICENSE | ⛔ |
---|---|
Có ít nhất một công cụ | ✅ |
Số lượng Forks | 5 |
Số lượng Stars | 12 |
Đây là máy chủ MCP cho phép tác nhân AI thu thập và chuyển đổi trang web sang Markdown bằng Puppeteer, Readability và Turndown. Nó có thể tự động tương tác và vượt qua các rào cản web phổ biến (như CAPTCHA và banner cookie), giúp trích xuất nội dung mạnh mẽ để nhập vào quy trình AI.
Tự động thu thập dữ liệu web để nhập tri thức, vượt qua rào cản tương tác, tóm tắt và phân tích nội dung, tự động hóa trình duyệt thời gian thực, và tích hợp liền mạch vào pipeline dàn nhạc LLM.
Cấu hình trong tệp cấu hình máy chủ MCP của orchestrator, xác định lệnh và biến môi trường (bao gồm khóa API OpenAI của bạn). Hướng dẫn chi tiết đã có ở phần trên cho Windsurf, Claude, Cursor và Cline.
Nó sử dụng tự động hóa dựa trên AI để tương tác, loại bỏ hoặc vượt qua các yếu tố web như banner cookie, CAPTCHA và paywall, đảm bảo trích xuất nội dung ngay cả với các trang web bảo vệ hoặc tương tác.
Có. Luôn lưu trữ API key trong biến môi trường hoặc tệp `.env`. Không bao giờ ghi cứng bí mật vào tệp cấu hình.
Công cụ chính là `scrape-webpage`, thu thập dữ liệu URL được chỉ định, tương tác với các yếu tố web khi cần và xuất nội dung chính dưới dạng Markdown.
Tăng tốc quy trình AI với thu thập dữ liệu web và trích xuất nội dung tiên tiến. Thiết lập Máy chủ Puppeteer Vision MCP trong vài phút và bắt đầu đưa dữ liệu web trực tiếp vào pipeline AI của bạn.
Máy chủ mcp-vision MCP kết nối các mô hình thị giác máy tính của HuggingFace—như phát hiện vật thể zero-shot—với FlowHunt và các nền tảng AI khác, giúp các LLM ...
Máy chủ Markitdown MCP kết nối trợ lý AI với nội dung markdown, cho phép tự động hóa tài liệu, phân tích nội dung và quản lý tệp markdown để nâng cao quy trình ...
Máy chủ ScrAPI MCP trao quyền cho các trợ lý AI trích xuất nội dung web trực tiếp—ngay cả từ các trang web được bảo vệ bởi captcha, phát hiện bot hoặc giới hạn ...