Máy chủ ScrAPI MCP

Máy chủ ScrAPI MCP

Máy chủ ScrAPI MCP cho phép các agent AI của bạn thu thập và sử dụng dữ liệu web trực tiếp, vượt qua các rào cản thu thập thông thường để tự động hóa mạnh mẽ và làm giàu ngữ cảnh.

Máy chủ “ScrAPI” MCP làm gì?

Máy chủ ScrAPI MCP cho phép các trợ lý AI thu thập nội dung web bằng cách kết nối tới dịch vụ ScrAPI. Nó đóng vai trò cầu nối giữa các client AI và nội dung web bên ngoài, cho phép trích xuất tự động HTML hoặc Markdown từ hầu như bất kỳ trang web nào—kể cả các trang được bảo vệ bởi phát hiện bot, captcha hoặc giới hạn vị trí địa lý. Công cụ này hữu ích để tích hợp dữ liệu web thời gian thực vào các quy trình AI, rất lý tưởng cho các nhà phát triển cần thông tin web mới nhất hoặc khó truy cập. Bằng cách cung cấp các endpoint API đơn giản, Máy chủ ScrAPI MCP giúp đơn giản hóa các tác vụ như thu thập nội dung, trích xuất dữ liệu và làm giàu ngữ cảnh cho các Mô hình Ngôn ngữ, nâng cao khả năng tương tác và sử dụng dữ liệu web trực tiếp trong nhiều kịch bản phát triển và tự động hóa.

Danh sách Prompt

Không có mẫu prompt nào được đề cập trong kho lưu trữ.

Danh sách Resource

Không có resource cụ thể nào được liệt kê trong kho lưu trữ.

Danh sách Công cụ

  • scrape_url_html
    • Thu thập một trang web bằng dịch vụ ScrAPI và trả về kết quả dưới dạng HTML. Hữu ích khi cần phân tích nâng cao hoặc thông tin cấu trúc từ nội dung web khó truy cập.
  • scrape_url_markdown
    • Thu thập một trang web bằng dịch vụ ScrAPI và trả về kết quả dưới dạng Markdown. Phù hợp khi nội dung văn bản trên trang web quan trọng hơn cấu trúc của nó.

Các trường hợp sử dụng MCP này

  • Trích xuất nội dung tự động
    • Nhà phát triển có thể tự động hóa quá trình trích xuất nội dung HTML hoặc Markdown từ các trang web, kể cả những trang được bảo vệ chống bot.
  • Làm giàu dữ liệu cho LLM
    • Tăng cường phản hồi của mô hình AI bằng cách cung cấp nội dung web mới làm ngữ cảnh, cải thiện độ chính xác và liên quan.
  • Phân tích đối thủ và thị trường
    • Nhanh chóng thu thập dữ liệu từ các trang đối thủ hoặc nguồn thị trường vốn khó thu thập do rào cản kỹ thuật.
  • Giám sát nội dung
    • Thiết lập các giải pháp giám sát thường xuyên lấy và phân tích thay đổi từ các trang web cụ thể để kiểm tra tuân thủ, cập nhật hoặc cảnh báo tin tức.
  • Tự động hóa nghiên cứu
    • Đơn giản hóa nghiên cứu học thuật hoặc thị trường bằng cách thu thập thông tin web tự động và chuyển đổi thành định dạng dễ phân tích.

Hướng dẫn thiết lập

Windsurf

Không có hướng dẫn cụ thể cho Windsurf trong kho lưu trữ.

Claude

  1. Nhận khóa API tùy chọn từ https://scrapi.tech (khuyến nghị để tăng giới hạn sử dụng).
  2. Mở file claude_desktop_config.json của bạn.
  3. Thêm Máy chủ ScrAPI MCP bằng cấu hình Docker dưới đây.
  4. Lưu file và khởi động lại Claude Desktop.
  5. Xác minh thiết lập bằng cách kiểm tra việc sử dụng công cụ thành công trong giao diện Claude.

Ví dụ JSON:

{
  "mcpServers": {
    "scrapi": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "SCRAPI_API_KEY",
        "deventerprisesoftware/scrapi-mcp"
      ],
      "env": {
        "SCRAPI_API_KEY": "<YOUR_API_KEY>"
      }
    }
  }
}

Bảo mật khóa API:
Hãy đặt khóa API của bạn trong phần env như trên, thay vì mã hóa cứng vào mã nguồn.

Cursor

Không có hướng dẫn cụ thể cho Cursor trong kho lưu trữ.

Cline

Không có hướng dẫn cụ thể cho Cline trong kho lưu trữ.

Cách sử dụng MCP trong flow

Sử dụng MCP trong FlowHunt

Để tích hợp máy chủ MCP vào workflow FlowHunt của bạn, hãy thêm thành phần MCP vào flow và kết nối với agent AI của bạn:

FlowHunt MCP flow

Nhấn vào thành phần MCP để mở bảng cấu hình. Trong phần cấu hình hệ thống MCP, chèn thông tin máy chủ MCP của bạn bằng định dạng JSON sau:

{
  "scrapi": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Sau khi cấu hình, agent AI của bạn sẽ có thể sử dụng MCP này như một công cụ với đầy đủ chức năng và khả năng của nó. Hãy nhớ thay “scrapi” thành tên thực tế của máy chủ MCP bạn dùng và thay URL bằng URL máy chủ MCP của bạn.


Tổng quan

MụcCó sẵnChi tiết/Ghi chú
Tổng quan
Danh sách PromptKhông tìm thấy mẫu prompt trong kho lưu trữ
Danh sách ResourceKhông có resource nào được liệt kê
Danh sách Công cụscrape_url_html, scrape_url_markdown
Bảo mật khóa APIqua env trong cấu hình JSON
Hỗ trợ sampling (ít quan trọng khi đánh giá)Không đề cập

Dựa trên hai bảng trên, máy chủ ScrAPI MCP đơn giản, tập trung và đã sẵn sàng cho môi trường sản xuất với chức năng cốt lõi (web scraping), nhưng thiếu các tính năng MCP nâng cao (như resource, sampling, hoặc roots) và tài liệu nền tảng rộng. Giá trị của nó rất cao cho các trường hợp sử dụng web scraping, nhưng hạn chế nếu bạn cần nhiều primitive MCP nâng cao hoặc các workflow prompt đa dạng.


Điểm MCP

Có LICENSE✅ (MIT)
Có ít nhất một công cụ
Số Forks1
Số Stars4

Đánh giá tổng thể: 6/10
Máy chủ ScrAPI MCP đáp ứng đầy đủ các yêu cầu cơ bản về cung cấp công cụ và thiết lập bảo mật, nhưng thiếu chiều sâu về hỗ trợ prompt/resource và tài liệu cài đặt đa nền tảng. Tuyệt vời cho mục đích cụ thể, nhưng chưa phải là giải pháp MCP “full-stack”.

Câu hỏi thường gặp

Máy chủ ScrAPI MCP là gì?

Máy chủ ScrAPI MCP là cầu nối giữa các client AI và dịch vụ thu thập web ScrAPI, cho phép trích xuất tự động HTML hoặc Markdown từ hầu như bất kỳ trang web nào—kể cả các trang được bảo vệ bởi phát hiện bot hoặc captcha.

Máy chủ ScrAPI MCP cung cấp những công cụ nào?

Nó cung cấp hai công cụ chính: `scrape_url_html` để lấy trang web dưới dạng HTML, và `scrape_url_markdown` để lấy nội dung dưới dạng Markdown.

Các trường hợp sử dụng phổ biến của máy chủ MCP này là gì?

Máy chủ ScrAPI MCP lý tưởng cho việc trích xuất nội dung tự động, làm giàu dữ liệu cho LLM, phân tích đối thủ, giám sát nội dung và tự động hóa nghiên cứu—đặc biệt khi các scraper truyền thống thất bại do rào cản bảo mật.

Làm thế nào để bảo mật khóa API ScrAPI của tôi?

Luôn lưu trữ khóa API của bạn trong phần `env` của cấu hình máy chủ MCP, không để trực tiếp trong mã nguồn. Điều này bảo vệ khóa khỏi bị lộ ngoài ý muốn.

Máy chủ ScrAPI MCP đã sẵn sàng cho môi trường sản xuất chưa?

Nó tập trung và đáng tin cậy cho các trường hợp sử dụng thu thập web, với thiết lập bảo mật và công cụ rõ ràng. Tuy nhiên, nó chưa có các tính năng MCP nâng cao như hỗ trợ prompt hoặc resource.

Tôi có thể sử dụng Máy chủ ScrAPI MCP với FlowHunt không?

Có! Chỉ cần thêm thành phần MCP vào quy trình FlowHunt của bạn, cấu hình với thông tin máy chủ ScrAPI, và AI agent của bạn có thể truy cập dữ liệu web trực tiếp như một phần của flow.

Tích hợp Máy chủ ScrAPI MCP với FlowHunt

Tăng tốc quy trình AI của bạn với dữ liệu web thời gian thực, dễ truy cập—bất kể trang web được bảo vệ như thế nào. Bắt đầu sử dụng Máy chủ ScrAPI MCP với FlowHunt ngay hôm nay.

Tìm hiểu thêm

Máy chủ Scrapling Fetch MCP
Máy chủ Scrapling Fetch MCP

Máy chủ Scrapling Fetch MCP

Máy chủ Scrapling Fetch MCP cho phép trợ lý AI và chatbot truy cập nội dung văn bản và HTML từ các trang web có bảo vệ bot, giúp truy xuất tài liệu và tài liệu ...

5 phút đọc
MCP Server Web Scraping +4
Máy chủ Search1API MCP
Máy chủ Search1API MCP

Máy chủ Search1API MCP

Máy chủ Search1API MCP tích hợp khả năng tìm kiếm web thời gian thực và thu thập dữ liệu vào các tác nhân AI thông qua Search1API mạnh mẽ, cho phép truy xuất th...

5 phút đọc
AI MCP Server +5
Máy chủ Giao thức Ngữ cảnh Mô hình (MCP)
Máy chủ Giao thức Ngữ cảnh Mô hình (MCP)

Máy chủ Giao thức Ngữ cảnh Mô hình (MCP)

Máy chủ Giao thức Ngữ cảnh Mô hình (MCP) kết nối các trợ lý AI với nguồn dữ liệu ngoài, API và dịch vụ, giúp tích hợp quy trình phức tạp và quản lý bảo mật các ...

4 phút đọc
AI MCP +4