Máy chủ Scrapling Fetch MCP

Máy chủ Scrapling Fetch MCP

Scrapling Fetch MCP Server cho phép các tác nhân AI của bạn truy xuất và trích xuất nội dung web được bảo vệ, mang lại hỗ trợ giàu ngữ cảnh và tự động hóa quy trình tài liệu ngay cả trên các trang có bảo vệ bot.

Máy chủ “Scrapling Fetch” MCP làm gì?

Scrapling Fetch MCP Server là một máy chủ Model Context Protocol (MCP) chuyên dụng nhằm hỗ trợ trợ lý AI truy cập nội dung văn bản từ các website có cơ chế chống bot và chống tự động hóa. Bằng cách tận dụng công cụ Scrapling nền tảng, nó thu hẹp khoảng cách giữa những gì người dùng thấy trên trình duyệt và những gì các tác nhân AI có thể truy xuất, cho phép lấy HTML hoặc markdown từ các trang vốn sẽ chặn các trình quét tự động. Scrapling Fetch MCP được tối ưu cho việc truy xuất tài liệu và tài liệu tham khảo với tần suất thấp, tập trung vào văn bản và HTML thay vì quét web tổng quát. Điều này giúp nó trở thành công cụ hữu ích cho các quy trình phát triển cần truy cập tài liệu trực tuyến được bảo vệ hoặc bổ sung ngữ cảnh, đồng thời tôn trọng ranh giới và mục đích sử dụng của website.

Danh sách Prompt

Không có mẫu prompt cụ thể nào được ghi lại trong kho lưu trữ.

Danh sách Tài nguyên

Không có tài nguyên MCP cụ thể nào được ghi lại trong kho lưu trữ.

Danh sách Công cụ

  • s-fetch-page: Lấy toàn bộ trang web, hỗ trợ phân trang để truy xuất dần các tài liệu lớn.
  • s-fetch-pattern: Trích xuất nội dung cụ thể từ trang web bằng cách khớp với biểu thức chính quy do người dùng cung cấp, cùng với ngữ cảnh tùy chỉnh.

Các trường hợp sử dụng Máy chủ MCP này

  • Truy cập tài liệu có bảo vệ bot: Lập trình viên có thể lấy tài liệu hoặc tài liệu tham khảo từ các trang vốn sẽ chặn công cụ tự động, giúp trợ lý AI trả lời bằng nguồn được bảo vệ, cập nhật.
  • Trích xuất thông tin cụ thể: Sử dụng biểu thức chính quy để trích xuất dữ liệu mục tiêu (như khóa API, đoạn cấu hình hoặc tham chiếu) từ những trang tài liệu lớn, giảm nhiễu và tập trung vào ngữ cảnh liên quan.
  • Tóm tắt nội dung web: Lấy toàn bộ trang web và tóm tắt nội dung của chúng, giúp người dùng dễ dàng nắm bắt tài liệu lớn hoặc phức tạp.
  • Hỗ trợ theo ngữ cảnh trong IDE: Tích hợp máy chủ vào môi trường phát triển, cho phép công cụ AI truy xuất và cung cấp trợ giúp theo ngữ cảnh từ tài nguyên trực tuyến được bảo vệ.
  • Truy xuất từng phần trang: Xử lý tài liệu lớn bằng cách phân trang yêu cầu, đảm bảo cả các tài liệu tham khảo mở rộng cũng có thể được xử lý mà không tốn quá nhiều tài nguyên.

Cách thiết lập

Windsurf

Không có hướng dẫn cụ thể cho Windsurf được ghi lại trong kho lưu trữ.

Claude

  1. Đảm bảo các điều kiện tiên quyết: Đã cài đặt Python 3.10+ và trình quản lý gói uv.
  2. Cài đặt các phụ thuộc:
    uv tool install scrapling
    scrapling install
    uv tool install scrapling-fetch-mcp
    
  3. Xác định vị trí tệp cấu hình của client Claude.
  4. Thêm máy chủ Scrapling Fetch MCP:
    {
      "mcpServers": {
        "Cyber-Chitta": {
          "command": "uvx",
          "args": ["scrapling-fetch-mcp"]
        }
      }
    }
    
  5. Lưu và khởi động lại client Claude để áp dụng cấu hình.

Bảo mật khóa API

Không có tài liệu rõ ràng về việc sử dụng khóa API hoặc cấu hình biến môi trường.

Cursor

Không có hướng dẫn cụ thể cho Cursor được ghi lại trong kho lưu trữ.

Cline

Không có hướng dẫn cụ thể cho Cline được ghi lại trong kho lưu trữ.

Cách sử dụng MCP này trong các flow

Sử dụng MCP trong FlowHunt

Để tích hợp máy chủ MCP vào quy trình FlowHunt, hãy bắt đầu bằng cách thêm thành phần MCP vào flow và kết nối nó với tác nhân AI của bạn:

FlowHunt MCP flow

Nhấp vào thành phần MCP để mở bảng cấu hình. Trong phần cấu hình hệ thống MCP, hãy nhập chi tiết máy chủ MCP của bạn với định dạng JSON sau:

{
  "scrapling-fetch": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Sau khi cấu hình xong, tác nhân AI có thể sử dụng MCP này như một công cụ với đầy đủ chức năng và năng lực. Đừng quên đổi “scrapling-fetch” thành tên thật của máy chủ MCP bạn sử dụng và thay thế URL bằng địa chỉ máy chủ MCP của bạn.


Tổng quan

MụcKhả dụngChi tiết/Ghi chú
Tổng quanCó tổng quan rõ ràng trong README
Danh sách PromptKhông có mẫu prompt nào được ghi lại
Danh sách Tài nguyênKhông có định nghĩa tài nguyên MCP nào được ghi lại
Danh sách Công cụs-fetch-page, s-fetch-pattern
Bảo mật khóa APIKhông có chi tiết về thiết lập khóa API hoặc biến môi trường
Hỗ trợ Sampling (ít quan trọng trong đánh giá)Không được đề cập

| Hỗ trợ Roots | ⛔ | Không được đề cập |


Trong số hai bảng trên, Scrapling Fetch MCP Server nổi bật ở khả năng cung cấp công cụ rõ ràng và hữu ích cho việc truy xuất web được bảo vệ, nhưng thiếu các prompt tiêu chuẩn, khai báo tài nguyên và tài liệu nâng cao về bảo mật/biến môi trường. Dựa trên tính năng và tài liệu, chúng tôi đánh giá MCP này 6/10 về độ hoàn thiện và tính hữu ích tổng thể.


Điểm MCP

Có LICENSE✅ (Apache-2.0)
Có ít nhất một công cụ
Số lượng Forks5
Số lượng Stars31

Câu hỏi thường gặp

Máy chủ Scrapling Fetch MCP làm gì?

Nó cho phép các tác nhân AI và chatbot truy cập và trích xuất nội dung văn bản hoặc HTML từ các website có bảo vệ bot, giúp truy xuất tài liệu hoặc tài liệu tham khảo mà các công cụ tự động khác thường không thể tiếp cận.

Những công cụ nào có với Scrapling Fetch MCP?

Hai công cụ chính: s-fetch-page (lấy toàn bộ trang web, hỗ trợ phân trang cho tài liệu lớn) và s-fetch-pattern (trích xuất nội dung khớp với biểu thức chính quy do người dùng cung cấp, với ngữ cảnh có thể cấu hình).

Những trường hợp sử dụng điển hình là gì?

Các trường hợp sử dụng gồm truy cập tài liệu có bảo vệ bot, trích xuất thông tin cụ thể qua regex, tóm tắt nội dung web, hỗ trợ IDE theo ngữ cảnh và truy xuất từng phần các tài liệu lớn.

Cách cấu hình Scrapling Fetch MCP trong FlowHunt?

Thêm thành phần MCP vào luồng của bạn, mở bảng cấu hình và nhập thông tin máy chủ của bạn dưới dạng JSON trong cấu hình hệ thống MCP. Đảm bảo sử dụng đúng tên và URL máy chủ cho triển khai của bạn.

Có cần khóa API hoặc các bước bảo mật bổ sung không?

Tài liệu hiện tại không chỉ rõ cần khóa API hoặc cấu hình biến môi trường cho Scrapling Fetch MCP.

Scrapling Fetch MCP sử dụng giấy phép gì?

Nó được phát hành theo giấy phép Apache-2.0, là mã nguồn mở và phù hợp để tích hợp vào cả dự án cá nhân lẫn thương mại.

Dùng thử Máy chủ Scrapling Fetch MCP với FlowHunt

Tích hợp Scrapling Fetch MCP Server để nâng cao quy trình AI của bạn với quyền truy cập nội dung website được bảo vệ và khả năng tự động hóa web mạnh mẽ hơn.

Tìm hiểu thêm

Fetch MCP Server
Fetch MCP Server

Fetch MCP Server

Fetch MCP Server cho FlowHunt cho phép các tác nhân AI truy xuất và chuyển đổi nội dung web trực tiếp ở nhiều định dạng khác nhau, bao gồm HTML, JSON, văn bản t...

6 phút đọc
AI MCP Servers +4
Máy chủ ScrAPI MCP
Máy chủ ScrAPI MCP

Máy chủ ScrAPI MCP

Máy chủ ScrAPI MCP trao quyền cho các trợ lý AI trích xuất nội dung web trực tiếp—ngay cả từ các trang web được bảo vệ bởi captcha, phát hiện bot hoặc giới hạn ...

5 phút đọc
MCP Server Web Scraping +6
Máy chủ Firecrawl MCP
Máy chủ Firecrawl MCP

Máy chủ Firecrawl MCP

Máy chủ Firecrawl MCP tăng cường FlowHunt và các trợ lý AI với khả năng thu thập dữ liệu web nâng cao, nghiên cứu chuyên sâu và khám phá nội dung. Tích hợp liền...

5 phút đọc
AI Web Scraping +4