Scrapling Fetch MCP 服务器

Scrapling Fetch MCP 服务器

Scrapling Fetch MCP 服务器让您的 AI 代理抓取和提取受保护的网页内容,即使在有机器人保护的网站上,也能实现丰富上下文的辅助和自动化文档流程。

“Scrapling Fetch” MCP 服务器的作用是什么?

Scrapling Fetch MCP 服务器是专为帮助 AI 助手访问带有机器人保护和反自动化措施的网站文本内容而设计的 Model Context Protocol(MCP)服务器。通过底层的 Scrapling 工具,它弥合了用户在浏览器中可见内容与 AI 代理可获取内容之间的鸿沟,使其能够从原本会屏蔽自动抓取工具的网站抓取 HTML 或 markdown。Scrapling Fetch MCP 优化于低频次检索文档和参考资料,特别关注文本与 HTML,而非通用网页抓取。这使其成为开发工作流中访问受保护在线文档或丰富上下文的有价值资产,同时尊重网站边界与用途。

提示词列表

仓库中未记录明确的提示词模板。

资源列表

仓库中未记录明确的 MCP 资源。

工具列表

  • s-fetch-page:获取完整网页,支持分页,便于对大型文档进行增量抓取。
  • s-fetch-pattern:通过用户提供的正则表达式匹配网页内容,并可配置提取上下文。

本 MCP 服务器的使用场景

  • 访问受保护的文档:开发者可以从原本会屏蔽自动化工具的网站检索文档或参考资料,使 AI 助手能够利用最新的受保护资源回答问题。
  • 提取特定信息:利用正则表达式从大型文档页面中提取目标数据(如 API 密钥、配置片段或引用),降低噪声,聚焦相关上下文。
  • 摘要网页内容:抓取整个网页并进行内容摘要,帮助用户高效消化大型或复杂文档。
  • IDE 上下文辅助:与开发环境集成,使 AI 工具能够利用受保护在线资源提供上下文相关辅助。
  • 增量页面抓取:通过分页请求处理大型文档,确保即使超大参考资料也能被处理且资源消耗可控。

如何设置

Windsurf

仓库中未记录 Windsurf 的具体说明。

Claude

  1. 确保先决条件:已安装 Python 3.10+ 和 uv 包管理器。
  2. 安装依赖项
    uv tool install scrapling
    scrapling install
    uv tool install scrapling-fetch-mcp
    
  3. 找到您的 Claude 客户端配置文件
  4. 添加 Scrapling Fetch MCP 服务器
    {
      "mcpServers": {
        "Cyber-Chitta": {
          "command": "uvx",
          "args": ["scrapling-fetch-mcp"]
        }
      }
    }
    
  5. 保存并重启 Claude 客户端,以应用配置。

API 密钥安全

未提供关于 API 密钥使用或环境变量配置的明确信息。

Cursor

仓库中未记录 Cursor 的具体说明。

Cline

仓库中未记录 Cline 的具体说明。

如何在流程中使用此 MCP

在 FlowHunt 中使用 MCP

要在 FlowHunt 工作流中集成 MCP 服务器,首先将 MCP 组件添加至您的流程,并与 AI 代理连接:

FlowHunt MCP flow

点击 MCP 组件以打开配置面板。在系统 MCP 配置区域,按如下 JSON 格式输入您的 MCP 服务器信息:

{
  "scrapling-fetch": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI 代理即可使用此 MCP 的所有功能。请注意,将 “scrapling-fetch” 替换为您实际的 MCP 服务器名称,并将 URL 替换为您自己的 MCP 服务器地址。


概览

部分可用性详情/备注
概览README 中有清晰简介
提示词列表未记录提示词模板
资源列表未记录 MCP 资源定义
工具列表s-fetch-page, s-fetch-pattern
API 密钥安全未说明 API 密钥或环境变量设置
采样支持(评估时不重要)未提及

| 根节点支持 | ⛔ | 未提及 |


在上述两个表格对比中,Scrapling Fetch MCP 服务器以其清晰且实用的受保护网页抓取工具脱颖而出,但缺乏标准化提示词、资源声明和进阶安全/环境变量文档。基于其功能与文档完整度,我们对该 MCP 的整体评分为 6/10


MCP 评分

是否有 LICENSE✅ (Apache-2.0)
有至少一个工具
Fork 数量5
Star 数量31

常见问题

Scrapling Fetch MCP 服务器的功能是什么?

它使 AI 代理和聊天机器人能够从带有机器人保护的网站访问并提取文本或 HTML 内容,使自动化工具能够获取原本无法访问的文档或参考资料。

Scrapling Fetch MCP 提供了哪些工具?

有两大主要工具:s-fetch-page(抓取完整网页,支持分页以处理大型文档)和 s-fetch-pattern(根据用户提供的正则表达式提取匹配内容,并可配置上下文)。

典型的使用场景有哪些?

使用场景包括访问受保护的文档、通过正则表达式提取特定信息、摘要网页内容、IDE 上下文辅助和对大型文档的增量检索。

如何在 FlowHunt 中配置 Scrapling Fetch MCP?

将 MCP 组件添加到流程中,打开配置面板,并在系统 MCP 配置中以 JSON 格式输入您的服务器信息。请确保使用正确的服务器名称和 URL。

是否需要 API 密钥或其他安全步骤?

当前文档未说明 Scrapling Fetch MCP 需要 API 密钥或环境变量配置。

Scrapling Fetch MCP 使用什么许可证?

它以 Apache-2.0 许可证开源发布,适合个人和商业项目集成。

在 FlowHunt 上试用 Scrapling Fetch MCP 服务器

集成 Scrapling Fetch MCP 服务器,为您的 AI 工作流赋能,访问受保护网站内容并提升网页自动化能力。

了解更多

Fetch MCP 服务器
Fetch MCP 服务器

Fetch MCP 服务器

FlowHunt 的 Fetch MCP 服务器让 AI 代理能够以多种格式(包括 HTML、JSON、纯文本和 Markdown)检索并转换实时网页内容——助力动态工作流、数据提取和实时内容集成。...

2 分钟阅读
AI MCP Servers +4
Firecrawl MCP 服务器
Firecrawl MCP 服务器

Firecrawl MCP 服务器

Firecrawl MCP 服务器为 FlowHunt 和 AI 助手注入先进的网页抓取、深度研究和内容发现能力。无缝集成让你能在开发环境中实时提取数据并自动化研究流程。...

2 分钟阅读
AI Web Scraping +4
ScrAPI MCP 服务器
ScrAPI MCP 服务器

ScrAPI MCP 服务器

ScrAPI MCP 服务器让 AI 助手能够提取实时网页内容——即使是有验证码、防机器人或地理围栏保护的网站也不例外。它作为 ScrAPI 服务的桥梁,实现 HTML 或 Markdown 的自动抓取,用于实时数据丰富、研究自动化等多种场景。...

2 分钟阅读
MCP Server Web Scraping +6