Scrapling Fetch MCP 服务器的功能是什么？

它使 AI 代理和聊天机器人能够从带有机器人保护的网站访问并提取文本或 HTML 内容，使自动化工具能够获取原本无法访问的文档或参考资料。

Scrapling Fetch MCP 提供了哪些工具？

有两大主要工具：s-fetch-page（抓取完整网页，支持分页以处理大型文档）和 s-fetch-pattern（根据用户提供的正则表达式提取匹配内容，并可配置上下文）。

典型的使用场景有哪些？

使用场景包括访问受保护的文档、通过正则表达式提取特定信息、摘要网页内容、IDE 上下文辅助和对大型文档的增量检索。

如何在 FlowHunt 中配置 Scrapling Fetch MCP？

将 MCP 组件添加到流程中，打开配置面板，并在系统 MCP 配置中以 JSON 格式输入您的服务器信息。请确保使用正确的服务器名称和 URL。

是否需要 API 密钥或其他安全步骤？

当前文档未说明 Scrapling Fetch MCP 需要 API 密钥或环境变量配置。

Scrapling Fetch MCP 使用什么许可证？

它以 Apache-2.0 许可证开源发布，适合个人和商业项目集成。

Scrapling Fetch MCP 服务器

Scrapling Fetch MCP 服务器让您的 AI 代理抓取和提取受保护的网页内容，即使在有机器人保护的网站上，也能实现丰富上下文的辅助和自动化文档流程。

MCP Server Web Scraping AI Tools Protected Content

立即开始预约演示

联系我们在FlowHunt托管您的MCP服务器

FlowHunt在您的内部系统和AI工具之间提供额外的安全层，让您能够精细控制从MCP服务器可访问哪些工具。托管在我们基础设施中的MCP服务器可以与FlowHunt的聊天机器人以及ChatGPT、Claude和各种AI编辑器等热门AI平台无缝集成。

support@flowhunt.io

“Scrapling Fetch” MCP 服务器的作用是什么？

Scrapling Fetch MCP 服务器是专为帮助 AI 助手访问带有机器人保护和反自动化措施的网站文本内容而设计的 Model Context Protocol（MCP）服务器。通过底层的 Scrapling 工具，它弥合了用户在浏览器中可见内容与 AI 代理可获取内容之间的鸿沟，使其能够从原本会屏蔽自动抓取工具的网站抓取 HTML 或 markdown。Scrapling Fetch MCP 优化于低频次检索文档和参考资料，特别关注文本与 HTML，而非通用网页抓取。这使其成为开发工作流中访问受保护在线文档或丰富上下文的有价值资产，同时尊重网站边界与用途。

提示词列表

仓库中未记录明确的提示词模板。

资源列表

仓库中未记录明确的 MCP 资源。

工具列表

s-fetch-page：获取完整网页，支持分页，便于对大型文档进行增量抓取。
s-fetch-pattern：通过用户提供的正则表达式匹配网页内容，并可配置提取上下文。

本 MCP 服务器的使用场景

访问受保护的文档：开发者可以从原本会屏蔽自动化工具的网站检索文档或参考资料，使 AI 助手能够利用最新的受保护资源回答问题。
提取特定信息：利用正则表达式从大型文档页面中提取目标数据（如 API 密钥、配置片段或引用），降低噪声，聚焦相关上下文。
摘要网页内容：抓取整个网页并进行内容摘要，帮助用户高效消化大型或复杂文档。
IDE 上下文辅助：与开发环境集成，使 AI 工具能够利用受保护在线资源提供上下文相关辅助。
增量页面抓取：通过分页请求处理大型文档，确保即使超大参考资料也能被处理且资源消耗可控。

如何设置

Windsurf

仓库中未记录 Windsurf 的具体说明。

Claude

确保先决条件：已安装 Python 3.10+ 和 uv 包管理器。

安装依赖项：

uv tool install scrapling
scrapling install
uv tool install scrapling-fetch-mcp

找到您的 Claude 客户端配置文件。

添加 Scrapling Fetch MCP 服务器：

{
  "mcpServers": {
    "Cyber-Chitta": {
      "command": "uvx",
      "args": ["scrapling-fetch-mcp"]
    }
  }
}

保存并重启 Claude 客户端，以应用配置。

API 密钥安全

未提供关于 API 密钥使用或环境变量配置的明确信息。

Cursor

仓库中未记录 Cursor 的具体说明。

Cline

仓库中未记录 Cline 的具体说明。

如何在流程中使用此 MCP

在 FlowHunt 中使用 MCP

要在 FlowHunt 工作流中集成 MCP 服务器，首先将 MCP 组件添加至您的流程，并与 AI 代理连接：

点击 MCP 组件以打开配置面板。在系统 MCP 配置区域，按如下 JSON 格式输入您的 MCP 服务器信息：

{
  "scrapling-fetch": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后，AI 代理即可使用此 MCP 的所有功能。请注意，将 “scrapling-fetch” 替换为您实际的 MCP 服务器名称，并将 URL 替换为您自己的 MCP 服务器地址。

概览

部分	可用性	详情/备注
概览	✅	README 中有清晰简介
提示词列表	⛔	未记录提示词模板
资源列表	⛔	未记录 MCP 资源定义
工具列表	✅	s-fetch-page, s-fetch-pattern
API 密钥安全	⛔	未说明 API 密钥或环境变量设置
采样支持（评估时不重要）	⛔	未提及

| 根节点支持 | ⛔ | 未提及 |

在上述两个表格对比中，Scrapling Fetch MCP 服务器以其清晰且实用的受保护网页抓取工具脱颖而出，但缺乏标准化提示词、资源声明和进阶安全/环境变量文档。基于其功能与文档完整度，我们对该 MCP 的整体评分为 6/10。

MCP 评分

是否有 LICENSE	✅ (Apache-2.0)
有至少一个工具	✅
Fork 数量	5
Star 数量	31

常见问题

Scrapling Fetch MCP 服务器的功能是什么？: 它使 AI 代理和聊天机器人能够从带有机器人保护的网站访问并提取文本或 HTML 内容，使自动化工具能够获取原本无法访问的文档或参考资料。
Scrapling Fetch MCP 提供了哪些工具？: 有两大主要工具：s-fetch-page（抓取完整网页，支持分页以处理大型文档）和 s-fetch-pattern（根据用户提供的正则表达式提取匹配内容，并可配置上下文）。
典型的使用场景有哪些？: 使用场景包括访问受保护的文档、通过正则表达式提取特定信息、摘要网页内容、IDE 上下文辅助和对大型文档的增量检索。
如何在 FlowHunt 中配置 Scrapling Fetch MCP？: 将 MCP 组件添加到流程中，打开配置面板，并在系统 MCP 配置中以 JSON 格式输入您的服务器信息。请确保使用正确的服务器名称和 URL。
是否需要 API 密钥或其他安全步骤？: 当前文档未说明 Scrapling Fetch MCP 需要 API 密钥或环境变量配置。
Scrapling Fetch MCP 使用什么许可证？: 它以 Apache-2.0 许可证开源发布，适合个人和商业项目集成。