RAG网页浏览器MCP服务器

RAG网页浏览器MCP服务器

通过RAG网页浏览器MCP服务器,为您的AI智能体赋能,实现实时网页搜索、抓取和内容提取。将最新的网页数据无缝集成到FlowHunt上的LLM驱动流程中。

“RAG网页浏览器”MCP服务器的作用

RAG网页浏览器MCP服务器是一款专为AI助手和大型语言模型(LLM)设计的工具,使其能够与互联网交互并从网页中提取最新信息。该服务器本地运行,以待机模式连接到RAG网页浏览器Actor,实现AI智能体与网页内容的无缝通信。其主要功能包括执行网页搜索、抓取搜索结果中前N个URL,并将清洗后的内容以Markdown返回。此外,还可获取单个URL的内容并以友好的Markdown格式呈现。这使LLM能够访问、摘要及利用实时网页数据,提升其研究、内容生成与流程自动化能力。

提示词列表

在仓库或文档中未明确提及任何提示词模板。

资源列表

可用文档或仓库文件中未明确定义资源。

工具列表

  • search
    查询Google搜索,抓取结果中的前N个URL,并将其清洗后的内容以Markdown返回。
    • 参数说明:
      • query(字符串,必填):搜索词或URL
      • maxResults(数字,选填):抓取的最大搜索结果数(默认:1)
      • scrapingTool(字符串,选填):选择抓取工具(‘browser-playwright’或’raw-http’;默认:‘raw-http’)
      • outputFormats(数组,选填):输出格式(’text’, ‘markdown’, ‘html’;默认:[‘markdown’])
      • requestTimeoutSecs(数字,选填):请求的最大秒数(默认:40)

该MCP服务器的使用场景

  • 自动化网页搜索
    让AI智能体能够进行实时网页搜索,并从顶级结果中获取摘要信息,适用于研究和回答最新问题。

  • RAG流程内容提取
    集成到检索增强生成(RAG)工作流,提取并处理网页内容,为LLM回复提供可靠上下文。

  • 网页摘要
    获取并清洗指定URL的内容,使开发者或LLM能快速读取并摘要相关信息。

  • 市场/竞品分析数据收集
    用于抓取竞品网站或市场新闻,为企业应用提供实时情报。

如何设置

Windsurf

  1. 确保已安装Node.js和npm。
  2. 找到您的Windsurf配置文件。
  3. mcpServers对象中添加RAG网页浏览器MCP服务器:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. 保存配置并重启Windsurf。
  5. 验证服务器是否已运行且可访问。

API密钥安全示例

{
  "mcpServers": {
    "rag-web-browser": {
      "command": "npx",
      "args": ["@apify/mcp-server-rag-web-browser@latest"],
      "env": {
        "APIFY_TOKEN": "process.env.APIFY_TOKEN"
      },
      "inputs": {
        "apiKey": "${APIFY_TOKEN}"
      }
    }
  }
}

Claude

  1. 确认Node.js和npm可用。
  2. 打开Claude的配置文件。
  3. 按如下方式添加MCP服务器:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. 保存并重启Claude。
  5. 检查集成是否正确。

Cursor

  1. 如有需要,安装Node.js和npm。
  2. 找到Cursor的配置文件。
  3. 插入MCP服务器配置:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. 保存配置,重启Cursor。
  5. 确认服务器出现在MCP工具中。

Cline

  1. 确保已安装Node.js和npm。
  2. 编辑Cline的配置文件。
  3. 添加如下JSON内容:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. 保存并重启Cline。
  5. 验证MCP服务器连接。

注意: 请参考Windsurf示例,使用环境变量方式保护API密钥。

在流程中如何使用该MCP

在FlowHunt中使用MCP

要将MCP服务器集成到您的FlowHunt工作流中,首先在流程中添加MCP组件,并将其连接到您的AI智能体:

FlowHunt MCP flow

点击MCP组件打开配置面板。在系统MCP配置部分,使用如下JSON格式填入您的MCP服务器信息:

{
  "rag-web-browser": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI智能体即可将该MCP作为工具,使用其全部功能。请记得将"rag-web-browser"替换为您实际的MCP服务器名称,并将URL替换为您自己的MCP服务器地址。


概览

部分可用性详细/备注
概览在README中有详细说明
提示词列表未引用提示词模板
资源列表未定义资源
工具列表search工具,功能丰富
API密钥安全机制设置说明中有示例
采样支持(评测时可略)未提及

根据下表,RAG网页浏览器MCP服务器聚焦于网页交互任务,缺乏更广泛的MCP原语如提示词和资源,但为部署和安全运行提供了全部所需,并有文档详实的核心工具。采样与Roots支持未提及。

我们的看法

该MCP服务器专注且实用,非常适合LLM流程中需要网页数据访问的场景。其设置简易,许可清晰,受欢迎度中等。缺乏提示词模板和显式资源,限制了复杂或自定义场景的灵活性,但对于RAG和实时网页搜索非常出色。评分:7/10

MCP得分

拥有LICENSE✅ (Apache-2.0)
有至少一项工具
Fork数量19
Star数量147

常见问题

RAG网页浏览器MCP服务器的功能是什么?

它使AI智能体和LLM能够执行实时网页搜索,从搜索结果中抓取内容,并以Markdown格式获取清洗后的网页数据,助力研究、摘要和检索增强生成(RAG)等场景。

该MCP服务器提供哪些工具?

它提供一个'search'工具,可查询Google搜索,抓取前N条结果的URL,并将其内容以Markdown形式返回,支持输出格式和抓取方式选项。

如何设置RAG网页浏览器MCP服务器?

通过提供的JSON将服务器添加到您的MCP配置,确保已安装Node.js和npm,并使用环境变量保护API密钥。配置后重启客户端。

该MCP服务器的典型使用场景有哪些?

自动化网页搜索、为RAG工作流提取内容、网页摘要、以及市场或竞品分析的实时数据收集。

该MCP服务器是开源的吗?

是的,采用Apache-2.0许可证并已公开。目前在GitHub上有19个fork和147个star。

集成RAG网页浏览器MCP服务器

为您的FlowHunt智能体注入实时网页搜索和自动内容提取能力。试用RAG网页浏览器MCP服务器,实现实时研究与RAG工作流。

了解更多

Ragie MCP 服务器
Ragie MCP 服务器

Ragie MCP 服务器

Ragie MCP 服务器使 AI 助手能够对 Ragie 知识库进行语义搜索和检索相关信息,通过上下文知识集成增强开发流程。

2 分钟阅读
AI MCP Server +4
mcp-local-rag MCP 服务器
mcp-local-rag MCP 服务器

mcp-local-rag MCP 服务器

mcp-local-rag MCP 服务器实现了本地、保护隐私的检索增强生成(RAG)网页搜索,为大语言模型(LLM)提供数据检索能力。它允许 AI 助手在无需外部 API 的情况下访问、嵌入并提取网页中的最新信息,从而提升科研、内容创作和问答等工作流程。...

2 分钟阅读
MCP RAG +5
mcp-rquest MCP 服务器
mcp-rquest MCP 服务器

mcp-rquest MCP 服务器

mcp-rquest MCP 服务器为 AI 助手赋予先进的类浏览器 HTTP 请求能力、强大的反爬虫机制以及文档到 Markdown 的转换功能。基于 rquest 引擎驱动,实现安全、真实的网页交互和高效处理大型网页或文档响应。...

2 分钟阅读
MCP Server HTTP +5