Puppeteer Vision MCP 服务器

Web Scraping AI Automation Markdown

联系我们在FlowHunt托管您的MCP服务器

“Puppeteer Vision” MCP 服务器能做什么?

Puppeteer Vision MCP 服务器让 AI 助手能够利用 Puppeteer、Readability 和 Turndown 抓取网页并转换为 Markdown 格式。它提供先进的 AI 驱动交互,可自动处理如 Cookie 横幅、验证码(CAPTCHA)、付费墙等网页元素,确保即使在交互性或受保护网站上也能稳定提取内容。该服务器通过 Model Context Protocol (MCP) 提供服务,便于集成至 AI 开发工作流,实现自动化网页抓取、内容摘要、数据导入等任务。服务器可通过 npx 一键部署,配置简单,并支持 stdio 与 SSE 通信方式,集成灵活。

提示词模板列表

仓库或文档中未提及任何提示词模板。

FlowHunt 标志

准备好发展您的业务了吗?

今天开始免费试用,几天内即可看到结果。

资源列表

仓库或文档中未列出或描述具体 MCP 资源。

工具列表

  • scrape-webpage:抓取指定 URL 网页,AI 自动与交互元素(如 Cookie 横幅、验证码)交互并绕过,使用 Readability 提取主要内容,转换为 Markdown。参数包括:
    • url(字符串,必填):要抓取的网页地址。
    • autoInteract(布尔值,可选,默认 true):是否自动处理交互元素。
    • maxInteractionAttempts(数字,可选,默认 3):AI 交互最大尝试次数。
    • waitForNetworkIdle(布尔值,可选,默认 true):抓取前是否等待网络空闲。

典型应用场景

  • 知识导入的自动化网页抓取
    开发者可从任意网页提取格式良好的 Markdown,便于将最新内容导入 AI 工作流、数据库或知识库。
  • 绕过交互障碍
    AI 驱动交互可自动绕过验证码、Cookie 横幅等交互障碍,实现对本无法自动化抓取的网站的内容提取。
  • 内容摘要与分析
    提取的 Markdown 可输入 LLM 进行摘要、情感分析或分类,简化研究与数据处理流程。
  • 实时浏览器自动化
    开发者可在可见(非无头)模式下运行工具,用于调试、演示,或需要直观浏览器操作时。
  • 集成至 LLM 编排流水线
    作为 MCP 服务器,可作为 Windsurf、Claude、Cursor、Cline 等编排器的组件,扩展 AI 代理与实时互联网交互能力。

如何部署设置

Windsurf

  1. 前置条件: 安装 Node.js 与 npm。

  2. 环境配置: 创建 .env 文件或导出所需环境变量(如 OPENAI_API_KEY)。

  3. 编辑配置: 找到 Windsurf 的配置文件。

  4. 添加 Puppeteer Vision MCP: 插入如下 JSON 片段:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. 保存并重启: 保存文件并重启 Windsurf。

  6. 验证: 检查日志或界面确认 MCP 服务器已运行。

API 密钥安全:
将密钥存储于环境变量(如 .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. 前置条件: 确保已安装 Node.js 与 npm。

  2. 配置环境: 准备 .env 或导出 OPENAI_API_KEY 等变量。

  3. 编辑配置: 打开 Claude 的 MCP 配置文件。

  4. 添加 MCP 服务器:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. 重启 Claude: 应用更改并重启平台。

  6. 验证: 确认启动成功。

Cursor

  1. 前置条件: 安装 Node.js 与 npm。

  2. 环境配置: 用 OpenAI API 密钥设置 .env

  3. 编辑 Cursor 配置: 按如下方式添加 MCP 服务器:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. 保存并重启: 保存并重启 Cursor。

  5. 检查日志: 确认服务器已运行。

Cline

  1. 前置条件: 安装 Node.js 与 npm。

  2. 环境变量: 设置或导出 OPENAI_API_KEY

  3. 配置: 在 Cline MCP 配置中添加:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. 重启 Cline: 应用并重启。

  5. 确认: 验证服务器可访问。

注意: 请通过环境变量保护 API 密钥,切勿在配置文件中明文写入。

在流程中使用 MCP

在 FlowHunt 中集成 MCP

要将 MCP 服务器集成到 FlowHunt 工作流,首先添加 MCP 组件并与 AI 代理相连:

FlowHunt MCP flow

点击 MCP 组件打开配置面板,在系统 MCP 配置区域按照如下 JSON 格式填写你的 MCP 服务器信息:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI 代理即可作为工具调用该 MCP,并访问其全部功能与能力。请将 “puppeteer-vision” 替换为实际 MCP 服务器名称,并将 URL 替换为你自己的 MCP 服务器地址。


概览

部分可用性详情/备注
概览已在 README 提供。
提示词模板列表未发现模板。
资源列表未描述具体 MCP 资源。
工具列表scrape-webpage 工具,README 有详解。
API 密钥安全提供了 .env 与环境变量设置说明。
采样支持(评测时较次要)未提及采样支持。

| Roots 支持 | ⛔ | 未提及 Roots。 |


综上,Puppeteer Vision MCP 服务器是一款文档完善、聚焦且安全性强的网页抓取工具,但缺乏多工具、提示词模板、资源和像 roots、采样等 MCP 高级特性。一专多能的设计让它在主要应用场景下非常可靠,但扩展性有限。

我们的评价

MCP 评分:5/10
该 MCP 服务器文档详实、适用性强、易于搭建,但提示模板、资源和高级 MCP 特性(roots、采样)欠缺,限制了多样性和生态集成能力。

MCP 评分表

有 LICENSE
有至少一个工具
Fork 数量5
Star 数量12

常见问题

开始体验 Puppeteer Vision MCP

用先进的网页抓取与内容提取能力提升你的 AI 工作流。几分钟内搭建 Puppeteer Vision MCP 服务器,将实时网页数据导入 AI 流水线。