Puppeteer Vision MCP 服务器

Puppeteer Vision MCP 服务器

通过 Puppeteer Vision MCP 服务器,实现强大、AI 加持的网页抓取和 Markdown 转换,即使在交互或受保护网站也能自动化操作。

“Puppeteer Vision” MCP 服务器能做什么?

Puppeteer Vision MCP 服务器让 AI 助手能够利用 Puppeteer、Readability 和 Turndown 抓取网页并转换为 Markdown 格式。它提供先进的 AI 驱动交互,可自动处理如 Cookie 横幅、验证码(CAPTCHA)、付费墙等网页元素,确保即使在交互性或受保护网站上也能稳定提取内容。该服务器通过 Model Context Protocol (MCP) 提供服务,便于集成至 AI 开发工作流,实现自动化网页抓取、内容摘要、数据导入等任务。服务器可通过 npx 一键部署,配置简单,并支持 stdio 与 SSE 通信方式,集成灵活。

提示词模板列表

仓库或文档中未提及任何提示词模板。

资源列表

仓库或文档中未列出或描述具体 MCP 资源。

工具列表

  • scrape-webpage:抓取指定 URL 网页,AI 自动与交互元素(如 Cookie 横幅、验证码)交互并绕过,使用 Readability 提取主要内容,转换为 Markdown。参数包括:
    • url(字符串,必填):要抓取的网页地址。
    • autoInteract(布尔值,可选,默认 true):是否自动处理交互元素。
    • maxInteractionAttempts(数字,可选,默认 3):AI 交互最大尝试次数。
    • waitForNetworkIdle(布尔值,可选,默认 true):抓取前是否等待网络空闲。

典型应用场景

  • 知识导入的自动化网页抓取
    开发者可从任意网页提取格式良好的 Markdown,便于将最新内容导入 AI 工作流、数据库或知识库。
  • 绕过交互障碍
    AI 驱动交互可自动绕过验证码、Cookie 横幅等交互障碍,实现对本无法自动化抓取的网站的内容提取。
  • 内容摘要与分析
    提取的 Markdown 可输入 LLM 进行摘要、情感分析或分类,简化研究与数据处理流程。
  • 实时浏览器自动化
    开发者可在可见(非无头)模式下运行工具,用于调试、演示,或需要直观浏览器操作时。
  • 集成至 LLM 编排流水线
    作为 MCP 服务器,可作为 Windsurf、Claude、Cursor、Cline 等编排器的组件,扩展 AI 代理与实时互联网交互能力。

如何部署设置

Windsurf

  1. 前置条件: 安装 Node.js 与 npm。

  2. 环境配置: 创建 .env 文件或导出所需环境变量(如 OPENAI_API_KEY)。

  3. 编辑配置: 找到 Windsurf 的配置文件。

  4. 添加 Puppeteer Vision MCP: 插入如下 JSON 片段:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. 保存并重启: 保存文件并重启 Windsurf。

  6. 验证: 检查日志或界面确认 MCP 服务器已运行。

API 密钥安全:
将密钥存储于环境变量(如 .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. 前置条件: 确保已安装 Node.js 与 npm。

  2. 配置环境: 准备 .env 或导出 OPENAI_API_KEY 等变量。

  3. 编辑配置: 打开 Claude 的 MCP 配置文件。

  4. 添加 MCP 服务器:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. 重启 Claude: 应用更改并重启平台。

  6. 验证: 确认启动成功。

Cursor

  1. 前置条件: 安装 Node.js 与 npm。

  2. 环境配置: 用 OpenAI API 密钥设置 .env

  3. 编辑 Cursor 配置: 按如下方式添加 MCP 服务器:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. 保存并重启: 保存并重启 Cursor。

  5. 检查日志: 确认服务器已运行。

Cline

  1. 前置条件: 安装 Node.js 与 npm。

  2. 环境变量: 设置或导出 OPENAI_API_KEY

  3. 配置: 在 Cline MCP 配置中添加:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. 重启 Cline: 应用并重启。

  5. 确认: 验证服务器可访问。

注意: 请通过环境变量保护 API 密钥,切勿在配置文件中明文写入。

在流程中使用 MCP

在 FlowHunt 中集成 MCP

要将 MCP 服务器集成到 FlowHunt 工作流,首先添加 MCP 组件并与 AI 代理相连:

FlowHunt MCP flow

点击 MCP 组件打开配置面板,在系统 MCP 配置区域按照如下 JSON 格式填写你的 MCP 服务器信息:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI 代理即可作为工具调用该 MCP,并访问其全部功能与能力。请将 “puppeteer-vision” 替换为实际 MCP 服务器名称,并将 URL 替换为你自己的 MCP 服务器地址。


概览

部分可用性详情/备注
概览已在 README 提供。
提示词模板列表未发现模板。
资源列表未描述具体 MCP 资源。
工具列表scrape-webpage 工具,README 有详解。
API 密钥安全提供了 .env 与环境变量设置说明。
采样支持(评测时较次要)未提及采样支持。

| Roots 支持 | ⛔ | 未提及 Roots。 |


综上,Puppeteer Vision MCP 服务器是一款文档完善、聚焦且安全性强的网页抓取工具,但缺乏多工具、提示词模板、资源和像 roots、采样等 MCP 高级特性。一专多能的设计让它在主要应用场景下非常可靠,但扩展性有限。

我们的评价

MCP 评分:5/10
该 MCP 服务器文档详实、适用性强、易于搭建,但提示模板、资源和高级 MCP 特性(roots、采样)欠缺,限制了多样性和生态集成能力。

MCP 评分表

有 LICENSE
有至少一个工具
Fork 数量5
Star 数量12

常见问题

什么是 Puppeteer Vision MCP 服务器?

它是一款 MCP 服务器,让 AI 代理可以利用 Puppeteer、Readability 和 Turndown 实现网页抓取与 Markdown 转换。它能自动交互并绕过常见网页障碍(如验证码和 Cookie 横幅),实现强大的内容提取,便于导入 AI 工作流。

主要应用场景有哪些?

自动化网页抓取用于知识导入、绕过交互障碍、摘要与内容分析、实时浏览器自动化,以及无缝集成至 LLM 协调流水线。

如何将 Puppeteer Vision MCP 集成到我的编排器?

在你的编排器 MCP 服务器配置中指定命令和环境变量(包括 OpenAI API 密钥)。具体操作详见上文 Windsurf、Claude、Cursor、Cline 的说明。

服务器如何处理 Cookie 横幅或付费墙等交互元素?

它通过 AI 自动化,能够与网页元素交互、关闭或绕过(如 Cookie 横幅、验证码、付费墙),确保即使在受保护或交互性强的网站也能提取内容。

我的 API 密钥安全吗?

安全。请始终将 API 密钥存储于环境变量或 `.env` 文件,切勿在配置文件中明文写入密钥。

该 MCP 服务器提供哪些工具?

主要工具为 `scrape-webpage`,它可抓取指定 URL 网页,按需与网页元素交互,并将主要内容输出为 Markdown。

开始体验 Puppeteer Vision MCP

用先进的网页抓取与内容提取能力提升你的 AI 工作流。几分钟内搭建 Puppeteer Vision MCP 服务器,将实时网页数据导入 AI 流水线。

了解更多

Playwright MCP 服务器
Playwright MCP 服务器

Playwright MCP 服务器

Playwright MCP 服务器为 AI 智能体与开发者带来先进的浏览器自动化与 API 交互能力,可在 Claude Desktop、Cline、Cursor IDE 等开发环境中无缝集成。...

2 分钟阅读
Automation AI Integration +5
browser-use MCP 服务器
browser-use MCP 服务器

browser-use MCP 服务器

browser-use MCP 服务器使 AI 代理能够通过 browser-use 库以编程方式控制网页浏览器。它支持自动化浏览、数据提取、表单提交,并为 FlowHunt 及其他开发环境的 AI 工作流提供实时网页上下文。...

2 分钟阅读
AI Automation +4
mcp-vision MCP 服务器
mcp-vision MCP 服务器

mcp-vision MCP 服务器

mcp-vision MCP 服务器将 HuggingFace 计算机视觉模型(如零样本目标检测)连接至 FlowHunt 和其他 AI 平台,为大语言模型和 AI 助手赋予高级视觉能力,如目标检测和图像分析。...

2 分钟阅读
AI Computer Vision +5