Servidor Puppeteer Vision MCP
Automatize raspagem de web robusta, alimentada por IA, e conversão para Markdown — mesmo em sites interativos ou protegidos — usando o Servidor Puppeteer Vision MCP.

O que faz o servidor “Puppeteer Vision” MCP?
O Servidor Puppeteer Vision MCP permite que assistentes de IA raspem e convertam páginas da web para o formato Markdown utilizando Puppeteer, Readability e Turndown. Ele oferece uma interação avançada alimentada por IA para lidar automaticamente com elementos da web como banners de cookies, CAPTCHAs, paywalls e mais, garantindo uma extração robusta de conteúdo mesmo em sites interativos ou protegidos. O servidor expõe essa capacidade via Model Context Protocol (MCP), facilitando a integração nos fluxos de desenvolvimento de IA. Isso permite que tarefas como raspagem automatizada da web, sumarização de conteúdo e ingestão de dados sejam realizadas de forma fluida por LLMs. O servidor é facilmente implantado via npx
, requer configuração mínima e suporta comunicação via stdio e SSE para integração flexível.
Lista de Prompts
Nenhum modelo de prompt é mencionado no repositório ou na documentação.
Lista de Recursos
Nenhum recurso específico de MCP está listado ou descrito no repositório ou na documentação.
Lista de Ferramentas
- scrape-webpage: Raspa uma página da web em uma URL especificada, usando IA para interagir e contornar elementos interativos (como banners de cookies ou CAPTCHAs), extrai o conteúdo principal usando Readability e converte o resultado para Markdown. Os parâmetros incluem:
url
(string, obrigatório): A página web a ser raspada.autoInteract
(booleano, opcional, padrão: true): Se deve lidar automaticamente com elementos interativos.maxInteractionAttempts
(número, opcional, padrão: 3): Máximo de tentativas de interação da IA.waitForNetworkIdle
(booleano, opcional, padrão: true): Aguarda a rede ficar ociosa antes da raspagem.
Casos de Uso deste Servidor MCP
- Raspagem Automática da Web para Ingestão de Conhecimento
Desenvolvedores podem extrair Markdown legível e bem formatado de páginas web arbitrárias, facilitando a ingestão de conteúdo atualizado em fluxos de IA, bancos de dados ou bases de conhecimento. - Contornando Barreiras Interativas
A interação alimentada por IA pode contornar automaticamente CAPTCHAs, banners de cookies e outros obstáculos interativos, permitindo extração de conteúdo fluida de sites que normalmente bloqueiam automação. - Sumarização e Análise de Conteúdo
O Markdown extraído pode ser enviado para LLMs para sumarização, análise de sentimento ou classificação, otimizando pesquisas e processamento de dados. - Automação de Navegador em Tempo Real
Desenvolvedores podem executar a ferramenta em modo visível (não headless) para depuração, demonstrações ou quando a confirmação visual da atividade do navegador é necessária. - Integração em Pipelines de Orquestração de LLMs
Como servidor MCP, pode ser usado como componente em orquestradores como Windsurf, Claude, Cursor e Cline, ampliando as habilidades dos agentes de IA para interagir com a web ao vivo.
Como configurar
Windsurf
Pré-requisitos: Instale Node.js e npm.
Configuração de Ambiente: Crie um arquivo
.env
ou exporte as variáveis de ambiente necessárias, incluindoOPENAI_API_KEY
.Editar Configuração: Localize o arquivo de configuração do Windsurf.
Adicionar Puppeteer Vision MCP: Insira o seguinte trecho JSON:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Salvar/Reiniciar: Salve o arquivo e reinicie o Windsurf.
Verificar: Confira os logs ou a interface para confirmar que o servidor MCP está em execução.
Protegendo chaves de API:
Armazene segredos em variáveis de ambiente (ex.: .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Claude
Pré-requisitos: Certifique-se de que Node.js e npm estão instalados.
Configurar Ambiente: Prepare o
.env
ou exporteOPENAI_API_KEY
e outras variáveis.Editar Configuração: Abra a configuração MCP do Claude.
Adicionar o Servidor MCP:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Reiniciar Claude: Aplique as alterações e reinicie a plataforma.
Verificar: Confirme a inicialização com sucesso.
Cursor
Pré-requisitos: Instale Node.js e npm.
Ambiente: Configure o
.env
com a chave de API da OpenAI.Editar Config do Cursor: Adicione o servidor MCP conforme abaixo:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Salvar & Reiniciar: Salve as alterações e reinicie o Cursor.
Verificar Logs: Certifique-se de que o servidor está rodando.
Cline
Pré-requisitos: Instale Node.js e npm.
Ambiente: Defina ou exporte
OPENAI_API_KEY
.Configuração: Adicione à configuração MCP do Cline:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Reinicie o Cline: Aplique e reinicie.
Confirmar: Valide que o servidor está acessível.
Nota: Proteja as chaves de API via variáveis de ambiente e nunca codifique segredos diretamente em arquivos de configuração.
Como usar este MCP em fluxos
Usando MCP no FlowHunt
Para integrar servidores MCP em seu fluxo do FlowHunt, comece adicionando o componente MCP ao seu fluxo e conectando-o ao seu agente de IA:

Clique no componente MCP para abrir o painel de configuração. Na seção de configuração MCP do sistema, insira os detalhes do seu servidor MCP usando este formato JSON:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Uma vez configurado, o agente de IA poderá usar este MCP como uma ferramenta com acesso a todas as suas funções e capacidades. Lembre-se de trocar “puppeteer-vision” pelo nome real do seu servidor MCP e substituir a URL pela URL do seu próprio servidor MCP.
Visão Geral
Seção | Disponibilidade | Detalhes/Notas |
---|---|---|
Visão Geral | ✅ | Disponível no README. |
Lista de Prompts | ⛔ | Nenhum modelo de prompt encontrado. |
Lista de Recursos | ⛔ | Nenhum recurso MCP explícito descrito. |
Lista de Ferramentas | ✅ | Ferramenta scrape-webpage , detalhada no README. |
Proteção de Chaves de API | ✅ | Instruções para .env e variáveis de ambiente fornecidas. |
Suporte a Sampling (menos importante na avaliação) | ⛔ | Nenhuma menção a suporte a sampling. |
| Suporte a Roots | ⛔ | Nenhuma menção a Roots. |
Com base no exposto, o Servidor Puppeteer Vision MCP oferece uma ferramenta de raspagem de web robusta e focada, com documentação forte e orientações de segurança, mas carece de múltiplas ferramentas, modelos de prompt, recursos e recursos MCP avançados como roots ou sampling. Seu design de ferramenta única e propósito único lhe confere alta confiabilidade para seu caso de uso, mas limita sua extensibilidade.
Nossa opinião
Pontuação MCP: 5/10
Este servidor MCP é bem documentado, útil para seu propósito específico e fácil de configurar, mas a ausência de modelos de prompt, recursos explícitos e funcionalidades MCP avançadas (roots, sampling) limita sua versatilidade e integração no ecossistema.
Pontuação MCP
Possui LICENSE | ⛔ |
---|---|
Possui ao menos uma ferramenta | ✅ |
Número de Forks | 5 |
Número de Stars | 12 |
Perguntas frequentes
- O que é o Servidor Puppeteer Vision MCP?
É um servidor MCP que permite que agentes de IA extraíam e convertam páginas web para Markdown usando Puppeteer, Readability e Turndown. Ele pode interagir automaticamente e contornar barreiras comuns da web (como CAPTCHAs e banners de cookies), permitindo uma extração robusta de conteúdo para ingestão em fluxos de trabalho de IA.
- Quais são os principais casos de uso?
Raspagem de web automatizada para ingestão de conhecimento, contornando barreiras interativas, sumarização e análise de conteúdo, automação de navegador em tempo real e integração perfeita em pipelines de orquestração de LLMs.
- Como configuro o Puppeteer Vision MCP com meu orquestrador?
Configure-o na configuração do servidor MCP do seu orquestrador, especificando o comando e as variáveis de ambiente (incluindo sua chave de API da OpenAI). Instruções detalhadas são fornecidas para Windsurf, Claude, Cursor e Cline acima.
- Como o servidor lida com elementos interativos como banners de cookies ou paywalls?
Ele utiliza automação alimentada por IA para interagir, dispensar ou contornar elementos da web como banners de cookies, CAPTCHAs e paywalls, garantindo a extração de conteúdo mesmo de sites protegidos ou interativos.
- Minha chave de API está segura?
Sim. Sempre armazene as chaves de API em variáveis de ambiente ou arquivos `.env`. Nunca codifique segredos diretamente em arquivos de configuração.
- Quais ferramentas este servidor MCP fornece?
A principal ferramenta é `scrape-webpage`, que extrai uma URL fornecida, interage com elementos web conforme necessário e gera o conteúdo principal em Markdown.
Comece com o Puppeteer Vision MCP
Potencialize seus fluxos de trabalho de IA com raspagem de web avançada e extração de conteúdo. Configure o Servidor Puppeteer Vision MCP em minutos e comece a ingerir a web ao vivo em seus pipelines de IA.