Automação de IA

Servidor Puppeteer Vision MCP

Web Scraping AI Automation Markdown

Entre em contato conosco para hospedar seu servidor MCP no FlowHunt

O FlowHunt fornece uma camada de segurança adicional entre seus sistemas internos e ferramentas de IA, dando-lhe controle granular sobre quais ferramentas são acessíveis a partir de seus servidores MCP. Os servidores MCP hospedados em nossa infraestrutura podem ser perfeitamente integrados com o chatbot do FlowHunt, bem como com plataformas de IA populares como ChatGPT, Claude e vários editores de IA.

O que faz o servidor “Puppeteer Vision” MCP?

O Servidor Puppeteer Vision MCP permite que assistentes de IA raspem e convertam páginas da web para o formato Markdown utilizando Puppeteer, Readability e Turndown. Ele oferece uma interação avançada alimentada por IA para lidar automaticamente com elementos da web como banners de cookies, CAPTCHAs, paywalls e mais, garantindo uma extração robusta de conteúdo mesmo em sites interativos ou protegidos. O servidor expõe essa capacidade via Model Context Protocol (MCP), facilitando a integração nos fluxos de desenvolvimento de IA. Isso permite que tarefas como raspagem automatizada da web, sumarização de conteúdo e ingestão de dados sejam realizadas de forma fluida por LLMs. O servidor é facilmente implantado via npx, requer configuração mínima e suporta comunicação via stdio e SSE para integração flexível.

Lista de Prompts

Nenhum modelo de prompt é mencionado no repositório ou na documentação.

Logo

Pronto para expandir seu negócio?

Comece seu teste gratuito hoje e veja resultados em dias.

Lista de Recursos

Nenhum recurso específico de MCP está listado ou descrito no repositório ou na documentação.

Lista de Ferramentas

  • scrape-webpage: Raspa uma página da web em uma URL especificada, usando IA para interagir e contornar elementos interativos (como banners de cookies ou CAPTCHAs), extrai o conteúdo principal usando Readability e converte o resultado para Markdown. Os parâmetros incluem:
    • url (string, obrigatório): A página web a ser raspada.
    • autoInteract (booleano, opcional, padrão: true): Se deve lidar automaticamente com elementos interativos.
    • maxInteractionAttempts (número, opcional, padrão: 3): Máximo de tentativas de interação da IA.
    • waitForNetworkIdle (booleano, opcional, padrão: true): Aguarda a rede ficar ociosa antes da raspagem.

Casos de Uso deste Servidor MCP

  • Raspagem Automática da Web para Ingestão de Conhecimento
    Desenvolvedores podem extrair Markdown legível e bem formatado de páginas web arbitrárias, facilitando a ingestão de conteúdo atualizado em fluxos de IA, bancos de dados ou bases de conhecimento.
  • Contornando Barreiras Interativas
    A interação alimentada por IA pode contornar automaticamente CAPTCHAs, banners de cookies e outros obstáculos interativos, permitindo extração de conteúdo fluida de sites que normalmente bloqueiam automação.
  • Sumarização e Análise de Conteúdo
    O Markdown extraído pode ser enviado para LLMs para sumarização, análise de sentimento ou classificação, otimizando pesquisas e processamento de dados.
  • Automação de Navegador em Tempo Real
    Desenvolvedores podem executar a ferramenta em modo visível (não headless) para depuração, demonstrações ou quando a confirmação visual da atividade do navegador é necessária.
  • Integração em Pipelines de Orquestração de LLMs
    Como servidor MCP, pode ser usado como componente em orquestradores como Windsurf, Claude, Cursor e Cline, ampliando as habilidades dos agentes de IA para interagir com a web ao vivo.

Como configurar

Windsurf

  1. Pré-requisitos: Instale Node.js e npm.

  2. Configuração de Ambiente: Crie um arquivo .env ou exporte as variáveis de ambiente necessárias, incluindo OPENAI_API_KEY.

  3. Editar Configuração: Localize o arquivo de configuração do Windsurf.

  4. Adicionar Puppeteer Vision MCP: Insira o seguinte trecho JSON:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Salvar/Reiniciar: Salve o arquivo e reinicie o Windsurf.

  6. Verificar: Confira os logs ou a interface para confirmar que o servidor MCP está em execução.

Protegendo chaves de API:
Armazene segredos em variáveis de ambiente (ex.: .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Pré-requisitos: Certifique-se de que Node.js e npm estão instalados.

  2. Configurar Ambiente: Prepare o .env ou exporte OPENAI_API_KEY e outras variáveis.

  3. Editar Configuração: Abra a configuração MCP do Claude.

  4. Adicionar o Servidor MCP:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Reiniciar Claude: Aplique as alterações e reinicie a plataforma.

  6. Verificar: Confirme a inicialização com sucesso.

Cursor

  1. Pré-requisitos: Instale Node.js e npm.

  2. Ambiente: Configure o .env com a chave de API da OpenAI.

  3. Editar Config do Cursor: Adicione o servidor MCP conforme abaixo:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Salvar & Reiniciar: Salve as alterações e reinicie o Cursor.

  5. Verificar Logs: Certifique-se de que o servidor está rodando.

Cline

  1. Pré-requisitos: Instale Node.js e npm.

  2. Ambiente: Defina ou exporte OPENAI_API_KEY.

  3. Configuração: Adicione à configuração MCP do Cline:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Reinicie o Cline: Aplique e reinicie.

  5. Confirmar: Valide que o servidor está acessível.

Nota: Proteja as chaves de API via variáveis de ambiente e nunca codifique segredos diretamente em arquivos de configuração.

Como usar este MCP em fluxos

Usando MCP no FlowHunt

Para integrar servidores MCP em seu fluxo do FlowHunt, comece adicionando o componente MCP ao seu fluxo e conectando-o ao seu agente de IA:

Fluxo MCP no FlowHunt

Clique no componente MCP para abrir o painel de configuração. Na seção de configuração MCP do sistema, insira os detalhes do seu servidor MCP usando este formato JSON:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Uma vez configurado, o agente de IA poderá usar este MCP como uma ferramenta com acesso a todas as suas funções e capacidades. Lembre-se de trocar “puppeteer-vision” pelo nome real do seu servidor MCP e substituir a URL pela URL do seu próprio servidor MCP.


Visão Geral

SeçãoDisponibilidadeDetalhes/Notas
Visão GeralDisponível no README.
Lista de PromptsNenhum modelo de prompt encontrado.
Lista de RecursosNenhum recurso MCP explícito descrito.
Lista de FerramentasFerramenta scrape-webpage, detalhada no README.
Proteção de Chaves de APIInstruções para .env e variáveis de ambiente fornecidas.
Suporte a Sampling (menos importante na avaliação)Nenhuma menção a suporte a sampling.

| Suporte a Roots | ⛔ | Nenhuma menção a Roots. |


Com base no exposto, o Servidor Puppeteer Vision MCP oferece uma ferramenta de raspagem de web robusta e focada, com documentação forte e orientações de segurança, mas carece de múltiplas ferramentas, modelos de prompt, recursos e recursos MCP avançados como roots ou sampling. Seu design de ferramenta única e propósito único lhe confere alta confiabilidade para seu caso de uso, mas limita sua extensibilidade.

Nossa opinião

Pontuação MCP: 5/10
Este servidor MCP é bem documentado, útil para seu propósito específico e fácil de configurar, mas a ausência de modelos de prompt, recursos explícitos e funcionalidades MCP avançadas (roots, sampling) limita sua versatilidade e integração no ecossistema.

Pontuação MCP

Possui LICENSE
Possui ao menos uma ferramenta
Número de Forks5
Número de Stars12

Perguntas frequentes

Comece com o Puppeteer Vision MCP

Potencialize seus fluxos de trabalho de IA com raspagem de web avançada e extração de conteúdo. Configure o Servidor Puppeteer Vision MCP em minutos e comece a ingerir a web ao vivo em seus pipelines de IA.

Saiba mais

Puppeteer Vision
Puppeteer Vision

Puppeteer Vision

Integre o FlowHunt com o servidor MCP Puppeteer Vision para automatizar raspagem de sites, lidar com cookies, CAPTCHAs, paywalls e converter páginas da web em m...

4 min de leitura
AI Web Scraping +4
mcp-rquest MCP Server
mcp-rquest MCP Server

mcp-rquest MCP Server

O servidor mcp-rquest MCP capacita assistentes de IA com capacidades avançadas de requisições HTTP semelhantes a navegadores, evasão robusta de anti-bot e conve...

5 min de leitura
MCP Server HTTP +5
mcp-vision MCP Server
mcp-vision MCP Server

mcp-vision MCP Server

O mcp-vision MCP Server conecta modelos de visão computacional do HuggingFace — como detecção de objetos zero-shot — ao FlowHunt e outras plataformas de IA, cap...

5 min de leitura
AI Computer Vision +5