Servidor Puppeteer Vision MCP

Web Scraping AI Automation Markdown

Contáctanos para alojar tu servidor MCP en FlowHunt

FlowHunt proporciona una capa de seguridad adicional entre tus sistemas internos y las herramientas de IA, dándote control granular sobre qué herramientas son accesibles desde tus servidores MCP. Los servidores MCP alojados en nuestra infraestructura pueden integrarse perfectamente con el chatbot de FlowHunt, así como con plataformas de IA populares como ChatGPT, Claude y varios editores de IA.

¿Qué hace el Servidor “Puppeteer Vision” MCP?

El Servidor Puppeteer Vision MCP permite que asistentes de IA extraigan y conviertan páginas web a formato Markdown utilizando Puppeteer, Readability y Turndown. Ofrece interacción avanzada impulsada por IA para manejar automáticamente elementos web como banners de cookies, CAPTCHAs, muros de pago y más, garantizando una extracción robusta de contenido incluso en sitios interactivos o protegidos. El servidor expone esta capacidad vía el Model Context Protocol (MCP), facilitando su integración en flujos de desarrollo de IA. Esto permite realizar tareas como scraping web automatizado, resumen de contenido e ingestión de datos de forma fluida con LLMs. El servidor es fácilmente desplegable mediante npx, requiere una configuración mínima y soporta comunicación stdio y SSE para una integración flexible.

Lista de Prompts

No se mencionan plantillas de prompt en el repositorio o la documentación.

Logo

¿Listo para hacer crecer tu negocio?

Comienza tu prueba gratuita hoy y ve resultados en días.

Lista de Recursos

No se listan ni describen recursos MCP específicos en el repositorio o la documentación.

Lista de Herramientas

  • scrape-webpage: Extrae una página web en una URL especificada, usando IA para interactuar y superar elementos interactivos (como banners de cookies o CAPTCHAs), extrae el contenido principal usando Readability y convierte el resultado a Markdown. Los parámetros incluyen:
    • url (string, requerido): La página web a extraer.
    • autoInteract (boolean, opcional, por defecto: true): Si manejar automáticamente los elementos interactivos.
    • maxInteractionAttempts (number, opcional, por defecto: 3): Número máximo de intentos de interacción de IA.
    • waitForNetworkIdle (boolean, opcional, por defecto: true): Esperar a que la red esté inactiva antes de extraer.

Casos de Uso de este Servidor MCP

  • Scraping Web Automatizado para Ingestión de Conocimiento
    Los desarrolladores pueden extraer Markdown legible y bien formateado de cualquier página web, facilitando la ingestión de contenido actualizado en flujos de IA, bases de datos o bases de conocimiento.
  • Superación de Barreras Interactivas
    La interacción impulsada por IA puede superar automáticamente CAPTCHAs, banners de cookies y otros obstáculos interactivos, facilitando la extracción de contenido incluso de sitios que bloquearían la automatización.
  • Resumen y Análisis de Contenido
    El Markdown extraído puede ser procesado por LLMs para resumen, análisis de sentimiento o clasificación, agilizando la investigación y el procesamiento de datos.
  • Automatización de Navegador en Tiempo Real
    Los desarrolladores pueden ejecutar la herramienta en modo visible (no headless) para depuración, demostraciones o cuando se requiera confirmación visual de la actividad del navegador.
  • Integración en Pipelines de Orquestación de LLM
    Como servidor MCP, puede utilizarse como componente en orquestadores como Windsurf, Claude, Cursor y Cline, expandiendo la capacidad de los agentes de IA de interactuar con la web en vivo.

Cómo configurarlo

Windsurf

  1. Prerrequisitos: Instala Node.js y npm.

  2. Configuración de Entorno: Crea un archivo .env o exporta las variables de entorno requeridas, incluyendo OPENAI_API_KEY.

  3. Editar Configuración: Localiza el archivo de configuración de Windsurf.

  4. Añade Puppeteer Vision MCP: Inserta el siguiente fragmento JSON:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Guardar/Reiniciar: Guarda el archivo y reinicia Windsurf.

  6. Verificar: Revisa los logs o la interfaz para confirmar que el servidor MCP está en funcionamiento.

Protegiendo claves API:
Guarda los secretos en variables de entorno (por ejemplo, .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Prerrequisitos: Asegúrate de que Node.js y npm estén instalados.

  2. Establecer Entorno: Prepara .env o exporta OPENAI_API_KEY y otras variables.

  3. Editar Configuración: Abre la configuración MCP de Claude.

  4. Añade el Servidor MCP:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Reinicia Claude: Aplica los cambios y reinicia la plataforma.

  6. Verificar: Confirma el inicio exitoso.

Cursor

  1. Prerrequisitos: Instala Node.js y npm.

  2. Entorno: Configura .env con la clave API de OpenAI.

  3. Editar Configuración de Cursor: Añade el servidor MCP como se muestra abajo:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Guardar y Reiniciar: Guarda los cambios y reinicia Cursor.

  5. Revisar Logs: Asegúrate de que el servidor esté en funcionamiento.

Cline

  1. Prerrequisitos: Instala Node.js y npm.

  2. Entorno: Establece o exporta OPENAI_API_KEY.

  3. Configuración: Añade a la configuración MCP de Cline:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Reinicia Cline: Aplica y reinicia.

  5. Confirmar: Valida que el servidor esté accesible.

Nota: Protege las claves API mediante variables de entorno y nunca escribas secretos directamente en archivos de configuración.

Cómo usar este MCP dentro de flujos

Usando MCP en FlowHunt

Para integrar servidores MCP en tu flujo de trabajo FlowHunt, comienza añadiendo el componente MCP a tu flujo y conectándolo a tu agente de IA:

Flujo MCP de FlowHunt

Haz clic en el componente MCP para abrir el panel de configuración. En la sección de configuración MCP del sistema, inserta los detalles de tu servidor MCP usando este formato JSON:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Una vez configurado, el agente de IA podrá usar este MCP como herramienta con acceso a todas sus funciones y capacidades. Recuerda cambiar “puppeteer-vision” por el nombre real de tu servidor MCP y reemplazar la URL por la de tu propio servidor MCP.


Resumen

SecciónDisponibilidadDetalles/Notas
ResumenProporcionado en README.
Lista de PromptsNo se encontraron plantillas de prompt.
Lista de RecursosNo se describen recursos MCP explícitos.
Lista de HerramientasHerramienta scrape-webpage, detallada en README.
Protección de claves APIInstrucciones para .env y variables de entorno dadas.
Soporte de muestreo (menos importante)No se menciona soporte de muestreo.

| Soporte de Roots | ⛔ | No se menciona Roots. |


Con base en lo anterior, el Servidor Puppeteer Vision MCP ofrece una herramienta de scraping web robusta y enfocada, con buena documentación y orientación de seguridad, pero carece de múltiples herramientas, plantillas de prompts, recursos y funciones MCP avanzadas como roots o muestreo. Su diseño de una sola herramienta y un solo propósito le otorga gran fiabilidad para su caso de uso, pero limita su extensibilidad.

Nuestra opinión

Puntuación MCP: 5/10
Este servidor MCP está bien documentado, es útil para su propósito específico y fácil de configurar, pero su ausencia de plantillas de prompt, recursos explícitos y funciones MCP avanzadas (roots, muestreo) limita su versatilidad e integración en el ecosistema.

Puntuación MCP

Tiene LICENSE
Tiene al menos una herramienta
Número de Forks5
Número de Stars12

Preguntas frecuentes

Comienza con Puppeteer Vision MCP

Impulsa tus flujos de trabajo de IA con scraping web avanzado y extracción de contenido. Configura Puppeteer Vision MCP Server en minutos y comienza a ingresar la web en vivo a tus pipelines de IA.

Saber más

Servidor OpenCV MCP
Servidor OpenCV MCP

Servidor OpenCV MCP

El Servidor OpenCV MCP conecta las potentes herramientas de procesamiento de imagen y video de OpenCV con asistentes de IA y plataformas de desarrollo a través ...

5 min de lectura
OpenCV MCP Server +4
Servidor ScrAPI MCP
Servidor ScrAPI MCP

Servidor ScrAPI MCP

El Servidor ScrAPI MCP permite a los asistentes de IA extraer contenido web en vivo, incluso de sitios protegidos por captchas, detección de bots o geovallado. ...

4 min de lectura
MCP Server Web Scraping +6