Servidor MCP RAG Web Browser

Potencia tus agentes de IA con búsqueda web en tiempo real, raspado y extracción de contenido usando el Servidor MCP RAG Web Browser. Integra datos web actualizados en flujos impulsados por LLM en FlowHunt de forma fluida.

Servidor MCP RAG Web Browser

¿Qué hace el Servidor MCP “RAG Web Browser”?

El Servidor MCP RAG Web Browser es una herramienta especializada diseñada para proporcionar a los asistentes de IA y a los grandes modelos de lenguaje (LLMs) la capacidad de interactuar con la web y extraer información actualizada de páginas web. Operando localmente, se conecta al RAG Web Browser Actor en modo Standby, facilitando la comunicación fluida entre los agentes de IA y el contenido web. Sus funciones principales incluyen realizar búsquedas web, raspar las N URLs principales de los resultados y devolver su contenido depurado en formato Markdown. Además, puede obtener el contenido de una sola URL y presentarlo en un formato markdown amigable. Esto permite a los LLMs acceder, resumir y utilizar datos web en vivo, mejorando sus capacidades para investigación, generación de contenido y automatización de flujos de trabajo.

Lista de Prompts

No se mencionan plantillas de prompt explícitas en el repositorio ni la documentación.

Lista de Recursos

No se definen recursos explícitos en la documentación disponible ni en los archivos del repositorio.

Lista de Herramientas

  • search:
    Consulta Google Search, raspa las N URLs principales de los resultados y devuelve su contenido depurado como Markdown.
    • Argumentos:
      • query (string, requerido): Término de búsqueda o URL
      • maxResults (number, opcional): Número máximo de resultados de búsqueda a raspar (por defecto: 1)
      • scrapingTool (string, opcional): Selecciona la herramienta de raspado (‘browser-playwright’ o ‘raw-http’; por defecto: ‘raw-http’)
      • outputFormats (array, opcional): Formatos de salida (’text’, ‘markdown’, ‘html’; por defecto: [‘markdown’])
      • requestTimeoutSecs (number, opcional): Tiempo máximo en segundos para la solicitud (por defecto: 40)

Casos de uso de este Servidor MCP

  • Búsqueda Web Automatizada
    Permite a los agentes de IA realizar búsquedas web en vivo y obtener información resumida de los principales resultados, útil para investigación y respuestas actualizadas.

  • Extracción de Contenido para Flujos RAG
    Integra flujos de trabajo de Generación Aumentada por Recuperación (RAG) para obtener y procesar contenido web como contexto confiable para respuestas de LLM.

  • Resumen de Páginas Web
    Obtiene y depura el contenido de URLs específicas, permitiendo a desarrolladores o LLMs ingerir y resumir información relevante rápidamente.

  • Recolección de Datos para Análisis de Mercado/Competencia
    Utiliza el servidor para raspar sitios de la competencia o noticias de mercado, proporcionando inteligencia en tiempo real para aplicaciones empresariales.

Cómo configurarlo

Windsurf

  1. Asegúrate de que Node.js y npm estén instalados.
  2. Localiza tu archivo de configuración de Windsurf.
  3. Agrega el Servidor MCP RAG Web Browser al objeto mcpServers:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. Guarda la configuración y reinicia Windsurf.
  5. Verifica que el servidor esté funcionando y accesible.

Protección de claves API (Ejemplo)

{
  "mcpServers": {
    "rag-web-browser": {
      "command": "npx",
      "args": ["@apify/mcp-server-rag-web-browser@latest"],
      "env": {
        "APIFY_TOKEN": "process.env.APIFY_TOKEN"
      },
      "inputs": {
        "apiKey": "${APIFY_TOKEN}"
      }
    }
  }
}

Claude

  1. Confirma la disponibilidad de Node.js y npm.
  2. Abre el archivo de configuración de Claude.
  3. Agrega el servidor MCP de la siguiente manera:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. Guarda y reinicia Claude.
  5. Comprueba la integración correcta.

Cursor

  1. Instala Node.js y npm si es necesario.
  2. Busca el archivo de configuración de Cursor.
  3. Inserta el Servidor MCP:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. Guarda la configuración y reinicia Cursor.
  5. Confirma que el servidor aparece en las herramientas MCP.

Cline

  1. Asegúrate de que Node.js y npm estén instalados.
  2. Edita la configuración de Cline.
  3. Agrega el siguiente JSON:
    {
      "mcpServers": {
        "rag-web-browser": {
          "command": "npx",
          "args": ["@apify/mcp-server-rag-web-browser@latest"]
        }
      }
    }
    
  4. Guarda y reinicia Cline.
  5. Valida la conexión al servidor MCP.

Nota: Protege tus claves API usando variables de entorno como se muestra en el ejemplo de Windsurf.

Cómo usar este MCP dentro de flujos

Uso de MCP en FlowHunt

Para integrar servidores MCP en tu flujo de trabajo de FlowHunt, comienza agregando el componente MCP a tu flujo y conectándolo a tu agente de IA:

Flujo MCP de FlowHunt

Haz clic en el componente MCP para abrir el panel de configuración. En la sección de configuración del sistema MCP, inserta los detalles de tu servidor MCP usando este formato JSON:

{
  "rag-web-browser": {
    "transport": "streamable_http",
    "url": "https://tunombremcpservidor.ejemplo/rutadelmcp/url"
  }
}

Una vez configurado, el agente de IA podrá usar este MCP como herramienta con acceso a todas sus funciones y capacidades. Recuerda cambiar “rag-web-browser” por el nombre real de tu servidor MCP y reemplazar la URL por la de tu propio servidor MCP.


Resumen

SecciónDisponibilidadDetalles/Notas
ResumenDetallado en README
Lista de PromptsNo se referencian plantillas de prompt
Lista de RecursosNo se definen recursos
Lista de HerramientasHerramienta search con opciones avanzadas
Protección de Claves APIEjemplo proporcionado en las instrucciones de configuración
Soporte de Sampling (menos importante en eval.)No mencionado

Según las tablas a continuación, el Servidor MCP RAG Web Browser está enfocado y altamente dirigido a tareas de interacción web, pero carece de primitivas MCP más amplias como prompts y recursos. Proporciona todo lo esencial para la configuración y operación segura, con una herramienta principal sólida y bien documentada. No se mencionan soporte para sampling ni roots.

Nuestra opinión

El servidor MCP es enfocado y funcional, ideal para escenarios que necesitan acceso a datos web dentro de flujos LLM. Es fácil de configurar, tiene una licencia clara y es moderadamente popular. La ausencia de plantillas de prompt y recursos explícitos limita su flexibilidad para casos más personalizados o complejos, pero para RAG y búsqueda web en vivo, destaca. Puntuación: 7/10

Puntuación MCP

Tiene LICENCIA✅ (Apache-2.0)
Tiene al menos una herramienta
Número de Forks19
Número de Stars147

Preguntas frecuentes

¿Qué hace el Servidor MCP RAG Web Browser?

Permite que los agentes de IA y LLMs realicen búsquedas web en vivo, raspado de contenido de los resultados de búsqueda y obtención de datos depurados de páginas web en formato Markdown, habilitando casos de uso como investigación, resumen y flujos de generación aumentada por recuperación (RAG).

¿Qué herramientas proporciona este servidor MCP?

Ofrece una herramienta 'search' que consulta Google Search, raspa las N URLs principales de los resultados y retorna su contenido en formato Markdown, con opciones de formato de salida y método de raspado.

¿Cómo configuro el Servidor MCP RAG Web Browser?

Agrega el servidor a tu configuración MCP usando el JSON proporcionado, asegúrate de tener Node.js y npm instalados, y protege tus claves API con variables de entorno. Reinicia tu cliente tras la configuración.

¿Cuáles son los casos de uso típicos de este servidor MCP?

Búsqueda web automatizada, extracción de contenido para flujos RAG, resumen de páginas web y recolección de datos en tiempo real para análisis de mercado o competencia.

¿Este servidor MCP es de código abierto?

Sí, tiene licencia Apache-2.0 y está disponible públicamente. Actualmente cuenta con 19 forks y 147 estrellas en GitHub.

Integra el Servidor MCP RAG Web Browser

Impulsa a tus agentes FlowHunt con búsqueda web en vivo y extracción automática de contenido. Prueba el Servidor MCP RAG Web Browser para investigación en tiempo real y flujos de trabajo RAG.

Saber más