Puppeteer Vision MCP Server

Puppeteer Vision MCP Server

Automatiser robust, AI-drevet web scraping og Markdown-konvertering—even på interaktive eller beskyttede sider—ved hjælp af Puppeteer Vision MCP Server.

Hvad gør “Puppeteer Vision” MCP Server?

Puppeteer Vision MCP Server gør det muligt for AI-assistenter at scrape og konvertere websider til Markdown-format ved hjælp af Puppeteer, Readability og Turndown. Den tilbyder avanceret AI-drevet interaktion til automatisk at håndtere webelementer som cookiebannere, CAPTCHA’er, betalingsmure og mere, hvilket sikrer robust indholdsudtræk selv fra interaktive eller beskyttede sider. Serveren udstiller denne funktionalitet via Model Context Protocol (MCP), så den let kan integreres i AI-udviklingsarbejdsgange. Dette muliggør opgaver som automatiseret web scraping, indholdssummering og dataindtagelse, som sømløst kan udføres af LLM’er. Serveren kan let udrulles via npx, kræver minimal konfiguration og understøtter både stdio og SSE-kommunikation for fleksibel integration.

Liste over Prompts

Ingen prompt-skabeloner er nævnt i repository eller dokumentation.

Liste over Ressourcer

Ingen specifikke MCP-ressourcer er opført eller beskrevet i repository eller dokumentation.

Liste over Værktøjer

  • scrape-webpage: Scraper en webside på en angivet URL, bruger AI til at interagere med og omgå interaktive elementer (som cookiebannere eller CAPTCHA’er), udtrækker hovedindholdet via Readability og konverterer resultatet til Markdown. Parametre inkluderer:
    • url (string, påkrævet): Websiden, der skal scrapes.
    • autoInteract (boolean, valgfri, standard: true): Om interaktive elementer skal håndteres automatisk.
    • maxInteractionAttempts (number, valgfri, standard: 3): Maksimalt antal AI-interaktionsforsøg.
    • waitForNetworkIdle (boolean, valgfri, standard: true): Vent på at netværket er inaktivt før scraping.

Anvendelsesmuligheder for denne MCP Server

  • Automatiseret Web Scraping til Vidensindtagelse
    Udviklere kan udtrække læsevenlig, veldesignet Markdown fra vilkårlige websider, hvilket gør det let at indtage opdateret indhold i AI-arbejdsgange, databaser eller vidensbaser.
  • Omgåelse af Interaktive Barrierer
    Den AI-drevne interaktion kan automatisk omgå CAPTCHA’er, cookiebannere og andre interaktive forhindringer, hvilket muliggør problemfrit indholdsudtræk fra sider, der ellers ville blokere automatisering.
  • Opsummering og Indholdsanalyse
    Udtrukket Markdown kan gives til LLM’er til opsummering, sentimentanalyse eller klassificering og effektivisere research og databehandling.
  • Realtids-browserautomatisering
    Udviklere kan køre værktøjet i synlig (ikke-headless) tilstand til debugging, demonstrationer eller når visuel bekræftelse af browseraktivitet er nødvendig.
  • Integration i LLM-orkestreringspipelines
    Som MCP-server kan den bruges som komponent i orkestratorer som Windsurf, Claude, Cursor og Cline og udvide AI-agenters evner til at interagere med det levende web.

Sådan sætter du den op

Windsurf

  1. Forudsætninger: Installer Node.js og npm.

  2. Miljøopsætning: Opret en .env-fil eller eksportér de nødvendige miljøvariabler, inkl. OPENAI_API_KEY.

  3. Redigér konfiguration: Find Windsurfs konfigurationsfil.

  4. Tilføj Puppeteer Vision MCP: Indsæt følgende JSON-udsnit:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Gem/Genstart: Gem filen og genstart Windsurf.

  6. Verificér: Tjek logs eller UI for at bekræfte, at MCP-serveren kører.

Sikring af API-nøgler:
Opbevar hemmeligheder i miljøvariabler (f.eks. .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Forudsætninger: Sørg for, at Node.js og npm er installeret.

  2. Miljø: Forbered .env eller eksportér OPENAI_API_KEY og andre variabler.

  3. Redigér konfiguration: Åbn Claudes MCP-konfiguration.

  4. Tilføj MCP-serveren:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Genstart Claude: Anvend ændringer og genstart platformen.

  6. Verificér: Bekræft vellykket opstart.

Cursor

  1. Forudsætninger: Installer Node.js og npm.

  2. Miljø: Opsæt .env med OpenAI API-nøglen.

  3. Redigér Cursor-konfiguration: Tilføj MCP-serveren som nedenfor:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Gem & Genstart: Gem ændringer og genstart Cursor.

  5. Tjek logs: Sørg for, at serveren kører.

Cline

  1. Forudsætninger: Installer Node.js og npm.

  2. Miljø: Sæt eller eksportér OPENAI_API_KEY.

  3. Konfiguration: Tilføj til Clines MCP-konfiguration:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Genstart Cline: Anvend og genstart.

  5. Bekræft: Valider at serveren er tilgængelig.

Bemærk: Sikr API-nøgler via miljøvariabler og hårdkod aldrig hemmeligheder i konfigurationsfiler.

Sådan bruger du denne MCP i flows

Brug af MCP i FlowHunt

For at integrere MCP-servere i dit FlowHunt workflow skal du begynde med at tilføje MCP-komponenten til dit flow og forbinde den til din AI-agent:

FlowHunt MCP flow

Klik på MCP-komponenten for at åbne konfigurationspanelet. I systemets MCP-konfigurationssektion indsætter du dine MCP-serverdetaljer med dette JSON-format:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Når den er konfigureret, kan AI-agenten nu bruge denne MCP som et værktøj med adgang til alle dens funktioner og egenskaber. Husk at ændre “puppeteer-vision” til det faktiske navn på din MCP-server og udskift URL’en med din egen MCP-server-URL.


Oversigt

SektionTilgængelighedDetaljer/Noter
OversigtGivet i README.
Liste over PromptsIngen prompt-skabeloner fundet.
Liste over RessourcerIngen eksplicitte MCP-ressourcer beskrevet.
Liste over Værktøjerscrape-webpage-værktøj, detaljeret i README.
Sikring af API-nøglerInstruktioner for .env og miljøvariabler givet.
Sampling Support (mindre vigtigt i evaluering)Ingen omtale af sampling support.

| Roots Support | ⛔ | Ingen omtale af Roots. |


Baseret på ovenstående tilbyder Puppeteer Vision MCP Server et robust og fokuseret web scraping-værktøj med stærk dokumentation og sikkerhedsvejledning, men mangler flere værktøjer, prompt-skabeloner, ressourcer og avancerede MCP-funktioner som roots eller sampling. Dens one-tool, one-purpose-design giver høj pålidelighed til dens anvendelse, men begrænser udvidelsesmulighederne.

Vores vurdering

MCP-score: 5/10
Denne MCP-server er veldokumenteret, nyttig til sit specifikke formål og nem at sætte op, men manglen på prompt-skabeloner, eksplicitte ressourcer og avancerede MCP-funktioner (roots, sampling) begrænser dens alsidighed og økosystem-integration.

MCP-score

Har LICENS
Har mindst ét værktøj
Antal forks5
Antal stjerner12

Ofte stillede spørgsmål

Hvad er Puppeteer Vision MCP Server?

Det er en MCP-server, der gør det muligt for AI-agenter at scrape og konvertere websider til Markdown ved hjælp af Puppeteer, Readability og Turndown. Den kan automatisk interagere med og omgå almindelige webbarrierer (som CAPTCHA'er og cookiebannere), hvilket muliggør robust indholdsudtræk til indtagelse i AI-arbejdsgange.

Hvad er de vigtigste anvendelsesområder?

Automatiseret web scraping til vidensindtagelse, omgåelse af interaktive barrierer, opsummering og indholdsanalyse, realtids-browserautomatisering og problemfri integration i LLM-orkestreringspipelines.

Hvordan sætter jeg Puppeteer Vision MCP op med min orkestrator?

Konfigurer den i din orkestrators MCP-serverkonfiguration ved at angive kommandoen og miljøvariablerne (inklusive din OpenAI API-nøgle). Der gives detaljerede instruktioner for Windsurf, Claude, Cursor og Cline ovenfor.

Hvordan håndterer serveren interaktive elementer som cookiebannere eller betalingsmure?

Den bruger AI-drevet automatisering til at interagere med, afvise eller omgå webelementer som cookiebannere, CAPTCHA'er og betalingsmure og sikrer indholdsudtræk selv fra beskyttede eller interaktive sider.

Er min API-nøgle sikker?

Ja. Opbevar altid API-nøgler i miljøvariabler eller `.env`-filer. Hårdkod aldrig hemmeligheder i konfigurationsfiler.

Hvilke værktøjer tilbyder denne MCP-server?

Hovedværktøjet er `scrape-webpage`, som scrapper en given URL, interagerer med webelementer efter behov og udskriver hovedindholdet som Markdown.

Kom i gang med Puppeteer Vision MCP

Supercharge dine AI-arbejdsgange med avanceret web scraping og indholdsudtræk. Opsæt Puppeteer Vision MCP Server på få minutter og begynd at indtage det levende web i dine AI-pipelines.

Lær mere

ScrAPI MCP Server
ScrAPI MCP Server

ScrAPI MCP Server

ScrAPI MCP Server gør det muligt for AI-assistenter at udtrække live webindhold – selv fra sider beskyttet af captchas, bot-detektion eller geofencing. Ved at f...

4 min læsning
MCP Server Web Scraping +6
Oxylabs MCP Server
Oxylabs MCP Server

Oxylabs MCP Server

Oxylabs MCP (Model Context Protocol) Server er en bro mellem AI-assistenter og det virkelige web, og tilbyder et samlet API til at udtrække, strukturere og leve...

4 min læsning
MCP Web Scraping +3
Dumpling AI MCP Server
Dumpling AI MCP Server

Dumpling AI MCP Server

Dumpling AI MCP Server til FlowHunt gør det muligt for AI-assistenter at forbinde sig til en bred vifte af eksterne datakilder, API'er og udviklerværktøjer. Det...

4 min læsning
AI MCP Server +4