Puppeteer Vision MCP Server

Web Scraping AI Automation Markdown

Kontakta oss för att vara värd för din MCP-server i FlowHunt

Vad gör “Puppeteer Vision” MCP Server?

Puppeteer Vision MCP Server gör det möjligt för AI-assistenter att skrapa och konvertera webbsidor till Markdown-format med hjälp av Puppeteer, Readability och Turndown. Den erbjuder avancerad AI-driven interaktion för att automatiskt hantera webelement som cookie-banners, CAPTCHAs, betalväggar med mera, vilket säkerställer robust innehållsextrahering även från interaktiva eller skyddade sidor. Servern exponerar denna funktionalitet via Model Context Protocol (MCP), vilket gör det enkelt att integrera i AI-utvecklingsflöden. Detta möjliggör uppgifter som automatiserad web scraping, innehållssummering och datainmatning som kan utföras sömlöst av LLM:er. Servern är enkel att distribuera via npx, kräver minimal konfiguration och stöder både stdio och SSE-kommunikation för flexibel integration.

Lista över promptar

Inga promptmallar nämns i förvaret eller dokumentationen.

FlowHunt Logotyp

Redo att växa ditt företag?

Starta din kostnadsfria provperiod idag och se resultat inom några dagar.

Lista över resurser

Inga specifika MCP-resurser listas eller beskrivs i förvaret eller dokumentationen.

Lista över verktyg

  • scrape-webpage: Skrapar en webbsida på angiven URL, använder AI för att interagera med och kringgå interaktiva element (som cookie-banners eller CAPTCHAs), extraherar huvudinnehållet med Readability och konverterar resultatet till Markdown. Parametrar inkluderar:
    • url (sträng, obligatorisk): Webbsidan som ska skrapas.
    • autoInteract (boolean, valfri, standard: true): Om interaktiva element ska hanteras automatiskt.
    • maxInteractionAttempts (nummer, valfri, standard: 3): Maximalt antal AI-interaktionsförsök.
    • waitForNetworkIdle (boolean, valfri, standard: true): Vänta tills nätverket är inaktivt innan skrapning.

Användningsområden för denna MCP-server

  • Automatiserad web scraping för kunskapsinhämtning
    Utvecklare kan extrahera läsbara, välformaterade Markdown från godtyckliga webbsidor, vilket gör det enkelt att mata in uppdaterat innehåll i AI-arbetsflöden, databaser eller kunskapsbaser.
  • Kringgående av interaktiva hinder
    Den AI-drivna interaktionen kan automatiskt kringgå CAPTCHAs, cookie-banners och andra interaktiva hinder, vilket möjliggör sömlös innehållsextrahering från sidor som annars hade blockerat automatisering.
  • Summering och innehållsanalys
    Extraherad Markdown kan matas in i LLM:er för summering, sentimentanalys eller klassificering, vilket effektiviserar forskning och databehandling.
  • Realtidsautomatisering av webbläsare
    Utvecklare kan köra verktyget i synligt (icke-headless) läge för felsökning, demonstrationer eller när visuell bekräftelse av webbläsaraktivitet behövs.
  • Integration i LLM-orkestreringspipelines
    Som MCP-server kan den användas som en komponent i orkestratorer som Windsurf, Claude, Cursor och Cline, och utöka AI-agenters förmåga att interagera med det levande webben.

Hur man sätter upp det

Windsurf

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljöinställning: Skapa en .env-fil eller exportera nödvändiga miljövariabler, inklusive OPENAI_API_KEY.

  3. Redigera konfiguration: Lokalisera Windsurfs konfigurationsfil.

  4. Lägg till Puppeteer Vision MCP: Infoga följande JSON-snutt:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Spara/Starta om: Spara filen och starta om Windsurf.

  6. Verifiera: Kontrollera loggar eller UI för att bekräfta att MCP-servern körs.

Säker hantering av API-nycklar:
Lagra hemligheter i miljövariabler (t.ex. .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Förutsättningar: Kontrollera att Node.js och npm är installerade.

  2. Miljöinställning: Förbered .env eller exportera OPENAI_API_KEY och andra variabler.

  3. Redigera konfiguration: Öppna Claudes MCP-konfiguration.

  4. Lägg till MCP-servern:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Starta om Claude: Verkställ ändringar och starta om plattformen.

  6. Verifiera: Bekräfta lyckad uppstart.

Cursor

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljö: Ställ in .env med OpenAI API-nyckeln.

  3. Redigera Cursor-konfigurationen: Lägg till MCP-servern enligt nedan:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Spara & Starta om: Spara ändringar och starta om Cursor.

  5. Kontrollera loggar: Säkerställ att servern körs.

Cline

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljö: Ställ in eller exportera OPENAI_API_KEY.

  3. Konfiguration: Lägg till i Clines MCP-konfiguration:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Starta om Cline: Verkställ och starta om.

  5. Bekräfta: Validera att servern är tillgänglig.

Obs: Skydda API-nycklar via miljövariabler och hårdkoda aldrig hemligheter i konfigurationsfiler.

Hur man använder denna MCP i flöden

Använda MCP i FlowHunt

För att integrera MCP-servrar i ditt FlowHunt-arbetsflöde, börja med att lägga till MCP-komponenten i ditt flöde och koppla den till din AI-agent:

FlowHunt MCP flow

Klicka på MCP-komponenten för att öppna konfigurationspanelen. I systemets MCP-konfigurationssektion, infoga detaljer för din MCP-server enligt detta JSON-format:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

När det är konfigurerat kan AI-agenten nu använda denna MCP som ett verktyg med tillgång till alla dess funktioner och kapabiliteter. Kom ihåg att ändra “puppeteer-vision” till det faktiska namnet på din MCP-server och ersätt URL:en med din egen MCP-server-URL.


Översikt

SektionTillgänglighetDetaljer/Noteringar
ÖversiktAnges i README.
Lista över promptarInga promptmallar funna.
Lista över resurserInga explicita MCP-resurser beskrivna.
Lista över verktygscrape-webpage-verktyget, detaljerat i README.
Säker hantering av API-nycklarInstruktioner för .env och miljövariabler ges.
Sampling-stöd (mindre viktigt vid utvärdering)Ingen nämnd sampling-stöd.

| Stöd för Roots | ⛔ | Ingen nämnd Roots. |


Baserat på ovanstående erbjuder Puppeteer Vision MCP Server ett robust och fokuserat web scraping-verktyg med stark dokumentation och säkerhetsrådgivning, men saknar flera verktyg, promptmallar, resurser och avancerade MCP-funktioner som roots eller sampling. Dess enkelverktygs- och enkeländamålsdesign ger hög tillförlitlighet för dess användningsområde, men begränsar utbyggbarheten.

Vår bedömning

MCP-betyg: 5/10
Denna MCP-server är väl dokumenterad, användbar för sitt specifika ändamål och lätt att sätta upp, men dess avsaknad av promptmallar, explicita resurser och avancerade MCP-funktioner (roots, sampling) begränsar dess mångsidighet och ekosystemintegration.

MCP Score

Har en LICENSE
Har minst ett verktyg
Antal Forks5
Antal Stars12

Vanliga frågor

Kom igång med Puppeteer Vision MCP

Ge dina AI-arbetsflöden en skjuts med avancerad web scraping och innehållsextrahering. Installera Puppeteer Vision MCP Server på några minuter och börja mata in det levande webben i dina AI-pipelines.

Lär dig mer

mcp-rquest MCP-server
mcp-rquest MCP-server

mcp-rquest MCP-server

mcp-rquest MCP-server ger AI-assistenter avancerade, webbläsarliknande HTTP-förfrågningsmöjligheter, robust anti-bot-undvikande och konvertering av dokument til...

4 min läsning
MCP Server HTTP +5
Firecrawl MCP-server
Firecrawl MCP-server

Firecrawl MCP-server

Firecrawl MCP-server förstärker FlowHunt och AI-assistenter med avancerad web scraping, djupgående research och möjligheter till innehållsupptäckt. Sömlös integ...

4 min läsning
AI Web Scraping +4
ScrAPI MCP-server
ScrAPI MCP-server

ScrAPI MCP-server

ScrAPI MCP-server ger AI-assistenter möjlighet att extrahera live webbinnehåll – även från webbplatser skyddade av captchas, botdetektering eller geofencing. Ge...

4 min läsning
MCP Server Web Scraping +6