Puppeteer Vision MCP Server

Puppeteer Vision MCP Server

Automatisera robust, AI-driven web scraping och Markdown-konvertering – även på interaktiva eller skyddade sidor – med Puppeteer Vision MCP Server.

Vad gör “Puppeteer Vision” MCP Server?

Puppeteer Vision MCP Server gör det möjligt för AI-assistenter att skrapa och konvertera webbsidor till Markdown-format med hjälp av Puppeteer, Readability och Turndown. Den erbjuder avancerad AI-driven interaktion för att automatiskt hantera webelement som cookie-banners, CAPTCHAs, betalväggar med mera, vilket säkerställer robust innehållsextrahering även från interaktiva eller skyddade sidor. Servern exponerar denna funktionalitet via Model Context Protocol (MCP), vilket gör det enkelt att integrera i AI-utvecklingsflöden. Detta möjliggör uppgifter som automatiserad web scraping, innehållssummering och datainmatning som kan utföras sömlöst av LLM:er. Servern är enkel att distribuera via npx, kräver minimal konfiguration och stöder både stdio och SSE-kommunikation för flexibel integration.

Lista över promptar

Inga promptmallar nämns i förvaret eller dokumentationen.

Lista över resurser

Inga specifika MCP-resurser listas eller beskrivs i förvaret eller dokumentationen.

Lista över verktyg

  • scrape-webpage: Skrapar en webbsida på angiven URL, använder AI för att interagera med och kringgå interaktiva element (som cookie-banners eller CAPTCHAs), extraherar huvudinnehållet med Readability och konverterar resultatet till Markdown. Parametrar inkluderar:
    • url (sträng, obligatorisk): Webbsidan som ska skrapas.
    • autoInteract (boolean, valfri, standard: true): Om interaktiva element ska hanteras automatiskt.
    • maxInteractionAttempts (nummer, valfri, standard: 3): Maximalt antal AI-interaktionsförsök.
    • waitForNetworkIdle (boolean, valfri, standard: true): Vänta tills nätverket är inaktivt innan skrapning.

Användningsområden för denna MCP-server

  • Automatiserad web scraping för kunskapsinhämtning
    Utvecklare kan extrahera läsbara, välformaterade Markdown från godtyckliga webbsidor, vilket gör det enkelt att mata in uppdaterat innehåll i AI-arbetsflöden, databaser eller kunskapsbaser.
  • Kringgående av interaktiva hinder
    Den AI-drivna interaktionen kan automatiskt kringgå CAPTCHAs, cookie-banners och andra interaktiva hinder, vilket möjliggör sömlös innehållsextrahering från sidor som annars hade blockerat automatisering.
  • Summering och innehållsanalys
    Extraherad Markdown kan matas in i LLM:er för summering, sentimentanalys eller klassificering, vilket effektiviserar forskning och databehandling.
  • Realtidsautomatisering av webbläsare
    Utvecklare kan köra verktyget i synligt (icke-headless) läge för felsökning, demonstrationer eller när visuell bekräftelse av webbläsaraktivitet behövs.
  • Integration i LLM-orkestreringspipelines
    Som MCP-server kan den användas som en komponent i orkestratorer som Windsurf, Claude, Cursor och Cline, och utöka AI-agenters förmåga att interagera med det levande webben.

Hur man sätter upp det

Windsurf

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljöinställning: Skapa en .env-fil eller exportera nödvändiga miljövariabler, inklusive OPENAI_API_KEY.

  3. Redigera konfiguration: Lokalisera Windsurfs konfigurationsfil.

  4. Lägg till Puppeteer Vision MCP: Infoga följande JSON-snutt:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Spara/Starta om: Spara filen och starta om Windsurf.

  6. Verifiera: Kontrollera loggar eller UI för att bekräfta att MCP-servern körs.

Säker hantering av API-nycklar:
Lagra hemligheter i miljövariabler (t.ex. .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Förutsättningar: Kontrollera att Node.js och npm är installerade.

  2. Miljöinställning: Förbered .env eller exportera OPENAI_API_KEY och andra variabler.

  3. Redigera konfiguration: Öppna Claudes MCP-konfiguration.

  4. Lägg till MCP-servern:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Starta om Claude: Verkställ ändringar och starta om plattformen.

  6. Verifiera: Bekräfta lyckad uppstart.

Cursor

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljö: Ställ in .env med OpenAI API-nyckeln.

  3. Redigera Cursor-konfigurationen: Lägg till MCP-servern enligt nedan:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Spara & Starta om: Spara ändringar och starta om Cursor.

  5. Kontrollera loggar: Säkerställ att servern körs.

Cline

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljö: Ställ in eller exportera OPENAI_API_KEY.

  3. Konfiguration: Lägg till i Clines MCP-konfiguration:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Starta om Cline: Verkställ och starta om.

  5. Bekräfta: Validera att servern är tillgänglig.

Obs: Skydda API-nycklar via miljövariabler och hårdkoda aldrig hemligheter i konfigurationsfiler.

Hur man använder denna MCP i flöden

Använda MCP i FlowHunt

För att integrera MCP-servrar i ditt FlowHunt-arbetsflöde, börja med att lägga till MCP-komponenten i ditt flöde och koppla den till din AI-agent:

FlowHunt MCP flow

Klicka på MCP-komponenten för att öppna konfigurationspanelen. I systemets MCP-konfigurationssektion, infoga detaljer för din MCP-server enligt detta JSON-format:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

När det är konfigurerat kan AI-agenten nu använda denna MCP som ett verktyg med tillgång till alla dess funktioner och kapabiliteter. Kom ihåg att ändra “puppeteer-vision” till det faktiska namnet på din MCP-server och ersätt URL:en med din egen MCP-server-URL.


Översikt

SektionTillgänglighetDetaljer/Noteringar
ÖversiktAnges i README.
Lista över promptarInga promptmallar funna.
Lista över resurserInga explicita MCP-resurser beskrivna.
Lista över verktygscrape-webpage-verktyget, detaljerat i README.
Säker hantering av API-nycklarInstruktioner för .env och miljövariabler ges.
Sampling-stöd (mindre viktigt vid utvärdering)Ingen nämnd sampling-stöd.

| Stöd för Roots | ⛔ | Ingen nämnd Roots. |


Baserat på ovanstående erbjuder Puppeteer Vision MCP Server ett robust och fokuserat web scraping-verktyg med stark dokumentation och säkerhetsrådgivning, men saknar flera verktyg, promptmallar, resurser och avancerade MCP-funktioner som roots eller sampling. Dess enkelverktygs- och enkeländamålsdesign ger hög tillförlitlighet för dess användningsområde, men begränsar utbyggbarheten.

Vår bedömning

MCP-betyg: 5/10
Denna MCP-server är väl dokumenterad, användbar för sitt specifika ändamål och lätt att sätta upp, men dess avsaknad av promptmallar, explicita resurser och avancerade MCP-funktioner (roots, sampling) begränsar dess mångsidighet och ekosystemintegration.

MCP Score

Har en LICENSE
Har minst ett verktyg
Antal Forks5
Antal Stars12

Vanliga frågor

Vad är Puppeteer Vision MCP Server?

Det är en MCP-server som låter AI-agenter skrapa och konvertera webbsidor till Markdown med hjälp av Puppeteer, Readability och Turndown. Den kan automatiskt interagera med och kringgå vanliga webbhinder (som CAPTCHAs och cookie-banners), vilket möjliggör robust innehållsextrahering för inmatning i AI-arbetsflöden.

Vilka är de främsta användningsområdena?

Automatiserad web scraping för kunskapsinhämtning, kringgående av interaktiva hinder, summering och innehållsanalys, realtidsautomatisering av webbläsare samt sömlös integration i LLM-orkestreringspipelines.

Hur sätter jag upp Puppeteer Vision MCP med min orkestrator?

Konfigurera den i din orkestrators MCP-serverkonfiguration, specificera kommandot och miljövariablerna (inklusive din OpenAI API-nyckel). Detaljerade instruktioner finns ovan för Windsurf, Claude, Cursor och Cline.

Hur hanterar servern interaktiva element som cookie-banners eller betalväggar?

Den använder AI-driven automation för att interagera med, avfärda eller kringgå webbelement såsom cookie-banners, CAPTCHAs och betalväggar, och säkerställer innehållsextrahering även från skyddade eller interaktiva sidor.

Är min API-nyckel säker?

Ja. Lagra alltid API-nycklar i miljövariabler eller `.env`-filer. Hårdkoda aldrig hemligheter i konfigurationsfiler.

Vilka verktyg tillhandahåller denna MCP-server?

Huvudverktyget är `scrape-webpage`, som skrapar en angiven URL, interagerar med webelement vid behov och returnerar huvud­innehållet som Markdown.

Kom igång med Puppeteer Vision MCP

Ge dina AI-arbetsflöden en skjuts med avancerad web scraping och innehållsextrahering. Installera Puppeteer Vision MCP Server på några minuter och börja mata in det levande webben i dina AI-pipelines.

Lär dig mer

browser-use MCP-server
browser-use MCP-server

browser-use MCP-server

browser-use MCP-servern ger AI-agenter möjlighet att styra webbläsare programmatiskt med hjälp av browser-use-biblioteket. Den möjliggör automatiserad surfning,...

4 min läsning
AI Automation +4
ModelContextProtocol (MCP) Server-integration
ModelContextProtocol (MCP) Server-integration

ModelContextProtocol (MCP) Server-integration

ModelContextProtocol (MCP) Server fungerar som en brygga mellan AI-agenter och externa datakällor, API:er och tjänster, vilket gör det möjligt för FlowHunt-anvä...

3 min läsning
AI Integration +4
Dumpling AI MCP-server
Dumpling AI MCP-server

Dumpling AI MCP-server

Dumpling AI MCP-servern för FlowHunt möjliggör att AI-assistenter kan ansluta till en mängd olika externa datakällor, API:er och utvecklarverktyg. Den ger kraft...

4 min läsning
AI MCP Server +4