Puppeteer Vision MCP Server

Web Scraping AI Automation Markdown

Kontakta oss för att vara värd för din MCP-server i FlowHunt

FlowHunt erbjuder ett extra säkerhetslager mellan dina interna system och AI-verktyg, vilket ger dig granulär kontroll över vilka verktyg som är tillgängliga från dina MCP-servrar. MCP-servrar som hostas i vår infrastruktur kan sömlöst integreras med FlowHunts chatbot samt populära AI-plattformar som ChatGPT, Claude och olika AI-redigerare.

Vad gör “Puppeteer Vision” MCP Server?

Puppeteer Vision MCP Server gör det möjligt för AI-assistenter att skrapa och konvertera webbsidor till Markdown-format med hjälp av Puppeteer, Readability och Turndown. Den erbjuder avancerad AI-driven interaktion för att automatiskt hantera webelement som cookie-banners, CAPTCHAs, betalväggar med mera, vilket säkerställer robust innehållsextrahering även från interaktiva eller skyddade sidor. Servern exponerar denna funktionalitet via Model Context Protocol (MCP), vilket gör det enkelt att integrera i AI-utvecklingsflöden. Detta möjliggör uppgifter som automatiserad web scraping, innehållssummering och datainmatning som kan utföras sömlöst av LLM:er. Servern är enkel att distribuera via npx, kräver minimal konfiguration och stöder både stdio och SSE-kommunikation för flexibel integration.

Lista över promptar

Inga promptmallar nämns i förvaret eller dokumentationen.

Logo

Redo att växa ditt företag?

Starta din kostnadsfria provperiod idag och se resultat inom några dagar.

Lista över resurser

Inga specifika MCP-resurser listas eller beskrivs i förvaret eller dokumentationen.

Lista över verktyg

  • scrape-webpage: Skrapar en webbsida på angiven URL, använder AI för att interagera med och kringgå interaktiva element (som cookie-banners eller CAPTCHAs), extraherar huvudinnehållet med Readability och konverterar resultatet till Markdown. Parametrar inkluderar:
    • url (sträng, obligatorisk): Webbsidan som ska skrapas.
    • autoInteract (boolean, valfri, standard: true): Om interaktiva element ska hanteras automatiskt.
    • maxInteractionAttempts (nummer, valfri, standard: 3): Maximalt antal AI-interaktionsförsök.
    • waitForNetworkIdle (boolean, valfri, standard: true): Vänta tills nätverket är inaktivt innan skrapning.

Användningsområden för denna MCP-server

  • Automatiserad web scraping för kunskapsinhämtning
    Utvecklare kan extrahera läsbara, välformaterade Markdown från godtyckliga webbsidor, vilket gör det enkelt att mata in uppdaterat innehåll i AI-arbetsflöden, databaser eller kunskapsbaser.
  • Kringgående av interaktiva hinder
    Den AI-drivna interaktionen kan automatiskt kringgå CAPTCHAs, cookie-banners och andra interaktiva hinder, vilket möjliggör sömlös innehållsextrahering från sidor som annars hade blockerat automatisering.
  • Summering och innehållsanalys
    Extraherad Markdown kan matas in i LLM:er för summering, sentimentanalys eller klassificering, vilket effektiviserar forskning och databehandling.
  • Realtidsautomatisering av webbläsare
    Utvecklare kan köra verktyget i synligt (icke-headless) läge för felsökning, demonstrationer eller när visuell bekräftelse av webbläsaraktivitet behövs.
  • Integration i LLM-orkestreringspipelines
    Som MCP-server kan den användas som en komponent i orkestratorer som Windsurf, Claude, Cursor och Cline, och utöka AI-agenters förmåga att interagera med det levande webben.

Hur man sätter upp det

Windsurf

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljöinställning: Skapa en .env-fil eller exportera nödvändiga miljövariabler, inklusive OPENAI_API_KEY.

  3. Redigera konfiguration: Lokalisera Windsurfs konfigurationsfil.

  4. Lägg till Puppeteer Vision MCP: Infoga följande JSON-snutt:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Spara/Starta om: Spara filen och starta om Windsurf.

  6. Verifiera: Kontrollera loggar eller UI för att bekräfta att MCP-servern körs.

Säker hantering av API-nycklar:
Lagra hemligheter i miljövariabler (t.ex. .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Förutsättningar: Kontrollera att Node.js och npm är installerade.

  2. Miljöinställning: Förbered .env eller exportera OPENAI_API_KEY och andra variabler.

  3. Redigera konfiguration: Öppna Claudes MCP-konfiguration.

  4. Lägg till MCP-servern:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Starta om Claude: Verkställ ändringar och starta om plattformen.

  6. Verifiera: Bekräfta lyckad uppstart.

Cursor

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljö: Ställ in .env med OpenAI API-nyckeln.

  3. Redigera Cursor-konfigurationen: Lägg till MCP-servern enligt nedan:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Spara & Starta om: Spara ändringar och starta om Cursor.

  5. Kontrollera loggar: Säkerställ att servern körs.

Cline

  1. Förutsättningar: Installera Node.js och npm.

  2. Miljö: Ställ in eller exportera OPENAI_API_KEY.

  3. Konfiguration: Lägg till i Clines MCP-konfiguration:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Starta om Cline: Verkställ och starta om.

  5. Bekräfta: Validera att servern är tillgänglig.

Obs: Skydda API-nycklar via miljövariabler och hårdkoda aldrig hemligheter i konfigurationsfiler.

Hur man använder denna MCP i flöden

Använda MCP i FlowHunt

För att integrera MCP-servrar i ditt FlowHunt-arbetsflöde, börja med att lägga till MCP-komponenten i ditt flöde och koppla den till din AI-agent:

FlowHunt MCP flow

Klicka på MCP-komponenten för att öppna konfigurationspanelen. I systemets MCP-konfigurationssektion, infoga detaljer för din MCP-server enligt detta JSON-format:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

När det är konfigurerat kan AI-agenten nu använda denna MCP som ett verktyg med tillgång till alla dess funktioner och kapabiliteter. Kom ihåg att ändra “puppeteer-vision” till det faktiska namnet på din MCP-server och ersätt URL:en med din egen MCP-server-URL.


Översikt

SektionTillgänglighetDetaljer/Noteringar
ÖversiktAnges i README.
Lista över promptarInga promptmallar funna.
Lista över resurserInga explicita MCP-resurser beskrivna.
Lista över verktygscrape-webpage-verktyget, detaljerat i README.
Säker hantering av API-nycklarInstruktioner för .env och miljövariabler ges.
Sampling-stöd (mindre viktigt vid utvärdering)Ingen nämnd sampling-stöd.

| Stöd för Roots | ⛔ | Ingen nämnd Roots. |


Baserat på ovanstående erbjuder Puppeteer Vision MCP Server ett robust och fokuserat web scraping-verktyg med stark dokumentation och säkerhetsrådgivning, men saknar flera verktyg, promptmallar, resurser och avancerade MCP-funktioner som roots eller sampling. Dess enkelverktygs- och enkeländamålsdesign ger hög tillförlitlighet för dess användningsområde, men begränsar utbyggbarheten.

Vår bedömning

MCP-betyg: 5/10
Denna MCP-server är väl dokumenterad, användbar för sitt specifika ändamål och lätt att sätta upp, men dess avsaknad av promptmallar, explicita resurser och avancerade MCP-funktioner (roots, sampling) begränsar dess mångsidighet och ekosystemintegration.

MCP Score

Har en LICENSE
Har minst ett verktyg
Antal Forks5
Antal Stars12

Vanliga frågor

Kom igång med Puppeteer Vision MCP

Ge dina AI-arbetsflöden en skjuts med avancerad web scraping och innehållsextrahering. Installera Puppeteer Vision MCP Server på några minuter och börja mata in det levande webben i dina AI-pipelines.

Lär dig mer

Puppeteer Vision
Puppeteer Vision

Puppeteer Vision

Integrera FlowHunt med Puppeteer Vision MCP Server för att automatisera webscraping, hantera cookies, CAPTCHAs, betalväggar och omvandla webbsidor till struktur...

4 min läsning
AI Web Scraping +4
puremd MCP Server
puremd MCP Server

puremd MCP Server

puremd MCP Server kopplar samman AI-assistenter och agenter med webbinnehåll genom att låsa upp och skrapa webbplatser, rendera dynamiska sidor och konvertera r...

4 min läsning
AI MCP +6
mcp-vision MCP-server
mcp-vision MCP-server

mcp-vision MCP-server

mcp-vision MCP-server kopplar HuggingFace datorseendemodeller – som zero-shot objektigenkänning – till FlowHunt och andra AI-plattformar, och ger LLM:er och AI-...

4 min läsning
AI Computer Vision +5