Puppeteer Vision MCP-server

Puppeteer Vision MCP-server

Automatiser robust, AI-drevet webskraping og Markdown-konvertering – selv på interaktive eller beskyttede nettsteder – med Puppeteer Vision MCP-server.

Hva gjør “Puppeteer Vision” MCP-server?

Puppeteer Vision MCP-server gjør det mulig for AI-assistenter å skrape og konvertere nettsider til Markdown-format ved å bruke Puppeteer, Readability og Turndown. Den tilbyr avansert AI-drevet interaksjon for automatisk å håndtere webelementer som cookie-bannere, CAPTCHAs, betalingsmurer m.m., og sikrer robust innholdsekstraksjon selv fra interaktive eller beskyttede sider. Serveren eksponerer denne funksjonaliteten via Model Context Protocol (MCP), noe som gjør den lett å integrere i AI-utviklingsflyter. Dette lar oppgaver som automatisert webskraping, innholdssammendrag og datainnhenting utføres sømløst av LLM-er. Serveren kan enkelt distribueres via npx, krever minimalt med konfigurasjon, og støtter både stdio- og SSE-kommunikasjon for fleksibel integrasjon.

Liste over promptmaler

Ingen promptmaler er nevnt i depotet eller dokumentasjonen.

Liste over ressurser

Ingen spesifikke MCP-ressurser er listet eller beskrevet i depotet eller dokumentasjonen.

Liste over verktøy

  • scrape-webpage: Skraper en nettside på en angitt URL, bruker AI for å samhandle med og omgå interaktive elementer (som cookie-bannere eller CAPTCHAs), trekker ut hovedinnholdet med Readability, og konverterer resultatet til Markdown. Parametre inkluderer:
    • url (string, påkrevd): Nettsiden som skal skrapes.
    • autoInteract (boolean, valgfri, standard: true): Om interaktive elementer skal håndteres automatisk.
    • maxInteractionAttempts (number, valgfri, standard: 3): Maksimalt antall AI-interaksjonsforsøk.
    • waitForNetworkIdle (boolean, valgfri, standard: true): Vente til nettverket er inaktivt før skraping.

Bruksområder for denne MCP-serveren

  • Automatisert webskraping for kunnskapsinnhenting
    Utviklere kan trekke ut lesbar, godt formatert Markdown fra vilkårlige nettsider, noe som gjør det enkelt å lese inn oppdatert innhold i AI-arbeidsflyter, databaser eller kunnskapsbaser.
  • Omgåelse av interaktive barrierer
    Den AI-drevne interaksjonen kan automatisk omgå CAPTCHAs, cookie-bannere og andre interaktive hindringer, slik at innhold kan hentes ut sømløst fra sider som ellers ville blokkert automatisering.
  • Sammendrag og innholdsanalyse
    Ekstrahert Markdown kan mates inn i LLM-er for sammendrag, sentimentanalyse eller klassifisering, og forenkler forskning og databehandling.
  • Sanntids nettleserautomatisering
    Utviklere kan kjøre verktøyet i synlig (ikke-headless) modus for feilsøking, demonstrasjoner eller når visuell bekreftelse av nettleseraktivitet er nødvendig.
  • Integrasjon i LLM-orkestreringspipelines
    Som MCP-server kan den brukes som komponent i orkestratorer som Windsurf, Claude, Cursor og Cline, og utvider AI-agenters mulighet til å samhandle med det levende nettet.

Slik setter du det opp

Windsurf

  1. Forutsetninger: Installer Node.js og npm.

  2. Miljøoppsett: Opprett en .env-fil eller eksporter nødvendige miljøvariabler, inkludert OPENAI_API_KEY.

  3. Rediger konfigurasjon: Finn Windsurf sin konfigurasjonsfil.

  4. Legg til Puppeteer Vision MCP: Sett inn følgende JSON-snutt:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Lagre/start på nytt: Lagre filen og start Windsurf på nytt.

  6. Bekreft: Sjekk logger eller UI for å bekrefte at MCP-serveren kjører.

Sikre API-nøkler:
Lagre hemmeligheter i miljøvariabler (f.eks. .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Forutsetninger: Sørg for at Node.js og npm er installert.

  2. Sett miljø: Forbered .env eller eksporter OPENAI_API_KEY og andre variabler.

  3. Rediger konfigurasjon: Åpne Claude sin MCP-konfigurasjon.

  4. Legg til MCP-serveren:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Start Claude på nytt: Utfør endringene og start plattformen på nytt.

  6. Bekreft: Kontroller at oppstarten var vellykket.

Cursor

  1. Forutsetninger: Installer Node.js og npm.

  2. Miljø: Sett opp .env med OpenAI API-nøkkelen.

  3. Rediger Cursor-konfig: Legg til MCP-serveren som under:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Lagre og start på nytt: Lagre endringer og start Cursor på nytt.

  5. Sjekk logger: Kontroller at serveren kjører.

Cline

  1. Forutsetninger: Installer Node.js og npm.

  2. Miljø: Sett eller eksporter OPENAI_API_KEY.

  3. Konfigurasjon: Legg til i Cline sin MCP-konfig:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Start Cline på nytt: Utfør og start på nytt.

  5. Bekreft: Kontroller at serveren er tilgjengelig.

Merk: Sikre API-nøkler via miljøvariabler og aldri hardkod hemmeligheter i konfigurasjonsfiler.

Slik bruker du MCP inne i flows

Bruk av MCP i FlowHunt

For å integrere MCP-servere i din FlowHunt-arbeidsflyt, begynn med å legge til MCP-komponenten i flyten og koble den til din AI-agent:

FlowHunt MCP flyt

Klikk på MCP-komponenten for å åpne konfigurasjonspanelet. I systemets MCP-konfigurasjonsseksjon, legg inn detaljene for din MCP-server med dette JSON-formatet:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Når dette er konfigurert, kan AI-agenten nå bruke denne MCP-en som et verktøy med tilgang til alle dens funksjoner og muligheter. Husk å endre “puppeteer-vision” til det faktiske navnet på din MCP-server, og bytt ut URL-en med din egen MCP-server-URL.


Oversikt

SeksjonTilgjengeligDetaljer/Notater
OversiktTilgjengelig i README.
Liste over promptmalerIngen promptmaler funnet.
Liste over ressurserIngen eksplisitte MCP-ressurser beskrevet.
Liste over verktøyscrape-webpage-verktøy, detaljert i README.
Sikring av API-nøklerInstruksjoner for .env og miljøvariabler gitt.
Sampling-støtte (mindre viktig i evaluering)Ingen omtale av sampling-støtte.

| Roots-støtte | ⛔ | Ingen omtale av Roots. |


Basert på det ovenstående tilbyr Puppeteer Vision MCP-server et robust og fokusert webskrapeverktøy med god dokumentasjon og sikkerhetsveiledning, men mangler flere verktøy, promptmaler, ressurser og avanserte MCP-funksjoner som roots eller sampling. Dens én-verktøy, ett-formål-design gir høy pålitelighet for bruksområdet sitt, men begrenser utvidbarheten.

Vår vurdering

MCP-score: 5/10
Denne MCP-serveren er godt dokumentert, nyttig for sitt spesifikke formål og enkel å sette opp, men mangelen på promptmaler, eksplisitte ressurser og avanserte MCP-funksjoner (roots, sampling) begrenser dens allsidighet og økosystemintegrasjon.

MCP-score

Har en LISENS
Har minst ett verktøy
Antall forks5
Antall stjerner12

Vanlige spørsmål

Hva er Puppeteer Vision MCP-server?

Det er en MCP-server som lar AI-agenter skrape og konvertere nettsider til Markdown ved å bruke Puppeteer, Readability og Turndown. Den kan automatisk samhandle med og omgå vanlige nettbarrierer (som CAPTCHAs og cookie-bannere), noe som muliggjør robust innholdsekstraksjon for innlesing i AI-arbeidsflyter.

Hva er hovedbruksområdene?

Automatisert webskraping for kunnskapsinnhenting, omgåelse av interaktive barrierer, sammendrag og innholdsanalyse, sanntids nettleserautomatisering og sømløs integrasjon i LLM-orkestreringspipelines.

Hvordan setter jeg opp Puppeteer Vision MCP med min orkestrator?

Konfigurer den i MCP-serverkonfigurasjonen til orkestratoren din, og spesifiser kommando og miljøvariabler (inkludert din OpenAI API-nøkkel). Detaljerte instruksjoner finnes for Windsurf, Claude, Cursor og Cline ovenfor.

Hvordan håndterer serveren interaktive elementer som cookie-bannere eller betalingsmurer?

Den bruker AI-drevet automatisering for å samhandle med, avvise eller omgå webelementer som cookie-bannere, CAPTCHAs og betalingsmurer, slik at innhold kan hentes ut selv fra beskyttede eller interaktive sider.

Er API-nøkkelen min sikker?

Ja. Oppbevar alltid API-nøkler i miljøvariabler eller `.env`-filer. Aldri hardkod hemmeligheter i konfigurasjonsfiler.

Hvilke verktøy tilbyr denne MCP-serveren?

Hovedverktøyet er `scrape-webpage`, som skraper en gitt URL, samhandler med webelementer etter behov og eksporterer hovedinnholdet som Markdown.

Kom i gang med Puppeteer Vision MCP

Gjør AI-arbeidsflytene dine kraftigere med avansert webskraping og innholdsekstraksjon. Sett opp Puppeteer Vision MCP-server på få minutter og begynn å hente inn levende nettinnhold i AI-pipelines.

Lær mer

Browserbase MCP-server
Browserbase MCP-server

Browserbase MCP-server

Browserbase MCP-server lar AI-agenter og LLM-er kontrollere og automatisere nettlesere i skyen, utføre datauttrekk, ta skjermbilder, overvåke konsollogger og sa...

4 min lesing
AI Automation Browser Automation +4
ModelContextProtocol (MCP) Server-integrering
ModelContextProtocol (MCP) Server-integrering

ModelContextProtocol (MCP) Server-integrering

ModelContextProtocol (MCP) Server fungerer som en bro mellom AI-agenter og eksterne datakilder, API-er og tjenester, slik at FlowHunt-brukere kan bygge kontekst...

3 min lesing
AI Integration +4
Playwright MCP Server
Playwright MCP Server

Playwright MCP Server

Playwright MCP Server gir AI-agenter og utviklere avansert nettleserautomatisering og API-interaksjon, noe som muliggjør sømløs integrasjon i utviklingsmiljøer ...

4 min lesing
Automation AI Integration +5