Puppeteer Vision MCP Server

Puppeteer Vision MCP Server

Automatizujte robustní, AI poháněný web scraping a převod do Markdownu – i na interaktivních či chráněných stránkách – pomocí Puppeteer Vision MCP Serveru.

Co dělá “Puppeteer Vision” MCP Server?

Puppeteer Vision MCP Server umožňuje AI asistentům stahovat a převádět webové stránky do formátu Markdown pomocí Puppeteer, Readability a Turndown. Nabízí pokročilou AI interakci pro automatické zvládání webových prvků jako jsou cookie lišty, CAPTCHA, paywally a další, což zajišťuje robustní extrakci obsahu i z interaktivních či chráněných stránek. Server poskytuje tuto funkci prostřednictvím Model Context Protocol (MCP), takže jej snadno integrujete do AI vývoje a workflow. To umožňuje úkoly jako automatizovaný web scraping, sumarizaci obsahu a ingestování dat hladce provádět pomocí LLM. Server lze jednoduše nasadit pomocí npx, vyžaduje minimální nastavení a podporuje jak stdio, tak SSE komunikaci pro flexibilní integraci.

Seznam promptů

V repozitáři nebo dokumentaci nejsou uvedeny žádné šablony promptů.

Seznam zdrojů

V repozitáři nebo dokumentaci nejsou konkrétně uvedeny žádné MCP zdroje.

Seznam nástrojů

  • scrape-webpage: Stáhne webovou stránku na zadané URL, pomocí AI interaguje a obchází interaktivní prvky (např. cookie lišty nebo CAPTCHA), extrahuje hlavní obsah pomocí Readability a převádí výsledek do Markdownu. Parametry:
    • url (řetězec, povinné): Webová stránka ke stažení.
    • autoInteract (boolean, volitelně, výchozí: true): Zda automaticky řešit interaktivní prvky.
    • maxInteractionAttempts (číslo, volitelně, výchozí: 3): Maximální počet pokusů o AI interakci.
    • waitForNetworkIdle (boolean, volitelně, výchozí: true): Čekat na klid v síti před scrapingem.

Příklady použití tohoto MCP serveru

  • Automatizovaný web scraping pro ingestování znalostí
    Vývojáři mohou extrahovat čitelný, dobře formátovaný Markdown z libovolné webové stránky a snadno jej ingestovat do AI workflow, databází nebo znalostních bází.
  • Obcházení interaktivních překážek
    AI interakce dokáže automaticky obejít CAPTCHA, cookie lišty a jiné interaktivní překážky, což umožňuje bezproblémovou extrakci obsahu i z webů, které by jinak blokovaly automatizaci.
  • Sumarizace a analýza obsahu
    Extrahovaný Markdown lze předat LLM pro sumarizaci, analýzu sentimentu nebo klasifikaci, což zjednodušuje výzkum a zpracování dat.
  • Automatizace prohlížeče v reálném čase
    Vývojáři mohou nástroj spustit i v “viditelném” (ne-headless) režimu pro ladění, ukázky nebo vizuální potvrzení činnosti prohlížeče.
  • Integrace do LLM orchestrace pipeline
    Jako MCP server lze použít jako komponentu v orchestrátorech jako Windsurf, Claude, Cursor a Cline, což rozšiřuje schopnosti AI agentů pracovat s živým webem.

Jak to nastavit

Windsurf

  1. Předpoklady: Nainstalujte Node.js a npm.

  2. Nastavení prostředí: Vytvořte soubor .env nebo exportujte potřebné proměnné prostředí včetně OPENAI_API_KEY.

  3. Úprava konfigurace: Vyhledejte konfigurační soubor Windsurf.

  4. Přidejte Puppeteer Vision MCP: Vložte tento JSON úsek:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Uložit/Restartovat: Uložte soubor a restartujte Windsurf.

  6. Ověření: Zkontrolujte logy nebo rozhraní, že MCP server běží.

Zabezpečení API klíčů:
Ukládejte tajné hodnoty do proměnných prostředí (například .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Předpoklady: Ujistěte se, že máte nainstalovaný Node.js a npm.

  2. Nastavení prostředí: Připravte .env nebo exportujte OPENAI_API_KEY a další proměnné.

  3. Úprava konfigurace: Otevřete MCP konfiguraci Claude.

  4. Přidejte MCP server:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Restartujte Claude: Proveďte změny a restartujte platformu.

  6. Ověření: Ověřte úspěšné spuštění.

Cursor

  1. Předpoklady: Nainstalujte Node.js a npm.

  2. Prostředí: Nastavte .env s OpenAI API klíčem.

  3. Úprava konfigurace Cursor: Přidejte MCP server takto:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Uložit a restartovat: Uložte změny a restartujte Cursor.

  5. Zkontrolujte logy: Ujistěte se, že server běží.

Cline

  1. Předpoklady: Nainstalujte Node.js a npm.

  2. Prostředí: Nastavte nebo exportujte OPENAI_API_KEY.

  3. Konfigurace: Přidejte do MCP konfigurace Cline:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Restartujte Cline: Proveďte změny a restartujte.

  5. Potvrzení: Ověřte, že je server dostupný.

Poznámka: API klíče vždy zabezpečte pomocí proměnných prostředí a nikdy je nezadávejte přímo do konfiguračních souborů.

Jak používat tento MCP uvnitř toků

Použití MCP ve FlowHunt

Pro integraci MCP serverů do vašeho workflow ve FlowHunt nejprve přidejte MCP komponentu do svého flow a propojte ji se svým AI agentem:

FlowHunt MCP flow

Klikněte na MCP komponentu pro otevření panelu nastavení. V sekci systémové MCP konfigurace vložte detail svého MCP serveru v tomto JSON formátu:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Po nastavení může nyní AI agent využívat tento MCP jako nástroj se všemi jeho funkcemi a možnostmi. Nezapomeňte změnit “puppeteer-vision” na skutečný název vašeho MCP serveru a nahradit URL adresou vašeho MCP serveru.


Přehled

SekceDostupnostDetaily/Poznámky
PřehledUvedeno v README.
Seznam promptůNenalezeny žádné šablony promptů.
Seznam zdrojůNení popsán žádný explicitní MCP zdroj.
Seznam nástrojůNástroj scrape-webpage popsán v README.
Zabezpečení API klíčůInstrukce pro .env a proměnné prostředí jsou uvedeny.
Podpora sampling (méně důležité)Žádná zmínka o sampling podpoře.

| Podpora Roots | ⛔ | Žádná zmínka o Roots. |


Na základě výše uvedeného nabízí Puppeteer Vision MCP Server robustní a vysoce zaměřený nástroj pro web scraping s dobrou dokumentací a bezpečnostními doporučeními, ale chybí mu více nástrojů, šablony promptů, zdroje a pokročilé MCP prvky jako roots nebo sampling. Jeho jednofunkční design zajišťuje vysokou spolehlivost pro daný účel, ale omezuje rozšiřitelnost.

Náš názor

MCP skóre: 5/10
Tento MCP server je dobře zdokumentovaný, užitečný pro svůj specifický účel a snadno se nastavuje, ale absence šablon promptů, explicitních zdrojů a pokročilých MCP funkcí (roots, sampling) omezuje jeho univerzálnost a integraci do ekosystému.

MCP skóre

Má LICENSE
Obsahuje alespoň 1 nástroj
Počet Forků5
Počet Star12

Často kladené otázky

Co je Puppeteer Vision MCP Server?

Je to MCP server, který umožňuje AI agentům stahovat a převádět webové stránky do Markdownu pomocí Puppeteer, Readability a Turndown. Dokáže automaticky interagovat a obcházet běžné webové překážky (například CAPTCHA a cookie lišty), což umožňuje robustní extrakci obsahu pro ingestování do AI workflow.

Jaké jsou hlavní případy použití?

Automatizovaný web scraping pro ingestování znalostí, obcházení interaktivních překážek, sumarizace a analýza obsahu, automatizace prohlížeče v reálném čase a snadná integrace do orchestrace LLM pipeline.

Jak nastavím Puppeteer Vision MCP se svým orchestrátorem?

Nakonfigurujte jej ve vašem orchestrátoru v MCP server konfiguraci, kde zadáte příkaz a proměnné prostředí (včetně vašeho OpenAI API klíče). Podrobné instrukce najdete výše pro Windsurf, Claude, Cursor a Cline.

Jak si server poradí s interaktivními prvky jako cookie lišty nebo paywally?

Používá AI automatizaci pro interakci, skrytí nebo obcházení webových prvků jako cookie lišty, CAPTCHA či paywally, a umožňuje tak extrakci obsahu i z chráněných či interaktivních stránek.

Je můj API klíč v bezpečí?

Ano. Vždy ukládejte API klíče do proměnných prostředí nebo souborů `.env`. Nikdy nezadávejte tajné údaje přímo do konfiguračních souborů.

Jaké nástroje tento MCP server poskytuje?

Hlavním nástrojem je `scrape-webpage`, který stáhne zadanou URL, interaguje s webovými prvky dle potřeby a předá hlavní obsah ve formátu Markdown.

Začněte s Puppeteer Vision MCP

Zrychlete své AI workflow pomocí pokročilého web scrapingu a extrakce obsahu. Nastavte Puppeteer Vision MCP Server během několika minut a začněte ingestovat živý web do svých AI pipeline.

Zjistit více

Markitdown MCP Server
Markitdown MCP Server

Markitdown MCP Server

Markitdown MCP Server propojuje AI asistenty s markdown obsahem, umožňuje automatizovanou dokumentaci, analýzu obsahu a správu markdown souborů pro efektivnější...

3 min čtení
AI Markdown +3
ScrAPI MCP Server
ScrAPI MCP Server

ScrAPI MCP Server

ScrAPI MCP Server umožňuje AI asistentům získávat aktuální webový obsah – i z webů chráněných captchou, detekcí botů nebo geofencingem. Funguje jako most ke slu...

4 min čtení
MCP Server Web Scraping +6
RAG Web Browser MCP Server
RAG Web Browser MCP Server

RAG Web Browser MCP Server

RAG Web Browser MCP Server vybavuje AI asistenty a LLM možností živého vyhľadávania na webe a extrakcie obsahu, čo umožňuje retrieval-augmented generation (RAG)...

4 min čtení
AI RAG +7