Puppeteer Vision MCP Server

Web Scraping AI Automation Markdown

Kontaktujte nás pro hostování vašeho MCP serveru ve FlowHunt

FlowHunt poskytuje dodatečnou bezpečnostní vrstvu mezi vašimi interními systémy a AI nástroji, čímž vám dává podrobnou kontrolu nad tím, které nástroje jsou přístupné z vašich MCP serverů. MCP servery hostované v naší infrastruktuře lze bezproblémově integrovat s chatbotem FlowHunt i s populárními AI platformami jako jsou ChatGPT, Claude a různé AI editory.

Co dělá “Puppeteer Vision” MCP Server?

Puppeteer Vision MCP Server umožňuje AI asistentům stahovat a převádět webové stránky do formátu Markdown pomocí Puppeteer, Readability a Turndown. Nabízí pokročilou AI interakci pro automatické zvládání webových prvků jako jsou cookie lišty, CAPTCHA, paywally a další, což zajišťuje robustní extrakci obsahu i z interaktivních či chráněných stránek. Server poskytuje tuto funkci prostřednictvím Model Context Protocol (MCP), takže jej snadno integrujete do AI vývoje a workflow. To umožňuje úkoly jako automatizovaný web scraping, sumarizaci obsahu a ingestování dat hladce provádět pomocí LLM. Server lze jednoduše nasadit pomocí npx, vyžaduje minimální nastavení a podporuje jak stdio, tak SSE komunikaci pro flexibilní integraci.

Seznam promptů

V repozitáři nebo dokumentaci nejsou uvedeny žádné šablony promptů.

Logo

Připraveni rozšířit své podnikání?

Začněte svou bezplatnou zkušební verzi ještě dnes a viďte výsledky během několika dní.

Seznam zdrojů

V repozitáři nebo dokumentaci nejsou konkrétně uvedeny žádné MCP zdroje.

Seznam nástrojů

  • scrape-webpage: Stáhne webovou stránku na zadané URL, pomocí AI interaguje a obchází interaktivní prvky (např. cookie lišty nebo CAPTCHA), extrahuje hlavní obsah pomocí Readability a převádí výsledek do Markdownu. Parametry:
    • url (řetězec, povinné): Webová stránka ke stažení.
    • autoInteract (boolean, volitelně, výchozí: true): Zda automaticky řešit interaktivní prvky.
    • maxInteractionAttempts (číslo, volitelně, výchozí: 3): Maximální počet pokusů o AI interakci.
    • waitForNetworkIdle (boolean, volitelně, výchozí: true): Čekat na klid v síti před scrapingem.

Příklady použití tohoto MCP serveru

  • Automatizovaný web scraping pro ingestování znalostí
    Vývojáři mohou extrahovat čitelný, dobře formátovaný Markdown z libovolné webové stránky a snadno jej ingestovat do AI workflow, databází nebo znalostních bází.
  • Obcházení interaktivních překážek
    AI interakce dokáže automaticky obejít CAPTCHA, cookie lišty a jiné interaktivní překážky, což umožňuje bezproblémovou extrakci obsahu i z webů, které by jinak blokovaly automatizaci.
  • Sumarizace a analýza obsahu
    Extrahovaný Markdown lze předat LLM pro sumarizaci, analýzu sentimentu nebo klasifikaci, což zjednodušuje výzkum a zpracování dat.
  • Automatizace prohlížeče v reálném čase
    Vývojáři mohou nástroj spustit i v “viditelném” (ne-headless) režimu pro ladění, ukázky nebo vizuální potvrzení činnosti prohlížeče.
  • Integrace do LLM orchestrace pipeline
    Jako MCP server lze použít jako komponentu v orchestrátorech jako Windsurf, Claude, Cursor a Cline, což rozšiřuje schopnosti AI agentů pracovat s živým webem.

Jak to nastavit

Windsurf

  1. Předpoklady: Nainstalujte Node.js a npm.

  2. Nastavení prostředí: Vytvořte soubor .env nebo exportujte potřebné proměnné prostředí včetně OPENAI_API_KEY.

  3. Úprava konfigurace: Vyhledejte konfigurační soubor Windsurf.

  4. Přidejte Puppeteer Vision MCP: Vložte tento JSON úsek:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Uložit/Restartovat: Uložte soubor a restartujte Windsurf.

  6. Ověření: Zkontrolujte logy nebo rozhraní, že MCP server běží.

Zabezpečení API klíčů:
Ukládejte tajné hodnoty do proměnných prostředí (například .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Předpoklady: Ujistěte se, že máte nainstalovaný Node.js a npm.

  2. Nastavení prostředí: Připravte .env nebo exportujte OPENAI_API_KEY a další proměnné.

  3. Úprava konfigurace: Otevřete MCP konfiguraci Claude.

  4. Přidejte MCP server:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Restartujte Claude: Proveďte změny a restartujte platformu.

  6. Ověření: Ověřte úspěšné spuštění.

Cursor

  1. Předpoklady: Nainstalujte Node.js a npm.

  2. Prostředí: Nastavte .env s OpenAI API klíčem.

  3. Úprava konfigurace Cursor: Přidejte MCP server takto:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Uložit a restartovat: Uložte změny a restartujte Cursor.

  5. Zkontrolujte logy: Ujistěte se, že server běží.

Cline

  1. Předpoklady: Nainstalujte Node.js a npm.

  2. Prostředí: Nastavte nebo exportujte OPENAI_API_KEY.

  3. Konfigurace: Přidejte do MCP konfigurace Cline:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Restartujte Cline: Proveďte změny a restartujte.

  5. Potvrzení: Ověřte, že je server dostupný.

Poznámka: API klíče vždy zabezpečte pomocí proměnných prostředí a nikdy je nezadávejte přímo do konfiguračních souborů.

Jak používat tento MCP uvnitř toků

Použití MCP ve FlowHunt

Pro integraci MCP serverů do vašeho workflow ve FlowHunt nejprve přidejte MCP komponentu do svého flow a propojte ji se svým AI agentem:

FlowHunt MCP flow

Klikněte na MCP komponentu pro otevření panelu nastavení. V sekci systémové MCP konfigurace vložte detail svého MCP serveru v tomto JSON formátu:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Po nastavení může nyní AI agent využívat tento MCP jako nástroj se všemi jeho funkcemi a možnostmi. Nezapomeňte změnit “puppeteer-vision” na skutečný název vašeho MCP serveru a nahradit URL adresou vašeho MCP serveru.


Přehled

SekceDostupnostDetaily/Poznámky
PřehledUvedeno v README.
Seznam promptůNenalezeny žádné šablony promptů.
Seznam zdrojůNení popsán žádný explicitní MCP zdroj.
Seznam nástrojůNástroj scrape-webpage popsán v README.
Zabezpečení API klíčůInstrukce pro .env a proměnné prostředí jsou uvedeny.
Podpora sampling (méně důležité)Žádná zmínka o sampling podpoře.

| Podpora Roots | ⛔ | Žádná zmínka o Roots. |


Na základě výše uvedeného nabízí Puppeteer Vision MCP Server robustní a vysoce zaměřený nástroj pro web scraping s dobrou dokumentací a bezpečnostními doporučeními, ale chybí mu více nástrojů, šablony promptů, zdroje a pokročilé MCP prvky jako roots nebo sampling. Jeho jednofunkční design zajišťuje vysokou spolehlivost pro daný účel, ale omezuje rozšiřitelnost.

Náš názor

MCP skóre: 5/10
Tento MCP server je dobře zdokumentovaný, užitečný pro svůj specifický účel a snadno se nastavuje, ale absence šablon promptů, explicitních zdrojů a pokročilých MCP funkcí (roots, sampling) omezuje jeho univerzálnost a integraci do ekosystému.

MCP skóre

Má LICENSE
Obsahuje alespoň 1 nástroj
Počet Forků5
Počet Star12

Často kladené otázky

Začněte s Puppeteer Vision MCP

Zrychlete své AI workflow pomocí pokročilého web scrapingu a extrakce obsahu. Nastavte Puppeteer Vision MCP Server během několika minut a začněte ingestovat živý web do svých AI pipeline.

Zjistit více

ScrAPI MCP Server
ScrAPI MCP Server

ScrAPI MCP Server

ScrAPI MCP Server umožňuje AI asistentům získávat aktuální webový obsah – i z webů chráněných captchou, detekcí botů nebo geofencingem. Funguje jako most ke slu...

4 min čtení
MCP Server Web Scraping +6
mcp-vision MCP Server
mcp-vision MCP Server

mcp-vision MCP Server

Server mcp-vision MCP propojuje počítačové vize modelů HuggingFace – například detekci objektů zero-shot – s FlowHunt a dalšími AI platformami. Umožňuje LLM a A...

4 min čtení
AI Computer Vision +5
Mindmap MCP Server
Mindmap MCP Server

Mindmap MCP Server

Mindmap MCP Server převádí Markdown dokumenty na interaktivní myšlenkové mapy a umožňuje vývojářům, pedagogům i AI asistentům vizualizovat hierarchické informac...

4 min čtení
AI Visualization +4