
Markitdown MCP Server
Markitdown MCP Server propojuje AI asistenty s markdown obsahem, umožňuje automatizovanou dokumentaci, analýzu obsahu a správu markdown souborů pro efektivnější...
Automatizujte robustní, AI poháněný web scraping a převod do Markdownu – i na interaktivních či chráněných stránkách – pomocí Puppeteer Vision MCP Serveru.
Puppeteer Vision MCP Server umožňuje AI asistentům stahovat a převádět webové stránky do formátu Markdown pomocí Puppeteer, Readability a Turndown. Nabízí pokročilou AI interakci pro automatické zvládání webových prvků jako jsou cookie lišty, CAPTCHA, paywally a další, což zajišťuje robustní extrakci obsahu i z interaktivních či chráněných stránek. Server poskytuje tuto funkci prostřednictvím Model Context Protocol (MCP), takže jej snadno integrujete do AI vývoje a workflow. To umožňuje úkoly jako automatizovaný web scraping, sumarizaci obsahu a ingestování dat hladce provádět pomocí LLM. Server lze jednoduše nasadit pomocí npx
, vyžaduje minimální nastavení a podporuje jak stdio, tak SSE komunikaci pro flexibilní integraci.
V repozitáři nebo dokumentaci nejsou uvedeny žádné šablony promptů.
V repozitáři nebo dokumentaci nejsou konkrétně uvedeny žádné MCP zdroje.
url
(řetězec, povinné): Webová stránka ke stažení.autoInteract
(boolean, volitelně, výchozí: true): Zda automaticky řešit interaktivní prvky.maxInteractionAttempts
(číslo, volitelně, výchozí: 3): Maximální počet pokusů o AI interakci.waitForNetworkIdle
(boolean, volitelně, výchozí: true): Čekat na klid v síti před scrapingem.Předpoklady: Nainstalujte Node.js a npm.
Nastavení prostředí: Vytvořte soubor .env
nebo exportujte potřebné proměnné prostředí včetně OPENAI_API_KEY
.
Úprava konfigurace: Vyhledejte konfigurační soubor Windsurf.
Přidejte Puppeteer Vision MCP: Vložte tento JSON úsek:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Uložit/Restartovat: Uložte soubor a restartujte Windsurf.
Ověření: Zkontrolujte logy nebo rozhraní, že MCP server běží.
Zabezpečení API klíčů:
Ukládejte tajné hodnoty do proměnných prostředí (například .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Předpoklady: Ujistěte se, že máte nainstalovaný Node.js a npm.
Nastavení prostředí: Připravte .env
nebo exportujte OPENAI_API_KEY
a další proměnné.
Úprava konfigurace: Otevřete MCP konfiguraci Claude.
Přidejte MCP server:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Restartujte Claude: Proveďte změny a restartujte platformu.
Ověření: Ověřte úspěšné spuštění.
Předpoklady: Nainstalujte Node.js a npm.
Prostředí: Nastavte .env
s OpenAI API klíčem.
Úprava konfigurace Cursor: Přidejte MCP server takto:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Uložit a restartovat: Uložte změny a restartujte Cursor.
Zkontrolujte logy: Ujistěte se, že server běží.
Předpoklady: Nainstalujte Node.js a npm.
Prostředí: Nastavte nebo exportujte OPENAI_API_KEY
.
Konfigurace: Přidejte do MCP konfigurace Cline:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Restartujte Cline: Proveďte změny a restartujte.
Potvrzení: Ověřte, že je server dostupný.
Poznámka: API klíče vždy zabezpečte pomocí proměnných prostředí a nikdy je nezadávejte přímo do konfiguračních souborů.
Použití MCP ve FlowHunt
Pro integraci MCP serverů do vašeho workflow ve FlowHunt nejprve přidejte MCP komponentu do svého flow a propojte ji se svým AI agentem:
Klikněte na MCP komponentu pro otevření panelu nastavení. V sekci systémové MCP konfigurace vložte detail svého MCP serveru v tomto JSON formátu:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Po nastavení může nyní AI agent využívat tento MCP jako nástroj se všemi jeho funkcemi a možnostmi. Nezapomeňte změnit “puppeteer-vision” na skutečný název vašeho MCP serveru a nahradit URL adresou vašeho MCP serveru.
Sekce | Dostupnost | Detaily/Poznámky |
---|---|---|
Přehled | ✅ | Uvedeno v README. |
Seznam promptů | ⛔ | Nenalezeny žádné šablony promptů. |
Seznam zdrojů | ⛔ | Není popsán žádný explicitní MCP zdroj. |
Seznam nástrojů | ✅ | Nástroj scrape-webpage popsán v README. |
Zabezpečení API klíčů | ✅ | Instrukce pro .env a proměnné prostředí jsou uvedeny. |
Podpora sampling (méně důležité) | ⛔ | Žádná zmínka o sampling podpoře. |
| Podpora Roots | ⛔ | Žádná zmínka o Roots. |
Na základě výše uvedeného nabízí Puppeteer Vision MCP Server robustní a vysoce zaměřený nástroj pro web scraping s dobrou dokumentací a bezpečnostními doporučeními, ale chybí mu více nástrojů, šablony promptů, zdroje a pokročilé MCP prvky jako roots nebo sampling. Jeho jednofunkční design zajišťuje vysokou spolehlivost pro daný účel, ale omezuje rozšiřitelnost.
MCP skóre: 5/10
Tento MCP server je dobře zdokumentovaný, užitečný pro svůj specifický účel a snadno se nastavuje, ale absence šablon promptů, explicitních zdrojů a pokročilých MCP funkcí (roots, sampling) omezuje jeho univerzálnost a integraci do ekosystému.
Má LICENSE | ⛔ |
---|---|
Obsahuje alespoň 1 nástroj | ✅ |
Počet Forků | 5 |
Počet Star | 12 |
Je to MCP server, který umožňuje AI agentům stahovat a převádět webové stránky do Markdownu pomocí Puppeteer, Readability a Turndown. Dokáže automaticky interagovat a obcházet běžné webové překážky (například CAPTCHA a cookie lišty), což umožňuje robustní extrakci obsahu pro ingestování do AI workflow.
Automatizovaný web scraping pro ingestování znalostí, obcházení interaktivních překážek, sumarizace a analýza obsahu, automatizace prohlížeče v reálném čase a snadná integrace do orchestrace LLM pipeline.
Nakonfigurujte jej ve vašem orchestrátoru v MCP server konfiguraci, kde zadáte příkaz a proměnné prostředí (včetně vašeho OpenAI API klíče). Podrobné instrukce najdete výše pro Windsurf, Claude, Cursor a Cline.
Používá AI automatizaci pro interakci, skrytí nebo obcházení webových prvků jako cookie lišty, CAPTCHA či paywally, a umožňuje tak extrakci obsahu i z chráněných či interaktivních stránek.
Ano. Vždy ukládejte API klíče do proměnných prostředí nebo souborů `.env`. Nikdy nezadávejte tajné údaje přímo do konfiguračních souborů.
Hlavním nástrojem je `scrape-webpage`, který stáhne zadanou URL, interaguje s webovými prvky dle potřeby a předá hlavní obsah ve formátu Markdown.
Zrychlete své AI workflow pomocí pokročilého web scrapingu a extrakce obsahu. Nastavte Puppeteer Vision MCP Server během několika minut a začněte ingestovat živý web do svých AI pipeline.
Markitdown MCP Server propojuje AI asistenty s markdown obsahem, umožňuje automatizovanou dokumentaci, analýzu obsahu a správu markdown souborů pro efektivnější...
ScrAPI MCP Server umožňuje AI asistentům získávat aktuální webový obsah – i z webů chráněných captchou, detekcí botů nebo geofencingem. Funguje jako most ke slu...
RAG Web Browser MCP Server vybavuje AI asistenty a LLM možností živého vyhľadávania na webe a extrakcie obsahu, čo umožňuje retrieval-augmented generation (RAG)...