
ScrAPI MCP Server
ScrAPI MCP Server umožňuje AI asistentom získavať aktuálny webový obsah – dokonca aj z webov chránených captcha, detekciou botov alebo geolokačnými obmedzeniami...
Automatizujte odolný web scraping s podporou AI a konverziu do Markdownu – aj na interaktívnych či chránených stránkach – vďaka Puppeteer Vision MCP Serveru.
Puppeteer Vision MCP Server umožňuje AI asistentom scrapovať a konvertovať webové stránky do formátu Markdown pomocou Puppeteer, Readability a Turndown. Vďaka pokročilej AI interakcii automaticky zvláda webové prvky ako cookie lišty, CAPTCHA, paywally a ďalšie, čo zabezpečuje robustnú extrakciu obsahu aj z interaktívnych alebo chránených stránok. Server túto schopnosť sprístupňuje cez Model Context Protocol (MCP), čo uľahčuje integráciu do AI vývojových workflow. Umožňuje tak automatizovaný web scraping, sumarizáciu obsahu aj získavanie dát priamo LLM modelmi. Server je jednoducho nasaditeľný cez npx
, vyžaduje len minimálnu konfiguráciu a podporuje komunikáciu cez stdio aj SSE pre flexibilnú integráciu.
V repozitári alebo dokumentácii nie sú uvedené žiadne prompt šablóny.
V repozitári alebo dokumentácii nie sú explicitne uvedené žiadne MCP zdroje.
url
(string, povinné): Webová stránka na scrapovanie.autoInteract
(boolean, voliteľné, predvolené: true): Či má automaticky riešiť interaktívne prvky.maxInteractionAttempts
(number, voliteľné, predvolené: 3): Maximálny počet AI pokusov o interakciu.waitForNetworkIdle
(boolean, voliteľné, predvolené: true): Čakať na neaktívnu sieť pred scrapovaním.Predpoklady: Nainštalujte Node.js a npm.
Nastavenie prostredia: Vytvorte súbor .env
alebo exportujte požadované environmentálne premenné vrátane OPENAI_API_KEY
.
Úprava konfigurácie: Nájdite konfiguračný súbor Windsurf.
Pridajte Puppeteer Vision MCP: Vložte tento JSON úsek:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Uložiť/reštartovať: Uložte súbor a reštartujte Windsurf.
Overiť: Skontrolujte logy alebo UI pre potvrdenie spustenia MCP servera.
Zabezpečenie API kľúčov:
Tajomstvá ukladajte do environmentálnych premenných (napr. .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Predpoklady: Uistite sa, že Node.js a npm sú nainštalované.
Nastavenie prostredia: Pripravte .env
alebo exportujte OPENAI_API_KEY
a ďalšie premenné.
Úprava konfigurácie: Otvorte Claude MCP konfiguráciu.
Pridajte MCP server:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Reštartujte Claude: Uložte zmeny a reštartujte platformu.
Overiť: Potvrďte úspešné spustenie.
Predpoklady: Nainštalujte Node.js a npm.
Prostredie: Nastavte .env
s OpenAI API kľúčom.
Úprava Cursor konfigurácie: Pridajte MCP server nasledovne:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Uložiť & reštartovať: Uložte zmeny a reštartujte Cursor.
Skontrolujte logy: Overte, že server beží.
Predpoklady: Nainštalujte Node.js a npm.
Prostredie: Nastavte alebo exportujte OPENAI_API_KEY
.
Konfigurácia: Pridajte do Cline MCP konfigurácie:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Reštartujte Cline: Použite zmeny a reštartujte.
Overte: Overte, že server je dostupný.
Poznámka: API kľúče zabezpečte prostredníctvom environmentálnych premenných a nikdy ich neukladajte priamo do konfigurácie.
Použitie MCP vo FlowHunt
Na integráciu MCP serverov do vášho FlowHunt workflow pridajte MCP komponent do flow a prepojte ho s AI agentom:
Kliknite na MCP komponent pre otvorenie konfiguračného panela. V časti systémová MCP konfigurácia vložte detaily MCP servera v tomto JSON formáte:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Po uložení je AI agent schopný používať tento MCP ako nástroj so všetkými jeho funkciami. Nezabudnite zmeniť “puppeteer-vision” na skutočný názov vášho MCP servera a nahraďte URL adresou vášho MCP servera.
Sekcia | Dostupnosť | Podrobnosti/Poznámky |
---|---|---|
Prehľad | ✅ | Uvedené v README. |
Zoznam promptov | ⛔ | Neboli nájdené žiadne prompt šablóny. |
Zoznam zdrojov | ⛔ | Nie sú popísané explicitné MCP zdroje. |
Zoznam nástrojov | ✅ | Nástroj scrape-webpage , podrobne v README. |
Zabezpečenie API kľúčov | ✅ | Návod na .env a environmentálne premenné je uvedený. |
Podpora sampling (menej dôležité v hodnotení) | ⛔ | Nie je spomenutá podpora sampling. |
| Podpora Roots | ⛔ | Nie je spomenutý Roots. |
Na základe vyššie uvedeného, Puppeteer Vision MCP Server ponúka robustný a zameraný nástroj na web scraping s kvalitnou dokumentáciou a bezpečnostnými odporúčaniami, no chýba viacero nástrojov, prompt šablóny, zdroje či pokročilé MCP funkcie ako roots alebo sampling. Vďaka jednému účelu má vysokú spoľahlivosť pre svoj prípad použitia, no obmedzenú rozšíriteľnosť.
MCP skóre: 5/10
Tento MCP server je dobre zdokumentovaný, užitočný pre svoj konkrétny účel a ľahko nastaviteľný, avšak absencia prompt šablón, explicitných zdrojov a pokročilých MCP funkcií (roots, sampling) obmedzuje jeho univerzálnosť a integráciu do ekosystému.
Má LICENSE | ⛔ |
---|---|
Má aspoň jeden nástroj | ✅ |
Počet Forkov | 5 |
Počet Starov | 12 |
Je to MCP server, ktorý umožňuje AI agentom scrapovať a konvertovať webové stránky do Markdownu pomocou Puppeteer, Readability a Turndown. Automaticky interaguje a obchádza bežné webové bariéry (ako CAPTCHA alebo cookie lišty), čím umožňuje robustnú extrakciu obsahu pre AI workflow.
Automatizovaný web scraping pre získavanie znalostí, obchádzanie interaktívnych bariér, sumarizácia a analýza obsahu, automatizácia prehliadača v reálnom čase a bezproblémová integrácia do LLM orchestrátorov.
Nakonfigurujte ho vo svojej MCP konfigurácii orchestrátora, zadajte príkaz a environmentálne premenné (vrátane OpenAI API kľúča). Podrobné inštrukcie sú uvedené vyššie pre Windsurf, Claude, Cursor a Cline.
Využíva automatizáciu poháňanú AI na interakciu, odmietnutie alebo obídenie webových prvkov ako sú cookie lišty, CAPTCHA či paywally, takže extrakcia obsahu funguje aj na chránených alebo interaktívnych stránkach.
Áno. API kľúče vždy ukladajte do environmentálnych premenných alebo `.env` súborov. Nikdy ich neukladajte priamo do konfiguračných súborov.
Hlavným nástrojom je `scrape-webpage`, ktorý scrapuje dané URL, prípadne interaguje s webovými prvkami a výstupom je hlavný obsah v Markdown formáte.
Zrýchlite svoje AI workflow vďaka pokročilému web scrapingu a extrakcii obsahu. Nastavte Puppeteer Vision MCP Server za pár minút a začnite vkladať živý web do svojich AI pipeline.
ScrAPI MCP Server umožňuje AI asistentom získavať aktuálny webový obsah – dokonca aj z webov chránených captcha, detekciou botov alebo geolokačnými obmedzeniami...
Scrapling Fetch MCP Server umožňuje AI asistentom a chatbotom pristupovať k textovému a HTML obsahu z webových stránok s ochranou proti botom, čím umožňuje získ...
Server mcp-vision MCP prepája modely počítačového videnia z HuggingFace – ako napríklad zero-shot detekciu objektov – s FlowHuntom a ďalšími AI platformami, čím...