
Markdownify MCP Server
Markdownify MCP Server convertește diverse tipuri de fișiere și conținut web—precum PDF-uri, DOCX, imagini, audio și pagini web—în format Markdown standardizat,...
Automatizează extragerea web robustă, bazată pe AI, și conversia în Markdown — chiar și pe site-uri interactive sau protejate — folosind serverul Puppeteer Vision MCP.
Serverul Puppeteer Vision MCP permite asistenților AI să extragă și să convertească pagini web în format Markdown folosind Puppeteer, Readability și Turndown. Oferă interacțiuni avansate, bazate pe AI, pentru a gestiona automat elemente web precum bannere cookie, CAPTCHA, paywall-uri și multe altele, asigurând extragerea conținutului chiar și de pe site-uri interactive sau protejate. Serverul expune această capacitate prin Model Context Protocol (MCP), făcând integrarea în fluxurile de dezvoltare AI foarte ușoară. Astfel, sarcini precum extragere automată web, sumarizare de conținut și ingestie de date pot fi realizate fără probleme de LLM-uri. Serverul se poate implementa rapid cu npx
, necesită o configurare minimă și suportă atât comunicare stdio cât și SSE pentru integrare flexibilă.
Niciun șablon de prompt nu este menționat în depozit sau documentație.
Nu sunt listate sau descrise resurse MCP specifice în depozit sau documentație.
url
(șir, obligatoriu): Pagina web de extras.autoInteract
(boolean, opțional, implicit: true): Dacă se gestionează automat elementele interactive.maxInteractionAttempts
(număr, opțional, implicit: 3): Numărul maxim de încercări de interacțiune AI.waitForNetworkIdle
(boolean, opțional, implicit: true): Așteaptă ca rețeaua să fie inactivă înainte de extragere.Prerechizite: Instalează Node.js și npm.
Configurarea mediului: Creează un fișier .env
sau exportă variabilele de mediu necesare, inclusiv OPENAI_API_KEY
.
Editează configurația: Găsește fișierul de configurare al Windsurf.
Adaugă Puppeteer Vision MCP: Inserează următorul fragment JSON:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Salvează/Repornește: Salvează fișierul și repornește Windsurf.
Verifică: Verifică jurnalele sau UI-ul pentru a confirma că serverul MCP rulează.
Securizarea cheilor API:
Stochează secretele în variabile de mediu (ex. .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Prerechizite: Asigură-te că Node.js și npm sunt instalate.
Setează mediul: Pregătește .env
sau exportă OPENAI_API_KEY
și alte variabile.
Editează configurația: Deschide configurația MCP din Claude.
Adaugă serverul MCP:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Repornește Claude: Aplică modificările și repornește platforma.
Verifică: Confirmă pornirea cu succes.
Prerechizite: Instalează Node.js și npm.
Mediu: Configurează .env
cu cheia OpenAI API.
Editează configurația Cursor: Adaugă serverul MCP astfel:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Salvează & Repornește: Salvează modificările și repornește Cursor.
Verifică jurnalele: Asigură-te că serverul rulează.
Prerechizite: Instalează Node.js și npm.
Mediu: Setează sau exportă OPENAI_API_KEY
.
Configurație: Adaugă în configurația MCP a Cline:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Repornește Cline: Aplică și repornește.
Confirmă: Validează că serverul este accesibil.
Notă: Securizează cheile API prin variabile de mediu și nu introduce niciodată secrete direct în fișierele de configurare.
Utilizarea MCP în FlowHunt
Pentru a integra servere MCP în fluxul tău FlowHunt, adaugă componenta MCP în flow și conecteaz-o la agentul AI:
Dă clic pe componenta MCP pentru a deschide panoul de configurare. În secțiunea de configurare MCP de sistem, inserează detaliile serverului tău MCP folosind acest format JSON:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
După configurare, agentul AI poate folosi acest MCP ca unealtă, având acces la toate funcțiile și capabilitățile sale. Nu uita să schimbi “puppeteer-vision” cu numele real al serverului tău MCP și să înlocuiești URL-ul cu cel al serverului tău MCP.
Secțiune | Disponibilitate | Detalii/Note |
---|---|---|
Prezentare generală | ✅ | Oferită în README. |
Lista de prompturi | ⛔ | Nu au fost găsite șabloane de prompt. |
Lista de resurse | ⛔ | Nu sunt descrise resurse MCP explicite. |
Lista de unelte | ✅ | Unealta scrape-webpage , detaliată în README. |
Securizarea cheilor API | ✅ | Instrucțiuni pentru .env și variabile de mediu prezentate. |
Suport pentru sampling (mai puțin important) | ⛔ | Nicio mențiune despre sampling. |
| Suport Roots | ⛔ | Nicio mențiune despre Roots. |
Pe baza celor de mai sus, serverul Puppeteer Vision MCP oferă o unealtă de extragere web robustă și concentrată, cu documentație și recomandări de securitate solide, dar lipsesc mai multe unelte, șabloane de prompturi, resurse și funcții MCP avansate precum roots sau sampling. Designul său, axat pe un singur instrument și scop, îi conferă fiabilitate ridicată pentru cazul său de utilizare, dar limitează extensibilitatea.
Scor MCP: 5/10
Acest server MCP este bine documentat, util pentru scopul său specific și ușor de configurat, dar lipsa șabloanelor de prompturi, resurselor explicite și a funcțiilor MCP avansate (roots, sampling) îi limitează versatilitatea și integrarea în ecosistem.
Are o LICENȚĂ | ⛔ |
---|---|
Are cel puțin o unealtă | ✅ |
Număr Forks | 5 |
Număr Stars | 12 |
Este un server MCP care permite agenților AI să extragă și să convertească pagini web în Markdown folosind Puppeteer, Readability și Turndown. Poate interacționa automat și depăși bariere web obișnuite (cum ar fi CAPTCHA și bannerele de cookie-uri), permițând extragerea robustă a conținutului pentru ingestie în fluxurile de lucru AI.
Extragere web automată pentru ingestie de cunoștințe, ocolirea barierelor interactive, sumarizare și analiză de conținut, automatizare de browser în timp real și integrare fără probleme în pipeline-uri de orchestrare LLM.
Configurează-l în fișierul de configurare al serverului MCP din orchestrator, specificând comanda și variabilele de mediu (inclusiv cheia ta OpenAI API). Instrucțiuni detaliate sunt oferite pentru Windsurf, Claude, Cursor și Cline mai sus.
Folosește automatizare bazată pe AI pentru a interacționa cu, respinge sau ocoli elemente web precum bannere cookie, CAPTCHA și paywall-uri, asigurând extragerea conținutului chiar și de pe site-uri protejate sau interactive.
Da. Stochează întotdeauna cheile API în variabile de mediu sau fișiere `.env`. Nu introduce niciodată secrete direct în fișierele de configurare.
Principala unealtă este `scrape-webpage`, care extrage o adresă URL dată, interacționează cu elementele web după necesitate și oferă conținutul principal ca Markdown.
Accelerează-ți fluxurile AI cu extragere web avansată și extragere de conținut. Configurează serverul Puppeteer Vision MCP în câteva minute și începe să ingerezi web-ul live în pipeline-urile tale AI.
Markdownify MCP Server convertește diverse tipuri de fișiere și conținut web—precum PDF-uri, DOCX, imagini, audio și pagini web—în format Markdown standardizat,...
Serverul Markitdown MCP face legătura între asistenții AI și conținutul markdown, permițând generarea automată de documentație, analiză de conținut și gestionar...
Serverul ModelContextProtocol (MCP) acționează ca o punte între agenții AI și sursele externe de date, API-uri și servicii, permițând utilizatorilor FlowHunt să...