Puppeteer Vision MCP Server
Automatisieren Sie robustes, KI-gestütztes Web Scraping und Markdown-Konvertierung – selbst auf interaktiven oder geschützten Seiten – mit dem Puppeteer Vision MCP Server.

Was macht der “Puppeteer Vision” MCP Server?
Der Puppeteer Vision MCP Server ermöglicht es KI-Assistenten, Webseiten mit Puppeteer, Readability und Turndown zu scrapen und in das Markdown-Format umzuwandeln. Mit fortschrittlicher, KI-gestützter Interaktion werden Webelemente wie Cookie-Banner, CAPTCHAs, Paywalls und mehr automatisch behandelt, sodass eine robuste Inhaltsextraktion selbst auf interaktiven oder geschützten Seiten möglich ist. Über das Model Context Protocol (MCP) steht diese Funktionalität für die einfache Integration in KI-Entwicklungs-Workflows zur Verfügung. So können Aufgaben wie automatisiertes Web Scraping, Inhaltszusammenfassung und Datenaufnahme nahtlos von LLMs erledigt werden. Der Server ist einfach per npx
einsetzbar, benötigt nur minimale Konfiguration und unterstützt sowohl stdio- als auch SSE-Kommunikation für flexible Integration.
Liste der Prompts
Im Repository oder in der Dokumentation werden keine Prompt-Templates erwähnt.
Liste der Ressourcen
Es sind keine spezifischen MCP-Ressourcen im Repository oder in der Dokumentation aufgeführt oder beschrieben.
Liste der Tools
- scrape-webpage: Scrapt eine Webseite an einer angegebenen URL, nutzt KI für die Interaktion und Umgehung interaktiver Elemente (wie Cookie-Banner oder CAPTCHAs), extrahiert den Hauptinhalt mit Readability und wandelt das Ergebnis in Markdown um. Parameter:
url
(string, erforderlich): Die zu scrapende Webseite.autoInteract
(boolean, optional, Standard: true): Ob interaktive Elemente automatisch behandelt werden sollen.maxInteractionAttempts
(number, optional, Standard: 3): Maximale KI-Interaktionsversuche.waitForNetworkIdle
(boolean, optional, Standard: true): Warten, bis das Netzwerk inaktiv ist, bevor gescrapt wird.
Anwendungsfälle dieses MCP Servers
- Automatisiertes Web Scraping zur Wissensaufnahme
Entwickler können lesbare, gut formatierte Markdown-Inhalte aus beliebigen Webseiten extrahieren und diese einfach in KI-Workflows, Datenbanken oder Wissensbasen einpflegen. - Umgehung interaktiver Barrieren
Die KI-gesteuerte Interaktion kann CAPTCHAs, Cookie-Banner und andere interaktive Hürden automatisch umgehen und ermöglicht so eine reibungslose Inhaltsextraktion auch dort, wo Automatisierung sonst blockiert würde. - Zusammenfassung und Inhaltsanalyse
Extrahiertes Markdown kann von LLMs für Zusammenfassungen, Sentiment-Analysen oder Klassifikationen genutzt werden, was Recherche und Datenverarbeitung vereinfacht. - Echtzeit-Browserautomatisierung
Entwickler können das Tool im sichtbaren (nicht-headless) Modus ausführen – für Debugging, Demonstrationen oder wenn eine visuelle Kontrolle der Browseraktivität erforderlich ist. - Integration in LLM-Orchestrierungs-Pipelines
Als MCP Server kann er als Komponente in Orchestratoren wie Windsurf, Claude, Cursor und Cline genutzt werden und erweitert die Fähigkeiten von KI-Agenten zur Interaktion mit dem Live-Web.
Einrichtung
Windsurf
Voraussetzungen: Node.js und npm installieren.
Umgebung einrichten:
.env
-Datei erstellen oder die benötigten Umgebungsvariablen, darunterOPENAI_API_KEY
, exportieren.Konfiguration bearbeiten: Die Konfigurationsdatei von Windsurf suchen.
Puppeteer Vision MCP hinzufügen: Fügen Sie folgenden JSON-Abschnitt ein:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Speichern/Neustarten: Datei speichern und Windsurf neu starten.
Überprüfen: Logs oder Oberfläche prüfen, ob der MCP Server läuft.
API-Keys absichern:
Geheimnisse in Umgebungsvariablen speichern (z.B. .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Claude
Voraussetzungen: Vergewissern Sie sich, dass Node.js und npm installiert sind.
Umgebung setzen:
.env
vorbereiten oderOPENAI_API_KEY
und weitere Variablen exportieren.Konfiguration bearbeiten: Öffnen Sie die MCP-Konfiguration von Claude.
MCP Server hinzufügen:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Claude neu starten: Änderungen anwenden und Plattform neu starten.
Überprüfen: Erfolgreichen Start bestätigen.
Cursor
Voraussetzungen: Node.js und npm installieren.
Umgebung:
.env
mit dem OpenAI API-Schlüssel einrichten.Cursor-Konfiguration bearbeiten: MCP Server wie folgt hinzufügen:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Speichern & Neustarten: Änderungen speichern und Cursor neu starten.
Logs prüfen: Sicherstellen, dass der Server läuft.
Cline
Voraussetzungen: Node.js und npm installieren.
Umgebung:
OPENAI_API_KEY
setzen oder exportieren.Konfiguration: In die MCP-Konfiguration von Cline einfügen:
{ "mcpServers": { "web-scraper": { "command": "npx", "args": ["-y", "puppeteer-vision-mcp-server"], "env": { "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE" } } } }
Cline neu starten: Anwenden und neu starten.
Bestätigen: Prüfen, dass der Server erreichbar ist.
Hinweis: API-Keys immer über Umgebungsvariablen absichern und niemals als Klartext in Konfigurationsdateien speichern.
Nutzung dieses MCP in Flows
Verwendung von MCP in FlowHunt
Um MCP-Server in Ihren FlowHunt-Workflow zu integrieren, fügen Sie die MCP-Komponente zu Ihrem Flow hinzu und verbinden Sie sie mit Ihrem KI-Agenten:

Klicken Sie auf die MCP-Komponente, um das Konfigurationspanel zu öffnen. Im Bereich der System-MCP-Konfiguration tragen Sie Ihre MCP-Server-Details in folgendem JSON-Format ein:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Nach der Konfiguration kann der KI-Agent diesen MCP als Tool nutzen und hat Zugriff auf alle Funktionen und Möglichkeiten. Denken Sie daran, “puppeteer-vision” durch den tatsächlichen Namen Ihres MCP-Servers zu ersetzen und die URL entsprechend anzupassen.
Übersicht
Abschnitt | Verfügbarkeit | Details/Anmerkungen |
---|---|---|
Übersicht | ✅ | Im README enthalten. |
Liste der Prompts | ⛔ | Keine Prompt-Templates gefunden. |
Liste der Ressourcen | ⛔ | Keine expliziten MCP-Ressourcen beschrieben. |
Liste der Tools | ✅ | scrape-webpage Tool, im README dokumentiert. |
Absicherung von API-Keys | ✅ | Hinweise zu .env und Umgebungsvariablen vorhanden. |
Sampling-Unterstützung (weniger wichtig) | ⛔ | Keine Erwähnung von Sampling-Unterstützung. |
| Roots-Unterstützung | ⛔ | Keine Erwähnung von Roots. |
Basierend auf den obigen Punkten bietet der Puppeteer Vision MCP Server ein robustes und fokussiertes Web Scraping Tool mit guter Dokumentation und klaren Sicherheitshinweisen, aber es fehlen mehrere Tools, Prompt-Templates, Ressourcen und fortgeschrittene MCP-Features wie Roots oder Sampling. Das Ein-Tool-Konzept sorgt für hohe Zuverlässigkeit für den jeweiligen Anwendungsfall, schränkt aber die Erweiterbarkeit ein.
Unsere Meinung
MCP Score: 5/10
Dieser MCP Server ist gut dokumentiert, für seinen spezifischen Zweck nützlich und einfach einzurichten. Das Fehlen von Prompt-Templates, expliziten Ressourcen und fortgeschrittenen MCP-Features (Roots, Sampling) begrenzt jedoch seine Vielseitigkeit und Integration ins Ökosystem.
MCP Score
Hat eine LICENSE | ⛔ |
---|---|
Mindestens ein Tool | ✅ |
Anzahl Forks | 5 |
Anzahl Sterne | 12 |
Häufig gestellte Fragen
- Was ist der Puppeteer Vision MCP Server?
Es handelt sich um einen MCP-Server, der es KI-Agenten ermöglicht, Webseiten mit Puppeteer, Readability und Turndown zu scrapen und in Markdown umzuwandeln. Er kann automatisch mit gängigen Webbarrieren (wie CAPTCHAs und Cookie-Bannern) interagieren und sie umgehen, was eine robuste Inhaltsextraktion für die Verwendung in KI-Workflows ermöglicht.
- Was sind die Hauptanwendungsfälle?
Automatisiertes Web Scraping zur Wissensaufnahme, Umgehung interaktiver Barrieren, Zusammenfassung und Inhaltsanalyse, Echtzeit-Browserautomatisierung sowie nahtlose Integration in LLM-Orchestrierungspipelines.
- Wie richte ich Puppeteer Vision MCP mit meinem Orchestrator ein?
Konfigurieren Sie ihn in der MCP-Server-Konfiguration Ihres Orchestrators und geben Sie den Befehl sowie die Umgebungsvariablen (inklusive Ihres OpenAI API-Schlüssels) an. Detaillierte Anweisungen finden Sie oben für Windsurf, Claude, Cursor und Cline.
- Wie geht der Server mit interaktiven Elementen wie Cookie-Bannern oder Paywalls um?
Er nutzt KI-gesteuerte Automatisierung, um mit Webelementen wie Cookie-Bannern, CAPTCHAs und Paywalls zu interagieren, sie zu schließen oder zu umgehen. So ist die Inhaltsextraktion auch auf geschützten oder interaktiven Seiten möglich.
- Ist mein API-Key sicher?
Ja. Speichern Sie API-Keys immer in Umgebungsvariablen oder `.env`-Dateien. Niemals Geheimnisse direkt in Konfigurationsdateien eintragen.
- Welche Tools stellt dieser MCP Server bereit?
Das Haupttool ist `scrape-webpage`, welches eine angegebene URL scrapet, bei Bedarf mit Webelementen interagiert und den Hauptinhalt als Markdown ausgibt.
Starten Sie mit Puppeteer Vision MCP
Beschleunigen Sie Ihre KI-Workflows mit fortschrittlichem Web Scraping und Inhalts-Extraktion. Richten Sie den Puppeteer Vision MCP Server in wenigen Minuten ein und beginnen Sie, das Live-Web in Ihre KI-Pipelines zu integrieren.