
mcp-vision MCP-Server
Der mcp-vision MCP-Server verbindet HuggingFace-Modelle für Computer Vision – wie Zero-Shot-Objekterkennung – mit FlowHunt und anderen KI-Plattformen. So erhalt...
Automatisieren Sie robustes, KI-gestütztes Web Scraping und Markdown-Konvertierung – selbst auf interaktiven oder geschützten Seiten – mit dem Puppeteer Vision MCP Server.
Der Puppeteer Vision MCP Server ermöglicht es KI-Assistenten, Webseiten mit Puppeteer, Readability und Turndown zu scrapen und in das Markdown-Format umzuwandeln. Mit fortschrittlicher, KI-gestützter Interaktion werden Webelemente wie Cookie-Banner, CAPTCHAs, Paywalls und mehr automatisch behandelt, sodass eine robuste Inhaltsextraktion selbst auf interaktiven oder geschützten Seiten möglich ist. Über das Model Context Protocol (MCP) steht diese Funktionalität für die einfache Integration in KI-Entwicklungs-Workflows zur Verfügung. So können Aufgaben wie automatisiertes Web Scraping, Inhaltszusammenfassung und Datenaufnahme nahtlos von LLMs erledigt werden. Der Server ist einfach per npx
einsetzbar, benötigt nur minimale Konfiguration und unterstützt sowohl stdio- als auch SSE-Kommunikation für flexible Integration.
Im Repository oder in der Dokumentation werden keine Prompt-Templates erwähnt.
Es sind keine spezifischen MCP-Ressourcen im Repository oder in der Dokumentation aufgeführt oder beschrieben.
url
(string, erforderlich): Die zu scrapende Webseite.autoInteract
(boolean, optional, Standard: true): Ob interaktive Elemente automatisch behandelt werden sollen.maxInteractionAttempts
(number, optional, Standard: 3): Maximale KI-Interaktionsversuche.waitForNetworkIdle
(boolean, optional, Standard: true): Warten, bis das Netzwerk inaktiv ist, bevor gescrapt wird.Voraussetzungen: Node.js und npm installieren.
Umgebung einrichten: .env
-Datei erstellen oder die benötigten Umgebungsvariablen, darunter OPENAI_API_KEY
, exportieren.
Konfiguration bearbeiten: Die Konfigurationsdatei von Windsurf suchen.
Puppeteer Vision MCP hinzufügen: Fügen Sie folgenden JSON-Abschnitt ein:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Speichern/Neustarten: Datei speichern und Windsurf neu starten.
Überprüfen: Logs oder Oberfläche prüfen, ob der MCP Server läuft.
API-Keys absichern:
Geheimnisse in Umgebungsvariablen speichern (z.B. .env
):
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
Voraussetzungen: Vergewissern Sie sich, dass Node.js und npm installiert sind.
Umgebung setzen: .env
vorbereiten oder OPENAI_API_KEY
und weitere Variablen exportieren.
Konfiguration bearbeiten: Öffnen Sie die MCP-Konfiguration von Claude.
MCP Server hinzufügen:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Claude neu starten: Änderungen anwenden und Plattform neu starten.
Überprüfen: Erfolgreichen Start bestätigen.
Voraussetzungen: Node.js und npm installieren.
Umgebung: .env
mit dem OpenAI API-Schlüssel einrichten.
Cursor-Konfiguration bearbeiten: MCP Server wie folgt hinzufügen:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Speichern & Neustarten: Änderungen speichern und Cursor neu starten.
Logs prüfen: Sicherstellen, dass der Server läuft.
Voraussetzungen: Node.js und npm installieren.
Umgebung: OPENAI_API_KEY
setzen oder exportieren.
Konfiguration: In die MCP-Konfiguration von Cline einfügen:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Cline neu starten: Anwenden und neu starten.
Bestätigen: Prüfen, dass der Server erreichbar ist.
Hinweis: API-Keys immer über Umgebungsvariablen absichern und niemals als Klartext in Konfigurationsdateien speichern.
Verwendung von MCP in FlowHunt
Um MCP-Server in Ihren FlowHunt-Workflow zu integrieren, fügen Sie die MCP-Komponente zu Ihrem Flow hinzu und verbinden Sie sie mit Ihrem KI-Agenten:
Klicken Sie auf die MCP-Komponente, um das Konfigurationspanel zu öffnen. Im Bereich der System-MCP-Konfiguration tragen Sie Ihre MCP-Server-Details in folgendem JSON-Format ein:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
Nach der Konfiguration kann der KI-Agent diesen MCP als Tool nutzen und hat Zugriff auf alle Funktionen und Möglichkeiten. Denken Sie daran, “puppeteer-vision” durch den tatsächlichen Namen Ihres MCP-Servers zu ersetzen und die URL entsprechend anzupassen.
Abschnitt | Verfügbarkeit | Details/Anmerkungen |
---|---|---|
Übersicht | ✅ | Im README enthalten. |
Liste der Prompts | ⛔ | Keine Prompt-Templates gefunden. |
Liste der Ressourcen | ⛔ | Keine expliziten MCP-Ressourcen beschrieben. |
Liste der Tools | ✅ | scrape-webpage Tool, im README dokumentiert. |
Absicherung von API-Keys | ✅ | Hinweise zu .env und Umgebungsvariablen vorhanden. |
Sampling-Unterstützung (weniger wichtig) | ⛔ | Keine Erwähnung von Sampling-Unterstützung. |
| Roots-Unterstützung | ⛔ | Keine Erwähnung von Roots. |
Basierend auf den obigen Punkten bietet der Puppeteer Vision MCP Server ein robustes und fokussiertes Web Scraping Tool mit guter Dokumentation und klaren Sicherheitshinweisen, aber es fehlen mehrere Tools, Prompt-Templates, Ressourcen und fortgeschrittene MCP-Features wie Roots oder Sampling. Das Ein-Tool-Konzept sorgt für hohe Zuverlässigkeit für den jeweiligen Anwendungsfall, schränkt aber die Erweiterbarkeit ein.
MCP Score: 5/10
Dieser MCP Server ist gut dokumentiert, für seinen spezifischen Zweck nützlich und einfach einzurichten. Das Fehlen von Prompt-Templates, expliziten Ressourcen und fortgeschrittenen MCP-Features (Roots, Sampling) begrenzt jedoch seine Vielseitigkeit und Integration ins Ökosystem.
Hat eine LICENSE | ⛔ |
---|---|
Mindestens ein Tool | ✅ |
Anzahl Forks | 5 |
Anzahl Sterne | 12 |
Es handelt sich um einen MCP-Server, der es KI-Agenten ermöglicht, Webseiten mit Puppeteer, Readability und Turndown zu scrapen und in Markdown umzuwandeln. Er kann automatisch mit gängigen Webbarrieren (wie CAPTCHAs und Cookie-Bannern) interagieren und sie umgehen, was eine robuste Inhaltsextraktion für die Verwendung in KI-Workflows ermöglicht.
Automatisiertes Web Scraping zur Wissensaufnahme, Umgehung interaktiver Barrieren, Zusammenfassung und Inhaltsanalyse, Echtzeit-Browserautomatisierung sowie nahtlose Integration in LLM-Orchestrierungspipelines.
Konfigurieren Sie ihn in der MCP-Server-Konfiguration Ihres Orchestrators und geben Sie den Befehl sowie die Umgebungsvariablen (inklusive Ihres OpenAI API-Schlüssels) an. Detaillierte Anweisungen finden Sie oben für Windsurf, Claude, Cursor und Cline.
Er nutzt KI-gesteuerte Automatisierung, um mit Webelementen wie Cookie-Bannern, CAPTCHAs und Paywalls zu interagieren, sie zu schließen oder zu umgehen. So ist die Inhaltsextraktion auch auf geschützten oder interaktiven Seiten möglich.
Ja. Speichern Sie API-Keys immer in Umgebungsvariablen oder `.env`-Dateien. Niemals Geheimnisse direkt in Konfigurationsdateien eintragen.
Das Haupttool ist `scrape-webpage`, welches eine angegebene URL scrapet, bei Bedarf mit Webelementen interagiert und den Hauptinhalt als Markdown ausgibt.
Beschleunigen Sie Ihre KI-Workflows mit fortschrittlichem Web Scraping und Inhalts-Extraktion. Richten Sie den Puppeteer Vision MCP Server in wenigen Minuten ein und beginnen Sie, das Live-Web in Ihre KI-Pipelines zu integrieren.
Der mcp-vision MCP-Server verbindet HuggingFace-Modelle für Computer Vision – wie Zero-Shot-Objekterkennung – mit FlowHunt und anderen KI-Plattformen. So erhalt...
Der Dumpling AI MCP Server für FlowHunt ermöglicht es KI-Assistenten, sich mit einer Vielzahl externer Datenquellen, APIs und Entwicklertools zu verbinden. Er u...
Der Pubchem MCP-Server verbindet KI-Assistenten mit der PubChem API und ermöglicht die automatisierte Abfrage von chemischen und Arzneimittelinformationen – wie...