Puppeteer Vision MCP Server

Automatyzuj solidny web scraping oparty na AI i konwersję do Markdown — nawet na interaktywnych lub chronionych stronach — z wykorzystaniem Puppeteer Vision MCP Server.

Puppeteer Vision MCP Server

Co robi serwer “Puppeteer Vision” MCP?

Puppeteer Vision MCP Server umożliwia asystentom AI skanowanie i konwertowanie stron internetowych do formatu Markdown, wykorzystując Puppeteer, Readability oraz Turndown. Oferuje zaawansowaną interakcję sterowaną AI, automatycznie obsługując elementy sieciowe, takie jak banery cookies, CAPTCHA, paywalle i inne, zapewniając solidną ekstrakcję treści nawet ze stron interaktywnych lub chronionych. Serwer udostępnia te możliwości przez Model Context Protocol (MCP), co ułatwia integrację z workflow deweloperskimi AI. Pozwala to na płynne wykonywanie takich zadań, jak automatyczny web scraping, podsumowywanie treści czy pobieranie danych przez LLM. Serwer jest łatwy do wdrożenia przez npx, wymaga minimalnej konfiguracji i obsługuje zarówno komunikację stdio, jak i SSE dla elastycznej integracji.

Lista promptów

W repozytorium ani dokumentacji nie wymieniono szablonów promptów.

Lista zasobów

W repozytorium ani dokumentacji nie opisano żadnych konkretnych zasobów MCP.

Lista narzędzi

  • scrape-webpage: Skrapuje stronę pod podanym URL, wykorzystując AI do interakcji i omijania elementów interaktywnych (np. banerów cookies czy CAPTCHA), wydobywa główną treść za pomocą Readability i konwertuje wynik do Markdown. Parametry:
    • url (string, wymagany): Adres strony do skrapowania.
    • autoInteract (boolean, opcjonalny, domyślnie: true): Czy automatycznie obsługiwać elementy interaktywne.
    • maxInteractionAttempts (number, opcjonalny, domyślnie: 3): Maksymalna liczba prób interakcji AI.
    • waitForNetworkIdle (boolean, opcjonalny, domyślnie: true): Czy czekać na bezczynność sieci przed skrapowaniem.

Przykładowe zastosowania tego serwera MCP

  • Automatyczny web scraping do pozyskiwania wiedzy
    Programiści mogą wydobywać czytelny, dobrze sformatowany Markdown z dowolnych stron, co ułatwia wprowadzanie aktualnych treści do workflow AI, baz danych lub baz wiedzy.
  • Omijanie interaktywnych barier
    Interakcja sterowana AI umożliwia automatyczne omijanie CAPTCHA, banerów cookies i innych przeszkód, pozwalając na płynną ekstrakcję treści ze stron, które normalnie blokowałyby automatyzację.
  • Podsumowywanie i analiza treści
    Wyodrębniony Markdown można przekazać do LLM w celu podsumowania, analizy sentymentu lub klasyfikacji, usprawniając badania i przetwarzanie danych.
  • Automatyzacja przeglądarki w czasie rzeczywistym
    Programiści mogą uruchamiać narzędzie w trybie widocznym (nie-headless) do debugowania, demonstracji lub gdy potrzebna jest wizualna weryfikacja działania przeglądarki.
  • Integracja z pipeline’ami orkiestracji LLM
    Jako serwer MCP, narzędzie może być używane jako komponent w orkiestratorach takich jak Windsurf, Claude, Cursor czy Cline, rozszerzając możliwości agentów AI w pracy z żywym internetem.

Jak skonfigurować

Windsurf

  1. Wymagania wstępne: Zainstaluj Node.js i npm.

  2. Konfiguracja środowiska: Utwórz plik .env lub ustaw wymagane zmienne środowiskowe, w tym OPENAI_API_KEY.

  3. Edytuj konfigurację: Znajdź plik konfiguracyjny Windsurf.

  4. Dodaj Puppeteer Vision MCP: Wstaw następujący fragment JSON:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Zapisz/Zrestartuj: Zapisz plik i zrestartuj Windsurf.

  6. Zweryfikuj: Sprawdź logi lub interfejs, aby potwierdzić działanie MCP servera.

Zabezpieczenie kluczy API:
Przechowuj sekrety w zmiennych środowiskowych (np. .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. Wymagania wstępne: Upewnij się, że Node.js i npm są zainstalowane.

  2. Ustaw środowisko: Przygotuj .env lub wyeksportuj OPENAI_API_KEY i inne zmienne.

  3. Edytuj konfigurację: Otwórz konfigurację MCP w Claude.

  4. Dodaj MCP Server:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. Zrestartuj Claude: Zastosuj zmiany i zrestartuj platformę.

  6. Zweryfikuj: Potwierdź poprawne uruchomienie.

Cursor

  1. Wymagania wstępne: Zainstaluj Node.js i npm.

  2. Środowisko: Skonfiguruj .env z kluczem API OpenAI.

  3. Edytuj konfigurację Cursor: Dodaj MCP server jak poniżej:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Zapisz i zrestartuj: Zapisz zmiany i zrestartuj Cursor.

  5. Sprawdź logi: Upewnij się, że serwer działa.

Cline

  1. Wymagania wstępne: Zainstaluj Node.js i npm.

  2. Środowisko: Ustaw lub wyeksportuj OPENAI_API_KEY.

  3. Konfiguracja: Dodaj do konfiguracji Cline MCP:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. Zrestartuj Cline: Zastosuj i zrestartuj.

  5. Potwierdź: Zweryfikuj dostępność serwera.

Uwaga: Zabezpieczaj klucze API przez zmienne środowiskowe i nigdy nie zapisuj sekretów na stałe w plikach konfiguracyjnych.

Jak używać MCP w flow

Użycie MCP w FlowHunt

Aby zintegrować serwery MCP w workflow FlowHunt, zacznij od dodania komponentu MCP do swojego flow i połącz go ze swoim agentem AI:

FlowHunt MCP flow

Kliknij na komponent MCP, aby otworzyć panel konfiguracji. W sekcji systemowej konfiguracji MCP, wstaw szczegóły swojego serwera MCP korzystając z tego formatu JSON:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

Po skonfigurowaniu, agent AI może korzystać z MCP jako narzędzia ze wszystkimi jego funkcjami i możliwościami. Pamiętaj, aby zamienić “puppeteer-vision” na prawdziwą nazwę swojego serwera MCP i podać własny adres URL serwera MCP.


Podsumowanie

SekcjaDostępnośćSzczegóły/Uwagi
PodsumowanieZawarte w README.
Lista promptówNie znaleziono szablonów promptów.
Lista zasobówBrak opisanych zasobów MCP.
Lista narzędziNarzędzie scrape-webpage opisane w README.
Zabezpieczenie kluczy APIInstrukcje dot. .env i zmiennych środowiskowych podane.
Sampling Support (mniej ważne w ocenie)Brak wzmianki o sampling supporcie.

| Roots Support | ⛔ | Brak wzmianki o Roots. |


Na podstawie powyższego, Puppeteer Vision MCP Server oferuje solidne, wyspecjalizowane narzędzie do web scrapingu z dobrą dokumentacją i wytycznymi bezpieczeństwa, lecz nie posiada wielu narzędzi, szablonów promptów, zasobów ani zaawansowanych funkcji MCP jak roots czy sampling. Jednofunkcyjne podejście zapewnia wysoką niezawodność w swoim zastosowaniu, ale ogranicza rozbudowę.

Nasza opinia

Ocena MCP: 5/10
Ten serwer MCP jest dobrze udokumentowany, przydatny do konkretnego celu i łatwy w konfiguracji, jednak brak szablonów promptów, jawnych zasobów oraz zaawansowanych funkcji MCP (roots, sampling) ogranicza jego wszechstronność i integrację z ekosystemem.

Ocena MCP

Posiada LICENSE
Posiada przynajmniej jedno narzędzie
Liczba Forków5
Liczba Gwiazdek12

Najczęściej zadawane pytania

Czym jest Puppeteer Vision MCP Server?

To serwer MCP, który pozwala agentom AI skanować i konwertować strony internetowe do Markdown, wykorzystując Puppeteer, Readability i Turndown. Może automatycznie wchodzić w interakcję i omijać typowe bariery sieciowe (jak CAPTCHA czy banery cookies), umożliwiając solidną ekstrakcję treści do workflow AI.

Jakie są główne zastosowania?

Automatyczny web scraping do pozyskiwania wiedzy, omijanie interaktywnych barier, podsumowywanie i analiza treści, automatyzacja przeglądarki w czasie rzeczywistym oraz łatwa integracja z pipeline’ami orkiestracji LLM.

Jak skonfigurować Puppeteer Vision MCP ze swoim orkiestratorem?

Skonfiguruj go w ustawieniach serwera MCP w swoim orkiestratorze, wskazując polecenie i zmienne środowiskowe (w tym swój klucz API OpenAI). Szczegółowe instrukcje znajdziesz powyżej dla Windsurf, Claude, Cursor i Cline.

Jak serwer radzi sobie z elementami interaktywnymi, takimi jak banery cookies czy paywalle?

Wykorzystuje automatyzację opartą na AI do interakcji, usuwania lub omijania elementów sieciowych, takich jak banery cookies, CAPTCHA czy paywalle, zapewniając ekstrakcję treści nawet z chronionych lub interaktywnych stron.

Czy mój klucz API jest bezpieczny?

Tak. Zawsze przechowuj klucze API w zmiennych środowiskowych lub plikach `.env`. Nigdy nie zapisuj sekretów na stałe w plikach konfiguracyjnych.

Jakie narzędzia oferuje ten serwer MCP?

Główne narzędzie to `scrape-webpage`, które skanuje wskazany adres URL, wchodzi w interakcję z elementami strony w razie potrzeby i zwraca główną treść jako Markdown.

Rozpocznij z Puppeteer Vision MCP

Wzmocnij swoje workflow AI zaawansowanym web scrapingiem i ekstrakcją treści. Skonfiguruj Puppeteer Vision MCP Server w kilka minut i zacznij pobierać dane z internetu do swoich procesów AI.

Dowiedz się więcej