
Playwright MCPサーバー
Playwright MCPサーバーは、AIエージェントや開発者に高度なブラウザ自動化とAPI連携を提供し、Claude Desktop、Cline、Cursor IDEなどの開発環境とシームレスに統合できます。...
Puppeteer Vision MCP サーバーを使えば、対話的または保護されたサイトでも、堅牢な AI 搭載ウェブスクレイピングと Markdown 変換を自動化できます。
Puppeteer Vision MCP サーバーは、Puppeteer、Readability、Turndown を利用し、AI アシスタントによるウェブページのスクレイピングと Markdown 形式への変換を実現します。Cookie バナーや CAPTCHA、ペイウォールなどのウェブ要素も自動で処理できる高度な AI 駆動のインタラクションにより、対話的または保護されたサイトからも堅牢にコンテンツを抽出します。この機能は Model Context Protocol (MCP) を通じて提供され、AI 開発ワークフローへの統合も容易です。自動ウェブスクレイピング、コンテンツ要約、データ取り込みなどのタスクを LLM がシームレスに実行できます。サーバーは npx
ですぐにデプロイでき、最小限の設定で、stdio と SSE 通信の両方をサポートし柔軟な統合が可能です。
リポジトリやドキュメントにプロンプトテンプレートは記載されていません。
リポジトリやドキュメントに明記された MCP リソースはありません。
url
(string, 必須): スクレイピングするウェブページの URL。autoInteract
(boolean, オプション, デフォルト: true): インタラクティブ要素を自動処理するか。maxInteractionAttempts
(number, オプション, デフォルト: 3): AI の最大インタラクション試行回数。waitForNetworkIdle
(boolean, オプション, デフォルト: true): スクレイピング前にネットワークアイドル状態を待つか。前提条件: Node.js と npm をインストールします。
環境設定: .env
ファイルを作成するか、OPENAI_API_KEY
など必要な環境変数をエクスポートします。
設定ファイルの編集: Windsurf の設定ファイルを探します。
Puppeteer Vision MCP を追加: 以下の JSON スニペットを挿入します:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
保存・再起動: ファイルを保存し、Windsurf を再起動します。
確認: ログや UI で MCP サーバーが起動していることを確認します。
API キーのセキュリティ:
機密情報は環境変数(例: .env
)で管理してください。
"env": {
"OPENAI_API_KEY": "${OPENAI_API_KEY}"
}
前提条件: Node.js と npm がインストールされていることを確認します。
環境設定: .env
を用意するか OPENAI_API_KEY
などをエクスポートします。
設定ファイルの編集: Claude の MCP 設定を開きます。
MCP サーバーを追加:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Claude を再起動: 変更を適用し、プラットフォームを再起動します。
確認: 正常な起動を確認します。
前提条件: Node.js と npm をインストールします。
環境設定: OpenAI API キーで .env
をセットアップします。
Cursor 設定の編集: MCP サーバーを以下のように追加します:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
保存・再起動: 変更を保存し、Cursor を再起動します。
ログ確認: サーバーが稼働していることを確認します。
前提条件: Node.js と npm をインストールします。
環境設定: OPENAI_API_KEY
をエクスポートまたは設定します。
設定: Cline の MCP 設定に以下を追加します:
{
"mcpServers": {
"web-scraper": {
"command": "npx",
"args": ["-y", "puppeteer-vision-mcp-server"],
"env": {
"OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
}
}
}
}
Cline を再起動: 反映させて再起動します。
確認: サーバーが利用可能か検証します。
注意: API キーは環境変数で安全に管理し、設定ファイルに直接記載しないでください。
FlowHunt で MCP を利用する
FlowHunt ワークフローに MCP サーバーを統合するには、まず MCP コンポーネントをフローに追加し、AI エージェントに接続します。
MCP コンポーネントをクリックして設定パネルを開きます。システム MCP 設定欄に、以下の JSON 形式で MCP サーバー情報を入力します:
{
"puppeteer-vision": {
"transport": "streamable_http",
"url": "https://yourmcpserver.example/pathtothemcp/url"
}
}
設定が完了すると、AI エージェントはこの MCP をツールとして使い、その全機能にアクセスできるようになります。“puppeteer-vision” の部分は実際の MCP サーバー名に、URL もご自身の MCP サーバー URL に置き換えてください。
セクション | 有無 | 詳細・備考 |
---|---|---|
概要 | ✅ | README に記載あり |
プロンプト一覧 | ⛔ | プロンプトテンプレートなし |
リソース一覧 | ⛔ | 明示的な MCP リソース記載なし |
ツール一覧 | ✅ | scrape-webpage ツール、README で詳細解説 |
API キーのセキュリティ | ✅ | .env や環境変数による管理手順あり |
サンプリングサポート(評価上は重要度低) | ⛔ | サンプリングサポート記載なし |
| Roots サポート | ⛔ | Roots の記載なし |
上記より、Puppeteer Vision MCP サーバーは堅牢で特化したウェブスクレイピングツールとして強力なドキュメントとセキュリティガイダンスを持ちますが、複数のツールやプロンプトテンプレート、リソース、Roots やサンプリングといった高度な MCP 機能は不足しています。ワンツール・ワンパーパスの設計により用途には高い信頼性を発揮しますが、拡張性には限りがあります。
MCP スコア: 5/10
この MCP サーバーはドキュメントが充実しており、特定用途には有用でセットアップも容易ですが、プロンプトテンプレートや明示的なリソース、高度な MCP 機能(roots、sampling)がないため汎用性やエコシステム統合性は限定的です。
ライセンスあり | ⛔ |
---|---|
ツールが最低1つある | ✅ |
フォーク数 | 5 |
スター数 | 12 |
これは、AI エージェントが Puppeteer、Readability、Turndown を利用してウェブページをスクレイピングし、Markdown へ変換できる MCP サーバーです。自動で Cookie バナーや CAPTCHA などの一般的なウェブ障壁を突破し、AI ワークフローへのコンテンツ抽出を実現します。
知識取り込みのための自動ウェブスクレイピング、対話的障壁の突破、要約やコンテンツ分析、リアルタイムのブラウザオートメーション、LLM オーケストレーションパイプラインへのシームレスな統合です。
オーケストレーターの MCP サーバー設定にコマンドと環境変数(OpenAI API キー含む)を指定してください。Windsurf、Claude、Cursor、Cline 用の詳細な手順は上記に記載しています。
AI 駆動の自動化で、Cookie バナーや CAPTCHA、ペイウォールなどのウェブ要素に対話・却下・回避し、保護されたり対話的なサイトからも確実にコンテンツを抽出します。
はい。API キーは必ず環境変数や `.env` ファイルで管理しましょう。設定ファイルに直接記述してはいけません。
主なツールは `scrape-webpage` で、指定した URL のウェブページをスクレイピングし、必要に応じてウェブ要素と対話し、主要コンテンツを Markdown として出力します。
Playwright MCPサーバーは、AIエージェントや開発者に高度なブラウザ自動化とAPI連携を提供し、Claude Desktop、Cline、Cursor IDEなどの開発環境とシームレスに統合できます。...
ScrAPI MCPサーバーは、AIアシスタントがキャプチャやボット検知、ジオフェンシングで保護されたサイトからもライブWebコンテンツを抽出できるようにします。ScrAPIサービスへの橋渡しとなり、リアルタイムなデータ強化やリサーチ自動化のために、HTMLやMarkdownの自動スクレイピングを実現します。...
mcp-google-search MCPサーバーは、AIアシスタントとウェブをつなぎ、Googleカスタム検索APIを利用したリアルタイム検索およびコンテンツ抽出を可能にします。大規模言語モデルがオンラインソースから最新情報へ直接アクセスし、検証や要約を行えるようにします。...