خادم Puppeteer Vision MCP

خادم Puppeteer Vision MCP

أتمتة قوية لاستخلاص الويب مدعومة بالذكاء الاصطناعي وتحويلها إلى Markdown — حتى في المواقع التفاعلية أو المحمية — باستخدام خادم Puppeteer Vision MCP.

ماذا يفعل خادم “Puppeteer Vision” MCP؟

يتيح خادم Puppeteer Vision MCP للمساعدين الذكيين استخراج وتحويل صفحات الويب إلى صيغة Markdown باستخدام Puppeteer وReadability وTurndown. فهو يوفر تفاعلاً متقدماً قائماً على الذكاء الاصطناعي للتعامل تلقائياً مع عناصر الويب مثل أشرطة ملفات تعريف الارتباط وCAPTCHAs وجدران الدفع وغيرها، ما يضمن استخراج محتوى قوي حتى من المواقع التفاعلية أو المحمية. يوفّر الخادم هذه الإمكانية عبر بروتوكول Model Context Protocol (MCP)، مما يجعل دمجه في سير عمل تطوير الذكاء الاصطناعي أمراً سهلاً. يتيح ذلك تنفيذ مهام مثل استخلاص الويب التلقائي، تلخيص المحتوى، وادخال البيانات بسلاسة بواسطة LLMs. يمكن نشر الخادم بسهولة باستخدام npx، ويتطلب إعداداً بسيطاً، ويدعم كلاً من الاتصال عبر stdio وSSE لمرونة الدمج.

قائمة القوالب (Prompts)

لا توجد قوالب تعليمات مذكورة في المستودع أو الوثائق.

قائمة الموارد

لا توجد موارد MCP محددة أو موصوفة في المستودع أو الوثائق.

قائمة الأدوات

  • scrape-webpage: يستخلص صفحة ويب عند عنوان URL محدد، باستخدام الذكاء الاصطناعي للتفاعل مع وتجاوز العناصر التفاعلية (مثل أشرطة ملفات تعريف الارتباط أو CAPTCHAs)، ويستخرج المحتوى الرئيسي باستخدام Readability، ثم يحوله إلى Markdown. المعاملات تشمل:
    • url (نص، مطلوب): صفحة الويب المراد استخلاصها.
    • autoInteract (قيمة منطقية، اختياري، الافتراضي: true): هل يتم التعامل تلقائياً مع العناصر التفاعلية.
    • maxInteractionAttempts (عدد، اختياري، الافتراضي: 3): أقصى عدد لمحاولات التفاعل بالذكاء الاصطناعي.
    • waitForNetworkIdle (قيمة منطقية، اختياري، الافتراضي: true): الانتظار حتى هدوء الشبكة قبل الاستخلاص.

حالات استخدام هذا الخادم MCP

  • استخلاص ويب تلقائي لإدخال المعرفة
    يمكن للمطورين استخراج Markdown مقروء ومنسق جيداً من صفحات الويب المختلفة، مما يسهل إدخال محتوى حديث إلى سير عمل الذكاء الاصطناعي أو قواعد البيانات أو قواعد المعرفة.
  • تجاوز الحواجز التفاعلية
    يمكن للتفاعل القائم على الذكاء الاصطناعي تجاوز CAPTCHAs وأشرطة ملفات تعريف الارتباط وغيرها من العوائق التفاعلية تلقائياً، ما يتيح استخراج المحتوى بسهولة من المواقع التي عادةً ما تمنع الأتمتة.
  • تلخيص وتحليل المحتوى
    يمكن تغذية Markdown المستخرج إلى LLMs لأغراض التلخيص أو تحليل المشاعر أو التصنيف، مما يسرّع البحث ومعالجة البيانات.
  • أتمتة المتصفح في الوقت الحقيقي
    يمكن للمطورين تشغيل الأداة في وضع مرئي (غير headless) لأغراض التصحيح أو العرض أو عند الحاجة لرؤية تفاعل المتصفح مباشرة.
  • الاندماج في خطوط تشغيل LLM
    كخادم MCP، يمكن استخدامه كمكون ضمن منسقات مثل Windsurf وClaude وCursor وCline، ما يوسع من قدرات وكلاء الذكاء الاصطناعي في التفاعل مع الويب الحي.

كيفية إعداده

Windsurf

  1. المتطلبات الأساسية: تثبيت Node.js وnpm.

  2. إعداد البيئة: أنشئ ملف .env أو صدّر متغيرات البيئة المطلوبة، بما في ذلك OPENAI_API_KEY.

  3. تعديل الإعدادات: ابحث عن ملف إعدادات Windsurf.

  4. إضافة Puppeteer Vision MCP: أضف المقطع JSON التالي:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. حفظ/إعادة تشغيل: احفظ الملف وأعد تشغيل Windsurf.

  6. التحقق: تحقق من السجلات أو الواجهة للتأكد من تشغيل خادم MCP.

تأمين مفاتيح API:
خزّن الأسرار في متغيرات البيئة (مثل .env):

"env": {
  "OPENAI_API_KEY": "${OPENAI_API_KEY}"
}

Claude

  1. المتطلبات الأساسية: تأكد من تثبيت Node.js وnpm.

  2. إعداد البيئة: جهّز ملف .env أو صدّر OPENAI_API_KEY والمتغيرات الأخرى.

  3. تعديل الإعدادات: افتح إعدادات Claude MCP.

  4. إضافة خادم MCP:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  5. إعادة تشغيل Claude: طبق التغييرات وأعد تشغيل المنصة.

  6. التحقق: تأكد من بدء التشغيل بنجاح.

Cursor

  1. المتطلبات الأساسية: تثبيت Node.js وnpm.

  2. إعداد البيئة: جهز ملف .env بمفتاح OpenAI API الخاص بك.

  3. تعديل إعدادات Cursor: أضف خادم MCP كما يلي:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. حفظ وإعادة تشغيل: احفظ التغييرات وأعد تشغيل Cursor.

  5. فحص السجلات: تأكد من تشغيل الخادم.

Cline

  1. المتطلبات الأساسية: تثبيت Node.js وnpm.

  2. إعداد البيئة: عيّن أو صدّر OPENAI_API_KEY.

  3. تعديل الإعدادات: أضف إلى إعدادات Cline MCP:

    {
      "mcpServers": {
        "web-scraper": {
          "command": "npx",
          "args": ["-y", "puppeteer-vision-mcp-server"],
          "env": {
            "OPENAI_API_KEY": "YOUR_OPENAI_API_KEY_HERE"
          }
        }
      }
    }
    
  4. إعادة تشغيل Cline: طبق وأعد التشغيل.

  5. التحقق: تحقق من أن الخادم متاح.

ملاحظة: قم بتأمين مفاتيح API عبر متغيرات البيئة ولا تدرج الأسرار مباشرة في ملفات الإعدادات.

كيفية استخدام هذا MCP داخل التدفقات

استخدام MCP في FlowHunt

لدمج خوادم MCP في سير عمل FlowHunt الخاص بك، ابدأ بإضافة مكون MCP إلى التدفق وربطه بوكيل الذكاء الاصطناعي:

تدفق FlowHunt MCP

انقر على مكون MCP لفتح لوحة الإعدادات. في قسم إعداد MCP للنظام، أدخل تفاصيل خادم MCP الخاص بك باستخدام هذا الشكل من JSON:

{
  "puppeteer-vision": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

بعد الإعداد، يصبح وكيل الذكاء الاصطناعي قادراً على استخدام هذا MCP كأداة مع إمكانية الوصول إلى جميع وظائفه وقدراته. تذكّر تغيير “puppeteer-vision” إلى الاسم الفعلي لخادم MCP الخاص بك واستبدال عنوان URL بعنوان خادم MCP الخاص بك.


نظرة عامة

القسمالتوفرالتفاصيل/ملاحظات
نظرة عامةمذكور في ملف README.
قائمة القوالبلا توجد قوالب تعليمات.
قائمة المواردلا توجد موارد MCP واضحة موصوفة.
قائمة الأدواتأداة scrape-webpage، مذكورة في README.
تأمين مفاتيح APIتعليمات حول .env ومتغيرات البيئة متوفرة.
دعم العينات (أقل أهمية في التقييم)لا يوجد ذكر لدعم العينات.

| دعم Roots | ⛔ | لا يوجد ذكر لـ Roots. |


استناداً إلى ما سبق، يوفر خادم Puppeteer Vision MCP أداة قوية ومركزة لاستخلاص الويب مع توثيق وإرشادات أمان جيدة، إلا أنه يفتقر إلى تعدد الأدوات، وقوالب التعليمات، والموارد، وميزات MCP المتقدمة مثل roots أو العينات. تصميمه الموجه لأداة واحدة يوفر له موثوقية عالية في استخدامه المحدد، لكنه يحد من قابلية التوسعة.

رأينا

درجة MCP: 5/10
هذا الخادم MCP موثق جيداً، ومفيد لغرضه المحدد، وسهل الإعداد، لكن افتقاره لقوالب التعليمات، والموارد الصريحة، وميزات MCP المتقدمة (roots، العينات) يحد من تنوعه واندماجه في النظام البيئي.

درجة MCP

لديه رخصة LICENSE
يحتوي على أداة واحدة على الأقل
عدد الفروع Forks5
عدد النجوم Stars12

الأسئلة الشائعة

ما هو خادم Puppeteer Vision MCP؟

هو خادم MCP يتيح للوكلاء الذكيين استخلاص وتحويل صفحات الويب إلى Markdown باستخدام Puppeteer وReadability وTurndown. يمكنه التفاعل تلقائياً مع الحواجز الشائعة في الويب (مثل CAPTCHAs وأشرطة ملفات تعريف الارتباط)، مما يتيح استخراج محتوى قوي لإدخاله في سير عمل الذكاء الاصطناعي.

ما هي الاستخدامات الرئيسية؟

الاستخلاص التلقائي للويب لإدخال المعرفة، تجاوز الحواجز التفاعلية، التلخيص وتحليل المحتوى، أتمتة المتصفح في الوقت الحقيقي، والاندماج السلس ضمن خطوط تشغيل LLM.

كيف أعد Puppeteer Vision MCP مع المنسق الخاص بي؟

قم بإعداده في إعدادات خادم MCP في المنسق الخاص بك، وحدد الأمر ومتغيرات البيئة (بما في ذلك مفتاح OpenAI API الخاص بك). تجد تعليمات مفصلة لـ Windsurf وClaude وCursor وCline أعلاه.

كيف يتعامل الخادم مع العناصر التفاعلية مثل أشرطة ملفات تعريف الارتباط أو جدران الدفع؟

يستخدم أتمتة مدعومة بالذكاء الاصطناعي للتفاعل مع عناصر الويب مثل أشرطة ملفات تعريف الارتباط وCAPTCHAs وجدران الدفع، مما يضمن استخراج المحتوى حتى من المواقع المحمية أو التفاعلية.

هل مفتاح API الخاص بي آمن؟

نعم. احرص دائماً على تخزين مفاتيح API في متغيرات البيئة أو ملفات `.env`. لا تقم أبداً بإدراج الأسرار بشكل مباشر في ملفات الإعدادات.

ما هي الأدوات التي يوفرها هذا الخادم MCP؟

الأداة الرئيسية هي `scrape-webpage`، التي تستخلص عنوان URL محدد، وتتفاعل مع عناصر الويب عند الحاجة، وتخرج المحتوى الرئيسي بصيغة Markdown.

ابدأ مع خادم Puppeteer Vision MCP

عزز سير عمل الذكاء الاصطناعي لديك بقدرات متقدمة لاستخلاص الويب واستخراج المحتوى. قم بإعداد خادم Puppeteer Vision MCP في دقائق وابدأ في إدخال الإنترنت الحي إلى قنوات الذكاء الاصطناعي الخاصة بك.

اعرف المزيد

خادم ScrAPI MCP
خادم ScrAPI MCP

خادم ScrAPI MCP

يُمكّن خادم ScrAPI MCP المساعدين الذكاء الاصطناعي من استخراج محتوى الويب المباشر — حتى من المواقع المحمية بكابتشا أو اكتشاف الروبوتات أو القيود الجغرافية. من خل...

4 دقيقة قراءة
MCP Server Web Scraping +6
خادم mcp-rquest MCP
خادم mcp-rquest MCP

خادم mcp-rquest MCP

يمنح خادم mcp-rquest MCP مساعدي الذكاء الاصطناعي إمكانيات متقدمة لطلبات HTTP تشبه المتصفح، وتخطي قوي لأنظمة مكافحة الروبوتات، وتحويل المستندات إلى Markdown. مدع...

4 دقيقة قراءة
MCP Server HTTP +5
خادم OpenAI WebSearch MCP
خادم OpenAI WebSearch MCP

خادم OpenAI WebSearch MCP

مكّن مساعديك الذكيين من الوصول إلى بيانات البحث على الويب في الوقت الفعلي مع خادم OpenAI WebSearch MCP. يتيح هذا التكامل لمنصات مثل FlowHunt وغيرها تقديم إجابات...

4 دقيقة قراءة
AI Web Search +4