وصف التدفق
الغرض والفوائد
يعمل هذا المسار على أتمتة عملية تحويل ملف sitemap.xml
الخاص بموقعك الإلكتروني إلى تنسيق llms.txt
منظم وصديق للذكاء الاصطناعي. تعتمد التدفق على وكلاء الذكاء الاصطناعي وأدوات الاسترجاع لتسهيل تجهيز محتوى موقعك لاستخدامه في نماذج اللغة الكبيرة (LLMs) وتطبيقات الذكاء الاصطناعي الأخرى. أدناه شرح تفصيلي للخطوات والمكونات.
1. تجربة المستخدم ونقطة البداية
2. معالجة إدخال المستخدم
- عنصر إدخال الدردشة
يقوم المستخدم بلصق رابط ملف sitemap.xml
في واجهة الدردشة. - تشغيل سير العمل
يتم تمرير رابط الإدخال تلقائياً إلى الخطوة التالية للمعالجة.
3. جلب ومعالجة روابط خريطة الموقع
4. الإثراء بالمعرفة الخارجية
أداة بحث جوجل
يتم تزويد وكيل الذكاء الاصطناعي بأداة بحث جوجل، مما يتيح له:
- البحث عن سياق إضافي أو مستندات ذات صلة عند الحاجة.
- تحديد عدد النتائج (افتراضياً: 3)، وتخصيص الدولة/اللغة.
- استخدام النتائج المخزنة لتحسين الكفاءة.
جالب روابط ثانوي
يمكن تكوين أداة جلب إضافية لاسترجاع المحتوى من الروابط التي تم العثور عليها عبر بحث جوجل، مما يعزز قاعدة معرفة وكيل الذكاء الاصطناعي عند الحاجة.
5. وكيل الذكاء الاصطناعي لتحويل المحتوى
- عنصر وكيل الذكاء الاصطناعي
جوهر المسار هو وكيل ذكاء اصطناعي مُعد بما يلي:- الهدف:
تحويل محتوى sitemap.xml
إلى ملف llms.txt
منظم وفق المثال المقدم. - الخلفية والدور:
يُقدَّم الوكيل كخبير في إنشاء ملفات llms.txt
. - الأدوات:
يستخدم أدوات بحث جوجل وجالب الروابط للوصول إلى محتوى الموقع والويب. - آلية العمل:
يقوم الوكيل بـ:- قراءة كامل محتوى الصفحات المسترجعة.
- تحديد العنوان والبنية.
- تحديد الصفحات الأكثر أهمية ووضعها أولاً.
- وضع الصفحات الأقل أهمية (مثل التصنيفات، العلامات) في النهاية.
- اتباع تنسيق صارم لضمان تطابق المخرجات مع متطلبات
llms.txt
لتغذية نماذج اللغة الكبيرة.
6. الإخراج وتغذية المستخدم
- عنصر إخراج الدردشة
يتم عرض مخرجات وكيل الذكاء الاصطناعي (محتوى ملف llms.txt
) للمستخدم في الدردشة، جاهز للاستخدام في تدريب الذكاء الاصطناعي أو تغذيته.
هيكلية سير العمل (نظرة عامة على العملية)
الخطوة | المكون | الغرض |
---|
1 | مشغل فتح الدردشة | عرض رسالة ترحيب/إرشاد |
2 | أداة الرسائل | إرشاد المستخدم لإدخال رابط sitemap.xml |
3 | إدخال الدردشة | استقبال رابط sitemap.xml المقدم من المستخدم |
4 | جالب الروابط | جلب وتحليل الروابط/المحتوى من خريطة الموقع |
5 | أداة بحث جوجل | (اختياري) البحث عن سياق إضافي للصفحات |
6 | جالب الروابط (جوجل) | (اختياري) جلب محتوى من الروابط التي عُثر عليها عبر بحث جوجل |
7 | وكيل الذكاء الاصطناعي | تحويل جميع بيانات الصفحات إلى تنسيق llms.txt |
8 | إخراج الدردشة | عرض ملف llms.txt المنسق للمستخدم |
لماذا هذا المسار مفيد؟
القابلية للتوسع:
يتيح أتمتة عملية يدوية تستغرق وقتاً طويلاً، ويمكنك من تحويل أي خريطة موقع إلى تنسيق مناسب لنماذج اللغة الكبيرة دون خبرة تقنية.
الجودة والاتساق:
يضمن أن المخرجات تتبع تنسيقاً صارماً، مما يحسن جودة بيانات تدريب الذكاء الاصطناعي.
قابلية التوسعة:
يمكن تخصيصه ليشمل مصادر معرفة إضافية أو لتطبيق منطق استخراج أكثر تقدماً.
الكفاءة:
يدمج التخزين المؤقت وحدود الرموز لمعالجة حتى المواقع الكبيرة بسرعة وموثوقية.
قرارات تعتمد على الذكاء الاصطناعي:
يمكن للوكيل إعطاء الأولوية للصفحات الهامة وهيكلة الإخراج بذكاء—وهو ما قد يكون مملاً أو عرضة للأخطاء إذا تم يدوياً.
أمثلة لحالات الاستخدام
- تجهيز موقعك بالكامل كوثيقة واحدة منظمة لتغذية الذكاء الاصطناعي.
- أتمتة تنسيق المحتوى لقواعد المعرفة أو أنظمة التوثيق.
- توسيع إنشاء مجموعات البيانات لتخصيص النماذج اللغوية بمحتوى مواقع متخصصة.
يجعل هذا المسار عملية تحويل خرائط مواقع الويب إلى ملفات نصية محسّنة للذكاء الاصطناعي سهلة وسريعة وموثوقة، ويوفر عليك ساعات من العمل اليدوي ويضمن حصول نماذج الذكاء الاصطناعي على مدخلات منظمة وعالية الجودة.