
مسترجع المستندات
يعزز مسترجع المستندات من FlowHunt دقة الذكاء الاصطناعي من خلال ربط النماذج التوليدية بمستنداتك وروابطك الخاصة المحدثة، مما يضمن الحصول على إجابات موثوقة وذات صل...
تعرف على كيفية ضبط معلمات ‘من H1 إذا وجدت’ و’التحميل من مؤشر’ و’تخطي آخر عنوان’.
يتيح لك مكون مستخرج المستندات للروبوت الذكي استرجاع المعرفة من المصادر التي حددتها في المستندات والجداول الزمنية. تتمثل وظيفة هذا المكون في التحكم في عملية الاسترجاع، وهناك عدة معلمات تؤثر على كيفية استخراج المعلومات من تلك المستندات.
يخبر خيار من H1 إذا وجدت المستخرج ببدء استخراج المحتوى من أول عنوان H1 يجده (غالباً ما يكون العنوان الرئيسي للمقالة).
ماذا يحدث؟
مثال استخدام:
ترغب في استخراج الدليل الفعلي فقط، دون أي عناصر تنقل للموقع أو رؤوس صفحات قد تكون موجودة على موقعك.
ملاحظة:
يتم تفعيل خيار من H1 إذا وجدت في مكون مستخرج المستندات بشكل افتراضي.
يمنحك خيار التحميل من مؤشر دقة أكبر من خلال السماح لمستخرج المستندات بتحميل البيانات فقط من مؤشر معين في المقالة الطويلة.
ماذا يحدث؟
ما هو “المؤشر”؟
المؤشر عادةً ما يكون سلسلة فريدة أو عنوان موجود في المستند (مثل H2 أو عبارة أو عنوان قسم محدد).
مثال استخدام:
تريد تخطي الأقسام التمهيدية واستخراج المعلومات لقسم معين ذي صلة في مقال أو مستند طويل (مثلاً من “الخطوة 4: إضافة زر محادثة مباشرة” في دليل إعداد).
يعد خيار تخطي آخر عنوان مفيداً لتجاهل آخر عنوان في المستند، والذي غالباً ما يكون متكرراً أو يُستخدم لأغراض التنقل أو التذييل.
ماذا يحدث؟
مثال استخدام:
ترغب في منع مستخرج المستندات من تحميل عنوان تذييل (مثل “مقالات أخرى” في نهاية صفحة المساعدة)، لضمان معالجة المحتوى الرئيسي فقط.
ملاحظة:
يمكن أن يساعد خيار تخطي آخر عنوان مع المستندات التي تولد تذييلات تلقائية أو عناصر تنقل متكررة. ومع ذلك، إذا لم يكن لديك مثل هذه الأقسام، فقد يؤدي استخدام هذا الخيار إلى عدم استخراج جزء من المقالة يحتوي على معلومات مهمة. لذا، يُنصح بترك هذا الخيار غير مفعل حتى يكون هناك سبب حقيقي لتفعيله.
تتيح لك معلمة الحد الأقصى للرموز التحكم في أقصى عدد من الرموز (الكلمات وعلامات الترقيم كما يحسبها نموذج الذكاء الاصطناعي) التي سيخرجها مستخرج المستندات من النص المستخرج.
ماذا يحدث؟
القيمة الافتراضية:
القيمة الافتراضية عادةً 3000 رمز، ولكن يمكنك تعديلها إذا لزم الأمر.
مثال استخدام:
إذا كنت تعالج مستندات طويلة، فإن تعيين قيمة أقل للحد الأقصى للرموز يساعد في جعل الردود مختصرة. ومع ذلك، للحصول على أفضل النتائج، يُنصح بتفعيل خيار “التحميل من مؤشر”. هذا يضمن أن يبدأ النص المستخرج من القسم الأكثر صلة في المستند وليس من البداية، مما يسمح لك بالحصول على جزء مركز وقابل للإدارة من المعلومات ضمن الحد الذي حددته من الرموز. هذا الجمع مفيد بشكل خاص عندما ترغب في مخرجات مختصرة وذات صلة سياقياً من مصادر كبيرة.
ملاحظة:
إذا وجدت أن المعلومات يتم اقتطاعها، جرب زيادة قيمة الحد الأقصى للرموز. وعلى العكس، إذا رغبت في مخرجات أقصر وأكثر تركيزاً، قلل قيمة هذه المعلمة.
عندما يجد مستخرج المستندات عدة مستندات ذات صلة، تحدد معلمة الاستراتيجية كيفية دمجها في ناتج نصي واحد للروبوت الذكي، مع الأخذ في الاعتبار حد “الحد الأقصى للرموز”.
خياران للاستراتيجية:
تضمين حجم متساوٍ من كل مستند:
يتم تقسيم الحد من الرموز بالتساوي. على سبيل المثال، مع ثلاثة مستندات وحد 3,000 رمز، يحصل كل واحد على 1,000 رمز كحد أقصى. يضمن ذلك أن تساهم جميع المصادر بشكل متساوٍ، وهو مفيد عندما ترغب في إجابة متوازنة تستند إلى عدة مستندات.
دمج المستندات، والتعبئة من الأول حتى حد الرموز:
تُضاف المستندات حسب الأهمية حتى بلوغ حد الرموز. يملأ المستند الأكثر صلة المساحة أولاً؛ وإذا بقي هناك مجال، تتم إضافة المستندات الأقل صلة حسب الترتيب. إذا كان المستند الأول طويلاً، فقد يستهلك كامل الحد بنفسه.
كيف تختار؟
ملاحظة:
تؤثر هذه الاستراتيجيات فقط على كيفية بناء النص من المستندات المستخرجة قبل تمريره إلى الخطوة التالية (مثل توليد النص بالذكاء الاصطناعي). ولا تغير أي من هذه الخيارات المستندات التي يتم استرجاعها – بل فقط كيفية دمج محتواها واقتطاعه ليتناسب مع إعداد الحد الأقصى للرموز.
بينما يركز هذا المقال على إعداد معلمات ‘من H1 إذا وجدت’ و’التحميل من مؤشر’ و’تخطي آخر عنوان’ و’الحد الأقصى للرموز’، يوفر مستخرج المستندات أيضاً معلمات إضافية تساعد في التحكم بكيفية اختيار المستندات واسترجاعها:
يحدد هذا الإعداد الحد الأقصى لعدد المستندات التي يجب على النظام استرجاعها، لضمان بقاء النتائج ذات صلة وسرعة توليد الردود.
يتيح لك هذا الخيار الاختياري قصر الاسترجاع على فئة واحدة أو أكثر قمت بإنشائها في قسم المستندات ضمن مصادر المعرفة.
يتيح لك تضمين أو إخفاء قسم منفصل، قبل إجابة الروبوت الفعلية، يحتوي على قائمة بالموارد التي استرجعها المستخرج. عند التكامل مع LiveAgent، يجب تفعيل هذا الخيار، لأن هذا القسم غير مدعوم ولن يُعرض بشكل صحيح في ودجة روبوت LiveAgent.
يتيح لك تقييد الاسترجاع على جدول زمني واحد أو أكثر قمت بتحديدها للزحف أو تحديث المحتوى في مصادر المعرفة.
تتحكم في مدى تطابق المستندات المستخرجة مع استفسارك، باستخدام درجة الصلة (من 0 إلى 1). على سبيل المثال، يوصى بعتبة 0.7–0.8 للحصول على إجابات عالية الصلة. تعطي العتبات الأعلى تطابقات أكثر دقة، بينما قد تتضمن العتبات الأقل مستندات أقل صلة.
مثال:
إذا قمت بتعيين العتبة إلى 0.6 ولديك أربعة مقالات بدرجات صلة 0.8 و0.65 و0.5 و0.9، فسيتم استخدام فقط تلك التي تزيد عن 0.6 (أي 0.8 و0.65 و0.9) للاستخراج.
إذا لم تتضمن إجابة الروبوت الذكي معلومات تعرف أنها متوفرة في مستنداتك أو جداولك الزمنية، جرب مراجعة سجل المحادثة باستخدام خيار “مفصل” (Verbose) لرؤية سجلات تفصيلية حول ما إذا تم استخدام مستخرج المستندات وما هي المستندات التي تم استرجاعها. إذا لزم الأمر، قم بتعديل إعداداتك والتعليمات بناءً على هذه السجلات.
يعزز مسترجع المستندات من FlowHunt دقة الذكاء الاصطناعي من خلال ربط النماذج التوليدية بمستنداتك وروابطك الخاصة المحدثة، مما يضمن الحصول على إجابات موثوقة وذات صل...
افتح محتوى الويب في سير عملك مع مكون مستخرج الروابط. استخرج النص والبيانات الوصفية من أي قائمة روابط بسهولة—بما في ذلك مقالات الويب، المستندات، والمزيد. يدعم خي...
اكتشف قوة سير العمل لديك مع مكون بحث الذاكرة—استرجع المعلومات ذات الصلة من الذاكرة المخزنة باستخدام استفسارات المستخدم. ابحث، وصفِّ، واستخرج المستندات أو مقتطفا...