مهما بلغت قوة الذكاء الاصطناعي، يبقى في النهاية مجرد آلة تنقل المعلومات التي يتعلمها. فهو لا يفهم النكات أو الافتراضات أو السخرية، والتي غالبًا ما تكون سببًا في أكثر الإجابات فكاهة أو أحيانًا ضارة بشكل جدي. لضمان ألا يتسبب روبوت الدردشة الخاص بك في فضيحة جديدة للذكاء الاصطناعي ولمساعدته على فهم محتواك بشكل أفضل، يمكنك أن تدله على المحتوى الذي يجب عليه تخطيه.
الطريقة لضمان موثوقية الذكاء الاصطناعي هي بمراقبة المعلومات التي يتعلم منها. ليس كل المحتوى الخاص بك مناسبًا ليستخدمه روبوت الدردشة. تتيح لك فئة flowhunt-skip تمييز المحتوى الذي لا يجب على FlowHunt فهرسته. سيتم تجاهل أي عنصر HTML يحمل هذه الفئة أثناء معالجة المحتوى.
متى يجب استخدام معامل التخطي
هناك سببان رئيسيان لاستخدام هذه الفئة، ولكن يمكنك استخدامها مع أي محتوى تجده غير ضروري أو غير مناسب لاستخدام الروبوت.
تخطي المحتوى المتكرر: إذا استمر فهرسة محتوى متشابه، سيصعب على الذكاء الاصطناعي التمييز وتصنيف موضوع المحتوى. كما أن تخطي المعلومات المكررة يوفر لك المال على معالجة النصوص على المدى الطويل.
تخطي المعلومات الخطرة أو غير المناسبة: يجب عليك تخطي أي معلومات قد تتسبب في إعطاء الذكاء الاصطناعي إجابات خاطئة أو ضارة أو خارج السياق. كن حذرًا بشكل خاص إذا كان أسلوب علامتك التجارية يتضمن النكات أو اللغة القوية. رغم أنها رائعة لمحتوى آخر، إلا أن المستخدمين قد لا يقدرون روبوتًا ساخرًا.
كيفية استخدام معامل flowhunt-skip
يقوم FlowHunt بالزحف وفهرسة موقعك الإلكتروني لتوفير السياق لروبوت الدردشة. يمكن أن يستخدم روبوت الدردشة أي شيء يفهرسه FlowHunt في أي وقت.
يتيح لك إضافة فئة flowhunt-skip إلى عناصر HTML تمييز المحتوى الذي لا تريد فهرسته. سيتم تجاهل أي عنصر يحمل هذه الفئة ولن يصل أبدًا إلى روبوت الدردشة.
إليك مثال على استخدام الفئة:
<div class="flowhunt-skip">
<h2>محتوى مكرر</h2>
<p>هذا المحتوى مكرر. لا أريد أن يقوم FlowHunt بفهرسته مرة أخرى.</p>
</div>
يمكنك أيضًا تخطي فقرة واحدة أو جزء من عنصر واحد فقط:
<div>
<h2>محتواي</h2>
<p>يجب فهرسة هذه الفقرة.</p>
<p class="flowhunt-skip">لا أريد أن يستخدم روبوت الدردشة هذه المعلومات.</p>
<p>يجب فهرسة هذه الفقرة.</p>
</div>
كيف تتم عملية الفهرسة
تعمل عملية الزحف في الخلفية بناءً على الجداول الزمنية التي تحددها. تقوم فقط بتنزيل صفحة HTML. يتم تخزين أي صور أو وسائط كروابط فقط. يتم اتباع أي عمليات إعادة توجيه وتقييم عناوين URL الأساسية.
بعد الزحف، يتم تحويل محتوى HTML إلى نص ماركداون عادي. قد تتم إزالة بعض المعلومات أثناء هذه العملية. يُعرض نص الماركداون النهائي على روبوت الدردشة كسياق. يمكن للروبوت بعد ذلك استرجاع هذه المعلومات عند الحاجة.
كيف يعرف الذكاء الاصطناعي المعلومات التي يجب اختيارها
يتم تقسيم نص الماركداون إلى مقاطع، وتحويله إلى متجهات، وتخزينه في قاعدة بيانات متجهات. هذا النوع من قواعد البيانات يخصص قيمًا لمعاني الكلمات. ونتيجة لذلك، يمكن للذكاء الاصطناعي فهم الكلمات ذات الصلة بدلاً من الحاجة إلى تطابق حرفي للكلمة.
تنتشر الكلمات على شبكة بناءً على القيم المخصصة لها. يتيح ذلك للكمبيوتر فهم أي الكلمات متقاربة في المعنى:

ملاحظة: هذا نموذج مبسط جدًا. في الواقع، يقوم الذكاء الاصطناعي بذلك مع آلاف الكلمات والعبارات والجمل الكاملة.
تسمى عملية استرجاع المعلومات من قواعد بيانات المتجهات بالبحث الدلالي. إنها قدرة الذكاء الاصطناعي على البحث وتقييم معنى الكلمات في قاعدة بيانات المتجهات، واستخدامها لتقديم الإجابات.
عندما يطرح المستخدم استفسارًا، يقوم الروبوت بتحويل الكلمات إلى متجهات. ثم يبحث في قاعدة البيانات عن أي تطابقات قريبة من محتواك. عند العثور على تطابقات أو محتوى مشابه، يستخدم المعلومات لصياغة الإجابة.
لماذا البحث الدلالي مهم جدًا
تخيل أنك تملك متجر حيوانات أليفة عبر الإنترنت. يسأل أحد العملاء الاستفسار التالي:
“هل تبيعون طعامًا للقطط الصغيرة؟”
نعم، ولكن اسم المنتج يحتوي على كلمة “صغير” بدلاً من “قط صغير”. سيتمكن الروبوت من فهم أن “طعام القطط الصغيرة” هو نفسه (أو مشابه جدًا) لـ “طعام للقطط الصغيرة” وسيوجه العميل بنجاح للمنتج الصحيح.
بدون البحث الدلالي في قاعدة بيانات المتجهات، سيرد روبوت الدردشة ببساطة بأنك لا تبيع “طعام للقطط الصغيرة”، مما يجعلك تخسر عميلًا مستقبليًا. ليس عليك القلق من حدوث ذلك عند استخدام FlowHunt.
