وصف التدفق
الغرض والفوائد
يتيح سير العمل هذا للمستخدمين التفاعل بالدردشة مع نص أي فيديو على يوتيوب. بمجرد تقديم رابط يوتيوب، يمكن للمستخدمين طرح الأسئلة وتلقي إجابات موجزة مستندة إلى نص الفيديو التفريغي. تم تصميم هذا النظام لجعل محتوى الفيديو الطويل سهل الوصول والبحث من خلال الذكاء الاصطناعي الحواري.
وصف سير العمل خطوة بخطوة
1. بدء الدردشة وإرشاد المستخدم
- مشغل فتح الدردشة: يبدأ سير العمل عندما يفتح المستخدم الدردشة. هذا يُفعّل العملية ويجهز الواجهة للتفاعل مع المستخدم.
- رسالة الترحيب: تعرض أداة الرسائل ترحيباً ودياً:
"👋 مرحباً بك في أداة الدردشة مع فيديو يوتيوب! أنا هنا لأساعدك في تحويل فيديوهات يوتيوب الطويلة إلى إجابات موجزة🌐. فقط أدخل رابط فيديو يوتيوب وانتظر قليلاً. سأخبرك عندما أكون جاهزاً للإجابة على أسئلتك. ✨📹" - مخرج الرسائل: تظهر رسالة الترحيب للمستخدم في مخرج الدردشة، موجهةً إياه لإدخال رابط فيديو يوتيوب.
2. معالجة إدخال المستخدم
- مدخل الدردشة: يستمع النظام لإدخال المستخدم، والذي يتضمن عادةً رابط فيديو يوتيوب وأي أسئلة لاحقة.
- سجل الدردشة: تُخزن جميع رسائل الدردشة السابقة في الذاكرة، مما يسمح بردود مدركة للسياق واستمرارية المحادثة متعددة الأدوار.
3. استرجاع نص الفيديو التفريغي
- مسترجع الروابط: عند تقديم رابط يوتيوب، يستخدم سير العمل عقدة مسترجع محتوى الرابط لاستخراج النص التفريغي (أو أي محتوى نصي متاح آخر) من الفيديو. تم ضبط هذه العقدة للتعامل مع ما يصل إلى 30,000 رمز، مما يمكنها من معالجة الفيديوهات الطويلة.
4. أسئلة وأجوبة مدعومة بالوكيل
- وكيل استدعاء الأدوات:
- يُطلب من الوكيل التصرف كباحث محترف على يوتيوب ومساعد شخصي.
- عند استلام استفسار من المستخدم، يستخدم الوكيل النص التفريغي (الذي استخرجه مسترجع الروابط) كأساس للمعرفة.
- تضمن مطالبة النظام أن يقدم الوكيل إجابات موجزة ودقيقة ويتجنب اختلاق المعلومات (“تخيلات”) إذا لم توجد الإجابة في النص التفريغي.
- يستفيد الوكيل من سجل الدردشة للحفاظ على السياق عبر عدة أسئلة.
- مخرج الإجابات: يُعاد إخراج رد الوكيل للمستخدم في واجهة الدردشة، ليكتمل بذلك حلقة كل سؤال.
هيكل سير العمل
الخطوة | المكون | الغرض |
---|
1. بدء الدردشة | ChatOpenedTrigger, MessageWidget | تحية المستخدم وتقديم الإرشادات |
2. إدخال المستخدم | ChatInput, ChatHistory | استقبال استفسارات المستخدم وتذكر تاريخ المحادثة |
3. جلب النص التفريغي | URLContent | استخراج النص التفريغي من فيديو يوتيوب |
4. وكيل الأسئلة والأجوبة | ToolCallingAgent | الإجابة على أسئلة المستخدم باستخدام النص التفريغي وسياق الدردشة |
5. المخرجات | ChatOutput | عرض الرسائل والإجابات للمستخدم |
الفوائد وحالات الاستخدام
- القابلية للتوسع: يتيح سير العمل هذا لأي شخص التفاعل مع عدد غير محدود من فيديوهات يوتيوب دون قراءة النص التفريغي يدوياً.
- الأتمتة: عملية استخراج النصوص التفريغية والإجابة على الأسئلة مؤتمتة بالكامل، مما يوفر ساعات من العمل اليدوي.
- سهولة الوصول المحسنة: يمكن للمستخدمين الحصول بسرعة على إجابات من فيديوهات تعليمية أو محاضرات أو وثائقيات طويلة دون مشاهدة المحتوى بالكامل.
- الاحتفاظ بالمعرفة: تحتفظ الدردشة متعددة الأدوار المدركة للسياق بتسلسل المحادثة، مما يدعم استفسارات ومتابعات أكثر تعقيداً.
أمثلة على حالات الاستخدام
- تلخيص النقاط الرئيسية بسرعة من مقابلة أو وثائقي طويل.
- طلب تعريفات أو شروحات أو توضيحات حول أجزاء من الفيديو.
- استخراج قوائم أو جداول زمنية أو معلومات منظمة أخرى من محتوى الفيديو.
- دعم البحث من خلال تمكين أسئلة وأجوبة سريعة عبر مصادر فيديو متعددة.
الخلاصة
يجلب سير العمل هذا أتمتة قوية ومحادثة مدعومة بالذكاء الاصطناعي إلى محتوى فيديو يوتيوب، مما يجعله أداة قيمة للمعلمين والباحثين والطلاب ومستهلكي المحتوى الذين يرغبون في استخراج القيمة من الفيديو دون جهد يدوي. ويمكن توسيعه وتعميمه بسهولة لأنواع مختلفة من محتوى الفيديو، لتحقيق أقصى قدر من الإنتاجية وسهولة الوصول.