الانتشار العكسي

الانتشار العكسي هو خوارزمية تعلم مراقب تُستخدم لتدريب الشبكات العصبية عن طريق تقليل خطأ التنبؤ من خلال تحديثات الأوزان التكرارية.

الانتشار العكسي هو خوارزمية لتدريب الشبكات العصبية الاصطناعية. من خلال تعديل الأوزان لتقليل الخطأ في التنبؤات، يضمن الانتشار العكسي أن تتعلم الشبكات العصبية بكفاءة. في هذا المدخل من القاموس، سنشرح ما هو الانتشار العكسي، وكيف يعمل، ونوضح الخطوات المتبعة في تدريب الشبكة العصبية.

ما هو الانتشار العكسي؟

الانتشار العكسي، ويُختصر بـ “النشر العكسي للأخطاء”، هو خوارزمية تعلم مراقب تُستخدم لتدريب الشبكات العصبية الاصطناعية. وهو الطريقة التي تقوم بها الشبكة العصبية بتحديث أوزانها بناءً على معدل الخطأ الذي تم الحصول عليه في الحقبة (التكرار) السابقة. الهدف هو تقليل الخطأ حتى تصبح تنبؤات الشبكة دقيقة قدر الإمكان.

كيف يعمل الانتشار العكسي؟

يعمل الانتشار العكسي عن طريق نشر الخطأ للخلف عبر الشبكة. إليك شرحًا خطوة بخطوة للعملية:

1. التمرير الأمامي

  • طبقة الإدخال: يتم إدخال بيانات الإدخال إلى الشبكة.
  • الطبقات المخفية: تتم معالجة البيانات عبر طبقة أو أكثر من الطبقات المخفية، حيث تطبق الخلايا العصبية الأوزان ودوال التفعيل لإنتاج المخرجات.
  • طبقة الإخراج: يتم إنتاج المخرجات النهائية بناءً على المجموع الموزون للمدخلات من الطبقة المخفية الأخيرة.

2. حساب الخسارة

  • حساب الخطأ: تتم مقارنة مخرجات الشبكة بالقيم المستهدفة الفعلية لحساب الخطأ (الخسارة). من دوال الخسارة الشائعة متوسط مربع الخطأ (MSE) وخسارة الانتروبيا التقاطعية.

3. التمرير الخلفي

  • حساب التدرج: يتم حساب تدرج دالة الخسارة بالنسبة لكل وزن عبر تطبيق قاعدة السلسلة في التفاضل. تتضمن هذه الخطوة حساب المشتقات الجزئية للخسارة بالنسبة لكل وزن.
  • تحديث الأوزان: يتم تحديث الأوزان باستخدام التدرجات التي تم حسابها. يحدد معدل التعلم، وهو متغير فائق، حجم الخطوة لتحديث الأوزان. عادةً ما يُعطى قانون التحديث كالتالي:
    wnew = wold – η ∂L/∂w
    حيث η هو معدل التعلم و*∂L/∂w* هو تدرج الخسارة (L) بالنسبة للوزن (w).

4. التكرار

  • إعادة التكرار: يتم تكرار الخطوات من 1 إلى 3 لعدد محدد مسبقًا من العصور أو حتى تصل الخسارة إلى عتبة مقبولة.

تدريب شبكة عصبية باستخدام الانتشار العكسي

يتضمن تدريب الشبكة العصبية عدة خطوات رئيسية:

1. تجهيز البيانات

  • مجموعة البيانات: جمع البيانات ومعالجتها مسبقًا.
  • التطبيع: تطبيع البيانات لضمان أن جميع ميزات الإدخال تقع ضمن نفس النطاق.

2. تهيئة النموذج

  • البنية: تحديد بنية الشبكة العصبية، بما في ذلك عدد الطبقات والخلايا العصبية.
  • تهيئة الأوزان: تهيئة الأوزان غالبًا بقيم عشوائية صغيرة.

3. حلقة التدريب

  • التمرير الأمامي: حساب مخرجات الشبكة.
  • حساب الخسارة: حساب الخسارة بين المخرجات المتوقعة والفعلية.
  • التمرير الخلفي: حساب تدرجات الخسارة بالنسبة لكل وزن.
  • تحديث الأوزان: تحديث الأوزان باستخدام التدرجات ومعدل التعلم.
  • العصر: تكرار العملية لعدة عصور لتحسين الأوزان.

4. التقييم

  • التحقق: اختبار النموذج المدرب على مجموعة تحقق منفصلة لتقييم الأداء.
  • الضبط: ضبط المتغيرات الفائقة مثل معدل التعلم، حجم الدفعة، وعدد العصور بناءً على نتائج التحقق.

مبادئ الانتشار العكسي

  • قاعدة السلسلة: المبدأ الرياضي الأساسي الذي يسمح بحساب التدرجات في شبكة متعددة الطبقات.
  • انحدار التدرج: خوارزمية تحسين تُستخدم لتقليل دالة الخسارة.
  • معدل التعلم: متغير فائق يتحكم في مقدار التغيير في النموذج استجابةً للخطأ المقدّر في كل مرة يتم فيها تحديث الأوزان.

المراجع:

الأسئلة الشائعة

ما هو الانتشار العكسي؟

الانتشار العكسي هو خوارزمية تعلم مراقب لتدريب الشبكات العصبية الاصطناعية. يقوم بتحديث الأوزان عن طريق نشر الخطأ للخلف وتقليل خسارة التنبؤ.

كيف يعمل الانتشار العكسي؟

يشمل الانتشار العكسي إجراء تمرير أمامي لحساب التنبؤات، وحساب الخسارة، وتمرير خلفي لحساب التدرجات، وتحديث الأوزان بشكل تكراري لتقليل الخطأ.

لماذا يُعد الانتشار العكسي مهمًا في الشبكات العصبية؟

يتيح الانتشار العكسي للشبكات العصبية التعلم بكفاءة من خلال تحسين الأوزان، مما يؤدي إلى تنبؤات دقيقة في مهام تعلم الآلة.

ما هي الخطوات الرئيسية في الانتشار العكسي؟

الخطوات الرئيسية هي تجهيز البيانات، تهيئة النموذج، التمرير الأمامي، حساب الخسارة، التمرير الخلفي (حساب التدرج)، تحديث الأوزان، والتكرار لعدة عصور (Epochs).

ابدأ البناء باستخدام الذكاء الاصطناعي

اكتشف كيف يمكن لأدوات FlowHunt وروبوتات الدردشة مساعدتك في البناء والأتمتة باستخدام الذكاء الاصطناعي. سجل الآن أو احجز عرضًا توضيحيًا اليوم.

اعرف المزيد

الانتشار الثابت
الانتشار الثابت

الانتشار الثابت

الانتشار الثابت هو نموذج متقدم لتوليد الصور من النصوص يستخدم التعلم العميق لإنتاج صور عالية الجودة وواقعية بناءً على الأوصاف النصية. كنموذج انتشار كامن، يمثل تق...

10 دقيقة قراءة
Stable Diffusion AI +5
انحدار الغابة العشوائية
انحدار الغابة العشوائية

انحدار الغابة العشوائية

انحدار الغابة العشوائية هو خوارزمية قوية في تعلم الآلة تُستخدم للتحليلات التنبؤية. تقوم بإنشاء عدة أشجار قرار وتُعدل متوسط مخرجاتها للحصول على دقة أعلى، وموثوقي...

3 دقيقة قراءة
Machine Learning Regression +3
الشبكات العصبية الاصطناعية (ANNs)
الشبكات العصبية الاصطناعية (ANNs)

الشبكات العصبية الاصطناعية (ANNs)

الشبكات العصبية الاصطناعية (ANNs) هي مجموعة فرعية من خوارزميات تعلم الآلة مستوحاة من الدماغ البشري. تتكون هذه النماذج الحاسوبية من عقد مترابطة أو "عصبونات" تعمل...

3 دقيقة قراءة
Artificial Neural Networks Machine Learning +3