مربع آر المعدل

يقيم مربع آر المعدل ملاءمة نموذج الانحدار مع التعديل على المتغيرات المستقلة لتجنب الإفراط في الملاءمة. وعلى عكس مربع آر، فإنه يرتفع فقط مع المتغيرات المهمة. يُعد أساسياً في تحليل الانحدار، ويساعد في اختيار النماذج وتقييم الأداء في مجالات مثل المالية.

مربع آر المعدل هو مقياس إحصائي يُستخدم لتقييم مدى جودة ملاءمة نموذج الانحدار. وهو نسخة معدلة من مربع آر (أو معامل التحديد) تأخذ في الاعتبار عدد المتغيرات المستقلة في النموذج. بخلاف مربع آر، الذي يمكن أن يرتفع بشكل مصطنع عند إضافة المزيد من المتغيرات المستقلة، يقوم مربع آر المعدل بضبط نفسه وفقًا لعدد المتغيرات، مما يوفر مقياسًا أكثر دقة لقدرة النموذج على الشرح. يرتفع فقط إذا حسّن المتغير الجديد القدرة التنبؤية للنموذج أكثر مما هو متوقع بالصدفة، وينخفض عندما لا يضيف المتغير قيمة ذات دلالة.

مربع آر المعدل في تقييم نماذج تعلم الآلة

يلعب مربع آر المعدل دوراً محورياً في تقييم نماذج الانحدار في التعلم الآلي الموجَّه، ويُكمّل مقاييس أخرى مثل RMSE و MAE ودرجات التحقق المتقاطع (cross-validation). فبينما يرتفع مربع آر العادي بشكل رتيب كلما أُضيفت ميزات جديدة — مما يجعله خطراً عند مقارنة نماذج تختلف في عدد المتغيرات — فإن مربع آر المعدل يفرض عقوبة صريحة على الميزات الإضافية التي لا تستحق إضافتها، مما يجعله مناسباً بطبيعته لسير عمل اختيار الميزات في خطوط أنابيب مبنية على scikit-learn أو statsmodels أو XGBoost. يدمج الممارسون عادةً مربع آر المعدل مع التحقق المتقاطع k-fold: فالتحقق المتقاطع يحمي من التحيز التفاؤلي على البيانات داخل العينة، بينما يقدم مربع آر المعدل ملخصاً قابلاً للتفسير وواعياً للتعقيد، مفيداً عند مقارنة نماذج خطية متداخلة أو مرشحين للانحدار التدريجي. وفي الإعدادات المنظَّمة مثل Ridge و Lasso و Elastic Net، يمكن الإبلاغ عن مربع آر المعدل جنباً إلى جنب مع قوة التنظيم المختارة للتحقق من أن تقليص المعاملات لم يُضحِ بالقدرة التفسيرية ذات المعنى. غير أنه في مشكلات تعلم الآلة عالية الأبعاد، حيث يقترب عدد الميزات من حجم العينة أو يتجاوزه، يصبح مربع آر المعدل غير موثوق وينبغي استبداله بمعايير المعلومات (AIC، BIC) أو بمقاييس تنبؤية خارج العينة تكون أكثر متانة في مواجهة الإفراط في الملاءمة في سير عمل تعلم الآلة الحديث.

فهم المفهوم

مربع آر مقابل مربع آر المعدل

  • مربع آر: يمثل نسبة التباين في المتغير التابع الذي يمكن التنبؤ به من المتغيرات المستقلة. يتم حسابه كنسبة التباين المفسر إلى إجمالي التباين ويتراوح بين 0 و1، حيث يشير الرقم 1 إلى أن النموذج يفسر كل التغير في البيانات حول المتوسط.
  • مربع آر المعدل: يقوم هذا المقياس بتعديل قيمة مربع آر بناءً على عدد المتغيرات المستقلة في النموذج. يتم هذا التعديل لمراعاة إمكانية الإفراط في الملاءمة التي قد تحدث عند تضمين عدد كبير من المتغيرات. يكون مربع آر المعدل دائماً أقل من أو يساوي مربع آر، ويمكن أن يكون سالباً، مما يشير إلى أن النموذج أسوأ من خط أفقي يمر بمتوسط المتغير التابع.

الصيغة الرياضية

صيغة مربع آر المعدل هي:

[ \text{Adjusted } R^2 = 1 – \left( \frac{1-R^2}{n-k-1} \right) \times (n-1) ]

حيث:

  • ( R^2 ) هو مربع آر،
  • ( n ) هو عدد المشاهدات،
  • ( k ) هو عدد المتغيرات المستقلة (المتنبئات).
Logo

هل أنت مستعد لتنمية عملك؟

ابدأ تجربتك المجانية اليوم وشاهد النتائج في غضون أيام.

الأهمية في تحليل الانحدار

يعتبر مربع آر المعدل ضرورياً في تحليل الانحدار، خاصة عند التعامل مع نماذج الانحدار المتعدد التي تتضمن عدة متغيرات مستقلة. فهو يساعد على تحديد أي المتغيرات تقدم معلومات ذات معنى وأيها لا يفعل. تصبح هذه النقطة ذات أهمية خاصة في مجالات مثل المالية والاقتصاد وعلم البيانات حيث يُعد التنبؤ عاملاً رئيسياً.

الإفراط في الملاءمة وتعقيد النموذج

إحدى المزايا الرئيسية لمربع آر المعدل هي قدرته على معاقبة إضافة المتغيرات غير المهمة. عادة ما يؤدي إدراج المزيد من المتغيرات في نموذج الانحدار إلى زيادة مربع آر بسبب احتمال التقاط الضوضاء العشوائية. ومع ذلك، لا يرتفع مربع آر المعدل إلا إذا حسّن المتغير المضاف القدرة التنبؤية للنموذج، مما يساعد على تجنب الإفراط في الملاءمة.

حالات الاستخدام والأمثلة

الاستخدام في تعلم الآلة

في تعلم الآلة، يُستخدم مربع آر المعدل لتقييم أداء نماذج الانحدار. ويكون مفيداً بشكل خاص في اختيار الميزات، وهي جزء أساسي من تحسين النماذج. باستخدام مربع آر المعدل، يمكن لعلماء البيانات التأكد من أن الميزات التي يتم تضمينها في النموذج هي فقط تلك التي تساهم فعلياً في دقته.

التطبيق في المالية

في مجال المالية، غالباً ما يُستخدم مربع آر المعدل لمقارنة أداء المحافظ الاستثمارية مقابل مؤشر مرجعي. من خلال التعديل على عدد المتغيرات، يمكن للمستثمرين فهم مدى تفسير عوائد المحفظة بواسطة عوامل اقتصادية متعددة بشكل أفضل.

مثال بسيط

افترض أن هناك نموذجاً يتنبأ بأسعار المنازل بناءً على المساحة وعدد غرف النوم. في البداية، يظهر النموذج قيمة مربع آر مرتفعة، مما يشير إلى ملاءمة جيدة. إلا أنه عند إضافة متغيرات غير ذات صلة مثل لون باب المنزل، قد تظل قيمة مربع آر مرتفعة. في هذه الحالة، ستنخفض قيمة مربع آر المعدل، مما يدل على أن المتغيرات الجديدة لا تحسن القدرة التنبؤية للنموذج.

مثال تفصيلي

وفقاً لدليل من معهد التمويل المؤسسي، افترض وجود نموذجين للانحدار بهدف التنبؤ بسعر البيتزا. النموذج الأول يستخدم سعر العجينة فقط كمتغير إدخال، ويحقق مربع آر بقيمة 0.9557 ومربع آر معدل بقيمة 0.9493. يضيف النموذج الثاني درجة الحرارة كمتغير إدخال ثانٍ، ويحقق مربع آر بقيمة 0.9573 ولكن مربع آر معدل أقل بقيمة 0.9431. يشير مربع آر المعدل بشكل صحيح إلى أن درجة الحرارة لا تحسن القدرة التنبؤية للنموذج، مما يدفع المحللين لتفضيل النموذج الأول.

المقارنة مع المقاييس الأخرى

بينما يُستخدم كل من مربع آر ومربع آر المعدل لقياس مدى جودة ملاءمة النموذج، إلا أنهما ليسا قابلين للاستبدال ويخدمان أغراضاً مختلفة. قد يكون مربع آر مناسباً أكثر للانحدار الخطي البسيط مع متغير مستقل واحد، بينما يكون مربع آر المعدل أكثر ملاءمة لنماذج الانحدار المتعدد التي تحتوي على عدة متغيرات مستقلة.

الأسئلة الشائعة

جرّب FlowHunt لتقييم نماذج أكثر ذكاءً

استفد من أدوات الذكاء الاصطناعي في FlowHunt لبناء واختبار وتحسين نماذج الانحدار باستخدام مقاييس متقدمة مثل مربع آر المعدل.

اعرف المزيد

المساحة تحت المنحنى (AUC)

المساحة تحت المنحنى (AUC)

المساحة تحت المنحنى (AUC) هي مقياس أساسي في تعلم الآلة يُستخدم لتقييم أداء نماذج التصنيف الثنائي. يُحدد القدرة الكلية للنموذج على التمييز بين الفئات الإيجابية و...

3 دقيقة قراءة
Machine Learning AI +3
الانحدار التدرجي

الانحدار التدرجي

الانحدار التدرجي هو خوارزمية تحسين أساسية تُستخدم على نطاق واسع في تعلم الآلة والتعلم العميق لتقليل دوال التكلفة أو الخسارة عن طريق تعديل معلمات النموذج بشكل تك...

5 دقيقة قراءة
Machine Learning Deep Learning +3
خطأ التعميم

خطأ التعميم

يقيس خطأ التعميم مدى قدرة نموذج التعلم الآلي على التنبؤ بالبيانات غير المرئية، من خلال تحقيق التوازن بين الانحياز والتباين لضمان تطبيقات ذكاء اصطناعي قوية وموثو...

5 دقيقة قراءة
Machine Learning Generalization +3