المساحة تحت المنحنى (AUC)
المساحة تحت المنحنى (AUC) هي مقياس أساسي في تعلم الآلة يُستخدم لتقييم أداء نماذج التصنيف الثنائي. يُحدد القدرة الكلية للنموذج على التمييز بين الفئات الإيجابية و...
يقيم منحنى ROC المصنفات الثنائية من خلال رسم معدل الإيجابيات الحقيقية مقابل معدل الإيجابيات الكاذبة عبر العتبات المختلفة، وهو أمر بالغ الأهمية لتقييم أداء النماذج في الذكاء الاصطناعي والتعلم الآلي.
منحنى ROC هو رسم بياني يوضح القدرة التشخيصية لنظام التصنيف الثنائي من خلال رسم معدل الإيجابيات الحقيقية (TPR) مقابل معدل الإيجابيات الكاذبة (FPR) عند إعدادات عتبة مختلفة. يقيس TPR، المعروف أيضاً بالحساسية أو الاسترجاع، نسبة الإيجابيات الفعلية التي تم تحديدها بشكل صحيح، بينما يمثل FPR نسبة السلبيات الفعلية التي تم تحديدها بشكل خاطئ كإيجابيات.
رياضياً:
حيث:
مصطلح “خصائص تشغيل المستقبل” نشأ من نظرية كشف الإشارات التي تم تطويرها خلال الحرب العالمية الثانية لتحليل إشارات الرادار. استخدم المهندسون منحنيات ROC للتمييز بين الأجسام المعادية والضوضاء. ومع مرور الوقت، وجدت منحنيات ROC تطبيقات في علم النفس والطب والتعلم الآلي لتقييم الاختبارات التشخيصية ونماذج التصنيف.
في التعلم الآلي والذكاء الاصطناعي، تعتبر منحنيات ROC أداة أساسية لتقييم أداء المصنفات الثنائية. فهي توفر رؤية شاملة لقدرة النموذج على التمييز بين الفئات الإيجابية والسلبية عبر جميع العتبات.
غالباً ما تنتج نماذج التصنيف احتمالات أو نتائج مستمرة بدلاً من تسميات الفئات النهائية. من خلال تطبيق عتبات مختلفة على هذه النتائج، يمكن تغيير الحساسية والنوعية للنموذج:
رسم TPR مقابل FPR لجميع العتبات الممكنة ينتج منحنى ROC، الذي يوضح التوازن بين الحساسية والنوعية.
تمثل المساحة تحت منحنى ROC (AUC) القدرة الإجمالية للنموذج على التمييز بين الفئات الإيجابية والسلبية. تشير قيمة AUC بمقدار 0.5 إلى عدم وجود قدرة تمييزية (أي مثل التخمين العشوائي)، بينما تمثل قيمة 1.0 تمييزاً مثالياً.
تعد منحنيات ROC ونتائج AUC ذات قيمة عالية عند مقارنة نماذج التصنيف المختلفة أو ضبط معلمات النموذج. يفضل عادةً النموذج ذو AUC الأعلى لأنه يشير إلى قدرة أفضل على التمييز بين الفئات الإيجابية والسلبية.
بالإضافة إلى كونها أداة بصرية لتقييم أداء النموذج، تساعد منحنيات ROC أيضاً في اختيار العتبة المثلى التي توازن بين الحساسية والنوعية وفقاً لمتطلبات التطبيق المحددة.
يتطلب فهم منحنيات ROC الإلمام بمصفوفة الالتباس، التي تلخص أداء نموذج التصنيف:
تم التنبؤ به إيجابي | تم التنبؤ به سلبي | |
---|---|---|
إيجابي فعلي | إيجابي حقيقي (TP) | سلبي كاذب (FN) |
سلبي فعلي | إيجابي كاذب (FP) | سلبي حقيقي (TN) |
تشكل مصفوفة الالتباس الأساس لحساب TPR وFPR عند عتبات مختلفة.
ترسم منحنيات ROC الحساسية مقابل 1 – النوعية (وهو FPR).
تستخدم منحنيات ROC في الاختبارات الطبية لتقييم فعالية الاختبارات التشخيصية.
مثال: تحديد عتبة علامة حيوية لتشخيص مرض.
تستخدم منحنيات ROC على نطاق واسع في تقييم خوارزميات التصنيف في التعلم الآلي.
مثال: كشف رسائل البريد الإلكتروني المزعجة
في الأتمتة وروبوتات الدردشة، تساعد منحنيات ROC في تحسين التعرف على النوايا ودقة الاستجابة.
مثال: تصنيف النوايا في روبوتات الدردشة
تستخدم المؤسسات المالية منحنيات ROC لتقييم النماذج التي تتنبأ بالتعثر في السداد.
مثال: التنبؤ بتعثر القروض
لكل عتبة، يصنف النموذج الحالات إلى إيجابية أو سلبية، مما يؤدي إلى قيم مختلفة من TP وFP وTN وFN.
من خلال تغيير العتبة من أدنى إلى أعلى نتيجة ممكنة، يتم الحصول على سلسلة من أزواج TPR وFPR لرسم منحنى ROC.
يمكن حساب AUC باستخدام تقنيات التكامل العددي مثل طريقة شبه المنحرف المُطبقة على منحنى ROC.
في مجموعات البيانات حيث تكون الفئات غير متوازنة (مثل كشف الاحتيال مع قلة الحالات الإيجابية)، قد تعطي منحنيات ROC رؤية متفائلة جداً لأداء النموذج.
في هذه الحالات، تكون منحنيات الدقة مقابل الاسترجاع (PR) أكثر إفادة.
ترسم منحنيات PR الدقة مقابل الاسترجاع، مما يوفر فهماً أفضل لأداء النموذج على البيانات غير المتوازنة.
في أنظمة الذكاء الاصطناعي، خصوصاً تلك التي تتضمن مهام تصنيف، توفر منحنيات ROC رؤى أساسية حول أداء النموذج.
من خلال الاستفادة من تحليل منحنى ROC، يمكن لمطوري الذكاء الاصطناعي تحسين تفاعل المستخدمين.
يمكن أيضاً استخدام منحنيات ROC لتقييم عدالة النماذج.
توفر العديد من البرمجيات الإحصائية ولغات البرمجة دوال لحساب ورسم منحنيات ROC.
roc_curve
و auc
.pROC
و ROCR
تحليلات ROC.from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt
# y_true: القيم الحقيقية الثنائية
# y_scores: الاحتمالات أو الدرجات المتوقعة
fpr, tpr, thresholds = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)
# الرسم
plt.figure()
plt.plot(fpr, tpr, color='blue', lw=2, label='منحنى ROC (المساحة = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='grey', lw=2, linestyle='--')
plt.xlabel('معدل الإيجابيات الكاذبة')
plt.ylabel('معدل الإيجابيات الحقيقية')
plt.title('منحنى خصائص تشغيل المستقبل (ROC)')
plt.legend(loc='lower right')
plt.show()
يمكن أن تكون منحنيات ROC مضللة عند التعامل مع مجموعات بيانات غير متوازنة للغاية. في مثل هذه الحالات، قد يتم تحقيق TPR مرتفع مع FPR مرتفع أيضاً، وهو ما قد لا يكون مقبولاً عملياً.
تأخذ منحنيات ROC في الاعتبار جميع العتبات الممكنة، لكنها لا تشير إلى أي عتبة هي الأنسب لحالة معينة.
قد تشير AUC قريبة من 1.0 إلى أداء ممتاز، لكن دون النظر إلى السياق (مثل توزيع الفئات وتكاليف الأخطاء)، قد تؤدي إلى ثقة زائدة في النموذج.
بينما تعتبر منحنيات ROC ذات قيمة، قد تكون هناك مقاييس أخرى أكثر ملاءمة في بعض الحالات.
مفيدة لمجموعات البيانات غير المتوازنة حيث تكون الفئة الإيجابية هي الأهم.
المتوسط التوافقي بين الدقة والاسترجاع، ويوفر مؤشراً واحداً لتقييم التوازن بينهما.
مقياس متوازن يمكن استخدامه حتى إذا كانت الفئات مختلفة الأحجام بشكل كبير.
يعد منحنى خصائص تشغيل المستقبل (ROC) أداة أساسية لتقييم أداء المصنفات الثنائية. ويُستخدم على نطاق واسع في مجالات عديدة مثل الطب والتعلم الآلي والإحصاء. فيما يلي بعض الأوراق العلمية ذات الصلة التي تستكشف الجوانب المختلفة لمنحنيات ROC وتطبيقاتها:
Receiver Operating Characteristic (ROC) Curves
The Risk Distribution Curve and its Derivatives
Conditional Prediction ROC Bands for Graph Classification
منحنى ROC (خصائص تشغيل المستقبل) هو رسم بياني يوضح القدرة التشخيصية لنظام التصنيف الثنائي من خلال رسم معدل الإيجابيات الحقيقية مقابل معدل الإيجابيات الكاذبة عند إعدادات عتبة مختلفة.
توفر منحنيات ROC نظرة شاملة على قدرة النموذج في التمييز بين الفئات، وتساعد في اختيار العتبة المثلى، وتعد ضرورية لمقارنة أداء النماذج المختلفة.
AUC تعني المساحة تحت المنحنى وتُكمم القدرة الإجمالية للنموذج على التمييز بين الفئات الإيجابية والسلبية. كلما كانت قيمة AUC أعلى، كان الأداء أفضل.
تكون منحنيات الدقة مقابل الاسترجاع أكثر إفادة من منحنيات ROC عند العمل مع مجموعات بيانات غير متوازنة، لأنها تركز على الأداء المتعلق بالفئة الإيجابية.
من خلال استخدام منحنيات ROC، يمكن للمطورين تحسين تصنيف النوايا ودقة الردود في روبوتات الدردشة، مع ضبط العتبات لتحقيق توازن بين الإيجابيات الكاذبة والحقيقية لتجربة مستخدم أفضل.
استفد من تحليل منحنى ROC وأدوات الذكاء الاصطناعي لتحسين نماذج التصنيف وأتمتة سير العمل لديك مع FlowHunt.
المساحة تحت المنحنى (AUC) هي مقياس أساسي في تعلم الآلة يُستخدم لتقييم أداء نماذج التصنيف الثنائي. يُحدد القدرة الكلية للنموذج على التمييز بين الفئات الإيجابية و...
مربع آر المعدل هو مقياس إحصائي يُستخدم لتقييم مدى جودة ملاءمة نموذج الانحدار، مع الأخذ في الاعتبار عدد المتغيرات المستقلة لتجنب الإفراط في الملاءمة وتقديم تقييم...
تقييم المستندات في توليد الاسترجاع المعزز (RAG) هو عملية تقييم وترتيب المستندات بناءً على مدى ملاءمتها وجودتها استجابةً لاستعلام، لضمان استخدام أكثر المستندات ص...