
Eğri Altındaki Alan (AUC)
Eğri Altındaki Alan (AUC), makine öğreniminde ikili sınıflandırma modellerinin performansını değerlendirmek için kullanılan temel bir metriktir. Bir modelin poz...
Bir ROC eğrisi, ikili sınıflandırıcıları, eşiğe göre Doğru Pozitif Oran ve Yanlış Pozitif Oran’ı çizerek değerlendirir; bu, AI ve makine öğreniminde model performansını ölçmek için çok önemlidir.
Bir ROC eğrisi, bir ikili sınıflandırıcı sisteminin tanısal yeteneğini, farklı eşik ayarlarında Doğru Pozitif Oran (TPR) ile Yanlış Pozitif Oran’ı (FPR) grafiğe dökerek gösterir. TPR, duyarlılık veya geri çağırma olarak da bilinir ve gerçek pozitiflerin doğru şekilde tanımlanma oranını ölçer; FPR ise gerçek negatiflerin yanlışlıkla pozitif olarak sınıflandırılma oranını belirtir.
Matematiksel olarak:
Burada:
“Alıcı İşletim Karakteristiği” terimi, radar sinyallerini analiz etmek için II. Dünya Savaşı sırasında geliştirilen sinyal algılama teorisinden gelir. Mühendisler, düşman nesneleri ile gürültüyü ayırt etmek için ROC eğrilerini kullandılar. Zamanla ROC eğrileri, psikoloji, tıp ve makine öğrenimi gibi alanlarda tanı testleri ve sınıflandırma modellerini değerlendirme amacıyla kullanılmaya başlandı.
Makine öğrenimi ve yapay zekada, ROC eğrileri ikili sınıflandırıcıların performansını değerlendirmek için vazgeçilmezdir. Bir modelin pozitif ve negatif sınıfları tüm eşikler boyunca ayırt edebilme yeteneğini kapsamlı olarak gösterirler.
Sınıflandırma modelleri genellikle kesin sınıf etiketleri yerine olasılıklar veya sürekli skorlar üretir. Bu skorlara farklı eşikler uygulayarak modelin duyarlılığı ve özgüllüğü değiştirilebilir:
Tüm olası eşikler için TPR ve FPR’yi çizmek, duyarlılık ve özgüllük arasındaki dengeyi gösteren ROC eğrisini ortaya çıkarır.
ROC eğrisinin Altındaki Alan (AUC), modelin pozitif ve negatif sınıfları ayırt etme kabiliyetini nicelendirir. 0,5’lik bir AUC, rastgele tahmine eşdeğer bir ayırt etme yeteneği olmadığını, 1,0’lık bir AUC ise mükemmel bir ayırt etme olduğunu gösterir.
ROC eğrileri ve AUC skorları, farklı sınıflandırma modellerini karşılaştırmak veya bir modelin parametrelerini ayarlamak için değerlidir. Daha yüksek AUC’ya sahip bir model, genellikle pozitif ve negatif sınıfları daha iyi ayırt ettiği için tercih edilir.
ROC eğrileri, model performansını görselleştirmenin yanı sıra, uygulamanın özel gereksinimlerine göre duyarlılık ve özgüllük arasında denge sağlayacak en uygun eşiklerin seçilmesine de yardımcı olur.
ROC eğrilerini anlamak için, bir sınıflandırma modelinin performansını özetleyen karmaşıklık matrisiyle aşina olmak gerekir:
Pozitif Tahmin | Negatif Tahmin | |
---|---|---|
Gerçek Pozitif | Doğru Pozitif (TP) | Yanlış Negatif (FN) |
Gerçek Negatif | Yanlış Pozitif (FP) | Doğru Negatif (TN) |
Karmaşıklık matrisi, farklı eşiklerde TPR ve FPR hesaplaması için temel oluşturur.
ROC eğrileri, duyarlılığı 1 – özgüllük (yani FPR) karşısında çizer.
Tıbbi testlerde, ROC eğrileri tanı testlerinin etkinliğini değerlendirmek için kullanılır.
Örnek: Bir biyobelirteç eşiğinin hastalığı teşhis etmek için belirlenmesi.
ROC eğrileri, makine öğreniminde sınıflandırma algoritmalarını değerlendirmede yaygın olarak kullanılır.
Örnek: E-posta Spam Tespiti
AI otomasyonu ve sohbet robotlarında, ROC eğrileri niyet tanıma ve yanıt doğruluğunu iyileştirmeye yardımcı olur.
Örnek: Sohbet Robotlarında Niyet Sınıflandırma
Finansal kuruluşlar, kredi temerrütlerini tahmin eden modelleri değerlendirmek için ROC eğrilerini kullanır.
Örnek: Kredi Temerrüt Tahmini
Her eşikte, model örnekleri pozitif veya negatif olarak sınıflandırır ve bu da farklı TP, FP, TN ve FN değerlerine yol açar.
En düşükten en yüksek olası skora kadar eşik değiştirildikçe, ROC eğrisi için TPR ve FPR çiftleri elde edilir.
AUC, ROC eğrisi üzerinde trapez kuralı gibi sayısal entegrasyon teknikleriyle hesaplanabilir.
Sınıfların dengesiz olduğu veri kümelerinde (ör. az sayıda pozitif vakalı dolandırıcılık tespiti) ROC eğrileri, modelin performansını olduğundan daha iyimser gösterebilir.
Bu gibi durumlarda, Hassasiyet-Duyarlılık (PR) eğrileri daha bilgilendiricidir.
PR eğrileri, hassasiyeti duyarlılığa karşı çizerek modelin dengesiz veri kümelerindeki performansı hakkında daha iyi fikir verir.
Özellikle sınıflandırma görevleri içeren AI sistemlerinde, ROC eğrileri model performansına dair temel içgörüler sunar.
ROC eğrisi analiziyle, AI geliştiricileri kullanıcı etkileşimlerini güçlendirebilir.
ROC eğrileri, model adaletini değerlendirmek için de kullanılabilir.
Çeşitli istatistiksel yazılımlar ve programlama dilleri ROC eğrisi hesaplama ve çizme fonksiyonları sunar.
roc_curve
ve auc
gibi fonksiyonlar sağlar.pROC
ve ROCR
gibi paketlerle ROC analizi yapılabilir.from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt
# y_true: Gerçek ikili etiketler
# y_scores: Tahmin edilen olasılıklar veya skorlar
fpr, tpr, thresholds = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)
# Grafiğe dökme
plt.figure()
plt.plot(fpr, tpr, color='blue', lw=2, label='ROC eğrisi (alan = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='grey', lw=2, linestyle='--')
plt.xlabel('Yanlış Pozitif Oran')
plt.ylabel('Doğru Pozitif Oran')
plt.title('Alıcı İşletim Karakteristiği (ROC)')
plt.legend(loc='lower right')
plt.show()
ROC eğrileri, yüksek derecede dengesiz veri kümelerinde yanıltıcı olabilir. Böyle durumlarda, yüksek TPR, orantısal olarak yüksek FPR ile birlikte elde edilebilir ve bu pratikte kabul edilebilir olmayabilir.
ROC eğrileri tüm olası eşikleri dikkate alır, ancak belirli bir durum için hangi eşiklerin en uygun olduğunu göstermez.
AUC’nin 1,0’a yakın olması mükemmel performansı gösterebilir; ancak bağlam (sınıf dağılımı ve hata maliyetleri gibi) dikkate alınmadan modele gereğinden fazla güven duyulmasına yol açabilir.
ROC eğrileri değerli olsa da, bazı durumlarda başka ölçütler daha uygun olabilir.
Pozitif sınıfın öncelikli olduğu dengesiz veri kümeleri için faydalıdır.
Hassasiyet ve duyarlılığın harmonik ortalamasıdır; ikisi arasındaki dengeyi tek bir metrikle ölçer.
Sınıflar çok farklı boyutlarda olsa bile kullanılabilen dengeli bir ölçüttür.
Alıcı İşletim Karakteristiği (ROC) eğrisi, ikili sınıflandırıcıların performansını değerlendirmede temel bir araçtır. Tıp, makine öğrenimi ve istatistik gibi birçok alanda yaygın olarak kullanılmaktadır. ROC eğrilerinin ve uygulamalarının farklı yönlerini inceleyen bazı bilimsel makaleler aşağıdadır:
Receiver Operating Characteristic (ROC) Curves
The Risk Distribution Curve and its Derivatives
Conditional Prediction ROC Bands for Graph Classification
ROC (Alıcı İşletim Karakteristiği) eğrisi, bir ikili sınıflandırıcı sisteminin tanısal yeteneğini, çeşitli eşik ayarlarında Doğru Pozitif Oran ile Yanlış Pozitif Oran'ı grafiğe dökerek gösteren bir diyagramdır.
ROC eğrileri, bir modelin sınıflar arasındaki ayırt etme yeteneğini kapsamlı şekilde gösterir, en uygun eşiklerin seçilmesine yardımcı olur ve farklı modellerin performansını karşılaştırmada vazgeçilmezdir.
AUC, Eğri Altındaki Alan anlamına gelir ve modelin pozitif ve negatif sınıfları ayırt etme becerisini nicelendirir. Daha yüksek bir AUC, daha iyi performansa işaret eder.
Hassasiyet-Duyarlılık eğrileri, dengesiz veri kümelerinde ROC eğrilerinden daha bilgilendiricidir; çünkü pozitif sınıfa ilişkin performansa odaklanırlar.
ROC eğrileri kullanılarak, geliştiriciler sohbet robotlarında niyet sınıflandırmasını ve yanıt doğruluğunu iyileştirebilir; yanlış pozitifler ile doğru pozitifler arasında denge sağlayacak eşikler optimize edilerek daha iyi kullanıcı deneyimi elde edilir.
ROC eğrisi analizi ve AI araçlarını kullanarak sınıflandırma modellerinizi optimize edin ve iş akışlarınızı FlowHunt ile otomatikleştirin.
Eğri Altındaki Alan (AUC), makine öğreniminde ikili sınıflandırma modellerinin performansını değerlendirmek için kullanılan temel bir metriktir. Bir modelin poz...
ROUGE skoru, makine tarafından oluşturulan özetlerin ve çevirilerin kalitesini insan referanslarıyla karşılaştırarak değerlendirmek için kullanılan bir dizi met...
Yapay zekada Retrieval-Augmented Generation (RAG) ile Cache-Augmented Generation (CAG) arasındaki temel farkları keşfedin. RAG, uyarlanabilir ve doğru yanıtlar ...