Krivka učenia
Krivka učenia v umelej inteligencii je grafické znázornenie ilustrujúce vzťah medzi výkonnosťou modelu a premennými, ako je veľkosť dátovej množiny alebo počet ...
Krížová validácia rozdeľuje dáta na trénovacie a validačné sady viackrát na posúdenie a zlepšenie generalizácie modelu v strojovom učení.
Krížová validácia je štatistická metóda používaná na vyhodnocovanie a porovnávanie modelov strojového učenia delením dát na trénovacie a validačné sady viackrát. Hlavnou myšlienkou je posúdiť, ako dobre sa výsledky modelu generalizujú na nezávislú dátovú sadu, aby model nefungoval dobre len na trénovacích dátach, ale aj na nevidených údajoch. Táto technika je kľúčová pri zmierňovaní problémov ako je preučenie, kedy sa model naučí trénovacie dáta príliš dobre vrátane šumu a odľahlých hodnôt, no zlyháva na nových dátach.
Krížová validácia zahŕňa rozdelenie dátovej sady na doplnkové podmnožiny, pričom jedna podmnožina slúži na trénovanie modelu a druhá na jeho validáciu. Proces sa opakuje vo viacerých kolách, pričom v každom kole sa na trénovanie a validáciu používajú iné podmnožiny. Výsledky validácie sa následne spriemerujú, čím vzniká jeden odhad výkonu modelu. Táto metóda poskytuje presnejšie meranie predikčného výkonu modelu v porovnaní s jednoduchým rozdelením na trénovaciu a testovaciu sadu.
K-násobná krížová validácia
Stratifikovaná K-násobná krížová validácia
Leave-One-Out krížová validácia (LOOCV)
Holdout metóda
Krížová validácia časových radov
Leave-P-Out krížová validácia
Monte Carlo krížová validácia (Shuffle-Split)
Krížová validácia je zásadnou súčasťou vyhodnocovania modelov strojového učenia. Poskytuje pohľad na to, ako bude model fungovať na nevidených dátach a pomáha pri ladení hyperparametrov tým, že umožňuje model trénovať a validovať na viacerých podmnožinách dát. Tento proces napomáha výberu najlepšieho modelu a optimálnych hyperparametrov, čím zlepšuje schopnosť modelu generalizovať.
Jednou z hlavných výhod krížovej validácie je jej schopnosť odhaliť preučenie. Validovaním modelu na viacerých podmnožinách dát poskytuje krížová validácia realistickejší odhad generalizácie modelu. Zabezpečuje, že model si nielen pamätá trénovacie dáta, ale skutočne sa naučí presne predikovať nové údaje. Na druhej strane, ak model dosahuje slabé výsledky vo všetkých validačných sadách, je to známka nedoučenia – teda neschopnosti zachytiť základné vzory v dátach.
Predstavme si dátovú sadu s 1000 príkladmi. Pri 5-násobnej krížovej validácii:
Krížová validácia je kľúčová pri ladení hyperparametrov. Napríklad pri trénovaní Support Vector Machine (SVM):
Keď je viacero kandidátov na nasadenie:
Pri časových radoch:
Python knižnice ako Scikit-learn poskytujú vstavané funkcie na krížovú validáciu.
Príklad implementácie k-násobnej krížovej validácie pomocou Scikit-learn:
from sklearn.model_selection import cross_val_score, KFold
from sklearn.svm import SVC
from sklearn.datasets import load_iris
# Načítanie datasetu
iris = load_iris()
X, y = iris.data, iris.target
# Vytvorenie SVM klasifikátora
svm_classifier = SVC(kernel='linear')
# Definovanie počtu foldov
num_folds = 5
kf = KFold(n_splits=num_folds, shuffle=True, random_state=42)
# Spustenie krížovej validácie
cross_val_results = cross_val_score(svm_classifier, X, y, cv=kf)
# Vyhodnotenie výsledkov
print(f'Výsledky krížovej validácie (Presnosť): {cross_val_results}')
print(f'Priemerná presnosť: {cross_val_results.mean()}')
Krížová validácia je štatistická metóda na odhad schopností modelov strojového učenia. Primárne sa používa v aplikovanom strojovom učení na odhad výkonu modelu na nových dátach. Krížová validácia zahŕňa rozdelenie dát na doplnkové podmnožiny, vykonanie analýzy na jednej podmnožine (trénovacia sada) a validáciu analýzy na druhej podmnožine (testovacia sada). Pre hlbšie pochopenie krížovej validácie môžeme odkázať na niekoľko vedeckých článkov:
Approximate Cross-validation: Guarantees for Model Assessment and Selection
Ashia Wilson, Maximilian Kasy, and Lester Mackey (2020)
Diskutuje o výpočtovej náročnosti krížovej validácie s mnohými foldmi, navrhuje aproximáciu pomocou jedného Newtonovho kroku a poskytuje záruky pre nespojitý predikčný problém.
Viac informácií tu
Counterfactual Cross-Validation: Stable Model Selection Procedure for Causal Inference Models
Yuta Saito and Shota Yasui (2020)
Zameriava sa na výber modelu pri predikcii podmieneného priemerného efektu liečby, navrhuje nový metriku na stabilné a presné porovnanie výkonu, užitočné v kauzálnych inferenciách.
Viac informácií tu
Blocked Cross-Validation: A Precise and Efficient Method for Hyperparameter Tuning
Giovanni Maria Merola (2023)
Predstavuje blokovanú krížovú validáciu (BCV), ktorá poskytuje presnejšie odhady chýb pri menšom množstve výpočtov, čím zvyšuje efektivitu ladenia hyperparametrov.
Viac informácií tu
Krížová validácia je štatistická metóda, ktorá rozdeľuje dáta na viacero trénovacích a validačných sád na vyhodnotenie výkonu modelu a zabezpečenie jeho dobrej generalizácie na nevidené dáta.
Pomáha odhaliť preučenie alebo nedoučenie, poskytuje realistický odhad výkonu modelu a usmerňuje ladenie hyperparametrov a výber modelu.
Medzi bežné typy patrí K-násobná validácia, stratifikovaná K-násobná validácia, Leave-One-Out (LOOCV), Holdout metóda, krížová validácia časových radov, Leave-P-Out a Monte Carlo krížová validácia.
Trénovaním a vyhodnocovaním modelov na viacerých podmnožinách dát pomáha krížová validácia identifikovať optimálnu kombináciu hyperparametrov, ktorá maximalizuje validačný výkon.
Krížová validácia môže byť výpočtovo náročná, najmä pri veľkých dátových sadách alebo metódach ako LOOCV, a môže vyžadovať opatrnosť pri nevyvážených dátach alebo časových radoch.
Inteligentné chatboty a AI nástroje pod jednou strechou. Prepojte intuitívne bloky a premeňte svoje nápady na automatizované Flowy.
Krivka učenia v umelej inteligencii je grafické znázornenie ilustrujúce vzťah medzi výkonnosťou modelu a premennými, ako je veľkosť dátovej množiny alebo počet ...
Plocha pod krivkou (AUC) je základná metrika v strojovom učení, ktorá sa používa na hodnotenie výkonnosti binárnych klasifikačných modelov. Kvantifikuje celkovú...
Validácia údajov v AI označuje proces hodnotenia a zabezpečenia kvality, presnosti a spoľahlivosti údajov používaných na trénovanie a testovanie AI modelov. Zah...