Logaritmická ztráta (Log Loss)
Logaritmická ztráta, nebo také křížová entropie (cross-entropy loss), je klíčová metrika pro hodnocení výkonu modelů strojového učení—zejména pro binární klasif...
Logistická regrese predikuje binární výstupy pomocí logistické funkce s využitím ve zdravotnictví, financích, marketingu a AI.
Logistická regrese je statistická a strojově-učící metoda používaná k predikci binárních výsledků z dat. Odhaduje pravděpodobnost, že k události dojde na základě jedné nebo více nezávislých proměnných. Hlavní výstupní proměnnou v logistické regresi je binární nebo dichotomická proměnná, což znamená, že má dva možné výsledky, například úspěch/neúspěch, ano/nebo 0/1.
Jádrem logistické regrese je logistická funkce, známá také jako sigmoidální funkce. Tato funkce převádí předpovězené hodnoty na pravděpodobnosti mezi 0 a 1, což ji činí vhodnou pro úlohy binární klasifikace. Vzorec logistické funkce je vyjádřen jako:
P(y=1|x) = 1 / (1 + e^-(β₀ + β₁x₁ + … + βₙxₙ))
Zde (β₀, β₁, …, βₙ) jsou koeficienty naučené z dat a (x₁, …, xₙ) jsou nezávislé proměnné.
Binární logistická regrese
Nejčastější typ, kdy závislá proměnná má pouze dva možné výsledky.
Příklad: Predikce, zda je e-mail spam (1) nebo není spam (0).
Multinomiální logistická regrese
Používá se, když závislá proměnná má tři nebo více neuspořádaných kategorií.
Příklad: Predikce žánru filmu, například akce, komedie nebo drama.
Ordinální logistická regrese
Platí, když závislá proměnná má uspořádané kategorie.
Příklad: Hodnocení spokojenosti zákazníka (špatné, průměrné, dobré, vynikající).
Šance a logaritmické šance:
Logistická regrese modeluje logaritmické šance výskytu závislé události. Šance představují poměr pravděpodobnosti, že se událost stane, k pravděpodobnosti, že se nestane. Logaritmické šance jsou přirozeným logaritmem šancí.
Poměr šancí:
Je to exponenciovaná hodnota koeficientu logistické regrese, která kvantifikuje změnu šancí vyplývající z jednotkové změny prediktoru, za předpokladu, že ostatní proměnné zůstávají konstantní.
V oblasti AI je logistická regrese základním nástrojem pro úlohy binární klasifikace. Slouží jako srovnávací model díky své jednoduchosti a účinnosti. V AI aplikacích jako jsou chatboty lze logistickou regresi využít pro klasifikaci záměru, například určení, zda uživatelský dotaz spadá do kategorie podpory, prodeje či obecného dotazu.
Logistická regrese je významná i v AI automatizaci, zvláště v úlohách učení s učitelem, kde se model učí na základě označených dat předpovídat výsledky pro nová, neznámá data. Často se používá ve spojení s dalšími technikami pro předzpracování dat, například převodem kategoriálních proměnných na binární pomocí one-hot encodingu pro složitější modely jako jsou neuronové sítě.
Logistická regrese je základní statistická metoda používaná pro binární klasifikaci, která má široké využití v různých oblastech, například v detekci podvodů, lékařské diagnostice nebo doporučovacích systémech. Níže jsou uvedeny některé klíčové vědecké články, které poskytují detailní vhled do problematiky logistické regrese:
Název článku | Autoři | Publikováno | Shrnutí | Odkaz |
---|---|---|---|---|
Logistic Regression as Soft Perceptron Learning | Raul Rojas | 2017-08-24 | Diskutuje propojení logistické regrese a perceptronového algoritmu učení. Zdůrazňuje, že logistické učení je v podstatě „měkkou“ variantou perceptronového učení a poskytuje vhled do základních mechanismů algoritmu logistické regrese. | Více zde |
Online Efficient Secure Logistic Regression based on Function Secret Sharing | Jing Liu, Jamie Cui, Cen Chen | 2023-09-18 | Řeší otázky ochrany soukromí při trénování logistických regresních modelů s daty od různých subjektů. Představuje protokol na ochranu soukromí založený na Function Secret Sharing (FSS) pro logistickou regresi, navržený pro efektivní online trénink, který je klíčový pro zpracování velkého objemu dat. | Více zde |
A Theoretical Analysis of Logistic Regression and Bayesian Classifiers | Roman V. Kirin | 2021-08-08 | Zkoumá základní rozdíly mezi logistickou regresí a Bayesovskými klasifikátory, zejména s ohledem na exponenciální a neexponenciální rozdělení. Diskutuje podmínky, za kterých jsou předpovězené pravděpodobnosti obou modelů nerozeznatelné. | Více zde |
Logistická regrese se používá k predikci binárních výsledků, například zda je e-mail spam nebo ne, určení přítomnosti nemoci, scoringu úvěrů a detekci podvodů.
Klíčové předpoklady zahrnují binární závislou proměnnou, nezávislost chyb, absenci multikolinearity mezi prediktory, lineární vztah s logaritmickými šancemi a velký vzorek dat.
Výhody zahrnují interpretovatelnost koeficientů jako poměru šancí, výpočetní efektivitu a univerzálnost při práci s binárními, multinomiálními i ordinálními odpověďmi.
Omezení zahrnují předpoklad linearity s logaritmickými šancemi, citlivost na odlehlé hodnoty a nevhodnost pro predikci spojitých výstupů.
Chytré chatboty a AI nástroje pod jednou střechou. Spojte intuitivní bloky a proměňte své nápady v automatizované Flows.
Logaritmická ztráta, nebo také křížová entropie (cross-entropy loss), je klíčová metrika pro hodnocení výkonu modelů strojového učení—zejména pro binární klasif...
Lineární regrese je základní analytická technika ve statistice a strojovém učení, která modeluje vztah mezi závislými a nezávislými proměnnými. Díky své jednodu...
Regrese pomocí náhodného lesa je výkonný algoritmus strojového učení používaný pro prediktivní analytiku. Vytváří více rozhodovacích stromů a průměruje jejich v...