Loggtap
Loggtap, eller logaritmisk/kryss-entropi-tap, er en nøkkelmetrik for å evaluere ytelsen til maskinlæringsmodeller—spesielt for binær klassifisering—ved å måle a...
Logistisk regresjon forutsier binære utfall ved bruk av logistisk funksjon, med anvendelser innen helsevesen, finans, markedsføring og AI.
Logistisk regresjon er en statistisk og maskinlæringsmetode som brukes til å forutsi binære utfall fra data. Den estimerer sannsynligheten for at en hendelse vil inntreffe basert på én eller flere uavhengige variabler. Den primære utfallsvariabelen i logistisk regresjon er binær eller dikotom, noe som betyr at den har to mulige utfall som suksess/fiasko, ja/nei, eller 0/1.
Kjernen i logistisk regresjon er den logistiske funksjonen, også kjent som sigmoid-funksjonen. Denne funksjonen omformer predikerte verdier til sannsynligheter mellom 0 og 1, noe som gjør den egnet for binære klassifiseringsoppgaver. Formelen for den logistiske funksjonen uttrykkes som:
P(y=1|x) = 1 / (1 + e^-(β₀ + β₁x₁ + … + βₙxₙ))
Her er (β₀, β₁, …, βₙ) koeffisientene som læres fra dataene, og (x₁, …, xₙ) er de uavhengige variablene.
Binær logistisk regresjon
Den vanligste typen hvor den avhengige variabelen kun har to mulige utfall.
Eksempel: Forutsi om en e-post er spam (1) eller ikke spam (0).
Multinomiell logistisk regresjon
Brukes når den avhengige variabelen har tre eller flere uordnede kategorier.
Eksempel: Forutsi sjangeren til en film, som action, komedie eller drama.
Ordinal logistisk regresjon
Aktuell når den avhengige variabelen har ordnede kategorier.
Eksempel: Kundetilfredshetsvurderinger (dårlig, middels, god, utmerket).
Odds og log odds:
Logistisk regresjon modellerer log odds for at den avhengige hendelsen skal inntreffe. Odds representerer forholdet mellom sannsynligheten for at hendelsen inntreffer og at den ikke inntreffer. Log odds er den naturlige logaritmen til odds.
Oddsforhold:
Dette er den eksponensierte verdien av koeffisienten i logistisk regresjon, som kvantifiserer endringen i odds som følge av en enhets endring i prediktorvariabelen, mens alle andre variabler holdes konstante.
Innen AI-feltet er logistisk regresjon et grunnleggende verktøy for binære klassifiseringsproblemer. Den brukes ofte som en baseline-modell på grunn av sin enkelhet og effektivitet. I AI-drevne applikasjoner som chatboter kan logistisk regresjon brukes for intensjonsklassifisering, altså for å avgjøre om en brukerhenvendelse tilhører en bestemt kategori som support, salg eller generelle spørsmål.
Logistisk regresjon er også viktig innen AI-automatisering, særlig i oppgaver med overvåket læring der modellen lærer fra merkede data for å forutsi utfall for nye, ukjente data. Den brukes ofte i kombinasjon med andre teknikker for å forhåndsprosessere data, for eksempel ved å konvertere kategoriske egenskaper til binær form via one-hot encoding for mer komplekse modeller som nevrale nettverk.
Logistisk regresjon er en grunnleggende statistisk metode brukt for binær klassifisering, som har brede anvendelser i ulike felt som svindeldeteksjon, medisinsk diagnostikk og anbefalingssystemer. Nedenfor følger noen viktige vitenskapelige artikler som gir en grundig forståelse av logistisk regresjon:
Tittel på artikkel | Forfattere | Publisert | Sammendrag | Lenke |
---|---|---|---|---|
Logistic Regression as Soft Perceptron Learning | Raul Rojas | 2017-08-24 | Diskuterer forbindelsen mellom logistisk regresjon og perseptron-læringsalgoritmen. Fremhever at logistisk læring i bunn og grunn er en “myk” variant av perseptronlæring, og gir innsikt i de underliggende mekanismene bak logistisk regresjonsalgoritmen. | Les mer |
Online Efficient Secure Logistic Regression based on Function Secret Sharing | Jing Liu, Jamie Cui, Cen Chen | 2023-09-18 | Tar for seg personvernutfordringer ved trening av logistiske regresjonsmodeller med data fra ulike parter. Introduserer en personvernbevarende protokoll basert på Function Secret Sharing (FSS) for logistisk regresjon, designet for å være effektiv under online treningsfase, avgjørende ved håndtering av store datamengder. | Les mer |
A Theoretical Analysis of Logistic Regression and Bayesian Classifiers | Roman V. Kirin | 2021-08-08 | Utforsker de grunnleggende forskjellene mellom logistisk regresjon og bayesiske klassifikatorer, spesielt med tanke på eksponentielle og ikke-eksponentielle fordelinger. Diskuterer betingelser der de predikerte sannsynlighetene fra begge modellene er uatskillelige. | Les mer |
Logistisk regresjon brukes til å forutsi binære utfall, som om en e-post er spam eller ikke, fastslå sykdomstilstedeværelse, kredittvurdering og svindeldeteksjon.
Viktige antakelser inkluderer en binær avhengig variabel, uavhengighet mellom feil, ingen multikollinearitet mellom prediktorer, en lineær sammenheng med log odds, og et stort utvalg.
Fordelene inkluderer tolkbarhet av koeffisienter som oddsforhold, beregningseffektivitet og allsidighet i håndtering av binære, multinomiale og ordinale responsvariabler.
Begrensninger inkluderer antakelsen om linearitet med log odds, følsomhet for uteliggere og at den ikke egner seg til å forutsi kontinuerlige utfall.
Smarte chatboter og AI-verktøy samlet på ett sted. Koble sammen intuitive blokker for å gjøre ideene dine om til automatiserte Flyter.
Loggtap, eller logaritmisk/kryss-entropi-tap, er en nøkkelmetrik for å evaluere ytelsen til maskinlæringsmodeller—spesielt for binær klassifisering—ved å måle a...
Lineær regresjon er en grunnleggende analytisk teknikk innen statistikk og maskinlæring, som modellerer forholdet mellom avhengige og uavhengige variabler. Kjen...
Random Forest-regresjon er en kraftig maskinlæringsalgoritme som brukes til prediktiv analyse. Den konstruerer flere beslutningstrær og gjennomsnittliggjør dere...