Logtab
Logtab, eller logaritmisk/kryds-entropitab, er en nøglemetrik til at evaluere ydeevnen af maskinlæringsmodeller—særligt til binær klassifikation—ved at måle afv...
Logistisk regression forudsiger binære udfald ved brug af den logistiske funktion, med anvendelser i sundhedsvæsen, finans, marketing og AI.
Logistisk regression er en statistisk og maskinlæringsmetode, der bruges til at forudsige binære udfald ud fra data. Den estimerer sandsynligheden for, at en begivenhed indtræffer baseret på en eller flere uafhængige variable. Den primære udfaldsvariabel i logistisk regression er binær eller dikotom, hvilket betyder, at den har to mulige udfald såsom succes/fiasko, ja/nej eller 0/1.
Kernen i logistisk regression er den logistiske funktion, også kendt som sigmoid-funktionen. Denne funktion kortlægger de forudsagte værdier til sandsynligheder mellem 0 og 1, hvilket gør den velegnet til binære klassifikationsopgaver. Formlen for den logistiske funktion udtrykkes som:
P(y=1|x) = 1 / (1 + e^-(β₀ + β₁x₁ + … + βₙxₙ))
Her er (β₀, β₁, …, βₙ) de koefficienter, der læres ud fra dataene, og (x₁, …, xₙ) de uafhængige variable.
Binær Logistisk Regression
Den mest almindelige type, hvor den afhængige variabel kun har to mulige udfald.
Eksempel: Forudsige om en e-mail er spam (1) eller ikke spam (0).
Multinomial Logistisk Regression
Bruges når den afhængige variabel har tre eller flere uordnede kategorier.
Eksempel: Forudsige genren af en film, såsom action, komedie eller drama.
Ordinal Logistisk Regression
Anvendes når den afhængige variabel har ordnede kategorier.
Eksempel: Kundetilfredshedsvurderinger (dårlig, middel, god, fremragende).
Odds og Log Odds:
Logistisk regression modellerer log odds for, at den afhængige begivenhed indtræffer. Odds repræsenterer forholdet mellem sandsynligheden for, at begivenheden indtræffer, og at den ikke gør. Log odds er den naturlige logaritme af odds.
Odds Ratio:
Det er den eksponentierede værdi af logistisk regressions koefficienten, som kvantificerer ændringen i odds som følge af en ændring på én enhed i prædiktorvariablen, mens alle andre variable holdes konstante.
Inden for AI er logistisk regression et grundlæggende værktøj til binære klassifikationsproblemer. Den fungerer som en baseline-model på grund af dens enkelhed og effektivitet. I AI-drevne applikationer som chatbots kan logistisk regression bruges til intentionklassificering, hvor det afgøres, om en brugers forespørgsel vedrører en specifik kategori såsom support, salg eller generelle forespørgsler.
Logistisk regression er også væsentlig i AI-automatisering, især inden for superviseret læring, hvor modellen lærer fra mærkede data for at forudsige udfald for nye, usete data. Den bruges ofte i kombination med andre teknikker til at forbehandle data, for eksempel ved at konvertere kategoriske variable til binær form med one-hot encoding til mere komplekse modeller som neurale netværk.
Logistisk regression er en grundlæggende statistisk metode, der bruges til binær klassifikation og har brede anvendelser inden for områder som svindelopsporing, medicinsk diagnostik og anbefalingssystemer. Nedenfor er nogle nøglevidenskabelige artikler, der giver en dybdegående forståelse af logistisk regression:
Artikel Titel | Forfattere | Udgivet | Resumé | Link |
---|---|---|---|---|
Logistic Regression as Soft Perceptron Learning | Raul Rojas | 2017-08-24 | Diskuterer forbindelsen mellem logistisk regression og perceptron-læringsalgoritmen. Fremhæver, at logistisk læring i det væsentlige er en “blød” variant af perceptron-læring og giver indsigt i de underliggende mekanismer i logistisk regressionsalgoritmen. | Læs mere |
Online Efficient Secure Logistic Regression based on Function Secret Sharing | Jing Liu, Jamie Cui, Cen Chen | 2023-09-18 | Tager fat på privatlivsproblemer ved træning af logistiske regressionsmodeller med data fra forskellige parter. Introducerer en privatlivsbevarende protokol baseret på Function Secret Sharing (FSS) for logistisk regression, designet til at være effektiv under online-træningsfasen — afgørende for håndtering af store datamængder. | Læs mere |
A Theoretical Analysis of Logistic Regression and Bayesian Classifiers | Roman V. Kirin | 2021-08-08 | Udforsker de grundlæggende forskelle mellem logistisk regression og Bayesianske klassifikatorer, især hvad angår eksponentielle og ikke-eksponentielle fordelinger. Diskuterer de betingelser, hvorunder de forudsagte sandsynligheder fra begge modeller er uadskillelige. | Læs mere |
Logistisk regression bruges til at forudsige binære udfald, såsom om en e-mail er spam eller ej, diagnosticering af sygdomme, kreditvurdering og afsløring af svindel.
Vigtige antagelser inkluderer en binær afhængig variabel, uafhængighed mellem fejl, ingen multikollinearitet mellem prædiktorer, en lineær sammenhæng med log odds samt et stort stikprøvestørrelse.
Fordele inkluderer fortolkning af koefficienter som odds-ratioer, beregningseffektivitet og alsidighed i håndtering af binære, multinomiale og ordinale responsvariable.
Begrænsninger inkluderer antagelsen om linearitet med log odds, følsomhed over for outliers og at den ikke er egnet til at forudsige kontinuerlige udfald.
Smarte chatbots og AI-værktøjer samlet ét sted. Forbind intuitive blokke for at gøre dine idéer til automatiserede flows.
Logtab, eller logaritmisk/kryds-entropitab, er en nøglemetrik til at evaluere ydeevnen af maskinlæringsmodeller—særligt til binær klassifikation—ved at måle afv...
Lineær regression er en grundlæggende analytisk teknik inden for statistik og maskinlæring, der modellerer forholdet mellem afhængige og uafhængige variabler. K...
Random Forest Regression er en kraftfuld maskinlæringsalgoritme, der bruges til forudsigende analyse. Den konstruerer flere beslutningstræer og gennemsnitliggør...