Logistinen regressio
Logistinen regressio on tilastollinen ja koneoppimisen menetelmä, jota käytetään binaaristen lopputulosten ennustamiseen datasta. Se arvioi tapahtuman todennäkö...
Lineaarinen regressio mallintaa muuttujien välisiä suhteita ja toimii sekä tilastotieteessä että koneoppimisessa yksinkertaisena mutta tehokkaana välineenä ennusteisiin ja analyysiin.
Riippuva ja riippumaton muuttuja
Lineaarisen regression yhtälö
Suhde ilmaistaan matemaattisesti seuraavasti:
Y = β₀ + β₁X₁ + β₂X₂ + … + βₚXₚ + ε
Missä:
Pienimmän neliösumman menetelmä
Tämä menetelmä arvioi kertoimet (β) minimoimalla havaittujen ja ennustettujen arvojen neliöityjen erotusten summan. Näin varmistetaan, että regressiosuora sopii aineistoon mahdollisimman hyvin.
Selityskerroin (R²)
R² ilmaisee, kuinka suuren osan riippuvan muuttujan vaihtelusta riippumattomat muuttujat pystyvät selittämään. R²-arvo 1 tarkoittaa täydellistä sopivuutta.
Jotta lineaarinen regressio tuottaisi luotettavia tuloksia, seuraavien oletusten tulee täyttyä:
Lineaarisen regression monipuolisuus tekee siitä soveltuvan monille aloille:
Tekoälyssä ja koneoppimisessa lineaarinen regressio toimii usein johdantomallina sen yksinkertaisuuden ja tehokkuuden ansiosta lineaaristen suhteiden käsittelyssä. Se toimii perustason mallina, jota käytetään vertailukohtana monimutkaisemmille algoritmeille. Sen tulkittavuus on erityisen arvostettua tilanteissa, joissa selittävyys on tärkeää, kuten päätöksenteossa, jossa muuttujien välisten suhteiden ymmärtäminen on olennaista.
Lineaarinen regressio on perustavanlaatuinen tilastollinen menetelmä, jolla mallinnetaan riippuvan muuttujan ja yhden tai useamman riippumattoman muuttujan suhdetta. Sitä käytetään laajasti ennakoivassa mallinnuksessa ja se on yksi yksinkertaisimmista regressioanalyysin muodoista. Alla on muutamia merkittäviä tieteellisiä artikkeleita, joissa käsitellään lineaarisen regression eri näkökulmia:
Robust Regression via Multivariate Regression Depth
Kirjoittaja: Chao Gao
Tässä artikkelissa tarkastellaan robustia regressiota Huberin ε-kontaminaatiomallien yhteydessä. Siinä tutkitaan estimaattoreita, jotka maksimoivat monimuuttujaisen regression syvyysfunktioita, ja osoitetaan niiden tehokkuus minimax-nopeuksien saavuttamisessa erilaisissa regressio-ongelmissa, mukaan lukien harva lineaarinen regressio. Tutkimuksessa esitellään yleinen syvyysfunktion käsite lineaarisille operaattoreille, mikä voi olla hyödyllistä robustille funktionaaliselle lineaariselle regressiolle. Lue lisää täältä.
Evaluating Hospital Case Cost Prediction Models Using Azure Machine Learning Studio
Kirjoittaja: Alexei Botchkarev
Tässä tutkimuksessa keskitytään sairaalatapausten kustannusten mallinnukseen ja ennustamiseen erilaisilla koneoppimisen regressioalgoritmeilla. Siinä arvioidaan 14 regressiomallia, mukaan lukien lineaarinen regressio, Azure Machine Learning Studiossa. Tulokset korostavat robustien regressiomallien, päätösmetsäregression ja boostatun päätöspuuregression ylivoimaisuutta sairaalakustannusten tarkassa ennustamisessa. Kehitetty työkalu on julkisesti saatavilla jatkokokeiluihin. Lue lisää täältä.
Are Latent Factor Regression and Sparse Regression Adequate?
Kirjoittajat: Jianqing Fan, Zhipeng Lou, Mengxin Yu
Tässä artikkelissa ehdotetaan Factor Augmented sparse linear Regression Model (FARM) -mallia, joka yhdistää latenttitekijöiden regression ja harvan lineaarisen regression. Se tarjoaa teoreettisen perustan mallin estimoinnille sekä sub-gaussisissa että raskashäntäisissä kohinoissa. Tutkimuksessa esitellään myös Factor-Adjusted de-Biased Test (FabTest) arvioimaan olemassa olevien regressiomallien riittävyyttä ja osoitetaan FARM-mallin robustius sekä tehokkuus laajojen numeeristen kokeiden avulla. Lue lisää täältä
Lineaarinen regressio on tilastollinen menetelmä, jolla mallinnetaan riippuvan muuttujan ja yhden tai useamman riippumattoman muuttujan välistä suhdetta olettaen, että suhde on lineaarinen.
Tärkeimmät oletukset ovat lineaarisuus, havaintojen riippumattomuus, homoskedastisuus (virheiden vakio varianssi) sekä residuaalien normaalijakauma.
Lineaarista regressiota käytetään laajasti ennakoivassa analytiikassa, liiketoiminnan ennustamisessa, terveydenhuollon tulosennusteissa, riskinarvioinnissa, kiinteistöjen arvonmäärityksessä sekä tekoälyn perustana koneoppimismallina.
Yksinkertainen lineaarinen regressio käsittelee yhtä riippumatonta muuttujaa, kun taas monimuuttujainen lineaarinen regressio hyödyntää kahta tai useampaa riippumatonta muuttujaa mallintaakseen riippuvaa muuttujaa.
Lineaarinen regressio on usein koneoppimisen lähtökohta sen yksinkertaisuuden, tulkittavuuden ja tehokkuuden ansiosta lineaaristen suhteiden mallinnuksessa, ja toimii vertailukohtana monimutkaisemmille algoritmeille.
Tutustu, kuinka FlowHuntin alusta mahdollistaa regressiomallien toteuttamisen, visualisoinnin ja tulkinnan älykkäämpien liiketoimintapäätösten tueksi.
Logistinen regressio on tilastollinen ja koneoppimisen menetelmä, jota käytetään binaaristen lopputulosten ennustamiseen datasta. Se arvioi tapahtuman todennäkö...
Oikaistu R-neliö on tilastollinen mittari, jota käytetään regressiomallin selitysasteen arviointiin. Se ottaa huomioon selittävien muuttujien määrän, jotta ylis...
Riippuvuusanalyysi on NLP:n syntaktisen analyysin menetelmä, joka tunnistaa kieliopilliset suhteet sanojen välillä muodostaen puumaisia rakenteita. Tämä on olee...