Koulutusvirhe
Koulutusvirhe tekoälyssä ja koneoppimisessa tarkoittaa mallin ennustettujen ja todellisten tulosten välistä eroavaisuutta koulutusvaiheen aikana. Se on keskeine...
Recall mittaa mallin kykyä tunnistaa positiiviset tapaukset oikein, mikä on olennaista esimerkiksi petosten havaitsemisessa, lääketieteellisessä diagnostiikassa ja tekoälyn automaatiossa.
Mitä recall tarkoittaa koneoppimisessa?
Koneoppimisen parissa, erityisesti luokitteluongelmissa, mallin suorituskyvyn arviointi on ensiarvoisen tärkeää. Yksi keskeisistä mittareista, jolla arvioidaan mallin kykyä tunnistaa positiiviset tapaukset oikein, on recall. Tämä mittari on olennainen tilanteissa, joissa positiivisen tapauksen missaaminen (false negatives) voi johtaa merkittäviin seurauksiin. Tässä kattavassa oppaassa perehdytään siihen, mitä recall tarkoittaa, miten sitä käytetään koneoppimisessa, tarjotaan yksityiskohtaisia esimerkkejä ja käyttötapauksia sekä selitetään sen merkitys tekoälyssä, automaatiossa ja chatboteissa.
Recall, joka tunnetaan myös nimillä herkkyys tai true positive rate, on mittari, joka ilmaisee kuinka suuren osuuden todellisista positiivisista tapauksista koneoppimismalli tunnistaa oikein. Se mittaa mallin kykyä löytää kaikki olennaiset tapaukset aineistosta.
Matemaattisesti recall määritellään seuraavasti:
Recall = True Positives / (True Positives + False Negatives)
Missä:
Recall on yksi useista luokittelumittareista, joilla arvioidaan mallien suorituskykyä, erityisesti binäärisessä luokittelussa. Se keskittyy mallin kykyyn tunnistaa kaikki positiiviset tapaukset, ja on erityisen tärkeä silloin, kun positiivisen tapauksen missaaminen aiheuttaa suuria kustannuksia.
Recall liittyy läheisesti muihin luokittelumittareihin, kuten precisioniin ja tarkkuuteen (accuracy). Ymmärtämällä miten recall vuorovaikuttaa näiden mittareiden kanssa, voi arvioida mallin suorituskykyä kattavammin.
Recallin käsitteen ymmärtämiseksi on tärkeää tuntea sekavuusmatriisi (confusion matrix), joka tarjoaa yksityiskohtaisen kuvan mallin suorituskyvystä.
Sekavuusmatriisi on taulukko, joka tiivistää luokittelumallin suorituskyvyn näyttämällä oikeiden ja väärien positiivisten ja negatiivisten tapausten määrät. Se näyttää tältä:
Ennustettu positiivinen | Ennustettu negatiivinen |
---|---|
Todellinen positiivinen | True Positive (TP) |
Todellinen negatiivinen | False Positive (FP) |
Sekavuusmatriisi auttaa näkemään paitsi oikeiden ennustusten määrän, myös millaisia virheitä on tehty, kuten false positives ja false negatives.
Sekavuusmatriisin avulla recall lasketaan seuraavasti:
Recall = TP / (TP + FN)
Tämä kaava kuvaa kuinka suuri osa todellisista positiivisista tapauksista tunnistettiin oikein.
Binäärisessä luokittelussa tapaukset jaetaan kahteen luokkaan: positiivisiin ja negatiivisiin. Recall on erityisen tärkeä tällaisissa ongelmissa, etenkin kun käsitellään epätasapainoisia aineistoja.
Epätasapainoisessa aineistossa luokkien tapausten määrät eivät ole suunnilleen yhtä suuret. Esimerkiksi petosten tunnistuksessa petollisten tapahtumien (positiivinen luokka) määrä on huomattavasti pienempi kuin laillisten tapahtumien (negatiivinen luokka). Tällöin mallin tarkkuus voi olla harhaanjohtava, koska malli voi saada korkean tarkkuuden pelkästään ennustamalla enemmistöluokkaa.
Kuvitellaan aineisto, jossa on 10 000 taloudellista tapahtumaa:
Oletetaan, että koneoppimismalli ennustaa:
Recallin laskeminen:
Recall = TP / (TP + FN)
Recall = 70 / (70 + 30)
Recall = 70 / 100
Recall = 0.7
Recall on 70 %, eli malli tunnisti 70 % petollisista tapahtumista. Petosten tunnistuksessa petollisten tapausten missaaminen (false negatives) voi olla kallista, joten korkea recall on toivottavaa.
Precision mittaa, kuinka suuri osuus positiivisiksi ennustetuista tapauksista on todellisuudessa positiivisia. Se vastaa kysymykseen: “Kuinka moni mallin positiiviseksi ennustamista tapauksista oli todella positiivinen?”
Precisionin kaava:
Precision = TP / (TP + FP)
Precisionin ja recallin välillä on usein kompromissi:
Sopiva tasapaino riippuu sovelluksen erityistarpeista.
Sähköpostin roskapostisuodatuksessa:
Optimaalinen tasapaino riippuu siitä, onko tärkeämpää välttää roskapostin pääsyä postilaatikkoon vai varmistaa, ettei yhtään laillista viestiä mene hukkaan.
Sairauksien tunnistuksessa positiivisen tapauksen missaaminen (potilas on sairas, mutta ei tunnisteta) voi johtaa vakaviin seurauksiin.
Petollisten tapahtumien tunnistaminen taloudellisissa prosesseissa.
Tunkeutumisten tai luvatonta pääsyn tunnistaminen.
Tekoälypohjaisissa chatboteissa käyttäjän aikomusten ymmärtäminen ja oikea reagointi on tärkeää.
Vikojen tai virheiden tunnistaminen tuotteissa.
Oletetaan, että käytössä on aineisto binääriluokitteluun, esimerkiksi asiakaspoistuman ennustamiseen:
Mallin jälkeen saadaan seuraava sekavuusmatriisi:
Ennustettu poistuma | Ennustettu ei-poistuma |
---|---|
Todellinen poistuma | TP = 160 |
Todellinen ei-poistuma | FP = 50 |
Recallin laskeminen:
Recall = TP / (TP + FN)
Recall = 160 / (160 + 40)
Recall = 160 / 200
Recall = 0.8
Recall on 80 %, eli malli tunnisti oikein 80 % poistuvista asiakkaista.
Recallin parantamiseksi voi hyödyntää seuraavia strategioita:
Recallin ymmärtäminen matemaattisesta näkökulmasta syventää aihetta.
Recall voidaan nähdä ehdollisena todennäköisyytenä:
Recall = P(Ennustettu positiivinen | Todellinen positiivinen)
Tämä kuvaa todennäköisyyttä, että malli ennustaa tapauksen positiiviseksi, kun se on oikeasti positiivinen.
Korkea recall tarkoittaa matalaa tyyppi II virhettä eli vähän false negatives -tuloksia.
Recall on sama asia kuin True Positive Rate (TPR), jota käytetään ROC-käyrässä (Receiver Operating Characteristic), jossa TPR asetetaan False Positive Ratea (FPR) vastaan.
Koneoppimisen alalla recallin käsite on keskeinen mallien tehokkuuden arvioinnissa, erityisesti luokittelutehtävissä. Tässä on yhteenveto tutkimusartikkeleista, jotka käsittelevät recallia eri näkökulmista:
Show, Recall, and Tell: Image Captioning with Recall Mechanism (Julkaistu: 2021-03-12)
Tässä artikkelissa esitellään uusi recall-mekanismi, joka pyrkii parantamaan kuvatekstitystä jäljittelemällä ihmisen kognitiota. Ratkaisu koostuu kolmesta osasta: recall-yksikkö relevanttien sanojen hakemiseen, semanttinen opas kontekstuaalisen tuen tuottamiseen sekä recalled-word slotit sanojen integrointiin kuvateksteihin. Tutkimuksessa hyödynnetään tekstin tiivistämisestä inspiroitunutta soft switch -menetelmää sanojen luontitodennäköisyyksien tasapainottamiseen. Lähestymistapa parantaa merkittävästi BLEU-4-, CIDEr- ja SPICE-pisteitä MSCOCO-datassa ja ylittää muut huippumenetelmät. Tulokset osoittavat recall-mekanismien potentiaalin kuvailevan tarkkuuden parantamisessa kuvatekstityksessä. Lue artikkeli täältä.
Online Learning with Bounded Recall (Julkaistu: 2024-05-31)
Tässä tutkimuksessa tarkastellaan rajatun recallin (bounded recall) käsitettä verkko-oppimisessa tilanteessa, jossa algoritmin päätökset perustuvat vain rajattuun määrään aiempia palkkioita. Kirjoittajat osoittavat, että perinteiset keskiarvoon perustuvat no-regret-algoritmit epäonnistuvat rajatun recallin olosuhteissa, mikä johtaa vakioregretin kertymiseen kierroksittain. Tutkimuksessa esitetään stationaarinen bounded-recall-algoritmi, joka saavuttaa regretin $\Theta(1/\sqrt{M})$ kierrosta kohden, ja esitetään sille tiukka alaraja. Tutkimus korostaa, että tehokkaiden bounded-recall-algoritmien tulee huomioida aiempien tappioiden järjestys, mikä eroaa täydellisen recallin asetelmasta. Lue artikkeli täältä.
Recall, Robustness, and Lexicographic Evaluation (Julkaistu: 2024-03-08)
Tässä artikkelissa kritisoidaan recallin käyttöä ranking-arvioinneissa ja esitetään muodollisempi arviointikehys. Kirjoittajat esittelevät “recall-orientaation” käsitteen ja liittävät sen oikeudenmukaisuuteen ranking-järjestelmissä. He ehdottavat leksikografista arviointimenetelmää, “lexirecallia”, joka osoittaa suurempaa herkkyyttä ja vakautta perinteisiin recall-mittareihin verrattuna. Empiiristen analyysien perusteella useissa suosittelu- ja hakutehtävissä lexirecall todettiin erottelevammaksi ja soveltuvaksi vivahteikkaampiin ranking-arviointeihin. Lue artikkeli täältä.
Recall, joka tunnetaan myös nimellä herkkyys tai true positive rate, ilmaisee kuinka suuren osuuden todellisista positiivisista tapauksista koneoppimismalli tunnistaa oikein. Se lasketaan jakamalla True Positives arvojen summa True Positives ja False Negatives yhteenlasketulla määrällä.
Recall on erityisen tärkeä silloin, kun positiivisten tapausten missaaminen (false negatives) voi aiheuttaa merkittäviä seurauksia, kuten petosten tunnistuksessa, lääketieteellisessä diagnostiikassa tai turvajärjestelmissä. Korkea recall varmistaa, että suurin osa positiivisista tapauksista tunnistetaan.
Recall mittaa, kuinka monta todellisista positiivisista tapauksista tunnistetaan oikein, kun taas precision mittaa, kuinka moni mallin positiiviseksi ennustamista tapauksista on oikeasti positiivinen. Näiden välillä on usein kompromissi, joka riippuu sovelluksen tarpeista.
Recallia voi parantaa keräämällä lisää dataa positiivisesta luokasta, käyttämällä uudelleennäytteenotto- tai data-augmentaatiotekniikoita, säätämällä luokittelukynnystä, soveltamalla kustannusherkkää oppimista ja hienosäätämällä mallin hyperparametreja.
Recall on erityisen tärkeä lääketieteellisessä diagnostiikassa, petosten tunnistuksessa, turvallisuusjärjestelmissä, asiakaspalvelun chatbot-ratkaisuissa sekä valmistuksen vikatilanteiden havaitsemisessa—kaikissa tilanteissa, joissa positiivisten tapausten missaaminen on kallista tai vaarallista.
Aloita tekoälypohjaisten ratkaisujen ja chatbotien rakentaminen, jotka hyödyntävät keskeisiä koneoppimisen mittareita, kuten recallia, parempaan automaatioon ja oivalluksiin.
Koulutusvirhe tekoälyssä ja koneoppimisessa tarkoittaa mallin ennustettujen ja todellisten tulosten välistä eroavaisuutta koulutusvaiheen aikana. Se on keskeine...
Ristivalidointi on tilastollinen menetelmä, jota käytetään koneoppimismallien arvioimiseen ja vertailuun jakamalla data useita kertoja koulutus- ja validointijo...
Reinforcement Learning from Human Feedback (RLHF) eli vahvistusoppiminen ihmisen palautteella on koneoppimistekniikka, jossa ihmisen antamaa palautetta hyödynne...