Gjennomsnittlig absolutt feil (MAE)

Gjennomsnittlig absolutt feil (MAE)

Gjennomsnittlig absolutt feil (MAE) måler gjennomsnittlig størrelse på prediksjonsfeil i regresjonsmodeller, og gir en enkel og tolkbar måte å evaluere modellnøyaktighet på.

Gjennomsnittlig absolutt feil (MAE)

Gjennomsnittlig absolutt feil (MAE) er en sentral metrikk i maskinlæring for evaluering av regresjonsmodeller, og måler gjennomsnittlig feilstørrelse uten retning. Den er robust mot uteliggere og lett å tolke i målvariabelens enhet, noe som gjør den nyttig for modellevaluering.

Gjennomsnittlig absolutt feil (MAE) er en grunnleggende metrikk i maskinlæring, spesielt brukt ved evaluering av regresjonsmodeller. Den måler den gjennomsnittlige størrelsen på feil i et sett med prediksjoner, uten å ta hensyn til retningen. Denne metrikken gir en enkel måte å kvantifisere nøyaktigheten til en modell ved å beregne gjennomsnittet av de absolutte forskjellene mellom predikerte og faktiske verdier. I motsetning til noen andre metrikker opphøyer ikke MAE feilene i andre, noe som betyr at alle avvik tillegges lik vekt uansett størrelse. Denne egenskapen gjør MAE spesielt nyttig når man skal vurdere størrelsen på prediksjonsfeil uten å tildele ulik vekt til over- eller underestimeringer.

Mean Absolute Error formula

Hvordan beregnes MAE?

Formelen for MAE uttrykkes som:

Hvor:

  • n representerer antall observasjoner.
  • yi betegner den faktiske verdien.
  • ŷi angir den predikerte verdien.

MAE beregnes ved å ta den absolutte verdien av hver prediksjonsfeil, summere disse absolutte feilene, og deretter dele på antall prediksjoner. Dette gir en gjennomsnittlig feilstørrelse som er lett å tolke og formidle.

Viktigheten av MAE i AI-trening

MAE har stor betydning i AI-trening på grunn av sin enkelhet og tolkbarhet. Fordelene inkluderer:

  • Robusthet mot uteliggere: I motsetning til gjennomsnittlig kvadrert feil (MSE), som opphøyer differansene i andre og dermed er mer følsom for uteliggere, behandler MAE alle feil likt, noe som gjør den mindre følsom for ekstreme verdier.
  • Tolkbarhet: MAE uttrykkes i samme enhet som målvariabelen, noe som gjør den lett å tolke. For eksempel, hvis en modell predikerer boligpriser i kroner, vil MAE også være i kroner og gi en klar forståelse av gjennomsnittlig prediksjonsfeil.
  • Anvendelighet: MAE brukes mye på tvers av ulike domener, inkludert finans, ingeniørfag og meteorologi, for effektiv evaluering av regresjonsmodeller.

Bruksområder og eksempler

  1. Modellevaluering:
    I praktiske scenarier brukes MAE til å evaluere ytelsen til regresjonsmodeller. For eksempel, ved prediksjon av boligpriser, indikerer en MAE på 1 000 kroner at de predikerte prisene i gjennomsnitt avviker med 1 000 kroner fra de faktiske prisene.

  2. Sammenligning av modeller:
    MAE fungerer som en pålitelig metrikk for å sammenligne ytelsen til ulike modeller. En lavere MAE antyder bedre modellprestasjon. Hvis for eksempel en Support Vector Machine (SVM)-modell gir en MAE på 28,85 grader i temperaturprediksjon, mens en Random Forest-modell gir en MAE på 33,83 grader, anses SVM-modellen som mer nøyaktig.

  3. Virkelige applikasjoner:
    MAE brukes i ulike applikasjoner som stråleterapi, der den benyttes som tapsfunksjon i dyp læringsmodeller som DeepDoseNet for 3D doseprediksjon, og overgår modeller som bruker MSE.

  4. Miljømodellering:
    I miljømodellering brukes MAE til å vurdere usikkerhet i prediksjoner, og gir en balansert fremstilling av feil sammenlignet med RMSE.

Sammenligning med andre metrikker

MetrikkStraffer store feilMåleenhetFølsomhet for uteliggereNår bør den brukes
Gjennomsnittlig absolutt feil (MAE)NeiSamme som målvariabelenMindre følsomNår tolkbarhet og robusthet mot uteliggere er viktig
Gjennomsnittlig kvadrert feil (MSE)Ja (opphøyer feil i andre)Kvadrert enhetMer følsomNår store feil er spesielt uønsket
Rot av gjennomsnittlig kvadrert feil (RMSE)Ja (opphøyer og roterer feil)Samme som målvariabelenMer følsomNår store avvik er kritiske
Gjennomsnittlig absolutt prosentvis feil (MAPE)NeiProsent (%)VariererNår relativ prosentvis feil er viktig
  • Gjennomsnittlig kvadrert feil (MSE): I motsetning til MAE opphøyer MSE differansene i andre, og straffer dermed større feil hardere. Dette gjør MSE mer følsom for uteliggere, og nyttig når store feil er spesielt uønsket.
  • Rot av gjennomsnittlig kvadrert feil (RMSE): RMSE er kvadratroten av MSE, og gir feil i samme enhet som dataene. Den straffer store feil hardere enn MAE, og passer når store avvik er kritiske.
  • Gjennomsnittlig absolutt prosentvis feil (MAPE): MAPE uttrykker feil som prosent, og gir et relativt mål på feilen. Den tilsvarer vektet MAE-regresjon og er nyttig for å vurdere modellnøyaktighet i prosent.

Implementeringseksempel i Python

MAE kan beregnes med Python’s sklearn-bibliotek slik:

from sklearn.metrics import mean_absolute_error
import numpy as np

# Eksempeldata
y_true = np.array([1, 2, 3, 4, 5])
y_pred = np.array([1.5, 2.5, 2.8, 4.2, 4.9])

# Beregn MAE
mae = mean_absolute_error(y_true, y_pred)
print("Gjennomsnittlig absolutt feil:", mae)

Når bør MAE brukes?

MAE er ideell når:

  • Målet er å evaluere den absolutte størrelsen på prediksjonsfeil.
  • Datasettet inneholder uteliggere som kan påvirke kvadrerte feilmetrikker som MSE.
  • Tolking i samme enhet som målvariabelen er ønskelig.

Begrensninger med MAE

Selv om MAE er allsidig og mye brukt, har den noen begrensninger:

  • Den gir ikke informasjon om retningen på feilen (over- eller underprediksjon).
  • Den behandler alle feil likt, noe som kanskje ikke er ideelt i situasjoner der større feil bør straffes hardere.

Forskning på gjennomsnittlig absolutt feil i AI-trening

Gjennomsnittlig absolutt feil (MAE) er en mye brukt metrikk i AI-trening, spesielt for å evaluere nøyaktigheten til prediktive modeller. Nedenfor er et sammendrag av nyere forskning som involverer MAE:

  1. Generativ AI for rask og nøyaktig statistisk beregning av væsker
    Denne artikkelen introduserer en generativ AI-algoritme kalt GenCFD, utviklet for rask og nøyaktig statistisk beregning av turbulente væskestrømmer. Algoritmen benytter en betinget score-basert diffusjonsmodell for å oppnå høykvalitets tilnærminger av statistiske størrelser, inkludert gjennomsnitt og varians. Studien fremhever at tradisjonelle operator-læringsmodeller, som ofte minimerer gjennomsnittlig absolutt feil, har en tendens til å regresere mot gjennomsnittsstrømningsløsninger. Forfatterne presenterer teoretiske innsikter og numeriske eksperimenter som viser algoritmens overlegne ytelse i å generere realistiske væskestrømsprøver. Les artikkelen

  2. AI-drevet dynamisk feiloppdagelse og ytelsesvurdering i solenergianlegg
    Denne forskningen fokuserer på å forbedre feiloppdagelse i solcelleanlegg ved hjelp av AI, spesielt gjennom maskinlæringsalgoritmer. Studien understreker viktigheten av nøyaktig karakterisering av effekttap og deteksjon av feil for å optimalisere ytelsen. Den rapporterer utviklingen av en beregningsmodell som oppnår en gjennomsnittlig absolutt feil på 6,0 % i daglig energiberegning, og demonstrerer effektiviteten av AI for feiloppdagelse og ytelsesvurdering av systemer. Les artikkelen

  3. Beregningseffektiv maskinlæringsbasert online batteritilstandsestimering
    Artikkelen utforsker datadrevne metoder for å estimere helsetilstanden (SoH) til batterier i e-mobilitetsapplikasjoner. Den diskuterer bruk av maskinlæringsteknikker for å forbedre nøyaktigheten av SoH-estimering, som tradisjonelt utføres med modellbaserte metoder. Forskningen fremhever potensialet for å redusere gjennomsnittlig absolutt feil i batteristyringssystemer gjennom avanserte AI-algoritmer. Les artikkelen

Vanlige spørsmål

Hva er gjennomsnittlig absolutt feil (MAE)?

Gjennomsnittlig absolutt feil (MAE) er en metrikk i maskinlæring som måler gjennomsnittlig størrelse på feil mellom predikerte og faktiske verdier i regresjonsmodeller, uten å ta hensyn til retningen.

Hvordan beregnes MAE?

MAE beregnes ved å ta den absolutte verdien av hver prediksjonsfeil, summere disse verdiene, og dele på antall prediksjoner, noe som gir gjennomsnittlig feilstørrelse.

Når bør jeg bruke MAE fremfor andre metrikker?

Bruk MAE når du ønsker et enkelt og tolkbart mål på gjennomsnittlig feil i samme enhet som målvariabelen, spesielt når det er uteliggere eller når du ikke ønsker å straffe store feil hardere.

Hva er begrensningene med MAE?

MAE gir ikke informasjon om retningen på feilene og behandler alle feil likt, noe som kanskje ikke er ideelt når større feil bør straffes mer.

Hvordan sammenlignes MAE med MSE og RMSE?

I motsetning til MSE og RMSE, som straffer større feil mer på grunn av opphøyning i andre, behandler MAE alle feil likt og er mindre følsom for uteliggere, noe som gjør den mer robust for datasett med ekstreme verdier.

Klar til å bygge din egen AI?

Smarte chatboter og AI-verktøy under ett tak. Koble intuitive blokker for å gjøre ideene dine om til automatiserte flyter.

Lær mer

Generaliseringsfeil

Generaliseringsfeil

Generaliseringsfeil måler hvor godt en maskinlæringsmodell predikerer ukjente data, og balanserer skjevhet og varians for å sikre robuste og pålitelige AI-appli...

5 min lesing
Machine Learning Generalization +3
Gjennomsnittlig Presisjon (mAP)

Gjennomsnittlig Presisjon (mAP)

Gjennomsnittlig presisjon (mAP) er en sentral målemetode innen datamaskinsyn for evaluering av objektgjenkjenningsmodeller, som fanger både deteksjons- og lokal...

6 min lesing
Computer Vision Object Detection +3
Treningsfeil

Treningsfeil

Treningsfeil i AI og maskinlæring er avviket mellom en modells predikerte og faktiske utganger under trening. Det er en nøkkelindikator for å evaluere modellens...

7 min lesing
AI Machine Learning +3