
Model-fortolkelighed
Model-fortolkelighed henviser til evnen til at forstå, forklare og have tillid til de forudsigelser og beslutninger, som maskinlæringsmodeller træffer. Det er a...
FID vurderer kvaliteten og diversiteten af billeder fra generative modeller som GANs ved at sammenligne genererede billeder med ægte, og overgår ældre målinger som Inception Score.
Fréchet Inception Distance (FID) er en måling, der bruges til at evaluere kvaliteten af billeder produceret af generative modeller, især Generative Adversarial Networks (GANs). I modsætning til tidligere målinger som Inception Score (IS) sammenligner FID fordelingen af genererede billeder med fordelingen af ægte billeder og giver en mere helhedsorienteret vurdering af billedkvalitet og diversitet.
Udtrykket “Fréchet Inception Distance” kombinerer to nøglebegreber:
Fréchet Distance: Introduceret af Maurice Fréchet i 1906, er denne måling en kvantificering af ligheden mellem to kurver. Den kan forstås som den minimale “snorlængde”, der kræves for at forbinde en hund og dens ejer, der går ad hver sin sti. Fréchet Distance har anvendelser inden for områder som håndskriftgenkendelse, robotteknologi og geografiske informationssystemer.
Inception Model: Udviklet af Google, er Inception-v3 modellen en konvolutionel neuralt netværksarkitektur, der omdanner rå billeder til et latent rum, hvor billedernes matematiske egenskaber er repræsenteret. Denne model er særligt nyttig til at analysere træk på flere skalaer og placeringer i et billede.
FID beregnes ved hjælp af følgende trin:
FID bruges primært til at vurdere den visuelle kvalitet og diversitet af billeder genereret af GANs. Den tjener flere formål:
Inception Score (IS) var en af de første målinger, der blev introduceret til at evaluere GANs med fokus på individuel billedkvalitet og diversitet. Den har dog visse begrænsninger, såsom følsomhed over for billedstørrelse og manglende overensstemmelse med menneskelig vurdering.
Introduceret i 2017, adresserer FID disse begrænsninger ved at sammenligne de statistiske egenskaber for genererede billeder med dem for ægte billeder. Den er blevet standardmålingen til evaluering af GANs på grund af dens evne til mere effektivt at indfange ligheden mellem ægte og genererede billeder.
Selvom FID er en robust og udbredt måling, har den sine begrænsninger:
FID er en måling, der vurderer kvaliteten og diversiteten af billeder genereret af modeller som GANs ved at sammenligne den statistiske fordeling af genererede billeder med ægte billeder ved hjælp af Inception-v3 modellen.
I modsætning til Inception Score, som kun vurderer individuel billedkvalitet og diversitet, sammenligner FID fordelinger af ægte og genererede billeder og giver en mere robust og menneskeafstemt måling til GAN-evaluering.
FID er beregningstung og bedst egnet til billeder, ikke andre datatyper som tekst eller lyd. Det kræver betydelige beregningsressourcer at udregne.
Opdag hvordan FlowHunt kan hjælpe dig med at bygge og vurdere AI-drevne løsninger, herunder evaluering af generative modeller med målinger som FID.
Model-fortolkelighed henviser til evnen til at forstå, forklare og have tillid til de forudsigelser og beslutninger, som maskinlæringsmodeller træffer. Det er a...
Flesch-læsevenlighed er en læsbarhedsformel, der vurderer, hvor let en tekst er at forstå. Udviklet af Rudolf Flesch i 1940'erne, tildeler den en score baseret ...
Lær de grundlæggende oplysninger om Frase, et AI-drevet værktøj til at skabe SEO-optimeret indhold. Oplev dets nøglefunktioner, fordele og ulemper samt alternat...