Fijn-afstemming
Model-fijn-afstemming past voorgetrainde modellen aan voor nieuwe taken door kleine aanpassingen te maken, waardoor minder data en middelen nodig zijn. Leer hoe...
FID beoordeelt de kwaliteit en diversiteit van afbeeldingen van generatieve modellen zoals GAN’s door gegenereerde afbeeldingen met echte te vergelijken, en overtreft oudere metingen zoals de Inception Score.
Fréchet Inception Distance (FID) is een maatstaf die wordt gebruikt om de kwaliteit van afbeeldingen te evalueren die zijn geproduceerd door generatieve modellen, met name Generative Adversarial Networks (GAN’s). In tegenstelling tot eerdere maatstaven zoals de Inception Score (IS), vergelijkt FID de distributie van gegenereerde afbeeldingen met de distributie van echte afbeeldingen, waardoor het een meer holistische maat biedt voor beeldkwaliteit en diversiteit.
De term “Fréchet Inception Distance” combineert twee kernbegrippen:
Fréchet-afstand: Geïntroduceerd door Maurice Fréchet in 1906, kwantificeert deze maat de gelijkenis tussen twee krommen. Het kan worden gezien als de minimale “riemlengte” die nodig is om een hond en zijn baasje te verbinden, die elk een apart pad bewandelen. De Fréchet-afstand vindt toepassing in diverse vakgebieden zoals handschriftherkenning, robotica en geografische informatiesystemen.
Inception-model: Ontwikkeld door Google, is het Inception-v3-model een convolutioneel neuraal netwerk dat ruwe afbeeldingen transformeert naar een latente ruimte, waarin de wiskundige eigenschappen van afbeeldingen worden weergegeven. Dit model is bijzonder nuttig voor het analyseren van kenmerken op meerdere schalen en locaties binnen een afbeelding.
FID wordt berekend aan de hand van de volgende stappen:
FID wordt voornamelijk gebruikt om de visuele kwaliteit en diversiteit van afbeeldingen die door GAN’s zijn gegenereerd te beoordelen. Het dient meerdere doelen:
De Inception Score (IS) was een van de eerste maatstaven die werd geïntroduceerd om GAN’s te evalueren, met de nadruk op individuele beeldkwaliteit en diversiteit. Deze maat heeft echter enkele beperkingen, zoals gevoeligheid voor afbeeldingsgrootte en een gebrek aan overeenstemming met menselijke beoordeling.
Geïntroduceerd in 2017, pakt FID deze beperkingen aan door de statistische eigenschappen van gegenereerde afbeeldingen te vergelijken met die van echte afbeeldingen. Het is uitgegroeid tot de standaardmaatstaf voor het evalueren van GAN’s vanwege het vermogen om de gelijkenis tussen echte en gegenereerde afbeeldingen effectiever vast te leggen.
Hoewel FID een robuuste en veelgebruikte maat is, zijn er enkele beperkingen:
FID is een maatstaf die de kwaliteit en diversiteit van afbeeldingen gegenereerd door modellen zoals GAN's beoordeelt door de statistische distributie van gegenereerde afbeeldingen met echte afbeeldingen te vergelijken met behulp van het Inception-v3-model.
In tegenstelling tot Inception Score, die alleen individuele beeldkwaliteit en diversiteit beoordeelt, vergelijkt FID distributies van echte en gegenereerde afbeeldingen, wat een robuustere en meer op mensen afgestemde maat voor GAN-evaluatie biedt.
FID is computationeel intensief en het meest geschikt voor afbeeldingen, niet voor andere datatypes zoals tekst of audio. Het vereist aanzienlijke rekenkracht om te berekenen.
Ontdek hoe FlowHunt u kan helpen AI-gedreven oplossingen te bouwen en te beoordelen, inclusief het evalueren van generatieve modellen met metingen zoals FID.
Model-fijn-afstemming past voorgetrainde modellen aan voor nieuwe taken door kleine aanpassingen te maken, waardoor minder data en middelen nodig zijn. Leer hoe...
De Flesch Reading Ease is een leesbaarheidsformule die beoordeelt hoe gemakkelijk een tekst te begrijpen is. Ontwikkeld door Rudolf Flesch in de jaren 40, kent ...
Een Foundation AI Model is een grootschalig machine learning-model dat getraind is op enorme hoeveelheden data en aanpasbaar is voor een breed scala aan taken. ...