Cache Augmented Generation (CAG)
Cache Augmented Generation (CAG) ist ein neuartiger Ansatz zur Verbesserung großer Sprachmodelle (LLMs), indem Wissen als vorab berechnete Key-Value-Caches vorab geladen wird. Dies ermöglicht eine KI-Leistung mit niedriger Latenz, hoher Genauigkeit und Effizienz für Aufgaben mit statischem Wissen.
•
7 min read