Cache Augmented Generation (CAG)
Cache Augmented Generation (CAG) je nový prístup na zlepšenie veľkých jazykových modelov (LLM) prednahrávaním znalostí vo forme vopred vypočítaných kľúč-hodnota (KV) cache, čo umožňuje nízku latenciu, presný a efektívny výkon AI pre úlohy so statickými znalosťami.
•
7 min read