Generación Aumentada por Caché (CAG)
La Generación Aumentada por Caché (CAG) es un enfoque novedoso para mejorar los grandes modelos de lenguaje (LLMs) precargando conocimientos como cachés de clave-valor precomputadas, lo que permite un rendimiento de IA de baja latencia, preciso y eficiente para tareas de conocimiento estático.
•
9 min read