
Aprendizaje por refuerzo a partir de retroalimentación humana (RLHF)
El Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF) es una técnica de aprendizaje automático que integra la intervención humana para guiar e...
3 min de lectura
AI
Reinforcement Learning
+4