
Forstærkningslæring fra menneskelig feedback (RLHF)
Forstærkningslæring fra menneskelig feedback (RLHF) er en maskinlæringsteknik, der integrerer menneskelig input for at guide træningsprocessen af forstærkningsl...
2 min læsning
AI
Reinforcement Learning
+4